[Amazon, 범용 AI 에이전트 'Nova Act' 공개] Amazon은 월요일에 웹 브라우저를 제어하고 몇 가지 간단한 동작을 독립적으로 수행할 수 있는 범용 AI 에이전트인 Nova Act를 공개
Amazon, 범용 AI 에이전트 'Nova Act' 공개
Amazon이 월요일, 웹 브라우저를 제어하고 간단한 동작을 독립적으로 수행할 수 있는 범용 AI 에이전트 'Nova Act'를 공개했습니다. 이와 함께 개발자들이 Nova Act로 에이전트 프로토타입을 구축할 수 있는 툴킷인 'Nova Act SDK'도 출시됐습니다.

Amazon의 AI 에이전트 전략
샌프란시스코에 위치한 Amazon의 AGI 랩에서 개발된 Nova Act는 향후 출시될 생성형 AI 강화 버전인 'Alexa+' 업그레이드의 주요 기능을 구동할 예정입니다. 현재 제공되는 버전은 '연구 미리보기' 단계로, 개발자들은 nova.amazon.com 웹사이트를 통해 Nova Act 툴킷에 접근할 수 있습니다.
이번 출시는 Amazon이 OpenAI의 'Operator'와 Anthropic의 'Computer Use' 같은 경쟁 제품에 도전장을 내민 것으로 볼 수 있습니다. 많은 기술 기업들은 사용자를 위해 웹을 탐색할 수 있는 AI 에이전트가 현재의 AI 챗봇보다 훨씬 더 유용할 것이라고 전망하고 있습니다.
Nova Act의 기능과 성능
Amazon에 따르면, Nova Act SDK를 활용하는 개발자들은 Sweetgreen에서 샐러드 주문이나 저녁 식사 예약과 같은 기본적인 작업을 사용자 대신 자동화할 수 있습니다. 이 툴킷을 통해 개발자들은 AI 에이전트가 웹 페이지 탐색, 양식 작성, 달력에서 날짜 선택 등의 기능을 수행할 수 있는 도구를 구축할 수 있습니다.
Amazon은 내부 테스트에서 Nova Act가 경쟁사 제품보다 우수한 성능을 보였다고 주장합니다. 'ScreenSpot Web Text' 테스트에서 Nova Act는 94%의 점수를 기록해 OpenAI의 CUA(88%)와 Anthropic의 Claude 3.7 Sonnet(90%)을 앞섰습니다. 다만 Amazon은 'WebVoyager'와 같은 보다 일반적인 에이전트 평가 방식으로는 벤치마킹을 실시하지 않았습니다.
AGI 랩의 첫 공개 제품
Nova Act는 전 OpenAI 연구원 David Luan과 Pieter Abbeel이 공동으로 이끄는 Amazon AGI 랩에서 나온 첫 번째 공개 제품입니다. 두 사람은 각각 Adept와 Covariant라는 스타트업을 설립한 경험이 있으며, Amazon은 작년에 AI 에이전트 개발을 위해 이들을 영입했습니다.
Luan은 에이전트 기술이 초지능 AI 시스템 개발의 중요한 단계라고 설명하며, AGI를 "컴퓨터에서 인간이 하는 모든 일을 할 수 있도록 돕는 AI 시스템"으로 정의했습니다. 그는 Nova Act SDK가 짧고 간단한 작업을 안정적으로 자동화하고, 개발자들에게 에이전트 워크플로에 인간 개입이 필요한 시점을 정확히 정의할 수 있는 도구를 제공한다고 강조했습니다.
시장 전망과 과제
Amazon은 이미 혼잡한 AI 에이전트 시장에 뛰어들었지만, 이는 회사가 많은 것을 걸고 있는 중요한 기술입니다. Nova Act의 초기 테스트는 오랫동안 지연된 Alexa+의 일부 기능을 엿볼 수 있는 기회를 제공할 것으로 보이며, 이는 Amazon의 AI 전략에 있어 중요한 시험대가 될 전망입니다.
OpenAI, Google, Anthropic 등 경쟁사들의 초기 AI 에이전트들이 다양한 영역에서의 신뢰성 문제로 어려움을 겪고 있는 가운데, Amazon이 이러한 문제를 해결했는지, 아니면 유사한 결함으로 고전할지는 곧 드러날 것으로 보입니다.
새로운 에이전트 AI 모델과 함께 Amazon은 개발자가 Nova Act로 에이전트 프로토타입을 빌드할 수 있는 툴킷인 Nova Act SDK를 출시합니다.
Amazon의 최근 개장한 샌프란시스코 소재 AGI 랩 에서 개발한 Nova Act는 Amazon의 인기 있는 음성 비서의 생성적 AI 강화 버전 인 회사의 다가올 Alexa+ 업그레이드 의 주요 기능도 구동할 것입니다 . 그러나 오늘부터 제공되는 Nova Act 버전은 약간 덜 세련되었습니다. Amazon은 이를 연구 미리보기라고 부릅니다.
Amazon은 월요일에 웹 브라우저를 제어하고 몇 가지 간단한 동작을 독립적으로 수행할 수 있는 범용 AI 에이전트인 Nova Act를 공개
개발자들은 새로운 웹사이트 nova.amazon.com 에서 Nova Act 툴킷에 접근할 수 있으며 , 이 사이트는 Amazon의 다양한 Nova 기반 모델을 소개하는 쇼케이스 역할도 합니다.
Nova Act는 Amazon이 자체적인 범용 AI 에이전트 기술을 사용하여 OpenAI의 Operator 와 Anthropic의 Computer Use 에 도전하려는 시도입니다 . 여러 선도적인 기술 회사는 사용자를 위해 웹을 탐색할 수 있는 AI 에이전트가 오늘날의 AI 챗봇을 훨씬 더 유용하게 만들 것이라고 믿습니다.
아마존이 이런 종류의 에이전트 기술을 개발한 것은 처음은 아니지만, Alexa+를 통해 가장 광범위한 영향력을 가질 수도 있습니다.
Amazon은 Nova Act SDK로 개발하는 개발자가 Sweetgreen에서 샐러드를 주문하거나 저녁 식사를 예약하는 것과 같이 사용자를 대신하여 기본적인 작업을 자동화할 수 있어야 한다고 말합니다. Nova Act 툴킷을 사용하면 개발자는 AI 에이전트가 웹 페이지를 탐색하고, 양식을 작성하고, 달력에서 날짜를 선택할 수 있는 도구를 모을 수 있습니다.
Amazon은 Nova Act가 회사의 여러 내부 테스트에서 OpenAI와 Anthropic의 에이전트보다 성능이 뛰어나다고 주장합니다. 예를 들어, AI 에이전트가 화면의 텍스트와 상호 작용하는 방식을 측정하는 ScreenSpot Web Text에서 Nova Act는 94%의 점수를 받아 OpenAI의 CUA(88%)와 Anthropic의 Claude 3.7 Sonnet(90%)보다 성능이 뛰어났습니다.
하지만 Amazon은 WebVoyager와 같은 보다 일반적인 상담원 평가를 사용하여 Nova Act를 벤치마킹하지 않았습니다.
Nova Act는 Amazon의 앞서 언급한 AGI 랩에서 나온 첫 번째 공개 제품으로, 전 OpenAI 연구원인 David Luan과 Pieter Abbeel이 공동으로 이끄는 이니셔티브입니다 . 둘 다 이전에 자체 스타트업을 설립했습니다. Luan은 Adept를 시작했고 Abbeel은 Covariant를 공동 설립했습니다 . Amazon이 작년에 AI 에이전트 노력을 이끌기 위해 두 사람을 고용하기 전까지 말입니다.
AGI 연구실에서 샐러드를 주문할 수 있는 AI 에이전트를 개발하는 것이 이상하게 보일 수 있지만, 루안은 TechCrunch에 에이전트를 초지능 AI 시스템을 만드는 데 있어 중요한 단계로 본다고 말했습니다. 루안은 AGI를 "컴퓨터에서 인간이 하는 모든 일을 할 수 있도록 돕는 AI 시스템"이라고 정의합니다.
루안은 그의 팀이 Nova Act SDK를 설계하여 짧고 간단한 작업을 안정적으로 자동화하고 개발자에게 에이전트 워크플로에 인간이 개입하기를 원하는 시점을 정확하게 정의할 수 있는 도구를 제공했다고 말합니다. 그는 개발자가 완전히 자율적인 것은 아니지만 더 안정적인 에이전트 애플리케이션을 만들 수 있기를 바랍니다.
Amazon은 혼잡한 공간에서 최초의 범용 AI 에이전트를 출시하지만, 이는 회사가 많은 것을 걸고 있는 중요한 기술입니다. Nova Act의 초기 테스트는 오랫동안 지연된 Alexa+의 일부 기능을 엿볼 수 있는 기회를 제공할 수 있으며, 이는 Amazon의 AI 노력에 있어 성패를 가르는 순간입니다.
OpenAI, Google, Anthropic의 초기 AI 에이전트의 주요 문제 는 다양한 도메인에서의 신뢰성입니다. TechCrunch의 테스트에서 시스템은 느리고, 매우 오랫동안 독립적으로 작동하는 데 어려움을 겪었으며, 인간이 저지르지 않을 실수를 저지르기 쉽습니다. Amazon이 코드를 해독했는지, 아니면 에이전트가 경쟁사를 괴롭히는 동일한 결함으로 어려움을 겪고 있는지는 오래지 않아 알 수 있을 것입니다
자료출처 http://m.ainet.link/19659 박민제 | 2025.04.01