
오픈AI가 사용자 대신 온라인에서 업무를 수행하고 복잡한 작업을 자동으로 처리하는 인공지능(AI) 에이전트 ‘챗GPT 에이전트’를 17일(현지시간) 공개했다.
이 에이전트는 챗GPT 사이트 내에서 ‘에이전트 모드’를 선택하거나 ‘agent’라고 입력해 사용할 수 있으며, 챗GPT 유료 구독자(프로, 플러스, 팀)를 대상으로 순차 제공된다.
단, 유럽경제지역(EEA)과 스위스는 제외된다.
오픈AI가 이번에 출시한 챗GPT 에이전트는 기존에 선보였던 두 가지 AI 도구를 통합한 고도화 모델이다.
오픈AI는 지난 1월, 사용자를 대신해 여행 계획, 식당 예약, 음식 배달 등을 수행하는 ‘오퍼레이터’를 공개했다.
2월에는 다수의 웹 자료를 바탕으로 전문가 수준의 분석 보고서를 생성하는 ‘딥리서치(Deep Research)’를 선보인 바 있다.
이번에 출시된 챗GPT 에이전트는 이 두 도구의 핵심 기능을 결합한 형태다.
오픈AI에 따르면 챗GPT 에이전트는 웹 브라우징과 조사 기능을 동시에 수행할 수 있으며, 문서 작성, 이미지 생성, 데이터 분석, API 호출, 파일 생성 등 실질적인 작업 처리까지 가능하다.
특히 사용자의 일정 확인 후 실제 웹사이트에서 예약을 진행하는 등 현실 세계에서 직접 행동하는 AI 기능이 강조된다.
기술적으로는 웹 페이지를 실제로 보고, 클릭하거나 스크롤하며 텍스트를 입력할 수 있는 ‘시각적 브라우저’ 기능도 탑재됐다.
오픈AI의 AI 에이전트 제품 및 엔지니어링 책임자 야시 쿠마르는 “우리는 ‘오퍼레이터’와 ‘딥리서치’가 서로 보완적이라는 것을 알게 됐고, 이에 두 팀이 협업해 두 제품의 장점을 결합한 새로운 제품을 만들게 됐다”고 말했다.
이어 챗GPT 에이전트는 “’딥리서치’처럼 빠르게 웹을 탐색하고 많은 페이지를 읽을 수 있다”고 말했다.
그는 “실제 웹사이트의 사용자 인터페이스를 보고 클릭하거나 스크롤하고 텍스트도 입력할 수 있는 ‘시각적 브라우저’ 기능도 갖췄다”고 설명했다.
또 “코드를 실행하거나 파일을 만들고 분석할 수 있으며, 이를 통해 공개 API(애플리케이션 프로그래밍 인터페이스)를 호출하거나 캘린더 등 개인 데이터 소스와도 연결할 수 있다”고 덧붙였다.
실제 활용 사례로는, 온라인 사전 브리핑에서 엔비디아의 분기 실적을 주제로 한 슬라이드 자료 생성 요청이 있었다.
이에 챗GPT 에이전트는 관련 문서 및 이미지를 검색하고 이미지 생성 API를 활용해 프레젠테이션 파일을 만들어냈다고 전해졌다.
오픈AI는 이번 에이전트가 민감한 작업을 수행하기 전 사용자로부터 명시적인 동의를 요구하며, 금융 거래, 법률 자문 등 고위험 작업은 수행하지 않는다고 밝혔다.
또한 유해하거나 불법적인 요청은 거부하도록 설계되어 있으며, 지금까지의 챗GPT 제품 중 가장 포괄적인 안전 체계를 갖췄다고 강조했다.