오픈AI, GPT-4.1 공개…GPT-4o보다 21% 향상된 코딩 성능

챗GPT 개발사 오픈AI가 최신 인공지능 모델 GPT-4.1을 14일(현지시간) 공개했다.
이번 신모델은 기존 GPT-4o 대비 성능이 전반적으로 향상된 후속작이며, 소형 모델 GPT-4.1 미니(mini)와 GPT-4.1 나노(nano)도 함께 선보였다.
GPT-4.1은 코딩 성능 측면에서 GPT-4o보다 21%, 지난 2월 공개된 GPT-4.5보다 27% 향상된 성과를 보였다고 오픈AI는 밝혔다.
특히 지시사항을 정확히 이행하고 긴 문맥을 이해하는 능력이 개선돼, 복잡한 AI 에이전트를 보다 효율적으로 구동하는 데 유리하다고 평가받고 있다.
오픈AI는 GPT-4.1이 SWE-Bench 벤치마크 테스트에서 54.6%의 코딩 작업을 성공적으로 수행해, GPT-4o의 33.2%를 크게 뛰어넘는 성과를 달성했다고 덧붙였다.
이로써 GPT-4.1은 AI 개발자들이 실질적으로 활용 가능한 모델로서 주목받고 있다.
GPT-4.1 미니는 실험과 테스트에 적합한 저비용 모델이며, GPT-4.1 나노는 지금까지 공개된 오픈AI 모델 중 가장 작고, 빠르며, 경제적인 모델이다.
세 모델 모두 최대 100만 토큰의 문맥을 안정적으로 처리할 수 있어, 이전 GPT-4o의 12만8천 토큰 처리 성능보다 8배 향상된 문맥 이해 능력을 제공한다.
오픈AI는 “GPT-4.1은 전체 100만 토큰 길이에 걸쳐 정보를 안정적으로 인식하도록 학습됐고 GPT-4o보다 관련 정보를 더 잘 찾아내고, 불필요한 요소는 무시하는 능력이 크게 향상됐다”고 설명했다.
특히 GPT-4.1은 운영 비용도 GPT-4o보다 26% 저렴해졌으며, GPT-4.5 프리뷰보다도 훨씬 효율적이라는 점에서 7월부터 해당 프리뷰 모델을 종료할 계획이라고 밝혔다.
새로운 모델들은 오픈AI의 애플리케이션 프로그래밍 인터페이스(API)를 통해 개발자들에게 우선 제공된다.
그러나 일반 이용자 대상 챗GPT에의 통합 시점은 아직 공개되지 않았다.
오픈AI 최고경영자 샘 올트먼은 “벤치마크 결과도 좋지만, 우리는 실제 사용성에 집중했고 개발자들의 반응도 매우 긍정적이다”라고 소셜미디어 엑스(X)를 통해 밝혔다.
그는 이번 주에 좋은 소식이 많이 준비돼 있다며 모델 공개를 예고한 바 있다.
오픈AI는 GPT-4.1 시리즈 외에도 향후 추론 특화 모델인 o3 정식 버전과 o4 미니 버전도 조만간 출시할 계획이다.
신혜연 (karung2@sabanamedia.com) 기사제보