documents

OpenAI가 새로운 GPT-4.1, GPT-4.1 mini, GPT-4.1 nano 모델을 공개했다. 이 모델들은 기존 GPT-4o 시리즈를 전반적으로 능가하며, 특히 코딩 및 지시 수행 능력에서 괄목할 만한 성능 향상을 이루었다.

주요 특징

향상된 성능: GPT-4.1은 GPT-4o 대비 향상된 성능을 제공하며, 일부 벤치마크에서는 GPT-4.5와 대등하거나 능가하는 결과를 보인다. 코딩 능력 향상에 집중하여 개발되었으며, 실제 소프트웨어 엔지니어링 작업에서 뛰어난 성능을 보인다. 또한 지시 사항을 따르는 능력과 복잡한 다단계 지시 사항 이해 능력도 개선되었다. 멀티턴(Multi-turn) 대화에서 이전 메시지의 정보를 더 잘 추출하여 자연스러운 대화가 가능하다.
100만 토큰 컨텍스트 창: 세 모델 모두 100만 토큰의 컨텍스트 길이를 지원하여, 대규모 코드베이스나 많은 양의 긴 문서를 처리하는 데 적합하다. GPT-4.1은 전체 100만 토큰 컨텍스트 길이에 걸쳐 정보를 안정적으로 처리하도록 훈련되었으며, GPT-4o보다 관련 텍스트를 찾아내고 방해 요소를 무시하는 데 더 안정적이다.
API 전용: GPT-4.1 시리즈는 API를 통해서만 제공되며, ChatGPT에는 통합되지 않는다. ChatGPT에서는 지시 사항 이행, 코딩, 지능 관련 개선 사항 대부분이 최신 버전의 GPT-4o에 점진적으로 통합될 예정이다.
다양한 모델 구성: GPT-4.1 외에도 경량화된 모델인 GPT-4.1 mini와 GPT-4.1 nano가 함께 출시되었다. GPT-4.1 mini는 소형 모델 성능에서 중대한 도약을 이루었으며, 많은 벤치마크에서 GPT-4o를 능가하기도 한다. GPT-4.1 nano는 낮은 지연 시간이 필수적인 작업을 위해 현재 사용 가능한 모델 중 가장 빠르고 저렴한 모델이다.
향상된 코딩 능력: GPT-4.1은 에이전트 방식의 코딩 작업 해결, 프론트엔드 코딩, 불필요한 수정 감소 등 다양한 코딩 작업에서 GPT-4o보다 현저히 뛰어난 성능을 보인다. 실제 소프트웨어 엔지니어링 기술을 측정하는 SWE-bench Verified에서 GPT-4.1은 54.6%의 작업을 완료, GPT-4o (2024-11-20 버전)의 33.2%와 비교된다.
낮은 비용: GPT-4.1은 중간값 쿼리 기준 GPT-4o보다 26% 저렴하며, GPT-4.1 nano는 OpenAI의 역대 가장 저렴하고 빠른 모델이다.
지식 컷오프: 모델이 사전 훈련한 데이터는 2024년 6월까지다.

모델별 상세 정보

모델	특징	사용 사례	가격
GPT-4.1	복잡한 작업에 적합, 문제 해결 능력 우수	고급 코딩, 상세한 콘텐츠 제작, 복잡한 문제 해결	입력: $2/100만 토큰, 출력: $8/100만 토큰
GPT-4.1 Mini	균형 잡힌 성능과 효율성	비즈니스 애플리케이션, 고객 서비스, 예산 제약이 있는 콘텐츠 생성	입력: $0.4/100만 토큰, 출력: $1.6/100만 토큰
GPT-4.1 Nano	빠른 응답 속도, 낮은 컴퓨팅 자원 요구	챗봇, 간단한 쿼리, 즉각성이 중요한 작업	입력: $0.1/100만 토큰, 출력: $0.4/100만 토큰

GPT-4.5 Preview 지원 중단

GPT-4.1이 GPT-4.5 Preview보다 낮은 비용으로 개선되었거나 유사한 성능을 제공하므로, OpenAI는 API에서 GPT-4.5 Preview 지원을 2025년 7월 14일에 종료할 예정이다. GPT-4.5는 대규모의 연산 집약적인 모델을 탐색하고 실험하기 위한 연구 프리뷰로 도입되었으며, 개발자 피드백을 통해 많은 것을 배웠다.

시사점

GPT-4.1 시리즈의 출시는 OpenAI가 AI 모델 개발 및 제공에 있어 중요한 진전을 이루었음을 보여준다. 특히 개발자 피드백을 적극적으로 반영하여 실제 사용 환경에 최적화된 모델을 제공하고, 다양한 사용 사례와 예산에 맞춰 선택할 수 있도록 모델 라인업을 확장한 점이 돋보인다. 향상된 코딩 능력과 긴 컨텍스트 처리 능력은 AI 에이전트 개발에 새로운 가능성을 제시하며, 다양한 산업 분야에서 AI 활용을 더욱 확대할 것으로 기대된다.

Follow-up Search