챗GPT를 만든 미국의 인공지능 개발사 오픈AI가 새로운 거대언어모델(LLM), GPT-4o를 공개했습니다. 이름 끝의 ‘o’는 ‘모든 것’을 의미하는 ‘옴니(omni)’의 첫 글자에서 따온 것인데요. 그 이름에 걸맞는 능력을 보여줍니다.

보고, 듣고, 말하고, 심지어 농담까지

GPT-4o와는 마치 사람과 소통하듯 대화할 수 있습니다. 음성을 입력했을 때, 응답까지 걸리는 시간은 평균 320밀리초인데요. 이는 대화 중 사람의 반응 속도와 비슷합니다. 또 GPT-4o와는 텍스트, 음성, 이미지 등을 자유롭게 섞어 대화할 수도 있죠. 사람처럼 보고, 듣고, 말하기를 한 번에 할 수 있는 겁니다. 카메라를 켜서 자기 모습을 보여주며 말로 “오늘 면접에 이렇게 입고 가도 될까?” 등의 질문을 할 수 있습니다. GPT-4o는 시연 영상에서 이 질문에 살짝 웃는 목소리로 “확실히 눈에 띄긴 하겠네요. 면접에서 남기고 싶은 인상이랑은 좀 다르겠지만요!”라며 농담 섞인 답변을 내놓았습니다. 감정의 톤까지 조절한 답변이었죠. 인공지능 비서 ‘사만다’와 인간 ‘테오도르’가 사랑에 빠지는 영화 <그녀>가 떠오르는데요. 오픈AI 최고경영자(CEO) 샘 알트먼도 같은 생각을 한 듯, X에 “her(그녀)”라고 적은 게시물을 올렸습니다.

GPT-4o 일반 공개 일정은?

GPT-4o의 기능은 순차적으로 출시될 예정입니다. 텍스트 및 이미지 기능은 오늘부터 출시되는데요. 무료 버전 사용자에게도 공개되죠. 새로운 보이스 모드는 다음 주부터 유료 플랜인 챗GPT 플러스에서 처음으로 선보일 예정입니다. 개발자라면 텍스트 및 비전 모델도 지금 바로 써볼 수 있습니다.