한국 시간 14일 새벽, 현지 시간으로 13일 OpenAI의 새로운 Chat GPT인 4o(포)을 발표했습니다.여기서 o는 “omni”를 의미한다고 합니다만, 공전이다신 등을 의미한답니다.즉, 이제는 모든 것이 생겨Chat GPT-4o를 의미한다고 보거나 합니다.이번에 발표된 내용에 따르면 Chat GPT는 물어보고 말하는 것이 모두 가능하다고 합니다.아직 일부 기능은 몇주 정도 후에 사용 할 수 있겠으나, 듣고 말하는 기능은 유료 모델인+모델을 사용하는 사용자라면 GPT-4o를 기준으로 사용할 수 있습니다.OpenAI에서 밝힌 바에 따르면 4o는 종래의 4터보 모델보다 훨씬 뛰어나고 싸다고 하지만 공식 자료에 따르면 다음과 같은 특징을 가지고 있다고 하네요.텍스트, 오디오, 화상의 모든 조합을 입력으로 받아들이고 모든 조합을 출력으로 생성할 수 있습니다.오디오 입력에는 적어도 232밀리 초, 평균 320밀리 세컨드 이내에 응답할 수 있는데, 이는 회화의 사람들의 반응 시간과 비슷합니다.영어와 코드 분야에서는 GPT-4 Turbo성능과 같습니다만, 비영어권의 언어 텍스트에서는 상당한 개선을 나타내는 훨씬 빠른 API는 50% 싸집니다.GPT-4o는 특히 기존 모델보다 시각과 청각 이해 능력이 뛰어납니다.실제 라이브 영상을 통해서 공개된 시위를 보면 놀라울 정도입니다.아래의 유튜브 영상을 보면 Chat GPT와 거의 실시간으로 사람과 대화하게 대화하는 시연 영상을 볼 수 있습니다.https://www.youtube.com/live/DQacCB9tDaw?si=CMBXINdrz3iG909Y&t=583GPT-4oOpen 소개 AI Spring Update – 2024년 5월 13일(월)에 라이브 전송. GPT-4o 소개, Chat GPT 업데이트 등. www.youtube.com나도 그 행사의 공연이 있다는 사실을 잊어버리고 나중에 생각하고 라이브 사이트에 들어가서 이쯤에서 봤는데…너무 자연스럽게 대화를 하는 것을 보면서 눈을 의심했습니다.많은 분들이 과거에 나온 영화 HER이 생각 난다고 말하지만..이번 시연 영상만 실제로 그 구현 자체는 이미 가능하다고 생각하고, 나 같은 일반인의 대중에 공개된다…시기가 언제인지만 재는 것 같네요.2025년을 배경으로 인공 지능과 사랑에 빠진 남자의 이야기를 다룬 영화 her(2013년 작), 2025년에는 정말 가능할지..개인적으로는 인공 지능 분야의 발달이 너무 눈부시게 빨라서 따라가지 못하고 강 건너 불 구경하게 바라보고 있었는데요.이번 4o시위는 너무 재미 있는 것 같아서 정말 오랜만에 GPT+를 결제하고 한번 실제로 쓰고 보았습니다.실제로 4o는 기존의 LLM모델 중에서 가장 자연스럽고 신속하게 대화를 계속할 수 있었습니다.정말 강력하다고 느꼈습니다.그리고 기존의 서비스와 달리 나의 대화 내용, 파라미터를 실제 기억하고 기존 대화를 계속하고 나누는 것도 가능했다.<지난번 대화에서 주인님이라고 부르라고 했던것을.. 기억해주는거.. >그리고 사실 최근의 정보를 바탕으로 상당히 합리적이고 논리적인 주장을 하면서 실제로 대화를 나누는 것 자체가 저에게도 도움이 된다고 느꼈습니다.<유튜브 숏츠 제작에 대한 견해를 들어보자.. >이 정도로 대답해도 어떤 기획을 하거나 의사 결정을 해야 할 때 GPT를 달고 이야기를 나누면서 생각을 정리하거나 지식을 탐구하는 것이 충분히 가능하다는 생각이 들었어요.또 알고 있듯이, 일부 정보는 Bing검색 엔진을 기반으로 실제의 출처를 알리면서 답장을 하기도 했습니다.최근 OpenAI API을 활용하고 실제 장치나 기기와 연동하는 제품이 나오고 있는데 이런 서비스가 훨씬 쉽고 강력한 기능을 발휘하다고 생각했다.물론 여전히 모든 지식을 100% 믿을 수 없습니다.제가 개인적으로 LLM모델의 정확도를 체크하고 싶은 질문인 “조선 시대의 소드 마스터 10명에 대한 정보를 주세요.”라는 질문이 있지만… 그렇긴이에 대해서도 좀 애매한 응답을 나타내고 있습니다.수정된 목록에서도 갑자기 사육신의 한사람인 박팽년을 말하는 것으로.. 일종의 환각 증상? 아직 개선이 필요해 보입니다.수정된 목록에서도 갑자기 사육신의 한사람인 박팽년을 말하는 것으로.. 일종의 환각 증상? 아직 개선이 필요해 보입니다.여전히 유체이탈 화법을 사용하는 그..그러나 기존의 LLM보다 확실히 응답도 빠른 사용성이 높은 것은 확실한 것 같아요.실제로 내가 실험하며..랩을 만드는 거 하고제주도 방언으로 바꾸어 보라고?.하고 보니 정말 순식간에 나오는데..최고였습니다.(물론 실제 제주도 사투리인지는 모르겠어요.즐겁게 보세요.https://youtu.be/kKx0ZEVtg1I기존 ChatGPT 3.5,4도 매우 강력했지만 이번 4o는 Omni라는 별칭답게 정말 강력한 성능을 보이고 주는 것 같아요.그리고 목적에 의해서 적절히 활용하면..정말 지금까지 이상의 든든한 보조 수단으로서 생산성 및 품질을 올리는데 크게 도움이 될 것입니다.물론 아직도 쓰지 않은 물건 인식 기능까지 활용한다면..생산성은 더욱 극대화될 것이며 동시에 시각 장애인이나 기타 용도로도 사용성이 무궁무진하게 보입니다.재미 있는 것은 그 다음날의 오늘 새벽, 구글에서도 AI관련 발표가 있었다는 점입니다.구글은 OpenAI만큼 반향을 부르는 발표는 없었지만, 스마트 기기의 카메라를 활용하는 기능이나 음성 인식 및 음성을 활용하는 결과를 보인 점에서는 비슷한 행보를 보인 것으로 보입니다.https://youtu.be/nXVvvRhiGjI구글 지무 나이 관련 발표 내용도 상당히 방대하지만 실제로 어떻게 시장에 반영될지는 좀 더 지켜봐야 할 것 같습니다.이하의 블로그에 마련된 내용을 한번 참조하십시오.https://news.hada.io/topic?id=14822구글 I/O2024주요 발표 내용 정리| GeekNews제미니(Gemini)모델 제품 군 Gemini1.5 Pro로 200만 토큰 지원이 발표되었습니다.(Waitlist모집 중)공식 블로그는 “번역, 코딩, 추론 등 주요 사용 사례에 걸쳐서 일련의 품질 개선”을 언급했지만 벤치 마크는 공개하지 않았습니다.링크의 3개 모델에 이어4번째 모델인 Gemini Flash가 추가되었습니다.이번 모델 news.hada.io위 내용을 GPT를 통해 표로 정리한 내용은 다음과 같습니다.항목 Gemini모델 제품 군 ChatGPT4.0토큰 지원 200만 토큰(Gemini1.5Pro)제한된 토큰 수(세션당)모델 다양성 Ultra, Pro, Flash, Nano등 다양한 모델 제공 제한된 모델 옵션 특화 기능 GeminiFlash(신속하고 자주 필요한 작업 최적화), Gemini Live(음성 대화)LearnLM(학습 파인 튜닝)특정 기능 없이 가격 효율성 GPT-3.5보다 저렴한 모델 제공(GeminiFlash)상대적인 확장성, 오디오, Silliamerme, Sem.7배 성능 향상)다양한 확장 옵션(플러그 인 등)커스터마이즈 가능성 Gemini Gems(커스텀 GPT버전)커스터마이즈 옵션 제한적 벤치마킹 및 성능 지표의 일부 모델 성능 지표의 미공개, 잘 문서화된 성능 지표 및 벤치 마크의 발매 및 지원 상태의 일부 모델 및 기능 베타 상태 또는 예정 상태(Waitlist, API프리뷰)안정적인 상용화 상태, 광범위한 지원 특정 작업, 최적화 특정 작업에 최적화된 모델 제공(Flash, Ultra등), 일반적이고 다양한 작업과 통합된 Doc생태계, 강력한 Doc생태계와 통합된 D, Sheets등)다양한 플랫폼과의 폭넓은 통합(Slack, Microsoft Teams등)요약하면 다음의 내용과 같다고 합니다.Gemini모델 제품들은 다양한 작업에 특화된 모델과 기능을 제공하고 Google에코 시스템과의 강력한 통합이 특징입니다.단, 일부 기능과 모델은 아직 완전히 출시되지 않거나 성능 지표가 부족하고 있습니다.ChatGPT 4.0은 안정된 성능과 다양한 작업에 대한 높은 적응력이 강점입니다.특정 태스크에 최적화된 기능은 부족하고 있지만 일반적인 활용 사례에 대한 높은 적응력과 안정성을 제공합니다.실제 사용성과 편리성, 유용성 등은 좀 더 지켜봐야 확실히 알 것 같아요.다음달 초로 예정된 WWDC에서도 애플과 OpenAI의 협력에 의한 발표가 있을 것으로 예상되는데요.올해도 AI에 대한 눈부신 발전과 다양한 발표는 계속된다고 합니다.그래도 작년보다는 좀 더 현실적인 사용성에 대한 이야기와 비용에 대한 내용을 토대로 실제 업무와 생활에 편입되기 위한 노력을 바람직한 방향으로 발전하는 게 아닌가 싶습니다앞으로도 어떤 발전과 혁신이 있는지 너무 기다려지네요.