초거대AI인 제미나이(Gemini)'를 전격 공개했습니다.

글씨가 잘 안보이시나요?

급하게 노트북을 열었습니다. 구글이 마침내 '오픈AI GPT-4 터보'의 호적수로 꼽히는, 초거대AI인 제미나이(Gemini)'를 전격 공개했습니다. 그동안 제미니로 썼는데, 구글에서는 공식 TM이 '제미나이'라고 했습니다. 실리콘밸리 이덕주 특파원이 온라인 간담회에 참여해 제미나이 시연을 직접 봤는데요. 상당히 임팩트 있는 서비스가 될 것으로 내다봤습니다.

 

구글이 제미나이를 발표하는 것을 알았는지, MS 역시 이날 AI 서비스인 코파일럿을 대대적으로 업데이트한다고 밝혔습니다. 또 IBM과 메타는 50개사와 함께 오픈소스 진영의 깃발을 올렸습니다. MS와 오픈AI 연합이 공고해지고 있는 가운데, 구글이 제미나이를 전격 공개하며 기습 공격을 했는데요. 오늘은 초거대AI 3개 진영의 이야기를 실황 중계해 드립니다.


   오늘의 에디션  

  • 구글 "제미나이, GPT 넘었다"
  • 3가지 종류로 나온다
  • MS, 코파일럿이 곧 GPT
  • IBM 메타, 깃발을 올렸다  

제미나이 브리핑 예고: 구글이 긴급 공개한 제미나이


구글 딥마인드 "GPT-4 보다 우수하다" 


구글은 전세계 주요 매체 기자들을 대상으로 온라인 기자 간담회를 열었습니다. 제미나이의 성능과 각종 지표를 공개했는데요. 제미나이는 오는 12월 6일 부터 구글의 챗봇인 바드(Bard)에 탑재된다고 합니다. 순차적으로 전 세계에 공개되는 것이죠.

 

데미스 하사비스 구글 딥마인드 CEO는 이렇게 밝혔어요. "제미나이는 MMLU(대규모 다중작업 언어 이해)에서 90%의 점수를 얻어 인간 전문가(89.8%)를 능가한 최초의 LLM 입니다. 32개 지표 중 30개에서 현재 가장 우수한 모델의 성능을 압도했습니다." 그만큼 자신감에 차있는 메시지였습니다.

 

디지털 세상을 지배한 챗GPT의 뼈대가 되는 GPT-4 터보보다 더 우수하다는 것을 강조한 것입니다. 제미나이로 할 수 있는 서비스는 크게 이렇습니다.

 

  1. 이미지를 인식할 수 있다.
  2. 음성으로 말하고 들을 수 있다.
  3. 코딩을 할 수 있는 능력까지 갖췄다.
  4. 수학문제를 풀거나 데이터를 분석할 수 있다.

 

즉, 언어면 언어, 수학이면 수학, 이미지면 이미지만 하는 한 가지 모델이 아닌 여러 능력을 갖춘 멀티모달 AI라는 점을 분명히 했습니다. 특히 코딩 능력인 알파코드를 업그레이드한 알파코드2로 훨씬 복잡한 프로그래밍이 가능하다고 했습니다.

 

  • ߓš 용어사전 알파코드: 구글 딥마인드가 2022년 내놓은 프로그래밍 AI입니다. 평균적으로 프로그래밍 대회 참가자의 상위 54% 내의 점수를 얻었습니다. 예를 들면 특정 조건을 주고 도로와 건물을 배치하는 방법을 찾거나 맞춤형 보드 게임에서 승리하기 위한 전략을 만드는 문제가 주어집니다.

 

구글이 공개한 데모영상에서 제미나이는 실시간으로 인간이 보여주는 것을 음성으로 설명했습니다. 또, 어려운 문제를 추론해서 해결하고, 사용자에게 퀴즈를 내기도 했습니다. 제미나이와 소통은 텍스트를 입력하는 것이 아닌 모두 음성으로 이뤄졌다는 점에서 눈에 띄었습니다. 제미나이는 다른 언어로 번역을 하기도 했습니다.

 

구글이 공개한 멀티모달 성능을 한번 볼까요? 

 

  • 이미지·문서이해(DocVQA): 제미나이(90.0%) vs GPT-4(88.4%)
  • 비디오·영어 비디오 캡셔닝(VATEX): 제미나이(62.7%) vs GPT-4(56.0%)
  • 오디오·자동 스피치 번역(CoVoST2): 제미나이(40.1%) vs GPT-4(29.1%)

구글 제미나이: 경사진 도로에서 내려오는 자동차 스케치를 보여주면, 무엇이 더 빠른지 추론해 답변한다.


3가지 종류로 나온다, 울트라 프로 나노

 

이러한 제미나이는 크게 울트라, 제미나이 프로, 제미나이 나노 3개 모델로 나옵니다.

 

  • 제미나이 프로: 범용 제품입니다. 6일 부터 서비스인 '바드'에 바로 적용됩니다.
  • 제미나이 울트라: (마치 구글 폰의 최상급인 픽셀 울트라... 같네요) 내년 초에 바드 어드밴스드라는 이름으로 바드에 적용됩니다. 즉, GPT-4 터보처럼 유료 모델이 될 것으로 보입니다.
  • 제미나이 나노: 스마트폰, PC 등에서 클라우드 없이 구동되는 '온디바이스' 용도입니다. 스마트폰인 '픽셀8 프로'에 탑재.

 

제니마이 울트라는, 오픈AI의 GPT-4 터보를 정 조준했고, 나노는 애플 아이폰을 정 조준한 것으로 보입니다. 애플이 뒤늦게 자체 LLM 개발에 나서고 있는데, 구글은 여유롭게 자체 스마트폰에 바로 도입! 스마트폰에 탑재한 제미나이 나노는 통화내용을 텍스트로 바꿔주고, 바로 요약하는 기능을 제공한다고 합니다. 구글은 오픈AI가 할 수 없는 AI 반도체를 함께 공개했습니다. (MS는 AI 반도체에서 후발주자이고, 오픈AI는 아직 AI 칩이 없습니다.) 구글은 제미나이를 가동시키기 위한 AI 반도체 TPU v5p 를 내놓았는데요. 지난번 공개한 v5e 보다 훨씬 강력한 Performance 를 보여주는 모델이라고 합니다.  

 

구글은 하이퍼컴퓨터 아키텍처를 공개해, 앞으로 'AI 슈퍼컴퓨터 인프라'를 구축하겠다고 밝힌 점은 MS 클라우드인 애저를 견제하려는 포석으로 읽혔습니다. 순다르 피차이 구글 CEO 는 제미나이를 공개하면서 "첫 번째 버전인 제미나이 1.0 은 제미니 시대의 첫 번째 모델이자 구글 딥마인드의 비전을 실현한 첫 번째 모델이다"라면서 "이는 구글이 기업으로 수행한 가장 큰 과학 및 엔지니어링 성과"라고 자부했어요. '인공지능의 지존은 오픈AI 가 아니라 바로 우리다'라는 자신감이 기자 간담회 내내 느껴졌습니다. 

코파일럿: MS가 도입한 멀티모달 검색 기능


MS, 코파일럿에 GPT-4 모두 탑재


마이크로소프트는 구글이 제미나이를 발표한 것을 사전에 감지한 것으로 보였습니다. MS는 구글이 제미나이를 발표하는 당일 AI 종합 솔루션인 코파일럿에 오픈AI가 개발한 GPT-4 터보를 장착한다고 발표했습니다. 새 코파일럿에는 GPT-4 터보 모델뿐 아니라 AI 이미지 생성기인 '달리(DALL-E) 3'와 검색 엔진 '빙(Bing)'을 위한 심층 검색 기능도 추가됐습니다. 사실상 챗GPT 유료 버전을 그대로 갖고 온 셈입니다. (블로그 좌표)


GPT-4 터보는 챗봇인 챗GPT 유료 버전의 근간이 되는 초거대AI로 12만8000토큰까지 입력이 가능하다. 영어 기준으로 약 300페이지, 한국어 기준으로 약 100 페이지까지 입력이 가능한 것인데요. 이 때문에 챗봇의 분석과 추론능력이 크게 향상됐습니다. MS 코파일럿에는 달리(DALL-E)3 모델까지 장착했습니다. 달리3는 미드저니처럼 문장을 입력하면 이미지를 생성할 수 있는 이미지 AI로 특히 GPT와 연동돼 자연어를 그대로 이해할 수 있습니다. 경쟁사인 미드저니가 프롬프트 입력이 난해한 것과 대비되는 점입니다.


코파일럿은 구글이 장악한 검색 시장을 정조준했습니다. 유섭 메흐디 CMO는 "빙에 장착될 심층 검색 기능은 복잡한 주제에 대해 최적화된 검색 결과를 제공한다"면서 "몇 마디 단어만 입력해도 AI가 이를 보다 풍성한 검색어로 변경해 보다 상세한 답변을 받을 수 있다"고 강조했습니다. 구글 검색 대신 빙 검색을 사용하라는 메시지입니다.

AI 얼리이언스: 50개사 참여를 알렸습니다.


IBM 메타, 오픈소스 동맹 깃발을 올렸다


IBM과 메타는 50개사와 연대해 오픈소스 AI 깃발을 올렸습니다. 이른바 인공지능 동맹(AI Alliance) 창설입니다. AI 동맹은 초거대AI를 오픈소스로 제공하는 방식으로 폐쇄진영인 구글과 MS·오픈AI에 대항학로 했습니다. AI 동맹은 "AI의 미래는 공개적이어야 한다"면서 "이를 위해 오픈소스 기술을 기반으로 구축돼야한다"고 강조했습니다. 메타와 IBM이 주도하는 동맹은 오픈소스 확산을 위해 이런 프로젝트를 함께 하기로 했습니다. (홈페이지 좌표)


  • AI 알고리즘을 평가하기 위한 공통 프레임워크 구축
  • AI 연구 자금 마련에 대한 헌신
  • 오픈소스 모델에 대한 협업 추진


이번 동맹에 참여한 주요 리스트입니다.


  • 대학: 코넬대 다트머스대 런던임페리얼칼리지 게이오대 뉴욕대 뮌헨공과대 UC버클리대 도쿄대 예일대
  • 기업: 메타 IBM 소니 델 AMD 오라클 허깅페이스 리눅스재단 레드햇
  • 연구소: 이론물리학국제센터 NASA 국립과학재단 


이날 또 다른 소식이 날아들어왔습니다. 일론 머스크가 이끄는 AI 스타트업 X.AI는 이날 미국 증권거래위원회(SEC)에 최대 10억 달러(약 1조3000억원) 규모로 자금 조달을 하겠다고 보고했습니다. 앞서 네 명의 투자자로부터 1억3500만달러를 투자 유치한데 이은 또 한 차례의 자본 조달이다. 오픈AI를 공동창업한 바 있는 머스크는 오픈AI 이사진에서 물러난 뒤 올 7월 별도 AI 기업을 설립하고 '그록(Grok)'이라는 챗봇을 공개한 상태입니다.


또! 아마존웹서비스(AWS)는 지난달 자연어 텍스트를 통한 의사소통으로 문서 요약과 자료 생성, 코드 작성 등 업무를 도와주는 기업용 생성형 AI 챗봇 '아마존 Q'를 전격 공개한 바 있습니다. 구글 클라우드, 마이크로소프트 애저 등 인프라 경쟁사가 잇따라 생성형AI를 탑재하자 반격에 나섰던 것입니다.


ߔŽ 

초거대AI를 놓고 이처럼 경쟁이 치열한 까닭은 디지털 세계의 패권인 '웹'의 미래가 생성AI에 달려 있기 때문으로 풀이됩니다. 포춘비즈니스인사이트에 따르면, 글로벌 생성형 AI 시장은 2023년 438억7000만달러(57조5486억원)에서 2030년 6679억6000만달러(876조2299억원)로 연평균 47.5%씩 폭증할 전망입니다.

 

등 채용 과정에 관여했는데요. 자신이 해당 채용에 응시해 최종 임용 됐어요.

 

맺음말

어떠셨나요? 오늘은 생성형 AI를 둘러싼 빅테크간 거대한 힘겨루기 장면을 소개해 드렸습니다. 개인적으로는, 오늘 핀테크 업계의 획을 그은 한 CEO님을 만나고 왔는데요. 이 분은 인터넷 물결을 보고 창업해, 현재는 기업을 중견기업으로 성장시킨 분입니다. 이 CEO님이 이런 말씀을 해주셨어요.

 

"생성AI 혁명은, 증기기관 혁명 TCP/IP 혁명에 이은 세번째 산업 혁명입니다. 1999년 인터넷 물결을 보고 회사를 그만두고 창업했는데, 이제는 은퇴를 앞두고도 은퇴를 당분간 못할 것 같습니다."

 

지금 같은 시기에서는 결코 흐름을 놓치면 안된다는 메시지로 받아들였습니다. 팀 미라클레터는 독자님들이 궁금한 소식을 언제나 실시간 전달하도록 노력하겠습니다. 그럼 또 인사드릴게요.

 

진심을 다합니다

 

 

댓글 쓰기

Welcome

다음 이전