Google Gemini는 지금까지 가장 강력한 AI 두뇌이며 Google 사용 방식을 변화시킬 것입니다.

 

Google Gemini는 지금까지 가장 강력한 AI 두뇌이며 Google 사용 방식을 변화시킬 것입니다.

주황색 배경의 노트북 화면에 표시된 Google Gemini 로고
(이미지 출처: 구글)

Google은 Google Bard 챗봇에서 Pixel 휴대폰에 이르기까지 회사의 다양한 제품을 지원하는 AI 시스템인 새로운 Gemini 인공 지능(AI) 모델을 발표했습니다. 회사는 Gemini를 "우리가 만든 가장 유능하고 일반적인 모델"이라고 부르며 AI가 "모든 사람에게 더 도움이 될 것"이라고 주장합니다. 이 페이지 아래에 있는 놀라운 비디오 데모를 보면 그 말이 맞을 수도 있습니다.

Gemini는 Ultra, Pro, Nano의 세 가지 '크기'로 제공되며 각 크기는 서로 다른 용도로 설계되었습니다. 이들 모두는 다중 모드가 될 것입니다. 즉, Gemini가 텍스트, 코드, 오디오, 이미지 및 비디오를 프롬프트로 받아들일 수 있다고 Google에서 말하는 것과 같이 광범위한 입력을 처리할 수 있다는 의미입니다.

Gemini Ultra는 데이터 센터와 같이 극도로 까다로운 사용 사례를 위해 설계되었지만 Gemini Nano는 스마트폰에 적합하여 상당한 AI 이점을 얻을 수 있는 최고의 Android 스마트폰 의 가능성을 높입니다 .

이 모든 새로운 기능을 통해 Google은 사람들의 Gemini 사용으로 인해 발생하는 유해한 결과를 식별하고 예방하기 위해 "엄격한 테스트"를 수행했다고 주장합니다. 회사는 Gemini의 다중 모드 특성으로 인해 겉보기에 무해해 보이는 두 가지 입력(예: 텍스트 및 이미지)을 결합하여 공격적이거나 위험한 것을 생성할 수 있기 때문에 이는 어려운 일이라고 말했습니다.

모든 서비스와 장치에 접근

Google은 OpenAI 의 ChatGPT 와 고급 AI 기능을 따라잡아야 한다는 압력을 받아왔습니다 . 사실 불과 며칠 전만 해도 구글이 다양한 언어에서의 명백한 저조한 ​​성능으로 인해  제미니 발표를 내년으로 연기 했다는 소식이 돌았습니다.

이제 뉴스가 잘못되었거나 Gemini의 불완전성 소문에도 불구하고 Google이 계속해서 추진하고 있는 것으로 나타났습니다. 이 점에서 주목할 점은 Gemini가 처음에는 영어로만 작동한다는 것입니다.

쌍둥이자리는 당신에게 어떤 의미인가요? 음, Pixel 8 Pro 휴대폰을 사용하는 경우 Google은 이제 Gemini Nano를 실행하여 모든 AI 기능을 주머니에 가져올 수 있다고 말합니다. Google 블로그 게시물 에 따르면 Gemini는 Pixel 8 Pro의 두 가지 새로운 기능, 즉 메시지 답장을 제안하는 Gboard의 스마트 답장과 녹음된 대화와 프레젠테이션을 요약할 수 있는 녹음기 요약에 포함되어 있습니다.

Google Bard 챗봇 도 Gemini를 실행하도록 업데이트되었습니다. 회사에서는 "Bard 출시 이후 가장 큰 업그레이드"라고 밝혔습니다. 또한 Google은 "Gemini는 앞으로 몇 달 안에 검색, 광고, Chrome 및 Duet AI와 같은 더 많은 제품 및 서비스에서 사용할 수 있을 것"이라고 밝혔습니다.

발표의 일환으로 Google은 Gemini 시연 목록을 공개했습니다 . 이는 AI가 사용자가 무엇을 그리고 있는지 추측하고, 그림에 맞춰 음악을 재생하는 등의 작업을 보여줍니다.

쌍둥이 자리 대 ChatGPT

Google I/O 2023에서 공개된 Google Gemini

(이미지 출처: 구글)

OpenAI의 ChatGPT가 현재 몇 달 동안 가장 지배적인 AI 도구였으며 Google은 Gemini를 통해 이를 끝내기를 원한다는 사실은 비밀이 아닙니다 . 회사는 자사의 능력에 대해서도 꽤 대담한 주장을 했습니다.

예를 들어 Google은 Gemini Ultra의 성능이 LLM(대형 언어 모델) 연구 및 개발에 사용되는 "널리 사용되는 학술 벤치마크 32개 중 30개"에서 현재의 최첨단 결과를 능가한다고 말합니다. 즉, Google은 거의 모든 면에서 GPT-4를 능가한다고 생각합니다.

ChatGPT를 지원하는 GPT-4 LLM과 비교하여 Gemini는 텍스트 기반 벤치마크 8개 중 7개에서 1위를 차지했다고 Google은 주장합니다. 다중 모드 테스트의 경우 Google의 비교에 따르면 Gemini는 10개 벤치마크 모두에서 승리했습니다.

이것은 새로운 AI 챔피언이 있다는 것을 의미합니까? 이는 아직 두고 볼 일이며, 독립 사용자들의 실제 테스트를 더 기다려야 할 것입니다. 그럼에도 불구하고 분명한 것은 구글이 AI 싸움을 매우 진지하게 받아들이고 있다는 것이다. 이제 공은 OpenAI(그리고 Microsoft )의 코트에 쏠려 있습니다 .


Microsoft의 Copilot 챗봇은 곧 ChatGPT의 새로운 두뇌를 포함하여 6가지 큰 업그레이드를 받게 됩니다.

Bing AI 채팅 이미지 결과
(이미지 출처: 미래)

Microsoft는 이전에 Bing Chat으로 알려진 AI 챗봇 인 Copilot이 곧 6가지 인상적인 업그레이드를 받을 것이라고 발표했습니다 .

이러한 일련의 개선을 통해 Copilot 챗봇은 여러 측면(Windows 11 외부 및 내부 )에서 훨씬 더 강력해졌습니다.

따라서 먼저 업그레이드 자체( Microsoft 블로그 게시물 에 나열됨 )를 분석한 후 어떤 차이점이 있는지 논의해 보겠습니다.

첫째, 그리고 가장 중요한 것은 Copilot이 새로운 두뇌를 얻고 있다는 것입니다. 즉 GPT-4 Turbo 형태의 업그레이드된 두뇌라고 해야 할까요. 이는 OpenAI 의 최신 GPT 모델로 일반적으로 더 우수하고 정확하다는 측면에서 다양한 발전을 이루었습니다.

또 다른 강력한 업그레이드는 챗봇의 이미지 생성 기능인 Dall-E 3의 업데이트된 엔진으로 , 사용자가 요청한 것과 더욱 밀접하게 일치하는 더 높은 품질의 결과를 생성합니다. 이것은 실제로 지금 Copilot에 있습니다.

셋째, Microsoft는 Copilot이 이미지 검색을 더 잘 수행하여 AI에 사진을 찍어 더 많은 정보를 얻을 때 더 나은 결과를 반환할 것이라고 약속합니다.

또 다른 추가 기능은 Microsoft가 표현한 것처럼 "복잡한 주제에 대해 최적화된 검색 결과를 제공"하기 위해 GPT-4를 사용하는 Deep Search입니다. 이것이 의미하는 바는 Copilot에 대한 쿼리가 있는 경우 더 심층적인 검색 요청을 생성하여 더 나은 결과를 생성할 수 있다는 것입니다. 또한, 쿼리 용어가 모호하고 잠재적으로 여러 주제와 관련될 수 있는 경우 Deep Search는 해당 주제가 무엇인지 추적하고 쿼리를 구체화할 수 있는 제안을 제공합니다.

Microsoft가 계획한 다섯 번째 업그레이드는 이름에서 알 수 있듯이 코딩, 데이터 분석 등을 포함한 복잡한 작업을 수행하는 데 도움이 되는 코드 해석기(Code Interpreter)입니다. 일반 사용자가 혜택을 볼 수 있는 것은 아니지만 물론 혜택을 받을 사람들도 있습니다.

마지막으로 Microsoft Edge 브라우저 의 Copilot에는 다시 쓰기 기능(인라인 텍스트 작성용)이 곧 제공될 예정입니다. 이를 통해 웹사이트에서 텍스트를 선택하고 AI가 이를 다시 작성하도록 할 수 있습니다.


분석: 구글이 걱정할 점

달-E 3

(이미지 출처: 미래)

여기에는 정말 유용한 변경 사항이 있습니다. GPT-4 Turbo를 얻는 것은 많은 Copilot 사용자가 원했던 GPT-4의 업그레이드이며 Microsoft는 현재 일부 사용자를 대상으로 테스트 중이라고 밝혔습니다. (우리는 이전에 아직 해결해야 할 몇 가지 꼬임이 있다고 들었 으므로 아마도 현재 진행 중인 작업일 것입니다).

GPT-4 Turbo는 "앞으로 몇 주" 내에 출시될 예정이므로 운이 좋으면 곧 출시될 것입니다. 귀하의 질문에 응답할 때 챗봇.

솔직히 말해서 이미 뛰어난 이미지 생성 엔진이기 때문에 Dall-E 3가 업그레이드되는 것을 보는 것도 좋습니다. (온라인에서 공유되는 인상적인 결과로 인해 이 기능이 처음 출시되었을 때 서둘러 사용했던 것을 기억해 보십시오.)

심층 검색 기능과 세련된 이미지 검색이라는 검색 쿼리 개선 사항도 위의 업그레이드와 결합되어 Copilot을 여러 면에서 훨씬 더 좋게 만들 것입니다. (Edge의 인라인 재작성 기능이 남용될 가능성에 대해 다소 걱정하기는 하지만).

Copilot에 대한 이러한 모든 추진력은 Google이 AI 분야의 발전을 지연하고 일부 주요 출시를 2024년 초로 연기한다는 소식을 들었을 때 발생했습니다. Microsoft는 Copilot에 관해서는 머뭇거리지 않습니다. Google  너무 세게 밀어붙여서 실수를 저지르지 않고 균형을 유지해야 합니다.


댓글 쓰기

Welcome

다음 이전