구글 AI 모델 제미나이(Gemini)란? 제미나이 종류 및 사용법 보기

2024/06/07글쓴이:

구글은 미국 캘리포니아주 마운틴 뷰에서 연례 개발자 회의(I/O)를 열고 제미나이의 구글 서비스 내 통합, 경량형 인공지능인 ‘제미나이 1.5 플래시’ 등을 공개했습니다. 이에 “구글은 이제 완전한 ‘제미나이(Gemini)의 시대’에 진입했습니다.”

본문은 구글 제미나이, 제미나이 1.5 프로, 제미나이 1.5 프래시 및 사용법에 대해서 살펴보도록 합니다.

구글 제미나이

 

AI 제미나이(Gemini)

구글 제미나이(Gemini)는 멀티모달 기반 AI 모델입니다. 제미나이는 텍스트로 채팅하는 것을 넘어 사람의 말을 듣고 대답할 수 있습니다. 즉, 텍스트, 이미지, 오디오, 동영상, 코드 등 다양한 유형의 정보를 일반화하고, 원활하게 이해하며, 여러 정보를 동시에 조합하여 활용할 수 있다는 뜻입니다.

제미나이는 구글 딥마인드(Google DeepMind)와 구글 리서치(Google Research) 등 구글 조직 전반에 걸친 대규모 협업의 결과이며, 구글 역사상 가장 큰 과학적 및 기술적 노력 중 하나입니다.

또한, 제미나이는 구글이 지금까지 만든 모델 중 가장 유연한 모델입니다. 제미나이는 데이터센터부터 모바일 기기까지 모든 환경에서 범용적으로 유연하게 활용될 수 있습니다. 앞으로 개발자들과 기업은 AI를 활용해 제품을 구축하고 확장하는 방식을 크게 개선할 수 있을 것입니다.

구글 AI 모델의 첫 번째 버전인 제미나이 1.0은 규모에 맞게 세 종류로 최적화했습니다.

  • 제미나이 울트라(Gemini Ultra): 방대하고 복잡한 작업에 적합한 가장 유용하고 규모가 큰 모델(Most capable and largest model for highly complex tasks)
  • 제미나이 프로(Gemini Pro): 다양한 작업에서 확장하기에 가장 적합한 모델 (Best model for scaling across a wide range of tasks)
  • 제미나이 나노(Gemini Nano): 온디바이스(on-device) 작업에 가장 효율적인 모델 (most efficient model for on-device tasks)

구글 바드 vs 제미나이

2024년 2월 7일 구글이 구글 바드를 구글 제미나이로 명칭 변경하였습니다. 사실 바드와 제미나이는 개별적인 AI 모델이지만 제미나이라는 하나의 브랜드로 통합된 것입니다.

특징 제미나이 바드
데이터 세트 텍스트, 이미지, 오디오 텍스트, 코드
모델 크기 175T 파라미터 1.56T 파라미터
성능 MMLU에서 사람보다 높은 점수 MMLU에서 사람과 비슷한 점수
강점 시각적 이해, 수학적 이해, 창의적 구성 창의적 텍스트 생성, 언어 번역
약점 창의적 텍스트 생성, 언어 번역 시각적 이해, 수학적 이해

구글 제미나이의 답변을 토대로 정리한 것이며 디테일한 부분에서는 오류가 있을 수 있습니다. 제미나이가 보다 발전된 모델이지만 구글 바드의 장점까지 결합해 보다 완성도 있는 서비스를 이용할 수 있을 것으로 기대합니다.

BTCC는 300개 이상의 암호화폐 USDT 무기한 선물을 최대 225배 레버리지로 제공하며 하단 버튼으로 거래해 보세요!

🎁BTCC 가입하시며 10USDT 받으세요

 

BTCC APP DOWNLOAD

안드로이드 버전 다운로드 iOS 버전 다운로드
신규 유저 한정 이벤트(입금 및 거래 시 10,055USDT 보상) <<<<

제미나이 1.0 기능

제미나이는 처음부터 텍스트, 오디오, 이미지, 영상 등 모든 종류의 입력값을 원활하게 이해하고 추론할 수 있으며, 기존 멀티모달 모델보다 훨씬 뛰어나며 거의 모든 영역에서 가장 앞선 기능을 제공합니다.

1.텍스트, 이미지, 오디오에 대한 이해

제미나이 1.0은 텍스트, 이미지, 오디오 등을 동시에 인식하고 이해하도록 훈련되어 미세한 차이의 정보도 잘 이해하고 복잡한 주제와 관련된 질문에도 답변할 수 있습니다.

특히 수학과 물리학의 추론에 대한 설명에 탁월합니다.

2.복잡한 추론

제미나이 1.0의 정교한 멀티모달 추론 기능은 복잡한 형태의 텍스트 및 시각적 정보를 이해하는 데 도움이 됩니다. 따라서 방대한 양의 데이터 속에서 식별하기 어려운 지식을 발견하는 데 뛰어난 능력을 발휘합니다.

3.강화된 코딩

제미나이 1.0은 파이썬, 자바, C++, Go 등 세계에서 가장 인기 있는 프로그래밍 언어로 작성된 고품질 코드를 이해하고, 설명하고, 생성할 수 있습니다. 다양한 언어를 다루고 복잡한 정보를 추론할 수 있는 능력으로 제미나이는 세계 최고 수준의 코딩 기반 모델 중 하나로 자리 잡았습니다.

제미나이는 더욱 발전된 코딩 시스템 엔진으로도 사용될 수 있습니다.

4. 안정성, 확장성, 효율성 향상

구글은 자체 설계한 텐서 프로세싱 유닛 (Tensor Processing Unit: TPU) v4 및 v5e를 사용하여 AI 최적화 인프라에서 대규모로 제미나이 학습을 진행했습니다. 제미나이는 학습 단계부터 가장 안정적이고 확장성이 뛰어나며, 가장 효율적인 모델로 설계되었습니다.

제미나이는TPU에서 이전의 크기가 작고 기능이 제한적이던 모델보다 훨씬 빠르게 실행됩니다.

 

제미나이 사용법

일반 이용자를 위한 제미나이

먼저 일반 이용자들은 파인튜닝된 제미나이 프로가 적용된 바드를 한국을 포함한 170개 이상의 국가 및 지역에서 영어로 이용할 수 있습니다. 이번 업데이트를 통해 제미나이 프로를 장착한 바드는 업계에서 가장 뛰어난 성능을 갖추게 되었습니다.

또한 구글 픽셀(Pixel)에도 제미나이가 탑재될 예정입니다. 픽셀 8 프로 모델은 제미나이 나노가 실행되도록 설계된 최초의 스마트폰입니다.

개발자 및 기업 고객을 위한 제미나이

둘째로, 개발자와 기업 고객은 Google AI Studio 또는 Vertex AI의 제미나이 API를 통해 제미나이 프로를 이용할 수 있습니다.

  • 제미나이 나노: 제미나이 나노는 갤럭시 S24에서 사용 가능합니다. 갤럭시 S24가 인터넷에 연결되어 있지 않은 상태에서도 실시간 통역 기능 등 뛰어난 AI 기능을 활용할 수 있는 것이 바로 제미나이 나노가 탑재되었기 때문입니다.
  • 제미나이 프로: 제미나이 프로는 무료로 지금 바로 사용 가능합니다. 현재 웹에서 이용 가능하며 조만간 앱에서도 만나볼 수 있을 것으로 기대됩니다.
  • 제미나이 울트라: 제미나이 울트라는 제미나이 어드밴스드(Gemini Advanced)에서 사용 가능합니다. 가장 중요한 제미나이 어드밴스드에 대해서 좀 더 상세히 정리해 보자면 아래 내용과 같습니다.

제미나이 사용법/단계

1. 구글 검색창에 gemini나 제미나이를 검색해 구글 제미나이를 방문하도록 하겠습니다.

2.그러고 나서 공식페이지에 들어서 로그인을 합니다.

3.로그인 완료된 후 여러 가지 메뉴가 보일 겁니다만, Bard를 선택할 거예요.바드는 구글 AI인데, 제미나이 AI가 바드에 적용된 겁니다.

3.이게 제미나이의 메인 메뉴입니다. 우측 하단에 대화 예시가 나와있는데요. 7일 동안의 캠핑 여행을 위한 패키지를 알려달라고 합니다.

4.이제 본격적으로 제미나이를 사용해보도록 합니다.

  • 구글 원 AI 프리미엄 요금제 가입 필요 (월 29,000원)
  • 구글 제미나이 웹과 앱에서 제미나이 울트라 사용 가능
  • Google Docs, Google Slides, Gamil에서 제미나이 울트라 사용 (곧 출시 예정)

BTCC는 300개 이상의 암호화폐 USDT 무기한 선물을 최대 225배 레버리지로 제공하며 하단 버튼으로 거래해 보세요!

🎁BTCC 가입하시며 10USDT 받으세요

 

BTCC APP DOWNLOAD

안드로이드 버전 다운로드 iOS 버전 다운로드
신규 유저 한정 이벤트(입금 및 거래 시 10,055USDT 보상) <<<<

챗GPT / Google Gemini 차이점

둘 다 사용자의 질문에 답해주는 인공지능 챗봇의 종류인 것은 동일하지만 챗 GPT는 텍스트로 입력된 질문만을 처리하는 반면 구글 제미니는 텍스트, 오디오, 이미지, 영상 등 모든 종류의 입력값을 이해하고, 답변할 수 있는 멀티모달 AI 모델라는 점이 가장 큰 차이점 입니다.

또한 구글의 AI 비서인 ‘구글 어시스턴트’의 음성 기능도 Gemini 앱을 통해 이용할 수 있습니다.

 

제미나이 1.5

제미나이 1.5는 획기적인 성능 개선을 이뤄냈습니다. 이는 파운데이션 모델 개발 및 인프라의 거의 모든 부분에 걸친 연구 및 엔지니어링 혁신을 기반으로 이뤄낸 구글의 접근 방식의 변화를 의미합니다.

제미나이 1.5 모델 중 구글이 초기 테스트 버전으로 출시하는 첫 모델은 ‘제미나이 1.5 프로’입니다. 이 모델은 다양한 작업에 걸쳐 확장하는데 최적화되어 있으며 구글의 역대 최대 모델인 제미나이 1.0 울트라와 비슷한 수준으로 수행하는 중형 멀티모달 모델입니다. 또한 긴 문맥을 이해할 수 있는 뛰어난 실험적인 기능도 함께 제공됩니다.

지난 몇 달간 구글은 다양한 작업에서 일반적인 성능을 발휘하는 최고의 모델 제미나이 1.5 프로를 대폭 개선해 왔습니다.

컨텍스트 윈도우를 200만 개의 토큰으로 확장한 것 외에도, 데이터 및 알고리즘 향상을 통해 코드 생성, 논리적 추론 및 계획, 멀티턴 대화(multi-turn conversation), 오디오 및 이미지 인식 기능을 개선했습니다.

제미나이 1.5 프로는 이제 역할, 형식 및 스타일과 같은 제품 수준의 동작을 지정하는 것을 포함해, 점점 더 복잡하고 미묘한 지침도 따를 수 있습니다. 채팅 상담원의 페르소나 및 응답 스타일을 만들거나 여러 기능 호출을 통해 워크플로우를 자동화하는 등, 특정 사용 사례에 대한 모델의 응답 제어 기능을 개선했습니다.

제미나이 1.5 프로는 150개 이상 국가에서 한국어를 포함, 35개 이상의 언어로 제공되는 제미나이 어드밴스드 구독자 대상으로 제공됩니다.

BTCC는 300개 이상의 암호화폐 USDT 무기한 선물을 최대 225배 레버리지로 제공하며 하단 버튼으로 거래해 보세요!

🎁BTCC 가입하시며 10USDT 받으세요

 

BTCC APP DOWNLOAD

안드로이드 버전 다운로드 iOS 버전 다운로드
신규 유저 한정 이벤트(입금 및 거래 시 10,055USDT 보상) <<<<

제미나이 1.5 프로 기능

복잡한 추론 기능

제미나이 1.5 프로는 주어진 프롬프트에 답하기 위해 더욱 매끄럽게 방대한 양의 콘텐츠를 분석, 분류하여 요약해 줍니다. 제미나이 1.5 프로는 문서 전반에서 발견되는 모든 자세한 정보들과 대화, 사건, 이미지 등을 종합해 추론해 낼 수 있습니다.

제미나이 1.5 프로는 영상 등 다양한 모달리티에서도 고도로 정교화된 이해 능력과 추론 능력을 자랑합니다.

더욱 향상된 성능

텍스트, 코드, 이미지, 음성 및 영상 등 종합적인 패널을 테스트 했을 때, 제미나이 1.5 프로는 구글의 대규모 언어 모델(LLM) 개발 시 사용된 벤치마크에서 기존 제미나이 1.0 프로보다 87% 더 향상된 성능을 보였습니다. 또한, 제미나이 1.0 울트라와 동일한 벤치마크 비교 시에는 전반적으로 거의 비슷한 수준의 성능을 나타냈습니다.

“문맥 기반 학습(in-context learning)” 기능

또한, 제미나이 1.5 프로는 놀라운 “문맥 기반 학습(in-context learning)” 기능을 갖추고 있습니다. 해당 기능을 통해 제미나이 1.5 프로는 추가적인 미세 조정 작업 없이도 주어진 긴 프롬프트 내 정보에서 새로운 기술을 학습할 수 있습니다. 구글은 Machine Translation from One Book (MTOB)이라는 벤치마크를 통해 모델이 기존에 본 적이 없던 정보도 얼마나 잘 학습하는지 테스트하였습니다.

더 많은 제미나이 1.5 프로 기능에 대한 정보는 공식 웹사이트에서 확인할 수 있습니다.

 

제미나이 1.5 사용법

1.챗 GPT처럼 사이트에 접속하거나 앱을 실행해서 사용할 수 있습니다.

2.접속 후 구글 ID로 로그인하면 하단에 프롬프트 창이 뜹니다.

3.이제 한국어로 궁금한 점을 입력하고 오른쪽 제출 버튼(비행기 모양)을 눌러주면 답변을 받을 수 있습니다.

4.문제를 입력한 후에 몇 초 만에 답변을 받았습니다. 조목조목 항목을 나누어 일목요연하게 설명해주는 것을 볼 수 있습니다.

5.하단 ‘대답 수정’을 눌러서, 답변을 짧게, 길게, 간결하게, 캐쥬얼하게, 전문적으로 등 다양한 답변 스타일로 변경할 수 있습니다. 이 기능을 통해 내가 쓰는 문체에 근접한 답변을 받을 수 있습니다.

6.하단 ‘구글 마크’를 누르면 답변을 재확인하면서 중요한 부분을 체크해 보여줍니다. 답변 내용이 너무 길다면 이런 식으로 중요한 내용을 체크해보면 편합니다.

참고로 구글의 이미지 검색’은 비슷한 이미지를 찾아주는 기능이지만, 구글 제미니의 이미지 검색은 이미지에 대한 정보를 텍스트로 정리해 준다는 점에서 차이가 있습니다.

BTCC는 300개 이상의 암호화폐 USDT 무기한 선물을 최대 225배 레버리지로 제공하며 하단 버튼으로 거래해 보세요!

🎁BTCC 가입하시며 10USDT 받으세요

 

BTCC APP DOWNLOAD

안드로이드 버전 다운로드 iOS 버전 다운로드
신규 유저 한정 이벤트(입금 및 거래 시 10,055USDT 보상) <<<<

구글, ‘프로젝트 아스트라(Astra)’공개

이 밖에도 구글은 멀티모달 인공지능인 ‘프로젝트 아스트라(Astra)’를 공개하기도 했습니다. 멀티모달 인공지능은 사람이 시각과 청각을 통해 사물을 인식하는 방식과 동일하게 인공지능이 다양한 이미지와 텍스트를 받아들여 스스로 사고하고 학습하는 기능을 말합니다.

프로젝트 아스트라는 인공지능이 사람처럼 보고 들을 수 있고 음성으로 대화하는 이용자의 개인 비서입니다. 지메일과 구글 문서, 캘린더 등 구글 앱에서 개인 정보를 가져와 이용자의 스케줄을 알려주고 계획을 만들어 제안해줍니다.

 

구글 ‘제미나이 생태계’로 오픈AI에 반격

14일(현지시간) 구글은 미국 캘리포니아 마운틴뷰에서 ‘구글 I/O 2024’를 열고 미국 내 생성형 AI 검색 서비스 정식 출시와 생성형 AI 제미나이의 구글 서비스 내 통합, 경량형 AI 제미나이 1.5 플래시 등을 공개했습니다.

제미나이는 지메일·캘린더·웍스 등 구글 앱 전반에도 본격 적용된다. 구글 생태계 내 데이터를 AI가 유기적으로 연결해 개인 비서 역할을 하는 것입니다. 일례로 제미나이가 구글 시트 내 일정을 찾아 캘린더에 저장해주고 e메일을 기반으로 캘린더와 시트를 수정해줄 수도 있습니다. 에지(온디바이스) AI용 경량화 모델인 ‘제미나이 나노’는 사진·음성 등을 모두 처리할 수 있는 ‘멀티모달’ 기능을 더했는데 전 세계적으로 2억 대 정도로 추산되는 안드로이드 스마트폰에 적용 가능하게 됩니다.

BTCC는 300개 이상의 암호화폐 USDT 무기한 선물을 최대 225배 레버리지로 제공하며 하단 버튼으로 거래해 보세요!

🎁BTCC 가입하시며 10USDT 받으세요

 

BTCC APP DOWNLOAD

안드로이드 버전 다운로드 iOS 버전 다운로드
신규 유저 한정 이벤트(입금 및 거래 시 10,055USDT 보상) <<<<

제미나이 1.5 플래시 공개

전날 경쟁사 오픈AIGPT-4o를 통해 강조했던 AI 모델 효율성은 구글의 전략에도 녹아 있다. 이날 공개한 경량화 AI 모델인 ‘제미나이 1.5 플래시’는 기존 1.5 프로 대비 응답 속도는 빠른 반면 100만 토큰당 구동 비용은 35센트에 불과하다. ‘제미나이 1.5 프로’와 비교하면 20분의 1 수준이다.

제미나이 1.5 플래시는 제미나이 모델 제품군에 추가된 최신 모델이자, API에서 제공되는 가장 빠른 제미나이 모델입니다. 대규모 및 빈도가 높은 작업에 최적화돼 있으며, 획기적으로 긴 컨텍스트 윈도우를 제공하는 동시에 비용 효율성이 더욱 높아졌습니다.

제미나이 1.5 프로보다 가벼운 모델이지만 방대한 양의 정보에 대한 멀티모달 추론 능력이 뛰어나며 크기에 비해 품질도 뛰어납니다.

제미나이 1.5 플래시는 요약, 채팅 애플리케이션, 이미지 및 동영상 캡션, 긴 문서 및 표에서 데이터 추출 등에 탁월한 성능을 발휘합니다. 이는 더 큰 모델에서 가장 필수적인 지식과 기술을 더 작고 효율적인 모델로 옮기는 ‘증류(distillation)’ 프로세스를 통해 1.5 프로로 학습되었기 때문입니다.

 

구글 제미나이의 시대: 혁신의 미래를 열다

이번 제미나이 업데이트는 AI 개발의 중요한 이정표이자, 구글이 AI 모델의 기능을 빠르게 혁신하고 책임감 있게 발전시켜 나가는 새로운 시대의 시작을 의미합니다.

구글이 특히 구글 검색을 완전히 개편한 ‘AI오버뷰(Overview·개요)’를 출시했습니다. 구글이 주도해 온 온라인 검색 기술은 그 동안 ‘키워드 중심’이었다. 찾고 싶은 내용을 검색창에 짧은 단어로 입력하고, 검색 결과로 나온 수 많은 웹사이트를 클릭하며 원하는 답을 찾는 식이었습니다.

하지만 검색 기능에 생성형 AI가 장착되면 이야기가 달라집니다. 구체적으로 원하는 내용을 문장 형식으로 길게 입력하면, AI가 그에 가장 적합한 답을 찾아 결과를 보여주는 식으로 바뀌게 된다는 것입니다.

‘AI 오버뷰’는 무료 서비스로, 이번 주 미국 시장 출시를 시작으로 연말까지 각국별로 순차적으로 적용될 예정입니다. 한국에선 올해 연말쯤 시작될 전망입니다.

또한 구글은 검색외에도 AI를 접목한 신규 서비스들을 대거 내놨습니다. ‘구글 포토에 물어보기’ 기능은 구글 포토 앱에 새롭게 생긴 제미나이 버튼을 누르고 ‘내 차 번호판 찾아줘’라고 하면 AI가 수많은 사진 중에 나의 차량 번호판이 찍힌 사진을 정확하게 찾아줍니다. 이 같은 시연과 동시에 현장 4300명 이상의 참석자들 사이에선 우렁찬 환호와 박수가 터져나왔습니다.

추가로 6세대 텐서처리장치(TPU) ‘트릴리움’은 전 세대보다 성능이 4.7배 개선됐습니다. 트릴리움은 연말 구글 클라우드에 적용됩니다.

BTCC는 300개 이상의 암호화폐 USDT 무기한 선물을 최대 225배 레버리지로 제공하며 하단 버튼으로 거래해 보세요!

🎁BTCC 가입하시며 10USDT 받으세요

 

 

더 많은 내용은 BTCC 뉴스 BTCC 아카데미에 확인 할 수 있습니다.


BTCC 가입혜택

BTCC는 신규 유저들을 위해서 가입하면 보너스를 받을 수 있는 이벤트를 준비합니다. 지금 가입 및 거래하면 최대 10,055USDT 받을 수 있습니다. 또한  입금 금액에 대비 VIP 등급 높을 수 있습니다(입금↑  VIP↑).VIP가 되면 거래 수수료 할인 또 다른 헤택을 누릴 수 있습니다.

BTCC 거래소

  • 12년 보안 무사고
  • 암호화페 라이센스를 확득한 믿음직한 거래소
  • 전세계 규제 준수
  • 세계 최저 수수료(0%)
  • 최대 225배 레버리지 제공
  • 무료 모의 거래 가능
  • 풍부한 유동성 및 오더북
  • 토큰화 주식 및 암호화폐 출시
  • 원화입금 지원
  • 24×7 시간 한국어 고객서비스 제공
  • 최신 시장 동향 및 투자 교육 제공
  • PC/모바일 거래 가능
  • 다양한 이벤트

 

핫한 암호화폐 소개:

낫코인(Notcoin)이란? NOT 코인 시세, 채굴 방법, 수익미션 및 전망

타이코(Taiko)란? TAIKO 코인 시세 및 에어드랍, 업비트 상장 정보

오픈AI, 새 AI 모델 GPT-4o 출시…챗 GPT-4o 사용법 및 기능 보기

오픈 AI ‘소라’ 등장…소라(Sora)란? 소라 사용 방법 알아보기

ChatGPT(챗GPT) 사용법 소개, 어떻개 가입합니까? – BTCC

Chat GPT 란? ‘구글의 시대 끝났다’평가 나온 그는 할 수 있는 일? – BTCC

가입하고 암호화폐 투자를 시작하세요

App Store또는Google Play를 통해 BTCC 앱 다운로드

BTCC 소셜 미디어 팔로우

스캔하여 다운로드

댓글

더 보기

댓글 달기

귀하의 이메일 주소는 공개되지 않습니다. *는 필수 항목입니다.

댓글 내용*

이름*

이메일 주소*

제출