Googleサービス PR

Google 『Gemini』をリリース〜マルチモーダル生成AIモデル〜

Google AI『Gemini』登場〜能力と活用方法を紹介〜
記事内に商品プロモーションを含む場合があります

また夢の広がるサービスが発表されました。
チャットAI『Bard』が登場してから約半年。

Googleの最新AI『Gemini』。

GeminiはGoogle最新のマルチモーダルAI

Geminiは、テキストや画像、音声、動画などさまざまな書式のデータをシームレスに理解して、複雑な質問にも回答できるモデル。

Googleの発表によると、業界標準のベンチマークでテストをおこない、あのChatGPTのスコアを上回る結果で、現時点で最も性能の良いモデルと位置づけてます。

発表のなかで、実際にGeminiを活用した事例が紹介されてますので、そちらをもとにGeminiの魅力をまとめました。

Geminiの3つのモデル

Geminiは3つのモデルから構成される
Image:Google Deepmind
  • Gemini Ultra
  • Gemini Pro
  • Gemini Nano

Gemini1.0として3つのモデルがラインナップされています。オンデバイスからデータセンターまであらゆるもので実行できるモデルラインナップとなってます。

Gemini Ultra

複雑なタスクに対応できる最もサイズも大きく有能なモデル

2024年から利用可能

Gemini Pro

幅広いタスクに最適なモデル

Bardで利用可能

Gemini Nano

デバイスタスクに適したモデル

Pixel8 Proから利用可能

Gemini 能力テスト映像

MMLUのスコアは驚異の90%
Image:Google Deepmind

Gemini Ultraは、数あるベンチマークのうち、マルチタスク性能を測定するためにつくられたMMLUテストで90%のスコアを獲得。

あのGPT-4も超えるスコアだったのです。32の項目のうち、30の項目がGemini Ultraが上回る結果となりました。

GPT-4をも超えるGemini
Image:Google Deepmind
GPT-4を凌駕するGemini Ultra
Image:Google Deepmind

実際にGeminiの実力が確認できる映像が公開されています。テキスト、画像、動画、音楽を用いてシームレスなやりとりが、分かりやすく紹介されています。

YouTube│Geminiの能力テスト

お絵描きクイズ

この絵はなにかな?
  1. ペンで描かれるものを的確に説明
  2. 描かれているのがアヒルだと回答
  3. アヒルが青く塗る
    ⇒青いアヒルはなかなか見ないと回答
  4. 青いアヒルのおもちゃを出すと、驚く
  5. おもちゃの素材も回答
  6. 他の言語も発音も教えてくれる

国名クイズ

この動物がいる国はどこでしょうか?
  1. イラストを使ってヒントを出す
  2. 世界地図に指差しで回答
    (答えはオーストラリア)
  3. オーストラリアを指差すと正解と反応

その他にも様々な角度からクイズを出題しいていて、それをGeminiがスムーズに回答してます。会話がきれいに成立しています。

ぜひ、上の動画を一度ご覧ください!!

BardでもつかえるGemini

Bardで利用できるGemini Pro
Image:Google Deepmind

3つのモデルのうち、『Gemibi Pro』は、Bardにアクセスすれば使用可能です。今後、利用できる地域・多くの言語で利用できるようになっていくようです。

英語版Bardのみで利用可能

英語版Bardのつかい方

英語版のBardを使うためには、Chromeの言語設定を英語に変える必要があります。

  • STEP1
    Chromeをひらく
  • STEP2
    パソコンなら右上ドットメニューからアカウントをクリック
  • STEP3
    個人情報をひらく
  • STEP4
    ウェブ向け全般設定をひらく
  • STEP5
    言語の設定
    English(United States)に設定

Bard Advanced

2024年はじめに、信頼性、安全性を確認したのち、Gemini Ultraを開発者と企業向けにリリース予定。

おなじタイミングを目指して、Gemini Ultraを搭載した『Bard Advanced』も導入されるということで、こちらも楽しみです。

磨くべきは『プロンプト力』

ChatGPTを活用するときも、よく言われていましたが、結局使いこなすには、プロンプトのテクニックが重要です。

プロンプトとは、AIとの対話する際にユーザー側が指示や質問することをいいます。AIサービスは活かすも殺すも、こちらの問いかけ次第です。

プロンプトについては自分も勉強中です。有益な情報は今後発信していきます。

Pixelシリーズの未来

今回のGeminiの発表でGemini NanoがPixel8 Proで利用できます。

Google Pixelシリーズ、Pixel Tablet、Pixel Watchなど今後ますますGeminiを中心に利便性がさらに高くなることが期待されます。

ピクセル端末でGeminiをしっかり使いこなせるように準備が必要です。