また夢の広がるサービスが発表されました。
チャットAI『Bard』が登場してから約半年。
Googleの最新AI『Gemini』。
Geminiは、テキストや画像、音声、動画などさまざまな書式のデータをシームレスに理解して、複雑な質問にも回答できるモデル。
Googleの発表によると、業界標準のベンチマークでテストをおこない、あのChatGPTのスコアを上回る結果で、現時点で最も性能の良いモデルと位置づけてます。
発表のなかで、実際にGeminiを活用した事例が紹介されてますので、そちらをもとにGeminiの魅力をまとめました。
Geminiの3つのモデル
- Gemini Ultra
- Gemini Pro
- Gemini Nano
Gemini1.0として3つのモデルがラインナップされています。オンデバイスからデータセンターまであらゆるもので実行できるモデルラインナップとなってます。
Gemini Ultra
複雑なタスクに対応できる最もサイズも大きく有能なモデル
Gemini Pro
幅広いタスクに最適なモデル
Gemini Nano
デバイスタスクに適したモデル
Gemini 能力テスト映像
Gemini Ultraは、数あるベンチマークのうち、マルチタスク性能を測定するためにつくられたMMLUテストで90%のスコアを獲得。
あのGPT-4も超えるスコアだったのです。32の項目のうち、30の項目がGemini Ultraが上回る結果となりました。
実際にGeminiの実力が確認できる映像が公開されています。テキスト、画像、動画、音楽を用いてシームレスなやりとりが、分かりやすく紹介されています。
お絵描きクイズ
- ペンで描かれるものを的確に説明
- 描かれているのがアヒルだと回答
- アヒルが青く塗る
⇒青いアヒルはなかなか見ないと回答 - 青いアヒルのおもちゃを出すと、驚く
- おもちゃの素材も回答
- 他の言語も発音も教えてくれる
国名クイズ
- イラストを使ってヒントを出す
- 世界地図に指差しで回答
(答えはオーストラリア) - オーストラリアを指差すと正解と反応
その他にも様々な角度からクイズを出題しいていて、それをGeminiがスムーズに回答してます。会話がきれいに成立しています。
ぜひ、上の動画を一度ご覧ください!!
BardでもつかえるGemini
3つのモデルのうち、『Gemibi Pro』は、Bardにアクセスすれば使用可能です。今後、利用できる地域・多くの言語で利用できるようになっていくようです。
英語版Bardのつかい方
英語版のBardを使うためには、Chromeの言語設定を英語に変える必要があります。
-
STEP1Chromeをひらく
-
STEP2パソコンなら右上ドットメニューからアカウントをクリック
-
STEP3個人情報をひらく
-
STEP4ウェブ向け全般設定をひらく
-
STEP5言語の設定English(United States)に設定
Bard Advanced
2024年はじめに、信頼性、安全性を確認したのち、Gemini Ultraを開発者と企業向けにリリース予定。
おなじタイミングを目指して、Gemini Ultraを搭載した『Bard Advanced』も導入されるということで、こちらも楽しみです。
磨くべきは『プロンプト力』
ChatGPTを活用するときも、よく言われていましたが、結局使いこなすには、プロンプトのテクニックが重要です。
プロンプトとは、AIとの対話する際にユーザー側が指示や質問することをいいます。AIサービスは活かすも殺すも、こちらの問いかけ次第です。
プロンプトについては自分も勉強中です。有益な情報は今後発信していきます。
Pixelシリーズの未来
今回のGeminiの発表でGemini NanoがPixel8 Proで利用できます。
Google Pixelシリーズ、Pixel Tablet、Pixel Watchなど今後ますますGeminiを中心に利便性がさらに高くなることが期待されます。
ピクセル端末でGeminiをしっかり使いこなせるように準備が必要です。