Google Geminiの実力は? Bardとの違いを検証してみた

生成AIブームに火が付いた2023年。その代表的なサービスである『ChatGPT』の発表から少し遅れ、2023年3月にGoogleがリリースした生成AIが『Bard(Google Bard)』です。

その後、GoogleはBardの機能拡張を進めていきましたが、2024年2月8日にBardを『Gemini』と改め、さらなる機能強化を行っていくことを発表しました。

今回、GoogleはなぜGeminiへのリニューアルを発表したのか。実際に公開されたGeminiに触りつつ、Bardとの違いを検証していきます。

Google Bardとは?

Bardとは、Googleが開発した大規模言語モデル「PaLM 2」を搭載した生成AIです。ChatGPTやBing AIと同じく、以下のような作業に対応しています。

  • 質問に答える
  • 文章を生成する
  • 翻訳する
  • コードを書く
  • 創造的なコンテンツを生成する

2023年5月に日本語へ対応し、現在は40以上の言語に対応。現在まで試験運用の状態が続けられていますが、Webサイトの膨大なデータを保有するGoogleの生成AIということもあり、世界中がその出来に注目していました。

さらに、9月のアップデートでBardは画像のアップロードや回答の書き換え、回答ニュアンスの設定にも対応。Googleスプレッドシートなど他のGoogleサービスとの連携も強化されており、実用性が一気に向上したとして注目を集めています。

Google Geminiとは?

Geminiも、Googleが開発した生成AIである点は変わりません。しかし、搭載されているAIモデルが「Gemini」という次世代型のものに変化している点が大きな特徴です。

両者の大きな違いとしては、PaLM2が「テキスト、コード」に強みを持っていたのに対し、Geminiは「画像や音声なども含めた“マルチモーダル”」な点に強みがあります。

ここから、Geminiへと進化したことで、テキストの生成や理解にとどまらず幅広い機能が強化されたものと思われます。

また、Bardは試験版ということもあって全ユーザーが全機能を使えましたが、Geminiでは有料版にあたる「Gemini Advanced」がリリースされ、スマホアプリ版も配布されるなど、より本格的なサービスになってきた印象です。

Google Geminiの料金

Geminiは基本無料で利用可能ですが、最上位版にあたる「Gemini Advanced」は、月額19.99ドル(日本では約3000円)の課金が必要になります。

ChatGPT Plusが月額20ドル(約3000円)であることを考えると、GoogleがChatGPTを意識して料金を設定してきたことがうかがえます。

ただ、Geminiの料金はGemini単体への課金ではなく、Googleのサービスモデルである「Google One」の、Gemini Advancedの利用を含めた「AI Premium」プランへの契約料金です。

プラン内では、Gemini Advancedに加えて以下の機能も解放されます。

  • Googleのストレージが15GB→2TBへ
  • GmailなどのGoogleツールにGeminiが搭載される
  • Google Meetの追加機能(長時間グループビデオ通話など)
  • Googleカレンダーの追加機能(高度な予約スケジュールなど)
  • Googleストアで 10% キャッシュバック

上記を踏まえると、Gemini Advancedの性能がChatGPT Plusと同程度だった場合、少しでもGoogleツールを使っているならAI Premiumへ課金したほうがコスパは良さそうです。

Google Geminiの対応プラットフォーム/言語

Geminiは、PCだけでなくスマホアプリの形でも配信されています。

Androidでは「Geminiアプリ」が、iOSでは「Googleアプリ」に搭載される形でリリースされると予告され、Android版はすでにアプリストアでも確認できます。

ただ、現時点では日本がまだダウンロード対象国ではなく、Googleは以下のようにアナウンスしています。

Gemini は、本日(編集部注:2024年2月8日)より Android および iOS で英語版の提供を順次開始します。また来週より、日本を含む様々な国や地域では英語版に加え、日本語版と韓国語版のAndroid の Gemini アプリとGemini に対応した iOS の Google アプリの提供を開始します。

このように日本語版はまだスマホだと利用できないため、スマホユーザーはダウンロード可能になるまで待っていてもいいでしょう。

なお、Geminiの場合はすでに日本語にも対応していますが、現時点でGemini Advancedは英語版のみ活用可能です。ただ、利用可能言語は順次拡大予定とアナウンスされています。

Google Geminiの使い勝手【Bardとクオリティを比較してみた】

Geminiはさまざまな機能に対応しているので、以下でかんたんな使い方の例をご紹介します。

なお、過去にBardへ行った質問と同じものを用意し、両者の比較もしていきましょう。

1. 質問に答える

まずは会話型AIの標準的な機能として「質問に答える」機能が搭載されています。試しに、「Geminiでできること」を聞いてみましょう。

▲自然な長文が素早く出力される

Bardと同じく、「生成スピード」「文量」が素晴らしい点は変わりません。さらに、Bardと異なり「出典」を示すようになってくれたのも、ビジネス活用を考えるとかなり大きな進化です。

ただ、後述するように出典は表示が若干バグっており、今後の修正が望まれます。

▲Bardへの質問例。このレベルであれば、Bardの返答も高クオリティだった

2. 文章を生成する

質問のやり取りでも文章生成能力の高さは感じられましたが、以下のように文章を書いてもらいました。

▲Bardの返答に比べ、日本語の自然さと事実の正確さがかなり向上している

下で示すように、Bardも「だいたいあってる」レベルの文章は書いてくれましたが、Geminiはかなり精度が上がっている感じがします。

▲Bardの返答。悪くはないが「ペーソス」など聞きなれない単語もある

強いて言うなら、「主人公は、名前も素性も明かされない一匹の猫」という部分は、名前を明かさないわけではなく「そもそも名前のない猫」が主人公なので、微妙に語弊を生む表現と言えなくはないです。

ただ、このくらいの粗探しが必要な程度には、ハイクオリティな文章になっているといえます。

3. 翻訳する

もともと英語版が先行していたサービスであり、翻訳は得意そうな感じもあります。実際に試してみました。

▲かなり自然な訳文になっている

今回はGoogleが公式に発表している「Google が掲げる10の事実」の原文を入力してみました。公式の日本語訳と比べてもかなり自然で、直訳っぽさが残ったBardに比べると翻訳能力も向上していそうです。

▲訳が間違っているとはいえないが、少し直訳感がある

ただ、Bardでは「この英文の説明」まで行われた一方、Geminiはシンプルに指示を実行して翻訳だけを行ってくれました。

対応は好みがわかれるところですが、個人的には英文の解説を行ってほしければその旨を指示するので、シンプルに指示を実行してくれるGeminiのほうが好きです。

4. 画像とテキストを組み合わせてやり取りする

「マルチモーダル」な強みがアピールされていたので、画像とテキストを組み合わせたやり取りも試してみましょう。

▲回答の制度はBardより向上も、昼間の写真を「夜景」と判断するミス

Geminiの言うとおり、被写体は東京スカイツリーなので大正解です。ですが、誰がどう見てもお昼に撮影したこの写真を、「夜景」と表現してしまったのはいただけません。

とはいえ、Bardの頃よりは回答精度も向上しているほか、他の回答案では「夜景」に触れていなかったので、回答案を吟味すれば正答にはたどりつけそうです。

▲Bardの回答。東京スカイツリーは特定できたが、うつり込んだ無関係のビルを「東京ソラマチ」と誤認している

5. Gemini側から画像を送ってもらう

こちらからの問いかけに対し、Gemini側が画像を送付してくれることもあるようです。こちらも試してみました。

▲世界のタワー型の建物を5つ教えてくれた。ただし、説明は若干事実と異なる

Bardの頃は2つしか教えてくれなかったのが、5つ教えてくれるようになりました。加えて、出典が明記されているのも助かります。

▲Bardが返してくれたのはこの2つだけ

ただし、Geminiは添付の文章が少し間違っており、たとえば広州塔の高さは「高さは604mで、2010年に完成しました」とありますが、実際は「高さ600m」で、完成も「2009年」です。

なんとも微妙な間違いですが、微妙なゆえに気づきにくく、むしろ質が悪いともいえます。

6. 音声でやり取りする

Geminiは音声でのやり取りにも対応しているので、こちらも試してみました。

▲話した内容の文字起こし→要約を依頼。若干内容は変わってしまったが、精度は決して悪くない

今回はマイクを使ってテキストを音声入力し、要約をお願いしました。使ったのは私が過去に書いた以下の文章です。

フリーランスや企業に勤めるFPの場合、一番ポピュラーな働き方が「相談対応」です。「ファイナンシャルプランナー」の名前通り、お客様のお金に関する悩みや人生設計をヒアリングし、キャッシュフローやライフプランのアドバイスから、ときには実行支援まで行います。

ただ、お客様あっての仕事となり、お客様の多くは一般の個人。そのため、副業ベースだと相談対応やライフプラン設計の時間がとれず、意外と難しいかもしれません。実際、筆者の場合は相談対応を「知り合いのみ」に限定しています。

そもそも読み手の発音などに左右される部分もあると思いますが、文字起こし精度は決して悪くないと感じました。Geminiに直接音声入力できるのも魅力的です。

Google Geminiの長所

ここまで見てきたGeminiは、Bardの時代より全体的に進化していることがわかりました。では、ChatGPTやBing AIと比較した場合の長所はどのあたりになるのでしょうか。

長所1. 文章生成速度が早い

Geminiの長所の一つは、文章生成速度が速いことです。ChatGPT(GPT-4)やBing AIの文章生成速度は速いとはいえず、長文の出力を依頼する場合はそれなりの待ち時間が発生します。しかし、Geminiの場合は瞬時に情報が出力されます。

その理由は、やはり自前の検索システム「Google検索」をフル活用できることにあるのかもしれません。技術的な違いは置いておき、ストレスのないやり取りを実現したい方にはおすすめです。

長所2. 日本語の長文が自然

これは感覚的な印象ですが、Geminiで出力される日本語は、長文になってもかなり自然な印象があります。実際、Geminiの文章はいわゆる「AIっぽさ」が少なく感じられ、テキスト生成の能力は高いです。

自然かつ高速で文章を生成できるので、特に長文を作成したい場合はGeminiが優れています。

長所3. 最新の情報を反映している

Google検索を活用できるため、Geminiは最新情報にも対応することができます。これはBing AIも同様ですが、ChatGPTは現状だとブラウジング機能が有料版のみの対応となっており、無料利用では最新情報に対応できないのが欠点です。

▲大谷選手の所属球団は正解。ただし、契約額と年数は不正確(実際は10年総額7億ドルと推定される)

長所4. 画像/音声のやり取りに対応している

Geminiの長所には、画像/音声のやり取りに対応していることも挙げられます。Geminiは、テキストと画像の両方のデータセットでトレーニングされており、画像や音声を理解し、質問に回答することができます。

画像対応に関しては、Bing AIは対応しているものの、ChatGPTの場合はプラグインで対応する必要がありました(2023年9月25日にプラグイン無しの音声・画像対応を発表したものの、対象は有償版ユーザーのみ)。

ただし、音声入力に関しては、現時点では「こちらから発した音声」がテキストとして認識されるのみ。オリジナルの音声を返してくれたり、実際の会話のようなやり取りができるわけではありません。

長所5. Googleツールとの連携が強力

これはGoogleツールならではのメリットですが、他のGoogleツールとの連携がかなり強力です。

たとえば、Geminiが作成した表はワンクリックでGoogleスプレッドシートに転記可能ですし、自らが生成したアウトプットを、Google検索を使って「セルフチェック」する機能も備えています。

▲先ほど間違えた大谷選手の契約金も、セルフチェックで間違いを発見した

長所6. 無料でも十分使える

これだけ豊富な機能を有しながら、Geminiは無料から利用することが可能です。しかも必要な準備はGoogleアカウントの作成のみと、利用ハードルも非常に低いことが特徴。

Bing AIもChatGPTも無料利用には対応していますが、ChatGPTの場合は無料版だと機能に大きな制約があり、GeminiやBing AIよりもコストがかかります。

Google Geminiの短所

かなり使い勝手のいい生成AIツールのGeminiですが、やはり短所も存在します。

短所1. 情報が間違っていることもある

これはGeminiに限った話ではありませんが、生成AIに間違いはつきもの。上記の例でも明らかだったように、Geminiが提供する情報は必ずしも正しいとは限りません。特に最新の情報や専門的な情報については、鵜呑みにしないように注意が必要です。

セルフチェックで精度が上がることを考慮しても、この部分に関しては、Bing AIやChatGPT Plusのほうが上手な印象です。

短所2. 出典の表記がやや甘い

Geminiになって出典を表示してくれるようにはなったのですが、肝心の出典が「<無効な URL を削除しました>」と表示されてしまい、確認不可能な状態です。

▲出典は確認できるが、URLがわからずかなり不便

上記は不具合の可能性もあり、早急な改善を望みたいところ。また、ChatGPTやBing AIに比べて、何も指示をしないと出典を明記してくれないケースが多いのも気になります。

短所3. 個人情報や機密情報の漏洩リスクが高い

Geminiは、ChatGPTやBing AI以上に個人情報や機密情報の漏洩リスクを意識する必要があります。精度向上のためにAIがデータを処理するほか「場合によっては人間のレビュアーが情報をチェックすることもある」と規約には記されており、情報の取り扱いには注意しましょう。

現在は解消されていますが、過去にはBardに入力した情報がインデックスされ、Google検索に表示されてしまったケースもあるようです。

短所4. カスタマイズ性ではやや劣る

これはChatGPT Plusの特徴ですが、プラグインが豊富にあったり、自分や他人のつくったGPTを自由に使えたりと、カスタマイズ性の高さが魅力です。一方、Geminiには現状だとカスタマイズの余地がほぼありません。

Bing AIもカスタマイズ性は低く、この点はChatGPT一強という印象があります。

ただし、ChatGPTもPlus以外ではカスタマイズ性は低く、GeminiもGemini Advancedではカスタマイズ機能がリリースされてくる可能性は十分考えられます。

短所5. 人物画像に非対応

これはGeminiを触るうちに発見したのですが、人物に関する画像を読み込ませても「人物の画像についてはまだ対応していません。ご理解いただけますようお願いいたします」と表示され、受け付けてくれません。

ChatGPTやBing AIでこういった現象に遭遇したことはなく、なぜ非対応なのかは不明ですが、短所であることは間違いないでしょう。

Google Geminiのビジネスにおける具体的な活用例

ここまで、Geminiというツールの詳細を見てきました。最後に、本ツールの性質を活かした具体的な活用例をご紹介します。

活用例1. メール文面の考案

ビジネスにおいて、Geminiはメール文面の考案に活用できます。試しに、「明日、クライアントと対面で打ち合わせがあります。日時と場所に変更がないかリマインドをかねたメールを作成してください」と聞いてみましょう。

▲シンプルで無駄がなく、すぐにでも活用できそう

BardだとややAI間の強い文面になってしまったのですが、Geminiはかなり自然な印象があります。これならすぐにでもテンプレートとして活用できそうです。

▲Bardのメール案。クライアントに送付するメールと考えると、若干雑な印象も否めない

活用例2. アイデア出し

AIの得意分野として知られるアイデア出しも、Geminiにお願いすることができます。

▲端的でわかりやすく、内容も共感できる

箇条書きとシンプルですが、参考になるアイデアが多かったです。実際、当メディアでも挙げてもらったネタは数多く取り組んでいます。

▲Bardの回答。無難すぎるのと、文章形式なのでパッと見で要点が分かりにくい

活用例3. 情報の抽出+表作成

Geminiは最新情報にも対応できるので、Geminiに情報を調べてもらいつつ、表作成までやってもらいましょう。

▲ソース、注釈付きでほぼ完璧な表

データソースに加えて注釈までついており、ほぼ100点の表といえます。数値や順位も正確で、実用性は極めて高そうです。

▲Bardの回答。人口が誤っていたり、第5位がブラジルになってしまっていたり、粗さもある

しかし表自体はきれいで、スプレッドシートへの出力もできるのは嬉しいですね。

活用例4. クリエイティブの添削

自分が過去に執筆した文章はもちろん、画像アップロードに対応しているためデザインなどの各種クリエイティブを添削してもらうこともできるはずです。実際にやってみましょう。

▲アイキャッチ画像がなぜか削除されてしまった……

しかし、なんと「人物の画像は非対応」として、クリエイティブを添削してもらえませんでした。掲載したのは以下のアイキャッチ画像なので、人物といっても小さなイラストなのですが……。

▲Geminiに拒否された画像

ちなみに、Bardでは同じ画像を添削してくれました。なおさら謎です。

▲Bardの回答。「画像の明るさ」は白背景なのでそこまで問題と感じないが、たしかに余白に対してフォントサイズが若干小さいのは否めない

ちなみに、人物が写っていない画像を添削させると、普通にこなしてくれました。当面は人物の無い画像に限定して使うのがよさそうです。

▲良い点、改善点の評価も的確。さらに、続く文章では改善の具体案も提示してくれた

活用例5. 仕事中のストレス解消

テレワークなどをしていると、つい孤独を感じがちなもの。そんなときは、Geminiを話し相手にストレスや不安を解消してみるのもいいかもしれません。

今回は「難易度の高い案件を任され、成功させられるか不安です。自信を持って働けるよう、私を励ましてください」と聞いてみました。

▲実に「それっぽい」アドバイスで、返答としては合格点

もちろん「心に刺さる言葉」を期待してはいけませんが、励まし方がかなり自然になったような気がします。

▲Bardの回答。「難易度の高い案件を成功させるポイント」「具体的な励ましの言葉」などを挙げてくるあたりはまだまだAIっぽい

まとめ

ここまで、Geminiの特徴を解説してきました。

生成AIをめぐる状況は変化が激しく、非常に高頻度な情報のアップデートが求められます。Geminiに関する情報も、場合によっては1週間後に大きく変化しているかもしれません。

生成AIのアップデートにキャッチアップしつつ、自分なりの「AIとの向き合い方」を見つけていくのがいいのかもしれません。

(執筆:AI原記子 with 編集部 編集:齊藤颯人)

SHARE

  • 広告主募集
  • ライター・編集者募集
  • WorkshipSPACE
週2日20万円以上のお仕事多数
Workship