エンジニアの副業は週1からでも可能?副業の例や探し方も解説
- ITエンジニア
- 副業
生成AIブームに火が付いた2023年。その代表的なサービスである『ChatGPT』の発表から少し遅れ、2023年3月にGoogleがリリースした生成AIが『Bard(Google Bard)』です。
その後、GoogleはBardの機能拡張を進めていきましたが、2024年2月8日にBardを『Gemini』と改め、さらなる機能強化を行っていくことを発表しました。
今回、GoogleはなぜGeminiへのリニューアルを発表したのか。実際に公開されたGeminiに触りつつ、Bardとの違いを検証していきます。
目次
Bardとは、Googleが開発した大規模言語モデル「PaLM 2」を搭載した生成AIです。ChatGPTやBing AIと同じく、以下のような作業に対応しています。
2023年5月に日本語へ対応し、現在は40以上の言語に対応。現在まで試験運用の状態が続けられていますが、Webサイトの膨大なデータを保有するGoogleの生成AIということもあり、世界中がその出来に注目していました。
さらに、9月のアップデートでBardは画像のアップロードや回答の書き換え、回答ニュアンスの設定にも対応。Googleスプレッドシートなど他のGoogleサービスとの連携も強化されており、実用性が一気に向上したとして注目を集めています。
Geminiも、Googleが開発した生成AIである点は変わりません。しかし、搭載されているAIモデルが「Gemini」という次世代型のものに変化している点が大きな特徴です。
両者の大きな違いとしては、PaLM2が「テキスト、コード」に強みを持っていたのに対し、Geminiは「画像や音声なども含めた“マルチモーダル”」な点に強みがあります。
ここから、Geminiへと進化したことで、テキストの生成や理解にとどまらず幅広い機能が強化されたものと思われます。
また、Bardは試験版ということもあって全ユーザーが全機能を使えましたが、Geminiでは有料版にあたる「Gemini Advanced」がリリースされ、スマホアプリ版も配布されるなど、より本格的なサービスになってきた印象です。
Geminiは基本無料で利用可能ですが、最上位版にあたる「Gemini Advanced」は、月額19.99ドル(日本では約3000円)の課金が必要になります。
ChatGPT Plusが月額20ドル(約3000円)であることを考えると、GoogleがChatGPTを意識して料金を設定してきたことがうかがえます。
ただ、Geminiの料金はGemini単体への課金ではなく、Googleのサービスモデルである「Google One」の、Gemini Advancedの利用を含めた「AI Premium」プランへの契約料金です。
プラン内では、Gemini Advancedに加えて以下の機能も解放されます。
- Googleのストレージが15GB→2TBへ
- GmailなどのGoogleツールにGeminiが搭載される
- Google Meetの追加機能(長時間グループビデオ通話など)
- Googleカレンダーの追加機能(高度な予約スケジュールなど)
- Googleストアで 10% キャッシュバック
上記を踏まえると、Gemini Advancedの性能がChatGPT Plusと同程度だった場合、少しでもGoogleツールを使っているならAI Premiumへ課金したほうがコスパは良さそうです。
Geminiは、PCだけでなくスマホアプリの形でも配信されています。
Androidでは「Geminiアプリ」が、iOSでは「Googleアプリ」に搭載される形でリリースされると予告され、Android版はすでにアプリストアでも確認できます。
ただ、現時点では日本がまだダウンロード対象国ではなく、Googleは以下のようにアナウンスしています。
Gemini は、本日(編集部注:2024年2月8日)より Android および iOS で英語版の提供を順次開始します。また来週より、日本を含む様々な国や地域では英語版に加え、日本語版と韓国語版のAndroid の Gemini アプリとGemini に対応した iOS の Google アプリの提供を開始します。
このように日本語版はまだスマホだと利用できないため、スマホユーザーはダウンロード可能になるまで待っていてもいいでしょう。
なお、Geminiの場合はすでに日本語にも対応していますが、現時点でGemini Advancedは英語版のみ活用可能です。ただ、利用可能言語は順次拡大予定とアナウンスされています。
Geminiはさまざまな機能に対応しているので、以下でかんたんな使い方の例をご紹介します。
なお、過去にBardへ行った質問と同じものを用意し、両者の比較もしていきましょう。
まずは会話型AIの標準的な機能として「質問に答える」機能が搭載されています。試しに、「Geminiでできること」を聞いてみましょう。
Bardと同じく、「生成スピード」「文量」が素晴らしい点は変わりません。さらに、Bardと異なり「出典」を示すようになってくれたのも、ビジネス活用を考えるとかなり大きな進化です。
ただ、後述するように出典は表示が若干バグっており、今後の修正が望まれます。
質問のやり取りでも文章生成能力の高さは感じられましたが、以下のように文章を書いてもらいました。
下で示すように、Bardも「だいたいあってる」レベルの文章は書いてくれましたが、Geminiはかなり精度が上がっている感じがします。
強いて言うなら、「主人公は、名前も素性も明かされない一匹の猫」という部分は、名前を明かさないわけではなく「そもそも名前のない猫」が主人公なので、微妙に語弊を生む表現と言えなくはないです。
ただ、このくらいの粗探しが必要な程度には、ハイクオリティな文章になっているといえます。
もともと英語版が先行していたサービスであり、翻訳は得意そうな感じもあります。実際に試してみました。
今回はGoogleが公式に発表している「Google が掲げる10の事実」の原文を入力してみました。公式の日本語訳と比べてもかなり自然で、直訳っぽさが残ったBardに比べると翻訳能力も向上していそうです。
ただ、Bardでは「この英文の説明」まで行われた一方、Geminiはシンプルに指示を実行して翻訳だけを行ってくれました。
対応は好みがわかれるところですが、個人的には英文の解説を行ってほしければその旨を指示するので、シンプルに指示を実行してくれるGeminiのほうが好きです。
「マルチモーダル」な強みがアピールされていたので、画像とテキストを組み合わせたやり取りも試してみましょう。
Geminiの言うとおり、被写体は東京スカイツリーなので大正解です。ですが、誰がどう見てもお昼に撮影したこの写真を、「夜景」と表現してしまったのはいただけません。
とはいえ、Bardの頃よりは回答精度も向上しているほか、他の回答案では「夜景」に触れていなかったので、回答案を吟味すれば正答にはたどりつけそうです。
こちらからの問いかけに対し、Gemini側が画像を送付してくれることもあるようです。こちらも試してみました。
Bardの頃は2つしか教えてくれなかったのが、5つ教えてくれるようになりました。加えて、出典が明記されているのも助かります。
ただし、Geminiは添付の文章が少し間違っており、たとえば広州塔の高さは「高さは604mで、2010年に完成しました」とありますが、実際は「高さ600m」で、完成も「2009年」です。
なんとも微妙な間違いですが、微妙なゆえに気づきにくく、むしろ質が悪いともいえます。
Geminiは音声でのやり取りにも対応しているので、こちらも試してみました。
今回はマイクを使ってテキストを音声入力し、要約をお願いしました。使ったのは私が過去に書いた以下の文章です。
フリーランスや企業に勤めるFPの場合、一番ポピュラーな働き方が「相談対応」です。「ファイナンシャルプランナー」の名前通り、お客様のお金に関する悩みや人生設計をヒアリングし、キャッシュフローやライフプランのアドバイスから、ときには実行支援まで行います。
ただ、お客様あっての仕事となり、お客様の多くは一般の個人。そのため、副業ベースだと相談対応やライフプラン設計の時間がとれず、意外と難しいかもしれません。実際、筆者の場合は相談対応を「知り合いのみ」に限定しています。
そもそも読み手の発音などに左右される部分もあると思いますが、文字起こし精度は決して悪くないと感じました。Geminiに直接音声入力できるのも魅力的です。
ここまで見てきたGeminiは、Bardの時代より全体的に進化していることがわかりました。では、ChatGPTやBing AIと比較した場合の長所はどのあたりになるのでしょうか。
Geminiの長所の一つは、文章生成速度が速いことです。ChatGPT(GPT-4)やBing AIの文章生成速度は速いとはいえず、長文の出力を依頼する場合はそれなりの待ち時間が発生します。しかし、Geminiの場合は瞬時に情報が出力されます。
その理由は、やはり自前の検索システム「Google検索」をフル活用できることにあるのかもしれません。技術的な違いは置いておき、ストレスのないやり取りを実現したい方にはおすすめです。
おすすめのAIライティングツール12選【AIツール開発者が解説】
Workship MAGAZINE
これは感覚的な印象ですが、Geminiで出力される日本語は、長文になってもかなり自然な印象があります。実際、Geminiの文章はいわゆる「AIっぽさ」が少なく感じられ、テキスト生成の能力は高いです。
自然かつ高速で文章を生成できるので、特に長文を作成したい場合はGeminiが優れています。
ChatGPTは記事作成に使える? AIを活用して高品質な記事を作成する方法【記事制作用プロンプト付き】
Workship MAGAZINE
Google検索を活用できるため、Geminiは最新情報にも対応することができます。これはBing AIも同様ですが、ChatGPTは現状だとブラウジング機能が有料版のみの対応となっており、無料利用では最新情報に対応できないのが欠点です。
Geminiの長所には、画像/音声のやり取りに対応していることも挙げられます。Geminiは、テキストと画像の両方のデータセットでトレーニングされており、画像や音声を理解し、質問に回答することができます。
画像対応に関しては、Bing AIは対応しているものの、ChatGPTの場合はプラグインで対応する必要がありました(2023年9月25日にプラグイン無しの音声・画像対応を発表したものの、対象は有償版ユーザーのみ)。
ただし、音声入力に関しては、現時点では「こちらから発した音声」がテキストとして認識されるのみ。オリジナルの音声を返してくれたり、実際の会話のようなやり取りができるわけではありません。
これはGoogleツールならではのメリットですが、他のGoogleツールとの連携がかなり強力です。
たとえば、Geminiが作成した表はワンクリックでGoogleスプレッドシートに転記可能ですし、自らが生成したアウトプットを、Google検索を使って「セルフチェック」する機能も備えています。
これだけ豊富な機能を有しながら、Geminiは無料から利用することが可能です。しかも必要な準備はGoogleアカウントの作成のみと、利用ハードルも非常に低いことが特徴。
Bing AIもChatGPTも無料利用には対応していますが、ChatGPTの場合は無料版だと機能に大きな制約があり、GeminiやBing AIよりもコストがかかります。
かなり使い勝手のいい生成AIツールのGeminiですが、やはり短所も存在します。
これはGeminiに限った話ではありませんが、生成AIに間違いはつきもの。上記の例でも明らかだったように、Geminiが提供する情報は必ずしも正しいとは限りません。特に最新の情報や専門的な情報については、鵜呑みにしないように注意が必要です。
セルフチェックで精度が上がることを考慮しても、この部分に関しては、Bing AIやChatGPT Plusのほうが上手な印象です。
Geminiになって出典を表示してくれるようにはなったのですが、肝心の出典が「<無効な URL を削除しました>」と表示されてしまい、確認不可能な状態です。
上記は不具合の可能性もあり、早急な改善を望みたいところ。また、ChatGPTやBing AIに比べて、何も指示をしないと出典を明記してくれないケースが多いのも気になります。
Geminiは、ChatGPTやBing AI以上に個人情報や機密情報の漏洩リスクを意識する必要があります。精度向上のためにAIがデータを処理するほか「場合によっては人間のレビュアーが情報をチェックすることもある」と規約には記されており、情報の取り扱いには注意しましょう。
現在は解消されていますが、過去にはBardに入力した情報がインデックスされ、Google検索に表示されてしまったケースもあるようです。
これはChatGPT Plusの特徴ですが、プラグインが豊富にあったり、自分や他人のつくったGPTを自由に使えたりと、カスタマイズ性の高さが魅力です。一方、Geminiには現状だとカスタマイズの余地がほぼありません。
Bing AIもカスタマイズ性は低く、この点はChatGPT一強という印象があります。
ただし、ChatGPTもPlus以外ではカスタマイズ性は低く、GeminiもGemini Advancedではカスタマイズ機能がリリースされてくる可能性は十分考えられます。
これはGeminiを触るうちに発見したのですが、人物に関する画像を読み込ませても「人物の画像についてはまだ対応していません。ご理解いただけますようお願いいたします」と表示され、受け付けてくれません。
ChatGPTやBing AIでこういった現象に遭遇したことはなく、なぜ非対応なのかは不明ですが、短所であることは間違いないでしょう。
ここまで、Geminiというツールの詳細を見てきました。最後に、本ツールの性質を活かした具体的な活用例をご紹介します。
ビジネスにおいて、Geminiはメール文面の考案に活用できます。試しに、「明日、クライアントと対面で打ち合わせがあります。日時と場所に変更がないかリマインドをかねたメールを作成してください」と聞いてみましょう。
BardだとややAI間の強い文面になってしまったのですが、Geminiはかなり自然な印象があります。これならすぐにでもテンプレートとして活用できそうです。
AIの得意分野として知られるアイデア出しも、Geminiにお願いすることができます。
箇条書きとシンプルですが、参考になるアイデアが多かったです。実際、当メディアでも挙げてもらったネタは数多く取り組んでいます。
Geminiは最新情報にも対応できるので、Geminiに情報を調べてもらいつつ、表作成までやってもらいましょう。
データソースに加えて注釈までついており、ほぼ100点の表といえます。数値や順位も正確で、実用性は極めて高そうです。
しかし表自体はきれいで、スプレッドシートへの出力もできるのは嬉しいですね。
自分が過去に執筆した文章はもちろん、画像アップロードに対応しているためデザインなどの各種クリエイティブを添削してもらうこともできるはずです。実際にやってみましょう。
しかし、なんと「人物の画像は非対応」として、クリエイティブを添削してもらえませんでした。掲載したのは以下のアイキャッチ画像なので、人物といっても小さなイラストなのですが……。
ちなみに、Bardでは同じ画像を添削してくれました。なおさら謎です。
ちなみに、人物が写っていない画像を添削させると、普通にこなしてくれました。当面は人物の無い画像に限定して使うのがよさそうです。
テレワークなどをしていると、つい孤独を感じがちなもの。そんなときは、Geminiを話し相手にストレスや不安を解消してみるのもいいかもしれません。
今回は「難易度の高い案件を任され、成功させられるか不安です。自信を持って働けるよう、私を励ましてください」と聞いてみました。
もちろん「心に刺さる言葉」を期待してはいけませんが、励まし方がかなり自然になったような気がします。
ここまで、Geminiの特徴を解説してきました。
生成AIをめぐる状況は変化が激しく、非常に高頻度な情報のアップデートが求められます。Geminiに関する情報も、場合によっては1週間後に大きく変化しているかもしれません。
生成AIのアップデートにキャッチアップしつつ、自分なりの「AIとの向き合い方」を見つけていくのがいいのかもしれません。
(執筆:AI原記子 with 編集部 編集:齊藤颯人)
【初心者向け】Bing AIの使い方と活用法を徹底解説
Workship MAGAZINE
音声入力ツール「Voice In」と「ChatGPT」の組み合わせは最強! 使い方を愛用者が解説
Workship MAGAZINE