BERTの1000倍強力。Googleの新検索アルゴリズム『MUM』で検索体験はどう変わる?

Google MUM

2021年にGoogleは、自然言語処理のレベルをさらに押し上げる新たなアルゴリズムを発表しました。それが『MUM(Multitask United Model)』です。

Googleによると、2019年に発表されたアルゴリズム『BERT』と比べて、MUMはなんと1000倍以上の性能を備えているとのこと。将来的にはGoogle検索エンジンをはじめとした各製品に搭載されるようです。

今回はこのMUM、そして新たに発表された言語モデル『LaMDA』ついて解説します。

MUM(Multitask United Model)とは

MUMは、2019年に発表されたBERTと同様の、自然言語処理モデルです。MUMの前身であるBERTは2019年当時、画期的でパワフルな自然言語処理モデルとして高く評価されました。

しかし、MUMはそのBERTからさらにパワーアップ。先述のとおり、1000倍以上の性能があるとされています。

BERTとMUMの大きな違いは、マルチタスクです。MUMは、順番にタスクをこなすのではなく、複数のタスクを同時に処理できます。

つまり、超高速で文章を読み、意味を理解し、トピックに関する知識を形成。さらに、動画や音声情報で知識を補強し、充実させ、75以上の言語から見識を得て導き出した、多層的なコンテンツによって複雑な質問に答えられるのです。

MUMの実力がわかる具体例

2021年のGoogle I/Oでは、プラバカール・ラガヴァン氏がMUMの仕組みを解説しました。その際に用いられたのが、私たち日本人にも親しみがある、富士山の例です。

「今年私はアダムス山を登った。来秋は富士山に登ろうと思っている。富士登山に向けて、どのような準備が必要か」

こうした複雑な内容を調べる場合、通常は自分で個々の内容について検索し、情報をまとめる必要がありますよね。

しかし、MUMはこうした調査をまとめて引き受けてくれます。

MUMは、富士山の大きさから日本自体の情報まで抽出し、日本が秋雨の時期であることを察知してレインコートを提案するなど、さまざまな角度からの情報を組み合わせて検索をおこないます。

こうした複雑なクエリに対応するためには、検索意図やユーザーの感情などを読み解き、求められているものを理解しなければいけません。

機械が人間の言語を完全に理解するのは容易ではありませんが、BERTやMUMのような自然言語処理モデルは、非常に高いレベルで人間の言語を理解しています。

さらに、MUMは出力形式が多様なマルチモーダルのため、動画や画像などの情報も提供します。情報が多様なリッチリザルトを提供できる仕組みになっているのです。

MUMは今後、Googleレンズにも搭載予定。カメラを登山靴に向けるだけで、富士登山に適しているかどうかを調べることも可能になります。

Google MUM Mt. Fuji Example

▲出典:yoast

こうした取り組みは、少ないクエリで多くの情報を得ることを可能にしてくれます。

しかし、Googleの目標はそれだけではありません。Googleは、自社サービス内で回答を完結させることを目指しているようです。

クイックアンサー・リッチリザルトの増加や、検索内外での活発な開発からも、Google完結型への動きがうかがえます。

人のような会話を可能にする『LaMDA』

Googleは、マイク、カメラ、テレビ、ウェアラブル端末、スマートスピーカーなど、さまざまなソースからの入力を可能にするなど、検索の概念をどんどん拡大しています。

スマホやスマートスピーカーなどのデバイスに搭載されているアシスタントは、持ち主の質問を理解して、役立つ情報を提供することが求められます。

そのために必要なのが、超強力で効率的、かつ柔軟な言語モデルです。2021年のGoogle I/Oで発表された『LaMDA(Language Model for Dialogue Applications)』が、これにあたります。

LaMDAは、チャットボットのようなAIと人間がより自然にコミュニケーションをとるための、革新的な言語モデルです。

従来のAIよりも自由な会話を実現するために、それぞれのトピックについて膨大な知識を獲得。会話が元のトピックからはずれてしまっても、インタラクティブな会話をつづけることを可能にしています。

Googleは、冥王星の知識を学習させたLaMDAと研究者を議論をさせるというユニークなデモを公開し、LaMDAの機能をアピールしました。

新たな技術がうむ課題

新しい技術には、課題や疑問がつきものです。

Googleがもし本当にあらゆる言語のコンテンツを読み、聞き、見ることができて、AIが生成したコンテンツを含んだ新しいフォーマットに再パッケージできる……その所有者は誰になるのでしょうか? また、自動化された検索結果の内容に責任をもつのは誰なのでしょうか?

AIの中立性や信頼性も課題のひとつです。GoogleはAIにかかるバイアスについて具体的に言及しており、現在もトレーニングを重ねています。AIにバイアスをかける可能性がある偽情報や有害なコンテンツを判断する『KELM』も発表されました。

MUMの実用化にそなえて私たちができること

MUMは現在テスト段階で、いつ実用化されるかはまだわかりません。しかし、準備をしておくことは大切です。

MUMの導入は、単なる検索結果の改善以上の変化をもたらすはずです。さまざまなソースから情報が集められることを考えると、単に質問に答えることや、問題を解決することの重要度は下がるでしょう。

構造化データの活用

MUMに対応するためにまず必要なのは、構造化データをWebページに追加し、コンテンツへの理解を深めてもらうことです。構造化データはGoogleがWebページを理解する手助けになるだけでなく、リッチリザルトの対象にもなります。

読みやすい文章

読みやすく、自然な文章も欠かせません。ランキング向上のために特定のキーワードを詰め込むのではなく、読者が読みたいと思うような文章を心がけましょう。最新情報の提供や、オリジナリティも大切です。

おわりに

今回のMUMとLaMDAの例からもわかるように、Googleはすさまじいスピードで技術開発をおこなっています。SF映画に登場する、非現実的にも思えるような技術のうちいくつかは、じつはすぐそこまで迫っているようです。

しかし、こうしためまぐるしい変化のなかでも、コンテンツの質が重要であることは変わりません。変化に振りまわされないためにも、誠実なコンテンツ制作を心がけましょう。

(執筆:Edwin Toonen 翻訳:中島あすか 編集:泉 提供元:yoast

SHARE

  • 広告主募集
  • ライター・編集者募集
  • WorkshipSPACE
マーケター副業案件
Workship