機械学習とは、人間や動物が自然に行っている動作を、(開発者がコンピュータにプログラムするのではなく)コンピュータが自らデータから解析し、法則やルールを導き出すことを意味します。

AI(人工知能)の開発がすすみ、さまざまなデバイスやアプリケーションが「スマート化」されている現在、最も急速に成長している分野のひとつといえるでしょう。

ここで気になるのが、その機械学習は私たちの生活にどう役立つかということ。そのもっとも分かりやすい例が、Google/Yahoo!/Bingなどの検索エンジン(サーチエンジン)です。検索エンジンは、ユーザーが知りたい情報の「最適解」を膨大なデータから選別し提示してくれます。

本記事では、私たちが何気なく使っている検索エンジンが、どのように機械学習を活用しているのかご紹介します。

検索エンジンによる6つの機械学習活用

1. ユーザーの「求めるもの」を的確に理解する

検索エンジンにとって最も重要なのは、ユーザーが何を知りたいのかを理解すること。それがわからなければ、最適解を見つけられません。

そこで機械学習の出番です。

例えば、ユーザーが検索したい語句の漢字や英単語のスペルを間違えて入力したとしましょう。検索結果には「正しいスペル」と共に、「正しいスペルで書いた場合に出てくるであろうサイト」が表示されます。実際、多くのユーザーは検索窓に打ち込むことでスペルを確認しているとのこと。機械学習は多くの人の「これまで間違って入力してきたデータ」から正しいキーワードを予測をしてスペル修正を行い、ユーザーが欲しい情報を的確に提示します。

また、機械学習はユーザーの曖昧な質問に対しても有効です。例えばユーザーが「Indian Ocean」と検索したとき。インド洋について知りたいのか、インド出身のバンド『Indian Ocean』のことについて知りたいのかわかりません。そこで検索エンジンは、検索の際にサジェスト(入力したキーワードと併記されることの多い語句)を提案したり、ユーザーの検索履歴からオートコンプリートを提示したりすることで、どちらの事柄について知りたいのかを予測してくれます。

さらに、機械学習はユーザーが検索した語句(クエリ)のカテゴリ分けも可能。カテゴリに応じてさまざまな追加情報を提供してくれることもあります。たとえばイギリスにある「ウェストミンスター寺院」を検索した場合、検索結果にはウェストミンスター寺院の公式サイトと共にGoogleマップの位置情報も表示されます。

Image search

2. 画像のソースを検索する

Googleには、ユーザーが画像をアップロードしてそのソースを探せる機能があります。写真素材など、どこで保存した画像なのかがわからなくなった場合に便利です。

機械学習を使った検索エンジンは膨大な画像データを処理し、その特徴をインプットしているため、一瞬で結果を表示できるのです。

3. ユーザーの興味関心を見極め、適切な広告を表示する

検索エンジンの多くは、検索結果やサイト内に表示される広告から収入を得ています。ユーザーの興味のあること、知りたいことに関連した広告を提案し、製品やサービスの購入率(コンバージョン率)を上げることから、ユーザー、広告主、そして検索エンジンにとって「三方よし」なシステムであるといえます。

そして機械学習を活用することで、ユーザーの検索結果や閲覧サイトのデータからさまざまな広告のターゲットを特定し、より最適な広告を表示できるのです。

4. ユーザーが使う語句の意味を推測する

流行り言葉というものは、日々新たに生まれ続けています。

新しい言葉が登場し、まだ一部の人のあいだでしか使われていないときは、検索エンジンに打ち込んでも正確な意味を把握することは難しいかもしれません。しかしその言葉がある程度広がり、インターネット上でさまざまな文脈で使われるようになってくると、検索エンジンは機械学習により単語やフレーズの意味の推測し始めます。

時間が経つにつれてコンテンツの精査が行われ、言葉の意味を一番よく説明しているサイトを表示してくれるようになるでしょう。

5. 最も質の良いサイトを検索上位へ

検索エンジンのもっとも重要な役割は、ユーザーの求める答えが得られる良質なサイトを上位表示することです。これができるかにどうかによって、検索エンジンそのものの質も決まるでしょう。

検索結果の順位は、ユーザーが検索した語句(クエリ)との関連性、コンテクスト、ユーザーへのパーソナライズなどを加味し、複数のフェーズを通して決まります。これらの選定を行っているのも、機械学習です。

6. スパムや質の低いサイトを検索から除外する

質の高いサイトを上位表示するとともに、もう一つ重要なことがあります。それは、スパムやコピーコンテンツなどの質の低いサイトを検索結果がら除外することです。

これらの”除外すべきコンテンツ”には、無関係なページにつながるリンクや、ストップワードの多用、同義語の不必要なまでの多用など、いくつか共通点があります。機械学習がこれらのサイトを除外することでUXを向上させ、より多くのユーザーが検索エンジンを使うようになるのです。

まとめ

現在、ハイスピードで成長を続ける機械学習の技術。これにより、これまで人々が手作業で行っていた作業は格段に減りました。

インターネット上に浮かぶ数えきれないほどのコンテンツを精査し、ユーザーにぴったりな情報を探し出してくれる検索エンジンにおける機械学習の活用は、今後ますます増えていくでしょう。これからのアップデートも引き続き追っていきたいです。

(原文:Rashmi Inglekh 翻訳:Klara)

SHARE

RELATED

  • お問い合わせ
  • お問い合わせ
  • お問い合わせ