エンジニアの副業は週1からでも可能?副業の例や探し方も解説
- ITエンジニア
- 副業
ユーザーが入力する言葉をより正確に理解し、最適な検索結果を提供するため、検索エンジンは日々進化しています。こうした進化のベースにあるのが、人間の複雑な「言葉」をシステムに理解させる、という不可能にも思える課題への挑戦です。
今回はこうした進化に対応するにあたって役立つ知識を、言語学を学んでいた筆者がご紹介します。言語学的観点からGoogleの進化を捉え直し、SEOに役立てましょう。
SEOの話題に入る前に、まず言語学の基礎知識を固めておきましょう。
言語にはさまざまな側面があります。私たちはおもに文字を書くことと、会話をすることでコミュニケーションをとります。その際に使う言葉はいわば音や文字の羅列で、日々のコミュニケーションを支えているのは、音や文字を特定の順番に並べて作った単語や文章です。
ときには、言葉以上の内容を汲み取ってもらうことを期待して発言することもあります。たとえば「ここは寒いですね」という言葉には、「窓を閉めてほしい」という意図が隠されているかもしれません。
このような言語の多様な側面について研究するために、言語学は言語をレベルごとに分類しています。
もっとも基本的なレベルは、音と文字です。
言語学において、音声は「音韻論(phonology)」、文字は「書記素論(graphology)」に分類されています。
つぎのレベルは、音や文字がどのようにして単語を形成するのかという「形態論(morphology)」です。
たとえば「ツリー」と「ハウス」を組み合わせて「ツリーハウス」という単語を作ることはできますが、「バナナ」と「ハウス」を組み合わせても、「バナナハウス」という単語はできません。
そのつぎが「統語論(syntax)」です。
統語論は文章を作るためのルールを指します。世の中には多くの単語がありますが、それらを無作為に繋いでも文章が作れるわけではありません。
さらにそのつぎが「意味論(semantics)」です。
私たちが言葉をとおしてコミュニケーションするとき、どのような意図によって言葉を選び、どのように相手の言葉を理解すべきか、ということを考えています。
最後のレベルに分類されているのが「語用論(pragmatics)」です。
たとえば「ぶぶ漬け(お茶漬け)でもどうです?」言われたとき、「早く帰りなさい」という意味になるのは有名な話ですよね。このように、文脈によって変化する言葉の意味を扱うのが語用論です。
言語のレベル | 言語学の分類 |
音と文字 | 音韻論(音声)/書記素論(文字) |
単語と語形 | 形態論 |
文章とルール | 統語論 |
意味 | 意味論 |
文脈と言葉の使い方 | 語用論 |
(参考:Crystal (1987)、Hickey (2005))
検索エンジンは、人間が使う言葉を理解するために日々進化しています。
数年前まではごく基本的な要素しか理解できなかったため、最適化の対象もキーワードだけでした。しかし時代は変わり、検索エンジンはいまや形態論、意味論、さらには語用論のレベルで言語を理解できるまでに成長しています。
つまり単語(キーワード)だけではなく、単語をつなげた文章、さらにはその文章が持つ意味までも理解できるレベルまで進化してきているのです。
ここからはGoogleアップデートの歴史とともに、Google検索エンジンの言語レベルの進化をみていきましょう。
Googleアルゴリズムアップデートの歴史。SEOに与えた影響を振り返る
Workship MAGAZINE
Googleは2011年のパンダアップデートで、下記のようなコンテンツがランキング上位に入らないように対処しました。
以降、Googleは意味論的/言語論的レベルで言葉を理解しようと努めています。ユーザーが入れたキーワードに対応する 、個々のユーザーにとってのハイクオリティなコンテンツを追求してきたのです。
パンダアップデートの数年後にあたる2013年、Googleはハミングバードアップデートで検索クエリ間の関係性を特定することに焦点をあて、意味論レベルでの理解を強化。このアップデートによって、単語だけでなく検索フレーズ全体が考慮されるようになりました。
さらに2015年のランクブレインアップデートでは、新語や口語の解釈、対話の処理を可能にしています。
単語やフレーズの多様な形式にも対応しています。
たとえば「本を読む」ことについて記事を書いている場合、「本」「読む」以外にも、「読書」「書籍」などの同義語や、「小説」「自伝」などの類語も認識して、ランキングに反映しています。
文章は同じフレーズをただ繰り返すだけではなく、言葉遣いに多様性をもたせることで、より豊かで読みやすいものになります。Googleが多様な語形に対応したことにより、豊かで読みやすいコンテンツがランキング上位に入りやすくなってきていると推測されます。
文章を分析してコンテンツを把握しようとしているだけではありません。個々のユーザーにとってどのような検索結果がもっとも有益なのかを見極めるために、バウンス率やクイックスルー率、Webサイトの閲覧時間などのデータもGoogleは活用しています。
検索クエリの言葉の選びかたなどによってユーザーの感情をも研究し、検索結果に反映しているのです。
2019年のBERTアップデートでは、人間の脳へさらに近づくことに成功。自然言語処理(NLP)を活用して、文中のすべての単語の関係性を踏まえ、文脈を理解するに至りました。
個々のユーザーのニーズにより近い検索結果を提供するための、大きな進歩です。
Googleは私たち人間と同じレベルで言葉を理解しようとしており、アップデートのたびにその精度は上がっています。
Googleの検索エンジンは、高品質なコンテンツを上位にランクインさせるものです。「検索エンジン対策がうまいコンテンツ」を上位にランクインさせるものではありません。
ユーザーを調査し、Googleではなくユーザーのためのコンテンツを制作すれば、自然とランキングも上がるはずです。少なくとも、未来のGoogle検索エンジンはそうなっていくでしょう。
Googleは、読みやすく高品質なコンテンツを多くの人に届けられるよう工夫しています。同じ言葉をただ大量に詰め込む、といった対策はかえって逆効果です。
ユーザーにとって価値があり、ユーザーにとって読みやすいコンテンツを制作すれば、Googleもそれを正しく評価してくれるでしょう。
(執筆:Fleur Heesen 翻訳:Nakajima Asuka 編集:Sato Mizuki)