お役立ち(情報)

ヤンデックスの流出によって推測できるGoogleのアルゴリズム

ヤンデックス(Yandex)はあまり耳馴染みのない言葉ではないでしょうか。ヤンデックス(Yandex)というのは日本のGoogleのようにロシアでは日常的に使用されている検索エンジンです。本記事ではヤンデックス(Yandex)の流出について解説していきます。

ヤンデックス(Yandex)とは

2023年の1月にロシアで最大の検索エンジンのヤンデックス(Yandex)のソースコードが流出してしまいました。
しかし、ハッキングによってではなく、ヤンデックス(Yandex)の元従業員が盗み出したものが流出したということです。
盗み出したものの中に個人情報などはないのですが、検索ランキングの要因が含まれているということが問題になっています。
ヤンデックス(Yandex)にはGoogleの元従業員もいるということなので、Googleの検索ランキングの要因も含まれていると思われているのです。

ロシア最大で世界上位の検索エンジン

ヤンデックス(Yandex)はロシアで最大の検索エンジンであり、世界でも4、5位に入るほどなので、流出したという話は衝撃的でした。
ロシアのGoogleとも言われており、インターネット企業としても最大手です。
検索エンジンのほか、フリーメールや地図検索、オンラインストレージなども担っているため、流出したという話はショックだったのではないでしょうか。
ヤンデックス(Yandex)の意味はYet another indexerであり、「もうひとつの索引作成者」から来ています。

ヤンデックス(Yandex)の流出について

ヤンデックス(Yandex)の概要は分かりましたが、ソースコードが流出したことで、どのようなことが起きたのでしょうか。
ハッキングではなく、元従業員が流出させたということなので、政治的なものも疑われているようですが、詳細は不明のままです。

ソースコードが流出したことでランキングの要因を見ることができる

ヤンデックス(Yandex)のソースコードが流出したことで、ランキングの要因を知ることができます。
具体的に説明すると、Googleでもそうですが、SEOキーワードなどの要因によって、サイトが1番最初に表示されるかが決定されるので重要なのです。
流出によって、サイトを作成する際どのような工夫をすれば、検索結果が上位になるのかを知ることができるかもしれないということです。
実際はそんなに単純、かつ簡単なことではありませんが、参考程度にはなるかもしれません。

流出したソースコードは最新ではない

しかしながら流出したヤンデックス(Yandex)のソースコードは最新ではないという意見もあります。
実際ヤンデックス(Yandex)側が流出したコードについて、最新のものではないとコメントを出しているのです。
ですから、現在は使用されていないソースコードが流出したのかもしれないと考えたほうがいいようです。

具体的にどのようなものが流出したのか

ヤンデックス(Yandex)とGoogleは同じではありませんが、流出によって役立てるものも含まれています。
後述しますが、具体的にどんなものが流出したのかを一部ですが紹介しましょう。以下に紹介するものは検索結果のランキングに関連するものです。

  • URLに数字が入っている場合はマイナスになる
  • スラッシュ(/)が多いのはランキングのマイナスになってしまう
  • タイトルに文字(キーワード)が入っている場合はランキングのプラスになる
  • Wikipediaから直接のトラフィックはプラスになる

具体的にはこのようなことが流出しましたが、SEOを学ぶ人から見ると当たり前のことかもしれません。

ヤンデックス(Yandex)の流出によって何が起きるのか

では、ヤンデックス(Yandex)のソースコードの流出は何が問題なのでしょうか。
はじめはヤンデックス(Yandex)の流出に関して、ソースコードをチェックするところが多かったようです。
なぜならGoogleのような検索エンジンと同じなのでは、と考える人もいるからです。

日本国内ではほかの検索エンジンが強いので影響はない

しかし、流出によってあまり慌てる必要がないというのが多くの人の意見のようです。
なぜなら、国内でよく使用される検索エンジンはGoogleやYahoo!であり、ヤンデックス(Yandex)とは違うと考えられているからです。
参考程度にはなるかもしれませんが、流出したからといって、Googleのアルゴリズムとは違っているので、ヤンデックス(Yandex)の流出したソースコードに則ってサイトを作成したりすると、それまでの順位が下がる可能性があります。

ヤンデックス(Yandex)のソースコードで考えるアルゴリズム

ヤンデックス(Yandex)のソースコード流出によって、Googleにも似たようなアルゴリズムがあると考えている人もいます。
そこで、何がどのように参考になるかを考えていきましょう。
ヤンデックス(Yandex)に見る検索結果のポイント①流入数
ヤンデックス(Yandex)に見る検索結果のポイント②リンケージ
ヤンデックス(Yandex)に見る検索結果のポイント③ホストの安定性
ヤンデックス(Yandex)に見る検索結果のポイント④URLの数字とスラッシュの数
ヤンデックス(Yandex)に見る検索結果のポイント⑤記事の公開・更新日
ヤンデックス(Yandex)に見る検索結果のポイント⑥ユーザー行動
ヤンデックス(Yandex)に見る検索結果のポイント⑦どのくらいブックマークされているか
ヤンデックス(Yandex)に見る検索結果のポイント⑧URLの中のキーワード
ヤンデックス(Yandex)に見る検索結果のポイント⑨コンテンツの質
ヤンデックス(Yandex)に見る検索結果のポイント⑩アルゴリズムは日々変化している

アルゴリズムとは

アルゴリズムとはとても簡単に説明すると「そこにたどり着くまでの方法、やり方」ということになります。
難しい言葉のように感じますが、手順ややり方と覚えておいてもいいでしょう。
ヤンデックス(Yandex)のソースコード流出によって、Googleのアルゴリズムのポイントを考えていきましょう。

ポイント①流入数

流入数というのは検索結果や広告によって、そのページを見る閲覧数のようなものです。
しかし、検索結果が効果を出すのは「すぐ」ではありません。ですから、公開直後の流入数はあまり当てにできない情報なのです。

ポイント②リンケージ

リンケージ(Linkage)とは一般的には繋がり、連携を意味するものです。
被リンクとも言いますが、これが増えればアクセス数が増加すると一般的には考えられています。
しかし、被リンクが多ければいいというものではなく、質が伴っていなければなりません。ということで、リンケージはそこまで重要ではないということでしょう。

ポイント③ホストの安定性

ホストの信頼性もしくは安定性というのもポイントのひとつと考えられています。
例えば検索結果で上位に表示されているものがあっても、そのページがエラーで表示できないということがあると、ヤンデックス(Yandex)では評価が下がってしまうと考えられているのです。
それはGoogleであっても同様でホストが安定していないと評価が下がると言われています。

ポイント④URLの数字やスラッシュの数

ヤンデックス(Yandex)のソースコードではURLに数字やスラッシュが多く入っていると検索結果があまりよくないという情報がありましたが、これはあまり関係ないと考えていいでしょう。
数字がURL入っていることに関しては問題ありませんが、スラッシュが多いのはあまり歓迎されていないようです。

ポイント⑤記事の公開日

ヤンデックス(Yandex)、Googleにおいても記事の公開日というのは重要で、記事は新しいほどランクが上がる可能性があります。
なぜなら記事の公開日が古いと情報も古いと考えられるからです。
記事の公開日、もしくは更新日は新しいほうがいいのですが、過剰に公開日を更新すればいいわけではありません。
そうすることによってGoogleは更新日を無視することになるからです。
適切に記事を更新していかなくてはいけません。

ポイント⑥ユーザー行動

ヤンデックス(Yandex)ではユーザーがアクセスした後、どのような行動を取るかが重要視されているようです。
しかし、それはGoogleにおいても重要だと考えられています。
ユーザー行動とはクリックする頻度、ページの滞在時間のことなどです。

ポイント⑦ブックマークの数

ヤンデックス(Yandex)ではページがブックマークされることを重要視しています。
ブックマークの数が多ければそれだけページに対し評価されていると考えられているからです。Googleでもそのようなポイントはあり、ブックマークの数が検索結果に反映していると考えられています。

ポイント⑧URLのキーワード

URLにページのタイトル、検索のキーワードが含まれているということはヤンデックス(Yandex)でもGoogleでも意味があると考えられています。
そのほうが内容を理解しやすいからという理由、キーワードなどが含まれているほうが検索結果の上位に表示される可能性があるのです。

ポイント⑨コンテンツの内容

ヤンデックス(Yandex)でもGoogleでもコンテンツ、内容が充実している、質のいいもののほうがいいとされています。
例えば検索結果の上位に表示されていても、肝心のことが書かれていなければ順位は下がっていってしまいます。ですから内容を重視すべきだと考えるべきでしょう。

ポイント⑩アルゴリズムは変化していることに注意

ヤンデックス(Yandex)のソースコードが流出したことによって、Googleのアルゴリズムを推測した人は多いかもしれません。
しかし、多くの人はあまり重要視していません。なぜならアルゴリズムは日々進化していくからで、Googleでも突然検索結果が変わったりします。
ですから、やはりページを作る際はコンテンツの質を重視しなくてはいけないのです。

国内の検索エンジンランキングは

ヤンデックス(Yandex)はロシアで1位のそして世界でも上位の検索エンジンです。
では国内ではどうでしょうか。ランキングトップから紹介していきましょう。

ランキングトップはGoogle

国内で1番使用されている検索エンジンはGoogleです。
PCでもスマホでもGoogleを利用している人は多いのでは。Googleはアメリカの主要IT企業で、世界で見ても検索エンジンとしてトップです。
Googleのモットーは「世界中の情報を整理し、人々に使いやすく」で、日々改善を図っています。
そのような企業としての努力もあり、人々が信頼し使いやすい検索エンジンなのかもしれません。

ランキング2位はYahoo!

国内で2番目の検索エンジンはYahoo!です。
2009年時点では国内で1日平均19億のアクセスがあり、検索エンジンとして過半数を誇っていましたが、徐々にGoogleに移行していきました。
他国のYahoo!とは相違点があり、2009年に紫色になったロゴは日本では未だ赤のままです。
検索エンジンとしてのYahoo!は今現在(2023年4月調査)Google社のものを使用しています。

ランキング3位はBing

国内でランキング3位の検索エンジンはMicrosoft Bingです。
コンセプトとして「意思決定を応援する検索エンジン」を掲げており、他社の検索エンジンとは差別化を図っています。
Bingの検索技術はGoogleなどとは違っているため、同じ言葉を検索しても違う結果を表示します。
しかし、その検索結果は信頼がおけるという意味ではイマイチという結果が出ており、内容的に質を問われているようです。

3位以下も紹介

GoogleやYahoo!が上位結果であるという結果を踏まえて、3位以下にはどのような検索エンジンが入っているかを見ていきましょう。
4位はDuckDuckGoです。こちらは利用者のプライバシーを重んじる方針を打ち出しており、IPアドレスの保存などをしないことによって、他の検索エンジンとは差別化を図っています。
5位に入っているのはBaidu(百度)で、こちらは中国最大の検索エンジンです。中国ではGoogleが使用できないため、世界的に見ても上位の検索エンジンとなっています。
日本でも6位にヤンデックス(Yandex)が入っています。
検索エンジンといえばGoogleを思い浮かべてしまいますが、国内でも海外の検索エンジンが入っているのが面白いですね。

まとめ

ヤンデックス(Yandex)のソースコードが流出したことについて解説してきました。しかし、ソースコードは最新ではないため、あまり重要視する必要性はありません。