Googleが検索の仕組みを紹介するインフォグラフィック『How Search Works』を公開しました。ただしこちらは英語のみで、日本語では検索の仕組みを解説するページが公開されています。
とはいえ、このインフォグラフィックはインタラクティブなため面白いですし、英語も非常に分かりやすいので見てみることをオススメします。
「さすがGoogle」と言えるデータも数多くありますので、そこを抜粋していきます。
How Search Works
インターネット上には30兆を超えるページがある
その30兆以上を、まずクロールし、情報を取得します。そして、ページからページへとリンクを辿っていきます(インデックス化)。
インデックス化されたものを、Google独自の基準で検索結果に並べていきます。
現在Googleがインデックス化したものは、1億ギガバイト(≒100ペタバイト)に達します。
アルゴリズム
オートコンプリート、Google Instantなどの機能を使い、検索するものを先読みします。
そしてインデックス化されたものの中から、Googleの定めた基準に従って(ページランク・セーフサーチ・言語等々…200以上)結果を表示します。しかも、それは1/8秒で行われます。
スパム戦争
Googleはいつもスパムと戦っています。
ウィルス配布サイト、不適切なサイト等々、いくつも種類はありますが、それらを自動的にインデックスから排除します。
まとめ
SEOに関する情報を頻繁にチェックしている方なら知っている事ばかりかもしれませんが、豆知識的なものも多く面白かったです。
また、このインフォグラフィック自体は検索の仕組みを知らない人に向けられているものなので、非常に分かりやすいですね。
Googleは他にも「安全にインターネットを使うには」や「Gmailの仕組み」などの分かりやすい解説を公表しており、非常に好感がもてます。
世界中の情報を整理する、という目標を果たせますように!
検索の仕組み