SYSTEM DEVELOPMENT

STUDY GROUP

インターネット上の検索エンジンとは

普段GoogleやYahooやBingなどの検索窓に何か文字を入力して調べたり、目的の情報を探したりしていると思います。検索結果の何件中の1件目から順に表示されるわけですが、この検索順位を決めているのが検索エンジンです。サーチエンジンともいいます。(ちなみにコンピューターにおける「エンジン」とはコンピューターで実質的にデータ処理を実行する機構。ということのようです)
検索エンジンといえばロボット型検索エンジン、ディレクトリ型検索エンジンがあります。前者はクローラーやロボットといわれるプログラムがホームページのリンクを辿り巡回しデータを集めています。そしてデータを解析し検索結果に反映させます。後者のディレクトリ型検索エンジンとは、フォルダのことです。つまりロボットではなく人の手によってデータをフォルダで管理・分類している検索エンジンとなります。
ロボット型検索エンジンの仕組みをひとことでいうと データベースです。データが検索エンジンのデータベースに登録されており、サイトの検索窓にキーワードを入力し検索すると、それに合致したデータが選択、抽出されて返って来るようになっています。クローラーやロボットが巡回して取得したデータはデータベースに格納され、インデックスと呼ばれる索引情報を作成しデータベース内のデータをすぐに検索して選択、抽出できるようにしています。本でいう目次のようなものです。そしてデータが データベースやインデックスに登録されることをインデックスされるといいます。ユーザーが入力するキーワードが単一ではなく複合キーワードの場合、例えば「◯◯ ××」とスペースが文字の間に入れば、「◯◯であり、かつ××であるもの」が返ってきます。これはAND演算、AND検索といわれるものです。またデータベースに対して命令・要求を出すのでクエリと言ったりします。データベース内はキーワードごとにランキング形式になっており、検索サイトごとに様々な要因で順位が決まっています。そしてその中から順位付けが高いものからブラウザに表示されることになります。このデータベース内で要因となっているもの、ランキングを決めているものを検索アルゴリズムと言います。
それぞれの検索サイトは、当然会社が違うわけですから検索するシステム・アルゴリズムも異なってきます。ですので同じキーワードで、それぞれの検索サイトで検索すると検索結果が違ってくるわけです。利用している検索サイトがどうも使いにくいな~とか、目的のホームページを見つけることができないな。と思ったら、検索サイトを変えてみるというのいいかもしれません。
しかしながらGoogleの検索は常に先を行き、結果として利用してしまう検索サイトとなっていますね。と敬意を表しながらなんですが、昔はもっと精度が高かったんですけどね。。とも思っています。インターネット上のデータが膨大になり、また、社会的責任、企業としての利益という大人の事情が有るのは分かりますがGoogle向けの検索サイトとそれ以外の昔のGoogle検索を分けて欲しいとも思ったりします。

menu