メインコンテンツへスキップ

クローラーとは何ですか?

クローラー(英語:crawler)は、ウェブクローラーとも呼ばれ、検索エンジンがワールドワイドウェブを自動的に検索し、インデックスを構築するために多用するソフトウェアプログラムです。

ウェブサイトを閲覧する際、クローラーはそのコンテンツを分析・インデックス化し、後で検索エンジンがより迅速に読み込めるようにします。いわば、検索エンジンの作業の基礎を築く役割を担っているのです。

ウェブクローラーはどのように機能するのでしょうか?

クローラーは、繰り返しのアクションのためにプログラムされており、自動化されて動作します。

「クロール」(英語:crawling)によって見つかった情報は、特定のカテゴリーに分類され、その後インデックス化されるため、その情報を呼び出して評価することが可能になります。テキスト、画像、動画、リンクも分析の対象となります。

さまざまな種類のクローラー

さまざまなクローラーが存在しますが、その例としては、Googlebot や Bingbot が挙げられます。Alexa も、ia_archiever という独自のボットを持っています。

クローラーは、データマイニングなど、さまざまなタスクを実行することもできます。これは、特定の情報をウェブ上で検索するものです。たとえば、メールアドレスを検索することができます。これは、ブラックハット SEOによって、収集したメールアドレスにスパムメールを送信するために使用されることもあります。

もう一つのタスクは、盗作の検索だよ。この機能は、著作権で保護された素材に関する法律違反の場合に特に重要になるね。

クローラーの操作

Mit Hilfe von Meta-Tags können dem Crawler im <head> Bereich Anweisungen gegeben werden, so kann man unter anderem steuern, ob der Crawler eine Seite indiziert oder einem Link folgt.

アドレスをインデックスに登録せず、リンクも追跡しないという指示の例:

<meta name=“robots“ content=“noindex,nofollow“>

 robots.txt ファイルでも、クローラーに指示を送信することができます。

クローラーとSEO

検索エンジン最適化の一部は、クローラーが最適に読み取れるようにウェブサイトを設計し、すべてのコンテンツが検索エンジンのインデックスに登録されるようにすることです。そのためには、できるだけ論理的なURL 構造が役立ちます。さらに、バックリンクや明確な内部リンクにより、クローラーがあなたのウェブサイトをより頻繁に、より長く訪問するようになります。