検索避けって何?

 2018年夏、某新聞社がネット上の記事に検索避けをしていた…
と言う話題が持ち上がりました。これを耳にし、検索避けって何?
そんなことできるの? と思われた方もいるのではないでしょうか。

 まず大前提して、ネット上に件の記事自体はちゃんと存在します。
じゃあ良いじゃん。と思うじゃん?
では、大多数の方はネット上で記事を見つける場合どういった経緯で
その記事にたどり着くでしょう?

 そのサイトのトップページから見つけるとか、他所のサイトに貼られた
リンクから訪れるとかあるでしょうが、検索サイトを用いて当該の
記事なりページを探すのは今日においてはかなり一般的な方法だと思います。
一人もいないとは言いませんが、URLを一文字ずつポチポチ打っていくって人は…
多くはないでしょう。

「ググれ」

という言葉が浸透したように、今日ではGoogleを用いて検索しお目当ての
サイトやページを見つけるのって一般的ですよね。

 が、今は昔…個人サイトが盛況だった頃はロボット式の検索サイトを避ける動きが
あったりしました。今考えると、何でそんな風潮あったんだ? と思えますが、
当時はYahoo!Japanを頂点とした登録制の検索サイトにカテゴリ登録される事は
極めて名誉でありステータスとされていました。
 反面、Googleのようなロボット式の検索エンジンに登録されるのを忌避する
動きがあったのです。

 リンクフリー、相互リンク募集、といった言葉からもわかるように、
これは当時の個人サイトが 管理人と呼ばれる持ち主個人の領域
と言う考えがとても強かった事に起因します。

リンクフリーって何だよ!? と今となっては思うでしょうが、
リンクを貼って良いのはサイトのトップページのみで、そこから記事を辿るのが
マナーであり、断り無く個別の記事やコンテンツにリンクを貼るのは、
大変失礼な行為とされていたんです。

今日では、Googleの浸透によって個別記事に検索エンジンを経由して
個別の記事単位で訪問者を獲得する事はごく一般的となり、
トップページ以外無断リンク不可! と言った強権的思想は
過去の物となりました。

ネットの変遷

 インターネットの進歩はまさに日進月歩。十年一昔どころか、十年も経てば
使っているPCから接続環境まで怒濤の進歩をするのが昨今です。

 先に書いたような、ホームページのリンク概念は完全に変貌しました。
かつては…特にオタク系のサイトは検索エンジンを用いたオールウェルカムの
体制ではなく、個人サイト同士の横のつながりを重視していました。

そのため、個人の各サイトには必ずと言っていいほどリンク集のページがあり、
そこから同好の士、同ジャンルであったり、その管理人の興味のあるサイトへ
訪問できるのが特色でした。

 それ以外ですと創作系専門に特化したサーチエンジンがかつては大小幾つも
ありましたし、Webリングと言うジャンルごとのサイトをつなぐリンク集の様な
物なども存在していました。

 特徴は、どちらも管理人が直接登録すると言う物。なので当時…例えば
FF6のサイトを探したいなら、創作系のサーチエンジンでFF6のジャンルを
覗いたり、FF6専門のリングを参照すれば簡単にサイトを見つける事が
出来たという時代背景があります。

 なにそれ、昔の方が便利じゃん? と思ったボーイズンガールズ諸君!
そうでもないですよ。

 専門のサーチエンジンやリングがあっても、そこに登録していないサイトの
情報を仕入れるのは、ロボット式の検索サイトがまだ不完全だった当時だと逆に
大変でしたし、それこそ個人サイトのリンク集からしか辿れないようなサイトさん
とかが普通にあったりしました。

 それに比べると、今はサーチエンジンが進化したため、知りたい事へパッと
アクセス出来るようになりましたし、Wiki等の発達で情報をまとめる事も容易に
なっています。当時はそう言った攻略情報や、考察等を複数のユーザー同士で
統合するシステムなど無かったため、情報が重複したり、てんでバラバラに
まとめたりされていたものです。
 まあそう言う所がむしろカオスなアングラ感を生み出して逆にネットが
面白かったと言うのも否定出来ませんがw

 今は創作関係ならCGでも小説でも、個人でサイトを作ってコツコツ
上げなくても、SNS経由でたくさんの作品に出会えます。反面、そう言った
サイトの発達によって個人サイトと言うものは往時に比べ激減しましたね。
専門のサーチエンジンも減少の一途ですし…

 またホームページの概念も変わり、個人サイトは管理人の領域!
なのでトップページにのみリンクし、トップページから各記事を見てくれ!
と言うサイト自体をひとまとめにするのではなく、検索エンジンが
各ページを辿り、各ページにそれぞれアクセスがある、コンテンツ単位で
個別に評価されるのが昨今の流れになっているようです。

 だれしもネットの海にコンテンツをアップロードした以上、それを
一人でも多くの方に見ていただきたいはず。今日の主流がそうなっているなら
検索エンジンのロボット検索を多用しない手は無いはずです。

 ただそれでもGoogle経由で不特定多数に自分のサイトを見て欲しく無い、
と言うサイトを営んでいる方もいるでしょう(インターネット上の
サイトとしてあまりふさわしい方針ではないと言えますが)。

ロボットお断り

 ようやく話が戻ってきましたが、そう言ったアングラかつ閉鎖的な
(とは限りませんね…暴言でした)サイトを運営する方などが検索避けを
使う…のでしょうか?

 どういったサイトを運営しているのかはこの際、脇に置いて
おくとして、Googleを筆頭としたロボット式の検索エンジンが
例えサイトにやって来ても、検索結果に登録させない(インデックス
させない)、登録すんな!
と設定しておく事が出来ます。これが検索避けと呼ばれる物であり、
現在の所、これに従いGoogleの検索結果に出さないようにする事が可能です。

 が、私の様な零細管理人としては、訪問者様に出来るだけ
わんさか来ていただきたいので、検索を避ける理由がわかりません。

 ちなみに、かつてのサイト運営では隠しページとしてパスワードを
かけた裏サイト、秘密のページを用意するという事もありました。
私はやった事無いですけど…

 基本的にロボット検索はパスのかかったページへは侵入できません。
なので同好の士のみの集まる秘密結社的なサイトを運営したいなら
パスやIDを発行するサイトを運営すれば良いって事でもあります。

検索避けとは具体的に何か

 さて、検索避け、検索避けと言って来ましたが具体的にそれって
なんなのでしょう? 普通にネットを見ている限り、そのサイトや
そのページが検索避けされているか判別は付きません。
検索避けはGoogleなどのロボット検索に対して行われる物なので、
普通に人が閲覧する際に目に入る事は無いのです。

 ではPCのブラウザでご説明します。
ブラウザは基本何でも良いのですが、わかりやすいのは
Firefoxあたりだと思うのでFirefoxを使って説明します。

まず、適当なサイトを開きます。

そうしたら上部のツールバーからツール>ウェブ開発>ページのソース
の順にたどります。バージョンで若干違いはありますが、近頃の
Firefoxだとだいたいこの辺りに位置しているはずです。

src src

すると…ズラズラーっと変な英語が表示されると思いますが、
これがソース…つまり今ご覧のページの設計図みたいな物になります。
Firefoxでなくとも主要なブラウザには大抵ページのソースを見る機能は
付いていると思います。スマホやタブレットは…どうなんだろう?

 ネット上で見かけるあらゆるページはこういった設計図で
出来ています。そこには、ここに画像Aを配置して、とか
ここの文字は150%拡大で色は赤にして、ここをクリックすると次の
ページへ行けるようにして、などと言った命令が書かれており
このファイルがブラウザを通して、皆さんが日頃目にしている
ネット上のページになっているわけです。

なので、例えばこのページをダウンロードしてメモ帳にぶっ込むと
設計図にあたるソースが表示され、Firefoxやインターネットエクスプローラーと
言ったネットブラウザを通すと、日頃目にしているページとして
表示されると言う寸法になります。

 んで、検索避けと言うのはどこに書いてるかというと…通常は
この設計図の上の方に<meta で始まる行があると思いますが
それが検索避け…

ってこのページにもあるじゃねーか!
検索避けしてるのか?!

あぁ、そりゃ早とちりってモンです。
<meta で始まるタグはメタタグと呼ばれる物で、htmlという
先ほどの説明で言うページの設計図に表記される、人の目につかない
メタ、の名の通り内部で扱われる命令です。

例えばこのページにある<meta charset="UTF-8">
文字コードの設定であり、ブラウザにこのページはUTF-8って
文字コードで書かれていますよ〜と説明を送っている事に
なります。なお、このコードとブラウザで指定しているコードが
違うと起きるのが、いわゆる文字化けです。

同様に
<meta name="viewport" content="width=device-width,initial-scale=1">
はスタイルシートが画面横幅に応じて変動するという説明を
送っています。
(簡単に言うとスマホで見た時に見やすくするために必要な
命令です。)

他にも検索エンジンに説明文を送るためのタグや、キーワードを
設定するためのタグも存在します。これらは検索エンジンに
こちらの情報を伝える役割を持ちます。

このように、メタタグはページを管理するために
主として使われる物…と思っていいでしょう。

で、検索避けのタグ

検索エンジンに情報を伝える、ページを管理するための物…
つまりロボット検索へのメタタグが存在します。ようやく出て来ましたね…
あいかわらず前置きが長い…

<meta name="robots" content="noindex, nofollow">

 はいこれ、こんな感じのタグが入っていたら、それは
ロボット検索を拒否している事になります。

metaのあとにrobotsと入っているのが特徴ですね。
ただしcontent=の後が重要で、noindexが読んで字の如く
indexするな!=検索避けって事です。

なので、robotsの入ったメタタグが記載されているだけで即
「検索避けだ!」と思い込むのは早計です。と言うのも、
する意味は全く無いですけど

<meta name="robots" content="index, follow">

と言う記載をする人がたまにいるからです。

これは検索エンジンのロボットに対して、インデックスしてくれ!
フォローもしてくれ! と言わんとしているのでしょうが、
インデックス、フォロー共にデフォルトで行われているため、
あえて記載する利点は現在の所ありません。

 Googleに登録したいならこのようなタグを書いて待っているより
サーチコンソールと言うGoogleの提供しているツールを使用し、
クロールを要求した方がはるかに手っ取り早いし確実です。

 なのでページのソースを見て上記のタグ、特にnoindex
記載の有無を要確認すべきでしょう。

※追記:そもそもロボット検索って?

ここから若干追記です。

 これまでロボット検索、ロボット検索と言って来ましたが具体的には
どういう事が起きているんでしょうか?

 ロボット検索と言っても、実際にナノマシンのようなロボットが
ネット上を徘徊していたり、ロボットがPCの前でネットを見ているわけでは
当然ありません(そりゃそうだ…)。

ロボット検索とはGoogleならGoogleの、他の検索サイトならそちらの
クローラーと呼ばれる、ネット上を日々どわーっと巡っている
プログラムみたいなのがあると思ってください。

 ネット空間は自サイト、他サイト問わず個々のページがリンクで
つながっており、それを辿って行く事で様々なページにつながります。
それがクモの巣のように広がって行くため、ウェブ(Web:クモの巣の意)
と名付けられたのでしょう。

ウェブの仕組み ウェブの仕組み
そのネット空間をロボットは辿り辿って、私たちのサイトを発見するわけです。
発見すると、そのサイトを検索結果に登録します。
 と言う事は、ネット上のどこからもつながっていないページには
さすがのGoogle様でも見つけられないし、登録もされないって事にも
なります。

 こうしてサイトにやって来たロボットは、文字通り機械的に
ページ本文から内容を読み取り、例えば

「このページで扱っているのはゲーム、Hoi2、Mod…」

などと理解し、同様の検索結果に表示されるようになる…
と言う仕組みだと思います。

クロール クロール

通常は本文から検索結果を導くのですが…

キーワード キーワード

逆にこういうキーワードで、あるいはこういう紹介文で、と
サイト側から指定する事も可能です。

 ページを作る側から紹介したいセンテンスをロボット検索に
伝えられるのは便利ですが、反面悪用しやすい面もあるため、
現状ではGoogleはこれらに関するメタタグを重視しない傾向に
あるようです。

noindex noindex

 そして検索避けのメタタグを入れると、サイトやページまで
ロボットがやって来たとしても、検索結果への登録を拒否していると
理解し、登録が行われません。

検索避けする意味

 検索避けをする必要性ですが、先述した通り今日のネットの利用方法を
鑑みるに低いと思います。より多くの情報を、より多くの人々が自由に
閲覧できる。と言うのがネットの本来の役割でもあるので、検索エンジンからの
訪問者を避けなければならない理由が見当たりません。

 よほど不特定多数の方の目に触れさせたくない情報を扱っているとかなら
別ですけど、そんな情報ネット上で扱ってどうすんです…?

 どうしても、それを避けたいのならパスワードなどを用いた会員制の
サイト構築を目指すべきではないでしょうか。ただ極度にアングラなサイト
なんてな場合は…まあ色々あるかもしれませんけど…

 ただし、noindexタグを使ってはいけない!と言っているわけでは
ありません。noindexを使う必要のある場面は…ある……はず…
なんですけど…パッと思いつかない…

link rel="canonical"と併用する物みたいな気がするんですけど、
実はlink rel="canonical"周りもよく理解できてないんですよね…

なので「noindex+どう使う」とど直球のワードで検索を
してみたのですが、いまいちこう使うのだ!という物に
出くわしません。

 例えば大量の記事を扱っているブログでちょっとした短い
記事などに用いる…みたいな使い方をするようです。
ブログで収益や集客を重視する方には有用かもしれませんが
あんまりピンと来ません。

 どうもネット上の記事を見る限り品質の低い記事に
検索避けを行い、ブログ全体の評価を上げる…という風に
使うんだそうな。ふーん…

 質の低い記事って何…? さらに見て行くと文字数や
内容の少ない、訪問者が満足する要素が薄い、でも必要なので
削除出来ないようなコンテンツ…例えば問い合わせページ、
自己紹介のページ、プライバシーポリシーの記載されたページなどが
それに当たるとの事…

なるほど…言われてみるとsiteinfoのページとかって
検索で出る必要ないんじゃないか。あのページに特段検索してまで
見て欲しい事なんて無いし。なるほど〜
じゃけんあのページ検索避けしますね! よかったよかったw

なにが…

おわりに

 この他にnofollowってのがあるのですが、それに付いて
説明しようとするとまたまた面倒臭い話になりそうなので
今回は割愛します。

また、検索やSEOに絡む話はそれこそ10年どころではない
数年単位…と言うかGoogle様の方針一つで一晩のうちに
180度様変わりしたりするのが常です。

 少し前の情報だともはや何一つ通用しなかったりする、
そりゃあおっかない世界だったりします。

なのでここで書いた話も、あっという間に過去の物に
なる事だって十分ありえるわけです。例えばGoogle様が
「robotsタグ今後無視して全部クロールするわw」
と言い出したら、もうこの記事で書かれた事は
過去の事になるわけで…

それだけでなく、今後noindexやrobotsタグ自体の扱いが
変わったり、それに取って代わる新たなタグが生まれないとも
限りません。ネットを取り巻く環境は日々、進化変化を続けています。

 と、なんだかんだ書いてきましたが私も別に
ネットやらhtmlやらSEOに詳しいわけでは全然無く、
そこそこの期間見よう見まねで個人サイトを運営して来た
零細管理人にすぎないので、今回の記事もいい加減だったり
間違っている箇所もある事でしょうさ…

加えて今回の記事は、某新聞社のアレについてを
書きたかったのではなく、あの件がきっかけで浮上した
検索避けと言うものを通して、これまでのネットと個人サイトの
リンクの歴史についてを書きたいなと思い立ち、
記事にした次第です。

 最後になりましたが、先述したような個人サイトが
勃興していた時代…アレはアレで面白かったですよね。
Google頼みじゃなくても十分個人サイトは探せましたし、
サーフィンしようぜ、光るネットの波をくぐってって感じの
ネットサーフィン感はバリバリありましたしねw

 お宝サイトを見つけた! みたいな感じはあの時ならではの
感覚に思えてなりません。

時間なんて気にしない

まあでも…あの時代に戻りゃあしないし、戻っちゃ
ダメなんでしょうけど。


HOME © 2018 六原短期大学