重複ページのあぶり出し方はネットでもゴロゴロ載ってるけど
低品質なページの探し方が載っていない
ってことありませんか?
ちなみに、ここでいう低品質なページとは
画像だけのサイトや明らかに「それ(そのページ)いらないでしょ」というページを指しています。
画像だけ
画像とほんのわずかなテキストだけ
こんなページを見つけたらさっさとnoindex処理をする or Google Search Consoleから削除しましょう!
サイトの上位表示に悩んでいるいる方は低品質なページがないか疑ってください。
低品質なページはどのサイトにも存在し得る
『自社サイトの中に低品質ページがあるのかどうか』を知るのはかなり難しいと思っていますか?
実は、低品質ページは意外と簡単に見つかります。
自分で運営していて低品質なページがまさか存在するとは思っていないですし、普通は分からなくなります。
サイト構築をゼロから行なったことがない人は知らないと思いますが、意図せず生成されたのを知らずにGoogleにインデックスされてしまうこともけっこうあるんです。
WordPressをはじめとするCMSを利用している場合は、注意が必要です。
調べる方法はいくつかありますが、ここでは簡単な方法をご紹介します!
「site:URL」で後ろのほうに出てくるページを疑う
site:URLでの検索でインデックスされているページを確認できます。
(※ インデックスしている全てのページではなく一部)
表示された検索結果で最も後ろのページを見てみましょう。
嘘か真か、site:URLで検索すると低品質ページは後ろのほうに表示されやすいのです。
語弊があるといけないのですが、後ろに表示されるからといって、そのページが必ず低品質というわけではありません。
経験則として画像だけのページややたら少ないテキストページが後ろの表示されやすいなぁと感じているだけです。
また、明らかに「このページいらない!」と思ったら該当URL内のタイトル、文章の一部をコピーしておきます。
「site:URL “コピーした内容”」で検索すると”コピーした内容”が記述されているページが出現します。
内容を吟味してURLだけ異なっていて内容は全く同じだったり、若干違うけどほぼ同じページであれば片方を削除しましょう。
「site:URL -ディレクトリ」で特定ディレクトリを除いて検索
これはインデックスページ数がやたら多い時に活用できます。
例えば、調べた結果が1,900件のインデックスが少なくともあると分かるサイトがあったとします。
実際に見てみると
509/1,900件しか表示されません。
ここで「site:URL -ディレクトリ」の出番です。
絶対低品質だと思わないページの集まるディレクトリや取り除きたいディレクトリをsite:URLのあとに入力します。
categoryディレクトリを取り除きたい場合は
site:URL -category
categoryディレクトリとblogディレクトリを同時に取り除きたい場合は
site:URL -category -blog
とすることで各ディレクトリを取り除いた検索結果になります!
※ URLと-の間は半角スペースを入力してください。
「site:URL ディレクトリ」で特定ディレクトリを含むページを検索
今度は逆です。
特定ディレクトリを除いた中に低品質ページが含まれている可能性もあります。
そうした場合は特定ディレクトリ以下のページを表示することもできます。
先ほどは、ディレクトリの前に-入力していましたが今回はそちらは入力しません。
site:URL ディレクトリ名
この範囲内で調べるとディレクトリ内で低品質ページや、思わぬ重複ページがインデックスされていることに気がつくパターンもあります。
ぜひ、試してみてください!
その他のコマンド例
Googleの「Site:」コマンドのオプション25個 SEOmoz | デジタルマーケティングブログ
canonicalを設定していても不要なページは削除すべし
site:関連で調べてようやく低品質ページを見つけても、しっかりと運営されている方なら重複ページや低品質ページに対してcanonicalを設定していることでしょう。
どれだけ時間をかけて見つけてもキチンと対応していたら
(な)んだよ!時間の無駄だったわ!!!
となるかもしません。
でも、根本的に低品質なページは存在していることがユーザーにとって混乱を招くページなので、最初から削除してしまったほうが良いと思うんですね。
絶対に必要なページだけど評価して欲しくないページに関してはcanonicalを活用するか、コンテンツの質を上げるといった対応をすればプラスに働くと思います。
まとめ
ユーザーにとって不要なページは検索結果から削除することを心がけることが理想です!
- 低品質なページはsite:検索で洗い出す
- ページ数が多いディレクトリは -ディレクトリで消去
- 見つかったページは削除したうえでfetch as googleで申請
お問い合わせ完了ページとか中身のない画像だけのページは意味がないので要注意です!
重複ページもこれで探せますね。
補足:はてなブログの場合
通常サーバーを借りてサイト運用する場合はrobots.txtや.htaccessで制御したり転送設定もできますが、はてなの場合は(おそらく)できません。
心外にも別URLで同一コンテンツが生成されることが多々あります。
これどうにかしたいんですが、特定の記事やカテゴリーにcanonicalを入れられないのかしら〜・・・
それかその該当ページをnoindexにしたい。
はてなの謎システムはまだまだ解明できないでいます。