
今回の記事は以下の内容になります。
- 検索エンジンへのインデックスが遅れると、オリジナルである自分の記事(ページ)がパクリ記事(ページ)だと判断されてしまうスカイクレイピングの被害にあう可能性があります。
- 自分のサイトがそのような理不尽な扱いを受けないように、プラグイン「WebSub/PubSubHubbub」を導入して、素早くgoogle等の検索エンジンに自分の記事(ページ)を通知しましょう。
このカテゴリー(独学ワードプレス)では、ウェブマガジン『GOKUI』編集長の渡辺が独学でワードプレスを学びながら、ウェブマガジン『GOKUI DIY - Creative and Minimum Life -』を構築していく過程や、その後のサイト運営について紹介しています。
僕がこのウェブマガジンの運営を始めるにあたり、最初に取り組んだことは以下の3つです。
ワードプレスでサイトやブログを始めるために決めなければならない3つのこと
【1】 | サイト名を決めて、それに合わせた独自ドメインを決めること |
【2】 | レンタルサーバーを決めること |
【3】 | ワードプレスのテーマを決めること |
その次は、以下の5ステップによってワードプレスを使ったサイトの基礎を構築しました。
WordPressでサイト&ブログを始める5ステップ
【1】 | 独自ドメインを取得する |
【2】 | レンタルサーバーと契約する |
【3】 | 独自ドメインとレンタルサーバーを紐づける |
【4】 | レンタルサーバーにワードプレスをインストールする |
【5】 | ワードプレスにテーマをインストールする |
今はこの段階ですね。
そしてここからは、インストールしたワードプレスに対して初期設定を進めていきます。
設定項目はたくさんあるので、初期設定の概念とか分類分けについては難しいところではあるのですが、あくまでも独断と偏見で以下の12項目に絞り、以後数回に分けて記事にしていこうと考えていますのでよろしくお願いします。
ワードプレスをインストール後、最初にやるべき12のこと
【1】 | サイトアドレスの設定 |
【2】 | サイトタイトルの設定 |
【3】 | キャッチフレーズの設定 |
【4】 | フロントページの設定 |
【5】 | パーマリンクの設定 |
【6】 | スパム対策 |
【7】 | サイトマップの設定 |
【8】 | サーバー容量節約対策 |
【9】 | 不正ログイン対策 |
【10】 | googleインデックス対策 |
【11】 | スカイクレイピング対策 |
【12】 | Ping送信の設定 |
前回までに【1】~【9】まで終了しましたので、今回は【10】 googleインデックス対策と【11】 スカイクレイピング対策をしていきます。
検索エンジンへのインデックスは早い方が良いと言われる理由
今回は「WebSub/PubSubHubbub」を紹介します。
「ウェブサブ/パブサブハブバブ」と読むこのプラグインは、サイトを更新した際にGoogle等の検索エンジンに素早くインデックス(検索されやすく整理された状態で格納)されるよう通知してくれる便利な機能を持っています。
このプラグインを導入しておくことで、検索エンジンに素早くインデックスされアクセスアップが期待できるだけでなく、オリジナルである自分の記事(ページ)をパクリ記事(ページ)だと誤認される現象(スカイクレイピング )を防ぐこともできます。
前回の記事でも紹介しましたが、インターネットの世界には残念ながら悪意を持った人々が数多く存在します。
そうした悪意にも様々な手口がありますが、その一つが 記事(ページ) 内容の「パクリ問題」です。
例えば、あなたがすごく頑張って新たな記事(ページ)を作成し、自身のサイトやブログで紹介したとしても、悪意を持った人々に目を付けられた途端、簡単に丸ごとコピーしただけのパクリ記事(ページ)を作成されてしまう可能性があります。
最近では、WEBボット等のシステムを使って、こうしたパクリ記事(ページ)を自動で量産されてしまうこともあるようです。
そうなるとインターネット上に全く同じような記事(ページ)が2つ(或いはそれ以上)存在することになりますが、
そのような場合、当然Google等の検索エンジンは「どれがオリジナル記事(ページ)なのか」ということを判断して、オリジナル記事(ページ)以外のパクリ 記事(ページ) を検索上位から排除しようとしてきます。
では、検索エンジンはどのようにしてオリジナルとパクリを見分けているのでしょうか?
当然あなたは「先にインターネット上にアップした自分の記事(ページ)」がオリジナルだと判断されることを期待すると思いますが違います。
なぜなら検索エンジンにとっての「先に」というのは、「先にインターネット上にアップされた」という事実ではなく、「検索エンジン自らが先に見つけたこと」を重視するからなんです。
つまり、例えあなたが時間的に先にオリジナル記事(ページ)をアップしたとしても、運悪くそれをパクった記事(ページ)の方が先に検索エンジンに見つけられてしまうと、検索エンジンはパクリ記事(ページ)の方を「オリジナル記事(ページ)である」と判断するということです。
これは検索エンジンの特性なので諦めるしかありませんが、こうしたことが繰り返され、検索エンジンから自分のサイトがパクリ記事(ページ)ばかりのサイトだと判断されることは余り好ましいことではありません。
ではどうしたらこのような理不尽な扱いをされないで済むのでしょうか?
答えは「とにかくパクリ記事(ページ)よりも先に自分の記事(ページ)を検索エンジンにインデックスしてもらう」ことです。
そこで登場するのが今回紹介するプラグイン「WebSub/PubSubHubbub」です。
これをインストールしておけば、新規で記事(ページ)をアップロードした際に、素早く自動的に検索エンジンに通知することでインデックスされやすいように働きかけてくれるため、そうした理不尽な扱い( スカイクレイピング )を防ぐことができるのです。
「WebSub/PubSubHubbub」は特に難しい設定はなく、「有効化」しておくだけでこのような機能を発揮してくれるのも嬉しいポイントです。
WebSub/PubSubHubbubの設定方法
まずはプラグイン「WebSub/PubSubHubbub」をワードプレスにインストールします。
1)ワードプレスの管理画面から、プラグイン>新規追加と進み、プラグインを追加する画面を表示させます。
キーワード右の空欄に「WebSub/PubSubHubbub」と入力すると、WebSub/PubSubHubbubが表示されてくるので、「今すぐインストール」をクリックしてインストールします。

2)インストールが終わったら「有効化」をクリックします。

3)次にワードプレスの管理画面から、設定>WebSub/PubSubHubbubに進むと下の画像のような画面が表示されます。
ここではハブサーバーの編集をすることができますが、このままでもしっかり機能してくれるので変更の必要はありません。

4)これで WebSub/PubSubHubbub の設定は完了です。
まとめ
今回はgoogleインデックス対策とスカイクレイピング対策を紹介しました。
せっかく頑張って作成したサイトが、悪意のある人々から攻撃を受けることで評価を落とすなんてことはあってはならないことです。
無料で特に細かな設定の必要がない便利なプラグイン「WebSub/PubSubHubbub」をインストールするだけで、こうした事態を防ぐことが出来るのであれば使わない手はないと思います。
次回も同じようなインデックス対策になりますが、【12】Ping送信の設定を記事にしたいと思います。
おわり