Google 検索エンジン最適化

公開日:
更新日:
0SEO
目次
  1. 検索エンジン最適化とは
  2. SEO の基礎
    1. 日本の中小企業における Web サイトの実態
    2. SEO の考え方
    3. Google の考え方
    4. 検索エンジンの仕組み
    5. SEO の要素
  3. コンテンツ SEO
    1. 検索キーワードの選定
    2. ロングテール SEO
    3. コンテンツデザイン
    4. モバイルフレンドリー
  4. SEO 内部対策
    1. インデクサビリティの最適化
      1. title 要素の最適化
      2. description 属性の最適化
      3. keywords 属性の最適化
      4. noindex の最適化
      5. nofollow の最適化
      6. hn (見出し) 要素の最適化
      7. p 要素の最適化
      8. strong・em 要素の最適化
      9. figure・figcaption 要素の最適化
      10. alt 属性の最適化
    2. クローラビリティの最適化
      1. サイト構造の最適化
      2. URL の正規化
      3. サイトマップ
      4. robots.txt
      5. アンカーテキスト
      6. パンくずリスト
      7. ナビゲーションメニュー
      8. ページネーション
  5. SEO 外部対策
    1. ナチュラルリンクの獲得
      1. アンカーテキストペナルティ
    2. ソーシャルメディア連携
  6. Google のアップデート
    1. パンダアップデート
    2. ペンギンアップデート
    3. フリッツアップデート
    4. ビッグダディアップデート
    5. カフェインアップデート
    6. フロリダ、オースティン、ブランデーアップデート
    7. ハミングバードアップデート
    8. デューイアップデート
    9. ヴィンスアップデート
    10. メーデーアップデート
    11. スクレイパーアップデート
    12. ファーマーアップデート
    13. EMD (Exact Match Domain) アップデート
    14. ファントムアップデート
  7. ホワイトハットSEO と ブラックハットSEO
    1. ホワイトハット SEO
    2. ブラックハット SEO
      1. ワードサラダ
      2. 隠しテキスト
      3. 隠しリンク
      4. クローキング
      5. キーワードスタッフィング
      6. コメントスパム
      7. リンクファーム
  8. ガイドライン違反によるペナルティの復旧方法
    1. ペナルティに対する Google の見解
  9. Google のランキング要素
    1. ドメイン
    2. ページレベル
    3. サイトレベル
    4. バックリンク
    5. ユーザインタラクション
    6. アルゴリズム
    7. ソーシャルシグナル
    8. ブランドシグナル
    9. サイト内部のスパム
    10. サイト外部のスパム
  10. まとめ

検索エンジン最適化とは

"検索エンジン最適化 (SEO:Search Engine Optimization)" とは、Web ページが検索結果の上位にランキングさせるための最適化手法です。検索結果の上位にランキングされることにより、より多くのユーザが Web サイトに訪れることになるため、訪問者数を増やすために有効です。下記のグラフは、NetBooster、Catalyst、Slingshot という企業がそれぞれ検索順位とクリック率を調査した結果です。9 割以上のユーザは、1 位 ~ 5 位までのページしか訪問していないことがわかります。


検索順位とクリック率
検索順位とクリック率

ただし、どのような最適化を行っても上位にランキングされることを保証することはできません。Google は 200 を超える要素から検索結果ページのランキングを作成し、掲載順位を決定しています。ランキングを作成するアルゴリズムは非公開であり、アップデートが繰り返されているため、最上位に掲載され続けることは至難の業と言えます。

SEO の基礎

SEO は 1990 年代のインターネット黎明期に検索エンジンが登場したことに端を発します。検索エンジンを経由して Web サイトにアクセスするケースが圧倒的に多いため、検索結果の順位が Web サイトの価値としてみなされるようになりました。その結果、Web サイトの管理人は、検索結果の順位を少しでも上げようと試行錯誤を行いました。


過去の SEO では、コンテンツ内容の良し悪しではなく、HTML の meta 要素や、body 要素内にキーワードを大量に盛り込む原始的な方法によって、検索順位を操作していました。しかし、現在の検索エンジンは、コンテンツの良し悪しを含め、様々な要因によって検索順位を決定します。また、不正な方法による検索順位の操作は何かしらのペナルティを受けるため、過去に行われていた SEO は逆効果になります。


SEO は、一部の個人サイトでも実施されていますが、主に企業サイトで実施されています。企業は、Web サイトを通じてユーザから商品の購入や、資料請求などの最終成果である "コンバージョン" (CV) を獲得する必要があるためです。コンバージョンを得るための第一歩として、特定のキーワードで検索された場合に検索順位で上位になることが求められるため、多くの企業サイトでは SEO が実施されています。

日本の中小企業における Web サイトの実態

企業サイトの中でも SEO を実施しているのは、大手サイトがメインです。そもそも中小企業は、自社の Web サイトを開設していない場合もあります。以下は、中小企業白書における IT の導入状況です。



中小企業白書における IT の導入状況
中小企業白書における IT の導入状況


中小企業白書 2013 [PDF]

特に小規模事業者においては、2012 年の段階でも自社の Web サイトを開設している割合は 46.3 % にとどまっています。また、小規模事業者の自社 Web サイトの開設有無と販売件数の変化においては、自社の Web サイトを開設している事業者の方が販売件数が増加した割合は多いものの、"大幅に増加した" と答えたのは、わずか 3.7 % となっています。



小規模事業者の自社 Web サイトの開設有無と販売件数の変化
小規模事業者の自社 Web サイトの開設有無と販売件数の変化


自社の Web サイトを開設しても、良質なコンテンツと適切な SEO 対策が行われていない場合は、失敗する可能性が高くなります。Web サイトでコンバージョンを集めるためには、ユーザが満足するコンテンツと、正しい SEO の知識が必要になります。

SEO の考え方

SEO の手法は多くありますが、SEO を実施しているすべての Web サイトが成果を上げているわけではありません。SEO を実施していても成果が上がらない場合は、SEO に対する基本的な考え方が誤っていると思われます。


SEO は検索エンジンに対する攻略法であると認識している場合は、考え方が誤っており、おそらく失敗します。SEO は検索順位が上位になるようなテクニカルな面も含まれますが、本質的な意味では正しくありません。正しい SEO の考え方は、検索ユーザが求める情報を正しく提供する "ユーザファースト" であることです。


検索ユーザが何を探し求めているかを考え、ユーザが感動するレベルの価値を与えるページを作成し、Web サイト全体がシンプルで使いやすく、デザインが洗練されており、ページの表示が高速で、安全にブラウジングできることです。それらの要素が土台となって初めて検索順位が上位になり、目標としているコンバージョンを獲得できます。

Google の考え方

Google は、検索エンジンを利用するユーザを最も大切にしています。Google の理念である "Google が掲げる 10 の事実" の最上位にユーザを置いており、巨大企業でありながら収益性よりもユーザを重視しています。


Google が掲げる 10 の事実

Google は、検索キーワードからユーザが何を求めているのかを把握し、膨大な Web サイトの中から最も適切な Web サイトを返すエンジンを目指しています。この最も適切な Web サイトを返す技術は、日々改善を重ねられており、どのようにすればユーザにもっと満足してもらえるような結果になるか Google は苦心しています。2000年代初頭は、まだまだ検索アルゴリズムが熟成しておらず、何も役に立たない大量のアフィリエイトが貼られた Web サイトが検索順位の上位にくることも珍しくありませんでした。しかし、後のパンダアップデートや、ペンギンアップデートにより、それらの役に立たない Web サイトは検索順位のはるか後方、または何かしらのペナルティを受けて表示されないまでに至りました。


Google がユーザーのためにしていること

検索エンジンの仕組み

Web サイトを作成してから、Google が検索順位を決定するまでには、"クローリング""インデックス""ランキング" の 3 つのステップがあります。


クローリングとは、"クローラー" と呼ばれる検索エンジンのロボットが世界中の Web サイトを収集することです。クローラーは、Googlebot、ロボット、スパイダーと呼ばれる場合もあります。作成した Web サイトをクローラーに収集してもらうことが、検索結果に載る最初のステップです。逆に、作成した Web サイトがクローラーに収集されなければ、いつまで経っても検索結果には表示されません。


クローラーは、Web 上を常に巡回しており、Web ページを常に見張っているわけではありません。そのため、クローラーに収集されるためには、クローラーが見つけやすい動線を確保するか、クローラーに収集して欲しいことを通知するかの 2 種類に分かれます。クローラーへの動線を確保するためには、ソーシャルメディアや、他の Web サイトからのナチュラルリンク (機械的ではない自然なリンク) を集める方法が一般的です。クローラーに収集して欲しいことを通知するには、サイトマップを送信するか、Fetch as Google ツールを使うかになります。


サイトマップ ページでサイトマップを管理する
ウェブサイト用 Fetch as Google を使用する

インデックスとは、Google が Web サイトをデータベースに登録することです。クローラーにより収集されたページは、すべてデータベースに登録されます。データベースに登録されることを "インデックス化" や "インデクシング" とも言います。クローラーによって収集されたページは、そのままの形で直接データベースに登録されるわけではありません。実際には "インデクサ" と呼ばれる中間処理を行うプログラムを経由して、検索エンジンが高速で処理しやすい形で登録されます。インデクサは、検索アルゴリズムが検索順位を決めるためのスコアリングを行いやすいように、ページのキーワード解析や、リンクの解析を行います。形態素解析なども行われるため、文章を単語に切り分け、ページが何のコンテンツについて書かれているかも理解します。


ランキングとは、ユーザが検索するキーワードをもとに 200 項目以上の要素によって、総合的に決定される検索順位のことです。この検索順位の要素は頻繁にアップデートされているため、評価項目のみ追い求めて検索順位を操作しようとしても無意味に終わります。良質なコンテンツこそ、最も確実な SEO 対策となります。


このように、Google は様々なアップデートを行っていますが、アップデート内容を特に気にする必要はありません。アップデートにより順位が変動する心配をする Web サイトは、良質なコンテンツを提供していなかったに過ぎません。良質なコンテンツを提供し続ける限り、Google のアップデートは有利に働きます。アップデートの内容を分析する時間は、コンテンツがどうすれば良質になるか分析する時間に充てましょう。

SEO の要素

SEO には、"コンテンツ SEO""SEO 内部対策""SEO 外部対策" の 3 つの要素があります。この 3 つの要素を正しく実践できれば、検索ユーザに大きな満足度を与えることが可能です。この 3 つの要素については、後述する章で説明します。

コンテンツ SEO

コンテンツ SEO とは、SEO の 3 つの要素の中で最も重要になります。良質なコンテンツは、検索順位が上位になり、多くのコンバージョンを獲得できるためです。Google は、検索ユーザにとって最も価値のあるサイトが上位に表示されるべきであると考えています。


Google ウェブマスター向け公式ブログ: 良質なサイトをより高く評価するために

Google は、検索アルゴリズムを改良し、ユーザに最良の結果をもたらす努力を続けています。どのように改良しているのかは、後述する "パンダアップデート と ペンギンアップデート" を参照して下さい。Google の理念に共感し、検索ユーザのために価値のあるコンテンツを作成することで、最上のコンテンツ SEO を実践していることになります。


コンテンツ SEO が優れている Web サイトが多くのコンバージョンを獲得できる理由は、他の Web サイトと情報の質で差別化ができている点にあります。ユーザからのアクションによりコンバージョンが獲得できる多くのケースは、その Web サイトが信頼できるかどうかにかかっています。Web サイトが信頼できるかは、粗悪な情報が多い Web サイトよりも、良質な情報がある Web サイトが優先されます。

検索キーワードの選定

SEO において、検索キーワードとはユーザが何を求めているのかを示すものです。そのため、コンテンツを作成する場合、どのようなキーワードを選定すれば良いかが重要な要素となります。検索キーワードとタイトルが一致し、ユーザの知りたかった情報が記載されている Web サイトであれば、ユーザに大きな満足を与えることができます。逆に、検索キーワードとタイトルが一致していても、役に立たない記事であれば、ユーザは落胆してしまいます。


ユーザに大きな満足感を与えるために、キーワード選定は慎重に行うべきです。具体的なキーワードの選定は、以下のように多角的な視点から行います。

  • そのキーワードで訪問したユーザからコンバージョンは期待できるか
  • そのキーワードは検索エンジンでどれだけ使用されているか
  • そのキーワードの他に関連性の高いキーワードも網羅しているか
  • そのキーワードで上位に表示されることはできるか

あるキーワードで訪問したユーザからコンバージョンが期待できるかは、ユーザが何か行動を起こすためのキーワードが設定されているかを考慮する必要があります。例えば、"ダウンロード"、"予約"、"購入" などのキーワードがタイトルやコンテンツの内容に含まれているかなどです。


あるキーワードは検索エンジンでどれだけ使用されているかを事前に調べるためには、Google トレンドが役に立ちます。何かのコンテンツについて、誰も検索キーワードとして使っていないキーワードを設定しても、ユーザは検索エンジンからはやってこないでしょう。専門性の高いキーワードや、一般的に認知されていないキーワードを使わなくてはならない場合などは、より汎用性の高い言葉に置き換えるなどの工夫が必要です。


あるキーワードの他に関連性の高いキーワードも網羅しておくと、検索ユーザの幅が広がり流入するユーザが増える可能性があります。あるキーワードと関連性の高いキーワードは、Google の検索結果ページに表示されています。例えば、"旅行" と関連性の高いキーワードは、"新婚旅行" や "ランキング" などです。


あるキーワードで上位に表示されることができるかは、実際の検索順位を見て判断します。例えば、"Google" のキーワードで検索順位の上位を目指しても、Google 本体の Web サイトには敵いませんし、関連する Google のサービス、ソフトウェア、関連するニュースが上位を占めており現実的ではありません。このように競合する Web サイトと比較してあるキーワードで、現実的に上位を目指せるかがポイントになります。


あるキーワードで本当に効果が上がっているのかを確認するためには、ウェブマスターツール (Search Console) の検索アナリティクスが役に立ちます。検索アナリティクスでは、クリック数、表示回数、CTR、検索順位がクエリ (検索キーワード) 別にグラフで表示されます。


検索アナリティクスの結果
検索アナリティクスの結果

ロングテール SEO

キーワードには、"ビッグキーワード""スモールキーワード" の 2 種類があります。Web サイトがターゲットとする検索キーワードの内、汎用的に使われ検索回数が多いキーワードをビッグキーワード、具体的に使われ検索回数が少ないキーワードをスモールキーワードと呼びます。


ビッグキーワードは、検索回数が多く、検索順位でも上位に表示されるため、多くのユーザ流入が期待できます。ただし、競合性が高く、相対的に順位を上げにくいため、時間とコストがかかるデメリットがあります。スモールキーワードは、検索回数が少なく、多くのユーザ流入は期待できません。しかし、競合性が低く、相対的に順位を上げやすく、時間やコストが節約できるメリットがあります。


SEO といえば、ビッグキーワードに対して対策を行うべきと考えがちですが、スモールキーワードに対しても正しく理解し、両方を意識した SEO 対策の方がより効果的となります。


ロングテール SEO とは、ビッグキーワードではなくスモールキーワードで、より広い範囲に対して Web サイトをヒットさせ、ユーザを多く集める SEO のことです。これは、Amazon などに見られるインターネットの物品販売の概念の 1 つで、販売機会の少ない商品でも、アイテム数を幅広く取り揃えることで多くのユーザからの売上により、総数を伸ばすものです。ロングテール SEO とは、この概念と同じで、スモールキーワードに焦点を当てることで、結果としてビッグキーワードによる流入数を超えるものです。


ロングテール SEO を行うためには、対象のキーワードに対してページ内に多く出現させるか、ページを分割するかになります。


対象のキーワードをページ内に多く出現させる方法は、非常にシンプルな方法です。また、競合の少ないキーワードがページ内にあれば、SEO 対策を施さなくても簡単に検索順位が上がる可能性があります。ただし、ページ内に多くのキーワードが出現したり、競合の少ないキーワードばかり使うと、非常に読みにくい文章になってしまうため、全体のバランスを考える必要があります。


対象のキーワードに対してページを分割する方法は、SEO の方法としては有効です。1 ページに 1 つのメインテーマを持たせることが基本になるためです。1 ページ内に複数のテーマを詰め込むのは SEO 上は好ましくありません。ページを分割し、1 ページ 1 テーマのコンテンツを増やすことで、ユーザの流入の幅を広げることになります。

コンテンツデザイン

良質なコンテンツを作成するための基礎となるのが Web ライティングです。Web ライティングとは、コンテンツに書かれた文章を検索エンジンが適切に評価できる文章術であり、同時にユーザからも読みやすく正しく理解してもらうための技術です。狭義では、検索エンジンだけに特化した文章術であると定義している場合もあります。


Web ライティングを行うときのガイドラインは、以下の 4 つになります。

  • 文章はなるべく簡潔に書く
  • 専門用語は避け、分かりやすい言葉で書く
  • 長い段落は作らず、細かく情報を区切って書く
  • 情報量が多い場合はページを分割する

Web 上の文章は、印刷した紙の文章と比べて、25 % ほど読みにくいことが分かっています。そのため、Web 上の文章を書くときは、なるべく簡潔に書くように心掛けます。良質なコンテンツでも、ユーザは文章が読みにくいという理由だけでページを離脱していきます。最低でも、誤字・脱字、スペルチェックなどの校正作業は行いましょう。


専門性の高いコンテンツにおいて、専門用語を何の説明もなしに乱発するページがあります。筆者が何も分かっていないと思われないように、賢く見える文章を書いているケースですが、読み手のユーザからすれば逆効果になります。難しい事を難しく書くことは簡単ですが、難しい事を解りやすく書く方が何倍も難しいのです。読み手を置き去りにするような文章は、途中で飽きられ最後まで読まれることはないでしょう。ただし、逆に親切すぎる書き方は冗長な文章になるため、適度なバランスが必要です。


検索ユーザは、目的の情報だけを探しに Web サイトに訪れます。そのため、苦労して書いた文章であったとしても最初から最後まで通読してくれるわけではありません。ユーザが文章を読みやすくするためには、長い段落を作らず、細かく情報を区切って書きます。興味のあるキーワードが拾えるように、斜め読みができるレベルであれば問題ありません。具体的には、結論から先に書いたり、1 つの段落には 1 つだけのテーマに絞ったり、箇条書きや、表を挿入するなどの可読性を上げる工夫を行って下さい。


文章は短く簡潔に書くべきであると上述しましたが、コンテンツを犠牲にしてまで短くする必要はありません。どうしても説明が長くなるケースも存在します。その場合は、ページを適切な大きさ (基本的に 1 ページに 1 テーマ) に分割し、分割したページにはリンクを張りましょう。検索ユーザの中には、スクロールしてまで長文の記事を読みたくないという人たちも存在します。それらのユーザが求めているのは、もっと簡潔で要約されている Web サイトです。Web サイトは無数にあるため、苦労して長文を読むより、自分に合った最良の Web サイトを探すために離脱してしまいます。

モバイルフレンドリー

Google は 2015 年 4 月 21日からスマートフォンの解像度に最適化された "モバイルフレンドリー" に対応している Web サイトの検索順位が上がりやすくなるように変更しました。そのため、モバイルフレンドリーに対応していない Web サイトは相対的に検索結果の順位を落とす可能性があります。この変更は、検索ユーザのスマートフォン利用率が上がってきたことが背景にあります。


モバイルフレンドリーとは、スマートフォンでコンテンツを利用できるか、読みやすいか、使いやすいか、デザインが崩れていないかなどが評価されます。Google は Web サイトがモバイルフレンドリーに対応しているかをテストできるサイトを用意しています。このテストに合格すれば、モバイルフレンドリーであると言えます。また、モバイルフレンドリーは Web ページが対象で、Web サイト全体が対象でないことに注意して下さい。例えば、Web サイトのいくつかのページがモバイルフレンドリーでない場合でも、Web サイト全体がモバイルフレンドリーではないと判断されることはありません。


モバイル フレンドリー テスト

モバイルフレンドリーの不合格例
モバイルフレンドリーの不合格例
モバイルフレンドリーの合格例
モバイルフレンドリーの合格例


スマートフォン用のクローラーは、PC用のクローラーとは異なり、"Smartphone Googlebot" や "Googlebot-Mobile" が収集しています。スマートフォンサイト用のサイトを正しく収集されていない場合、モバイルフレンドリーとは判定されません。正しく収集できないケースとしては、モバイル用サイトへのリダイレクト設定が誤っており、デスクトップ用サイトがクローリングされるなどです。


モバイルフレンドリーの重要性は非常に大きく、パンダアップデートやペンギンアップデートよりも大きな影響があるとされています。通例では、Google が重大な検索アルゴリズムを変更する場合、ある特定の地域から開始して、世界中に展開していきますが、今回の変更では一斉適用になっています。


モバイルフレンドリーに対応する場合は、レスポンシブデザインを取り入れるか、PCとは別にモバイルサイトを用意しリダイレクトさせるか、動的なページとしてPCとモバイルを分けるかなどの方法があります。Google はスマートフォン用のサイトをクローリングできれば良いので、対応する場合はどの方法でも問題ありません。最近では、レスポンシブデザインを取り入れるサイトが増えてきており、Google もレスポンシブデザインの導入を勧めています。ただし、これらの対応方法はユーザに最適な環境を提供する単なる手段であり、重要なことはコンテンツ自体であることを忘れないで下さい。

SEO 内部対策

SEO 内部対策とは、ユーザと検索エンジンから見て使いやすい Web サイトを作ることです。つまり、Web サイトの内部を最適化する対策を意味します。具体的には、コンテンツの更新頻度、信頼性、網羅性、専門性などのコンテンツの "質" を検索エンジンに適切に評価してもらう施策になります。また、検索エンジンに評価してもらうために、評価されやすい構造になっている必要もあります。細かい単位では、HTML 要素の最適化や、URL の正規化も SEO 内部対策に含まれます。


これらの SEO 内部対策を怠り、外部からのリンクを獲得することだけを重要視しても、検索順位にはあまり影響しません。ページの検索順位を上げるために大量の外部リンクを、業者から購入する例もありますが、意味がないどころか逆効果になります。外部リンクについての詳細は、後述する SEO 外部対策を参照して下さい。


Web ページを公開すると、Web上を巡回しているクローラーが Web ページの情報を収集しに訪問します。ただし、クローラーが 1 度訪問しただけではページの情報はすべて収集されず、断片的な情報しか収集されません。クローラーが何度も訪問することで、ページの情報を正確に読み取られ、適切に評価されます。そのためには、頻繁にクローラーに訪れてもらう必要があります。自身の Webサイトが 1 日にどの程度クローラーが巡回しているのかは、Google ウェブマスターの Search Console から確認できます。


Google ウェブマスター

Search Console にログイン → 対象のウェブサイト → クロール → クロールの統計情報


1日あたりのクロールされたページ数
1日あたりのクロールされたページ数


クローラーの巡回頻度は、Webサイトの規模、ページの更新頻度、サイトマップや RSS/Atom フィードの有無など、様々な要因から Webサイトによって異なります。一般的には、クローラーの巡回頻度が平均 60 ~ 80 回/日程度から SEO の効果が現れます。逆に、クローラーの巡回頻度が低い場合は、ページが正しく評価されていない可能性があるため、検索順位が上がりません。


クローラーが収集したページの情報は、Google の膨大なデータベースに登録されます。そして、ページが登録される際には、何のコンテンツについて書かれたページなのかが分析され、ドキュメント内のキーワードが抽出されます。これらのキーワードは、検索する際のキーワードと関連付けされ "インデックス" と呼びます。


Google で検索する際には、検索キーワードとインデックスが比較され、ユーザが望むページの優先順位が決定されます。そして優先順位の高い順に Web ページが表示されます。これらの検索順位の決定するルールを "検索アルゴリズム" と呼びます。検索アルゴリズムは非公開ですが、ある程度有名なものは知られています。詳細は、後述するGoogle のランキング要素を参照して下さい。


SEO 内部対策では、検索エンジンのクローラーに対して正確なインデックス情報を提供する "インデクサビリティ"の確保と、クローラーの巡回頻度を上げるための施策、またはクローラーが巡回しやすいようにする施策である "クローラビリティ"の確保について分けて説明します。

インデクサビリティの最適化

インデクサビリティとは、検索エンジンのクローラーに Web ページが何のコンテンツについて書かれているか、その中で重要なキーワードは何かを伝え、ページを正確にインデックスさせることです。そのためには、ページ内の各要素の構造を適切にマークアップし、クローラーに内容を正確に伝えることが求められます。例えば、ユーザは動画や画像を認識できますが、クローラーは動画や画像を認識できないため、代替テキストのマークアップが適切になされているなどです。インデクサビリティの精度が高い場合、ページの評価の精度も向上します。

title 要素の最適化

title 要素は、そのページを端的に表す非常に重要な要素です。検索キーワードに対して、title 要素の一致は検索順位を大幅に上げる可能性があります。逆に title 要素に検索キーワードが入っていない場合、コンテンツの中身が優れていなければ検索結果に表示されることは困難になります。ただし、title 要素に検索キーワードを盛り込みすぎるのは逆効果になるため、ターゲットとなるキーワードを絞る必要があります。


検索キーワードと title 要素が一致した場合、検索結果画面には以下のように太字で表示されます。検索キーワードの単語単位で一致する数が多ければ、検索ユーザが求めるページである可能性が高いと判断されます。また、検索キーワードの順番と title 要素に書かれているキーワードの順番は関係ありません。ただし、検索キーワードは単語で区切られるため、"映画情報" と "映画の情報" は区別される可能性があります。ユーザの検索キーワードを考慮した場合、後者の方が有利かもしれません。


検索結果ページにおけるタイトル
検索結果ページにおけるタイトル
title 要素に設定する文字数

検索結果画面に表示される title 要素の文字数は、最大で全角 34 文字程度になります。そのため、title 要素の文字数は長くても 30 字程度が良いとされています。文字数が長くなると、個々のキーワードの重要度が低くなり、検索結果のページでは後方が省略され表示されなくなるためです。そのため、ページ内容を要約した分かりやすい (検索キーワードとして選ばれやすい) シンプルなキーワードで構成されたタイトルが理想的です。


ただし、ページの内容とタイトルの内容がかけ離れていたり、誇張されていたりするのは適切ではありません。クローラーは、タイトルの内容とページの内容を比べてテーマに沿った内容が書かれているかを評価します。

title 要素の決め方

検索結果画面に title 要素が表示されるため、タイトルはユーザがページに訪れる前に見るものになります。ユーザは、タイトルを見てそのページに何が書かれているのかを想像しながら、あるいは期待しながらページを開きます。そのページに書かれた内容がユーザの期待通りであれば、ユーザに満足感を与えます。逆に、期待はずれの内容が書かれていた場合、ユーザは早々にページを離脱してしまいます。そのため、タイトルに含めるキーワードや文章は、ユーザを意識して決める必要があります。

検索キーワードを含める

検索エンジンは、ユーザが検索するキーワードを含むタイトルのページは、ユーザが望むメインテーマが書かれている可能性が高いと判断します。そのため、"そのページが何について書かれているのか""その中でも特に重要なキーワードは何か""ユーザはページにたどり着くために検索しそうなキーワードは何か" などを考える必要があります。

ページの内容がわかるタイトルにする

タイトルは、ページを要約した一文です。そのため、ページの中身が何について書かれているものかが分かる文章が理想的です。検索結果画面には、タイトルの他にも概要文 (description) が表示されますが、概要文まで読んでくれるユーザは少ないため、概要文よりも理想的なタイトルを付けることに集中しましょう。

クリックしたくなるような数字や言葉を含める

タイトルはクリック率 (CTR) に大きく影響します。検索ユーザは検索画面に表示されたタイトルの一覧から、どのページが自分にとって最良のページかを瞬時に判断します。そのため、ユーザが思わずクリックしたくなるようなタイトルであれば、クリック率が向上します。


SEO のテクニックとしては、タイトルに客観的な数字を入れることで説得力が増す方法があります。例えば、"◯◯を使う 10 の方法" や "3 分でできる◯◯" などです。


また検索ユーザを扇動するようなタイトルもよく使われています。例えば、"今更聞けない◯◯のやり方" や "初心者でも分かる◯◯の設定" などです。


上記の方法は SEO のテクニックとして一定の成果を挙げているのかもしれませんが、個人的には好きになれません。検索ユーザも過剰な宣伝文句が並んだタイトルのページには、有益な情報が含まれていないことを知っています。例えば、アンチパターンとして、"日本初!必ず儲かる◯◯のマル秘テクニックを大公開!今すぐ無料でトライ!" など、情報リテラシーの高い人はまずクリックしないでしょう。

title 要素にサイト名を付与する

title 要素では、サイト名称が付与されている場合があります。Google ですらも title 要素にサイト名称を付与しているため、タイトルの後方にサイト名称を付与する程度の装飾であれば、ペナルティはないものと考えられます。一般的には、キーワードとサイト名称を "-""|" の記号で区切られています。この程度の装飾なら問題はありませんが、記号を使った過剰な装飾は避けるべきです。

title 要素を変更する影響

Google のフォーラムサイトでは、ページが作成されてから一定期間が過ぎた後でページタイトルを変更すると検索順位が大幅に落ちることを示唆するコメントが投稿されています。Google は Web サイトの歴史を観察しており、ページタイトルの変更は過剰な最適化と判断される場合があるとのことです。


タイトルを変更した場合、クローラーの巡回頻度に依存しますが、すぐに検索結果には反映されず 2 ~ 3 日程度かかります。クローラーの巡回頻度が低い Web サイトは 2 ~ 3 週間程度かかる可能性があります。その場合、ウェブマスターツールの Fetch as Google からインデックスの登録リクエストを送れば、1 日程度で反映されます。

description 属性の最適化

meta 要素の description 属性は、タイトルだけでは伝えきれないページの説明文を設定します。検索結果のページでは、タイトルの下に "スニペット" (抜粋文) として表示されます。検索キーワードは、description 属性にも反応し、一致するとスニペットの該当キーワードが太文字で表示されます。これは、ユーザのクリックを促す契機になるため、適切な description 属性はユーザを呼びこむために有効です。


検索結果ページにおけるスニペット
検索結果ページにおけるスニペット


ただし、description 属性に設定した説明文が必ずスニペットとして表示されるわけではありません。検索キーワードが description 属性に含まれていない場合は、Web ページ内の body 要素から抽出されたキーワードがスニペットとして使用されます。


スニペットの表示をコントロールすることは難しく、Google の Matt Cutts は、スニペットの制御に関する質問に回答するビデオを投稿しています。最初のビデオは "スニペットに入る日付やスニペットそのものを変更できるか" という質問に対する回答です。次のビデオは "スニペットに引用されないように重要でない部分を Google に指示できるか" という質問に対する回答です。Matt Cutts は、両方とも "NO" と答えています。


Can I make sure Google always uses my meta description tags for snippets?


Is there a way to mark a section of a page as being less important for snippets?
description 属性の必要性

description 属性は、正しく記述しても上述の通り、検索結果画面には表示されない可能性があります。具体的にスニペットは、ユーザの検索キーワードに対応する description 属性や、コンテンツの一部が表示されます。また、description 属性にコンテンツの要約が正確に記述されていれば、スニペットとして表示されやすくなります。逆に description 属性を記述していない場合は、コンテンツの一部や、alt 属性、それらの周辺のテキストが表示されます。


しかし、だからと言って description 属性を省略しても良いというわけではありません。description 属性はページの概要を表す大切な要素であり、省略しているページと、正しく記述しているページでは後者のページの方が評価されます。ただし、内容が似ているページに対して同じ description 属性を設定するくらいならば、省略した方が良いかもしれません。


検索ユーザの多くはタイトルを見て訪問しますが、スニペットを見て訪問するユーザもいます。ある統計では、ページのタイトルで訪問を判断するユーザは 56.7 % に対して、スニペットで訪問を判断するユーザは 33.6 % でした。つまり、3 人に 1 人はスニペットまで読んでいることになります。そのため、description 属性は省略せずに、正しく記述した方が良いでしょう。

description 属性に設定する文字数

description 属性の役割は説明文、または要約文であるため、title 要素や h1 要素よりも長い文章で書きます。目安の文字数としては、最大で全角 80 ~ 120 文字程度です。また、スマートフォンでは 50 文字程度ですが、機種によって異なります。長過ぎる description 属性は、スニペットにすべて表示されず省略されます。description 属性が極端に長い場合は、検索エンジンからペナルティを受ける可能性もありますので、注意しましょう。

description 属性の決め方

description 属性は、ページの概要文です。検索したユーザが、見てみたいと思える魅力的な文章を考えましょう。ただし、ページの内容と無関係のキーワードを盛り込んだり、誇張したり、記号などを使って見た目の派手さを狙ってはいけません。それらの方法は、検索したユーザを混乱させるだけではなく、最悪ペナルティを受ける可能性があります。

検索キーワードを含める

検索エンジンは、ユーザが検索するキーワードを含むスニペットのページは、ユーザが望むテーマが書かれている可能性が高いと判断します。そのため、"そのページが何について書かれているのか""その中でも特に重要なポイントは何か""ユーザはスニペットに何があれば訪問したくなるか" などを考える必要があります。

ページの内容がわかるスニペットにする

description 属性は、ページのポイントを説明する概要文です。そのため、ページの中身が何について書かれているものかが分かる文章が理想的です。タイトルはページの中身を一言で表しているならば、スニペットはそれを補足するような文章にします。

クリックしたくなるような数字や言葉を含める

description 属性によく設定される文章は、客観的な数字を盛り込んだ文章です。検索ユーザは、スニペットを見て Web サイトに訪問するか決める場合があるため、客観的な数字は説得力があります。例えば、"◯◯を 100 種類集めた画像を掲載しています" などです。

keywords 属性の最適化

meta 要素 の keywords 属性は、検索エンジンに対してキーワードによってページ内容を伝えることが目的の要素です。しかし、Google では keywords 属性は SEO に対して効果がなく、評価対象からも外れています。 そのため、keywords 属性の設定は任意ですが、一般的には "念のために" 付けている Web サイトが多いようです。


Yahoo!JAPAN の検索エンジン (YST:Yahoo Search Technology) は 日本国内で 1 位のシェアを誇っていましたが、Google に移行しました。しかし、移行後も YST 独自のアルゴリズムが一部残っており、keywords 属性は評価対象の 1 つとされています。また、今後、Google のアルゴリズムの変更も考慮して "念のために" 付けておいた方が良いでしょう。


Google がサポートしているメタタグ
Google does not use the keywords meta tag in web ranking
keywords 属性を設定するべきか

keywords 属性は、Google、Yahoo!、Bing の主要な検索エンジンでサポートされていません。また、Google は、ウェブマスター向けのオフィシャルブログで、メタキーワードについて検索順位を決定する要素として利用していないと述べています。



Q: Does this mean that Google will always ignore the keywords meta tag?
(Q: Googleは今後もメタキーワードタグを利用しないか?)

A: It's possible that Google could use this information in the future, but it's unlikely.
Google has ignored the keywords meta tag for years and currently we see no need to change that policy.
(A: 将来的に Google がその情報を使用する可能性はあります。Google は何年もメタキーワードを無視しており、現段階でも方針を変更する必要はないと考えています。)

Google does not use the keywords meta tag in web ranking



主要な検索エンジンがサポートしていないにも関わらず、(たとえ "念のため" であっても) keywords 属性を設定するべきでしょうか。SEO を研究している Web サイトの中には、不用意に keywords 属性を設定すると、競合サイトに何を重要視しているのか把握されてしまうため、書くべきではないとの指摘もあります。


私的な意見ですが、それでも keywords 属性を設定するべきであると考えます。検索エンジンがサポートしていなくても、ページを整理するために役に立ちますし、HTML 5 においても非推奨に指定されておらず、本来の HTML ドキュメント的にも必要な要素であると考えます。また、競合サイトが調査しなくても、Web サイトが何を重要視しているかはコンテンツを見れば分かります。また、keywords 属性を調査されて競合サイトに負けるようであれば、キーワード以前に Web サイトとして何かが不足しているのだと思います。

keywords 属性にキーワードは何個設定するべきか

keywords 属性は、コンテンツの中に登場する重要なキーワードを列挙します。複数のキーワードを指定する場合は , で区切って指定します。ただし、過剰なキーワード設定や、コンテンツとは関係のないキーワードばかり設定しているとペナルティを受ける可能性があるため、目安の設定個数は 2 ~ 5 個程度です。keyword "s" と複数形になっていますが、1 個でも特に問題ありません。また、複数設定した方が有利になるということもありません。


多くの SEO を解説しているサイトでは 5 個が最適であるとされていますが、正確な情報ではありません。SEO の書籍にも 2 個が望ましく、多くても 5 個までとし、6 個以上はペナルティを受ける可能性があると書かれていますが、これも正確な情報ではありません。なぜなら、キーワードの数はページの量やテーマによって異なり、画一的な数は定義できないためです。例えば、明確に 1 つのテーマに絞った量の少ないページである場合、無理にキーワードを設定しても、内容と食い違うキーワードになるでしょう。内容と食い違うキーワードを無理に設定するくらいであれば、キーワードの数はひとつでも問題はないと考えます。

keywords 属性に何のキーワードを設定するべきか

keywords 属性は , で区切ることでキーワードをいくつでも指定できます。そのため、過去には重要なキーワードを過剰に詰め込むブラックハット SEO の手法のひとつとして利用されました。その結果、keywords 属性は検索エンジンからは評価されなくなり、今では keywords 属性自体を設定しないサイトも存在します。


keywords 属性を設定している Web サイトは、ページを "タグ" や "テーマ" でカテゴライズするために keywords 属性を利用しています。本来の使い方としても "ページの重要なキーワード" を設定することは正しい使い方であると言えます。ただし、重要なキーワードであっても過剰に詰め込みすぎるのは、キーワードの重要性が薄れてしまうため良くありません。どうしてもキーワードが多くなりすぎる場合は、1 ページに書くべきテーマが多すぎる可能性が高いため、ページの分割を検討して下さい。


keywords 属性に設定するキーワードは、"タイトルで使われているキーワード""本文中に含まれるキーワード""強い関連用語としてのキーワード" などが適切です。また、抽象的なキーワードよりも、より具体的なキーワードの方が好ましいと考えられます。


また、現在は削除されていますが、検索エンジンの infoseek のガイドラインによると、head 要素が 1,024 Byte を超えると正確に読み込めなくなるとあります。keywords 属性に多くのキーワードを設定すると、どうしても head 要素が大きくなってしまいます。現在の infoseek の処理方式は不明ですが、head 要素が大きくなりすぎることは検索エンジンからすると好ましくない状態なのかもしれません。

noindex の最適化

meta 要素の content 属性には、"noindex" という値を設定できます。noindex が設定されたページは、クローラーに対して対象のページはインデックスしないように通知します。以下は、noindex の設定例です。


<!-- meta 要素の content 属性に noindex を設定する例 -->
<meta name="robots" content="noindex">
 meta 要素の content 属性に noindex を設定する例
noindex の記述位置

一般的に noindex は head 要素内に書かれる meta 要素 content 属性で設定します。しかし、Google の Gary Illyes が Google+ に投稿した内容では body 要素内に書いた場合でも同様に機能すると述べています。有志の方が実験を行った結果、本当に機能したことが証明されました。そのため、コメントが投稿できるブログでは、悪意のあるユーザによって noindex が書き込まれるとインデックスから削除される可能性があります。もしもコメントが投稿できるブログを持っている場合は、そのようなスクリプトインジェクションを回避するために、HTML タグをエスケープ処理が行われているか確認しましょう。

noindex を設定するべきページ

noindex の用途は、Web サイトに低品質なページが多く存在する場合、それらのページに影響されて良質なページの順位まで低下してしまうことを避けるために使われます。低品質なページとは、例えばプログラムにより自動でページを作成している場合などです。それらのページが大量にあると、クローラーはスパムであると判断し、Web サイト全体に対して低い評価、またはペナルティを与えます。そのため、それらのページには noindex の設定を追加し、クローラーに通知する必要があります。


ただし、低品質なコンテンツが Web サイトの一部にしか存在しない場合でも、Web サイト全体の順位に影響すると Google は明言しています。そのため、サイト内検索ページや、ブログの一覧ページなど自動的に作成しているページには noindex の設定を行った方が良いでしょう。また、成果を出していない低品質なページは noindex の設定よりも削除するか、改善するか、別ドメインに移行した方が Web サイト全体の評価を下げないため、思い切った決断も必要になる場合があります。


良質なサイトを作るためのアドバイス
noindex を設定しても残しておくページ

例外として noindex を設定してもユーザのために残しておくページはあります。例えば、Web サイトの全体像をまとめたサイトマップや、カスタマイズされた HTTP 404 エラーページなどです。


Web サイトの全体像をまとめたサイトマップは、コンテンツとしては何も生み出していません。しかし、ユーザに Web サイト構造をわかりやすく伝え、目的のページまで導くためのファインダビリティを提供しています。通常、サイトマップのページはすべてのページに対してリンクが張られるため、スパムと見なされないように noindex を設定しておきます。


ただし、サイトマップはユーザにとって目的のページが見つからない場合の非常手段です。サイトマップに頼らなくても済むように Web サイトの構造がシンプルで、機能的に整備され、ユーザが迷わないデザインを考慮すべきです。


目的のページが移動、または削除されていた場合に表示される HTTP 404 エラーページは、オリジナルのデザインにカスタマイズしている Web サイトも多くあります。HTTP 404 エラーページもコンテンツとしては価値がないため、noindex を設定します。しかし、オリジナルのデザインにカスタマイズされた HTTP 404 エラーページには、目的のページが見つからない場合の代替手段が書かれている場合が多いため、ユーザビリティを損ねないためにも残しておく必要があります。また、HTTP 404 エラー以外の他のエラーページにも原則として noindex を設定するべきです。

noindex と robots.txt

noindex の設定がされていてもインデックスに登録される可能性はあります。noindex は、あくまでもクローラーに通知するだけで、最終的な判断はクローラーが行います。例えば、noindex のページが多くのナチュラルリンクを獲得している場合、インデックスに登録される可能性が高くなります。完全にクローリング対象外とする場合は、"robots.txt" で制御して下さい。


noindex と robots.txt の役割は似て非なるものです。noindex はクローラーに通知するのに対して robots.txt はクローラーを制御します。そのため、robots.txt で指定されたページやディレクトリは、完全にクローリングの対象外とすることができます。詳細は、"SEO 対策" のページを参照して下さい。

インデックスされているページ数を確認する

インデックスされているページ数を確認するには、ウェブマスターツールを利用します。ウェブマスターツールの左にあるメニューの "Google インデックス" から "インデックスステータス" を開くと、インデックスされているページの総数が表示されます。ただし、どのページがインデックスされていて、どのページがインデックスされていないのかは分かりません。


通常、記事数に比例してインデックスされている数も伸びていきます。記事数とインデックスの数が大きく異なる場合は、noindex が誤って設定されている可能性があります。インデックスの数は定期的にチェックすると良いでしょう。

nofollow の最適化

meta 要素の content 属性には、"nofollow" という値を設定できます。nofollow が設定されたページは、クローラーに対して対象のページの外部リンクをたどらないように通知します。meta 要素以外にも、a 要素にも nofollow の設定ができます。meta 要素に設定した場合は、ページ全体の外部リンクに対して有効になります。a 要素に設定した場合は、対象の外部リンクのみ有効になります。以下は、nofollow の設定例です。


<!-- meta 要素と a 要素に nofollow を設定する例 -->
<meta name="robots" content="nofollow">
<a href="example.html" rel="nofollow">example</a>
 meta 要素と a 要素に nofollow を設定する例

また nofollow は、ページの "PageRank" を転送したくない場合に使用します。PageRank とは、ページが持つ評価点 (0 ~ 10 点) のことです。nofollow を設定しない外部リンクは、リンク先のページに評価点を与えます。その評価点を与えたくないケースとしては、信頼出来ないコンテンツにリンクを張る場合などがあります。例えば、ブログでユーザがコメントできる機能がある場合、評価点の高いブログサイトから大量のリンク (コメントスパム) を張ると、リンク先のサイトの評価が不自然に高くなってしまいます。このような不正な評価を避けるために nofollow の設定があります。

nofollow の使い方

外部サイトへのリンクを張る場合、すべてのリンクに nofollow を設定するのは適切ではありません。SEO を解説しているサイトでも、外部サイトへのリンクにはすべて nofollow を設定して PageRank を流出することを防ぐように書かれているページが多く見られます。しかし、nofollow を設定するリンクはそんなに多くありません。具体的に nofollow を設定するリンクは、以下の 3 つに該当する場合に限られます。


  • 信頼出来ないページにリンクする場合
  • 有償で獲得したリンクの場合
  • 重要なページの評価を上げたい場合

上記のケースについては、以下に個別で説明します。

信頼出来ないページにリンクする場合

リンク先のページ内容が不明で、信頼できない場合に nofollow を使うことでリンク先に PageRank を渡さないようにすることができます。例えば、ブログのコメントを投稿できる機能にサイトの URL を入力できるタイプのものがあります。このような投稿フォームのタイプでは、第三者が自分のサイトへのリンクを獲得するためだけに URL を入力します。そして、入力されたリンク先のサイトは低品質なサイトである場合が多く、自動で投稿するツールを使って大量の URL を入力します。このようなコメントスパムの対抗策として、投稿された URL や コメントには nofollow を設定するべきです。

有償で獲得したリンクの場合

Google は PageRank を渡すリンクの売買を禁止しています。売買にはお金だけではなく物品も含まれます。つまり、無償ではないリンクが張られた場合、Google のリンクプログラムに抵触します。無償ではないリンクを獲得した場合、それらのリンクすべてに nofollow を設定しなければ、高確率でペナルティを受けることになります。


リンクプログラム - Search Console ヘルプ
重要なページの評価を上げたい場合

nofollow を指定すると、クローラーはリンク先のページにはクローリングしなくなります。この性質を利用して重要なページの評価を上げる場合は、積極的に nofollow を指定します。例えば、会員制サイトのログイン以降のページや、通販サイトの会計ページなどはクローリングを行う必要がありません。そのようなページが検索結果の上位に表示されても検索ユーザには役に立たないためです。


このようなページに対しては nofollow を適切に設定することで、トップページなどの上位に表示されるべきページに対してクローリング頻度を増やすことができます。クローリングの頻度が増えるとページの情報が正確にインデックスされるため、検索順位が向上する可能性があります。

hn (見出し) 要素の最適化

hn (見出し) 要素は、h1 ~ h6 までの範囲まで設定できます。文章に見出しをつけて文章構造をクローラーや、ユーザにわかりやすく伝えるために使用されます。特に h1 要素は 2 番目のタイトルと呼ばれるほど重要な要素です。


h1 には検索キーワードを含めた文章にすると、検索順位が向上する可能性があります。ただし、検索キーワードを過剰に含める文章は好ましくありません。また、h1 は後続のコンテンツを表し、1 ページ に 1 つだけ設定するのが一般的です。ページのタイトルには h1 要素を使用し、大見出しには h2 要素、中見出しには h3 要素、小見出しには h4 要素を使いましょう。HTML には h6 要素まで用意されていますが、h5 や h6 までを使う極端に深い階層構造になる場合は、構造自体の見直しも検討して下さい。


<!-- hn 要素を使った見出し例 -->
<h1>Google 検索エンジン最適化</h1>

  <h2>SEO 内部対策</h2>
    <h3>title 要素の設定</h3>
    <h3>meta 要素 description 属性の設定</h3>
    <h3>meta 要素 keywords 属性の設定</h3>
    
  <h2>SEO 外部対策</h2>
    <h3>Twitter 連携</h3>
    <h3>Facebook 連携</h3>
    <h3>Google+ 連携</h3>
 hn 要素を使った見出し例

SEO を解説した本や Web サイトには 1 ページに設定する h2 ~ h6 要素の目安が書かれている場合がありますが、特に気にする必要はありません。適切な文章構造であれば、h2 ~ h6 は何度使っても問題ありません。逆に、使用回数を抑えてコンテンツが薄くなったり、不適切な文章構造になるデメリットの方が大きいでしょう。


hn 要素は検索順位に大きな影響を与えるにも関わらず title 要素とは異なり 1 ページ内に何度も使用できます。そのため、ブラックハット SEO として h1 要素の文字を背景と同色にして隠したり、非表示にしたり、画面の表示外に飛ばしたりして検索キーワードを何個も含める手法がありました。これらの手法は、過去には一定の効果がありましたが、現在ではペナルティの対象となるため、絶対に行ってはなりません。

ユーザビリティとしての効果

見出しタグは、ドキュメントの文章構造をユーザに分かりやすく伝える効果があります。h1 ~ h6 でマークアップされた文字列は強調表示になるため、単純な文章を並べたドキュメントより遥かに読みやすくなります。


また、見出しタグを使うことで文章構造を論理的に整理することができます。例えば、h2 のテーマに 2 つのサブテーマを含む場合、h2 の直下に 2 つの h3 を加えることでサブテーマがいくつあるか判別できるようになります。ユーザは、それらのサブテーマを読むべきか、読み飛ばすべきかをテーマ単位で判断することができるため、可読性が向上します。

SEO としての効果

論理的な文章構造は、ユーザビリティを高めるだけでなくクローラーに対しても、コンテンツの内容を正確に伝える効果があります。クローラーは、見出しタグの内容から、メインテーマ、サブテーマを認識し、ページ全体のコンテンツに一致した内容であるかを判断します。また、見出しタグの文字列から重要なキーワードを抽出し、検索キーワードとも比較を行います。


それらの情報からページ全体、メインテーマ、サブテーマが何のコンテンツについて書かれているのかを認識し、ページの品質を測る指標のひとつとします。逆に見出しタグを使用していない場合は、クローラーに正しくコンテンツの内容を伝えることができないため、適切な評価がされない場合があります。

見出しタグを使うときの注意点

見出しタグは SEO に対して重要な意味を持ちます。そのため、見出しタグは昔からブラックハット SEO として悪用される対象となっていました。今でも、見出しタグの重要性は変わっていないため、スパムと見なされないように見出しタグを使う場合は注意が必要です。具体的に注意するべき点は、以下の 3 つです。


  • レイアウト目的で使用しないこと
  • h1 要素は 1 ページに 1 つだけにすること
  • 見出しタグの順番は守ること

上記の注意点については、以下に個別で説明します。

レイアウト目的で使用しない

見出しタグはテキストを装飾するためのタグではありません。ドキュメントの文章構造を表すタグであり、ユーザやクローラーにコンテンツを分かりやすく伝えるためのタグです。フォントサイズを大きくしたり、強調表示をしたい場合は、CSS や strong・em 要素を使うべきです。


もしもテキストを装飾目的で見出しタグを使っている場合、文章構造が破壊され SEO にマイナスの影響を与えます。h1 で装飾している場合は、スパムと判断されペナルティを受ける可能性が高くなります。

h1 要素は 1 ページに 1 つだけにする

h1 要素は SEO に対して重要なシグナルを送ります。そのため、ブラックハット SEO の手法として 1 ページ内に h1 要素をいくつも配置する方法があります。1 ページは 1 テーマが基本となるため、1 ページに 複数の h1 要素が存在しているのは不自然な状態になります。過剰に h1 要素を 1 ページ内に詰め込むとスパムと判断され、ペナルティを受ける可能性があります。


ただし、Google の Matt Cutts は "1 つのページに 1 つ以上の h1 要素を含むのは悪いことか?" という質問に対して以下のように回答しています。

More than one H1 on a page: good or bad?


回答を要約すると "複数の区分を入れるために使うのは問題ない" と述べています。例えば、1 つのページで 3 つのテーマを取り上げる場合、h1 要素を 3 つ使ってページを作成することは問題にならないということです。逆に意味もなく h1 要素が 10 個も 20 個も入っていたら、それは注意するべきということです。


基本的に h1 要素は 1 ページに 1 つだけ設置しましょう。1 ページ内に複数の h1 要素をどうしても設置したい場合は、テーマが複数ある可能性があるため、ページ分割を検討して下さい。

見出しタグの順番は守ること

見出しタグには順番があります。h1 ~ h6 まで定義されていますが、h1 の次は h2、h2 の次は h3 というように順番を守る必要があります。もしも、順番が守られていない場合、クローラーが正しくコンテンツを評価できない可能性があるため、SEO にマイナスの影響を与えます。


これはドキュメントの文章構造を考えるとよく理解できます。メインテーマにサブテーマが複数含まれている場合、見出しタグで分割しますが、h2 の次に h4 が来ることはありません。例えば、メインテーマを h2 を表す場合、サブテーマは必ず h3 になります。サブテーマの中に、更に別の説明すべきテーマが含まれている場合、h4 を使うことになります。


これらのドキュメントの文章構造を整えることは、整理学の階層構造と似ています。例えば、大量の写真をフォルダに分けて保存する場合、大項目・中項目・小項目とカテゴリ別に分けることになります。大項目の次に小項目が来ないように、ドキュメントの文章構造も論理的に分割されていた方が、ユーザにとって読みやすい文章となります。

p 要素の最適化

p 要素は、段落を表すために使用されます。また、p 要素は、一般的にページ内で最も多く使われる要素です。1 つの段落には、1 つのテーマだけをまとめたり、先頭に結論や要約を書くことで、クローラーや、ユーザに情報をわかりやすく伝えられます。


Web サイトの中には p 要素を使わなかったり、p 要素の代わりに br 要素で表示を整えている場合があります。p 要素を使わずにテキストを書いても、ブラウザには表示されます。しかし、本来のマークアップの意味合い的には p 要素で文章を構成し、装飾は CSS で行う方が適切であると言えます。検索エンジンもコンテンツが同じである場合、適切にマークアップされた Web サイトの方をより評価します。


p 要素は段落を表すために、細かく段落分けを行う作業は面倒だと思うかもしれません。実際、1 ページに 1 つの p 要素しか使われていなかったり、画像も p 要素の中に含まれている Web サイトも存在します。しかし、地道に細かく段落分けを行うことで、段落内に含まれるキーワードも評価されるようになります。その結果、そのコンテンツは何を重視して書かれているのか、テーマ内にサブトピックはいくつあるのか、テーマに関連する重要なサブトピックは含まれているかなどが適切に評価されます。

p 要素と br 要素による改行

p 要素と br 要素はどちらもテキストが改行されます。しかし HTML のドキュメントとして、この 2 つの要素の意味はまるで異なるものです。


p 要素は段落を表す Paragraph の略で、br 要素は改行を表す BReak の略です。どちらも結果的にテキストの改行ができますが、p 要素は段落を区切るための改行で、br 要素は明示的な改行を意味します。基本的には br 要素の方が直感的に分かりやすいと思います。p 要素は、行末に設定する改行ではなく、セクションと呼ばれるブロックで理解する必要があります。


p 要素のセクションとは、<p> から </p> までの囲まれた範囲を指します。このセクションは 1 つの段落 (Paragraph) となり単位として扱われます。文章に複数の段落が含まれる場合、各段落の区切りとして改行が設定されることになります。これが p 要素と br 要素の改行の違いになります。

p 要素の書き方

HTML ドキュメントでは、テーマの中に複数のトピックが含まれます。テーマは h1 ~ h6 要素の見出しタグで表されますが、トピックは p 要素で表されます。p 要素で表される段落には、1 つのトピックだけを含めるのが理想的です。複数のトピックを、同じ p 要素に含めてしまうと、可読性が損なわれてしまいます。


可読性を上げるためには結論を段落の先頭に書くことをおすすめします。そうすることによって、読み手はその段落を読むべきか、読み飛ばしても問題ないかを判断できます。逆に、最後に結論を書いてしまうと、読み手は段落を読むべきかの判断が最後までできなくなってしまいます。結論に続く後続の文章は、すべて結論を補記するための文章に過ぎません。また、1 つの段落に複数のトピックを含めてしまうと、読み手が段落ごと読み飛ばした場合、知りたかったトピックを読み飛ばすことになるかもしれません。


テーマを説明するためのトピックに順番がある場合は、それらの順番を守って下さい。順序性を無視してトピックを並べても、読み進めていくうちにユーザは混乱するでしょう。トピックの順序に関しては、一般的に既に知っている情報から、まだ知らない情報へと並べます。重要なトピックだからといって、いきなり事前知識もない状態で先頭の段落に書くのは避けるべきです。

strong・em 要素の最適化

strong 要素、em 要素は、どちらも強調を表します。検索エンジンに評価されたいキーワードを、これらの要素で囲むことにより、重要なキーワードを明示的に伝えることができます。ただし、hn 要素とこれらの要素を組み合わせる過度な強調は、マークアップ的に不自然でありペナルティを受ける可能性があります。

strong 要素と em 要素の違い

strong 要素は em 要素よりも強い強調を表します。CSS で何も指定されていない場合、strong 要素で囲まれた部分は "太字" で表示されます。一方、em 要素は strong よりも弱い強調を表します。CSS で何も指定されていない場合、em 要素で囲まれた部分は "斜体" で表示されます。


<!-- strong 要素は太字で表示されます -->
<strong> strong </strong>

<!-- em 要素は斜体で表示されます -->
<em> em </em>
 strong 要素と em 要素の違い

"太字" や "斜体" のように、フォントのスタイルを変更したくない場合は、以下のように CSS を指定することで打ち消すことができます。スタイルを打ち消しても装飾に関する設定なので、SEO には影響しません。ただし、マークアップ的に強調されている文字と、通常の文字が同じ見た目になることは、ユーザビリティの観点からもおすすめはできません。


<!-- font-weight で太字を打ち消します -->
<strong style="font-weight: normal;"> strong </strong>

<!-- font-style で斜体を打ち消します -->
<em style="font-style: normal;"> em </em>
 strong 要素と em 要素の違い
strong ・em 要素と b・i 要素の違い

テキストに装飾する要素には b 要素、i 要素も存在します。それらの要素は単純にテキストを装飾するだけで、マークアップ的には強調の意味はありません。しかし、強調の意味として使われる場合が非常に多いため、strong 要素や em 要素の強いレベルまではないものの、クローラーによっては重要なキーワードとして認識します。本当に重要なキーワードをマークアップする場合は、それらの要素を避けて strong 要素か em 要素を使うべきです。

strong ・em 要素の使用回数

strong ・em 要素の使用回数に使用制限はありません。しかし、だからといって乱用すればクローラーにスパムと判断されペナルティを受ける可能性もあります。1 ページのテキスト量が多くなれば、strong ・em 要素を使う回数も多くなるため、一概に 1 ページに何個までとは言えません。


また、テキスト量が多いからといって strong ・em 要素を乱用すれば、個々のキーワードの重要性がそれだけ薄くなるため、乱用は避けましょう。SEO を解説している多くのサイトや書籍では、目安として 1 ページに 2 ~ 3 個までとされています。

SEO としての効果

strong ・em 要素を使っていても、必ず検索順位が上がるわけではありません。strong ・em 要素はクローラーに重要なキーワードを正確に伝え、検索キーワードとマッチさせるために使われるものです。結果的に、ある検索キーワードにおいては多少の検索順位に影響を与えるかもしれませんが、それは副次的な効果であり、strong ・em 要素だけの効果ではありません。

figure・figcaption 要素の最適化

figure 要素は図表を表すために使用され、主に img 要素に対して設定されます。figcaption 要素は図表の説明、または題名を表すために使用されます。以下は、img 要素に figure要素、figcaption 要素を付与した例です。


<!-- figure 要素、figcaption 要素を使った例 -->
<figure>
  <img src="example.png" alt="サンプル図の説明">
  <figcaption>サンプル図の説明</figcaption>
</figure>
 figure 要素、figcaption 要素を使った例

ただし、すべての画像に figure・figcaption 要素を設定するのは適切ではありません。文章中に登場する画像には figure・figcaption 要素を設定しますが、装飾系の画像には設定する必要はありません。マークアップ的には figcaption 要素は画像の前後どちらに付けるかは決められていませんが、一般的には画像の後に figcaption 要素を付けます。また、表題については figcaption よりも caption 要素が使われます。以下は、テーブルを SEO に最適化した例となります。


<!-- テーブルを SEO に最適化した例 -->
<table summary="表の概要">
  <caption>表題</caption>
  <tr>
    <th>表の項目</th>
  </tr>
  <tr>
    <td>表の内容</td>
  </tr>
</table>
 テーブルを SEO に最適化した例

テーブルを SEO に最適化するときは、表の概要 (summary 属性) 、表題 (caption 要素)、表の項目 (th 要素) を設定しましょう。これらの要素は省略しても見た目にはテーブルとして表示されるため、最適化されていない場合が多く見受けられます。

alt 属性の最適化

img 要素の alt 属性は、画像が表示されない場合に表示される代替テキストです。画像が認識できないクローラーには、alt 属性を使用してどのような画像であるかを伝えます。


<!-- img 要素に alt 属性を設定した例 -->
<img src="image.png" alt="代替テキスト">
 img 要素に alt 属性を設定した例

そのため、alt 属性はクローラーから見れば、画像と等価のテキストであると言えます。ただし、alt 属性は過去にキーワードを大量に設定するスパム行為が行われていた経緯があり、検索エンジンは指定された文字列を以下のように扱います。


  • alt 属性の文字列は通常のテキストと同様に認識するが、検索順位を上げるために使用しない
  • 画像をリンクとして使用された場合、alt 属性をアンカーテキストと同様に扱う
  • 画像検索のように画像に特化した検索エンジンに、どのような画像であるかを伝える

alt 属性は、クローラーとアクセシビリティの観点から設定することを推奨します。ただし、いくら alt 属性を設定していても Web サイトのナビゲーションとして画像を使ったリンクを多用することは推奨されません。

alt 属性に設定する値

alt 属性には、画像と等価のテキスト情報を記述して下さい。画像と等価のテキストとは、画像単体の説明ではなく、前後の文章と整合性が合う等価なテキストという意味です。具体的には、テキストブラウザで閲覧した場合に意味が通じるものであれば理想的です。


テキストブラウザは、トラフィックがほぼないとしても、Web アクセシビリティを保つためには必要な措置であると思います。なぜなら、ユーザへ提供するアクセシビリティと同等のアクセシビリティをクローラーにも提供することが SEO の基本となるためです。ユーザとクローラーに提供するアクセシビリティは同等であり、どちらか片方に偏ってはいけません。


alt 属性に設定する値のアンチパターン (クローラーに偏ったパターン) として、キーワードを詰め込むブラックハット SEO の手法があります。例えば、以下のコードは、画像を見えないほど小さく、または透過画像を使うことにより、ユーザには画像を見せずクローラーにのみキーワードを伝える手法です。


<!-- alt 属性を使ったブラックハット手法の例 -->
<img src="image.png" alt="キーワード1,キーワード2,・・・" width="1" height="1">
 alt 属性を使ったブラックハット手法の例

このような手法はユーザのアクセシビリティを著しく損なうだけでなく、クローラーにスパムと判断されペナルティを受ける可能性が高くなります。

見出しやリンクに画像を使うケース

見出しタグに設定するテキストや、リンクのアンカーテキストの代わりに画像を使う例は珍しくありません。HTML の文法的には問題ありませんが、SEO として考えた場合、クローラーへ送るシグナルが弱くなる可能性があります。


基本的にクローラーはテキストを好みます。そのため、SEO としての強いシグナルを送る見出しタグなどに画像を使用した場合、代替テキストである alt 属性を読み取ります。しかし、前述の通り alt 属性に書かれた代替テキストは検索順位に影響しないため、シグナルを弱めるかもしれません。


アンカーテキストの場合も同様です。リンクに画像を使うイメージリンクの場合、クローラーはアンカーテキストではなく alt 属性に設定された代替テキストを読み取ります。イメージリンクの alt 属性よりも、通常のアンカーテキストの方が SEO 的には有利であると考えます。また、ユーザがリンク先のページがどのようなページか分からない場合があるため、イメージリンクではユーザビリティを損なう可能性があります。イメージリンクを使う場合は、アンカーテキストも一緒に設置できないかを検討して下さい。

クローラビリティの最適化

クローラビリティとは、検索エンジンのクローラーが Web サイト内への巡回しやすさ (回遊性) を意味します。Web サイトの構造が複雑である場合や、あるページへのリンク切れがある場合は、クローラビリティが低いと言えます。そのような Web サイトは検索エンジンからの評価が低くなる可能性があるため、クローラビリティは SEO において重要な指標となっています。

サイト構造の最適化

サイト構造の最適化とは、サイトを論理的な構造に組み直し、初めて訪れたユーザでも混乱せずスムーズにブラウジングできることを指します。以下は、Web 構造の良い例 (上) と悪い例 (下)です。


Web サイト構造の良い例と悪い例
Web サイト構造の良い例と悪い例

上図の Web サイトの構造において、良い例は構造が論理的であり、どのページにも 2 クリック以内で到達できます。一方で悪い例は、構造に一貫性がなく、Contents B に到達するには 4 クリックも必要になります。このように論理的な構造であれば、ユーザは混乱せずに目的のページまで到達できますが、構造に何かしらの欠陥がある場合はユーザが目的のページまで到達するのは困難になります。


ただし、サイト構造の最適化は、すでに大規模な Web サイトを構築済みであれば実施は困難になります。しかし、クローラビリティと、ユーザビリティの向上のために実施を検討する価値はあります。

URL の正規化

URL の正規化とは、同じコンテンツが複数の URL に存在する場合、1 つの URL にまとめることを指します。クローラーは、それらのページ、または Web サイト全体にネガティブな評価を与えます。コンテンツが重複するケースとしては、www や URL 末尾の / の有無、GET パラメータの有無、経路によって到達するコンテンツは同じでも URL が異なる場合などがあります。URL の正規化は、サイト構造の最適化で検討するべき事項で、基本的にはあるコンテンツに対して 1 つの URL を与えるように設計します。


URL の正規化を行うためには、以下の 4 つの方法があります。

  • Google ウェブマスターツールで使用するドメインを設定する
  • link 要素の rel 属性に canonical を設定する
  • .htaccess を使って 301 リダイレクトを行う
  • .htaccess を使って HTTP ヘッダーに canonical を設定する

Google ウェブマスターツールで使用するドメインを設定するには、下図のように設定アイコンから "サイトの設定" を選択し、使用するドメインを選択して下さい。ただし、www のある URL と www のない URL の両方の所有権を設定していない場合は、警告メッセージが表示されます。


ウェブマスターツールにおける使用するドメインの設定
ウェブマスターツールにおける使用するドメインの設定


link 要素の rel 属に canonical を設定する方法とは、同じコンテンツのページが複数ある場合、オリジナルのページはどのページかを指定する方法です。例えば、同じコンテンツの example1.htmlexample2.html があるとします。オリジナルのページが example2.html である場合、example1.html の head 要素内に以下のように設定することで、オリジナルのページがどのページか示すことができます。


<!-- link 要素の rel 属性に canonical を設定する例 -->
<head>
  <link rel="canonical" href="example2.html">
</head>
 link 要素の rel 属性に canonical を設定する例

.htaccess を使う方法は、.htaccessの書き方 のページを参照して下さい。

サイトマップ

サイトマップ (sitemaps) とは、検索エンジンにクロールしてほしい Web ページの一覧ファイルです。Web サイトの全体像をまとめたコンテンツもサイトマップと呼びますが、本ページでは扱いません。サイトマップ (sitemaps) の作成方法については、サイトマップの作り方 のページを参照して下さい。

robots.txt

robots.txt とは、クローラーを制御するファイルで、自動生成されるページなどの検索結果ページに表示される必要のないページを伝えることができます。以下は、本サイトで設定している robots.txt です。


User-agent: *
Disallow: /cgi-bin/

Sitemap:https://murashun.jp/sitemap.xml.gz
 murashun.jp の robots.txt

クローラーは Web サイトを巡回するとき、すべてのページを見ているわけではありません。ドメイン毎にクロールするページ数が決められており、これを "クロールバジェット" と呼びます。robots.txt を適切に設定することで、クロールバジェットが効率化され、重要なページにクロールするリソースが割り振られ、Web サイト全体としての SEO が改善されます。


Google は、検索ユーザにとってあまり価値のない自動生成されたページをクロールしないようにしています。Google は、自動生成されたページを以下のように定義しています。このようなページは、robots.txt でブロックしましょう。


自動的に生成されたコンテンツ - Search Console ヘルプ

robots.txt の作り方はプレーンテキストで作成します。ファイル名は "robots.txt" で作成し、完成したらルートドメインに配置します。ファイル名が誤っていたり、ルートドメイン以外の場所においてもクローラーが認識しないため、無効になります。


robots.txt の書き方は、ディレクティブと値を記述します。ディレクティブと値の間には : を入れて区切ります。コメントを付ける場合は、先頭に "#" を付けると、その行がコメントアウトされます。以下は robots.txt の構文です。


# robots.txt の構文
directive: value
 robots.txt の構文

ディレクティブとして設定できるのは、User-agent, Disallow, Crawl-delay, Allow, Sitemap の 5 つです。それぞれのディレクティブで設定できる値は、以下に示します。


robots.txt のディレクティブ一覧
ディレクティブ必須/任意説明
User-agent必須動き方を制御するクローラーの種類を指定できます。すべてのクローラーを指定する場合は * で指定します。クローラーの動き方は、後続の Disallow, Crawl-delay, Allow で設定します。User-agent とそのすぐ後ろに続く Disallow, Crawl-delay, Allow のペアがエントリとして見なされます。エントリは、複数指定することが可能です。
Disallow必須クローリングを許可しないファイル、またはファイルパスを相対パスで指定します。ディレクティブの指定は必須ですが、設定値を省略することが可能です。また、ファイル、またはファイルパスには "*""$" のみ正規表現が使用可能です。
Crawl-delay任意同一サーバに対してリクエストを行う、待機時間を秒で指定できます。主要なクローラは、このディレクティブをサポートしていますが、一部のクローラーはサポートしていません。
Allow任意クローリングを許可するファイル、またはファイルパスを相対パスで指定します。ファイル、またはファイルパスには "*""$" のみ正規表現が使用可能です。このディレクティブは、Disallow ディレクティブと組み合わせて使用されます。例えば、ディレクトリ全体は許可しませんが、その中の一部のファイルだけは許可するなどです。標準的な実装では先に書かれているディレクティブが評価されます。ただし、Google は Allow ディレクティブを先に評価し、その後 Disallow ディレクティブを評価します。また、Bing は AllowDisallow も、最も具体的なパターンを優先して評価します。
Sitemap任意サイトマップのパスを絶対パス (URL) で指定します。
robots.txt のディレクティブの設定値一覧
ディレクティブ説明
User-agent*すべてのクローラーを指定します。
(crawler-name)クローラーの名前を指定します。以下が一例です。
  • Googlebot: Google 検索
  • Googlebot-Image: Google 画像検索
  • Googlebot-Video: Google 動画検索
  • Googlebot-Mobile: Google モバイル検索
  • bingbot: Bing 検索
Disallow(none)値を設定しません。値を設定しない場合、すべてのファイルに対してクローリングを許可します。
----
User-agent: *
Disallow: 
(file-name)ファイル名を相対パスで指定します。指定したファイル名は、クローリングを許可しません。複数のファイルを指定する場合は、ディレクティブを含めて指定します。
----
User-agent: *
Disallow: /example1.html
Disallow: /example2.html
Disallow: /img/*.png$
(directory-name)ディレクトリ名を相対パスで指定します。指定したディレクトリ配下のファイルは、すべてクローリングを許可しません。複数のディレクトリを指定する場合は、ディレクティブを含めて指定します。/ を指定した場合、すべてのファイルがクローリングされません。
----
User-agent: *
Disallow: /
Crawl-delay(second)同一サーバに対してリクエストを行う、待機時間を秒で指定します。
----
User-agent: *
Crawl-delay: 10
Allow(file-name)ファイル名を相対パスで指定します。指定したファイル名は、クローリングを許可します。複数のファイルを指定する場合は、ディレクティブを含めて指定します。
----
User-agent: *
Disallow: /img/
Allow:    /img/*.png$
(directory-name)ディレクトリ名を相対パスで指定します。指定したディレクトリ配下のファイルは、すべてクローリングを許可します。複数のディレクトリを指定する場合は、ディレクティブを含めて指定します。
----
User-agent: *
Disallow: /test/
Allow:    /test/public/
Sitemap(URL)サイトマップのパスを絶対パス (URL) で指定します。
----
User-agent: *
Sitemap:https://murashun.jp/sitemap.xml

アンカーテキスト

アンカーテキストとは、a 要素によってリンクを設定したテキストのことを指します。アンカーテキストに設定する文言は、SEO にとって重要なシグナルとなります。アンカーテキストは、ユーザとクローラーにリンク先の情報を伝えるために使用されます。リンクは、内部リンクの可能性もありますし、外部リンクの可能性もあります。より具体的で適切なアンカーテキストは、ユーザビリティの向上にも繋がり、クローラーからも高い評価を受けます。


アンカーテキストの失敗例では、"このページ" や "ここをクリック" などがあります。前後の文意から、リンク先のコンテンツが何かを推測できるかもしれませんが、SEO としては適切ではありません。逆に、キーワードを過剰に設定した冗長なアンカーテキストも好ましくありません。また、ユーザには通常の文章と、アンカーテキストが簡単に区別できるようにしましょう。CSS などの装飾により、アンカーテキストを見落とすことや、誤ってクリックしてしまうことがないように、青文字や下線などの一般的な装飾が無難です。

パンくずリスト

パンくずリストとは、ユーザが Web サイトのどの位置にいるのかを視覚的に分かりやすくしたものです。"パンくず" の名前の由来は、童話「ヘンゼルとグレーテル」で、森の中で帰り道が分かるようにパンくずを落としながら歩いたエピソードから来ています。大規模な Web サイトでは階層が深くなる場合があるため、パンくずリストはユーザの利便性を高めてくれます。


パンくずリストは、ナビゲーションの役割の他に、SEO でも重要な役割を果たします。パンくずリストは、クローラーの巡回効率が改善されるため、SEO にポジティブな影響を与えます。具体的には、内部リンクの数から Web サイトの管理人はどのページを重要と考えているのか、その Web サイトはどのような構造になっているのかなどを情報をクローラーに伝えることができます。


パンくずリストは、サイト構造を最適化する際にある程度決まっていきます。そのため、すでに大規模な Web サイトに対して、パンくずリストの最適化を行うことは非常に困難になります。


パンくずリストは、"ホーム" > "大分類" > "中分類" > "記事のタイトル名" のような形になります。これは、分類学上の問題になりますが、同じ性質を持つ記事 (例えば、情報技術に関する記事など) は、ある程度まとめてカテゴライズしなければ、論理的に破綻してしまいます。どのような記事を書くかを考える前に、Web サイト全体としてどのようなコンテンツを取り扱うのかを考えてみる価値はあります。


パンくずリストは、構造化データを埋め込むことで、検索結果のページにおいてパンくずリストが表示されるようになります。


検索結果ページにおけるパンくずリスト
検索結果ページにおけるパンくずリスト


構造化データのマークアップ方法は、"microdata" または "JSON-LD" が一般的な方法で Google も推奨しています。構造化データのマークアップ方法は、Google のページをご確認下さい。


Breadcrumbs  | Structured Data  | Google Developers

ナビゲーションメニュー

ナビゲーションメニューとは、一般的に Web サイトの上部に設定されるメニューのことを指します。すべてのページからアクセスが可能であるため、"グローバルナビゲーション" とも呼ばれます。ナビゲーションメニューは、サイト内にどのようなコンテンツがあるのかを把握するのに役立ちます。


ナビゲーションメニューと SEO の関係は、Google の検索エンジン最適化スターターガイドによれば、クローラーがその Web サイトはどのようなコンテンツを扱い、ページがどのような役割を果たしているのかを理解されるために使用されます。そのため、ナビゲーションメニューとしてリンクするページ、およびアンカーテキストは特別な意味を持つため、慎重に選定しましょう。ただし、キーワードの詰め込み過ぎは、ユーザからは分かりにくいメニューになり、ペナルティを受ける可能性があります。また、画像を使ったナビゲーションメニューは、クローラーがリンク先を理解しにくくなるため、SEO としては効果的ではありません。


ナビゲーションメニューを作成する場合、ul 要素を使用するのが論理的に正しい HTML 構造です。その他の要素でも作成は可能ですが、クローラーに正しく情報を伝えるために、論理的に正しい HTML を使用するべきです。また、HTML 5 からは header 要素や nav 要素が追加されているため、それらを使用することを推奨します。


<!-- ナビゲーションメニューの例 -->
<header>
  <nav>
    <ul>
      <li><a href="menu1.html">menu1</a></li>
      <li><a href="menu2.html">menu2</a></li>
      <li><a href="menu3.html">menu3</a></li>
    </ul>
  </nav>
</header>
 ナビゲーションメニューの例

また、ナビゲーションメニューの数が多すぎる場合は、ユーザビリティを低下させるため、取捨選択するか、カテゴライズするなどの工夫を行って下さい。ナビゲーションメニューの数は多くても 7 つ程度にしましょう。これは、マジカルナンバー 7 (個人差により ± 2) と呼ばれる心理学用語で、意味を持つ集合 (チャンク) を短期的に覚えられるのは 7 つ前後であるという意味です。Amazon などは多くのメニューを持つため、カテゴライズすることによってユーザビリティの低下をある程度防いでいます。


Amazon の商品カテゴライズの例
Amazon の商品カテゴライズの例

ページネーション

ページネーションとは、コンテンツを複数のページに分割した際の "ページ送り" を意味します。例えば、情報量が多いコンテンツを複数のページに分割したときに、1 ページ目、2ページ目 ... と、ページネーションが使われます。情報量の多いコンテンツを複数のページに分割するため、それぞれのページ内容は異なります。そのため、同一のコンテンツが複数のページに分割される "canonical" とは明確に区別されます。ただし、分割したコンテンツが 1 ページにすべて書かれている "View-All ページ" と呼ばれるページが存在する場合、分割したページに "canonical" を設定する方法は正しい使い方になります。


ページネーションの設定方法は、link 要素で指定します。例えば、あるコンテンツが example1.html, example2.html, example3.html の 3 ページに分割されている場合、各ページには以下のように設定します。


<!-- example1.htmlの設定例 -->
<link rel="next" href="example2.html">

<!-- example2.htmlの設定例 -->
<link rel="prev" href="example1.html">
<link rel="next" href="example3.html">

<!-- example3.htmlの設定例 -->
<link rel="prev" href="example3.html">
 ナビゲーションメニューの例

上記の例では、example1.html の次のページが example2.html を表しています。同様に、example2.html は前後のページを設定し、example3.html では前のページのみ表しています。


ページネーションの設定は、任意の設定であり、必須ではありません。クローラーは、ページネーションがなくても分割された複数のコンテンツの類似性を理解し、検索ユーザに最適なページ、または View-All ページを返します。ただし、クローラーの判断は完璧ではないため、明示的にページネーションを設定し、クローラーにヒントを与えます。最終的な判断はクローラーになりますが、ページネーションを設定することで、精度が向上します。

SEO 外部対策

SEO 外部対策とは、価値のあるコンテンツをまだ知らない人に知ってもらう活動や行動のことを指します。SEO 外部対策としては、ソーシャルメディアを活用する方法が一般的です。しかし、その他にも以下のような SEO 外部対策があります。

  • ページの検索順位を確認し、競合サイトからの外部リンクを得る
  • 他の記事やブログにコメントを残し、広く関係性を築く
  • Q&A のフォーラムで質問に答え、そこから外部リンクを得る
  • ニュースレターや、メールマガジンを発行する
  • はてなブックマーク、Gunosy などのキュレーションサイト、またはサービスに掲載される
  • Slideshare に役に立つコンテンツをまとめたスライドを投稿する
  • スポンサーになれるイベントを見つける
  • 人気ブロガーや、大手サイトの記事を分析し、どのようなキーワードを使用しているのか調査する
  • SNS のプロフィールを作成する
  • インフルエンサー (発言力や影響力の強い人物) のサイトに寄稿する
  • 公共系の Web サイトに掲載される
  • 同じコンテンツを扱う Web サイトのコミュニティに参加する
  • 支援できる Web サイトにボランティアを行う

SEO 外部対策の本質は、価値のあるコンテンツをどのようにしてユーザに知ってもらい、いかにして Web サイトを有名にし、多くのナチュラルリンクを得るかの "ブランディング活動" になります。ただし、良質なコンテンツがベースになるため、コンテンツを無視して外部対策を行っても意味がありません。上述した SEO の 3 つの中では、外部対策は最も優先度が低い対策になります。そのため、外部対策に時間をかけるなら、コンテンツデザイン、または内部対策に集中するべきです。

ナチュラルリンクの獲得

ナチュラルリンクとは、"自然に" 張られた自身の Web サイトに対する外部リンク (バックリンク) のことを指しします。プログラムなどを使用して "機械的に" 張られたリンクは、不自然なリンク (アンナチュラルリンク) と呼びます。


ナチュラルリンクは、アンカーテキストペナルティ (不自然なリンクによるペナルティ) を受けず、検索エンジンからの評価を高めます。そのため、大量のナチュラルリンクを獲得することは、SEO に対して高い効果があります。


ナチュラルリンクを獲得する基本は、良質なコンテンツが広く認知されることです。良質のコンテンツは多くのユーザに満足感を与えるため、SNS などで拡散されやすく、その結果多くのナチュラルリンクを獲得できます。

アンカーテキストペナルティ

アンカーテキストペナルティは、不自然なリンクを大量に得ていることに対するペナルティです。Google がペンギンアップデートを実施する以前は、プログラムによる大量の外部リンクを得ることで、一定の成果を得ていました。しかし、Google がペンギンアップデートを実施後は、そのような不正に外部リンクを得ていた Web サイトは大きく検索順位を落とすことになりました。


もしも、不正な外部リンクを大量に得てしまっている Web サイトの SEO を実施する場合は、削除できない外部リンクが多くあるため非常に困難になります。その場合、新規の Web サイトを構築することも検討して下さい。


アンカーテキストペナルティは、簡単に引き起こすことが可能です。しかし、アンカーテキストペナルティを逆用して、評価の低い Web サイトから評価の高い Web サイトに大量のリンクを張り、評価を落とす攻撃は実現しません。論理的に攻撃することは可能でも、評価の高い Web サイトには既に多くのナチュラルリンクを獲得しています。そのため、評価の低い外部リンクはマイナスに作用せず、無効と判断される可能性が高いため、攻撃は失敗に終わると考えられます。また、ウェブマスターツールを使えば大量の外部リンクはどこから張られているか調べることができるため、"リンクの否認" ツールによりバックリンクを否認することができます。


Google のバックリンク否認ツール
Google のバックリンク否認ツール


リンクの否認 - Search Console

ソーシャルメディア連携

記事を更新したことをツイッターでつぶやいたり、Facebookに投稿するユーザは少なくありません。しかし、ソーシャルメディアでコンテンツの共有がされても URL には nofollow が設定されているため、ナチュラルリンクは獲得できません。


ナチュラルリンクの獲得はできませんが、多くのリツイートや、"いいね!" が付いたコンテンツは、検索エンジンに評価されます。ただし、Google はリンクの "数" はもちろん、"質" まで理解するため、スパムやボットなどからのリンクは評価されません。また、ソーシャルメディアから得られる評価は、ナチュラルリンクほど強くありません。


リンクの質を理解するために、Google は URL 付きのツイートや、投稿をしたユーザのオーソリティを考慮します。オーソリティとは、ソーシャルメディア上の行動がスパムやボットではないか、多くのフォロワー・友達を集めているか、有益なツイート・投稿をしているか、ソーシャルメディアを開始してから十分な日数が経過しているかなど、"発言力" や "影響力" があるかを意味します。オーソリティを持つユーザからの URL 付きツイート・投稿は、オーソリティを持たないユーザのツイート・投稿よりも評価が高くなります。


ここで注意しなければならないのは、過去に大量の外部リンクを得るために行った行為をソーシャルメディア上で繰り返さないことです。例えば、相互的なフォローによって大量のフォロワーを獲得し、オーソリティを持つ行為などです。そのような試みは、Google に見抜かれスパム扱いされる可能性があります。


SEO におけるソーシャルメディア連携とは、フォロワーや友達の多い人の機嫌を取るということではありません。ユーザが思わず共有したくなるような、価値のあるコンテンツを作成することです。そうすれば、自然とフォロワーや友達が増え、リツイートや "いいね!" が多くなり、ソーシャルメディアからの評価を得られるはずです。

Google のアップデート

Google は様々なアップデートを日々繰り返しています。その中でも有名なアップデートは、"パンダアップデート""ペンギンアップデート" です。 白黒はっきりさせることを目的としているため、このような名称になったそうです。ここで言う白や黒とは、後述するホワイトハット SEO やブラックハット SEO のことを指します。

パンダアップデート

パンダアップデートとは、低品質なWebサイトの掲載順位を低下させるアップデートです。例えば、検索するキーワードとページタイトルがどれほど一致していても、ページの内容が薄かったり、情報の信頼性に欠けたり、掲載順位だけを考えたページであったりする場合、ユーザはそれらのページに価値があるとは思いません。Google は、そのような低品質なWebサイトが検索結果の上位に表示されないように、以下の観点で評価しています。


  1. その記事の情報は、信頼できるか?
  2. その記事は、専門家、または熟知している人物によって書かれたものか?
  3. 同一、または類似するトピックについて、記事が複製、または重複していないか?
  4. クレジットカード情報を安心して提供できるサイトか?
  5. その記事に、誤字・脱字、または事実と異なる説明はないか?
  6. その記事は、ユーザの関心のある情報が提供されているか?
    それとも検索エンジンの掲載順位を考慮したものか?
  7. その記事は、独創的なコンテンツや情報、独自の調査や分析を行ったものか?
  8. そのページは、検索結果に表示される他のページと比較して、十分な価値を持っているか?
  9. コンテンツの品質管理はなされているか?
  10. その記事は、物事を一面的な視点から書かれていないか?
  11. そのサイトは、そのトピックに関する第一人者として知られているか?
  12. そのコンテンツは、多数のクリエイターに委託して大量生産されたものか?
    または大規模なネットワークを通じて広められたものではないか?
    その結果、個別のサイトやページに注意が払われていないということはないか?
  13. その記事は、急いで書かれたものでなく、丁寧に編集、推敲されているか?
  14. 健康に関する検索において、そのサイトにある情報を信頼できるか?
  15. そのサイト名を聞いたとき、情報源として信頼できるか?
  16. その記事は、トピック全体を網羅的に情報を提供しているか?
  17. その記事は、事実の列挙だけではなく、優れた洞察や分析が行われ、興味をひく情報が含まれているか?
  18. その記事は、お気に入りに登録したり、共有したくなるようなページか?
  19. その記事の中には、広告が多く含まれていてコンテンツを妨げたりしていないか?
  20. その記事は、雑誌、百科事典、書籍として出版されることを期待するか?
  21. その記事は、短くて内容が薄く、具体性に欠けていないか?
  22. ページの細部にわたり、注意を払って作られているか?
  23. このサイトの各ページを見て、ユーザが満足できるか?

Official Google Webmaster Central Blog: More guidance on building high-quality sites

ペンギンアップデート

ペンギンアップデートとは、不自然に大量のバックリンクがある Web サイトの掲載順位を低下させるアップデートです。Google は、バックリンクをユーザの支持投票と解釈し、バックリンクが多いほど価値があるWebサイトと判断しています。しかし、バックリンクを不正に獲得する以下の行為により検索順位を操作している Web サイトは Google のガイドラインに違反しており、ペナルティを受ける可能性があります。


  1. リンクを得るために金銭、商品、サービスなどをやりとりする
  2. 過剰な相互リンク、または相互リンクを目的としたページを作成する
  3. 大規模なサイトに過剰なキーワードを埋め込んだリンクを投稿する
  4. 自動化されたプログラムやサービスを使用してリンクを作成する
  5. 低品質なディレクトリやブックマークサイトからのリンクを獲得する
  6. ブログパーツのような埋込み型アプリケーションにリンクやキーワードを隠す
  7. CMSのように様々なサイトのフッターにリンクを埋め込む
  8. フォーラムのコメントにおいて、投稿文や署名に作為的なリンクを含める

リンクプログラム - ウェブマスターツール ヘルプ

フリッツアップデート

フリッツアップデートは、2003 年の夏に導入されたインデックス化技術のアップデートです。Google は、世界中の Web ページをデータベースに登録してインデックス化を行うのに 30 ~ 60 日程度の周期で更新 (フルインデックス) を行っていました。そのため、公開したページが検索可能になるには、およそ 1 ヶ月後になっていました。


フリッツアップデートは、インデックス化の更新方法を新しくし、公開されたばかりのページでも検索結果に反映できるようにしました。具体的にはフルインデックスを残しつつ、前回との差分をインデックスに追加する "Incremental Index" を導入し、更新頻度を 1 ヶ月から毎日に変更されました。


フリッツアップデートのおかげで、1 ヶ月に 1 度起きる大幅な順位変動 (Google ダンス) の現象が改善されました。その後、ビッグダディアップデートや、カフェインアップデートにより検索インフラストラクチャは更に高速化されます。

ビッグダディアップデート

ビッグダディアップデートとは、Google の検索インフラストラクチャにおけるアップデートです。将来的に様々な新機能を搭載するための基盤アップデートという位置付けになります。


ビッグダディアップデートにより、nofollow や canonical の設定が有効化されたり、新しいリダイレクト処理、重複コンテンツの判定、リンクの信頼性評価、ユニバーサル検索など様々なアルゴリズムが投入されることになります。


ビッグダディアップデートは 2005 年 12 月に公開され、運用が開始されました。その後、カフェインアップデートにより検索インフラストラクチャは更に高速化されます。

カフェインアップデート

カフェインアップデートとは、クローラーとインデクサのアップデートです。カフェインアップデートの背景には、映像や画像などのテキストと比較してサイズの大きいコンテンツ分野の成長、ニュースなどのリアルタイム性を求められるニーズがあったためです。アップデートにより、最新の記事がより速くインデックスされるようになり、記事が更新されてから検索結果に表示されるまでのタイムロスが改善されました。下記の記事によると、従来に比べて 50 % の改善がされたそうです。また、カフェインアップデートは、検索アルゴリズムのアップデートではないため、検索順位に影響を与えません。


Official Google Blog: Our new search index: Caffeine

カフェインアップデートは、2009 年 8 月に公表され、プレビュー版がテスト公開され、同年 11 月に公開は終了しました。そして、2010 年 6 月に新しいインデックス技術の "Caffeine" が完成したことが発表されました。検索インデックスを分割し、絶えず更新することにより新しい情報をよりすばやくインデックスに追加できるようになったとされています。


"Caffeine" より以前のインデックスシステムは "BigDaddy" のコードネームで呼ばれます。

フロリダ、オースティン、ブランデーアップデート

フロリダ、オースティン、ブランデーアップデートは、検索アルゴリズムの大幅なアップデートです。フロリダアップデートは 2003 年 11 月、オースティンアップデートは 2004 年 1 月、ブランデーアップデートは 2004 年 2 月に行われました。


当時、Google の検索順位は PageRank アルゴリズムを採用していることが広く知られており、それを逆手に取ったブラックハット SEO が実施されていました。このような Web スパムに対抗するためにフロリダアップデートを導入しました。その後、バグフィックスと新機能を追加したオースティンアップデートを導入し、さらにバグフィックスを重ねたブランデーアップデートを導入しました。


これらのアップデートでは、Hilltop アルゴリズムが導入されました。Hilltop は、検索キーワードに依存して専門性、権威性の高い Web サイトを選び出すアルゴリズム (Query Dependent Algorithm) です。一方、PageRank は、検索キーワードに依存せず要性の高い Web サイトを選び出すアルゴリズム(Query Independent Algorithm) です。検索キーワードと関連性が高い専門的なドキュメントを 2 つ以上発見し、そのドキュメントが相互参照する Web サイトを特定することで権威性を評価します。Hilltop により、検索結果に関連性の高い Web サイトが表示されるよう大幅に改良されました。


また、Hilltop は、当時横行していたリンクファームを完全に排除することも試みられました。IPアドレス、地域、リンクグラフの近接度などを分析し、利害関係があるリンクネットワークの評価を下げる工夫が施されました。


これらのアップデートでは、その他にも検索キーワードの類義語や同義語を判断して、検索結果に表示するように改善しました。しかし、これらのアップデートを導入した期間が短かったために、英語圏を中心に大きな混乱を与えました。

ハミングバードアップデート

ハミングバードアップデートとは、従来の検索キーワードで "辞書を引く" 形から "人と会話をする" 形にシフトしたアップデートです。例えば、"新宿 グルメ" と検索した場合、単純に新宿のグルメ情報が掲載された Web サイトだけではなく、ユーザが近くの飲食店を探している意図を読み取り、位置情報と Google マップが連動して、近場にある評価の高いお店を紹介する機能が実現されています。また、複雑な検索キーワードに対しても、キーワードの背景や文脈を理解して、関連性の高い Web サイトを提示できるようになりました。これは、検索キーワードが質問であるならば、検索結果は答えを表示する検索エンジンに近付いたことになります。


ハミングバードアップデートによる SEO の影響はほぼありません。ただし、キーワードの個数を調整して検索順位を不正に操作しようとしている Web サイトは検索順位を落とすことになるため、良質なコンテンツを用意している Web サイトは検索順位が上がる可能性があります。

デューイアップデート

デューイアップデートとは、英語圏でのみ影響のある検索アルゴリズムのアップデートと言われています。英語圏の Web サイトでは大幅な順位変動はあったものの、日本語圏の Web サイトには影響はありません。


デューイアップデートにより Google の Matt Cutts はウェブマスター向けのコミュニティを使って、フィードバックを行っています。その結果を検索結果の品質改善のために役立てていたという情報がありますが、詳細が明らかにされていないため不明です。一部では、新しいドメインの検索順位が上がったという報告や、曖昧な検索キーワードに対する検索結果が変化したという報告がされています。

ヴィンスアップデート

ヴィンスアップデートとは、"ブランド" が強い Web サイトの検索順位を上げる検索アルゴリズムのアップデートです。ブランドを測る指標として、信頼性、評判性、権威性、ページランクなどが考慮されます。そのため、今まで知られていなかった Web サイトでも、検索結果の上位に表示される可能性があります。ヴィンスアップデートは、一部の検索キーワードに対して適用されるため、ロングテールキーワードには影響しません。

メーデーアップデート

メーデーアップデートとは、より高いクオリティを持つ Web サイトが、ロングテールキーワードで検索結果の上位に表示されるようになったアップデートです。

スクレイパーアップデート

スクレイパーアップデートとは、スクレイピングコンテンツ (コピーコンテンツ) を排除するアップデートです。スクレイピングコンテンツとは、オリジナルのコンテンツを持たず、他の Web サイトからコンテンツをコピーして集めているサイトのことです。

ファーマーアップデート

ファーマーアップデートとは、コンテンツファーム (スパムまでではないが、品質の低いサイト) を検索結果から表示させないようにするアップデートです。ただし、品質の指標値を測るアルゴリズムは非公開であり、過去には品質の高い Web サイトも誤判定により検索順位を大きく落とした事例もあります。


実施された当時は Google.com だけであったため、日本に影響はありませんでした。しかし、現在ではパンダアップデートと名前が変更され日本にもアップデートが適用されています。

EMD (Exact Match Domain) アップデート

EMDアップデートとは、"検索キーワードと完全一致するドメイン名" を対象に、低品質と判断したサイトに対して "ランキングを低下" させる Google のアルゴリズムアップデートです。ただし、EMD アップデートの影響を受けるのは低品質な Web サイトのみであり、高品質な Web サイトは影響を受けません。


"検索キーワードと完全一致するドメイン名" は SEO 的に有利と考えられているため、人気が高くなります。Google が Web サイトを評価する指標として、検索キーワードとドメインの関連性を判断している可能性が高いため、EMD を利用している Web サイトが Google のランキングの上位に比較的多く表示されています。しかし、EMD を利用しているというだけで低品質の Web サイトまで上位表示されていることが、問題として指摘されていました。そのため、EMD アップデートにより、EMD を利用した Web サイトであっても低品質であれば、上位表示されないようになりました。

ファントムアップデート

ファントムアップデートとは、"Google は認めていないが、何かが起こっている" アップデートです。同一キーワード検索による順位変動は日々起こっていますが、大幅な順位変動があった場合は、Google からは何かしらの告知があります。しかし、告知がなく大幅な順位変動が起こった場合、Google が何かをテストしているかは不明ですが、それらをファントムアップデートと呼びます。


また、"アップデート" とは大幅な修正を意味しますが、Google は年間にいくつもの細かい修正を行っています。それらの修正は、バグフィックスであったり、評価方法の細かな変更であったりするため、告知されることはありません。しかし、その細かい修正によって、順位が大幅に変動することがあります。修正内容を知ることや、事前に検知することはできませんが、定期的に Google の順位変動を見張っている Web サイトもあります。

ホワイトハットSEO と ブラックハットSEO

SEOには様々な手法がありますが、ホワイトハットSEOとブラックハットSEOに大別できます。検索エンジンが推奨する手法はホワイトハットSEOと呼び、逆に検索エンジンのアルゴリズムを悪用するような手法をブラックハットSEOと呼びます。


たまに "SEOは小手先のテクニックだから好きになれない" という意見を見かけます。恐らく、それらの意見はブラックハットSEOを指していると思われますが、ホワイトハットSEOは積極的に取り入れていくべき手法です。2つのSEOを区別なく嫌っている場合は、ホワイトハットSEOについて検討してみることが良いかと思います。

ホワイトハット SEO

ホワイトハット SEO とは、"検索エンジン最適化スターターガイド" や "ウェブマスター向けガイドライン (品質に関するガイドライン)" に詳しく述べられているように、ユーザが本当に求める情報は何かを考え、良質なコンテンツを提供し、検索エンジンと相性の良いページに最適化することです。ホワイトハット SEO の詳細は、コンテンツ SEO、SEO 内部対策、SEO 外部対策を参照して下さい。


Google検索エンジン最適化スターターガイド [PDF]
ウェブマスター向けガイドライン - ウェブマスターツール ヘルプ

ブラックハット SEO

ブラックハット SEO の手法は、ページ品質を無視して、Webサイトの掲載順位を上げることに特化した手法のことです。例えば、Webページを巡回するクローラにユーザが閲覧するページとは別のページを閲覧させる "クローキング" や、プログラムによりキーワードを含む文章を自動的に生成する "ワードサラダ" などがあります。このような悪意のある手法はスパム行為と判断され、掲載順位の著しい低下、または検索結果に表示されなくなるペナルティを受けます。


このようなブラックハット SEO の手法は、アルゴリズムがアップデートされるまでは一定の成果を上げていた時期もありました。しかし、現在ではパンダアップデート、ペンギンアップデートにより、スパム行為を検知する精度が向上したことで、ブラックハットSEOは費用対効果が見込めなくなりつつあります。


何よりブラックハット SEO は、ユーザにとって百害あって一利なしであるため、絶対に行うべきではありません。

ワードサラダ

ワードサラダとは、プログラムによって自動生成された文章で構成された Web ページのことを指します。ワードサラダによる文章は、文法的には正しくても、人間が読むと意味が通じない特徴があります。ワードサラダは、ブログや迷惑メールに多く見られます。


ワードサラダは、検索エンジンやメールのスパムフィルタを回避して、検索ユーザを特定の Web サイトに誘導することを目的としています。誘導先の Web サイトは、アドセンスやアフェリエイトの収益に特化したサイトや、アダルトサイト、違法サイト、ウィルスが仕込まれたサイト (SEO ポイズニング) などがあります。


ワードサラダは、ニュースサイトや RSS などの文章をもとに、形態素解析・構文解析を使用して自動生成されます。また、一部では記事の前半だけにワードサラダを使用し、後半は第三者の記事をコピーするものもあります。検索エンジンは、文章の意味情報を完全に理解することができないため、自然な文章とワードサラダを簡単には区別できません。しかし、現在ではそのようなワードサラダを使った Web サイトは Google のインデックスからも削除されており、検索結果には表示されなくなっています。


Google は、オリジナルのコンテンツが存在しないページは、ドメインに対して処置を取ることを明言しています。ワードサラダであると判断された場合、そのサイトからの外部リンクも評価されなくなります。もしもワードサラダである疑いの強いサイトを発見した場合、ウェブマスターツールからスパムの報告を行うこともできます。

隠しテキスト

隠しテキストとは、ユーザに対しては表示されませんが、クローラーに対しては認識されるキーワードがページ内に隠されていることを指します。テキストを隠す方法としては、背景色と同色にする、テキストを画像の背後に設置する、テキストを画面の表示外に設置する、フォントサイズを 0 にするなどがあります。これらの方法で過剰なキーワードを設置し、検索順位を操作しようとします。


隠しテキストによる過剰なキーワードが設置されていると判断された場合、信頼できないサイトであると見なされる可能性があります。検索順位を操作する手法であるため、ページ単位ではなくドメイン単位でインデックスから削除されるなどの重いペナルティを受ける可能性があります。


ただし、隠しテキストがすべて偽装行為と見なされるわけではありません。例えば、クローラーがアクセスしにくい Javascript、画像、動画 などのファイルに対して説明用のテキストを使用する場合があります。これらは、アクセシビリティが向上するため、隠しテキストとは見なされません。ただし、それらの説明用のテキストを追加する場合は、noscript 要素、alt 属性、caption 要素などを使用することも検討して下さい。

隠しリンク

隠しリンクとは、ユーザに対しては表示されませんが、クローラーに対しては認識されるページ内に隠されているアンカーテキストのことを指します。隠しリンクの手法としては、隠しテキストと同様です。また、イメージマップという方法で、画像の非常に小さな領域に対してリンクを設定している場合も隠しリンクと見なされます。


Google は、隠しリンクをガイドラインで禁止しています。隠しリンクによる不自然なアンカーテキストが設置されていると判断された場合、検索順位を操作する手法であるため、ページ単位ではなくドメイン単位でインデックスから削除されるなどの重いペナルティを受ける可能性があります。

クローキング

クローキングとは、検索エンジンのクローラーに対して通常のページとは別のページを出力することを指します。ブラウザがサーバにアクセスする場合、User-Agent 情報を送信します。その情報からクローラーかどうかを判断し、クローラーであれば通常のページとは別のページを出力します。


クローラー用のページを出力させる方法は、.htaccess や Javascript を使って別のページにリダイレクトしたり、プログラムにより動的なページを生成したり、クローラーには HTML を出力し、ユーザには Flash を出力する方法などがあります。クローキングは、通常のページは更新しなくてもクローラーに対して SEO に特化したページを認識させられるため SEO の対策が容易になります。


Google はクローキングを明確に禁止しており、クローキングで偽装している場合はインデックス削除のペナルティを受ける可能性があります。

キーワードスタッフィング

キーワードスタッフィングとは、コンテンツとは関係のないキーワードをページ内に詰め込むことを指します。キーワードスタッフィングは、そのまま表示される場合もありますし、隠しテキストとして表示されない場合もあります。


キーワードスタッフィングの具体例としては、以下のパターンがあります。

  • 同じキーワードを連続して使用する
  • noscript 要素に検索キーワードを詰め込む
  • title 要素に検索キーワードを詰め込む
  • meta 要素に検索キーワードを詰め込む
  • img 要素の alt 属性に画像とは関係のないキーワードを詰め込む
  • アンカーテキストにリンク先とは関係のないキーワードを詰め込む

キーワードスタッフィングは、過去の SEO でキーワードが多く含まれているページは検索結果ページで上位に表示される手法がベースになっています。しかし、現在では検索エンジンはキーワードスタッフィングを認識するため、このようなキーワードの乱用は避けるべきです。キーワードスタッフィングだと判断された場合は、検索順位を大きく落とすペナルティを受ける可能性があります。

コメントスパム

コメントスパムとは、ブログなどのコメント欄に、コンテンツの内容とは無関係のコメントを大量に投稿することを指します。ブログの多くは、ソフトウェア (例えば Wordpress など)として、コメントを書き込めるブログパーツを簡単に設置できるようになっており、コメントを残せるブログが多数あります。これを悪用して、プログラムより自動的、または手動でコメントを大量に投稿しています。


コメントスパムの手法は、コメントフォームに URL の入力欄に誘導したいサイトの URL を入力したり、コメント内にアンカーテキストを設置したりします。大手のブログサービスでは、投稿されたコメントは事前に承認しないと掲載されないようになっているため、コメントスパムをある程度防げますが、すぐにコメントが掲載されてしまうブログでは防ぐことができません。


コメントスパムは簡単にバックリンクを得られる手法です。過去の SEO には、バックリンクの多いサイトは検索結果ページで上位に表示されやすかったため、このような手法が取られています。しかし、現在ではバックリンクの "質" まで評価されるため、評価の低いサイトからのバックリンク、または不自然なバックリンクは評価されず、SEO として効果がなくなっています。


コメントスパムによる不自然なバックリンクを大量に獲得していると判断された場合は、検索順位を大きく落とすペナルティを受ける可能性があります。もしも、コメントスパムによって検索順位を大きく落としてしまった場合、コメントをすべて削除することは困難です。その場合は、新規に Web サイトを構築することも検討して下さい。

リンクファーム

リンクファームとは、大量の Web サイト群から相互にリンクすることで、多くのバックリンクを獲得している状態のことを指します。意味のあるリンクをしているサイトは、リンクファームとは呼びません。リンクファームはコンテンツとは無関係な Web サイト群からの不自然なバックリンクである点に注意して下さい。


リンクファームは、一種のコミュニティのような集団です。グループに参加すると、参加している Web サイトからバックリンクを獲得できる代わりに、他のすべての Web サイトにリンクを張る必要があります。このように、グループへの参加者が増えるほど多くのバックリンクを獲得できます。


Google のウェブマスターツールのヘルプには過剰な相互リンクをガイドライン違反として定義しています。クローラーは、コンテンツの内容を理解するため、コンテンツとは無関係な Web サイトからの不自然なバックリンクを検知することができます。


リンクファームであると判断された場合、検索順位を大きく落とすペナルティを受ける可能性があります。また、不自然なバックリンクを獲得しているだけではなく、コンテンツとは無関係なページに大量のリンクを張っている場合も、同様にペナルティを受ける可能性があります。

ガイドライン違反によるペナルティの復旧方法

Google の品質に関するガイドライン違反をした場合、検索順位が大幅に落ちるペナルティを受ける可能性がありますが、ペナルティは復旧することができます。品質のガイドラインは細かく定義されているため、意図しないで違反してしまう場合があります。しかし、悪意のある行為を続けていない限り、ペナルティから回復することは難しくありません。特定のキーワード検索で、検索順位が明らかに落ちていて、心当たりがない場合は、落ち着いて以下に説明する手順を確認してみて下さい。


ペナルティには大きく分けて "手動ペナルティ""自動ペナルティ" の 2 種類があります。


手動ペナルティとは、Google サーチクオリティチームによる手動によって課されるペナルティです。このペナルティは、データベースのインデックスから削除される重大なペナルティで、悪質な行為を行う Web サイトに限定されたものです。手動ペナルティを受けると、Google からウェブマスターツール経由でガイドラインに違反している旨の通知が届きます。また、ウェブマスターツールに登録していない場合でも、インデックスから削除された場合は、検索結果ページに表示されないため、検索順位が落ちた場合は、自動ペナルティになります。


ウェブマスターツールには 2013 年 8 月から "手動による対策" という項目が追加されています。この項目を見れば、手動ペナルティを受けているかを確認することができます。手動ペナルティを受けていない場合、"手動によるウェブスパム対策は見つかりませんでした。" というメッセージが表示されます。


ウェブマスターツールの手動による対策
ウェブマスターツールの手動による対策


ウェブマスター ツールでの手動によるウェブスパム対策の表示

手動ペナルティを受けた場合、順位を回復するためには "再審査リクエスト" が必要になります。再審査リクエストとは、Google サーチクオリティチームによって問題が解決しているか再審査を行うことです。再審査リクエストを送ってから 30 日 ~ 180 日 程度でインデックスが復活する場合があります。問題が解決していない場合は、再びインデックスから削除されます。ただし、ガイドライン違反を繰り返すサイトについては、再審査が厳しくなる可能性があります。


再審査リクエスト - Search Console ヘルプ
ウェブマスター向けガイドライン違反を繰り返すサイトについて

自動ペナルティとは、アルゴリズムによってガイドライン違反であると自動的に判断されて課されるペナルティです。ペナルティを受けるユーザの多くは、自動ペナルティになるはずです。このペナルティは、OOP (Over Optimization Penalty) と呼ばれることもあるため、多くの場合は過度な SEO 対策を行っている場合にペナルティが課されます。


ただし、自動ペナルティは手動ペナルティと異なり、実際に受けたかどうかの判断が難しい場合があります。例えば、検索アルゴリズムの変更や、競合サイトの検索順位が上がったなど、ペナルティではない可能性もあります。そのため、まずは本当にペナルティを受けているかどうかの確認を行います。


自動ペナルティは、基本的に公開したばかりのページに課されることはありません。ある程度時間が経過し、ページがバックリンクを獲得した時点で以下のような症状が現れれば、自動ペナルティを受けている可能性があります。

  • 何もしていないのに検索順位が大幅に下落した
  • 特定のキーワードでのみ検索順位が大幅に下落した
  • サイト名、タイトル名の完全一致するキーワードでも検索結果の上位に表示されない
  • ウェブマスターツールの登録されたインデックス数に変化はないが検索結果に表示されない
    ※ サイト内検索 (site:https://murashun.jp/ など) でページが表示されるかの確認方法でも可

上記の症状がいくつか確認できた場合、自動ペナルティを受けていると考えられます。その場合、ガイドラインの規約違反部分を修正し、1 ~ 2 ヶ月程度 (クローラーの巡回頻度によって異なります) 待てば、順位が回復します。ただし、1 ~ 2 ヶ月はあくまで目安で、明確な期間は存在しません。詳細は、後述する "ペナルティに対する Google の見解" を参照して下さい。また、以前の順位まで回復するとは限りません。


サイトの修正については、品質に関するガイドラインをチェックリスト代わりに使用し、すべての項目を潰し込みます。ペナルティを受けている場合、単一の項目ではなく複数の項目を違反している可能性があります。

ペナルティに対する Google の見解

Google の John Mueller は、2015 年 9 月 8 日に開催されたオフィスアワーの質問に対して、アルゴリズムによるペナルティは存在しないと明言しています。アルゴリズムによって検索順位が変動するのは、"ペナルティ" ではなく "調整" しているだけであると述べています。アルゴリズムは、そのサイトの適切な検索順位をコンテンツの品質や、スパムであるかなどの様々な面から見つけ出そうとしており、検索順位の変動は "ペナルティ" ではなく、適切に "調整" した結果という意味です。


また、自動ペナルティによる回復までの時間については、修正する範囲によって異なるため、例えば Web サイト全体などの大規模な修正である場合は、すべての処理が完了するまで 2 ~ 3 ヶ月程度かかる可能性もあるそうです。逆に修正する範囲が小さい場合、例えば title 要素だけの変更などであれば、2 ~ 3 日程度で完了します。


English Google Webmaster Central office-hours hangout

Google のランキング要素

Google の検索アルゴリズムは非公開ですが Google の Matt Cutts は 200 以上の要素からページをランキングしていると言及しています。多くの人がこれらの要素を見つけようとしており、ある程度の要素は実証されています。ただし、これらのランキング要素は公式に認められているわけではなく、可能性として高いということに注意して下さい。


Google Ranking Factors: The Complete List

ドメイン

  1. ドメインの取得年数
    ドメインを取得してからの年数は、古い方が有利であるという考え方です。しかし Matt Cutts は取得後6ヶ月のドメインと、取得後 1 年のドメインには大きな違いはないと述べています。

    How important is the frequency of updates on a blog?


    回答を要約すると以下の 2 点です。
    • そこまで心配する必要はない。
    • 重要なのはサイトの品質である
  2. キーワードを含むドメイン名
    ドメインにキーワードを含めた場合、関連性があると判断されます。
    http://www.ABCkeyword.com
  3. キーワードで始まるドメイン名
    ドメインがキーワードで始まる場合、関連性があると判断されます。この関連性は、キーワードを含まないドメイン、またはキーワードがドメインの文字列の中央や後方に含む場合より優位性がある可能性があります。
    http://www.keywordABC.com
  4. ドメインの登録年数
    ドメインの登録年数は、古い方が優位性があります。スパム行為を行うドメインは、同じドメインを使い続けることがあまりないため、ドメインの登録年数が要素になります。
  5. キーワードを含むサブドメイン
    サブドメインにキーワードを含めた場合、関連性があると判断されます。
    http://keyword.ABC.com
  6. ドメインの変更履歴
    ドメインの所有者情報が変更されると、バックリンクによる評価がリセットされます。
  7. キーワードと完全一致するドメイン(EMD:Extra Match Domain)
    EMD アップデートにおいて、EMD の掲載順位が低下するペナルティを与えました。EMDアップデートとは、"検索キーワードと完全一致するドメイン名" を対象に、低品質と判断したサイトに対して "ランキングを低下" させる Google のアルゴリズムアップデートです。ただし、EMD アップデートの影響を受けるのは低品質な Web サイトのみであり、高品質な Web サイトは影響を受けません。
    http://www.keyword.com
  8. ドメイン登録情報
    ドメインの登録情報(WHOIS情報)は、公開している方が非公開よりも優位性があります。Matt Cutts は、正当な理由がない限りドメインの登録情報は公開している方が信頼できると述べています。
  9. ドメインの登録者に対するペナルティ
    Google が特定の個人がスパム行為を行っていると認めた場合、その人が所有する他のWebサイトも調査対象となり、ペナルティを受ける可能性があります。
  10. 国別コードトップレベルドメイン(ccTLD)
    ccTLD(".jp"、".cn"、".ca"など)は、その国内の検索における掲載順位を助けますが、世界規模においては掲載順位が制限されます。

ページレベル

  1. キーワードを title 要素に含める
    title 要素はコンテンツに次ぐ重要な要素で、キーワードを含めることでSEOに強いシグナルを与えます。
  2. キーワードを title 要素の前方に含める
    title 要素の前方にキーワードがある場合、後方にキーワードがある場合より優位性があります。
  3. キーワードを meta 要素の description に含める
    meta 要素の description 属性は title 要素に関連するシグナルで特に重要ではありませんが、キーワードが含まれることで多少の効果が見込めます。
  4. キーワードを h1 要素に含める
    h1 要素は "第 2 の title 要素" であり、キーワードを含めることで SEO に強いシグナルを与えます。
  5. キーワードをドキュメント内に含める
    ドキュメント内にキーワードが含まれることでシグナルになります。
  6. コンテンツの量
    多くの単語を使用したコンテンツはより広い範囲をカバーすることができるため、短くまとめた記事よりも好まれます。コンテンツ量・単語数と掲載順位には多少の相関関係が認められます。
  7. キーワードの密度
    キーワードの密度は Google がトピックを決定するために使われますが、それほど重要ではありません。
  8. コンテンツに関連するキーワード
    コンテンツのキーワードから、潜在的に関連するキーワード(LSI:Latent Semantic Indexing)を抽出し、それらが含まれているかでコンテンツの品質を測定するシグナルになります。
  9. title 要素や meta 要素の description 属性にLSIキーワードを含める
    コンテンツと同様に、title 要素や meta 要素の description 属性に使われたLSIキーワードは Google が同義語を見つけるために役立てられます。
  10. ページの読み込み速度
    Google と Bing は、どちらもページの読み込み速度をランキングの要素として使用しています。検索エンジンのスパイダーは、ページのコードとファイルサイズから正確にページの読み込み速度を測定することができます。
  11. 重複したコンテンツ
    重複したコンテンツ、または少しだけ内容を変更したコンテンツが同じWebサイト上にある場合、検索エンジンはネガティブな評価を行います。
  12. canonical属性
    canonical属性(<link rel="canonical">)が適切に使われている場合、Google は重複したコンテンツのどちらが優先されるか判断することができます。
  13. Chromeによるページの読み込み速度
    Google はページの読み込み速度、サーバのスピード、CDNの使用有無などのスピードに関連するシグナルを得るためにChromeを使用する可能性があります。
  14. 画像の最適化
    ページに配置された画像のファイル名、alt属性、タイトル、説明文、caption タグなどは、検索エンジンに重要な関連性のシグナルを送ります。
  15. コンテンツのアップデート
    2010年に行われたカフェインアップデートによって、より新しい記事が好まれるようになり、コンテンツのアップデート日時が検索結果に表示されるようになりました。
  16. コンテンツのアップデート規模
    コンテンツのアップデート規模も更新に関する重要な要素になります。単語をいくつか修正するよりも、全体的な修正の方が重要なアップデートと判断されます。
  17. コンテンツのアップデート頻度
    コンテンツのアップデート頻度も更新に関する重要な要素になります。
  18. 突出したキーワード
    キーワードがコンテンツの最初の100語に含まれると、関連性のある重要なシグナルになります。
  19. h2 要素や h3 要素にキーワードを含める
    h2 要素や h3 要素にキーワードを含めると、関連性のあるシグナルになります。
  20. キーワードの順序
    検索するキーワードには順序性があります。例えば "ネコのひげを剃るテクニック" と検索した場合 "ネコのひげを剃るテクニック" が "テクニック ネコのひげを剃る" よりも優先されます。
  21. 外部リンク先のWebサイト品質
    外部リンク先のWebサイト品質は Google に信頼性のシグナルを送ると考えられます。
  22. 外部リンク先のコンテンツ
    外部リンク先のコンテンツは関連性のシグナルとして使われる可能性があります。例えば、自動車関連のページから映画関連のページにリンクすると、自動車の映画として解釈される可能性があります。
  23. 正しい文法と誤字・脱字
    正しい文法と、誤字・脱字の有無はコンテンツの品質のシグナルとなります。
  24. 類似したコンテンツ
    コンテンツが他のページからコピーしたものである場合、そのコンテンツはインデックスされず、補足インデックス※1として扱われます。
  25. 参考となるコンテンツ
    参考となるコンテンツへのリンクは品質のシグナルになります。
  26. 外部リンクの数
    外部リンクの数が不自然に多い場合、リンク元のページランクを落とす可能性があります。
  27. マルチメディアコンテンツ
    画像、動画、その他のマルチメディアは、コンテンツの品質のシグナルとなります。
  28. 内部リンクの数
    特定のページにおける内部リンクの数は、外部リンクの数よりも重要であることを意味します。
  29. 内部リンクの品質
    同一ドメインにおいて、ページランクの高いページからの内部リンクは、ページランクの低いページからの内部リンクよりも強い影響を持ちます。
  30. リンク切れ
    ページ内にリンク切れが多い場合、そのサイトは放棄された可能性があると判断されます。また、リンク切れはサイトの品質のシグナルとなります。
  31. ページの読みやすさ
    Google はページの読みやすさを品質の指標としている可能性が高いと考えられます。
  32. アフェリエイトのリンク
    アフェリエイトのリンクはランキングには影響を与えませんが、あまりにも数が多いとアフェリエイトサイトでないことを確認するために、他の品質のシグナルにより注意を払う可能性があります。
  33. W3C ValidationによるHTMLの文法エラー
    HTMLのエラーや、品質の悪いコーディングの多くは低品質のサイトの可能性があります。
  34. ドメインの知名度
    認知度の高いドメインは、認知度の低いドメインに対して優位性があると考えられています。しかし、Google の Matt Cutts や John Mueller はドメインの優位性について否定しています。
  35. ページのページランク
    相関性はありませんが、一般的にページランクの高いページが低いページより掲載順位が上位になります。
  36. URLの長さ
    極端に長いURLは、検索結果画面に悪影響を与えます。
  37. URLの短さ
    短いURLは、長いURLよりもわずかに優位である可能性があります。
  38. 人の手による編集
    Google はページが人の手によって編集されたものか判断する特許を取得しています。
  39. ページのカテゴリ
    ページに表示されるカテゴリは、関連性のシグナルを持ちます。密接に関連するカテゴリのページは、関連性のシグナルを得ることができます。
  40. WordPressのタグ
    WordPressのタグは関連性のある固有のシグナルを持ちます。
  41. URLに含まれたキーワード
    キーワードがURLに含まれると、関連性のある重要なシグナルを持ちます。
  42. URLの文字列
    URLの文字列から Google はページが何のカテゴリについて書かれているかを推測し、そのテーマのシグナルになる可能性があります。
  43. 参照と出典
    研究論文のように、参照と出典を引用することで品質のシグナルを得る可能性があります。
  44. 箇条書きと番号付きリスト
    箇条書きと番号付きリストは、ユーザフレンドリーで、コンテンツを理解しやすくします。
  45. サイトマップのページ優先度
    sitemap.xmlで設定しているページ優先度はランキングに影響を与える可能性があります。サイトマップの詳細は、サイトマップの作り方の記事を参照して下さい。
  46. 極端に多い外部リンク
    極端に多い外部リンクは、前述の通り品質のシグナルに悪影響を与えます。
  47. 他のキーワードの量
    他のキーワードによってページがランキングされている場合、品質のシグナルに悪影響を与えます。
  48. ページの年数
    Google は新しいページを好みますが、古いページでも定期的な更新によって新しいページを凌ぐ可能性があります。
  49. ユーザフレンドリーなレイアウト
    Google の品質に関するガイドラインには、優れたレイアウトはコンテンツがどこにあるかすぐに分かると述べられています。
  50. パークドメイン
    パークドメインとは、ドメインの登録だけを行いコンテンツがない状態のドメインです。2011年の Google のアップデートによりパークドメインが検索結果画面に表示される件数は減少しました。
  51. 有益なコンテンツ
    Google は "品質" と "有益" なコンテンツを区別する可能性があります。

サイトレベル

  1. コンテンツの価値
    Google はユーザにとって価値のあるコンテンツや、希少性のあるコンテンツを求めています。しかし、内容が薄いアフェリエイトサイトなどはユーザにとって無価値であると判断しています。
  2. お問い合わせページ
    Google の品質に関するガイドラインでは "適切な量の連絡先情報" を持つWebサイトを好むと述べられています。また、連絡先情報が WHOIS 情報と一致した場合は、ボーナスがもらえる可能性があります。
  3. ドメインの信頼性
    Webサイトの信頼性は、信頼されているWebサイトからいくつの外部リンクを受けているかが重要な要素となります。
  4. Webサイトのアーキテクチャ
    十分に設計されたWebサイトのアーキテクチャ(特にサイロ構造)は Google がテーマ別にコンテンツを整理するのに役立ちます。
  5. Webサイトの更新頻度
    Webサイトがどの程度の頻度で更新されているかは、Webサイトを評価する要素となります。特に、新しいコンテンツがサイトに加えられているかはWebサイト全体の更新に関する要素になります。ただし、Google の Matt Cutts は "ブログの頻繁な更新はSEOにいい影響を与えるか?" という質問に対して以下のように回答しています。

    How important is the frequency of updates on a blog?


    回答を要約すると以下の 2 点です。
    • 更新頻度よりもコンテンツの品質の方が重要であり、品質を高めることに集中するべき。
    • 特定のトピックスに対してオリジナリティを加えること。
  6. Webサイトのページ数
    Webサイトのページ数は、あまり重要ではありませんが評価のシグナルとなります。少なくとも大規模なサイトのページ数は、コンテンツが薄いアフェリエイトサイトと区別するのに役立ちます。
  7. Webサイトのサイトマップ
    サイトマップは、検索エンジンがより簡単に、より効率的にインデックスをつけるために役立ちます。サイトマップの詳細は、サイトマップの作り方の記事を参照して下さい。
  8. Webサイトの稼働時間
    Webサイトのメンテナンスや、サーバの問題で故障時間が多い場合、ランクを損なう可能性があります。
  9. サーバの場所
    サーバの場所が地理的に離れた場所にある場合、検索時に影響を受ける可能性があります。特に県名や地名などを検索のキーワードに含める場合に影響があります。
  10. SSL証明書
    Google は SSL証明書の導入有無を評価対象にしています。電子商取引において、SSL証明書の導入有無はランキングの優位性に影響を与えます。
  11. 利用規約とプライバシーポリシー
    利用規約とプライバシーポリシーのページの有無は、信頼性のシグナルを与えます。
  12. 重複する meta 情報
    Webサイト全体で重複する meta 情報は、各ページの見やすさを損なうことがあります。
  13. パンくずリスト
    パンくずリストは、ユーザ、および検索エンジンがWebサイトのどの階層にいるのかを知るのに役立ちます。ユーザフレンドリーなサイトアーキテクチャは、ランキング要素である可能性があります。
  14. モバイルフレンドリー
    Google はスマートフォンや、タブレットなどのモバイルに最適化されたレスポンシブデザインを推奨しています。レスポンシブデザイン対応のWebサイトは、モバイルからの検索において優位性があります。
  15. YouTube
    YouTube の動画は、優遇されている可能性が高いと思われます。実際に、パンダアップデート後には YouTube.com のトラフィックが増加しています。
  16. Webサイトのユーザビリティ
    ページのサービスを利用することが難しい、またはページを移動することが難しいWebサイトは、見られたページと直帰率で判別することができます。
  17. Google アナリティクスやウェブマスターツールの使用
    Google が提供する2つのツールを使うことで、Webページがインデックスされることを助けることができます。
  18. ユーザのレビューとWebサイトの評判
    Yelp.com や RipOffReport.com のようなレビューサイト上にあるWebサイトは重要な役割を果たしています。Google はそれらのサイトに投稿されたユーザのレビューを参考にしています。

バックリンク

  1. 古いドメインからの外部リンク
    取得してから年数が経過している古いドメインからのリンクは、新しいドメインからのリンクよりも優位である可能性があります。
  2. ルートドメインからの外部リンク
    ルートドメインからの外部リンク数は Google が最も重要視する要素の1つです。
  3. CクラスのIPアドレスからの外部リンク
    CクラスIPアドレスからの外部リンクは、より広範囲からの外部リンクであることを示しています。
  4. 同一ドメイン上の内部リンク
    同一のドメインであっても、ページの合計リンク数はランキングの要素になります。
  5. 画像のalt属性
    画像の代替テキスト(alt属性)は、画像におけるアンカーテキストの役割を果たします。
  6. .edu または .gov ドメインからの外部リンク
    Matt Cutts はTLD(Top Level Domain:トップレベルドメイン)からの外部リンクは重要な要素にはならないと述べています。しかし、SEOの業者はTLDからの外部リンクは特別であると考えています。
  7. 外部リンク元のページランク
    外部リンク元のページランクは極めて重要な要素です。
  8. 外部リンク元のドメイン
    外部リンク元のドメインはページランク(PR)より重要な役割を果たしている可能性があります。例えば、PR3(.com) → PR2 より PR8(.edu) → PR2 の方がリンク元のページランクは低いですが .edu のドメインからリンクされているため、価値が高いと判断される可能性があります。
  9. 競合するページからのリンク
    同じ検索結果画面に表示されている他のページからのリンクは、特定のキーワードにおいて価値が高いと判断されます。
  10. ソーシャルメディアでのシェア
    ソーシャルメディアのシェアによるリンクは価値を与える可能性があります。
  11. 良くない地域からのリンク
    "良くない地域" からのリンクはWebサイトの価値を低下させる可能性があります。
  12. ゲストによる投稿
    一部のWebサイトではゲストによる投稿が可能ですが、ゲストが投稿した記事に含まれるリンクは、本来の記事に含まれるリンクより価値がありません。
  13. ホームページドメインへのリンク
    ホームページへのリンクはWebサイトを評価する上で重要な要素になる可能性があります。
  14. リンクの nofollow 指定
    Google はリンクに nofollow を指定すると、その先はクロール対象外になると述べています。しかし、nofollow が指定された場合の処理にはいくつかの例外があり、必ずクロールの対象外になるとは限りません。そのため、nofollow が指定された場合、自然なリンクと比べて不自然なリンクになる可能性があります。
    <a href="signin.php" rel="nofollow">sign in</a>
  15. 様々な方面からのリンク
    1つのWebサイトから不自然に多くリンクされている場合はスパムである可能性があります。リンクは様々なWebサイトから貼られている方が自然なリンクであると判断されます。
  16. スポンサーのリンク
    "スポンサーリンク" や "リンクパートナー" といったキーワードによるリンクは、リンクの価値を下げる可能性があります。
  17. 文章中に含まれるリンク
    ページのコンテンツ内に埋め込まれたリンクは、空白のページのリンクよりも価値があると考えられます。
  18. 過度な301リダイレクト
    301リダイレクトにより転送されるリンクは、10~15%程度の価値を失います。
  19. バックリンクのアンカーテキスト
    アンカーテキストはWebページの関連性を表現しているという考え方から Google はオリジナルのアルゴリズムを設計しています。現在では、アンカーテキストはそれほど重要ではなくスパムの可能性すらありますが、関連性における強いシグナルを与えています。
  20. 内部リンクのアンカーテキスト
    内部リンクのアンカーテキストは関連性を示すシグナルですが、バックリンクのアンカーテキストとは価値が異なる可能性があります。
  21. アンカーテキストのtitle属性
    アンカーテキストのtitle属性は弱い関連性のシグナルを示します。
    <a href="blog.html" title="日常のブログ">blog</a>
  22. 国別TLD(Top Level Domain:トップレベルドメイン)
    国別のTLD(.jp, .de, .cnなど)から外部リンクを得ることは、その国において評価される可能性があります。
  23. コンテンツ内のリンク場所
    コンテンツ内の始まりの方にあるリンクの方が、終わりの方にあるリンクよりも重要視されます。
  24. ページ内のリンク場所
    リンクがページのどこに配置されているかは重要な要素となります。コンテンツ内にあるリンクは、フッターやサイドバーのリンクに比べて価値があります。
  25. 外部リンクの関連性
    テーマが類似したWebサイトからの外部リンクは、テーマが無関係のWebサイトからの外部リンクより価値があります。
  26. 内部リンクの関連性
    テーマが類似したページからの内部リンクは、テーマが無関係のページからの内部リンクより価値があります。
  27. 肯定的なリンク・否定的なリンク
    Google はサイトへのリンクが肯定的であるか、否定的であるかの感情を理解します。肯定的なリンクはより価値があります。
  28. title属性にキーワードを含める
    アンカーテキストのtitle属性にキーワードを含む場合、より価値があります。
  29. 肯定的なリンクを得る速度
    外部からの肯定的なリンクを得る速度によって、掲載順位が上がります。
  30. 否定的なリンクを得る速度
    外部からの否定的なリンクを得る速度によって、掲載順位が下がります。
  31. トップページからのリンク
    Webサイトのトップページからリンクされているページは、特別なページであると判断される可能性があります。
  32. 第一人者のWebサイトからの外部リンク
    テーマの第一人者のWebサイトからの外部リンクは、その他のWebサイトからの外部リンクより価値があります。
  33. Wikipedia からの外部リンク
    Wikipedia からのリンクは nofollow ですが、外部リンクを得ていることは検索エンジンから見て信頼を与えられていると判断される可能性があります。ただし、Google の Matt Cutts は "Wikipedia の様な、信頼のおけるサイトからのリンクに nofollow が含まれている時は、Web 上で質を考慮するのか?" という質問に対して以下のように回答しています。

    Two questions about nofollow


    回答を要約すると以下の 2 点です。
    • Wikipedia からのリンクは検索順位には影響しない。
    • nofollow タグの入っているリンクは、順位に影響しない。
  34. 共起率
    共起とは、関連性のある2つの表現やキーワードが同時に出現することです。例えば "ラーメン" と "つけ麺" は共起率が高いと言えます。他のWebサイトからの外部リンク周辺に現れる共起率の高いキーワードは、そのページのテーマが何であるか Google は知ることができます。
  35. 他のWebサイトからの外部リンクの年齢
    Google の特許によれば、より古い外部リンクはより新しいリンクよりも価値があります。
  36. スパムサイトと本物のサイトからのリンク
    Google はスパムサイトの外部リンクより、本物のサイトの外部リンクを重要視します。
  37. 自然なリンク
    自然なリンクプロフィールを持つサイトはランキングに大きく影響します。
  38. 相互リンク
    Google は過度な相互リンクは検索結果に悪影響を与えると述べています。
  39. 生成されたリンク
    Google は外部リンクがWebサイトの管理者が生成したものかを識別することができます。
  40. 301リダイレクトによるリンク
    #97と同様に、301リダイレクトはダイレクトリンクと比較して、10~15%程度の価値を失います。しかし、Matt Cutts は301リダイレクトはダイレクトと類似したものであると述べています。
  41. microdata フォーマット
    構造化データである microdata フォーマットを取り入れたページは、取り入れていないページに比べてランキングが上位になる可能性があります。
  42. DMOZ(Directory Mozilla)のリスト
    DMOZはボランティア方式で運営されるWebディレクトリであり、多くの人はDMOZに登録されたWebサイトは信頼性が多少あると考えられています。
  43. 外部リンクの信頼性
    信頼性のある他のWebサイトからの外部リンクは、信頼性のランキングに影響を与えます。
  44. 外部リンク数
    非常に多くの外部リンクがあるページは、少ない外部リンクがあるページより価値が下がる可能性があります。
  45. フォーラムのプロフィール
    Google はフォーラムのプロフィール情報からスパムであるかを考慮し、リンク数が多い場合は価値を下げる可能性があります。
  46. リンクが含まれる記事のワード数
    1,000ワードからなる記事に含まれるリンクは、25ワードの記事に含まれるリンクよりも価値があります。
  47. リンクの品質
    完成度の低い記事に含まれるリンクは価値を下げる可能性があります。
  48. Webサイトの共通部分に含まれるリンク
    ヘッダー、フッター、サイドバーなどのWebサイトの共通部分に含まれるリンクは、Webサイト全体として1つのリンクであると認識されます。

ユーザインタラクション

  1. 特定のキーワードによるオーガニックなCTR(Click Through Rate:クリック率)
    オーガニックなクリックとは、ユーザの直帰率と滞在時間から実際にページが読まれたかを判断します。オーガニックなクリック率がより高いページは、特定のキーワードにおいてランキングが上位になる可能性があります。
  2. すべてのキーワードによるオーガニックなCTR(Click Through Rate:クリック率)
    ページ上、またはWebサイト上のすべてのキーワードにおけるオーガニックなクリック率は、ユーザインタラクションのシグナルとして価値がある可能性があります。
  3. 直帰率
    直帰率とは、ユーザがWebサイトに訪問してから1ページしか閲覧されなかった割合のことを言います。直帰率はWebサイトの品質の指標となるため Google が評価する可能性があります。
  4. ダイレクトなトラフィック
    ダイレクトなトラフィックが多いWebサイトは、少ないWebサイトと比べて品質が高いと評価されます。
  5. リピーター
    繰り返し訪問するユーザがいるWebサイトは、ランキングが上位になる可能性があります。
  6. Google Chrome でブロックされたWebサイト
    Google はパンダアップデートにおいて Google Chrome でブロックされたWebサイトを品質のシグナルとして利用しました。
  7. Google Chrome でブックマークされたWebサイト
    Google は Google Chrome でブックマークされたページ情報を収集しています。ブックマークされたページはランキングで上位になる可能性があります。
  8. Google ツールバー
    Google ツールバーから得たデータはランキングのシグナルとして使われる可能性があります。
  9. ページの評価コメント
    多くの評価コメントがついたページはユーザインタラクションと品質のシグナルとなる可能性があります。
  10. 滞在時間
    Google はユーザが検索結果画面からページに訪れて、どれくらいの時間を費やすかに細心の注意を払っています。滞在時間が長い場合、品質のシグナルとして使われる可能性があります。

アルゴリズム

  1. キーワードの話題性
    話題のキーワードはランキングが上位になる可能性があります。
  2. キーワードのバリエーション
    Google はあいまい検索に対応するため、キーワードにバリエーションを持たせる可能性があります。
  3. ユーザの訪問履歴
    Google にサインインしている場合、検索結果画面にはWebサイトの訪問回数が表示されます。繰り返し訪問しているWebサイトに価値を与える可能性があります。
  4. ユーザの検索履歴
    検索を連続で行った場合、後続の検索結果に影響を与えます。例えば "レビュー" と検索し、それから "トースター" を検索した場合、Google はトースターのレビューサイトをランキングの上位に表示する可能性が高くなります。
  5. 地理的な優位性
    Google はローカルサーバや国別のドメインを優先してランキングします。
  6. セーフサーチ
    汚い言葉が使われていたり、成人向けのコンテンツを扱っている場合は、セーフサーチをオンにしているユーザには表示されません。
  7. Google+サークル
    Google が特定の Google+ サークルを増やしたい場合、ランキングが上位になる可能性があります。
  8. DMCA(Digital Millennium Copyright Act:デジタルミレニアム著作権法)侵害による削除
    Google は DMCAを侵害しているWebサイトについて削除リクエストを受け付けています。
  9. ドメインのバリエーション
    ビッグフットアップデートでは新しい複数のドメインが検索結果画面に表示されるようになりました。
  10. トランザクショナルサーチ
    購入やダウンロードなどの、決済や取引を目的としたトランザクショナルサーチ(例えば "Amazon セール" )では、キーワードに対して異なる結果を表示する可能性があります。
  11. ローカルサーチ
    Google はオーガニック検索結果ページ上に Google+ の結果を表示する場合があります。
  12. Google ニュース
    特定のキーワードに対して Google ニュースの結果を表示する場合があります。
  13. ブランドの優先性
    ヴィンスアップデートでは "ブランド" を重要視せず "信頼"、"評判"、"権威"、"ページランク" が考慮されるようになりました。このアルゴリズムのアップデートは、複数のキーワードを組み合わせて検索する "ロングテールキーワード" には影響せず、単一のキーワードで検索する "ショートテールキーワード" に影響を及ぼします。
  14. Google ショッピング
    特定のキーワードに対して Google ショッピングの結果を表示する場合があります。
  15. 画像の検索結果
    Google の画像検索では検索連動型広告を表示せずにオーガニックな検索結果を表示します。
  16. イースターエッグ
    Google には様々なイースターエッグがあります。例えば、画像検索で "Atari Breakout" を検索するとゲームが始まります。
  17. ブランドに対する検索結果
    ドメイン、またはブランドにキーワードが一致した場合、複数の結果を表示します。

ソーシャルシグナル

  1. 多くの"ツイート"
    ページのツイート数は、リンク数のようにランキングに影響を与える可能性があります。
  2. ツイッターのアカウント
    信頼のあるアカウントからのツイートは、影響力が低いアカウントより価値がある可能性があります。
  3. 多くの"いいね"
    ページのいいね(Likes)の数は、リンク数のようにランキングに影響を与える可能性があります。
  4. 多くの"シェア"
    Facebookのシェアは外部リンクと類似しているため、"いいね" より影響がある可能性があります。
  5. Facebookのアカウント
    Twitter と同様に、信頼のあるアカウントからの "いいね" や "シェア" は影響力が低いアカウントより価値がある可能性があります。
  6. Pinterestのピン
    Pinterestは多くの公開データを持つ人気のあるソーシャルサービスです。Google はピン数を評価のシグナルと扱う可能性があります。
  7. ソーシャルシェアリングによる評価
    Google が Twitter や Facebook や Google+ や reddit や Stumbleupon や digg などのシェアリングサイトでシェアされているページを評価のシグナルとして扱う可能性があります。ただし、Google の Matt Cutts は "Twitter や Facebook からのリンクはどのように評価するのか?" という質問に対して以下のように回答しています。

    How do you rate links from sites like Twitter and Facebook?


    回答を要約すると以下の 2 点です。
    • Google はどんなリンクも平等に扱っている。
    • クローリングできないページや、nofollow タグ付のリンクは評価の対象にはならない。
  8. 多くの"Google+1"
    Matt Cutts は Google+ がランキングには影響しないと述べていますが、自身のソーシャル・ネットワークの影響を無視するとは考えにくいことです。
  9. Google+ のアカウント
    Twitter や Facebook と同様に、Google+ でも影響力のアカウントがより価値がある可能性があります。
  10. Google+ の認証済みプロフィール
    検索結果画面に Google+ の認証済みプロフィールが表示されている方がランキングで上位に表示されます。
  11. ソーシャルシグナルの関連性
    Google はコンテンツとリンクの周囲にあるテキストを共有し、関連情報を調べている可能性があります。
  12. Webサイトレベルのソーシャルシグナル
    Webサイトレベルのソーシャルシグナルは、サイト全体の信頼性を向上させる可能性があります。

ブランドシグナル

  1. ブランドのアンカーテキスト
    ブランドの名称を使ったアンカーテキストは強いシグナルになります。
  2. ブランドの検索
    ブランドを検索する場合は、"ブランド名" + "関連するキーワード" の順番が一般的で、Google もその順番を考慮しています。また、Google の Matt Cutts は "Google は大企業を優先して検索結果に表示しているか?" という質問に対して以下のように回答しています。

    Is Google putting more weight on brands in rankings?


    回答を要約すると以下の 3 点です。
    • 大企業だからといって検索結果を優遇することはない。
    • Google は最適な検索結果をユーザに返そうとしている。
    • 我々がやるべきは、ニッチな分野でいいので優れたサイトをつくること。
  3. ブランドのFacebook
    ブランドはFacebookページと多くの"いいね"を持っている傾向があります。
  4. ブランドのTwitter
    ブランドは多くのフォロワーを持っている傾向があります。
  5. ブランドのLinkedin
    ブランドの多くはLinkedinに自社のページを持っている傾向があります。
  6. Linkedinの従業者名簿
    Linkedinのプロフィールを持っている会社はブランドのシグナルになる可能性があります。
  7. ソーシャルメディアの信頼性
    フォロワー数と投稿数が極端に異なる場合(例えば10,000人ものフォロワーと、2つの投稿しかないアカウント)は、フォロワーが強く支持しているアカウントと解釈されます。
  8. Google ニュースのフィード表示
    有名なブランドは、常に Google ニュースに取り上げられます。いくつかのブランドでは、検索結果画面に Google ニュースのフィードが表示されます。
  9. 共起されたWebサイト
    Google はアンカーテキストでなくとも、キーワードと共に特定のWebサイトについて言及されていれば、ブランドのシグナルとして扱う可能性があります。
  10. 多くの RSS 購読者
    Google は Feedburner RSS を所有しているため RSS 購読者のデータがブランドのシグナルになる可能性があります。
  11. Google+ のロケーション
    本物の会社はオフィスを所有しています。Google はWebサイトが大きなブランドであるか判断するために、Google+ のロケーションデータを使う可能性があります。
  12. 法人税の納税
    Google は会社が法人税を納めているか調査する可能性があります。

サイト内部のスパム

  1. パンダアップデートによるペナルティ
    低品質なコンテンツを含むWebサイトは、パンダアップデート後に検索結果画面に表示されなくなりました。特にコンテンツファームと呼ばれる "スクレイピング(自動生成された)記事"、"信頼性の低い記事"、"コピーされた記事" などは顕著に影響を受けます。
  2. 良くない地域からのリンク
    #90と同様に、"良くない地域" からのリンクはWebサイトの価値を低下させる可能性があります。
  3. リダイレクト
    検索エンジンに異なるページを見せる "クローキング" など卑劣なリダイレクトは、インデックスから抹消される可能性があります。
  4. ポップアップ広告や気が散る広告
    Google の品質に関するガイドラインでは、ポップアップ広告や気を散る広告は低品質のサイトのサインであると述べています。
  5. Webサイトの過剰な最適化
    キーワードを詰め込みすぎたり、キーワードの過剰な装飾は逆効果になります。
  6. Webページの過剰な最適化
    多くの人がペンギンアップデートにおいて、Webサイト全体ではなく個別のWebページが特定のキーワード検索のターゲットになっていると報告しています。
  7. ファーストビューの広告
    ページのレイアウトを検出するアルゴリズムではページが表示された時、スクロールせずに見える範囲に広告があるとペナルティを受けます。
  8. 隠されたアフェリエイトリンク
    アフェリエイトリンクが隠れていると、ペナルティを受けます。
  9. アフェリエイトリンク
    Google はアフェリエイトを好まないため、アフェリエイトリンクがあるWebサイトは評価が異なる可能性があります。
  10. 自動生成されたコンテンツ
    Google は自動生成されたコンテンツを好まないため、自動生成されたコンテンツが存在するとペナルティを受ける可能性があります。
  11. 過剰な nofollow 属性
    すべての外部リンク、内部リンクにおいて nofollow 属性を付与するような場合は、ページランクを悪用していると判断される可能性があります。
  12. スパムとしてのIPアドレス
    サーバのIPアドレスがスパムと判断された場合、サーバ上のすべてのWebサイトのランキングを損なう可能性があります。
  13. 過剰な meta タグ
    meta タグにキーワードを詰め込みすぎるとスパムと見なされます。もしも、Google がアルゴリズムを操作する目的で meta タグにキーワードを加えていると判断したら、Webサイトのランキングを損なう可能性があります。

サイト外部のスパム

  1. 他のWebサイトからの不自然な外部リンク
    他のWebサイトからの不自然な外部リンクは、スパムであると判断される極めて確実なサインです。
  2. ペンギンペナルティ
    ペンギンアップデートによってペナルティを受けたWebサイトは多くありません。
  3. 他のWebサイトからの低品質な外部リンク
    他のWebサイトからの低品質な外部リンク(ブログのコメントや、フォーラムのコメントなどに含まれるリンク)は、悪用するサインと判断される可能性があります。
  4. 関連性の低いWebサイトからの外部リンク
    関連性の低いWebサイトからの外部リンクが多いWebサイトは、ペンギンアップデートで発見されています。
  5. クロールエラー
    Google はウェブマスターツールでクロールエラーとなったページを通知します。一般的には通知されたページはランクを下げることになります。
  6. 同一のCクラスのIPアドレスからの外部リンク
    同一のCクラスのIPアドレスからの外部リンクが不自然に多い場合、ブログネットワークのリンクである可能性があります。
  7. "ポイズン" アンカーテキスト
    薬に関するキーワードのアンカーテキストは、スパム、またはハッキングされているWebサイトからのリンクである可能性があります。いずれの場合でも、ランキングを損ねる可能性があります。
  8. 手動対応によるペナルティ
    Google は何らかの違反をした場合は、手動対応によるペナルティを与えています。
  9. リンクの販売
    販売されたリンクはページランクに影響を与えます。ただし、ペナルティによりWebサイトのランキングを損ねる可能性があります。
  10. Google サンドボックス
    新しいWebサイトは、"Google ハネムーン" と "Google サンドボックス" の対象になる場合があります。Google ハネムーンは、新規作成したWebサイトが SEO 対策していなくても上位にランキングされる一種のボーナスが与えられている状態です。Google サンドボックスは、Google ハネムーン期間が終了後、本来のランキング評価を受けるまで一時的にランキングが制限されている状態です。
  11. Google ダンス
    Google ダンスとは、ランキングの順位が入れ替わる現象です。発生する原因は、アルゴリズムが変更された場合や、接続する Google のサーバが異なる場合などに発生します。Google の特許によれば、Webサイトがアルゴリズムを悪用しているか判断するために行われている可能性があります。
  12. リンクの無効化ツール
    無効化ツール(Disavow Tool)の使用は、ネガティブな評価を受けたときにリンクの関与を否定することで、ペナルティを軽減、または失効できる可能性があります。
  13. 再審査のリクエスト
    ペナルティを受けた場合、再審査のリクエストをすることでペナルティを失効することができます。

まとめ

Google の検索エンジン最適化について200を超える要素を含めてまとめました。Google のアップデートの内容や、ランキングの各要素から、どのようにしてユーザに有益なページを提供し、スパムに立ち向かっているかが分かるかと思います。Google が求める良質なページも、多くのユーザに読まれるためには SEO 対策が必要であると考えます。良質なページと適度な SEO 対策によって、ユーザと良いインタラクションを生み出して下さい。