ウェブが進化するにつれて、グーグルとSEOも進化します。
これは、ベストプラクティスと見なされるものが流動的であることが多いことを意味します。 昨日は良い助言だったかもしれませんが、今日はそうではありません。
これは、SEO自体とほぼ同じくらい古いサイトマップに特に当てはまります。
問題は、すべての男性とその犬がフォーラムに回答を投稿し、ブログに推奨事項を公開し、ソーシャルメディアで意見を増幅した場合、誤った情報から貴重なアドバイスを分類するのに時間がかかることです。
したがって、私たちのほとんどは、サイトマップをGoogle検索コンソールに送信することが重要であるという一般的な理解を共有していますが、ある方法でそれらを実装する方法の複雑さを知らないかもしれません。
SEOの主要業績評価指標(KPI)を推進します。
今日のサイトマップのベストプラクティスに関する混乱を解消しましょう。
XMLサイトマップとは
簡単に言うと、XMLサイトマップはウェブサイトのURLのリストです。
これは、検索エンジンに利用可能なコンテンツとそのアクセス方法を伝えるためのロードマップとして機能します。
上記の例では、検索エンジンはXMLサイトマップファイルに1回アクセスするだけで、サイトマップ内の9ページすべてを検索します。
Webサイトでは、9ページを見つけるために5つの内部リンクをジャンプする必要があります。
クローラーがより高速なインデックス作成を行うのを支援するXMLサイトマップのこの機能は、次のようなWebサイトにとって特に重要です。
- 何千ものページおよび/または深いウェブサイトアーキテクチャを持っています。
- 頻繁に新しいページを追加します。
- 既存のページのコンテンツを頻繁に変更します。
- 弱い内部リンクと孤立したページに苦しんでいます。
- 強力な外部リンクプロファイルがありません。
補足:インデックスなしのURLを使用してサイトマップを送信すると、インデックス解除を高速化することもできます。 インデックスを解除するURLが多数ある場合は、Google検索コンソールでURLを削除するよりも効率的です。 ただし、これは注意して使用し、そのようなURLをサイトマップに一時的に追加するだけにしてください。
重要なポイント
検索エンジンは技術的にはそれなしでURLを見つけることができますが、XMLサイトマップにページを含めることで、それらが高品質のランディングページであると見なしていることを示しています。
XMLサイトマップがページをクロールする保証はありませんが、インデックスやランク付けはもちろんのこと、送信すると確実にチャンスが増えます。
XMLサイトマップ形式
SEOはこれらの各タグをどのように使用する必要がありますか?
すべてのメタデータは価値がありますか?
場所(別名場所)タグ
この必須タグには、URLの場所の絶対的な正規バージョンが含まれています。
サイトのプロトコル(httpまたはhttps)を正確に反映し、wwwを含めるか除外するかを選択したかどうかを正確に反映する必要があります。
国際的なWebサイトの場合、これはhreflang処理を実装できる場所でもあります。
xhtml
link属性を使用して各URLの言語と地域のバリエーションを示すことにより、ページの読み込み時間を短縮できます。これは、<head>またはHTTPヘッダー内の他のリンク要素の実装では提供できません。
Yoastには、詳細を知りたい人のために、hreflangに関する壮大な投稿があります。
Lastmod(別名最終変更)タグ
ファイルの最終変更日時を通知するために使用される、オプションですが強く推奨されるタグ。
John Muellerは、Googleがlastmodメタデータを使用して、ページが最後に変更されたのはいつか、クロールする必要があるかどうかを理解していることを認めました。 2015年のイリーズからの矛盾したアドバイス。
最終変更時刻は、Googleがあなたが元の発行者であることを理解するのに役立つため、コンテンツサイトにとって特に重要です。
鮮度を伝えることも強力です。意味のある変更を加えた場合にのみ、変更日を更新してください。
コンテンツが新鮮であると検索エンジンをだまそうとすると、そうでない場合でも、Googleのペナルティが発生する可能性があります。
Changefreq(別名Change Frequency)タグ
昔々、このオプションのタグは、URLのコンテンツが検索エンジンに変更されると予想される頻度を示唆していました。
しかし、ミューラー氏は、「変更頻度はサイトマップではそれほど重要ではない」と述べ、「タイムスタンプを直接指定する方がはるかに優れている」と述べています。
優先タグ
このオプションのタグは、表面上、ページが他のURLと比較してどれほど重要であるかを0.0から1.0のスケールで検索エンジンに伝えます。
せいぜい、それは検索エンジンへのヒントに過ぎず、ミューラーとイリーズの両方がそれを無視すると明確に述べています。
重要なポイント
WebサイトにはXMLサイトマップが必要ですが、必ずしも優先度と変更頻度のメタデータが必要なわけではありません。
lastmodタグを正確に使用し、正しいURLが送信されていることを確認することに注意を向けてください。
サイトマップの種類
サイトマップにはさまざまな種類があります。 実際に必要なものを見てみましょう。
XMLサイトマップインデックス
XMLサイトマップにはいくつかの制限があります。
- 最大50,000URL
- 非圧縮ファイルサイズの制限は50MB
サイトマップはgzipを使用して圧縮でき(ファイル名はsitemap.xml.gzのようになります)、サーバーの帯域幅を節約できます。 ただし、解凍した後でも、サイトマップはどちらの制限も超えることはできません。
いずれかの制限を超える場合は常に、URLを複数のXMLサイトマップに分割する必要があります。
これらのサイトマップは、多くの場合sitemap-index.xmlという名前の単一のXMLサイトマップインデックスファイルに結合できます。 基本的に、サイトマップのサイトマップ。
よりきめ細かいアプローチを取りたい非常に大規模なWebサイトの場合は、複数のサイトマップインデックスファイルを作成することもできます。
例えば:
- sitemap-index-articles.xml
- sitemap-index-products.xml
- sitemap-index-categories.xml
ただし、サイトマップインデックスファイルをネストすることはできないことに注意してください。
検索エンジンがサイトマップファイルのすべてを一度に簡単に見つけるには、次のことを行う必要があります。
- サイトマップインデックスをGoogle検索コンソールとBingウェブマスターツールに送信します。
- robots.txtファイルでサイトマップインデックスのURLを指定します。 検索エンジンをサイトマップに直接向けて、クロールを歓迎します。
Googleにpingを送信してサイトマップを送信することもできます。
ただし、注意してください。
Googleは、「未確認のサイトマップ」のhreflangエントリに注意を払わなくなりました。これは、Tom Anthonyがping URLを介して送信されたエントリを意味すると考えています。検索エンジンがサイトマップファイルをすべて一度に簡単に見つけるには、次のようにします。
- サイトマップインデックスをGoogle検索コンソールとBingウェブマスターツールに送信します。
- robots.txtファイルでサイトマップインデックスのURLを指定します。 検索エンジンをサイトマップに直接向けて、クロールを歓迎します。
XML画像サイトマップ
画像サイトマップは、画像コンテンツのインデックス作成を改善するために設計されました。
ただし、現代のSEOでは、画像はページコンテンツに埋め込まれているため、ページのURLとともにクロールされます。
さらに、JSON-LD schema.org/ ImageObjectマークアップを利用して、画像XMLサイトマップよりも多くの属性を提供するため、検索エンジンに画像プロパティを呼び出すことをお勧めします。
このため、ほとんどのWebサイトではXMLイメージサイトマップは不要です。 画像サイトマップを含めると、クロールの予算が無駄になるだけです。
これの例外は、ストックフォトウェブサイトやeコマースサイトがGoogle画像検索から商品ページセッションを取得するなど、画像がビジネスの推進に役立つ場合です。
サイトマップで送信するために、画像がウェブサイトと同じドメインにある必要はないことを知っておいてください。 検索コンソールで確認されている限り、CDNを使用できます。
XMLビデオサイトマップ
画像と同様に、動画がビジネスにとって重要な場合は、XML動画サイトマップを送信します。そうでない場合は、動画サイトマップは不要です。
ビデオが埋め込まれているページのクロール予算を保存し、JSON-LDを使用してすべてのビデオをschema.org/VideoObjectとしてマークアップできるようにします。
Googleニュースサイトマップ
このサイトマップを使用するのは、Googleニュースに登録されているサイトのみです。
含まれている場合は、過去2日間に公開された記事をサイトマップごとに最大1,000のURLに含め、公開されたらすぐに新しい記事で更新します。
一部のオンラインアドバイスとは異なり、Googleニュースのサイトマップは画像のURLをサポートしていません。
schema.orgの画像またはog:imageを使用して、Googleニュースの記事のサムネイルを指定することをお勧めします。
モバイルサイトマップ
これはほとんどのWebサイトでは必要ありません。
どうして? Muellerが確認したモバイルサイトマップは、フィーチャーフォンページ専用です。 スマートフォンとの互換性はありません。
したがって、フィーチャーフォン用に特別に設計された一意のURLがない限り、モバイルサイトマップは役に立ちません。
HTMLサイトマップ
XMLサイトマップは、検索エンジンのニーズに対応します。 HTMLサイトマップは、人間のユーザーがコンテンツを見つけるのを支援するために設計されました。
問題は、優れたユーザーエクスペリエンスと巧妙に作成された内部リンクがある場合、HTMLサイトマップが必要かどうかということです。
GoogleAnalyticsでHTMLサイトマップのページビューを確認してください。 たぶん、それは非常に低いです。 そうでない場合は、ウェブサイトのナビゲーションを改善する必要があることを示しています。
HTMLサイトマップは通常、Webサイトのフッターにリンクされています。 あなたのウェブサイトのすべてのページからリンクの公平性を取ります。
自問してみてください。 それはそのリンクエクイティの最善の使用法ですか? または、従来のWebサイトのベストプラクティスに賛成するものとしてHTMLサイトマップを含めていますか?
少数の人間がそれを使用する場合。 また、強力な内部リンクとXMLサイトマップがあるため、検索エンジンはそれを必要としません。 そのHTMLサイトマップには存在する理由がありますか? 私はノーと主張します。
動的XMLサイトマップ
静的サイトマップは、ScreamingFrogなどのツールを使用して簡単に作成できます。
問題は、ページを作成または削除するとすぐに、サイトマップが古くなることです。 ページのコンテンツを変更しても、サイトマップはlastmodタグを自動的に更新しません。
したがって、変更ごとにサイトマップを手動で作成してアップロードするのが好きでない限り、静的なサイトマップは避けるのが最善です。
一方、動的XMLサイトマップは、サーバーによって自動的に更新され、関連するWebサイトの変更が発生したときに反映されます。
動的XMLサイトマップを作成方法
- 開発者にカスタムスクリプトのコーディングを依頼し、明確な仕様を提供するようにしてください
- 動的サイトマップジェネレータツールを使用する
- WordPress用のYoast SEOプラグインなど、CMS用のプラグインをインストールします
重要なポイント
動的XMLサイトマップとサイトマップインデックスは、最新のベストプラクティスです。 モバイルとHTMLのサイトマップはそうではありません。
画像、動画、Googleニュースのサイトマップは、これらのコンテンツタイプのインデックス作成が改善されてKPIが向上する場合にのみ使用してください。
XMLサイトマップインデックスの最適化
さて、楽しい部分です。 XMLサイトマップをどのように使用してSEOKPIを推進しますか。
XMLサイトマップにSEO関連ページのみを含める
XMLサイトマップは、クロールすることをお勧めするページのリストです。これは、必ずしもWebサイトのすべてのページであるとは限りません。
検索スパイダーは、クロールするページ数の「許容値」とともにWebサイトに到着します。
XMLサイトマップは、含まれているURLが、ブロックされていないがサイトマップに含まれていないURLよりも重要であると考えていることを示しています。
これを使用して、検索エンジンに「特にこれらのURLに焦点を当てていただければ幸いです」と伝えています。
基本的に、クロールバジェットを効果的に使用するのに役立ちます。
SEO関連のページのみを含めることで、検索エンジンがサイトをよりインテリジェントにクロールして、より適切なインデックス作成のメリットを享受できるようになります。
除要項目
- 非正規ページ
- 重複ページ
- ページ付けされたページ
- パラメータまたはセッションIDベースのURL
- サイト検索結果ページ
- コメントURLに返信
- メールURLで共有
- SEOに不要なフィルタリングにより作成されたURL
- アーカイブページ
- リダイレクト(3xx)、欠落ページ(4xx)、またはサーバーエラーページ(5xx)
- robots.txtでブロックされたページ
- インデックスのないページ
- 潜在顧客フォームからアクセスできるリソースページ(ホワイトペーパーPDFなど)
- ユーザーにとって有用であるが、ランディングページを意図していないユーティリティページ(ログインページ、お問い合わせ、プライバシーポリシー、アカウントページなど)
ページの優先順位付けに関するMichaelCottamの例を共有したいと思います。
あなたのウェブサイトが1,000ページあるとしましょう。 1,000ページのうち475ページはSEO関連のコンテンツです。 XMLサイトマップでこれらの475ページを強調表示し、基本的に残りのインデックスの優先順位を下げるようにGoogleに依頼します。
ここで、Googleがそれらの475ページをクロールし、アルゴリズムによって175が「A」グレード、200が「B +」、100が「B」または「B-」であると判断したとします。これは強力な平均成績であり、おそらくユーザーを送るための質の高いWebサイトを示しています。
XMLサイトマップを介して1,000ページすべてを送信するのとは対照的です。現在、GoogleはあなたがSEO関連のコンテンツであるとあなたが言う1,000ページを見て、50パーセント以上が「D」または「F」ページであるとわかります。あなたの平均成績はもうそれほど良く見えていません、そしてそれはあなたの有機的なセッションに害を及ぼすかもしれません。
ただし、GoogleはXMLサイトマップを、サイトで重要なことの手がかりとしてのみ使用することを忘れないでください。
XMLサイトマップにないからといって、必ずしもGoogleがそれらのページをインデックスに登録しないことを意味するわけではありません。
SEOに関しては、サイト全体の品質が重要な要素です。
サイトの品質を評価するには、Google検索コンソール(GSC)のサイトマップ関連のレポートを参照してください。
重要なポイント
XMLサイトマップURLをSEO関連ページのみに制限することでクロール予算を管理し、時間をかけてWebサイトの低品質ページの数を減らします。
サイトマップレポートを完全に活用する
新しいGoogle検索コンソールのサイトマップセクションは、以前に提供されていたものほどデータが豊富ではありません。
現在の主な用途は、サイトマップインデックスが正常に送信されたことを確認することです。
数値ではなく説明的な命名規則を使用することを選択した場合は、「検出」されたさまざまなタイプのSEOページの数を把握することもできます。つまり、サイトマップやその他の方法でGoogleが見つけたすべてのURLです。 次のリンクとして。
新しいGSCでは、サイトマップに関してSEOにとってより価値のある領域は、インデックスカバレッジレポートです。
レポートはデフォルトで「すべての既知のページ」になります。 ここでできます:
・「エラー」または「警告付きで有効」の問題に対処します。 これらは多くの場合、競合するロボット指令に起因します。 1つ解決しました。必ず、カバレッジレポートを介して修正を検証してください。
・インデックスの傾向を見てください。 ほとんどのサイトは継続的に価値のあるコンテンツを追加しているので、「有効な」ページ(別名Googleによってインデックス付けされたページ)は着実に増加するはずです。 劇的な変化の原因を理解します。
・「有効」を選択し、「インデックス付き、サイトマップに送信されていない」タイプの詳細を確認します。 これらはあなたとグーグルがそれらの価値について意見が一致しないページです。 たとえば、プライバシーポリシーのURLを送信していないのに、Googleがページをインデックスに登録しているとします。 このような場合、実行するアクションはありません。 あなたがする必要があること
注目すべきは、ページ付けの処理が不十分、パラメータの処理が不十分、コンテンツの重複、またはページが誤ってサイトマップから除外されていることに起因するインデックス付きURLです。
その後、ドロップダウンを[送信されたすべてのページ]に変更して、サイトマップに含めたSEO関連のURLにレポートを制限します。 次に、すべての「除外」ページの詳細を確認します。
サイトマップURLを除外する理由
1.クイックウィン
重複コンテンツ、カノニシャル、ロボットディレクティブ、40X HTTPステータスコード、リダイレクト、または合法性の除外については、適切な修正が行われます。
2.調査ページ
「送信されたURLが削除されました」と「クロールの異常」の両方の除外について、Fetch asGoogleツールを使用してさらに調査します。
3.ページの改善
「クロール済み-現在インデックスが作成されていない」ページの場合は、ページ(または一般的には同様の種類の多くのURLであるためページタイプ)のコンテンツと内部リンクを確認します。薄いコンテンツ、オリジナルではないコンテンツに苦しんでいるか、孤立している可能性があります。
4.ドメインの改善
「検出済み-現在インデックスに登録されていない」ページの場合、Googleは、「URLをクロールしようとしましたが、サイトが過負荷になっている」ため、除外の一般的な理由を示しています。だまされてはいけません。内部リンクが不十分であるか、ドメインから見たコンテンツの品質が低いため、Googleが「努力する価値がない」と判断した可能性が高くなります。これらの除外が多数表示される場合は、サイトマップを介して送信したページ(またはページタイプ)のSEO値を確認し、クロール予算の最適化に重点を置き、リンクとコンテンツの両方からパラメーターを含む情報アーキテクチャを確認します。視点。
行動計画が何であれ、ベンチマークKPIを必ず書き留めてください。
サイトマップ最適化の取り組みの影響を評価するための最も有用な指標は、「送信されたすべてのページ」のインデックス作成率です。これは、検出されたURLの総数から有効なページの割合を取得して計算されます。
これを80%以上にするように努めます。
なぜ100パーセントにしないのですか? 現在持っているすべてのSEO関連のURLがインデックスに登録されるようにすることに全力を注いでいると、コンテンツの範囲を拡大する機会を逃した可能性があります。
注:サイトを複数のサイトマップインデックスに分割することを選択した大規模なWebサイトの場合は、それらのインデックスでフィルタリングできます。
これにより、次のことが可能になるだけではありません。
1.より詳細なレベルで概要チャートを参照してください。
2.除外のタイプを調査するときは、より多くの関連する例を参照してください。
3.セクションごとにインデックス率の最適化に取り組みます。
重要なポイント
警告とエラーを特定することに加えて、インデックスカバレッジレポートをXMLサイトマップ調査ツールとして使用して、インデックスの問題を特定できます。
XMLサイトマップのベストプラクティスチェックリスト
次のことに時間を費やしてください。
- gzipを使用してサイトマップファイルを圧縮する
- サイトマップインデックスファイルを使用する
- 画像、動画、Googleニュースのサイトマップは、インデックス作成によってKPIが促進される場合にのみ使用してください
- XMLサイトマップを動的に生成する
- URLが単一のサイトマップにのみ含まれていることを確認します
- robots.txtの参照サイトマップインデックスURL
- サイトマップインデックスをGoogle検索コンソールとBingウェブマスターツールの両方に送信する
- XMLサイトマップにSEO関連のページのみを含める
- すべてのエラーと警告を修正します
- 有効なページの傾向と種類を分析する
- 提出ページのインデックス率を計算する
- 提出されたページの除外の原因に対処する