Semalt Expert:Googleが古いサイトマップをクロールしないようにするためのガイド

あなたのウェブサイトが成長するにつれて、あなたはインターネット上でのその視認性と信頼性を改善する方法を見つけるために最善を尽くします。時々、私たちのサイトが以前はどのように機能していたかという影響が後を絶たないことがあり、これが私たちが注意を払うべき場所です。

Googleが古いサイトをクロールしないようにするために、 SemaltのカスタマーサクセスマネージャーであるMax Bellから次のヒントを入手してください。

数週間前、私のクライアントの1人がeコマースのウェブサイトを持っていると私に言った。 URL構造からサイトマップに至るまで、サイトがより見やすくなるようにすべてが変更されました。

お客様はGoogle Search Consoleにいくつかの変更があったことに気づき、そこでクロールエラーを見つけました。彼が見たのは、偽のトラフィックを生成している古いURLと新しいURLが多数あったことです。ただし、一部にはAccess Denied 403およびNot Found 404エラーが表示されていました。

私の顧客は、彼が抱えていた最大の問題は、ルートフォルダーに存在する古いサイトマップであると言っていました。彼のウェブサイトは以前はさまざまなGoogle XMLサイトマッププラグインを使用していましたが、現在はサイトマップをYoastによるWordPress SEOに依存しています。しかし、さまざまな古いサイトマッププラグインが彼を混乱させました。それらは、sitemap.xml.gzという名前のルートフォルダーにありました。 Yoastプラグインを使用してすべての投稿、ページカテゴリ、タグのサイトマップを作成し始めたため、これらのプラグインは必要なくなりました。残念ながら、この人物はsitemap.xml.gzをGoogle Search Consoleに送信していません。彼は自分のYoastサイトマップを送信しただけで、Googleも古いサイトマップをクロールしていた。

何をクロールしますか?

ルートフォルダーから古いサイトマップを削除しなかったため、インデックスも作成されていました。私は彼に戻り、サイトマップは検索エンジンの結果でクロールする必要があるものの単なる提案であると説明しました。古いサイトマップを削除すると、Googleが無効なURLをクロールできなくなると思われるかもしれませんが、そうではありません。私の経験によると、Googleは古いURLを1日に数回インデックスに登録しようとし、404エラーが本物であり、偶然ではないことを確認しています。

Googlebotは、サイトのサイトマップにある古いリンクと新しいリンクのメモリを保存できます。定期的にWebサイトにアクセスし、すべてのページが正しくインデックスに登録されていることを確認します。 Googlebotは、訪問者が問題を経験しないように、リンクが有効か無効かを評価しようとします。

クロールエラーの数が増えると、ウェブマスターが混乱することは明らかです。彼ら全員がそれを大幅に減らしたいと思っています。古いサイトマップをすべて無視するようにGoogleに通知する方法は?あなたはすべての不要な、そして奇妙なサイトマップのクロールを殺すことによってそうすることができます。以前は、それを可能にする唯一の方法は.htaccessファイルでした。いくつかのプラグインを提供してくれたWordPressに感謝します。

WordPress Webサイトのルートフォルダーにこのファイルがあります。したがって、FTPにアクセスしてcPanelの隠しファイルを有効にするだけです。要件に従ってこのファイルを編集するには、ファイルマネージャオプションに移動します。誤って編集するとサイトに損害を与える可能性があることを忘れないでください。そのため、常にすべてのデータをバックアップする必要があります。

スニペットをファイルに追加すると、期限切れのすべてのURLがすぐにクロールエラーから削除されます。 Googleがあなたのサイトをライブに保ち、404エラーの可能性を減らすことを望んでいることを忘れないでください。

mass gmail