Google に渡すサイトマップは XML じゃなくてテキストファイルでいいことになってた

ウェブサイトを運営するとき、サイトマップを作ることも多いと思います。
ユーザーに見せるやつじゃなくて、Google (など) に渡すやつ。

作らなくてもいいんだけど、
サイトマップがあった方が検索エンジンのクローラーに
「ほらここにページがあるから見に来てね」
と伝わりやすいという話になってますね。

このブログのサイトマップもここにあります。

XML じゃなくていい

さてこのサイトマップ、たしか仕様を知った頃は
XML で作ることになってたように思います。

XML の要素に情報を追加することで
サイトの状態について細かい指定ができるようになってますね。

ただ、そこまでちゃんとやってるとこはそんなに多くないんじゃないでしょうか。
要するにクロールしてほしい URL が伝わればいい。

知らなかったんだけど、URL を伝えるだけなら
XML じゃなくて URL を羅列したテキストファイルでもいいことになってました。

サイトマップの作成 – ウェブマスター ツール ヘルプ

テキスト ファイル: 基本的なサイトマップ(画像、動画などの特殊なデータはなく、ウェブページの URL のみ含まれるサイトマップ)の場合、1 行につき 1 つの URL を記載したテキスト ファイルを Google に送信できます。次に例を示します:

http://www.example.com/file1.html
http://www.example.com/file2.html

これは楽ちん。

テキストファイルでのサイトマップの書き方

おやくそくとしてはこんなところ。

  • Google は指定された URL をそのままクロールするため、完全な形で URL を指定する必要があります。
  • テキスト ファイルは UTF-8 エンコードで作成する必要があります。
  • テキスト ファイルに URL のリスト以外を含めることはできません。
  • テキスト ファイルの名前は自由に設定できます。ファイルの拡張子は .txt にすることをおすすめします(例: sitemap.txt)。

まあ素直に sitemap.txt にしとけばいいんじゃないかな。

あとは Google のウェブマスターツールに入ってこれを登録するだけ。

実際に運営してるサイトでやってみたけど、
ウェブマスターツールで問題なく認識されてました。

これは楽ちん

まあ多くの場合 XML を手書きすることはなくて
何か生成してくれるツールを使うことになるんだけど、
それにしてもテキストファイルに URL を羅列しとけばいいというのは楽ちん。

確か当初は XML だけだったと思うんだけどあってますよね。
実は最初からテキストファイルでもよかったんだったら、あの苦労は何だったのか。

  • このエントリーをはてなブックマークに追加