サイトマップとは「サイト内のコンテンツやページについての情報をまとめるためのMAP」を指します。一般的には「サイトマップファイル」のことをサイトマップと呼びますが、実はサイトマップには2種類が存在しています。
その2種類とは「HTMLサイトマップ」と「サイトマップファイル」です。
HTMLサイトマップ
こちらはサイトを訪れるユーザー向けのサイトマップで、「このサイトにはどんなページがありますよ~」というのを一覧にしてわかりやすくするためのMAPです。
ユーザーにとっては本物の地図と同じような役割で、このページに行きたいけどどこから行けばいいんだろう?と迷ってしまった時にはとっても役立つページとなります。
ユーザー向けである上にHTMLなので、もちろんページのデザインなども必要ですし、ユーザーが見やすいように作る必要があります。
こちらのHTMLサイトマップはユーザーのために役立ちますが、SEO的な面ではあまり効果はないと言われています。しかし、規模がそこそこ大きいサイトでは導入をしておくと、ユーザーは便利にサイトを使うことが出来ます。
サイトマップファイル
一般的にはXMLサイトマップとも呼ばれますが、こちらはクローラー向けに作られたサイトマップを指します。
サイト内でインデックスをさせたいページの一覧を特定の形式(クローラーが読み取れる形式)で記載することで、よりクローラーにサイト内を巡ってもらいやすくするためのMAPです。
こちらはクローラーに向けて配信されるため、デザインなどは特にこだわらず形式や記述する内容に気を付けます。また、内部リンクで繋ぐわけではなくrobots.txtへの記述やSearch Consoleを使ってサイトマップを送信するといった方法でないとクローラーは読み取ってくれません。
- 記述はXML、RSS(mRSS・Atom1.0)、テキスト、Googleサイトでのみ可能
- 基本の記述はUTF-8、URLエスケープが必要
- 1サイトマップの上限は50MB、50,000URL以内で記述
- 拡張機能は「動画」「画像」「ニュース」
サイトマップ内には基本的に「インデックスをさせたいURLのみ」記載をします。
容量が大きくなるようであればサイトマップを複数格納できるサイトマップを使用し、分割をします。
一般的に使われる記述方法はXMLでの記述です。標準的なXMLの記述方法に則りますが、ここでは基礎的な記述方法を紹介します。
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.example.com/</loc> <lastmod>2018-09-04</lastmod> </url> <url> <loc>http://www.example.com/sample.html</loc> <lastmod>2018-08-22</lastmod> </url> </urlset>
<urlset></urlset>で囲まれた中に、1つ分を<url></url>で囲まれたURLを記載します。実際のURLは<loc></loc>で囲み、付属情報として「lastmod(最終更新日)」や「priority(更新頻度)」などを記述することが出来ます。
lastmodはGoogleが訪問時に参考にしているようですが、priorityは現在使用していないとのことです。記述が大変であれば省いてしまってもいいでしょう。
より詳しい書き方などはGoogleにインデックスを促そうのコラムでも紹介しています。