構造化データとは人間が使う言葉の意味を、Googleのロボットが理解できるような情報に変換されたデータを指します。
人間が日常使っている言葉をGoogleのロボットは正しく理解が出来ません。これは人間と機械の言語の違いですが、Web上にある文章のデータはGoogleのロボットはほぼ意味を分からずに読んでいる事になります。検索エンジンはWeb上の文章をただの文字として見て扱っていましたが、そうではなく、人間と同じようにちゃんと「意味のある文章」としてWeb上の文字を認識させていこう!という考えが生まれました。
この考え方をセマンティック・ウェブと呼びます。
このセマンティック・ウェブを実現させるための手段として考えられたのが構造化データです。
構造化データマークアップとは
構造化データには取り決められたデータがあります。「こんな意味が込められていますよ」という情報をあらかじめGoogleのロボットが分かる言語で作り理解をさせておき、その言語をタグを使用してWeb上の文章に組み込んでいきます。
こうすることで、Googleのロボットはその文章の意味を理解することが出来るのです。
例えば、下の文章を見てください。
私の名前はつじといいます。
みんなからはつじさんって呼ばれるんですよ。
私達が見れば誰かが自己紹介してるなぁ、と分かるのですが、ロボットがそれを理解するのはかなり難しいことです。そこで
<ここからは人のことです>私の名前は<ここからが名前です>つじ<ここまで>といいます。
みんなからは<ここからがニックネームです>つじさん<ここまで>って呼ばれるんですよ。<ここまで>
というような感じでGoogleのロボットにその文章はどんな意味です、というのを伝えてあげるタグを付けてあげます。これで、Googleのロボットの「つじ」という人がいて、ニックネームは「つじさん」なのだ、と理解が出来ます。
このように、Webの文章に構造化データなどのタグ情報を付与していく作業を、マークアップするといいます。
そのため、構造化データマークアップというのは、「ウェブ上の文章にGoogleが理解できるタグ情報を付与すること」を指します。
ボキャブラリーとシンタックス
構造化データには様々な情報がありますが、それら情報のことを「ボキャブラリー」と呼びます。このボキャブラリーはschema(スキーマ)と呼ばれるものが現在有名ですが、これはGoogleなどの大手検索エンジンが共同で開発したものです。数多くのデータを保持しており、これらのデータを使ってマークアップをすることで多くの検索エンジンが言葉の意味を理解することが出来ます。
上記のボキャブラリーをマークアップしていくにはタグが必要ですが、そのマークアップ方法にも幾つかの方法が用意されています。その方法を「シンタックス」と呼びます。
有名なシンタックスは
- Microdata
- RDFa
- Microformats
- JSON-LD
それぞれに特徴がありますが、Googleが現在(2018年1月)推奨しているのはJSON-LDです。
ボキャブラリーとシンタックスの詳しい情報と書き方は下記のブログで紹介していますのでぜひこちらを読んでみてください。
構造化データマークアップのメリット
少し手間を感じてしまう構造化データマークアップですが、これをすることで色々なメリットが生まれます。
まず、Googleなどの大手検索エンジンのロボットが文章の内容をより理解してくれます。そのため、サイト内の評価をする際に大きく役立ちます。また、Googleの検索結果においてはリッチスニペットにマークアップされた情報が表示されることがあります。
このことで、検索結果上でユーザーの目を惹くことができ、結果クリック率のアップなどが望めます。
このように、SEOをやる上では魅力的な情報が満載の構造化データマークアップです。Googleも推奨しているため、今後はかなり重要な項目になっていくと考えられています。