llms.txt と構造化データ ―AIに正しく伝える基礎整備

AIに引用されるかどうかは、コンテンツの良し悪し以前に「機械が正しく読めるか」で決まります。llms.txt と構造化データ(JSON-LD)は、その土台を整える最小コストの基礎整備です。

技術実装 llms.txt 構造化データ / JSON-LD

この記事でわかること

  • llms.txt の役割・書き方・配置場所と最小記述例
  • JSON-LD / Schema.org(Article・FAQPage・Organization)の実装ポイント
  • llms.txt と robots.txt / sitemap.xml の違いと使い分け
目次
  1. 結論:基礎整備は2点セットで効く
  2. なぜ「機械可読性」がAI引用を左右するのか
  3. llms.txt の書き方・配置・記述例
  4. llms.txt と robots.txt / sitemap.xml の違い
  5. 構造化データ(JSON-LD)の実装ポイント
  6. 基礎整備の手順(5ステップ)
  7. よくある質問

1. 結論:基礎整備は2点セットで効く

TL;DR:AIに自社情報を正しく理解・引用させるための土台は、llms.txt(AIに読んでほしい主要ページを案内するMarkdownファイル)と構造化データ(JSON-LD)(ページの意味を機械可読にするマークアップ)の2点です。前者はAIに“目次”を渡し、後者は各ページの内容を曖昧さなく伝えます。いずれも実装コストが低く、コンテンツの質を底上げする前提となる「最小コストの基礎整備」として、優先的に着手する価値があります。

本記事は技術的な実装に踏み込んだ手順書です。GEO全体の考え方・従来SEOとの違いといった概論はLLM時代のSEOの基礎と戦略で扱っています。本記事はそこから一歩進み、「AIに正しく伝えるための具体的なファイル整備」に絞って解説します。

2. なぜ「機械可読性」がAI引用を左右するのか

生成AIや検索エンジンは、ページのHTMLを解析して「何について書かれたページか」「運営者は誰か」「いつ更新されたか」を推定します。この推定が曖昧なほど、引用候補から外れやすくなります。基礎整備の狙いは、推定に頼らせず事実を構造で明示することです。

  • llms.txt:サイト内のどのページを優先的に参照すべきかをAIに案内する
  • 構造化データ:各ページの種別(記事・FAQ・運営者)と属性を機械可読に宣言する

前者が「サイトレベルの案内」、後者が「ページレベルの宣言」です。両方を揃えることで、AIは迷いなく情報を抽出できます。

3. llms.txt の書き方・配置・記述例

llms.txt は、AIに読んでほしい主要コンテンツを案内するためのMarkdown形式のファイルです。配置場所はサイトのルート直下(https://example.com/llms.txt)で、robots.txt や sitemap.xml と同じ階層に置きます。

3.1 基本フォーマット

先頭に H1 でサイト名、引用ブロックで概要、見出しごとにリンクリストを並べる構成が標準です。各リンクには短い説明を添えると、AIが用途を判断しやすくなります。

# Example Inc.

> AI検索・GEO対策のためのSaaS。ブランドの露出と引用状況を追跡・分析します。

## ドキュメント

- [製品概要](https://example.com/product/): 主要機能と対応エンジンの一覧
- [料金プラン](https://example.com/pricing/): 各プランの比較と無料トライアル
- [導入ガイド](https://example.com/guides/start/): 初期設定から計測開始までの手順

## 記事

- [GEOとは](https://example.com/article/geo/): 生成エンジン最適化の基礎
- [引用分析の進め方](https://example.com/article/citation/): 改善優先度の決め方

## Optional

- [更新履歴](https://example.com/changelog/): リリースノート

3.2 記述のポイント

  • 重要ページに絞る:全URLを列挙せず、AIに参照してほしい中核ページを厳選する
  • 説明を1行添える:リンク先の用途を簡潔に書き、文脈を補う
  • 「Optional」見出し:優先度の低い補足リンクはこの見出しにまとめる慣習がある
  • 詳細版の併設:本文を丸ごと含めたい場合は llms-full.txt を別途用意する
注意:llms.txt は現時点で全AIが公式対応を保証する規格ではありません。設置だけで引用が増えるものではなく、構造化データや本文品質と組み合わせて初めて効果が出ます。低コストで「損のない整備」と捉えてください。

4. llms.txt と robots.txt / sitemap.xml の違い

ルート直下に置く3つのファイルは目的が異なります。混同せず役割分担を理解することが重要です。

ファイル 主な目的 主な対象 形式
llms.txt AIに読んでほしい重要ページを案内する LLM・AI検索 Markdown
robots.txt クロールの可否(許可/禁止)を制御する 検索クローラー全般 独自テキスト規約
sitemap.xml サイト内の全URLと更新情報を網羅的に伝える 検索クローラー全般 XML

sitemap.xml が「全URLの網羅的なリスト」であるのに対し、llms.txt は「重要ページを絞った案内(目次)」です。robots.txt のようにアクセスをブロックする機能はありません。3つは排他ではなく、併用して整備します。

5. 構造化データ(JSON-LD)の実装ポイント

構造化データは Schema.org の語彙を用い、推奨形式である JSON-LD で記述します。script タグにまとめて記述でき、HTML本文と分離されるため保守性が高いのが利点です。

5.1 主要スキーマと用途

スキーマ 用途 主なプロパティ
Organization 運営者情報(全ページ共通) name / url / logo / sameAs
Article 記事・ブログページ headline / datePublished / author / publisher
FAQPage Q&Aを含むページ mainEntity(Question / acceptedAnswer)
BreadcrumbList パンくず階層 itemListElement(position / name / item)
HowTo 手順・ハウツー記事 step(HowToStep)

5.2 Article の記述例

記事ページには、見出し・公開日・更新日・著者・発行者を明示します。

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "Article",
  "headline": "llms.txt と構造化データ ―AIに正しく伝える基礎整備",
  "datePublished": "2026-02-14",
  "dateModified": "2026-02-14",
  "author": { "@type": "Organization", "name": "Example Inc." },
  "publisher": {
    "@type": "Organization",
    "name": "Example Inc.",
    "logo": {
      "@type": "ImageObject",
      "url": "https://example.com/logo.png"
    }
  }
}
</script>

5.3 FAQPage の記述例

ページに表示しているQ&Aと完全に一致させることが必須です。表示と異なる内容を記述すると、評価対象から外れる場合があります。

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "FAQPage",
  "mainEntity": [
    {
      "@type": "Question",
      "name": "llms.txt はどこに置きますか?",
      "acceptedAnswer": {
        "@type": "Answer",
        "text": "サイトのルート直下に配置します。"
      }
    }
  ]
}
</script>
実装Tip:複数スキーマは @graph 配列にまとめると、ページ全体の関係(WebPage・Article・FAQPage・BreadcrumbList)を一括で宣言でき、管理しやすくなります。実装後は必ずリッチリザルトテストで構文と必須プロパティを検証してください。

6. 基礎整備の手順(5ステップ)

影響範囲の広い構造化データから着手し、最後に案内役の llms.txt を設置するのが効率的です。

  • STEP1:Organization を全ページに実装 ― 運営者名・URL・ロゴ・SNS(sameAs)を共通定義する
  • STEP2:記事に Article を実装 ― headline・公開日・更新日・著者・発行者を付与する
  • STEP3:FAQページに FAQPage を実装 ― 画面表示のQ&Aと一致させる
  • STEP4:検証ツールで確認 ― 構文エラー・必須プロパティ欠落・表示との不一致をチェックする
  • STEP5:llms.txt をルートに設置 ― AIに読んでほしい主要ページをリンクリストで案内する

整備した後は、AIでの露出・引用状況をモニタリングし、どのページが参照されているかを確認します。改善の優先順位の付け方は引用分析:強化すべきページの決め方で詳しく解説しています。基礎整備からコンテンツ改善まで一貫した実践ステップはGEO実践プレイブック 2026にまとめています。

ポイント:llms.txt と構造化データは「やれば引用される魔法」ではなく、AIにコンテンツを正しく認識させるための前提条件です。質の高い本文・明確な定義・更新性と組み合わせて、初めて引用獲得につながります。

よくある質問

llms.txt は必須ですか?設置すれば必ず引用されますか?

必須ではなく、現時点で全AIが公式対応を明言しているわけでもありません。ただし設置コストは低く、AIに参照してほしい主要ページを明示的に伝える「損のない基礎整備」です。設置だけで引用が保証されるものではなく、コンテンツの質・構造・更新性と併せて効果が出ます。

llms.txt はどこに置けばいいですか?

サイトのルート直下(https://example.com/llms.txt)に配置します。robots.txt や sitemap.xml と同じ階層です。詳細本文を別ファイルにする場合は llms-full.txt として併設する慣習があります。

llms.txt と robots.txt は何が違いますか?

robots.txt は「クロールの可否」を制御する古くからの規約、llms.txt は「AIに読んでほしい重要ページを案内する」目的のMarkdownファイルであり、アクセスをブロックするものではありません。AI向けの“目次”に近い役割です。

構造化データはどの形式で書くべきですか?

Google・各検索エンジンが推奨する JSON-LD 形式を使います。HTML属性に埋め込む Microdata/RDFa より保守性が高く、<script type="application/ld+json"> として head か body にまとめて記述できます。

まずどのスキーマから実装すべきですか?

サイト全体に Organization(運営者情報)、記事ページに Article、FAQを持つページに FAQPage の3種が起点として有効です。手順記事には HowTo、パンくずには BreadcrumbList を追加します。

構造化データを入れたのに認識されません。何を確認すべきですか?

①JSON-LDの構文エラー(カンマ・引用符)②ページ表示内容と構造化データの不一致 ③必須プロパティの欠落、の順で確認します。Googleのリッチリザルトテストやスキーマ検証ツールで構文と必須項目を検査してください。

llms.txt と構造化データ、どちらを先にやるべきですか?

影響範囲の広い構造化データ(Organization・Article)を先に整え、その後に主要ページを案内する llms.txt を設置する順序を推奨します。どちらも低コストなので、同じ改修サイクルでまとめて対応するのが効率的です。

AI時代のブランド戦略を始めませんか?

LLM Insightで、AIに選ばれるブランドへ

デモ予約する お問い合わせ 資料ダウンロード
料金・プラン