ChatGPTに引用されるサイトの条件|クロールの仕組みとデータで解説
あなたのサイト、ChatGPTに引用されていますか?
Perplexityで検索したとき、
自分のサイトが回答に出てきた。
そういう体験、まだ少ないかもしれません。
でも、
AIに引用されるかどうかは、運ではありません。
クロールの仕組みがあって、
信頼の条件があって、
コンテンツの構造がある。
データで見ると、引用されるサイトには明確なパターンがあります。
目次
1.そもそもAIに引用されると何がいいのか
AIに引用されることで、何が変わるのか。
まず、トラフィックの話です。
従来のSEOは「検索結果に上位表示される=クリックされる」という構造でした。
AI検索は違います。
ユーザーはAIの回答を読んで、そこで完結することが多い。
クリックされなくても、ブランド名が回答の中に登場する。
それが積み重なると、認知が変わります。
「このサイト、よく見かける」
「AIがよく引用している」
検索経由ではなく、信頼経由で人が来る構造に変わっていきます。
数字で見ると、
AIのオーバービューに引用されたブランドは、オーガニッククリック率が35%高いというデータがあります。
(出典:Position Digital)
引用されることは、クリックを増やすだけでなく、
ブランドへの信頼をAIが代わりに作ってくれるということです。
2.ChatGPTはどうやってサイトを見つけているのか

AIクローラーは、ランダムにサイトを回っているわけではありません。
観測データや公開情報をもとにすると、大きく4つの動き方が見えてきます。
① 定期クロール
日本時間の深夜3〜5時頃、定期的にサイトを巡回しているクローラーが観測されています。
決まったスケジュールで、既知のサイトを定期的に再訪問する動きです。
(AI観測ラボでの観測より)
② リクエスト起点のクロール
ユーザーがChatGPTに質問したとき、
学習データに答えがなければ、リアルタイムでクローラーを走らせて情報を取りにいきます。
質問されるたびにサイトが読まれる可能性がある、と考えられています。
③ 第三者リンク経由の発見
被リンクや引用元をたどって、新しいサイトを発見するパターンも考えられます。
権威あるサイトからリンクされているサイトは、AIにとっても信頼の文脈で発見されやすい可能性があります。
④ サイトマップ・llms.txt経由の発見
①〜③がAI側の動きだとすると、④はサイト側からAIに迎えに行く動きです。
llms.txtやサイトマップで「ここを読んでください」と明示的に伝えることで、
発見される確率を高められると考えられています。
さらに、AIクローラーには用途別に種類があります。
学習データ収集用、検索結果生成用、エージェント用など、
目的によってクローラーが使い分けられている構造があると見られています。
robots.txtでAIクローラーを用途別に制御できるのも、この構造があるためです。
→ robots.txtでAIクローラーを制御する方法はこちら
3.AIに信頼されるサイトはどう作られているのか
AIクローラーに発見されても、引用されるとは限りません。
発見と信頼は、別の話です。
では、AIはどのサイトを信頼するのか。
OtterlyAIが100万件以上のAI引用を分析した結果、
AIの回答は自社サイトより第三者サイトに95%依存していることがわかっています。
つまり、自分のサイトをいくら最適化しても、
外部から言及されていなければ、AIに引用されにくい。
信頼は、自分では作れません。
第三者が言及することで、はじめて信頼が生まれます。
具体的に信頼につながる要素としては、
ニュースサイトや専門メディアへの掲載、SNSでの言及、
権威あるサイトからの被リンクなどが挙げられます。
また、ブランド名がQuoraやRedditのような
コミュニティプラットフォームで言及されているサイトは、
ChatGPTに引用される確率が約4倍高いというデータもあります。
SEOの文脈で言う「被リンク」に近い概念ですが、
AIの場合はリンクの数より言及の文脈と権威性が重要だと考えられています。
小さなところから始めるなら、
自分のサイトやブランド名をChatGPTやPerplexityで検索してみてください。
どんな文脈で言及されているか、どのサイトが引用されているか。
引用されているサイトの共通点を見ると、信頼の構造が見えてきます。
4.引用されるコンテンツのパターン
どんな記事がAIに引用されやすいのか。
これも、データが出ています。
LLMの引用分析によると、引用の44.2%は記事の冒頭30%から発生しています。
中盤が31.1%、結論部分が24.7%。
つまり、記事の冒頭で結論を出している文章ほど引用されやすい。
「読ませる文章」より「答えを先に出す文章」がAIに好まれます。
また、ChatGPTが引用しやすいコンテンツの特徴として、以下が挙げられています。
- 断定的な表現がある(「〜です」「〜とわかっています」)
- 疑問符を含む見出しがある(「〜とは?」「〜はなぜ?」)
- 固有名詞・数字・データが多い
- 事実と意見が明確に分かれている
- 文章構造がシンプル(一文が短い、段落が短い)
読み返してみると、
AI観測ラボのクローラー分析記事が引用されやすいのは、
時刻データや実測値など「他では取れない数字」があるからだと考えています。
オリジナルデータは、AIにとっても希少です。
5.自分のサイトで今すぐできること
ここまで読んで、「難しそう」と感じた方もいるかもしれません。
でも、今日からできることはあります。
まず確認すること
ChatGPTやPerplexityで、自分のサイト名やブランド名を検索してみてください。
引用されているか、どんな文脈で出てくるか。
現状を知るところが、すべての出発点です。
コンテンツで意識すること
記事の冒頭に結論を置く。一文を短くする。数字やデータを入れる。
特別なツールは不要です。書き方を変えるだけで、AIに読まれやすくなります。
技術面で整えること
robots.txtでAIクローラーをブロックしていないか確認する。
llms.txtを設置して、重要なページをAIに案内する。
構造化データを入れて、コンテンツの意味をAIに伝える。
詳しくは、それぞれの解説記事をご覧ください。
最後に、少し視点を変えた話をします。
AIはなぜ、特定のサイトを引用するのか。
技術的な説明はいろいろあります。でも、私はこう考えています。
AIは、自分が持っていない情報を探している。
学習済みのモデルには、過去のデータしかありません。
「今月の実測値」も「現在進行中の実験ログ」も、AIは自分では持てない。
だから、それを持っているサイトに引き寄せられる。
引用とは、AIが「ここには自分にないものがある」と判断したサインかもしれません。
完璧に整ったデータより、今この瞬間しか存在しない情報の方が、AIには価値がある。
あなたのサイトにしかない観測、あなたにしか書けない記録。
それが、AIに引用される一番の理由になる時代が来ているのだと思います。
あなたのサイトは、
AIに見えていますか?
URLを入力するだけで30秒。8項目を自動診断し、優先度別の改善プランを提示します。完全無料・登録不要。