
検索エンジン最適化
コンテンツの品質は実際にGoogleの順位を予測するのか?4万4千ページを分析してわかったこと。
Read more about this topic...
2 min readRead article

Read more about this topic...
Read more about this topic...

Read more about this topic...

Read more about this topic...
クロール最適化、サイト構成、インデックス戦略——これらのインフラ決定が、ページの検索可否を左右します。15年間、地域の中小企業サイトから数百万ページを抱える多地域プラットフォームまで、様々な規模のサイトでこの分野に取り組んできました。
既存ツールがブログ記事以外で機能しない現状を解決するため、rs-trafilaturaを開発しました。ML分類によるページ種別認識、信頼度スコアリング、Markdown出力を実装。2,008ページのデータセットで14種の抽出ツールと比較評価を行っています。
LLMはGoogleと同様にコンテンツ品質を評価できるか?Google API流出情報からcontentEffort、originalContentScore、page2vecLqなどのシグナルに基づく評価基準を作成し、44,000件のSERP結果で検証しました。結論:トピックの一貫性は順位予測に有効ですが、ドメイン権威性はその10倍の重要度を持ちます。
トピックの権威性、エンティティ関連性、コンテンツギャップ分析。GoogleはsiteRadiusやページ埋め込みなどのシグナルを用いて、トピック集中度を数学的に評価しています。コンテンツがこれらの構造にどう対応するかを理解すれば、深掘りが必要な分野と分散しすぎている分野が明確になります。