Murrough Foley

Murrough Foley

Consultant et chercheur en SEO technique avec 15 ans d'expérience en optimisation pour les moteurs de recherche, extraction de données web et apprentissage automatique appliqué. Je développe des outils open-source en Rust pour l'extraction de contenu web et la classification des types de pages, et je publie des recherches sur les signaux de qualité du contenu et leur corrélation avec les classements Google. Auteur de rs-trafilatura et du benchmark d'extraction de contenu web WCXB.

SEO Technique

Optimisation du crawl, architecture du site et stratégie d’indexation — les décisions d’infrastructure qui déterminent si vos pages seront trouvées. J’ai passé 15 ans à travailler sur cela pour des sites allant des petites entreprises locales aux plateformes multi-régions avec des millions de pages.

Extraction de Contenu Web

J’ai créé rs-trafilatura car les outils existants échouent sur tout ce qui n’est pas un article de blog. Extraction intelligente selon le type de page avec classification ML, score de confiance et sortie en markdown. Évalué contre 14 extracteurs sur un jeu de données de 2 008 pages.

Analyse et Notation du Contenu Web

Les LLM peuvent-ils évaluer la qualité du contenu comme le fait Google ? J’ai élaboré des grilles d’évaluation basées sur les signaux de la fuite de l’API Google — contentEffort, originalContentScore, page2vecLq — et les ai testées sur 44 000 résultats SERP. Réponse courte : la cohérence thématique prédit le classement, mais l’autorité du domaine est 10 fois plus importante.

Analyse Sémantique et Thématique

Autorité thématique, relations entre entités et analyse des lacunes de contenu. Google évalue la concentration thématique mathématiquement — en utilisant des signaux comme siteRadius et les embeddings au niveau de la page. Comprendre comment votre contenu s’inscrit dans ces structures vous indique où vous avez de la profondeur et où vous êtes trop dispersé.

Murrough Foley

Restons en contact

Retrouvez-moi sur LinkedIn ou X.