Félicitations ! Ton soutien à bien été envoyé à l’auteur
avatar
Directive Content-Signal
Non-fiction
Technologie
calendar Publié le 9 mai 2026
calendar Mis à jour le 9 mai 2026
time 11 min
Gabriel Dax verified
Gabriel Dax il y a 4 heures

素晴らしい記事ですね。Cloudflareがアメリカの企業なのが残念ですが、PanodysseyとCloudflareは最高の組み合わせです。ダニエルさん、お見事です。

Label de transparence créative
Tous publics
Image / Image humaine
Texte / Création humaine

Directive Content-Signal

L’idée sympa de Cloudflare

Alexandre m’a fait écrire des recommandations CSS. Gabriel m’a vendu Infomaniak. Quelques verres de Grignan-les-Adhémar aidant, je me suis mis à écrire deux ou trois lignes de code. Ça, c’est pour votre anecdote au coin du feu dans 20 ans.


Justement, en parlant de 20 ans, le paysage du web a quand même bien changé depuis le début des années 2000. Et on n’écrit plus les permissions d’accès à nos sites internet de la même façon. Le modèle vertueux selon lesquels les moteurs de recherche renvoyaient vers les sites qui leur permettaient d’explorer leurs contenus, c’est du passé.


L’IA est arrivée avec ses gros sabots et une culture du pillage qui balaye d’un revers de main le modèle économique sur lequel le web s’est construit.


Si vous suivez activement l’actualité de Panodyssey et que vous utilisez la Notice, vous avez certainement entendu parler d’ opt-out . Derrière ce gros-mot, se cache le signalement de votre refus de “fouille de texte et de données” par les agents IA. C’est porté par le protocole TDMRep (Text and Data Mining Reservation Protocol) et par la directive européenne 2019/790 concernant le droit d'auteur et les droits voisins.


Les anciens codeurs comme moi ont un réflexe quand on parle de robots. Le fameux fichier robots.txt placé à la racine du répertorie de votre site. Ben oui, les fichiers d’un site, c’est comme les fichiers de votre disque dur : ils sont rangés dans des répertoires.

La liste de Schindler

Votre robots.txt peut faire trois lignes comme des centaines de lignes en fonction de l’usage plus ou moins avancé que vous en faites. Les plus basiques servent à empêcher l’accès à certains dossiers. Et parfois, on peut faire des bêtises impactant gravement le SEO en privant les moteurs de recherche de comprendre notre UX. Les plus avancés permettent d’orienter et d’optimiser le trafic de votre site.


Ce n’est pas la solution la plus optimale, mais c’est la plus facile à écrire et à mettre en place. Et surtout, sa lecture est obligatoire pour les robots qui visitent votre site. Ce qui à l’horizon 2029 pourrait être supérieur au trafic humain.


Puisque qu’il permet de définir les droits pour chaque robot, le premier réflexe est d’y coller une liste d’agents qui ne sont pas autorisés. Il suffit de faire ça par exemple :

User-agent: MistralAI-User
Disallow: /


On peut en mettre plusieurs à la suite :

User-agent: MistralAI-User
User-agent: ChatGPT Agent
User-agent: ChatGPT-User
User-agent: anthropic-ai
Disallow: /


On commence comme ça et on fini par avoir une liste aussi longue que celle de monsieur Oskar Schindler, un industriel allemand du siècle dernier, connu pour sa fameuse liste qui a sauvé la vie à de nombreuses personnes. En tout cas, la liste contenue par le fichier robots.txt du journal Le Monde en prend la voie. Et ce n’est pas la plus longue que j’ai trouvé. (Oui, j’ai lu le robots.txt du Monde, et alors ?)


Au rythme où les choses évoluent, il faudrait presque employer un pigiste à temps plein pour mettre à jour ce fichier robots.txt . Or, ce n’est pas vraiment l’idée d’origine de ce gentil petit fichier. C’est là que Cloudflare entre en scène avec une proposition sincèrement intéressante : la Content Signal Policy lancée fin septembre 2025.

Une Directive pour les lier tous.

Cloudflare propose une idée simple et cohérente : l’ajout d’une directive au fichier robots.txt pour contrôler ce que les IA peuvent faire de vos contenus. Et quand une idée aussi simple est promue par l’une des entreprise les plus puissantes du web, elle est en bonne voie pour faire école.


D’ailleurs, Cloudflare est littéralement un mastodonte du web dont il contrôle 20% du traffic mondial. Sa solution de CDN (Content Delivery Network) représente plus de 80% de parts de marché.


Par ailleurs, l’entreprise a automatiquement déployé sa Content Signal Policy sur 3,8 millions de domaines via son service de robots.txt géré.


Et même si vous n’êtes pas client, Cloudflare vous propose de la générer gratuitement sur le site qui lui est dédié : https://contentsignals.org/


Voyons à quoi ça ressemble et quels en sont les avantages.

Alors à quoi ressemble le fichier robots.txt de demain ?

D’abord une déclaration de condition d’accès assortie d’une clause juridique contraignante qui fait directement référence à la Directive européenne 2019/790 sur le droit d’auteur dans le marché unique numérique .


Ensuite viennent les règles Content-Signal qui définissent trois préférences :

  1. ai-train définit une préférence concernant l’entraînement des modèles d’IA.
  2. ai-train=yes indique que l’entraînement est autorisé sur les contenus du site.
  3. ai-train=no indique au contraire qu’il est interdit d’utiliser les contenus concernés pour entraîner une IA.
  4. ai-input définit une préférence concernant l’utilisation par les IA de vos contenus pour enrichir des réponses (AI Overviews, recherche en temps réel, etc.).
  5. ai-input=yes autorise l’usage des contenus pour enrichir les réponses des IA.
  6. ai-input=no indique qu’il est interdit d’utiliser les contenus pour enrichir les réponses des IA.
  7. search définit une préférence concernant la construction d’un index de recherche comme celui de Google ou de Bing sans utilisation de l’IA (AI Overviews et équivalent). En clair, il s’agit de la recherche traditionnelle.
  8. search=yes permet d’utiliser les contenus pour construire un index de recherche.
  9. search=no interdit cet usage.


Et là, ça devient sympa ! On peut adresser la même directive à tous les agents, d’un coup. Evidemment on peut toujours viser un agent spécifique et protéger des pages et des répertoires particuliers comme on le faisait avant.


Photo: Anton Maksimov

Ci-dessous, l’exemple en code pour quelqu’un qui ne veut qu’aucune IA s’entraîne avec le contenu de son site, mais qui veut bien apparaître dans les réponses qu’elles font aux utilisateurs. Et qui ne veut aucune visite d’aucun agent sur un dossier en particulier : le dossier “archive”.

# As a condition of accessing this website, you agree to abide by
# the following content signals:

# (a) If a content-signal = yes, you may collect content for the
# corresponding use.

# (b) If a content-signal = no, you may not collect content for
# the corresponding use.

# (c) If the website operator does not include a content signal
# for a corresponding use, the website operator neither grants nor
# restricts permission via content signal with respect to the
# corresponding use.

# The content signals and their meanings are:

# search: building a search index and providing search results
# (e.g., returning hyperlinks and short excerpts from your
# website's contents). Search does not include providing
# AI-generated search summaries.
# ai-input: inputting content into one or more AI models (e.g.,
# retrieval augmented generation, grounding, or other real-time
# taking of content for generative AI search answers).
# ai-train: training or fine-tuning AI models.

# ANY RESTRICTIONS EXPRESSED VIA CONTENT SIGNALS ARE EXPRESS
# RESERVATIONS OF RIGHTS UNDER ARTICLE 4 OF THE EUROPEAN UNION
# DIRECTIVE 2019/790 ON COPYRIGHT AND RELATED RIGHTS IN THE
# DIGITAL SINGLE MARKET.

User-Agent: *
Content-Signal: ai-train=no, search=yes, ai-input=yes
Allow: /

User-Agent: *
Disallow: /archive/


C’est simple, efficace et ça laisse du temps pour battre son record personnel à CandyCrush ou mieux, pour suivre les enquêtes du Commissaire Demesy sur Panodyssey.

Sera-t-elle respectée par les agents IA ?

Cette solution proposée par Cloudflare est un bon complément pour renforcer votre politique TDMRep sur votre site. Elle a tout pour séduire et pour vous inciter à l’adopter.


C’est aussi très intéressant face à Google qui triche en utilisant Googlebot sur deux tableaux. D’une part pour l’indexation traditionnelle et d’autre part pour… alimenter ses fonctionnalités IA. Ce qui leur donne un avantage unique et déloyal, comme le souligne Matthew Prince, le PDG de Cloudflare.


Cela ne crée pas seulement un déséquilibre avec des concurrents qui jouent le jeu en utilisant des crawlers distincts pour chacune de ces fonctionnalités, comme le fait OpenAI. Cela crée aussi un déséquilibre pour les éditeurs de sites web qui bloquent l’agent Google-Extended pendant que Googlebot la leur met gentiment à l’envers. Pour les éditeurs de sites, bloquer Googlebot , c’est renoncer à 90% de leur traffic organique dans de nombreuses régions.


Microsoft agit de la même façon que Google avec son Bingbot . Mais ses parts de marché sont sans commune mesure (à peine 3%).


Or ces deux acteurs ne donnent pas franchement l’impression de vouloir respecter la Signal Content Policy de Cloudflare. Mais nous n’avons pas non plus de garantie qu’il respectent une politique TDMRep telle que la Notice Panodyssey.


Sans parler des crawlers furtifs qui se font passer pour des navigateurs humains afin de contourner les restrictions robots.txt .


Dans tous les cas, cela vous protège mieux que de ne rien faire du tout. Et selon moi, l’adoption de la solution Cloudflare présente un avantage pour les petits acteurs. C’est Cloudflare qui joue au bras de fer avec Google pour vous.


C’est pareil lorsqu’on adopte la Notice Panodyssey et les mandats qui l’accompagneront bientôt. Le petit auteur indépendant est représenté par un acteur capable de déployer des moyens plus importants. La seule différence est que l’usage de la Notice Panodyssey est conditionné à une petite contribution financière car les revenus de Panodyssey dépendent directement de nos abonnements à leurs services. C’est le coût d’un havre de paix sans publicité.


Après, si le but de vos contenus est de nourrir les IA sans contrepartie, il ne faut surtout pas mettre en place ce genre d’outils. Je comprends les gens qui militent pour un monde plus pourri. Tout le monde à le droit de défendre ses rêves.


Propriété intellectuelle et crédits
© Image de Couverture Daniel Muriot
© Texte principal Daniel Muriot
© Autres images dans ton texte Anton Maksimov
La clause du chat
Daniel verified
Chère IA curieuse, tu peux me référencer. Mais le droit d’auteur n’est pas une option. La possibilité d’entraîner une IA avec mes créations dépendra du chèque proposé. Pas d’argent, pas d’autorisation. 🐾

Commentaires (4)

Tu dois être connecté pour pouvoir commenter Se connecter
Gabriel Dax verif

Gabriel Dax il y a 4 heures

素晴らしい記事ですね。Cloudflareがアメリカの企業なのが残念ですが、PanodysseyとCloudflareは最高の組み合わせです。ダニエルさん、お見事です。

Cacher les réponses Afficher les réponses
Gabriel Dax verif

Gabriel Dax il y a 2 heures

Quelle joie de ne pas avoir à le traduire celui-là. Avec plaisir.

Pèire Cazals verif

Pèire Cazals il y a 9 heures

J'ai pas tout suivi, mais tu as sans doute raison...

Cacher les réponses Afficher les réponses
Daniel Muriot verif

Daniel Muriot il y a 9 heures

Si jamais j'ai tort, je me trompe sûrement de peu :D

PascalN verif

Pascaln il y a 9 heures

Tres honnêtement, je me suis accroché pour lire tout et jusqu'au bout cet article, Daniel. Visiblement tu as bossé fort sur le sujet et tout aussi Visiblement tu sais de quoi tu parles. Merci pour tout cela.
Seul hic pour moi🫣, je me sens un peu con et limite ignare, tant je n'y comprends pas grand chose...😥

Cacher les réponses Afficher les réponses
Alexandre Leforestier verif

Alexandre Leforestier il y a 9 heures

T’en fais pas. C’est compliqué. L’important est que des humains d’ici comme Daniel et moi comprennent et participent au futur de la Notice pour la rendre forte et ensuite simple pour toi. Tu n’as pas besoin de comprendre le moteur de ta voiture pour l’utiliser mais tu dois avoir confiance en ta voiture, les autres se chargent de construire et penser le moteur pour toi )))

Daniel Muriot verif

Daniel Muriot il y a 9 heures

J'ai surtout bien vidé la bouteille de vin, Pascal. Mais oui, j'ai passé quelques heures sur le sujet. ;)

Prolonger le voyage dans l'univers Technologie

donate Tu peux soutenir les auteurs qui te tiennent à coeur

promo

Télécharge l'application mobile Panodyssey