Contenu IA : quand la modération devient un problème de conception.

YouTube, Instagram, TikTok savent très bien comment filtrer les contenus IA. Ils ne veulent pas le faire. Pas encore.

Contenu IA : quand la modération devient un problème de conception.

The Verge vient de publier un article au titre assez direct : « Let us filter AI slop, you cowards ». Le propos tient en une phrase : YouTube, Instagram, TikTok et Meta ont tous mis en place des labels pour identifier les contenus générés par IA, mais aucun ne propose de filtre pour ne pas les voir. L'étiquette existe. Le bouton pour s'en débarrasser, non.

Ce n'est pas un manque d'idée. C'est un choix.

Le choix de ne pas filtrer.

Deux approches coexistent pour tracer l'origine d'un contenu. La première repose sur la provenance : des systèmes comme C2PA (Coalition for Content Provenance and Authenticity) ou SynthID (développé par Google DeepMind) embarquent des métadonnées ou des filigranes invisibles dans un fichier au moment de sa création, pour permettre de retracer son origine. La seconde repose sur la détection : des algorithmes analysent les patterns visuels d'une image pour estimer la probabilité qu'elle ait été générée par IA.

https://deepmind.google/models/synthid/

Les deux ont leurs limites. Les modèles open source n'implémentent pas C2PA. Les métadonnées se suppriment facilement. Les détecteurs produisent des faux positifs. Personne ne dit vraiment que ça marche à l'échelle.

DeviantArt a bien une option « Suppress AI » dans ses paramètres, enfouie derrière plusieurs clics. Le journaliste qui a testé les deux modes n'a pas vu de différence notable. Pinterest a quelque chose de similaire, catégorie par catégorie, là encore difficile à trouver et peu efficace.

Sundar Pichai, le PDG de Google, a reconnu dans une interview (encore chez The Verge) qu'il y avait « beaucoup d'AI slop » en ligne et que les utilisateurs devaient « s'y adapter ».

Réponse logique : donnez-nous des filtres.
Réponse réelle : silence.

La raison est simple. Meta, Google, Spotify ne se contentent pas d'héberger des contenus générés par IA. Ils fabriquent aussi les outils qui les créent. Laisser les utilisateurs filtrer ces contenus irait à l'encontre de tout l'effort déployé pour monétiser la production automatisée. Ils veulent que vous absorbiez le flux, pas que vous le coupiez.

Ce que j'ai dû construire sur readme.club

Vous le savez peut-être, readme.club est un hub communautaire pour les utilisateurs de liseuses Xteink. Plus de 10 000 membres, des wallpapers, des firmwares alternatifs, des guides. Rien à voir avec TikTok en termes d'échelle, mais un problème identique dans sa nature : les wallpapers générés par IA ont commencé à arriver. Très vite.

J'avais voulu faire une plateforme ouverte, sans paywall, sans contrainte éditoriale forte, sans arbitrage sur ce qui mérite d'être publié. Dès les premières soumissions suspectes, j'ai compris que cette position allait devenir intenable.

Pas parce que le phénomène était massif au départ, il ne l'était pas. Mais parce que la trajectoire était lisible : une première vague timide, puis une croissance plate pendant quelques semaines, un pic, et maintenant des dépôts réguliers chaque jour.

Côté dates, Midjourney grand public, c'était 2022. Le problème avait mis du temps à arriver, mais il était là. 4 ans pour que ça arrive à poser des soucis sur une niche.

Sur un site de wallpapers pour liseuses e-ink, la question est à la fois esthétique et de confiance. Les membres viennent chercher des créations pensées pour un écran qui ne rend pas les dégradés, qui valorise le contraste, le trait, l'économie de moyens.

Un wallpaper IA sorti de Midjourney ou Stable Diffusion, ça se voit. Pas toujours au premier coup d'œil, mais assez souvent pour créer de la friction. Et cette friction est de plus en plus forte.

Dans le sondage que j'ai lancé cette semaine auprès des membres, quelqu'un a écrit directement : « No more AI generated wallpapers ». Une ligne, sèche, au milieu des demandes de tutoriels vidéo et de boutique tierce. Pas de grande révolte. Juste un signal clair sur ce que la communauté défend.

Ça rejoint la mise en place un système de modération indirecte par les membres depuis plusieurs mois.

N'importe quel membre connecté peut signaler un wallpaper : IA, NSFW, offensant. Au-delà d'un certain seuil de signalements, le contenu passe automatiquement en quarantaine : un flou s'applique sur l'aperçu, un tag visible apparaît.

Un clic et c'est parti ! Ou presque.

Si le tag « Offensive » dépasse dix signalements, une demande de suppression est générée et l'ID du membre qui avait soumis le contenu est flaggé. La modération finale reste humaine, mais le déclenchement est automatique.

Je n'ai pas les ressources pour modérer manuellement chaque soumission en temps réel : ce mécanisme distribue la vigilance sur l'ensemble de la communauté.

Pourquoi ça fonctionne à cette échelle (et pas ailleurs).

La différence avec les grandes plateformes, ce n'est pas la technologie. C'est l'alignement d'intérêts. Et ça, c'est un truc pas facile-facile.

Sur une communauté de 10 000 personnes focalisées sur un appareil précis, les membres partagent un contexte commun et une forme d'attachement à ce que le site représente. Un wallpaper suspect est discuté, signalé, confirmé ou infirmé. Les faux positifs existent : les illustrations très propres ou les rendus vectoriels trop léchés déclenchent parfois des signalements à tort. Mais le système produit un signal utile.

Ce que l'article de The Verge identifie comme le blocage structurel des grandes plateformes ne s'applique pas ici : je n'ai pas intérêt à protéger les créateurs de contenus automatisés. Le modèle de readme.club repose sur la confiance de la communauté, pas sur le volume. Si la galerie se remplit de wallpapers générés en masse, les membres partent.

La limite réelle reste la détection en amont. Je ne peux pas analyser automatiquement les métadonnées de chaque upload avec fiabilité : les outils de détection existants produisent encore trop d'erreurs. Et ont un coût, ce qui est pas terrible pour un side-projet sur lequel je vise la rentabilité niveau zéro, je veux juste rentabiliser les coûts techniques. Pas plus.

Je dépends du regard humain, de la communauté, et d'une charte de soumission claire. C'est déjà beaucoup et c'est pas si mal.

Ce que ça dit du problème plus large.

Le filtre que les grandes plateformes refusent de construire, les petites communautés le bricolent par nécessité. Ce n'est pas une vertu, c'est une contrainte : une communauté niche perd sa raison d'être si elle dilue ce qui la définit.

Ce qui a changé depuis l'arrivée grand public des outils génératifs, c'est moins la quantité de contenus IA que le niveau de défiance qu'ils produisent.

Il y a une vraie montée du dégoût, pas seulement de la méfiance. Y compris chez des gens qui utilisent eux-mêmes ces outils pour autre chose.

La frontière n'est pas entre pro-IA et anti-IA.

Elle est entre les espaces où l'origine du contenu est transparente et les espaces où elle ne l'est pas.