Le New York Times a déposé une plainte contre Perplexity, l’accusant d’utiliser des contenus protégés pour alimenter ses réponses générées par intelligence artificielle. Le quotidien reproche au moteur, et à ses produits fondés sur des techniques de « retrieval‑augmented generation » (RAG), de reproduire mot pour mot ou presque des articles sans autorisation et d’attribuer parfois des informations erronées au journal.
Contexte et nature des griefs
Selon la plainte, Perplexity fournirait des produits commerciaux qui « substituent » le travail du New York Times en reprenant et redistribuant des articles sans rémunération. Le Times affirme que certaines sorties des systèmes de Perplexity sont des reproductions verbatim ou quasi‑verbatim de ses contenus, ou des résumés trop proches, et que des « hallucinations » ont conduit à l’attribution erronée d’informations au journal, portant atteinte à sa réputation.
La réaction de Perplexity et les mesures proposées
Perplexity a cherché à répondre aux demandes de rémunération en créant des dispositifs commerciaux. Parmi eux figurent un « Publishers’ Program » qui propose un partage de revenus publicitaires avec des titres participants, et un abonnement nommé Comet Plus, dont 80 % des 5 $ mensuels seraient alloués aux éditeurs adhérents. L’entreprise a également signé un accord de licence avec Getty Images. Des médias comme Gannett, TIME, Fortune et le Los Angeles Times sont cités comme participants à ces programmes.
Une stratégie juridique coordonnée et les précédents
La plainte du New York Times n’est pas isolée. D’autres titres, dont le Chicago Tribune et plusieurs groupes médiatiques (News Corp, Encyclopedia Britannica, Merriam‑Webster, Nikkei, Asahi Shimbun et Reddit) ont engagé ou envisagé des actions similaires contre Perplexity. Des accusations de plagiat ont aussi été portées par des publications comme Wired et Forbes, et un fournisseur d’infrastructure, Cloudflare, aurait confirmé des comportements de « scraping » de sites qui interdisaient explicitement ce procédé.
Sur un plan plus large, des procès contre d’autres acteurs de l’IA alimentent le débat sur l’utilisation des œuvres protégées pour l’entraînement et le fonctionnement des modèles. Le New York Times poursuit par ailleurs OpenAI et Microsoft pour des motifs voisins. Un dossier distinct impliquant Anthropic s’est soldé, selon les informations disponibles, par un règlement de 1,5 milliard de dollars dans une affaire portant sur des livres piratés.
Enjeux pour le marché et conséquences possibles
Les éditeurs cherchent à contraindre les plateformes à licencier et à rémunérer le journalisme original plutôt qu’à se référer à un usage libre de contenus en ligne. La combinaison de pressions juridiques et de négociations commerciales semble être une stratégie choisie par plusieurs acteurs : engager des poursuites tout en restant ouvert à des accords payants. Le New York Times lui‑même a conclu un contrat pluriannuel avec Amazon pour la licence de son contenu, ce qui illustre la coexistence de recours judiciaires et d’accords commerciaux.
Pour les startups et fournisseurs d’IA, ces évolutions juridiques augmentent l’incertitude sur les pratiques autorisées autour du « scraping », de la réutilisation de textes protégés et du périmètre du « fair use ». Selon l’issue des procès, des obligations de licence plus strictes ou des limitations d’usage pourraient modifier les modèles économiques actuels des moteurs RAG et des assistants de recherche.
Ce qui reste à confirmer
- Les décisions de justice éventuelles et leurs conséquences précises sur la validité du « fair use » appliqué aux systèmes d’IA.
- Les éléments de preuve qui seront retenus par la cour concernant les reproductions verbatim et les cas d’attribution erronée.
- La réaction définitive de Perplexity en termes d’évolutions techniques, commerciales ou d’éventuels accords de licence.
À retenir
- Le New York Times a engagé une action en justice contre Perplexity, l’accusant de violation de droits d’auteur via des réponses générées par des systèmes RAG.
- Perplexity propose des programmes de partage et un abonnement redistribuant une large part des revenus aux éditeurs, mais le Times les juge insuffisants.
- Plusieurs autres éditeurs et plateformes ont lancé des actions similaires, et un précédent d’importance (règlement impliquant Anthropic) pèse déjà sur le débat.
- La question centrale reste la portée du « fair use » et les obligations de licence pour l’usage d’œuvres protégées par les fournisseurs d’IA.
- De nombreuses incertitudes juridiques persistent et les décisions à venir pourraient redessiner les pratiques industrielles autour des données et du contenu en ligne.
Article amélioré avec l'IA - Article original