Lors du workshop « AI for Music » organisé pendant NeurIPS 2025 à San Diego, la start‑up coréenne NewTune a présenté une proposition technique visant à rendre traçable et rémunérable l’usage des éléments musicaux générés par intelligence artificielle. Leur démarche articule décomposition du signal, suivi en temps réel et génération assistée par récupération de blocs audio identifiables.

Contexte : pourquoi l'attribution devient un enjeu

Les modèles génératifs qui apprennent sur de vastes corpus recomposent des motifs musicaux issus d'œuvres existantes. NewTune souligne le risque que la contribution des auteurs se perde dans des « pools » de revenus opaques à l’heure où la création passe du format physique au streaming, puis à la génération par IA. Présentée parmi 74 communications au workshop, l’approche revendique une réponse technique et éthique à ce défi.

L'architecture proposée : trois volets complémentaires

NewTune détaille une « Music AI Agent Architecture » structurée en trois éléments principaux :

  • BlockDB : une base de blocs audio qui segmente les morceaux en stems (voix, batterie, basse, etc.) et en sections structurelles (intro, couplet, refrain). Chaque bloc est accompagné de métadonnées musicales (tempo (BPM), tonalité) et de l’identité des auteurs.
  • Attribution Layer : une couche qui enregistre en temps réel l’utilisation des blocs lors de la génération. Plutôt que d’inférer a posteriori quelles sources ont inspiré une création, le système vise une « attribution intrinsèque » au moment même où l’IA assemble ou cite un bloc.
  • Système multi‑agent : des agents d’IA collaborent pour analyser, rechercher et générer de la musique. Ils appliquent le principe dit RAG (Retrieval‑Augmented Generation) au domaine audio, c’est‑à‑dire qu’ils peuvent « citer » explicitement des blocs pris dans BlockDB durant la génération.

Ce que cela change pour les créateurs et l'industrie

En liant chaque fragment musical à des métadonnées d’auteur et en consignant son usage au moment de la génération, l’architecture vise à offrir une base pour répartir les revenus au prorata des contributions. À terme, cela ouvre la possibilité :

  • d’établir des licences plus claires pour les briques sonores utilisées par les générateurs ;
  • d’améliorer la transparence des plateformes d’IA en rendant explicites les sources invoked lors d’une création.

Le PDG Lee Jong‑pil a présenté cette vision comme une volonté de transformer l’IA de « boîte noire » en une plateforme plus équitable, capable de redistribuer les revenus selon la contribution réelle des auteurs.

Limites, questions ouvertes et aspects à préciser

La proposition combine des idées techniques et éthiques prometteuses, mais plusieurs points restent à confirmer :

  • le degré d’intégration et de compatibilité de BlockDB avec les catalogues existants et les normes de métadonnées ;
  • la scalabilité du suivi en temps réel pour des systèmes de génération à large échelle et le coût de stockage des millions de blocs potentiels ;
  • la reconnaissance légale et contractuelle d’une « attribution intrinsèque » face aux cadres de droit d’auteur actuels ;
  • l’acceptation par les plateformes de streaming et les détenteurs de droits, qui conditionnera l’impact pratique sur la rémunération.

Ces éléments pourraient nécessiter des expérimentations industrielles et des discussions avec les acteurs du droit d’auteur pour passer d’un prototype conceptuel à une adoption effective.

Ce qui reste à confirmer

  • si l’architecture présentée est déjà déployée en version opérationnelle ou si elle demeure au stade de prototype de recherche ;
  • les performances techniques et les métriques d’efficacité du système dans des conditions réelles de production ;
  • la feuille de route réglementaire et contractuelle pour que l’attribution automatique soit reconnue et rémunérée par les écosystèmes de diffusion.

À retenir

  • NewTune a présenté à NeurIPS 2025 une architecture en trois volets visant à tracer l’usage des blocs musicaux générés par IA.
  • Le dispositif combine une base de blocs identifiés (BlockDB), une couche d’attribution en temps réel et un système multi‑agent appliquant la logique RAG au domaine audio.
  • L’objectif affiché est d’améliorer la transparence et de permettre une répartition des revenus au prorata des contributions d’auteurs.
  • Des questions pratiques et juridiques demeurent avant toute adoption à grande échelle, notamment sur la scalabilité et la reconnaissance légale de l’attribution.
  • La proposition ouvre toutefois un cadre technique et éthique utile pour discuter de licences et de rémunération dans l’ère post‑streaming.

Article amélioré avec l'IA - Article original