Also Like

Le procès de la RIAA contre les startups de musique générative sera le bain de sang dont l'IA a besoin

Le procès de la RIAA contre les startups de musique générative sera le bain de sang dont l'IA a besoin

Comme de nombreuses sociétés d’IA, les startups de génération musicale Udio et Suno semblent s’être appuyées sur des fragments non autorisés d’œuvres protégées par le droit d’auteur pour former leurs modèles. C'est ce qu'ils reconnaissent eux-mêmes et ceux des investisseurs, ainsi que les nouvelles poursuites intentées contre eux par les sociétés de musique. Si ces poursuites étaient portées devant un jury, le procès pourrait être à la fois un exposé préjudiciable et un précédent très utile pour les entreprises d’IA, tout aussi collantes, confrontées à certains périls juridiques.

Les poursuites intentées par la Recording Industry Association of America (RIAA) nous mettent tous dans la position inconfortable de soutenir la RIAA, qui est depuis des décennies le croque-mitaine des médias numériques. J'ai moi-même reçu des nastygrammes de leur part ! L’affaire est tout simplement aussi claire.

L'essentiel des deux procès, dont le contenu est extrêmement similaire, est que Suno et Udio (à proprement parler, Uncharted Labs faisant affaire sous le nom d'Udio) ont pillé sans discernement plus ou moins toute l'histoire de la musique enregistrée pour former des ensembles de données, qu'ils ont ensuite utilisés pour former une IA génératrice de musique.

Et ici, notons rapidement que ces IA ne « génèrent » pas tant que faire correspondre l'invite de l'utilisateur aux modèles de leurs données d'entraînement, puis tenter de compléter ce modèle. D’une certaine manière, ces modèles ne font que réaliser des reprises ou des mashups des chansons qu’ils ont ingérées.

Le fait que Suno et Udio aient ingéré ces données protégées par le droit d'auteur semble, à toutes fins utiles (y compris juridiques), très probable. Les dirigeants et les investisseurs des entreprises ont été imprudemment discrets sur les défis liés aux droits d'auteur dans ce domaine.

Ils ont admis que la seule façon de créer un bon modèle de génération musicale est d’ingérer une grande quantité de musique de haute qualité. C’est tout simplement une étape nécessaire pour créer des modèles de machine learning de ce type.

Ensuite, ils ont déclaré qu'ils l'avaient fait sans l'autorisation des labels de musique. L'investisseur Antonio Rodriguez de Matrix Partners a déclaré à Rolling Stone il y a quelques mois à peine :

Honnêtement, si nous avions eu des accords avec des labels au début de cette entreprise, je n’y aurais probablement pas investi. Je pense qu'ils avaient besoin de fabriquer ce produit sans contraintes.

Les sociétés ont déclaré aux avocats de la RIAA qu'elles estimaient que les médias qu'elles avaient ingérés relevaient de la doctrine de l'utilisation équitable – qui n'entre fondamentalement en jeu que dans l'utilisation non autorisée d'une œuvre. Certes, l'utilisation équitable est un concept complexe et flou dans son idée et son exécution, mais l'utilisation par les entreprises semble s'éloigner quelque peu du cadre de sécurité prévu, par exemple, pour un élève de septième année utilisant une chanson de Pearl Jam en arrière-plan de sa vidéo sur le réchauffement climatique.

Pour être franc, il semble que la poule aux œufs d’or de ces entreprises soit cuite. Ils auraient pu espérer pouvoir s'inspirer du manuel d'OpenAI, en utilisant un langage évasif et des orientations erronées pour bloquer leurs critiques les moins nantis, comme les auteurs et les journalistes. (Si au moment où les magouilles des sociétés d’IA sont révélées et qu’elles constituent la seule option de distribution, cela n’a plus d’importance.)

Mais c’est plus difficile à réaliser quand on a une arme fumante dans la main. Et malheureusement pour Udio et Suno, la RIAA affirme dans son procès qu'elle dispose de quelques milliers de preuves irréfutables et que les chansons qu'elle possède sont clairement régurgitées par les modèles musicaux. Son affirmation : qu'il s'agisse de Jackson 5 ou de Maroon 5, les chansons « générées » sont des versions légèrement tronquées des originaux – ce qui serait impossible si l'original n'était pas inclus dans les données d'entraînement.

La nature des LLM – en particulier leur tendance à halluciner et à perdre l’intrigue à mesure qu’ils écrivent – ​​empêche la régurgitation, par exemple, de livres entiers. Cela a probablement donné lieu à un procès des auteurs contre OpenAI , puisque ce dernier peut prétendre de manière plausible que les extraits que son modèle cite ont été extraits de critiques, de premières pages disponibles en ligne, etc. (La dernière avancée en date est qu'ils ont utilisé très tôt des œuvres protégées par le droit d'auteur, mais ont depuis arrêté, ce qui est drôle car c'est comme dire que vous n'avez pressé l'orange qu'une seule fois et que vous avez arrêté depuis.)

Ce que vous ne pouvez pas faire, c'est prétendre de manière plausible que votre générateur de musique n'a entendu que quelques mesures de « Great Balls of Fire » et a réussi d'une manière ou d'une autre à cracher le reste mot pour mot et accord pour accord. N’importe quel juge ou jury vous rirait au nez, et avec de la chance, un artiste de la cour aura l’occasion d’illustrer cela.

Ceci est non seulement intuitivement évident, mais également juridiquement conséquent, car la recréation d'œuvres entières ( brouillées, mais évidemment basées sur les originaux ) ouvre une nouvelle voie de soulagement. Si la RIAA parvient à convaincre le juge qu'Udio et Suno causent un préjudice réel et majeur aux affaires des détenteurs de droits d'auteur et des artistes, elle peut demander au tribunal de mettre fin à l'ensemble des activités des sociétés d'IA dès le début du procès, avec une injonction. .

Les premiers paragraphes de votre livre issu d'un LLM ? C'est une question intellectuelle qui mérite d'être longuement discutée. Un magasin à un dollar « Call Me Maybe » généré à la demande ? Ferme-le. Je ne dis pas que c'est vrai, mais c'est probable.

La réponse prévisible des entreprises a été que le système n'est pas destiné à reproduire des œuvres protégées par le droit d'auteur : une tentative désespérée et flagrante de se décharger de la responsabilité sur les utilisateurs en vertu de la sphère de sécurité de l'article 230. Autrement dit, de la même manière, Instagram n'est pas responsable si vous utilisez une chanson protégée par le droit d'auteur pour sauvegarder votre Reel. Ici, l’argument semble peu susceptible de gagner du terrain, en partie à cause des aveux susmentionnés selon lesquels l’entreprise elle-même a ignoré le droit d’auteur au départ.

Quelle sera la conséquence de ces poursuites ? Comme pour tout ce qui concerne l’IA, il est tout à fait impossible de le dire à l’avance, car il existe peu de précédents ou de doctrines applicables et établies.

Ma prédiction est que les entreprises seront obligées d’exposer leurs données et méthodes de formation, ces éléments présentant un intérêt évident en termes de preuves. Et si ces preuves montrent qu'ils abusent effectivement du matériel protégé par le droit d'auteur, nous assisterons à une tentative de règlement ou d'évitement d'un procès, et/ou à un jugement rapide contre Udio et Suno. Il est probable qu'au moins l'un des deux tentera de continuer, en utilisant des sources de musique légales (ou au moins légales adjacentes), mais le modèle résultant (selon leurs propres normes en matière de données de formation) entraînerait presque certainement un grand pas en avant. la qualité diminuait et les utilisateurs fuyaient.

Des investisseurs ? Idéalement, ils perdront leur chemise, après avoir parié sur quelque chose qui était selon toute vraisemblance illégal et certainement contraire à l'éthique, et pas seulement aux yeux des associations d'auteurs nébuleuses, mais selon les esprits juridiques de la tristement célèbre et impitoyablement litigieuse RIAA.

Les conséquences pourraient être considérables : si les investisseurs dans une nouvelle start-up de médias génératifs voient soudainement une centaine de millions de dollars vaporisés en raison de la nature fondamentale des médias génératifs, un niveau de diligence différent semblera soudainement approprié.

Les entreprises peuvent apprendre des documents de procès ou de règlement ce qui peut être dit – ou peut-être plus important encore, ce qui ne devrait pas être dit – pour éviter toute responsabilité et laisser les titulaires de droits d’auteur dans l’incertitude.

Bien que ce procès particulier semble presque acquis d’avance, il ne s’agira pas d’un manuel pour poursuivre ou arracher des règlements à d’autres sociétés d’IA générative, mais une leçon de choses sur l’orgueil.

C'est bien d'en avoir un de temps en temps, même si le professeur est la RIAA.

Commentaires