Temps de lecture: 5 minutes, 22 secondes

Jay-Z demande à YouTube de supprimer des vidéos avec la synthèse vocale

Une nouvelle chaîne YouTube, Vocal Synthesis, est dédiée à la publication de deepfakes audio. Ces deepfakes audio sont générés par l'IA pour imiter les voix des humains.

Un Nouveau YouTube La chaîne appelée Vocal Synthesis est dédiée à la publication de deepfakes audio. Ces deepfakes audio sont des paroles générées par l'intelligence artificielle pour imiter les voix des humains. Les voix que ces voix générées par l'IA imitent sont synthétisées par du texte grâce à la formation d'un réseau neuronal avec un système de pointe.

Jay-Z demande à YouTube de supprimer des vidéos avec la synthèse vocale

Les vidéos de Vocal Synthetics sont remarquables, combinant des voix populaires avec des dialogues improbables, notamment Bob Dylan chantant dans la voix de Britney Spears, Tucker Carlson lisant le manifeste Unabomber, Ayn Rand et Slavoj Zizek chantant Sonny and Cher, Bill Clinton récitant le Baby Got Back , ainsi que JFK vantant les mérites intellectuels de Rick et Morty.

Certaines vidéos ont été créées par des fans qui y ont ajouté de la musique afin de proposer des mashups musicaux hilarants.

Les vidéos ont été retirées

Pour la première fois depuis le YouTube a été créée, le propriétaire de Vocal Synthesis, qui reste anonyme, a obtenu une réclamation pour atteinte aux droits d'auteur sur YouTube. Deux de ses vidéos publiées dans la chaîne où l'audio de Jay-Z était profondément ancré disant le soliloque To Be or Not to Be - a Hamlet, ainsi que «We Didn't Start the Fire» de Bill Joel ont été supprimés.

Jay-Z demande à YouTube de supprimer des vidéos avec la synthèse vocale

Le créateur de la chaîne YouTube a déclaré que Roc Nation LLC avait déposé la réclamation pour atteinte aux droits d'auteur et que la suppression de la vidéo était due au fait que les vidéos de la chaîne utilisent illégalement l'intelligence artificielle pour usurper l'identité de la voix des clients de Roc Nation LLC.

Bien que les deux vidéos aient été supprimées immédiatement par ladite plate-forme de partage de vidéos, elles peuvent toujours être consultées sur la plate-forme de publication open source et décentralisée appelée LBRY. Pendant ce temps, des vidéos de Jay-Z avec un son profond sont toujours sur Internet. Ces vidéos sont l'endroit où il rappait le Book of Genesis ainsi que le copypasta Navy Seal.

Le créateur de la vidéo a annoncé la suppression de la vidéo de manière créative. Il a utilisé les voix des présidents américains Donald Trump, Barack Obama, JFK, FDR et Ronald Reagan.

Voici le message que contient la vidéo:

Au cours des plusieurs mois qui se sont écoulés, le créateur de Vocal Synthesis a pu former de nombreux modèles de synthèse vocale en les fondant sur les modèles de différentes célébrités et individus populaires. Il a utilisé ces modèles pour réaliser plus d'une centaine de vidéos pour la chaîne YouTube. Les vidéos présentent généralement une célébrité avec une voix synthétique racontant un discours ou un court texte. La plupart du temps, les textes sélectionnés sont ceux qui offrent un contraste amusant ou divertissant avec le personnage réel de la célébrité en vedette.

Il semble que la chaîne YouTube ait été créée par un amateur qui a beaucoup de temps libre à sa disposition ainsi qu'un grand intérêt pour l'apprentissage automatique ainsi que pour les technologies de l'IA. Il semble également qu'il voulait noter que toutes les vidéos qu'il publie sur sa chaîne YouTube sont à des fins de divertissement et qu'il n'y a pas une seule fin malveillante sur aucune d'entre elles. De plus, le titre de toutes les vidéos qu'il publie a une étiquette de synthèse vocale à la fois dans leur titre et dans la description.

Jay-Z Synthetic Voice obtient plus de vues YouTube?

Les voix synthétiques de la vidéo ont également exprimé leur déception quant à la façon dont Jay-Z et Roc Nation LLC intimidaient un YouTuber en faisant retirer ses vidéos. En outre, les gens étaient également déçus que la plate-forme de partage de vidéos choisisse de soutenir des individus puissants pour étouffer la créativité d'un petit créateur de contenu. En plus de cela, il semble ironique que YouTube ait accepté l '«usurpation d'identité par l'IA» comme raison pour retirer les vidéos de Vocal Synthesis lorsque Google, la même société qui a créé YouTube, a plaidé dans l'affaire «Authors Guild vs. Google», disant que les modèles d'apprentissage automatique formés sur du matériel protégé par des droits d'auteur doivent être protégés dans le cadre d'une utilisation équitable.

Aucune intention de tromper

La controverse qui sous-tend les deepfakes est centrée sur la désinformation et la tromperie. Par exemple, Facebook et Twitter ont bloqué les deepfakes trompeurs et nuisibles qui peuvent avoir un impact négatif sur les élections de cette année.

Jay-Z demande à YouTube de supprimer des vidéos avec la synthèse vocale

Cependant, le cas de la synthèse vocale est très différent. Comme il l'a dit dans sa déclaration, toutes les vidéos qu'il crée et publie sur sa chaîne YouTube sont clairement étiquetées comme synthèse vocale dans le titre et la description. Cela signifie seulement que les vidéos ne sont destinées à tromper personne et qu'elles ne respectent pas les directives de YouTube concernant les médias manipulés.

Utilisation équitable et droits d'auteur

Roc Nation LLC a deux réclamations concernant le retrait vidéo de Vocal Synthesis. Premièrement, les vidéos portaient atteinte au droit d'auteur de Jay-Z. D'un autre côté, la deuxième affirmation est que les vidéos utilisaient illégalement l'intelligence artificielle pour usurper l'identité de la voix de leur client.

Les vidéos publiées sur la chaîne YouTube Vocal Synthesis ont été créées grâce à la formation d'un modèle avec une énorme quantité de transcriptions de texte et d'échantillons audio. Dans le cas de Jay-Z, le propriétaire de la chaîne a introduit les paroles et les chansons de l'artiste dans Tacotron 2, une architecture de réseau neuronal qui a été développée par la plus grande plateforme de recherche Google.

Vues YouTube sur Jay-Z Push The Site

Pour cette raison, il est tout à fait raisonnable de supposer qu'une synthèse audio modélisée à partir d'audio protégé par des droits d'auteur serait considérée comme une œuvre dérivée. Cependant, la vraie question est de savoir si elle doit être considérée comme une violation du droit d'auteur ou non. Dans le monde où presque tout est protégé par le droit d'auteur, cela dépend de la façon dont l'audio généré par l'IA a été utilisé et de son objectif réel.

Il est très facile d'imaginer la loi constatant de nombreuses violations des droits d'auteur et de publicité en utilisant la technologie d'aujourd'hui. Par exemple, si un producteur de disques avait Jay-Z ou l'invité d'un autre artiste sur un single sans en informer ou demander leur permission, un recours légal se produirait sûrement.

Jay-Z demande à YouTube de supprimer des vidéos avec la synthèse vocale

Conclusion

Cependant, comme l'a souligné le créateur de Vocal Synthesis, les œuvres dérivées telles que ses vidéos doivent être protégées dans le cadre d'une utilisation équitable. L'usage loyal est très compliqué à définir, mais il y a quatre façons de le peser devant le tribunal: son objet, la nature de l'œuvre protégée, le montant ainsi que la substantivité de la partie prise et l'effet de l'utilisation potentielle sur le marché.

Dans le cas de Vocal Synthesis, les vidéos qu'il crée sont uniquement à des fins de divertissement et ne sont pas destinées à tromper. Pour cette raison, il existe de solides arguments pour que ses vidéos ne tombent pas sous le coup d'une violation du droit d'auteur.

0 aime

Laissez un commentaire.