Tempo di lettura: 5 minuti, 22 secondi

Jay-Z chiede a YouTube di eliminare i video con sintesi vocale

Un nuovo canale YouTube, Vocal Synthesis, è dedicato alla pubblicazione di deepfake audio. Questi deepfake audio sono generati dall'intelligenza artificiale per imitare le voci degli umani.

Un nuovo Youtube il canale chiamato Vocal Synthesis è dedicato alla pubblicazione di deepfake audio. Questi deepfake audio sono discorsi generati dall'intelligenza artificiale per imitare le voci degli umani. Le voci che imitano queste voci generate dall'IA sono sintetizzate dal testo attraverso la formazione di una rete neurale con un sistema all'avanguardia.

Jay-Z chiede a YouTube di eliminare i video con sintesi vocale

I video in Vocal Synthetics sono straordinari, combinando voci popolari con dialoghi improbabili, tra cui Bob Dylan che canta con la voce di Britney Spears, Tucker Carlson che legge il Manifesto Unabomber, Ayn Rand e Slavoj Zizek che cantano Sonny e Cher, Bill Clinton che recita il Baby Got Back , così come JFK propagandando meriti intellettuali di Rick e Morty.

Alcuni dei video sono stati creati dai fan che hanno aggiunto musica al fine di creare esilaranti mashup musicali.

I video sono stati abbattuti

Per la prima volta da quando Youtube è stato creato il canale, il proprietario di Vocal Synthesis, che rimane anonimo ha ottenuto un reclamo di violazione del copyright su YouTube. Due dei suoi video pubblicati nel canale in cui l'audio di Jay-Z era scritto in modo profondo dicendo che il soliloquio di essere o non essere un amleto, così come "We Didn't Start the Fire" di Bill Joel, sono stati eliminati.

Jay-Z chiede a YouTube di eliminare i video con sintesi vocale

Il creatore del canale YouTube ha dichiarato che Roc Nation LLC è stato quello che ha presentato le rivendicazioni sul copyright e che il motivo della rimozione del video era dovuto al fatto che i video del canale utilizzavano illegalmente l'intelligenza artificiale per impersonare la voce dei clienti di Roc Nation LLC.

Mentre entrambi i video sono stati rimossi immediatamente da detta piattaforma di condivisione video, possono comunque essere visualizzati sulla piattaforma di pubblicazione decentralizzata open-source chiamata LBRY. Nel frattempo, i video di Jay-Z con audio deepfaked rimangono ancora su Internet. Questi video sono dove stava rappando il Libro della Genesi e la copypasta del Navy Seal.

Il creatore del video ha annunciato la rimozione del video in modo creativo. Ha usato le voci dei presidenti statunitensi Donald Trump, Barack Obama, JFK, FDR e Ronald Reagan.

Di seguito è riportato il messaggio che contiene il video:

Durante i diversi mesi trascorsi, il creatore di Vocal Synthesis è stato in grado di formare molti modelli di sintesi vocale basandoli sugli schemi di diverse celebrità e individui popolari. Ha usato questi modelli per realizzare oltre cento video per il canale YouTube. I video di solito presentano una celebrità con una voce sintetica che narra un discorso o un breve testo. Il più delle volte, i testi che vengono selezionati sono quelli che forniscono un contrasto divertente o divertente con il personaggio della vita reale della celebrità in primo piano.

Sembra che il canale YouTube sia stato creato da un hobbista che ha molto tempo libero a disposizione e un grande interesse per l'apprendimento automatico e le tecnologie di intelligenza artificiale. Sembra anche che volesse notare che tutti i video che pubblica sul suo canale YouTube sono a scopo di intrattenimento e che non esiste un solo scopo dannoso su nessuno di essi. Inoltre, il titolo di tutti i video che pubblica ha un'etichetta di sintesi vocale sia nel titolo che nella descrizione.

La voce sintetica di Jay-Z ottiene più visualizzazioni su YouTube?

Le voci sintetiche nel video hanno anche espresso la loro delusione per il modo in cui Jay-Z e Roc Nation LLC stavano maltrattando un YouTuber facendo smantellare i suoi video. Inoltre, le persone erano anche deluse dal fatto che la piattaforma di condivisione di video avrebbe scelto di schierare individui potenti nel soffocare la creatività di un piccolo creatore di contenuti. Inoltre, sembra ironico che YouTube abbia accettato la "rappresentazione dell'IA" come motivo per eliminare i video da Vocal Synthesis quando Google, la stessa società che ha creato YouTube, ha discusso nel caso "Authors Guild vs. Google", dicendo che i modelli di apprendimento automatico formati su materiale protetto da copyright devono essere protetti con il fair use.

Nessuna intenzione di ingannare

La controversia che sta alla base dei deepfakes è focalizzata sulla disinformazione e sull'inganno. Ad esempio, Facebook e Twitter hanno bloccato profondi fuorvianti e dannosi che possono avere un impatto negativo sulle elezioni di quest'anno.

Jay-Z chiede a YouTube di eliminare i video con sintesi vocale

Tuttavia, il caso di Vocal Synthesis è molto diverso. Come ha affermato nella sua dichiarazione, tutti i video che crea e pubblica sul suo canale YouTube sono chiaramente etichettati come sintesi vocale sia nel titolo che nella descrizione. Ciò significa solo che i video non intendono ingannare nessuno e che non rientrano nelle linee guida di YouTube sui media manipolati.

Reclami per uso corretto e copyright

Roc Nation LLC ha due pretese per quanto riguarda la rimozione dei video di Vocal Synthesis. Il primo è che i video violano l'uso del copyright di Jay-Z. D'altra parte, la seconda affermazione è che i video utilizzavano illegalmente l'intelligenza artificiale per impersonare la voce del loro cliente.

I video pubblicati sul canale YouTube di Vocal Synthesis sono stati creati attraverso la formazione di un modello con un'enorme quantità di trascrizioni di testo e campioni audio. Nel caso di Jay-Z, il proprietario del canale ha inserito i testi e le canzoni dell'artista in Tacotron 2, un'architettura di rete neurale sviluppata dalla più grande piattaforma di ricerca di Google.

Visualizzazioni YouTube su Jay-Z Push The Site

Per questo motivo, è abbastanza ragionevole supporre che una sintesi audio modellata da audio protetto da copyright sia considerata come opera derivata. Tuttavia, la vera domanda è se debba essere considerata una violazione del copyright o meno. Nel mondo in cui quasi tutto è protetto da copyright, dipende da come è stato utilizzato l'audio generato dall'intelligenza artificiale e dal suo scopo.

È molto facile immaginare la legge che trova molte violazioni del copyright e dei diritti di pubblicità utilizzando la tecnologia di oggi. Ad esempio, se un produttore discografico avesse Jay-Z o l'ospite di un altro artista su un singolo senza informare o chiedere il loro permesso, sarebbe sicuramente un ricorso legale.

Jay-Z chiede a YouTube di eliminare i video con sintesi vocale

Conclusione

Tuttavia, come è stato sottolineato dal creatore di Vocal Synthesis, le opere derivate come i suoi video devono essere protette in modo equo. Il fair use è molto complicato da definire, ma ci sono quattro modi per valutarlo in tribunale: il suo scopo, la natura dell'opera protetta da copyright, l'importo e la sostanzialità della parte presa e l'effetto di un potenziale utilizzo sul mercato.

Nel caso di Vocal Synthesis, i video che crea sono esclusivamente a scopo di intrattenimento e non intendono ingannare. Per questo motivo, è un caso evidente che i suoi video non rientrino nella violazione del copyright.

0 Piace

Lascia un commento.