Olvasási idő: 5 perc, 22 másodperc

Jay-Z arra kéri a YouTube-ot, hogy vegye le a videókat vokális szintézissel

Egy új YouTube csatorna, a Vocal Synthesis, az audio mélyhangok közzétételére szolgál. Ezeket az audio mélyhangokat az AI hozza létre az emberek hangjainak utánozására.

A New Youtube A Vocal Synthesis nevű csatorna az audio mélyhangok publikálására szolgál. Ezek a hangos mély hangok olyan beszéd, amelyet a mesterséges intelligencia generál az emberek hangjainak utánozására. Azokat a hangokat, amelyeket ezek az AI által generált hangok utánoznak, a szöveg szintetizálja a korszerű rendszerrel rendelkező neurális hálózat kiképzésével.

Jay-Z arra kéri a YouTube-ot, hogy vegye le a videókat vokális szintézissel

A Vocal Synthetics videói figyelemre méltóak: a népszerű hangokat olyan valódi valószínűtlen párbeszédekkel ötvözik, mint például Bob Dylan, Britney Spears hangjában énekelve, Tucker Carlson az Unabomber Manifeszt felolvasása, Ayn Rand és Slavoj Zizek, Sonny és Cher éneklésével, Bill Clinton a Baby Got szavalásával. , valamint a JFK Rick és Morty szellemi érdemeit.

Néhány videót a rajongók készítették, akik zenét adtak hozzá annak érdekében, hogy vidám zenei mashup-okkal álljanak elő.

Videók lekerültek

Azóta első ízben Youtube A csatornát létrehozták, a Vocal Synthesis tulajdonosa, aki anonim marad, szerzői jogi igényt kapott a YouTube-on. Két csatornán közzétett videóját, amelyben Jay-Z hangját mélyrehatóan hangzották el, mondván: A lenni vagy nem lenni - egy Hamlet-monológia, valamint Bill Joel „Mi nem indítottuk el a tüzet” című művet.

Jay-Z arra kéri a YouTube-ot, hogy vegye le a videókat vokális szintézissel

A YouTube csatorna alkotója szerint a Roc Nation LLC nyújtotta be a szerzői jogi igényeket, és a videó eltávolításának oka az volt, mert a csatorna videóiban jogellenesen használták a mesterséges intelligenciát, hogy megszemélyesítsék a Roc Nation LLC ügyfeleinek hangját.

Noha mindkét videót azonnal eltávolította az említett videómegosztó platform, a LBRY nevű nyílt forráskódú és decentralizált kiadói platformon továbbra is megtekinthető. Eközben a Jay-Z videóinak mély hanggal ellátott videói továbbra is az interneten maradnak. Ezekben a videókban rabolta a Genesis könyvét, valamint a haditengerészet pecsétjét.

A videó készítője kreatív módon bejelentette a videó eltávolítását. Használta az amerikai elnökök, Donald Trump, Barack Obama, JFK, FDR és Ronald Reagan hangját.

Az alábbiakban olvasható az a üzenet, amelyet a videó tartalmaz:

Az elmúlt néhány hónapban a Vocal Synthesis alkotója számos beszédszintézis-modellt képes volt kiképezni, különféle hírességek és népszerű egyének mintázata alapján. E modellek segítségével több mint száz videót készített a YouTube-csatornára. A videók általában egy hírességet mutatnak fel, szintetikus hanggal, amely beszédet vagy rövid szöveget mond el. Leginkább a kiválasztott szövegek azok, amelyek vicces vagy szórakoztató kontrasztot jelentenek a bemutatott hírességek valós személyiségével.

Úgy tűnik, hogy a YouTube csatornát egy rajongó készítette, akinek rengeteg szabadideje van a kezére, és óriási érdeklődése van a gépi tanulás és az AI technológiák iránt. Úgy tűnik, hogy meg akarta jegyezni, hogy az összes videó, amelyet a YouTube-csatornáján tesz közzé, szórakoztató jellegű, és egyikükben sem létezik egyetlen rosszindulatú cél. Ezenkívül az összes általa közzétett videó címében beszédszintetizáló címke található mind a címben, mind a leírásban.

A Jay-Z szintetikus hangja több YouTube-megtekintést szerez?

A videó szintetikus hangjai szintén csalódásukat fejezték ki amiatt, hogy a Jay-Z és a Roc Nation LLC miközben zaklattak egy YouTuber-t azzal, hogy videóit levette. Ezen felül az emberek csalódtak voltak azért is, hogy a videomegosztó platform úgy dönt, hogy a hatalmas egyének mellett egy kis tartalom készítője kreativitásának elfojtása mellett dönt. Ráadásul ironikusnak tűnik, hogy a YouTube elfogadta az „AI megszemélyesítést” a videók Vocal Synthesisből való levonásának okaként, amikor a Google, ugyanazt a társaságot, amely a YouTube-ot létrehozta, a „Szerzők Guild vs. Google” ügyében érvelt: hogy a szerzői joggal védett anyagon kiképzett gépi tanulási modelleket a tisztességes használat alatt kell védeni.

Nincs becsapási szándék

A mélyfajok alapját képező vita a dezinformációra és a megtévesztésre összpontosít. Például a Facebook és a Twitter blokkolta a megtévesztő és ártalmas bemutatókat, amelyek rossz hatást gyakorolhatnak az idei választásokra.

Jay-Z arra kéri a YouTube-ot, hogy vegye le a videókat vokális szintézissel

A vokális szintézis esete azonban nagyon eltérő. Mint mondta nyilatkozatában, az összes videót, amelyet a YouTube-csatornán készít és tesz közzé, egyértelműen beszédszintézisként van megcímkézve a címben és a leírásban. Ez csak azt jelenti, hogy a videók nem célja senkinek a megtévesztése, és hogy kívül esik a YouTube manipulált médiával kapcsolatos irányelvein.

Méltányos felhasználási és szerzői jogi igények

A Roc Nation LLC-nek két állítása van a Vocal Synthesis videofelvételének vonatkozásában. Először is, a videók sértik a Jay-Z szerzői jogának használatát. Másrészt, a második állítás az, hogy a videókat jogellenesen használtak mesterséges intelligenciával, hogy megszemélyesítsék ügyfeleik hangját.

A Vocal Synthesis YouTube csatornájában közzétett videókat egy hatalmas mennyiségű szövegátírással és audio mintával rendelkező modell kiképzésével készítették. Jay-Z esetében a csatorna tulajdonosa a művész dalszövegeit és dalait táplálta a Tacotron 2-re, egy neurális hálózati architektúrára, amelyet a Google legnagyobb keresési platformja fejlesztett ki.

YouTube-megtekintések a Jay-Z webhelyen

Ezért meglehetősen ésszerű azt feltételezni, hogy a szerzői jogok által védett audióból modellezett audio szintézist származékos műnek tekintik. A valódi kérdés azonban az, hogy azt szerzői jogok megsértésének kell tekinteni, vagy sem. A világon, ahol szinte minden szerzői jogvédelem alatt áll, attól függ, hogy az AI által generált hangot hogyan használták és mi a célja valójában.

Nagyon könnyű elképzelni azt a törvényt, amely a mai technológiát felhasználva számos szerzői és nyilvánossági jog megsértését állapítja meg. Például, ha egy lemezgyártó Jay-Z vagy más művész vendége mellett állna egyedül anélkül, hogy tájékoztatná vagy engedélyt kért volna, akkor jogorvoslati lehetőségre kerül sor.

Jay-Z arra kéri a YouTube-ot, hogy vegye le a videókat vokális szintézissel

Következtetés

Amint azonban a Vocal Synthesis készítője rámutatott, a származékos műket, például videóit, tisztességes felhasználás alatt kell védeni. A tisztességes felhasználás meghatározása nagyon bonyolult, de a bíróságon négy szempontot mérlegelhetünk: célja, a szerzői jogok által védett mű jellege, az elvégzett rész mennyisége és jelentősége, valamint a potenciális piaci felhasználás hatása.

A Vocal Synthesis esetében az általa készített videók kizárólag szórakoztatási célokat szolgálnak, és nem szándékoznak becsapni őket. Ezen okból kifogásolható, hogy videói nem tartoznak a szerzői jogok hatálya alá.

0 szereti

Szólj hozzá.