Ώρα ανάγνωσης: 5 λεπτά, 22 δευτερόλεπτα

Ο Jay-Z ζητά από το YouTube να καταργήσει βίντεο με φωνητική σύνθεση

Ένα νέο κανάλι YouTube, Vocal Synthesis, είναι αφιερωμένο στη δημοσίευση deepfakes ήχου. Αυτά τα deepfakes ήχου δημιουργούνται από το AI για να μιμούνται τις φωνές των ανθρώπων.

Μια νέα YouTube Το κανάλι που ονομάζεται Vocal Synthesis είναι αφιερωμένο στη δημοσίευση deepfakes ήχου. Αυτά τα deepfakes ήχου είναι ομιλία που δημιουργείται από τεχνητή νοημοσύνη για να μιμείται τις φωνές των ανθρώπων. Οι φωνές που μιμούνται αυτές οι AI δημιουργούνται μέσω κειμένου μέσω της εκπαίδευσης ενός νευρικού δικτύου με υπερσύγχρονο σύστημα.

Ο Jay-Z ζητά από το YouTube να καταργήσει βίντεο με φωνητική σύνθεση

Τα βίντεο στο Vocal Synthetics είναι αξιοσημείωτα, συνδυάζοντας δημοφιλείς φωνές με διαλόγους που είναι απίθανο, όπως ο Bob Dylan τραγουδώντας με τη φωνή της Britney Spears, ο Tucker Carlson διαβάζοντας το μανιφέστο Unabomber, ο Ayn Rand και ο Slavoj Zizek τραγουδώντας τους Sonny and Cher, ο Bill Clinton απαγγέλλει το Baby Got Back , όπως επίσης και η JFK για τα πνευματικά προσόντα του Rick και του Morty.

Μερικά από τα βίντεο δημιουργήθηκαν από θαυμαστές που πρόσθεσαν μουσική σε αυτό για να βρουν ξεκαρδιστικά μουσικά mashup.

Τα βίντεο καταργήθηκαν

Για πρώτη φορά από τότε YouTube Το κανάλι δημιουργήθηκε, ο ιδιοκτήτης της Vocal Synthesis, ο οποίος παραμένει ανώνυμος, έλαβε αξίωση πνευματικών δικαιωμάτων στο YouTube. Δύο από τα βίντεό του που δημοσιεύτηκαν στο κανάλι, όπου ο ήχος του Jay-Z ήταν βαθύτατος, λέγοντας "To Be or Not to Be - ένα Hamlet soliloquy, καθώς και το" We Not Start the Fire "του Bill Joel καταργήθηκαν.

Ο Jay-Z ζητά από το YouTube να καταργήσει βίντεο με φωνητική σύνθεση

Ο δημιουργός του καναλιού YouTube είπε ότι η Roc Nation LLC ήταν αυτή που υπέβαλε αξιώσεις πνευματικών δικαιωμάτων και ότι ο λόγος για την κατάργηση του βίντεο ήταν επειδή τα βίντεο του καναλιού χρησιμοποιούν παράνομα τεχνητή νοημοσύνη για να πλαστοπροσωπήσουν τη φωνή των πελατών της Roc Nation LLC.

Ενώ και τα δύο βίντεο αφαιρέθηκαν αμέσως από την εν λόγω πλατφόρμα κοινής χρήσης βίντεο, μπορεί ακόμα να προβληθεί στην πλατφόρμα ανοιχτού κώδικα και αποκεντρωμένη έκδοση που ονομάζεται LBRY. Εν τω μεταξύ, τα βίντεο του Jay-Z με βαθιά ήχο παραμένουν στο Διαδίκτυο. Αυτά τα βίντεο είναι όπου έβαζε το βιβλίο της Γένεσης καθώς και τα copypasta του Navy Seal.

Ο δημιουργός του βίντεο ανακοίνωσε την κατάργηση του βίντεο με δημιουργικό τρόπο. Χρησιμοποίησε τις φωνές των προέδρων των ΗΠΑ Donald Trump, Barack Obama, JFK, FDR και Ronald Reagan.

Ακολουθεί το μήνυμα που περιέχει το βίντεο:

Κατά τη διάρκεια των αρκετών μηνών που πέρασαν, ο δημιουργός της Vocal Synthesis κατάφερε να εκπαιδεύσει πολλά μοντέλα σύνθεσης ομιλίας βασισμένα στα πρότυπα διαφορετικών διασημοτήτων και δημοφιλών ατόμων. Χρησιμοποίησε αυτά τα μοντέλα για να δημιουργήσει πάνω από εκατό βίντεο για το κανάλι YouTube. Τα βίντεο διαθέτουν συνήθως μια διασημότητα με μια συνθετική φωνή που αφηγείται μια ομιλία ή ένα σύντομο κείμενο. Τις περισσότερες φορές, τα κείμενα που επιλέγονται είναι αυτά που παρέχουν μια αστεία ή διασκεδαστική αντίθεση με το πραγματικό πρόσωπο της διασημότητας.

Φαίνεται ότι το κανάλι YouTube δημιουργήθηκε από έναν χόμπι που έχει πολύ ελεύθερο χρόνο στα χέρια του, καθώς και τεράστιο ενδιαφέρον για τη μηχανική μάθηση καθώς και για τις τεχνολογίες AI. Φαίνεται επίσης ότι ήθελε να σημειώσει ότι όλα τα βίντεο που δημοσιεύει στο κανάλι του στο YouTube είναι για ψυχαγωγικούς σκοπούς και ότι δεν υπάρχει κανένας κακόβουλος σκοπός σε κανένα από αυτά. Επιπλέον, ο τίτλος όλων των βίντεο που δημοσιεύει έχει μια ετικέτα σύνθεσης ομιλίας τόσο στον τίτλο όσο και στην περιγραφή.

Η συνθετική φωνή Jay-Z αποκτά περισσότερες προβολές στο YouTube;

Οι συνθετικές φωνές στο βίντεο εξέφρασαν επίσης την απογοήτευσή τους για το πώς ο Jay-Z και η Roc Nation LLC εκφοβίζουν ένα YouTuber κάνοντας τα βίντεό του να αφαιρεθούν. Επιπλέον, οι άνθρωποι ήταν επίσης απογοητευμένοι που η πλατφόρμα κοινής χρήσης βίντεο θα επέλεγε να υποστηρίξει ισχυρά άτομα που καταπνίγουν τη δημιουργικότητα ενός μικρού δημιουργού περιεχομένου. Επιπλέον, φαίνεται ειρωνικό ότι το YouTube δέχτηκε την «πλαστοπροσωπία AI» ως λόγο για την κατάργηση των βίντεο από τη Vocal Synthesis όταν η Google, η ίδια εταιρεία που δημιούργησε το YouTube, έχει υποστηρίξει στην υπόθεση «Συγγραφέας Authors εναντίον Google», λέγοντας ότι τα μοντέλα μηχανικής μάθησης που έχουν εκπαιδευτεί σε υλικό που προστατεύεται από πνευματικά δικαιώματα πρέπει να προστατεύονται υπό την ορθή χρήση.

Δεν υπάρχει πρόθεση να εξαπατήσει

Η διαμάχη που κρύβεται πίσω από τα βαθιά ψεύτικα εστιάζεται στην παραπληροφόρηση και την εξαπάτηση. Για παράδειγμα, το Facebook και το Twitter απέκλεισαν παραπλανητικά και επιβλαβή deepfakes που μπορούν να προκαλέσουν κακό αντίκτυπο στις φετινές εκλογές.

Ο Jay-Z ζητά από το YouTube να καταργήσει βίντεο με φωνητική σύνθεση

Ωστόσο, η περίπτωση της φωνητικής σύνθεσης είναι πολύ διαφορετική. Όπως είπε στη δήλωσή του, όλα τα βίντεο που δημιουργεί και δημοσιεύει στο κανάλι του στο YouTube επισημαίνονται σαφώς ως σύνθεση ομιλίας τόσο στον τίτλο όσο και στην περιγραφή. Αυτό σημαίνει μόνο ότι τα βίντεο δεν προορίζονται να εξαπατήσουν κανέναν και ότι δεν εμπίπτει στις οδηγίες του YouTube σχετικά με τα παραποιημένα μέσα.

Αξιώσεις ορθής χρήσης και πνευματικών δικαιωμάτων

Η Roc Nation LLC έχει δύο αξιώσεις σχετικά με την κατάργηση βίντεο της Vocal Synthesis. Πρώτον είναι ότι τα βίντεο παραβίαζαν τη χρήση πνευματικών δικαιωμάτων του Jay-Z. Από την άλλη πλευρά, ο δεύτερος ισχυρισμός είναι ότι τα βίντεο χρησιμοποιούν παράνομα τεχνητή νοημοσύνη για να πλαστοπροσωπήσουν τη φωνή του πελάτη τους.

Τα βίντεο που δημοσιεύθηκαν στο κανάλι Vocal Synthesis YouTube δημιουργήθηκαν μέσω της κατάρτισης ενός μοντέλου με τεράστια ποσότητα μεταγραφών κειμένου και ηχητικών δειγμάτων. Στην περίπτωση του Jay-Z, ο ιδιοκτήτης του καναλιού τροφοδότησε τους στίχους και τα τραγούδια του καλλιτέχνη στο Tacotron 2, μια αρχιτεκτονική νευρωνικών δικτύων που αναπτύχθηκε από τη μεγαλύτερη πλατφόρμα αναζήτησης Google.

Προβολές YouTube στο Jay-Z Push The Site

Για αυτόν τον λόγο, είναι πολύ λογικό να υποθέσουμε ότι μια σύνθεση ήχου που διαμορφώνεται από ήχο που προστατεύεται από πνευματικά δικαιώματα θα θεωρείται παράγωγα έργα. Ωστόσο, το πραγματικό ερώτημα είναι αν πρέπει να θεωρηθεί παραβίαση πνευματικών δικαιωμάτων ή όχι. Στον κόσμο όπου σχεδόν όλα προστατεύονται από πνευματικά δικαιώματα, εξαρτάται από το πώς χρησιμοποιήθηκε ο ήχος που δημιουργήθηκε από AI και ποιος είναι πραγματικά ο σκοπός του.

Είναι πολύ εύκολο να φανταστεί κανείς ότι ο νόμος βρίσκει πολλές παραβιάσεις πνευματικών δικαιωμάτων και δημοσιότητας χρησιμοποιώντας τη σημερινή τεχνολογία. Για παράδειγμα, εάν ένας παραγωγός δίσκου είχε τον Jay-Z ή τον επισκέπτη άλλου καλλιτέχνη σε ένα single χωρίς να ενημερώσει ή να ζητήσει την άδειά του, σίγουρα θα συνέβαινε μια νομική προσφυγή.

Ο Jay-Z ζητά από το YouTube να καταργήσει βίντεο με φωνητική σύνθεση

Συμπέρασμα

Ωστόσο, όπως επεσήμανε ο δημιουργός της φωνητικής σύνθεσης, παράγωγα έργα όπως τα βίντεό του πρέπει να προστατεύονται υπό ορθή χρήση. Η εύλογη χρήση είναι πολύ περίπλοκη για τον καθορισμό, αλλά υπάρχουν τέσσερις τρόποι για να το σταθμίσετε στο δικαστήριο: ο σκοπός του, η φύση του έργου που προστατεύεται από πνευματικά δικαιώματα, το ποσό καθώς και η ουσία του μέρους που λαμβάνεται και η επίδραση της πιθανής χρήσης στην αγορά.

Στην περίπτωση της Vocal Synthesis, τα βίντεο που δημιουργεί είναι αποκλειστικά για ψυχαγωγικούς σκοπούς και δεν προορίζονται να εξαπατήσουν. Για αυτόν τον λόγο, υπάρχει μεγάλη πιθανότητα τα βίντεό του να μην εμπίπτουν σε παραβίαση πνευματικών δικαιωμάτων.

0 αρέσει

Αφήστε ένα σχόλιο.