読書時間:5分、22秒

Jay-ZがYouTubeにボーカル合成で動画の削除を依頼

新しいYouTubeチャンネルであるVocal Synthesisは、オーディオのディープフェイクの公開に特化しています。 これらのオーディオのディープフェイクは、人間の声を模倣するためにAIによって生成されます。

ユーチューブ ボーカルシンセシスと呼ばれるチャンネルは、オーディオディープフェイクの公開専用です。 これらのオーディオのディープフェイクは、人間の声を模倣するために人工知能によって生成される音声です。 これらのAI生成の音声が模倣する音声は、最新のシステムでニューラルネットワークをトレーニングすることにより、テキストによって合成されます。

Jay-ZがYouTubeにボーカル合成で動画の削除を依頼

ボーカルシンセティックスのビデオは注目に値し、人気のある声とありそうもない会話を組み合わせています。たとえば、ボブ・ディランがブリトニー・スピアーズの声で歌う、タッカー・カールソンがウナボンバー・マニフェストを読む、アイン・ランド、スラヴォイ・ジゼクがサニーとシェールを歌う、ビル・クリントンがベイビー・ゴットを暗唱する、およびリックとモーティの知的メリットを宣伝するJFK。

ビデオのいくつかは、陽気な音楽マッシュアップを思いつくために音楽を追加したファンによって作成されました。

動画が削除された

以来、初めて ユーチューブ チャンネルが作成され、匿名のままであるボーカルシンセシスの所有者は、YouTubeで著作権侵害の申し立てを受けました。 ジェイ・Zのオーディオがディープフェイクされて、「するべきか否か」というハムレットの独り言を伝えるチャンネルで公開された彼のXNUMX本の動画と、ビルジョエルの「火は始まらない」は削除されました。

Jay-ZがYouTubeにボーカル合成で動画の削除を依頼

YouTubeチャンネルの作成者は、Roc Nation LLCが著作権侵害の申し立てを行った人物であり、動画が削除された理由は、チャンネルの動画が違法に人工知能を使用してRoc Nation LLCのクライアントの声を偽装したためであると述べました。

どちらの動画も上記の動画共有プラットフォームによってすぐに削除されましたが、LBRYと呼ばれるオープンソースの分散型公開プラットフォームで引き続き視聴できます。 一方、ディープフェイクされたオーディオを含むJay-Zのビデオは、まだインターネットに残っています。 これらのビデオは、彼が創世記と海軍シールのコピーパスタをラップしていた場所です。

動画の作成者は、動画の削除をクリエイティブな方法で発表しました。 彼は米国大統領のドナルドトランプ、バラックオバマ、JFK、FDR、ロナルドレーガンの声を使いました。

以下は、ビデオに含まれるメッセージです。

過去数か月の間に、Vocal Synthesisの作成者は、さまざまな有名人や人気のある個人のパターンに基づいて、多くの音声合成モデルをトレーニングすることができました。 彼はこれらのモデルを使用して、YouTubeチャンネル用にXNUMX本を超える動画を作成しました。 ビデオは通常、スピーチまたは短いテキストをナレーションする合成音声のある有名人を特集しています。 ほとんどの場合、選択されるテキストは、注目の有名人の現実のペルソナと面白いまたは面白いコントラストを提供するテキストです。

YouTubeチャンネルは、機械学習とAIテクノロジーに大きな関心を寄せているだけでなく、多くの余暇を持っている愛好家によって作成されたようです。 また、自分のYouTubeチャンネルで公開する動画はすべて娯楽目的であり、悪意のある目的はXNUMXつもないことに注意したいと思います。 さらに、彼が公開するすべてのビデオのタイトルには、タイトルと説明の両方に音声合成ラベルが付いています。

Jay-Z Synthetic VoiceがYouTubeの視聴回数を増やしましたか?

ビデオの合成音声はまた、Jay-ZとRoc Nation LLCが彼のビデオを削除することでYouTuberをいじめていることに彼らの失望を表明しました。 さらに、人々はまた、ビデオ共有プラットフォームが強力な個人を小規模なコンテンツ作成者の創造性を阻害することで味方することを選択することに失望しました。 その上、YouTubeが「AIのなりすまし」をVocal Synthesisからの動画を削除する理由として受け入れたのは皮肉なようです。著作権で保護された素材でトレーニングされた機械学習モデルは、フェアユースの下で保護されなければなりません。

欺くつもりはない

ディープフェイクの根底にある論争は、偽情報と欺瞞に焦点を当てています。 たとえば、FacebookとTwitterは、今年の選挙に悪影響を及ぼす可能性がある誤解を招く有害なディープフェイクをブロックしました。

Jay-ZがYouTubeにボーカル合成で動画の削除を依頼

ただし、ボーカルシンセシスの場合は大きく異なります。 彼の声明で述べたように、彼が作成して自分のYouTubeチャンネルで公開しているすべての動画は、タイトルと説明の両方で音声合成として明確にラベル付けされています。 これは、動画が誰かを欺くことを意図したものではなく、操作されたメディアに関するYouTubeのガイドラインの範囲外であることを意味します。

フェアユースと著作権の主張

Roc Nation LLCは、Vocal Synthesisのビデオ削除に関してXNUMXつの申し立てを行っています。 XNUMXつは、ビデオがJay-Zの著作権の使用を侵害していることです。 一方、XNUMX番目の主張は、動画が人工知能を不法に使用してクライアントの声を偽装しているというものです。

ボーカル合成のYouTubeチャンネルで公開されているビデオは、大量のテキストの文字起こしとオーディオサンプルを使用してモデルをトレーニングすることによって作成されました。 Jay-Zの場合、チャンネルの所有者はアーティストの歌詞と曲をTacotron 2にフィードしました。TacotronXNUMXは、最大の検索プラットフォームGoogleによって開発されたニューラルネットワークアーキテクチャです。

Jay-ZのYouTube再生回数がサイトをプッシュ

このため、著作権で保護された音声からモデル化された音声合成が派生著作物と見なされることを想定することはかなり合理的です。 しかし、本当の問題は、それを著作権侵害と見なすべきかどうかということです。 ほとんどすべてが著作権で保護されている世界では、AIで生成されたオーディオがどのように使用され、その目的が実際に何であるかによって異なります。

今日の技術を使用して多くの著作権および肖像権の侵害を発見する法律を想像するのは非常に簡単です。 たとえば、レコードプロデューサーがジェイ-Zまたは他のアーティストのゲストをシングルに許可または通知せずに持っていた場合、法的手段が確実に発生します。

Jay-ZがYouTubeにボーカル合成で動画の削除を依頼

結論

ただし、Vocal Synthesis作成者から指摘されたように、彼のビデオなどの派生作品はフェアユースで保護する必要があります。 フェアユースの定義は非常に複雑ですが、法廷でそれを比較検討するにはXNUMXつの方法があります。その目的、著作権で保護された作品の性質、取られた部分の量と実質性、および市場での潜在的な使用の影響です。

ボーカルシンセシスの場合、彼が作成するビデオは娯楽目的のみであり、騙すことを意図したものではありません。 このため、彼の動画が著作権侵害に該当しないという強い主張があります。

0が好き

コメントを残す。