Перейти к содержимому

Радиоведущий обвинил Google в краже его голоса ради ИИ

 |  Редакция  | 

Технологии и медиа⁠,

WP: радиоведущий обвинил Google в краже его голоса ради ИИ

Радиоведущий, ведущий популярное политическое шоу, подал в суд на Google за использования его голоса в ИИ-подкастах. Он считает, что ИИ-помощник компании украл не только звучание, но и особенности его речи

Радиоведущий Дэвид Грин подал в суд на Google, обвиняя компанию в том, что она обучила ИИ-сервис NotebookLM на записях его голоса. В иске неназванная компания, специализирующаяся на судебной экспертизе ИИ, установила, что для обучения искусственного голоса NotebookLM с вероятностью от 53% до 60% был использован реальный голос журналиста, сообщает The Washington Post (WP).

Профессор цифрового права Корнеллского университета Джеймс Гриммельман заявил, что Грину не нужно обязательно доказывать, что Google обучил NotebookLM на голосе ведущего, или что голоса ИИ и журналиста совпадают на 100%. По словам юриста, Грину нужно лишь доказать, что ИИ-голос имитирует его особенности.

Сам Грин уверяет, что мужской голос NotebookLM звучит точно так, как и он сам — от интонаций и ритма до особенностей речи: заминки «эээ» или использование в речи слова-паразита «типа».

Грин является популярным политическим журналистом в США и ведет подкаст «Left, Right & Center», где выступает медиатором в беседах с экспертами левого и правого толка. По данным National Public Radio (NPR), радио где работает Грин, с 2012 по 2020 год его голос прослушали около 13 млн слушателей в программе «Morning Edition», что сделало ее самой популярной новостной радиопередачей в Америке.

Фото:guys_who_shoot / Shutterstock

В Google полностью отвергли обвинения и заявили WP, что мужской голос, используемый в подкасте NotebookLM не имеет никакого отношения к Грину. «Эти обвинения безосновательны», — заявил представитель Google Хосе Кастанеда. Он добавил, что компания наняла профессионального актера, чтобы он дал свой голос для аудиоаватаров NotebookLM.

В 2023 году Microsoft объявила о разработке искусственного интеллекта под названием VALL-E, который способен имитировать любой голос. Искусственному интеллекту достаточно прослушать трехсекундную запись, чтобы досконально скопировать голос и манеру речи, которая будет использована даже в тех словах, которые человек никогда не произносил.

Фото:Taris Tonsa / Shutterstock

Создатели ChatGPT в 2024 году представили нейросеть Voice Engine, которая способна воссоздать голос любого человека на основе 15-секундного аудиопримера. Разработчики OpenAI считают, что технология будет полезна для восстановления голоса у людей, потерявших его. Сам ИИ способен при помощи клонированного голоса воспроизводить любой заданный текст.