Валерия
Лебедева

Юрий Литвиненко
27.01.2023

Союз дикторов просит Госдуму установить специальное регулирование синтеза человеческого голоса с помощью технологий искусственного интеллекта (ИИ). Дикторы говорят о случаях кражи их голосов и опасаются снижения доходов на фоне распространения технологий. Предлагается, в частности, ввести лицензии на использование определенного голоса. Компании, синтезирующие речь, говорят, что заботятся о легитимности технологии. Но юристы подтверждают, что голос никак не защищен от копирования.

"Ъ" ознакомился с копией письма Союза дикторов России главе комитета Госдумы по информполитике Александру Хинштейну от 26 января. Дикторы предлагают в нем разработать регулирование синтеза голосов с помощью ИИ. В союзе подтвердили подлинность письма, господин Хинштейн заявил "Ъ", что пока его не получал.

Речь идет о технологиях, которые копируют голос человека на основе звуковой записи и позволяют в дальнейшем использовать его в голосовых помощниках, онлайн-синтезаторах и пр.

В перспективе получить синтезированную речь станет дешевле, чем записать диктора, и многие голосовые артисты лишатся работы, считают авторы письма.

Дикторы в письме рассказывают о фактах "кражи" голоса с помощью ИИ: "Нет ни норм, ни практики, ни понимания, как писать претензию. Заказчики ссылаются на договор, в котором есть пункты про отчуждение прав, право на переработку и право передачи третьим лицам".

Члены союза предлагают закрепить запрет на отчуждение прав исполнителей при использовании голосового синтеза и перейти на лицензионные договоры "с четко определенным сроком действия", как в сфере защиты прав на товарный знак. Также предлагается закрепить норму о том, что запись синтезированного голоса может использоваться только в конкретном проекте.

Михаил Мишустин, премьер РФ, 2 сентября 2021 года (цитата по ТАСС): "Можно сколько угодно говорить о том, что роботы вытеснят какие-то специальности, заменят людей. Не соглашусь с этим".

ИИ-инструменты начинают активно внедряться для озвучивания аудиокниг, сообщал "Ъ" 23 января: участники рынка рассчитывают, что это удешевит и ускорит процесс их производства. "Издательствам нужна хорошая озвучка по приемлемой цене, дикторам — сохранение профессии, которой многие отдали годы",— говорит руководитель аудиопроектов Alpina Digital Николай Боронин. У владельца или разработчика ИИ должен быть договор на использование голоса, однако от прямого пиратства никто не застрахован, признает он.

В издательской группе "Эксмо-АСТ" считают, что опасения дикторов "не в полной мере оправданны". Сервис "Яндекса" SpeechKit, с которым сотрудничает группа, заключает договоры с диктором, на основе голоса которого синтезируется речь, говорят в пресс-службе группы. Кроме того, без личного участия специалиста, чей голос отобран по специальным параметрам, невозможно добиться качества автоматического озвучивания, добавляют в группе.

Глава VS Robotics (занимается решениями на базе речевых технологий) Дмитрий Теплицкий рассказал, что в теории синтезировать речь определенного человека можно и без многочасовой записи: "У нас есть опыт создания голосов знаменитых личностей на основе записей спектаклей, отрывков из фильмов, публичных выступлений. Здесь важно, чтобы записи были как можно более чистыми и сопровождались текстовой расшифровкой". Но для создания нового голоса для TTS (text-to-speech, преобразование текста в речь) компания все же отбирает дикторов и записывает их живой голос продолжительностью от пяти часов. Гендиректор ЦРТ Дмитрий Дырмовский отмечает, что компании-лидеры в области речевых технологий уделяют внимание легитимности его применения "и в целом этике ИИ".

Голос невозможно защитить от "копирования": если имитирование само по себе совершается без преступного умысла, то за такое использование даже ответственности не предусмотрено, говорит управляющий партнер Enterprise Legal Solutions Юрий Федюкин:

"Понять дикторов можно, но с точки зрения закона реализация их инициативы невозможна просто в силу того, что законом защищается не голос, а фонограмма, созданная с его применением".

Внесение изменений в российское законодательство, которые могли бы сделать это возможным, не имеет смысла, полагает Юрий Федюкин, поскольку обрабатывать фонограммы дикторов тогда просто будут в других странах.

Новости из связанных рубрик