Штучний інтелект клонує голос та знижує вартість аудіокниг на 90%

Поділитися на facebook
Поділитися на twitter
Поділитися на linkedin
Технології штучного інтелекту здатні зменшити затрати часу й коштів на створення аудиокниги майже на 90%.

Китайський пошуковий сервіс Sogou створив штучний інтелект, який дозволяє озвучувати книги голосами їхніх авторів. Це наступний етап еволюції системи для державного новинного агентства Xinhua. Останнє і нині використовує штучний інтелект для зачитування новин.

Аудіокниги сьогодні стають дедалі популярнішими, причому цей тренд спостерігається як у Китаї, так і в країнах західної півкулі. Китайський медіагігант iiMedia прогнозує, що цей ринок у період з 2016 по 2020 подвоїться та досягне 7,8 млрд юанів на рік.

Технологія перетворення тексту на аудіо не нова, але більшість користувачів люблять, коли це робить професіонал: актор, автор чи відома публічна фігура. Їхній час коштує дорого, і тому, вважають експерти, розроблене Sogou рішення дозволить зменшити затрати. Для створення синтетичного голосу, який майже точно копіює власника, потрібна лише хвилина запису.

Лондонський стартап DeepZen, який займається такими ж технологіями, каже, що синтетичний голос здатний створити аудіокнигу за кілька годин. Це зменшує затрати часу та коштів майже на 90%.