Искусственный интеллект озвучивает книги!

Рынок аудиокниг не первый год бьёт рекорды. Сегодня его оборот в России составляет 2,7 млрд рублей. Последние пять — семь лет он демонстрирует 30%-ные показатели ежегодного роста. Попасть на этот праздник, к сожалению, могут не все. По данным ПАО «МТС», более 90% книг на российском рынке не имеют аудиоверсии. Этот сегмент охватывает узкий круг издателей, способных выводить бестселлеры на массовый рынок. Книгам попроще вход на аудиорынок практически закрыт, поскольку озвучка — дорогостоящий проект, сопоставимый с подготовкой бумажной книги. Диктор, звукорежиссёр, студия — всё это самостоятельные вложения.

isk-intell-kostyuk

Автор Константин КОСТЮК, генеральный директор издательства «Директ-Медиа»

На помощь приходят технологии речевого синтеза. Эти программы год от года демонстрируют заметный прогресс, но художественное чтение не допускает ошибок и фальшивых интонаций. Здесь может помочь искусственный интеллект. Он способен адаптировать книгу к чтению вслух и устранить ошибки. Именно это стало целью проекта «Искусственный интеллект читает книги!».

Издательский дом «Директ-Медиа» после нескольких лет упорной работы совершил прорыв, представив на рынок новый сервис создания аудиокниг. Основу услуги составляют технологический комплекс с использованием нейросетей и команда редакторов для контроля результата.

Почему нельзя просто загрузить электронный текст издания и получить качественное аудио? Очевидно, что перевести речь напрямую из письменной в устную на основе простых алгоритмов невозможно. Электронные тексты требуют тщательной подготовки. Решением именно этих задач занимается команда проекта.

Процесс выглядит следующим образом.

1. Оценка издания

Во внимание принимаются наличие нетекстовых элементов, необходимых для понимания аудиотекста.

2. Адаптация

Происходит очистка текста от сносок, расшифровываются редко встречающиеся аббревиатуры. С помощью нейросети приводятся к текстовому виду числительные.

3. Аннотирование

На базе словарей и обученных нейросетей для синтезаторов расшифровываются сложные речевые фрагменты.

4. Озвучивание

Подготовленный и аннотированный текст озвучивается выбранным голосом через речевой синтезатор.

5. Редактирование и корректура

Производится контрольное прослушивание аудиотекста. При необходимости редактор вносит исправления, пользуясь рабочим интерфейсом и разметкой аудиокниги.

isk-intell-1

Кому интересно, может зайти на сайт www.directmedia.ru и ознакомиться с серией «Послушайте!».

Комплексный подход позволяет создавать аудиокниги по цене в четыре-пять раз ниже, чем при озвучивании даже недорогим диктором. Использование автоматизации и нейросетей позволяет значительно удешевить и ускорить процесс. Стандартное издание объёмом около 10 авторских листов будет готово в течение нескольких дней, в то время как дикторское озвучивание займёт несколько недель.


Мы сумели успешно реализовать совместные проекты по озвучиванию больших объёмов текста со сложным содержанием, добившись в короткий срок высокого уровня качества продукта

Дмитрий Цап, издательство «Русское слово»


Также «Директ-Медиа» предлагает услуги продвижения аудиокниг по маркетинговым каналам, опираясь на многолетний опыт работы на рынке электронных книг.

Надеемся, наше предложение заинтересует издателей, которые хотели бы опробовать этот рынок. Для таких мы предлагаем первое издание бесплатно. Более подробная информация – на сайте www.aibooks.ru.

Сейчас самое время стать первым!


Рубрика: Инновационные технологии

Год: 2023

Месяц: Декабрь

Теги: Константин Костюк Аудиокниги Директ-Медиа