Команда Яндекса анонсировала значительное обновление своего фирменного книжного сервиса, «Яндекс Книги», которое обещает значительно улучшить пользовательский опыт. В рамках новых функций был внедрён усовершенствованный виртуальный рассказчик, созданный на основе последней нейросетевой модели синтеза речи. Это нововведение делает озвучивание книг ещё более натуральным и живым, приближая его к голосу настоящего диктора.
Ранее использовавшаяся модель имела ограничения — её голос был монотонным и не воспринимался как естественный, что существенно снижало качество прослушивания, особенно для долгих произведений. Новая версия системы успешно решает эти проблемы, предлагая более выразительную и динамичную чтецкую манеру, с учётом жанра книги и её эмоциональной составляющей. Благодаря усовершенствованиям, интонация виртуального рассказчика стала намного более естественной и разнообразной, что делает прослушивание увлекательнее и комфортнее.
В Яндексе отметили, что новая технология показывает высокие результаты в сравнении с ведущими мировыми решениями, такими как ElevenLabs, показывая преимущество в 80% случаев по качеству синтеза голоса на русском языке. Для обучения модели использовали массовый массив речевых фрагментов, записанных профессиональными дикторами, которые зачитывали тексты разных жанров — фантастику, детективы, романы, учебники и другие. Это позволило системе научиться адаптировать голос под стиль произведения, а также распознавать диалоги и выделять реплики героев, что делает озвучку ещё более правдоподобной и эмоциональной.
Благодаря этому обновлению, функция озвучивания теперь доступна для более чем 120 тысяч книг, что существенно расширяет возможности пользователей сервиса. Озвучка предоставляется как в веб-версии, так и в мобильном приложении, что обеспечивает удобство использования для широкого круга читателей и слушателей. Такой шаг делает «Яндекс Книги» ещё более привлекательным и инновационным, позволяя наслаждаться чтением и прослушиванием в новых формах.
«Яндекс Книги» (ранее известный как «Букмейт») является интегрированной частью экосистемы компании Яндекс, объединяя электронные книги и аудиоформаты под одной платформой. Эта статья посвящена недавним достижениям сервиса: ранее в июне 2024 года была запущена первая версия виртуального рассказчика, который озвучивает более 13 тысяч книг в реальном времени, а в сентябре того же года сервис сменил название и стал частью международной платформы для любителей чтения и прослушивания. Новая нейросетевая модель, внедрённая в «Яндекс Книги», делает опыт пользования ещё более комфортным и технологически продвинутым, что не только способствует росту популярности сервиса, но и укрепляет позицию Яндекса как лидера в области интеллектуальных решений для спортсменов книг и аудиоразвлечений.