МОСКВА, 26 сентября. /ТАСС/. Первый в России тест рабочего прототипа синхронного нейропереводчика, аналогов которому в мире пока не существует, состоялся в Москве на Мировой атомной неделе. Об этом ТАСС сообщил управляющий партнер Корпорации по связям с искусственным интеллектом Денис Терехов.
"Корпорация по связи с искусственным интеллектом (AIR Corp) впервые в России показала работающий синхронный нейроперевод, который точно передает речь конкретного спикера, удерживая его смысл, темп и профессиональный словарь. Насколько мне известно, в мире не существует аналогичных стабильно работающих систем. Наше решение отработало стабильно и доказало, что уже сегодня мы можем заменить классическую работу синхронистов. Наш следующий шаг - глубже учитывать контекст мероприятия и профильный вокабуляр, а также снизить задержку перевода до двух секунд", - рассказал он.
По словам Терехова, сложность системы заключается в том, что в ней одновременно задействованы три нейросети: одна преобразует голос в текст, вторая переводит его, а третья снова озвучивает.
"Главная сложность технологии именно в реалтайме, что это необходимо делать так же быстро, как это делает человек
Терехов отметил, что решение обеспечивает качественный, контекстный перевод речи спикера в реальном времени на 10 языков с одновременной передачей текста и озвучки. По его словам, это первый шаг к полной замене живых синхронистов.
О проекте
Как рассказали ТАСС в компании, ключевыми отличиями отечественного решения являются фокус на голосе докладчика, автоматическое определение исходного языка, параллельный перевод на десять языков и профессиональная озвучка собственными синтезированными голосами для каждого языка. Процесс включает распознавание речи, перевод текста, синтез аудио и выдачу результата одновременно в виде текста и звука в одном интерфейсе.
"Система работает на базе трех генеративных нейросетей, специальным образом дообученных и развернутых в закрытом контуре с использованием GPU процессоров, что обеспечивает скорость и приватность данных. В рамках форумных панелей система обеспечила стабильный, качественный перевод выбранного спикера при средней задержке около пять-семь секунд относительно оригинала", - рассказали ТАСС.
В 2024 году японский государственный Национальный институт информационных и коммуникационных технологий разработал систему автоматического синхронного устного перевода, которую предполагается использовать в том числе для ведения международных переговоров большой секретности.
Комментарии