В России впервые протестировали синхронный нейроперевод

МОСКВА, 26 сентября. /ТАСС/. Первый в России тест рабочего прототипа синхронного нейропереводчика, аналогов которому в мире пока не существует, состоялся в Москве на Мировой атомной неделе. Об этом ТАСС сообщил управляющий партнер Корпорации по связям с искусственным интеллектом Денис Терехов.

"Корпорация по связи с искусственным интеллектом (AIR Corp) впервые в России показала работающий синхронный нейроперевод, который точно передает речь конкретного спикера, удерживая его смысл, темп и профессиональный словарь. Насколько мне известно, в мире не существует аналогичных стабильно работающих систем. Наше решение отработало стабильно и доказало, что уже сегодня мы можем заменить классическую работу синхронистов. Наш следующий шаг - глубже учитывать контекст мероприятия и профильный вокабуляр, а также снизить задержку перевода до двух секунд", - рассказал он.

По словам Терехова, сложность системы заключается в том, что в ней одновременно задействованы три нейросети: одна преобразует голос в текст, вторая переводит его, а третья снова озвучивает.

"Главная сложность технологии именно в реалтайме, что это необходимо делать так же быстро, как это делает человек

Пока машина это делает чуть медленнее человека, синхронист в среднем синхронит за три секунды, машина за пять. Но мы работаем над тем, чтобы сделать это, если уж не быстрее человека, то, по крайней мере, сопоставимо во времени. И главная прорывная составляющая технологии в том, что это возможности для синхронного перевода на практически любое количество языков. Эта технология позволяет сразу переводить на десятки языков в режиме реального времени", - указал собеседник агентства.

Терехов отметил, что решение обеспечивает качественный, контекстный перевод речи спикера в реальном времени на 10 языков с одновременной передачей текста и озвучки. По его словам, это первый шаг к полной замене живых синхронистов.

О проекте

Как рассказали ТАСС в компании, ключевыми отличиями отечественного решения являются фокус на голосе докладчика, автоматическое определение исходного языка, параллельный перевод на десять языков и профессиональная озвучка собственными синтезированными голосами для каждого языка. Процесс включает распознавание речи, перевод текста, синтез аудио и выдачу результата одновременно в виде текста и звука в одном интерфейсе.

"Система работает на базе трех генеративных нейросетей, специальным образом дообученных и развернутых в закрытом контуре с использованием GPU процессоров, что обеспечивает скорость и приватность данных. В рамках форумных панелей система обеспечила стабильный, качественный перевод выбранного спикера при средней задержке около пять-семь секунд относительно оригинала", - рассказали ТАСС.

В 2024 году японский государственный Национальный институт информационных и коммуникационных технологий разработал систему автоматического синхронного устного перевода, которую предполагается использовать в том числе для ведения международных переговоров большой секретности.

tass.ru

Как Вы оцените?

0

Оценка 0/5
1
2
3
4
5

О проекте

Как Вы оцените?

0

ПРОГОЛОСОВАЛИ: 1

Почитать ещё

Комментарии