Редакция сайта ТАСС
САМАРА, 14 ноября. /ТАСС/. Ученые Самарского университета им. Королева создали методику распознавания информации, созданной интернет-ботами, даже тогда, когда это не могут определить классические тесты. Разработка позволит усовершенствовать имеющиеся тесты, сообщает пресс-служба вуза.
"Преподаватели и аспиранты Самарского университета им. Королева первыми в мире (по данным Google Scholar) провели экспериментальное исследование, посвященное проблемам возраста информации, которой оперируют популярные системы искусственного интеллекта (ИИ) - так называемые большие языковые модели (БЯМ)", - говорится в сообщении. Результаты исследования опубликованы в российском научном журнале "Искусственный интеллект и принятие решений".
Как пояснили в университете, системы БЯМ используют для разнообразных операций с текстами, таких как написание, литературная обработка, исправление ошибок, перевод, а также написание программных кодов, поиск и сбор информации, ответы на вопросы пользователей в сети
"В нашем исследовании мы рассматривали ограничения в применении БЯМ в связи с устареванием той информации, на которой модели обучались в свое время. Традиционные БЯМ не оснащены системами дообучения по большинству тем и областей человеческих знаний, поэтому со временем информация, которой владеют эти языковые модели, устаревает, ответы их чат-ботов становятся неточными и теряют актуальность", - рассказал доктор технических наук, профессор кафедры программных систем Самарского университета Андрей Сухов.
Ученые выявили, что форма информации, которую выдают чат-боты до и после своего обучения, различается. Так, ответ системы ИИ на вопрос, который она не изучала, будет содержать ссылки на источники информации в сети, и это станет катализатором того, что на вопрос отвечает программа. Момент смены формата ответа - это время прохождения обучения программы, а значит можно определить и возраст информации, которой она оперирует. Авторы исследования определили, что для выявления ИИ нужно составить и задать список вопросов, которые предполагают простой численный ответ, имеющий различные числовые значения в разные периоды времени, и чтобы ответы на эти вопросы можно было легко проверить с помощью поисковых систем в интернете. Ученые считают, что предложенный ими алгоритм в дальнейшем можно применять для составления обновленного списка вопросов при прохождении теста Тьюринга - классического исследования искусственного интеллекта, который легко проходят современные системы.
Комментарии