Руководитель ИППИ РАН Федоров: если не тренировать естественный интеллект, он атрофируется

Наука

25 Просмотры 0

Институт проблем передачи информации (ИППИ) РАН стоял у истоков создания цифровой вселенной человечества. О великой истории института и его сегодняшнем пути, о том, что такое хемоинформатика, нужен ли технологический суверенитет в развитии искусственного интеллекта (ИИ) и не превратится ли он в будущем во врага человечества, в интервью ТАСС рассказал руководитель ИППИ РАН им. А.А. Харкевича Максим Федоров

— ИППИ РАН существует уже больше 60 лет. Надо сказать, что в публичном пространстве это один из недооцененных академических институтов. Какие достижения ИППИ за прошедшие десятилетия вы особенно выделили бы?

— ИППИ РАН был создан в начале 1960-х годов Александром Александровичем Харкевичем и его единомышленниками, в том числе академиком Владимиром Котельниковым. Эти гениальные провидцы поняли, что будущее за цифровыми технологиями связи, обработки и передачи информации

Они — пионеры цифрового века, хотя тогда это было совсем не очевидно, поскольку в то время аналоговые системы связи доминировали. Транзистор был только изобретен. Но как только были созданы полупроводниковые приборы, эти люди поняли огромный потенциал миниатюризации за счет эффектов на атомарном уровне.

Они поверили в цифровые технологии, потому что поняли: одно из их преимуществ — возможность технически бесконечное количество раз копировать, шифровать, дешифровать. "Цифра" позволяет копировать технически бесконечно, что аналоговые системы не позволяют. При перезаписи магнитных лент теряется качество. Мы сейчас это воспринимаем как данность, но, чтобы понять это в аналоговом мире, нужно было иметь серьезную научную интуицию.

Если говорить про вклад в сегодняшнюю технологию, то практически в каждом смартфоне используются алгоритмы обработки видео и изображения и протоколы цифровой связи, разработанные в свое время в нашем институте. Без преувеличения могу сказать, что выдающиеся умы ИППИ очень много сделали для страны и мировой науки. Фундаментальный вклад института сложно оценить, потому что алгоритмы не патентуются, но наши результаты используются во многих системах компьютерного зрения, анализа изображений, цифровой связи и предсказательного моделирования по всему миру. Уровень института был и остается высочайшим, у нас есть филдсовские лауреаты, лауреаты Абелевской премии — несколько сотрудников отмечены высочайшими наградами в математике уровня Нобелевской премии.

Три направления — триединый институт

У Харкевича было три основных научных направления, которые он отразил в своем классическом трактате, институт и сегодня развивается по определенным им направлениям.

Первое — цифровая связь с фокусом на помехоустойчивое кодирование, помехоустойчивую передачу сигналов, широкополосную связь. Интересно, что телевизоров тогда было совсем немного, а наши гении уже думали про цифровую обработку видео. Для них было понятно, что нужно кодировать и передавать не только аудио-, но и видеосигналы.

У нас есть фотографии передачи видеосигнала с Венеры, с космических аппаратов в дальнем космосе — это все наши разработки. Кстати, интересно, что ставки в институте выдавались через Президиум Академии наук СССР. И до сих пор работают люди, которых утверждал на работу Президиум Академии. Понимаете, насколько высок был уровень отбора в ИППИ?

Второе направление — то, что сейчас называется машинным обучением, а тогда это называлось опознанием образов. Не распознавание, а именно опознание. Еще один выдающийся ученый, работавший в институте, — кибернетик и один из основоположников теории распознавания образов Михаил Бонгард ставил проблему как узнавание. А Харкевич определял ее как опознание образа.

С момента создания института машинное обучение в ИППИ активно развивалось. И до сих пор работают люди, которые помнят, как оно начиналось. Например, ведущий научный сотрудник лаб. Ц-4 Вадим Львович Стефанюк читает курс по истории развития искусственного интеллекта, показывает фотографии ламповых приборов. Они начинали с ламп. Это живые свидетели всех волн интереса к нейросетям, к тому, что сейчас не совсем корректно называют искусственным интеллектом.

Бонгард, кстати, занимался вполне практическими задачами: например, выбором места для бурения нефтегазовой скважины. Он сэкономил сотни миллионов советских рублей для нефтегазовой промышленности в конце 1960-х. А с другой стороны, занимался фундаментальными проблемами.

Именно Бонгард составил знаменитые 100 тестов на проверку интеллектуальности алгоритмов. Дело в том, что они уже тогда понимали: тест Тьюринга когда-нибудь машиной будет обойден. Это и произошло недавно: многие современные большие языковые модели уже проходят тест Тьюринга достаточно успешно. А наши ученые это понимали 60 лет назад, поэтому создали более устойчивую систему проверки. До сих пор нет ни одного алгоритма, то есть ИИ, который прошел бы все 100 тестов Бонгарда. А человек проходит их относительно легко.

Третье направление — теория информации. Харкевич и его коллеги понимали, что мы входим в эру расширения информационной вселенной и важно понимать фундаментальные законы передачи и обработки информации. Здесь ценен вклад [Алексея Николаевича] Колмогорова  (крупного советского математика — прим. ТАСС) — одна из его известнейших статей по сложности была опубликована в журнале института "Проблемы передачи информации".

Эти три направления переплетаются. Сложно представить цифровые технологии связи без машинного обучения. А фундамент всего — теория информации.

Химическая информатика (хемоинформатика): новая точка экспоненциального роста

— Какие направления исследований сейчас наиболее перспективны? Как институт справляется с интеграцией химических и биологических данных?

— Наши предшественники научили нас искать новые точки приложения там, где ожидается экспоненциальное развитие. Использование машинного обучения в молекулярных науках — химии, химических технологиях, молекулярной биологии — имеет колоссальный потенциал. Думаю, можно заниматься этим еще 100–200 лет.

Потенциальный объем возможных для синтеза только малых молекул — меньше 200 атомов — по разным оценкам, от 10^60 до 10^180 за счет комбинаторики. Если добавляем макромолекулы, полимеры, белки — технически это бесконечность. Эти числа больше количества атомов во всей известной Вселенной.

Нам нужны инструменты навигации в этом пространстве. Все, что мы знаем об окружающем молекулярном мире — более 200 млн известных молекул, — это ни о чем по сравнению с этим колоссальным объемом. Наше молекулярное окружение сильно изменилось на протяжении одного поколения. Тысячи новых веществ ежедневно — они вокруг нас. Мы же как биологический вид эволюционировали в совсем другом химическом окружении.

Есть вещества, которые сразу не отравляют, но приводят к хроническим эффектам. Эндокринные разрушители — в пластике, упаковках, природе. Их эффект на популяционное здоровье пока непонятен. Мы — первое поколение, проэкспонированное этим веществом. Каждый день человечество синтезирует 15 тыс. новых веществ, и скорость их появления растет из-за автоматизированных систем. Но еще больше открытий ждет в невообразимой молекулярной вселенной.

Нам нужны инструменты быстрого анализа свойств, генерации молекул под заданную задачу. Но не методом простого перебора — мы столько не проживем. А с другой стороны, интересно понимать, как эта молекулярная вселенная устроена.

Есть квантовая механика, но мы упираемся в вычислительную сложность. За счет высокой сложности алгоритмов мы даже большие молекулы точно обсчитать не можем. Тем более групповое взаимодействие — это "число Авогадро" молекул.

Но это поддается описанию с помощью машинного обучения. Взаимосвязи между эффектами мы можем вычленить вместо прямого моделирования. Хемоинформатика использует современные методы ИКТ (информационно-коммуникационные технологии — прим. ТАСС), машинное обучение, большие данные для решения задач в химии. Поэтому мы в ИППИ развиваем методы анализа химических рисков нового поколения, используя машинное обучение, а также экспресс-методы диагностики.

Технологический суверенитет против замкнутости

— Нужен ли технологический суверенитет в области ИИ и передачи информации?

— Давайте разделять замкнутость и технологический суверенитет. Суверенитет нужен в IT. Пример из личной практики: в 2018 году мне лично не продали зарубежную базу данных по свойствам химических веществ, несмотря на отсутствие санкций тогда. Они воспринимали нашу группу как конкурента. В 2022 году наши патентные ведомства оказались отключены от зарубежных источников данных по химии. Благо, что у нас были наработки. А ведь над нами смеялись: "Зачем делаете то, что уже сделано?" Я отвечал: "Мы следуем принципу "обгонять не догоняя". Мы делаем лучше, используем другие технологии.

В ИКТ за счет эффектов масштабирования можно очень быстро масштабироваться, но и очень быстро стать исключенным. Если у тебя нет доступа к кнопке, ты всегда заложник. Но надо быть открытым. Наука — планетарный феномен. Надо использовать потенциал мировой науки, общаться, обсуждать. Но платформа технологического развития должна быть суверенной.

Новая редакция стратегии научного развития, где государство выступает квалифицированным заказчиком, — колоссальное достижение. Мы начали понимать: наука для страны, страна для науки.

Искусственный интеллект в будущем: друг или враг?

— В России, как и во всем мире, развитию ИИ уделяется особое внимание. При этом постоянно звучит вопрос: ИИ в будущем — враг или друг?

— Это зависит от нас. Сошлюсь на диалог в книге писателя Казанцева "Пылающий остров" про производство технологий двойного назначения. Один собеседник другому говорит: "Я произвожу иголки. Что человек с ними делает — зашивает дыру или кладет в суп соседу, — его проблемы".

ИИ — это инструмент. К примеру, как более технологичный молоток. Многие страхи имеют психологическую причину, ведь у людей склонность к антропоморфизации всего, что вокруг. Люди разговаривали с бездушными машинами задолго до появления современного ИИ. Наши зеркальные нейроны заставляют приписывать неодушевленным предметам свойства, которых нет. Мы прошли сложный путь регулирования медицинских препаратов и сейчас понимаем: если следуем рекомендациям врача, вряд ли что-то плохое случится. То же с ИИ — нужен регуляторный подход.

Кстати, я противник широкого использования ИИ в образовании. Проблема не в том, что ИИ плохой, а в возможных сценариях деградации людей. Если человек не тренируется — у него наступает атрофия мышц. То же с мышлением: не тренируешь свой естественный интеллект, он постепенно атрофируется.

Если ИИ освобождает время учителя от рутины для общения с учениками — это полезно. Но если заменяет учителя — то мы спустя короткое время получим негативный эффект от этого. Детей нужно учить мыслить, писать сочинения, отвечать самим. И в целом, взаимодействие "учитель — ученик" более устойчивое: человек эволюционировал как система, корректирующая сама себя.

Фундаментальная проблема — отсутствие системы анализа пределов применимости нейросетей. Все, кто пользуется большими языковыми моделями, сталкивались с проблемой галлюцинаций LLM (вымышленные ответы нейросетей, не имеющие отношения к действительности — прим. ТАСС). И мы пока не можем точно сказать, где они будут галлюцинировать, а где дадут точный ответ.

Нейросети могут показать интересный результат, но выпускать алгоритмы управления критическими устройствами — самолетами, автомобилями — рановато. В классических методах мы можем рассчитать пределы применимости, в нейросетях — пока нет.

— К вам идет работать молодежь? Что интересно молодым ученым в ИППИ РАН?

— За несколько лет количество молодых ученых выросло вдвое. Молодежь понимает: деньги не всегда главное в начале карьеры. Важно — получить знания и интересные задачи, понять свои границы возможностей. Нынешнее поколение ищет границы своих возможностей. Институт уникален сочетанием мощной фундаментальной подготовки и практически важных задач. Эта практико-ориентированная фундаментальная наука привлекает. У нас базовая кафедра в МФТИ на высоком месте в рейтингах.

Фундаментальная наука позволяет заглянуть за горизонт — что произойдет через 5, 10 или 60 лет. Отцы-основатели смотрели на 60–70 лет вперед, занимались вопросами, которые тогда было невозможно воплотить. Институт предоставляет возможность увидеть развитие технологий через десятки лет. К примеру, мы активно развиваем квантовую теорию передачи информации. Но для начала мы много должны узнать об основных принципах передачи в квантовых системах. Как в свое время теорема Котельникова — Шеннона позволила создать цифровые технологии, так сейчас мы входим в квантовую эпоху с чертами аналоговых и цифровых систем. Развиваем направление на стыке социальных наук и машинного обучения. Большие языковые модели — мощные инструменты анализа информации, но сам феномен требует осмысления. Работаем с ЮНЕСКО по этике ИИ в науке и образовании.

Вот вопрос: а где грань между написанием статей человеком и ИИ? Все больше научных групп используют ИИ для чтения статей — нет ли критических ошибок в их осмыслении? Институт продолжает развиваться в направлении отцов-основателей: ищем новые точки экспоненциального роста, работаем на стыке фундаментальной науки и практических приложений, готовим молодые кадры для решения задач будущего. Это и привлекает в ИППИ РАН молодежь. 

Как Вы оцените?

0

ПРОГОЛОСОВАЛИ(0)

ПРОГОЛОСОВАЛИ: 0

Комментарии