Американские исследователи
использовали видеоигры, чтобы оценить эффективность моделей
искусственного интеллекта (ИИ). Об этом
Об изобретении нового
бенчмарка, который позволил бы оценивать качество ИИ, рассказали
специалисты компании Hao AI Lab, созданной на основе
Калифорнийского университета в Сан-Диего (
Разработчики создали фреймворк GamingAgent, с которым «заставили» модели воспроизводить и симулировать игровой опыт. Перед этим тестируемые модели получили информацию об игре и правилах с помощью скриншотов. Специалисты заметили, что игра «Марио» заставила каждую модель учиться, принимать решения на скорость и создавать игровую стратегию.
Лучше всего в тестах показала
себя Claude 3.7 от Anthropic, немного уступили ей Gemini 1.5 Pro от
Сооснователь OpenAI и известный
ученый Андрей Карпатый прокомментировал в
В конце февраля инженеры OpenAI
Комментарии