Аналитики "Яндекса" выяснили, что больше всего запоминается
зрителям в кино. Для этого специалисты изучили запросы-описания
сюжетов, по которым пользователи пытались найти в интеренете
название того или иного фильма,
"Оказалось, например, что в воспоминаниях о российском кино особенно часто фигурируют "подруги" и "менты". В описаниях турецких фильмов - невесты и богатые парни, для запросов про индийское кино характерно упоминание братьев и крокодилов", - говорится в исследовании.
При описании советских фильмов особенно много "пьют" и "поют", в запросах про российское кино - "сажают в тюрьму" и "попадают в прошлое". Также в российских фильмах что-то часто происходит "в деревне" и "в Новый год", в американских - "на вечеринке" и "в Рождество". Герои комедий обычно "отдыхают", "меняются" местами, телами или супругами и в кого-нибудь "переодеваются". Для фильмов ужасов характерны сцены "в доме", "в лесу" и "в подвале", для боевиков - "в здании", "в пустыне" и "в джунглях".
Что касается персонажей, то "мужья и жены" возглавили топы сразу двух жанров - мелодрамы и триллера. Аналитики также определили, чем именно запоминаются персонажи
Компания также привела несколько запросов пользователей: "кино где мужик женился на первой встречной ради ноутбука", "фильм в котором лысый сбегают с другим лысым из тюрьмы и спасают другого лысого", "фильм, где животные едят сельдерей", "американский фильм, где мужчины переоделись в девушек и пили чай", "фильм, в котором был грунт".
Как "Яндекс" распознает запрос
Запросы про забытые фильмы в основном уникальны: люди обращают внимание на разные вещи и даже одну и ту же памятную сцену описывают по-разному. В отличие от обработки типовых запросов, про которые поиск по опыту, то есть по статистике переходов на сайты из выдачи, знает, что хочет найти человек, показать нужные ссылки в ответ на что-нибудь вроде [фильм где в космосе говорящий барсук и дерево] - это очень нетривиальная задача. Но и очень важная: редкие и необычные запросы задают не только про кино, они вообще составляют огромную часть от всего потока.
Чтобы отвечать на них, "Яндекс" использует традиционные поисковые алгоритмы в сочетании с нейросетевыми технологиями. Например, с помощью нейросети оценивается смысловая близость уникального запроса к каждому из множества частотных, для которых известен хороший ответ. Так, запрос про говорящего барсука и дерево похож на [фильм в котором говорящий енот и дерево], который в свою очередь похож на [фильм где енот дерево и звездный лорд], на который, наконец, поиск может уверенно ответить ссылкой на страницы фильма "Стражи галактики", потому что видит, что в их текстах важное место занимают словосочетания из запроса. Чтобы нейросеть лучше справлялась с уникальными запросами, ее обучают на редких запросах из истории поиска - посвященных другим темам, но не менее неповторимых.
Комментарии