Поисковый сервис «Яндекс» выяснил, по каким ярким приметам россияне чаще всего пытаются найти в интернете позабытое название фильма. В основу исследования лег анализ 18 миллионов уникальных поисковых запросов за 2017-2019 годы, пишет «Интерфакс».
Поиски обычно начинаются с перечисления героев в общих чертах (девушка, парень или просто человек), их семейной роли или профессии, национальности. Запоминаются главные персонажи больше всего тем, что они убивали, умирали, находили что-либо, жили, или попадали куда-то, например, в мир фей или ад. Самыми популярными местами действия среди поисковых запросов оказались школа, город, тюрьма, лес и остров.
С национальным колоритом
Для фильмов разных стран определились свои самые частотные запросы. Российские фильмы отличились персонажами: это обычно подруги, «менты» или следователи, бизнесмены и няни. Герои обычно оказываются в тюрьме или попадают в прошлое, устраиваются на работу, подставляют кого-либо, теряют память. Дело происходит в деревне или на даче, на «зоне», в детдоме или в целом в антураже Нового года.
Названия советских фильмов вспоминают по совсем другим зацепкам: в поисковых запросах чаще других фигурируют животные (собака, кот, медведь), дед и солдат. Персонажи пьют, поют, строят, кричат или плывут, а действие крутится вокруг морей или рек, заводов, связано с планетами или космосом в целом.
В американских фильмах главенствуют подростки и студенты, президенты, солдаты и блондинки. Заняты они чаще похудением, переездами, охотой и расследованиями, а еще попадают в тюрьму. Сюжет разворачивается на вечеринках, в колониях, в космосе или пустыне или связан с Рождеством.
Для турецких фильмов характерными персонажами оказались невесты и богатые парни, для индийских — крокодилы и братья. В китайских фильмах, как отмечают пользователи «Яндекса», дерутся и летают.
Для отдельных персонажей тоже нашлись характерные занятия: женщины чаще всего рожают, мужчины — кого-то или что-то видят (девушек, призраков, будущее). Божество в запросах предстает руководителем, посылающим на задание ангелов, мужчин и женщин. Демоны вселяются в кого-либо, охотятся или забирают что-то, агенты предсказуемо внедряются и спасают. А вот вампиры чаще запоминаются своей влюбленностью, а не тем, что кусаются.
Ни слова больше
По некоторым запросам без труда можно узнать фильм. Так, «Большой куш» стал для россиян тем фильмом, где Томми ненавидит цыган, а в «Стражах галактики» «дерево живое и енот живой», а «еще енот милый, но грубый». «Волк с Уолл-стрит» стал для зрителей тем самым фильмом с Леонардо ДиКаприо, в котором «чувак отвечал на звонки и стал богатым». Особняком стоит сериал «Детективное агентство Дирка Джентли», где «ничего не понятно и есть корги».
Некоторые запросы искателей забытых фильмов составили отдельный хит-парад. Так, пользователи «Яндекса» пытались найти «фильм, где животные едят сельдерей», фигурирует «получеловек полу — Киану Ривз». Также зрителей интересовали фильмы, где «монстр живет на острове, любит выпить», «избитый парень рассказывает про Игорька» или «мужик едет в поезде с торшером». Еще один пользователь искал в интернете комедию, «в которой, как правило, не наблюдается никакого смысла».
Как «Яндекс» понимает, что искал пользователь
В компании отметили, что запросы про забытые фильмы в основном уникальны, так как люди обращают внимание на разные вещи и даже одну и ту же памятную сцену описывают по-разному. Для ответа на такие редкие и необычные запросы использует традиционные поисковые алгоритмы в сочетании с нейросетевыми технологиями. Например, с помощью нейросети оценивается смысловая близость уникального запроса к каждому из множества частотных, для которых известен точный ответ.
Так, запрос про «фильм где в космосе говорящий барсук и дерево» похож на «фильм в котором говорящий енот и дерево», а тот — на запрос «фильм где енот дерево и звездный лорд», а уже на него поиск может уверенно ответить ссылкой на «Стражей галактики». Чтобы нейросеть лучше справлялась с уникальными запросами, ее обучают на редких запросах из истории поиска по другим темам.
Фото на обложке: pixabay