Наш блог

Нейронная Жар-птица, или умный Палех

Каждый год Яндекс вводит новинки на рынок веб-разработок. Новый умный алгоритм поиска получил название «Палех» или, как ласково именуют его вебмастеры, «Жар-птица». Его называют началом нового подхода к ранжированию сайтов в поисковой системе Яндекс, а значит, и новых методов продвижения. Что же такое Палех? Давайте разберемся.

Жар-птица как символ будущего веб-разработок

Почему Жар-птица, спросите вы? Все предельно просто. Как известно, все запросы, которые вводятся в строке поиска, делятся на три большие категории:

  • высокочастотные;
  • среднечастотные;
  • низкочастотные.

Яндекс обрабатывает около 300 тыс. поисковых запросов за одни сутки. Большая часть из них — это запросы с низкой частотностью, чуть меньше — со средней частотностью, и лишь небольшая часть запросов относится к категории высокочастотных. Разработчики Яндекса условно разделили эти вопросы на «клюв», «тело» и «хвост» и окрестили получившееся создание Палехом.

Хвосты Палеха и составляют львиную долю низкочастотных запросов, на которые найти поисковой системе релевантный ответ очень сложно, и поэтому разработчики решились добавить алгоритму поиска немного мозгов, или включить так называемую нейросеть. Жар-птица работает для всех запросов, просто прежде всего она ориентирована решить проблему нахождения ответа на «низкочастотники».

Принцип работы

Еще несколько месяцев назад поиск проводился только по заданным в запросе ключам. Так, если мы искали «продвижение сайта в Орле недорого», мы и находили продвижение сайта в Орле недорого. Принцип работы Палеха заключается в поиске не самого запроса, а ответа на вопрос, более того, ответ может и вовсе не содержать ключевого запроса.

Искусственные нейронные сети — это один из наиболее популярных на сегодняшний день методов машинного обучения. Эта технология получила свое распространение в таких сферах, как распознавание картинок и музыки. Теперь настала очередь текста.

Принцип работы Палеха объяснить не так-то просто. Запрос переводится в специальное трехмерное пространство, где ему подбирают соответствие из трехсот чисел, а затем система выдает к запросу ответ, который максимально близко находится к нему в сложной системе координат. Пока что система обрабатывает только заголовки ресурсов, однако, в скором будущем Яндекс планирует внедрить систему полностью в тексты ресурсов.