Новый сигнал ранжирования Google RankBrain

Что означает красивое название RankBrain.

Стало известно, что в формировании поисковой выдачи Google использует систему искусственного интеллекта RankBrain, созданную на базе алгоритмов машинного обучения и ежедневно обрабатывает до 15% запросов.

google-brain-data2-ss-1920

Как и «Колибри», это самообучающийся сигнал, способный определять наиболее значимые слова в запросе. Механизмы машинного обучения, на которых работает RankBrain, помогают ему определять значения незнакомых слов исходя из контекста.

В Google RankBrain называют третьим по важности сигналом ранжирования.

Редактор Search Engine Land Дэнни Салливан (Danny Sullivan) подготовил список часто задаваемых вопросов об этом сигнале и его месте в системе ранжирования Google.

Что представляет собой RankBrain

RankBrain – это рабочее название системы искусственного интеллекта, созданной на базе алгоритмов машинного обучения. Система помогает обрабатывать результаты поиска.

Что такое машинное обучение?

Машинное обучение предполагает, что компьютер обучается выполнению определённых задач или следует детальным инструкциям автоматически без какого-либо участия человека.

Что такое искусственный интеллект?

Искусственный интеллект (AI) предполагает, что компьютер может обладать таким же разумом, как человек. По крайней мере, аналогия прослеживается с точки зрения приобретения знаний – как в процессе внешнего обучения, так и на базе приобретаемого опыта.

RankBrain – это новый способ ранжирования результатов поиска Google?

Нет. RankBrain – часть поискового алгоритма Google, компьютерная программа, которая используется для отбора наиболее релевантных конкретным запросам страниц из миллиардов других, о которых она знает.

Как называется основной поисковый алгоритм Google?

Он называется «Колибри» (Hummingbird). В течение многих лет основной алгоритм Google не имел официального названия. Однако в середине 2013 года Google полностью переработал его и назвал «Колибри».

google-hummingbird1-ss-1920-800x450.jpg

RankBrain – часть поискового алгоритма «Колибри»?

Да, «Колибри» – основной алгоритм Google, включающий в себя множество различных элементов (фильтров). Самым новым из них является RankBrain.

RankBrain входит в состав основного поискового алгоритма, поскольку он обрабатывает не все запросы, а лишь часть.

«Колибри» также включает такие фильтры, как:

  1. «Панда»;
  2. «Пингвин»;
  3. Алгоритм локального поиска Pigeon;
  4. Mobile-friendly алгоритм;
  5. Payday, разработанный для борьбы с «переспамленными запросами»;
  6. Top Heavy, удаляющий из топа выдачи ресурсы, на страницах которых рекламный контент преобладает над содержательной составляющей;
  7. Pirate – призванный бороться с нарушением авторских прав.

В отрасли принято считать, что основным алгоритмом Google является PageRank. Разве это не так?

PageRank – это часть основного алгоритма Google, которым на сегодняшний день является «Колибри». Он присваивает странице определённое численное значение, основываясь на анализе ссылающихся на неё документов.

PageRank – особенный показатель. Ведь именно такое название Google дал одному из основополагающих элементов своего первого поискового алгоритма, на основе которого строилась работа поисковой системы, запущенной в 1998 году.

Что такое «сигналы», которые Google использует в ранжировании?

Сигналы – это то, что Google использует для определения того, какую позицию присвоить веб-странице в поисковой выдаче. Все сигналы обрабатываются разными элементами внутри алгоритма «Колибри». В расчётах частично используются показатели PageRank. В частности, вес странице до сих пор присваивается на основе тех алгоритмов, на которых работает PageRank.

Вес странице до сих пор присваивается на основе PageRank.

С помощью сигналов поисковая система понимает, какие страницы показывать в ответ на различные поисковые запросы пользователей.

Сколько сигналов ранжирования использует Google?

Представители Google неоднократно заявляли о том, что поисковик использует более 200 сигналов ранжирования.

RankBrain – третий по важности сигнал?

Да. По словам представителя Google, новый сигнал – третий по важности фактор в ранжировании веб-страниц.

«RankBrain — один из сотен сигналов поискового алгоритма, который определяет, какие именно результаты должны показываться в выдаче, и как высоко они будут ранжироваться. В ближайшие месяцы сигнал будет дорабатываться и развиваться. На сегодняшний день RankBrain занимает третье место по значимости среди сигналов ранжирования Google», – поясняет представитель компании Грег Коррадо (Greg Corrado).

По личному мнению Дэнни Салливана, самым важным сигналом остаются ссылки, а вторым по значимости — «слова» (семантика), начиная от слов на странице и, заканчивая тем, как Google интерпретирует слова, содержащиеся в запросах, вводимых в поисковую строку.

Самым важным сигналом остаются ссылки, а вторым семантика.

Что именно делает RankBrain?

RankBrain используется преимущественно для интерпретации поисковых запросов. Главная цель сигнала – страницы, релевантные запросу, но на которых могут не использоваться точные вхождения ключевых слов из этого запроса.

Как RankBrain помогает определять запросы?

Ежедневно Google обрабатывает три миллиарда поисковых запросов. При этом около 15% из них поисковая система видит впервые.

Среди них могут быть сложные многословные, низкочастотные запросы, так называемые «запросы с длинным хвостом». RankBrain призван помочь алгоритмам системы грамотно интерпретировать их, чтобы найти наиболее релевантные таким запросам страницы.

RankBrain призван помочь алгоритмам грамотно интерпретировать новые слова и распределять запросы по тематикам..

RankBrain может выявлять закономерности между, вроде бы, несвязанными между собой сложными запросами и понимать, схожи ли они друг с другом. Самообучение позволяет лучше понимать будущие сложные запросы. Это предоставляет поисковой системе возможность распределять запросы по тематикам.

И что самое важное, RankBrain способен связывать эти группы поисковых запросов с результатами выдачи, которые, по версии алгоритма, являются наиболее популярными среди пользователей.

Когда был запущен RankBrain?

Постепенный запуск RankBrain стартовал в начале 2015 года и был закончен несколько месяцев назад. Сигнал работает во всех странах присутствия Google.

Какую долю запросов он затрагивает?

RankBrain обрабатывает «очень большую долю» запросов. Конкретную цифру Гугл не называл.

RankBrain постоянно обучается?

Весь процесс обучения RankBrain происходит офлайн. RankBrain получает на обработку группы исторических запросов и на их примерах учится строить прогнозы. Полученные прогнозы в обязательном порядке тестируются. В случае, если сигнал обработал запросы верно, запускается новая версия RankBrain. Затем этот цикл повторяется.

RankBrain — действительно сигнал ранжирования?

Да. Существует компонент, в котором RankBrain непосредственно влияет на ранжирование страницы.

По предположению Дэнни Салливана, RankBrain каким-то образом помогает Google лучше классифицировать страницы. Функция реализуется путём анализа контента, который содержат эти страницы. Возможно, RankBrain способен лучше, чем другие математические модели Google, понять, о чём идёт речь на странице. Однако пока это только предположения. Представители Google не предоставили официальных данных о том, как именно работает данный аспект.

Где можно получить дополнительную информацию о RankBrain?

Представители Google рекомендуют желающим получить дополнительную информацию о «векторах» – математической модели, посредством которой слова и фразы могут быть объединены в группы – ознакомиться с этой публикацией. В ней рассказывается о том, как система (в публикации не упоминается название RankBrain) изучила понятие «столицы», сканируя новостные статьи:

image00-800x593.gif

Более обширная научная статья на эту тему доступна здесь. Желающие больше узнать об алгоритмах машинного обучения могут ознакомиться со справочными публикациями, руководствами и технической документацией на этой странице.

Перевод статьи © searchengines.ru

  • https://www.facebook.com/app_scoped_user_id/316512522019808/ Андрей Кусков

    https://www.youtube.com/watch?v=BdA8iFjtgGk — сделал видеообзор на RankBrain. Думаю, будет хорошим дополнением к статье.