388x60 Ads

Как Google использует слова синонимы


Почему синонимы очень важны для продвижения сайтов? Как Google использует похожие слова при обработке запросов? Синонимы  это фактор ранжирования? В этой статье вы получите ответы на эти вопросы.

Цель поисковой системы — вернуть наилучшие результаты для поиска, а понимание языка имеет решающее значение для возвращения лучших результатов. Ключевая часть этого — система для понимания синонимов. Google использует много методов для извлечения синонимов. Их системы анализируют огромное количество веб-документов и исторических данных поиска, чтобы создать сложное понимание того, что слова означают в разных контекстах.

Исследования показывают, что синонимы влияют на 70 процентов пользовательских запросов на более чем 100 языках, поддерживаемых Google.

Google взял ряд запросов и проанализировал, насколько точны синонимы, и был доволен результатами: на каждые 50 запросов, где синонимы значительно улучшали результаты поиска, Google получил только один плохой синоним[1].

Об этом в 2010 году писал инженер Google Steven Baker.


Мэтт Катс, комментируя эту статью, посоветовал веб-мастерам подумать о разных словах, которые поисковики могут использовать при поиске вашего контента. «Подумайте о сленге, который будут набирать пользователи. Не упускайте из вида термины, которые люди будут печатать, подумайте о синонимах, естественным образом соответствующие вашему контенту. Не засоряйте статью ключевыми словами, но если вы используете разные способы рассказать о предмете естественным образом, это может помочь пользователям»[2].

Так что Мэтт Катс тоже рекомендовал использовать синонимы в контенте сайта.

Что такое слова синонимы?

Определим критерии термина "синонимы".
Слова синонимы — слова, принадлежащие, как правило, к одной и той же части речи, различные по звучанию и написанию, но имеющие похожее лексическое значение.
Википедия[3]
Что происходит на практике. Часто пользователь вводит запрос на одном языке, а результаты получает на другом.

Пример — в Google-ua вводится запрос на украинском языке из четырёх слов, несозвучных и не однокоренных с похожими словами на русском языке. При этом результаты выдачи на запрос пользователь получает на русском языке.

Второй пример. Пользователь вводит запрос, а в перечне результатов видит страницы, в которых ключевое слово запроса отсутствует.

Google понимает термин "слова синонимы" более широко. Это слова одинаковые или близкие по смыслу и упоминаются в одинаковом контексте. Это необязательно слова на одном языке.

Google использует систему Knowledge base, поэтому рискну предположить, что "Корпорация добра" выкупила у Xerox Corporation патент US 8103669 B2.

Слово «синоним» относится к термину (к слову или фразе), который встречается в запросе пользователя и считается эквивалентным термину в базе знаний (knowledge base) или наоборот. Он может иметь такое же или сходное значение для термина базы знаний.
Патент US 8103669 B2[4]
«Синонимическое правило» — это тип правила расширения запроса, которое указывает пару (проблематичный термин, заменяющий термин) и необязательно содержит ограничение на контекст. Контекстное ограничение может указывать другой термин, связанный / не связанный с проблемным термином и / или заменять термин для правила расширения запроса, которое должно применяться.
Патент US 8103669 B2

Инженер Google Paul Haahr третьего марта 2016 года на конференции SMX West выступил с докладом «Как работает Google». Обратите внимание на этот слайд из доклада.
Как Google использует слова синонимы

Процесс понимания поисковой системой Google запроса состоит из трёх этапов:
- Содержит ли запрос имя или известную сущность;
- Существуют ли полезные синонимы;
- Какой контекст использования.
Как указано в Патенте US 8103669 B2 синонимы полезны в нескольких контекстах. Системы поиска информации нуждаются в создании и обслуживании правил расширения запросов на основе синонимов, поскольку терминология, используемая в доступном для поиска содержании базы знаний, часто отличается от терминологии, применяемой пользователями поисковой системы.

Системы устранения неполадок с пользовательским взаимодействием на основе пользовательского языка обеспечивают эффективные результаты только в том случае, если у пользователя есть определённый опыт терминологии, используемой в базе знаний (knowledge base), и он может выбирать правильные слова для запроса.

Синонимы должны определяться точно и выборочно чтобы быть полезными. Общий список синонимов для естественных языков в некоторых случаях отсутствует. Большинство баз знаний имеют ограниченное число правил расширения запросов, которые заменяют один или несколько синонимов для запрашиваемого термина. 

Примерный вариант реализации изобретения обеспечивает способ разработки правил расширения запросов, который может выполняться, по меньшей мере, полуавтоматически, для улучшения поиска из структурированной базы знаний (knowledge base).

Предполагается, что полуавтоматическая система [с привлечением редакторов] формирования правил расширения запроса включает в себя модуль, который автоматически извлекает пары синонимов из выражений, используемых пользователями в запросах при поиске в базе знаний. Модуль экспорта правил синонимии экспортирует правила расширения запросов на носитель данных для использования при расширении пользовательских запросов при поиске базы знаний.

Если Google использует этот Патент, подбор синонимов производится примерно в таком порядке
1. Пользователь вводит запрос;
2. Система проверяет, содержит ли он имя или сущность;
3. Система анализирует контекст использования;
4. Система производит поиск синонимов в knowledge base;
5. Система получает из knowledge base информацию и создаёт список релевантных страниц;
6. Система ранжирует (англ. ranking) каждую страницу из списка используя факторы ранжирования.

Слова синонимы - фактор ранжирования

Синонимы являются фактором ранжирования, как это ни удивительно для многих звучит. Не верите? Смотрите на слайд из доклада инженера Paul Haahr.
Синонимы — это фактор ранжирования

Paul Haahr объяснил, что синонимы — это сигнал ранжирования, зависимый от запроса. Как слова синонимы влияют на ранжирование, не совсем ясно. Можно предложить, что синонимы используются Google в модели LSA.
Латентно-семантический анализ (ЛСА) (англ. Latent semantic analysis, LSA) — это метод обработки информации на естественном языке, анализирующий взаимосвязь между коллекцией документов и терминами в них встречающимися, сопоставляющий некоторые факторы (тематики) всем документам и терминам. Впервые ЛСА был применён для автоматического индексирования текстов, выявления семантической структуры текста и получения псевдодокументов. Затем этот метод был довольно успешно использован для представления баз знаний и построения когнитивных моделей.
Википедия[5]

Обязательно прочитайте!
Обновления алгоритма Google - Fred и его друзья
Google Algorithm Update 7 февраля 2017 года

Я уже писал, основываясь на документах Google, что если RankBrain видит незнакомое ему слово или фразу, машина может сделать предположение относительно того, какие слова или фразы имеют аналогичный смысл и фильтровать результат.
Судя по всему, модуль подбора синонимов  часть алгоритма RankBrain и синонимы не являются самостоятельным сигналом ранжирования. RankBrain — это система машинного обучения, объединяющая сигналы ранжирования и понимание документов.

SEO продвижение и подбор синонимов

Нужно активно использовать семантические аналоги для продвижения сайтов, поскольку инженер Google Paul Haahr говорит о синонимах как о факторе ранжирования.
Если пары синонимов в knowledge base действительно периодически корректируются редакторами, то "человеческий фактор" может при каких-то обновлениях алгоритма опосредовано влиять на результаты выдачи. В таких случаях веб-мастерам будет всё сложнее искать причины падения трафика или позиций. Рекомендую посмотреть это видео.
Итак, где найти примеры синонимов? Первое что вам поможет — это сам Google. Поисковая система подсвечивает полужирным текстом ключевые слова из запроса и их синонимы. Примеры синонимов видны в инструменте автозамены при вводе запроса в окно поиска; в результатах выдачи; подсказках внизу результатов выдачи.

Автоматизировать процесс сбора подсказок можно при помощи программы Словодер.

Также используйте:
Викисловарь
Словарь синонимов
Словари gramota.ru
Парсинг подсветок Yandex

Ещё одним полезным инструментом является Google Correlate.
Google Correlate

Google Correlate использует информацию об активности веб-поиска для поиска запросов с похожим шаблоном в целевой серии данных.

Если ввести в этот инструмент слово "консультация" Google выдаст результаты, которые коррелируют с трудоустройством, медицинской тематикой, и в меньшей степени с юриспруденцией. Предположительно Google Correlate указывает на контекст, в котором Google хочет обрабатывать запрос.

Источники:
1. Google Official Blog. January 19, 2010. Steven Baker, Software Engineer. Helping computers understand language.
2. Matt Cutts. January 19, 2010. More info about synonyms at Google.
3. Синонимы. Статья из Википедии.
4. Патент US 8103669 B2. System and method for semi-automatic creation and maintenance of query expansion rules.
5. Латентно-семантический анализ. Статья из Википедии.



Подпишитесь В закладки НапечататьPrint Friendly and PDF


Вячеслав Вареня
Вячеслав Вареня
Статус: seo-специалист | Контакты


0 коммент.:

Отправить комментарий