Основное

Google о ранжировании отрывков или фрагментов

Google о ранжировании отрывков или фрагментов

15 ноября 2020 года Google объявил об использовании ранжирования на основе отрывков (фрагментов) контента на странице.

 

Я пока точно не могу сказать используется ли ранжирование на основе пассажей в 2020 году, или только будет использоваться с 2021 года.


Я заметил, что Google подсвечивает желтым цветом определенные абзацы текста в браузере Chrome при поиске информации по определённым запросам на английском языке. Возможно это признаки тестирования технологии ранжирования контента на основе отрывков или фрагментов.


По мнению Google, эта новая технология поможет им выявить контент, который в противном случае не мог бы считаться актуальным при рассмотрении страницы только в целом.

  

Google оценивает и индексирует весь контент на веб-странице, чтобы определить, соответствует ли он поисковому запросу. Но иногда веб-страницы могут быть очень длинными или посвящены нескольким темам, что может снизить релевантность частей страницы для конкретных запросов.

"Идея состоит в том, чтобы взять особенно длинные страницы и понять соответствующие части ... Если у вас действительно длинные статьи, то, возможно, мы найдем что-то полезное в середине ... вероятно, вы уже разбили эти исключительно длинные статьи в более короткие".

 — Джон Мюллер


Судя по всему, время супер длинных статей (лонгридов) уходит. Джон даже обмолвился о том, что желательно разбить такие статьи на несколько.

Что мы знаем о ранжировании отрывков или фрагментов

В интернете очень мало достоверной информации, которая бы хоть как-то проливала свет на основы ранжирования веб-страниц на основе отрывков (фрагментов).


Недавно я прочитал интересный патент, который, как мне кажется, имеет отношение к этой технологии.

Машинное обучение для определения мнений в документах

Изобретатели: Борис Дадачев и Кишоре Папинени 

Правообладатель: Google LLC. Патент США: 10 832 001. Выдан: 10 ноября 2020 г. Подан: 26 апреля 2018 г.


В аннотации к патенту сказано, что «примеры аспектов настоящего раскрытия направлены на системы и способы, которые используют модель классификации мнений, полученную с помощью машинного обучения, для классификации частей (например, предложений, фраз, абзацев и т. п.).  Части документа можно ранжировать по важности и выбирать для включения в информационное отображение на основе их ранжирования».


Вам ничего это не напоминает? По-моему, это именно, то, как описывает Google описывает способ ранжирования веб-страниц на основе отрывков или фрагментов.


Отрывки (passages) в этой технологии — это фрагменты текста на странице, а именно отдельные предложения, фразы, абзацы. 


Вопрос в том, как Google будет сравнивать и выбирать самый важный фрагмент среди других фрагментов, размещенных на веб-страницах разных сайтов.


Нам ничего не остается, как обратиться снова к тексту этого патента.


Используемая технология предусматривает использование кластеризации веб-страницы в один из множества кластеров веб-страниц, основанный, по меньшей мере, частично на сравнении частей документа, которые были классифицированы как мнение, с дополнительными частями других веб-страниц, которые были классифицированы как мнения.


Я выскажу такое предположение.


Ранжирование на основании отрывков (Google passage ranking) – это технология, использующая машинное обучение, в основе которой лежит определение релевантного фрагмента текста и определение его важности. Затем интернет-страница включается в кластер похожих страниц и среди страниц кластера определяется рейтинг самого важно фрагмента.


Дополнительно читайте:

Как Google классифицирует YMYL сайты


Можно ли как-то оптимизировать под это свой сайт?


Честно говоря, я пока не знаю, так как технология эта новая и информации об этом почти нет.


Если статья вам понравилась, не забудьте поделиться ей и подписаться на телеграм канал SEO Inside.




Вячеслав Вареня
Вячеслав Вареня
Статус: seo-специалист | Контакты |


0 коммент.:

Отправка комментария