388x60 Ads

Ссылочный спам – точка зрения Google

Существуют разные виды спама. Основные – почтовый и веб-спам. В этой статье я вам расскажу, как Google определяет ссылочный спам (разновидность веб-спама).

Дальше по тексту я буду приводить цитаты из первоисточников – патентов Google и одного патента Yahoo. Перевод конечно не дословный и местами упрощенный, но это специально сделано, поскольку патенты содержат много математических выкладок.

Спамеры добавляют на страницу много входящих ссылок, основываясь на наблюдении, что страницы, на которые более часто ссылаются другие сайты, обычно считаются поисковыми системами более предпочтительными. Это затрудняет провести грань между реальными страницами высокого качества, на которые ссылается много других качественных и ценных страниц, и спам-страницами со многими входящими бэклинками. [1]

Полезная тематическая статья: 



Результаты поиска, которые определены как спам, исключаются из выдачи, предоставляемой пользователю.[2]

Ссылочный спам и его пороговое значение

При определении PageRank и TrustRank используется константа перемещения (teleportation constant) (С), как правило, определяемая в диапазоне 0,7-0,9. Для определения максимально безопасного коэффициента прироста биклинков (V) предлагаю использовать такую формулу:

V = 1/C

Получаем диапазон от 1,11 до 1,43 или от 11 до 43 процентов. Возможно это совпадение, но полученное расчётным путём значение 43 процента почти соответствует пороговому значению, о котором речь идёт в патенте Google.

Читаем дальше, что написано в патенте. Спам-фильтр анализирует каждую из страниц, чтобы определить, является ли страница спам-страницей. Спам-фильтр может быть динамическим (например, алгоритмическое определение спама на основе анализа контента) или статическим (например, сравнение страницы со списком известных спам-страниц). Если значительная часть (например, более чем на 40%) из страниц [бэклинков – авт.] определяется спам-фильтром как спам, то может быть принято одно из двух действий. Во-первых, страница не используется для дальнейшего прямой обработки. Во-вторых, если конкретные документы считаются спамом, они удаляются вовремя пост-обработки из результатов поиска.

Это первый этап автономного режима обработки для обнаружения и устранения поискового спама. Второй этап обнаружения спама - во время прямой обработки запросов.

Спам-результаты могут быть охарактеризованы (без ограничения) как коммерчески установленные взаимосвязи, которые не отражают фактических интересов пользователя; результаты могут быть охарактеризованы (опять же, без ограничения) как существенно отличающиеся по своему содержанию от результатов поиска, полученных с помощью объективных моделей поиска.

Некоторая часть результатов поиска обрабатываются спам-фильтром, чтобы определить средний балл спама для контекстных обрабатываемых результатов поиска. Например, топ-10% или топ-1000 результатов поиска могут быть обработаны спам-фильтром. Если средний балл спама превышает заранее определенный порог поставщик контента идентифицируется как контент-провайдер спама. В другом варианте процент результатов поиска, определенных как спам, сравнивается с заданным порогом (например, 40%), и если этот процент превышает пороговое значение, то поставщик контента идентифицируется как контент-провайдер спама.[2]

Таким образом, можно предположить, что Google «закрывает глаза» на манипулирование результатами поисковой выдачи, в том числе на ссылочный спам, но в пределах сорока процентов. Запомните этот показатель.


Ссылочный спам и структура ссылочного профиля

Теперь несколько слов о структуре обратных ссылок. Вот что сказано об этом в патенте Google.

Умышленное манипулирование структурой ссылок называется ссылочным спамом. Если узел определяется как ссылочный спам или потенциальный ссылочный спам, могут быть приняты различные меры противодействия, в том числе исключение из индекса [3]


По моим наблюдениям, , а если доля таких ссылок меньше 8 процентов – это спамный профиль.

Полезная тематическая статья:



Динамика прироста обратных ссылок

Теперь посмотрим, что Google пишет о динамике (скорости прироста) обратных ссылок. Так в справке Google написано:
Неестественность ссылок, неестественная динамика их изменения также могут повлиять на позиции страниц сайта в выдаче.[5]
Снова обратимся к патенту Google.

[0041] Рассмотрим пример документа созданного вчера, на который ссылается 10 обратных ссылок. Этот документ может ранжироваться поисковиком лучше, чем документ, созданный 10 лет назад, на который ссылается 100 обратных ссылок, потому что темпы роста ссылок для первого сайта сравнительно выше, чем для второго.


Пиковые темпы роста числа обратных ссылок могут быть фактором, используемым поисковой системой для роста позиций документа, он также может сигнализировать о попытке поискового спама. Соответственно, в этой ситуации, поисковик может на самом деле снизить рейтинг документа (ов), чтобы уменьшить эффект спама.

[0043] Поисковик может изменить основанную на ссылках оценку (рейтинг) документа следующим образом:
H = L / Log(F + 2),

где Н – оценка (рейтинг) документа на основе обратных ссылок, L- оценка весов бэклинков, и F - время [скорее всего в в днях - авт.] от даты создания документа.

[0073] Даты появления ссылок также могут быть использованы для обнаружения «спама». Обычно, "законопослушный" документ (страница) привлекает обратные ссылки медленно. Большой (пиковый) рост количества обратных ссылок может указывать на то, что страница является источником популярной новости, или сигнализировать о попытке поискового спама.

[0083] Поисковик может сравнить средний трафик для документа в течение последних J дней (например, где J = 30) со средним трафиком в течение месяца в котором документ получил большую часть трафика, возможно с учетом сезонных изменений или в течение последних дней К (например, когда K = 365).[4]

Таким образом поисковая система может определить периоды, когда документ является популярным. И если в каком-то периоде определен пиковый прирост обратных ссылок на сайт и это сопоставим с тем, когда документ был популярен, то это, на мой взгляд, выглядит сомнительно (указывает на обычную закупку ссылок).

Для проверки показателей органического трафика рекомендую воспользоваться .

[0095] Документ, который прыгает в рейтингах по многим запросам, может быть определен поисковой системой как актуальный [популярный – авт.], или это может сигнализировать о попытке поискового спама.

[0100] Поисковая система может контролировать диапазоны бэклинков в течение продолжительного времени для того, чтобы обнаружить неожиданные всплески в диапазонах бэклинков. Пик может указывать на то, что страница является источником популярной новости, или сигнализировать о пытке поискового спама, например, торговля или покупка ссылок. Поисковик может принять меры по предотвращению попыток спама, чтобы рейтинг такой страницы рос с определённой скоростью. Также для спамного документа может быть разрешено определённое максимальное пороговое значение роста в течение заранее определённого временного периода.[4]

Поисковая система по определённым критериям может распознать, содержит ли документ популярную новость или его рейтинг базируется на ссылочном спаме.

[0112] Резкий рост числа входящих и / или исходящих ссылок на отдельные документы могут указывать на потенциально синтетический веб-график, который является показателем попытки спама. [4]

Динамику бэклинков лучше всего, по моему мнению, .

Выводы: 

1. Обратите внимание на динамику прироста бэклинков. Резкий рост (больше 40 процентов) за короткий период времени (месяц – два) может быть индикатором ссылочного спама.

2. Если в структуре обратных ссылок доля nofollow-ссылок меньше десяти процентов, на мой взгляд, - это не естественно.

3. Использование Хрумера и автоматических систем раскрутки - смерть для сайта.

Надеюсь, эта статья была полезна для вас. Не пожалейте пару минут и поделитесь ссылкой на неё в социальных сетях. Учитывая запуск Яндексом алгоритма Минусинск, а так же присутствие хорошо обученного алгоритма Google , использовать ссылочный спам не рекомендую.





Источники:
[1] . US 7533092 B2.  United States Patent 7,533,092. Berkhin ,  et al. May 12, 2009.
[2] . United States Patent 8,452,746, Guha, May 28, 2013
[3] . US 7509344 B1 United States Patent 7,509,344 Kamvar , et al. March 24, 2009
[4] . United States Patent Application 20070094254. Kind Code A1. Cutts; Matt ; et al. April 26, 2007.
[5] для веб-мастеров.


Подпишитесь В закладки НапечататьPrint Friendly and PDF


Вячеслав Вареня
Статус: seo-специалист | Контакты


5 коммент.:

Allurex комментирует... [Ответить]

А что делать, если в источниках трафика уже месяц разный ссылочный спам? Я регулярно пишу в гугл с просьбой заблокировать нежелательный трафик с сайтов, но каждый день появляются новые источники. Как можно решить эту проблему?

Игорь комментирует... [Ответить]

Спасибо, вот только первый патент он не Гугл, а Яху ;)

Вячеслав Вареня комментирует... [Ответить]

@Игорь

Да, но часть текста из патента Яху в этой статье совсем не значительная.

Станислав комментирует... [Ответить]

Спасибо за статью.
Вопрос может не по теме. Хрумер получается не работает, как и сами доры?

Вячеслав Вареня комментирует... [Ответить]

@Станислав

Ну это как посмотреть. Конечно временный эффект он даст, но если Google это заметит, то под меры или под Пингвин и надолго.

Отправить комментарий