Документы Google утекли в сеть, и оптимизаторы сделали несколько диких предположений

Вы, наверное, слышали о последней утечке Google Docs. Это есть на каждом крупном веб-сайте и во всех социальных сетях.

Откуда взялись документы?

Насколько я понимаю, бот под названием yoshi-code-bot слил документы, относящиеся к Content API Warehouse, на Github 13 марта 2024 года. Возможно, они появились раньше в некоторых других репозиториях, но этот был обнаружен первым.

Они были обнаружены Эрфан Азими кто поделился этим с Рэнд Фишкин кто поделился этим с Майк Кинг. Документы были изъяты 7 мая.

Я благодарен всем, кто поделился своими выводами с сообществом.

ответ Google

Были некоторые споры о том, были ли эти документы подлинными или нет, но в них упоминается множество внутренних систем и есть ссылки на внутреннюю документацию, и она определенно выглядит подлинной.

Представитель Google опубликовал следующее заявление. Страна поисковой системы:

Мы предостерегаем от неверных предположений о Поиске на основе вырванной из контекста, устаревшей или неполной информации. Мы поделились обширной информацией о том, как работает Поиск и какие факторы учитываются в наших системах, одновременно работая над защитой целостности наших результатов от манипуляций.

SEO-специалисты интерпретируют вещи, основываясь на своем собственном опыте и предвзятости.

Многие оптимизаторы говорят, что факторы ранжирования утекли. Я не видел ни кода, ни веса, только описания и информацию о хранении. Если в одном из описаний не сказано, что элемент используется для ранжирования, я думаю, что для SEO-специалистов опасно предполагать, что все они используются для ранжирования.

Сохранение некоторых функций или информации не означает, что они используются в рейтинге. Для нашей поисковой системы Да.com, у нас хранятся самые разные данные, которые можно использовать для сканирования, индексирования, ранжирования, персонализации, тестирования или обратной связи. Мы храним много вещей, которыми еще не пользовались, но, возможно, воспользуемся в будущем.

Более вероятно, что оптимизаторы делают предположения, которые поддерживают их собственные мнения и предубеждения.

Для меня это то же самое. Возможно, у меня нет полного контекста или знаний, и у меня могут быть присущие предубеждения, влияющие на мою интерпретацию, но я стараюсь быть настолько справедливым, насколько могу. Если я ошибаюсь, значит, узнаю что-то новое, и это хорошо! SEO-специалисты могут и интерпретируют вещи по-разному.

ЧИТАТЬ   Nanoleaf выпускает праздничные гирлянды с поддержкой материи | Цифровые тенденции

Гаэль Бретон хорошо сказал:

Я существую достаточно долго, чтобы видеть множество мифов о SEO, созданных за эти годы, и могу указать вам, кто основал многие из них и в чем они ошибались. Вероятно, из-за этой утечки мы увидим множество новых мифов, с которыми придется разобраться в течение следующего десятилетия или даже больше.

Давайте посмотрим на несколько вещей, которые, по моему мнению, истолковываются неверно или в которых делаются выводы там, где их не должно быть.

Авторитет сайта

Как бы я ни хотел сказать, что у Google есть показатель авторитетности сайта, который они используют для ранжирования, аналогичный DR, эта часть конкретно касается сжатых показателей качества и разговоров о качестве.

Я считаю, что DR — это скорее эффект, который возникает, когда у вас много страниц с высоким PageRank, а не то, что Google обязательно его использует. Многие страницы с более высоким PageRank, имеющие внутренние ссылки друг на друга, означают, что у вас больше шансов создать более сильные страницы.

  • Считаю ли я, что PageRank может быть частью того, что Google называет качеством? Да.
  • Я думаю, это все? Никто.
  • Может ли Site Authority быть чем-то похожим на DR? Может быть. Это вписывается в общую картину.
  • Могу ли я доказать это или даже то, что оно используется в таблицах лидеров? Нет, не от этого.

Из некоторых показаний Google Министерству юстиции США мы узнали, что качество часто измеряется показателем удовлетворенности информацией (IS), полученным от оценщиков. Это не используется непосредственно в рейтингах, но используется для обратной связи, тестирования и тонкой настройки моделей.

Мы знаем, что у оценщиков качества есть концепция EEAT, но, опять же, это не совсем то, что использует Google. Они используют сигналы, соответствующие EEAT.

ЧИТАТЬ   Как продуманная архитектура сайта помогает продвижению в поиске Яндекса и Google

Некоторые из сигналов EEAT, упомянутых Google:

  • Боковой ранг
  • Отзывы на авторитетных сайтах
  • Запросы на сайт. Это может быть «сайт: EEAT» или поисковый запрос типа «ahrefs EEAT».

Так может ли некая форма оценки PageRank, экстраполированная на уровень домена и называемая авторитетом сайта, использоваться Google и быть частью того, что составляет сигналы качества? Я бы сказал, что это правдоподобно, но эта утечка этого не доказывает.

Я помню 3 патента Google, которые я видел, о качественных результатах. Один из них соответствует приведенным выше сигналам для запросов на веб-сайте.

Я должен отметить, что то, что что-то запатентовано, не означает, что оно используется. Патент о запросах на сайт частично написал Навнит Панда. Сможете ли вы угадать, в честь кого назван алгоритм Panda, связанный с качеством? Я бы сказал, что есть хорошие шансы, что он будет использован.

Остальные были посвящены потреблению н-граммов и, похоже, предназначались для расчета показателя качества нового веб-сайта и еще одного упомянутого времени на сайте.

Песочница

Я тоже думаю, что это неправильно истолковали. В документе есть поле под названием hostAge, в котором говорится об «песочнице», но в нем конкретно говорится, что оно используется «для изолирования свежего спама во время его обслуживания».

На мой взгляд, это не подтверждает существование «песочницы» в том виде, в каком ее видят оптимизаторы поисковой оптимизации, где новые сайты не могут ранжироваться. Мне кажется это мера защиты от спама.

щелкнуть

Используются ли клики в местах размещения? Ну и да, и нет.

Мы знаем, что Google использует клики для таких вещей, как персонализация, своевременные события, тестирование, обратная связь и т. д. Мы знаем, что у них есть модели за моделями, обученные на данных о кликах, включая navBoost. Но имеет ли он прямой доступ к данным о кликах и используется ли они в местах размещения? Ничего из того, что я видел, не подтверждает это.

Проблема в том, что оптимизаторы интерпретируют это как CTR как фактор ранжирования. Navboost предназначен для прогнозирования, на какие страницы и функции будут нажиматься. Как мы узнали из исследования Министерства юстиции, он также используется для сокращения количества возвращаемых результатов.

Насколько мне известно, нет подтверждения того, что он учитывает данные о кликах на отдельных страницах для изменения порядка результатов или что увеличение количества людей, нажимающих на ваши отдельные результаты, повысит ваш рейтинг.

ЧИТАТЬ   Шесть крупных обновлений ChatGPT OpenAI представлены в весеннем обновлении — и почему мы не можем перестать о них говорить

Доказать, что это так, должно быть достаточно легко. Это было опробовано много раз. Я попробовал это много лет назад, используя сеть Tor. Мой друг Расс Джонс (пух ему пухом) пытался использовать жилищные полномочия.

Я никогда не видел успешной версии этого, и люди годами покупают и обменивают клики на разных сайтах. Я не пытаюсь вас отговорить или что-то в этом роде. Проверьте это сами и, если оно сработает, опубликуйте исследование.

Тест Рэнда Фишкина по поиску и нажатию на результат на конференциях много лет назад показал, что Google использует данные о кликах для определения тенденций событий, и они повышают результат, на который нажали. После анализов результаты пришли в норму. Это не то же самое, что использовать их для обычных мест размещения.

Авторы

Мы знаем, что Google сопоставляет авторов с объектами в графе знаний и что они используют их в Новостях Google.

Кажется, в этих документах содержится приличное количество информации об авторе, но ничто в них не подтверждает, что они используются в рейтингах, как предполагают некоторые SEO-специалисты.

Google обманул нас?

С чем я совершенно не согласен, так это с тем, что SEO злятся на Google Search Advocates и называют их лжецами. Это хорошие люди, которые просто делают свою работу.

Если они сказали нам что-то не так, возможно, это потому, что они не знают, их дезинформировали или им сказали скрыть что-то, чтобы предотвратить злоупотребления. Они не заслуживают той ненависти, которую им сейчас оказывает SEO-сообщество. Нам повезло, что они вообще делятся с нами информацией.

Если вы считаете, что что-то, что они сказали, неверно, пройдите тест, чтобы доказать это. Или, если вы хотите, чтобы я провел тест, дайте мне знать. Простое упоминание в документации не является доказательством того, что элемент используется в рейтингах.

Последние мысли

Хотя я могу соглашаться или не соглашаться с интерпретациями других SEO-специалистов, я уважаю любого, кто готов поделиться своим анализом. Нелегко выставлять себя или свои мысли на всеобщее обозрение.

Я также повторю, что если в этих полях прямо не указано, что они используются в рейтингах, эту информацию можно легко использовать для чего-то другого. Нам, конечно, не нужны никакие сообщения о 14 000 факторах ранжирования Google.

Если вам интересно мое мнение по конкретному поводу, отправьте мне сообщение. Икс или LinkedIn.



Source