Содержание

Дублированный контент

SEO
date_s 30 сентября 2021
eye_s 361
time_s 7-8 мин.
Олексій Дмитренко
Автор статьи:
Алексей Дмитренко
SEO-специалист

Что такое дублированный контент?

Дублированный контент — это контент, который является похожей или точной копией контента на других сайтах или на разных страницах одного и того же сайта. Наличие большого количества дублированного контента на сайте может негативно сказаться на рейтинге Google.

Дублированный контент — это контент, который слово в слово повторяет контент, размещенный на другой странице.

Как дублирующийся контент влияет на SEO?

В целом, Google не хочет ранжировать страницы с дублированным контентом.

Фактически, Google заявляет, что :

«Google изо всех сил старается индексировать и показывать страницы с отдельной информацией».

Поэтому если на вашем сайте есть страницы без отдельной информации, это может повредить рейтингу вашей поисковой системы.

В частности, вот три основные проблемы, с которыми сталкиваются сайты с большим количеством дублированного контента.

Меньше органического трафика: Это довольно просто. Google не хочет ранжировать страницы, на которых используется контент, скопированный с других страниц в индексе Google.

Включая страницы на вашем собственном веб-сайте.

Допустим, на вашем сайте есть три страницы с похожим содержанием.

Google не уверен, какая страница является «оригинальной». Таким образом, всем трем страницам будет сложно ранжироваться.

Санкции (крайне редко): Google заявил, что дублированный контент может привести к санкциям или полной пессимизации сайта(тут нужно объяснить).

Однако это очень редко. И это делается только в тех случаях, когда сайт намеренно очищает или копирует контент с других сайтов.

Так что, если у вас есть куча дублирующихся страниц на вашем сайте, вам, вероятно, не нужно беспокоиться о «штрафах за дублирование контента».

Меньше проиндексированных страниц: это особенно важно для веб-сайтов с большим количеством страниц (например, сайтов электронной коммерции).

Иногда Google не просто снижает рейтинг дублированного контента. Фактически он отказывается его индексировать.

Поэтому, если на вашем сайте есть страницы, которые не индексируются, это может быть связано с тем, что ваш краулинговый бюджет тратится на дублированный контент.

Лучшие практики

Следите за одним и тем же контентом по разным URL-адресам

Это наиболее частая причина появления проблем с дублированным контентом.

Предположим, что у вас есть интернет магазин.

И у вас есть страница продукта, на которой продаются футболки.

Если все настроено правильно, все размеры и цвета футболки будут по-прежнему иметь один и тот же URL-адрес.

Но иногда вы обнаруживаете, что ваш сайт создает новый URL-адрес для каждой версии вашего продукта, что приводит к тысячам страниц с дублированным контентом.

Другой пример:

Если на вашем сайте есть функция поиска, эти страницы результатов поиска тоже могут быть проиндексированы. Опять же, это может легко добавить 1000+ страниц на ваш сайт. Все они содержат повторяющийся контент.

Проверить проиндексированные страницы

Один из самых простых способов найти повторяющийся контент — это посмотреть количество страниц вашего сайта, проиндексированных в Google.

Вы можете сделать это, выполнив поиск по запросу site: example.com в Google.

site:example.com

Или проверьте свои проиндексированные страницы в Google Search Console .

В любом случае это число должно совпадать с количеством страниц, созданных вами вручную.

Убедитесь, что ваш сайт правильно перенаправляется.

Иногда у вас не просто несколько версий одной и той же страницы, но и одного и того же сайта.

Хоть это и редкость, но с таким часто можно столкнуться на просторах интернета. 

Эта проблема возникает, когда «WWW» версия вашего сайта не перенаправляет на «не-WWW» версию.

Или наоборот.

Это также может произойти, если вы переключили свой сайт на HTTPS и не перенаправили HTTP-сайт.

Короче говоря:

Все различные версии вашего сайта должны находиться в одном и том же месте.

Используйте 301 редирект

301 редирект — это самый простой способ исправить проблемы с дублирующимся контентом на вашем сайте.

Помимо полного удаления страниц.

Поэтому, если вы обнаружили на своем сайте кучу страниц с дублированным контентом, перенаправьте их обратно на оригинал.

Когда Googlebot зайдет на страницу, он обработает перенаправление и проиндексирует только оригинальный контент.

Что может помочь оригинальной странице начать ранжироваться.

Следите за похожим контентом

Дублированный контент не означает только контент, скопированный слово в слово из другого места.

На самом деле, Google определяет дублированный контент как:

Поэтому даже если ваш контент технически отличается от того, что уже есть, вы все равно можете столкнуться с проблемой дублированного контента.

Для большинства сайтов это не проблема. Большинство сайтов имеют несколько десятков страниц. И они пишут уникальный материал для каждой страницы.

Но есть случаи, когда «похожий» дублированный контент может появиться.

Тяжело ли писать 100% уникальный контент для каждой страницы вашего сайта? Да, тяжело. Но если вы серьезно относитесь к ранжированию каждой страницы своего сайта, это обязательно.

Используйте канонический тег

Rel=canonical тег сообщает поисковые системы:

«Да, у нас есть куча страниц с повторяющимся содержанием. Но конкретно эта страница — оригинал. Остальное можно игнорировать ».

Google сообщил, что канонический тег лучше, чем блокировка страниц с дублированным контентом.

(Например, блокировка робота Google с помощью файла robots.txt или тега noindex в HTML-коде вашей веб-страницы)

Поэтому, если вы обнаружите на своем сайте несколько страниц с дублированным контентом, вам нужно:
  • Удалить их
  • Перенаправить их
  • Использовать канонический тег

Используйте специальные инструменты

Есть несколько инструментов SEO, которые имеют функции, предназначенные для выявления дублированного контента.

Например, Siteliner сканирует ваш веб-сайт на наличие страниц, содержащих много повторяющегося контента.

Объединяйте страницы

Eсли у вас много страниц с дублированным контентом, вы вероятно захотите перенаправить их на одну страницу.

Или используйте канонический тег.

Но что, если у вас есть страницы с похожим содержанием?

Что ж, вы можете создать уникальный контент для каждой страницы или объединить их в одну мегастраницу.

Например, предположим, что у вас есть 3 статьи в блоге на вашем сайте, которые технически различаются, но содержание почти такое же.

Вы можете объединить эти 3 статьи в одну супер полезную статью в блоге, которая будет на 100% уникальной.

Поскольку вы удалили со своего сайта дублирующийся контент, эта страница должна иметь более высокий рейтинг, чем остальные 3 страницы вместе взятые.

Страницы тегов или категорий Noindex WordPress

Если вы используете WordPress, вы могли заметить, что он автоматически генерирует страницы тегов и категорий.

Это потенциально большой источник дублированного контента.

Чтобы они были полезны пользователям, лучшим решением будет добавить на эти страницы тег «noindex». Таким образом, они могут существовать без индексации поисковыми системами.

Вы также можете настроить такие вещи в WordPress, чтобы эти страницы вообще не генерировались.

Вывод:

Следите за индексом поисковой системы. Вы даже можете не подозревать что причиной “застоя” может быть банально вновь созданные страницы, на которые Google тратит свое время. И не важно вы владелец бизнеса или SEO специалист. Главное помнить что все продвижение зависит от того как ваш сайт видит Гугл. Соответственно проверка индекса и вовремя принятые решения, обязательно приведут вас к шикарному результату.