Зміст

Дубльований контент

SEO
date_s 30 Вересня 2021
eye_s 295
time_s 7-8 хв.
Олексій Дмитренко
Автор статті:
Олексій Дмитренко
SEO-спеціаліст

Що таке дубльований контент?

Дубльований контент – це контент, який є схожою або точною копією контенту на інших сайтах або на різних сторінках одного сайту. Наявність великої кількості дубьованого контенту на сайті може негативно вплинути на рейтинг Google.

Дубльований контент – це контент, який слово у слово повторює контент, розміщений на іншій сторінці.

Як дублюючий контент впливає на SEO?

Загалом Google не хоче ранжувати сторінки з дубльованим контентом.

Фактично, Google заявляє, що :

“Google щосили намагається індексувати і показувати сторінки з окремою інформацією”.

Тому якщо на вашому сайті є сторінки БЕЗ окремої інформації, це може пошкодити рейтинг вашої пошукової системи.

Зокрема, три основні проблеми, з якими стикаються сайти з великою кількістю дубльованого контенту.

Менше органічного трафіку: Це досить просто. Google не хоче ранжувати сторінки, на яких використовується контент, скопійований з інших сторінок в індексі Google.

Включаючи сторінки на вашому власному веб-сайті.

Припустимо, на вашому сайті є три сторінки зі схожим змістом.

Google не впевнений, яка сторінка є “оригінальною”. Таким чином, усім трьом сторінкам буде складно ранжуватися.

Санкції (вкрай рідко): Google заявив, що дубльований контент може призвести до санкцій або повної песимізації сайту (тут потрібно пояснити).

Однак це дуже рідко. І це робиться тільки в тих випадках, коли сайт навмисно очищає або копіює вміст інших сайтів.

Так що, якщо у вас є купа сторінок, що дублюються на вашому сайті, вам, ймовірно, не потрібно турбуватися про «санкції за дублювання контенту».

Менше проіндексованих сторінок: це особливо важливо для веб-сайтів із великою кількістю сторінок (наприклад, сайтів електронної комерції).

Іноді Google не просто знижує рейтинг дубльованого контенту. Фактично він відмовляється його індексувати.

Тому якщо на вашому сайті є сторінки, які не індексуються, це може бути пов’язане з тим, що ваш краулінговий бюджет витрачається на дубльований контент.

Найкращі практики

Слідкуйте за одним і тим же контентом з різних URL-адрес

Це найчастіша причина виникнення проблем із дубльованим контентом.

Допустимо, що у вас є інтернет-магазин.

І у вас є сторінка продукту, де продаються футболки.

Якщо все налаштовано правильно, всі розміри і кольори футболки, як і раніше, будуть мати ту саму URL-адресу.

Але іноді ви виявляєте, що ваш сайт створює нову URL-адресу для кожної версії вашого продукту, що призводить до тисяч сторінок із дубльованим контентом.

Інший приклад:

Якщо на вашому сайті є функція пошуку, ці сторінки результатів пошуку також можуть бути проіндексовані. Знову ж таки, це може легко додати 1000 сторінок на ваш сайт. Усі вони містять контент, що повторюється.

Перевірити проіндексовані сторінки

Один із найпростіших способів знайти повторюваний контент – це подивитись кількість сторінок вашого сайту, проіндексованих у Google.

Ви можете зробити це, виконавши пошук у Google на запит:

site:example.com

Або перевірте свої проіндексовані сторінки у Google Search Console.

У будь-якому випадку це число має збігатися з кількістю сторінок, які ви створили вручну.

Упевніться, що ваш сайт правильно перенаправляється

Іноді у вас не просто кілька версій однієї сторінки, а й одного і того ж сайту.

Хоч це і рідкість, але з таким часто можна зіткнутися на просторах Інтернету.

Ця проблема виникає, коли “WWW” версія вашого сайту не перенаправляє на “не-WWW” версію.

Чи наоборот.

Це також може статися, якщо ви переключили свій сайт на HTTPS і не перенаправили HTTP-сайт.

Коротше кажучи:

Усі різні версії вашого сайту повинні знаходитися в тому самому місці.

Використовуйте 301 редирект

301 редирект – це найпростіший спосіб виправити проблеми з дублюючим контентом на вашому сайті.

(Окрім повного видалення сторінок)

Тому, якщо ви виявили на своєму сайті купу сторінок із дубльованим контентом, перенаправте їх назад на оригінал.

Коли Googlebot зайде на сторінку, він обробить перенаправлення та проіндексує лише оригінальний контент.

Що може допомогти оригінальній сторінці розпочати ранжування.

Слідкуйте за схожим контентом

Дубльований контент не означає лише контент, скопійований словом у слово з іншого місця.

Насправді Google визначає дубльований контент як:

Тому навіть якщо ваш контент технічно відрізняється від того, що є, ви все одно можете зіткнутися з проблемою дубльованого контенту.

Для більшості веб-сайтів це не проблема. Більшість сайтів мають кілька десятків сторінок. Вони пишуть унікальний матеріал для кожної сторінки.

Але є випадки, коли схожий дубльований контент може з’явитися.

Чи важко писати 100% унікальний контент для кожної сторінки вашого сайту? Так, важко. Але якщо ви серйозно ставитеся до ранжування кожної сторінки сайту, це обов’язково.

Використовуйте канонічний тег

Rel=canonical тег повідомляє пошукові системи:

«Так, у нас є купа сторінок із змістом, що повторюється. Але ця сторінка – оригінал. Решту можна ігнорувати».

Google повідомив, що канонічний тег краще, ніж блокування сторінок із дубльованим контентом.

Наприклад, блокування робота Google за допомогою файлу robots.txt або тега noindex у HTML-коді вашої веб-сторінки.

Тому, якщо ви знайдете на своєму сайті кілька сторінок із дубльованим контентом, вам потрібно:
  • Видалити їх
  • Перенаправити їх
  • Використовувати канонічний тег

Використовуйте спеціальні інструменти

Існує кілька інструментів SEO, які мають функції, призначені для виявлення дубльованого контенту.

Наприклад, Siteliner сканує ваш веб-сайт на наявність сторінок, що містять багато повторюваного контенту.

Об’єднуйте сторінки

Якщо у вас багато сторінок з дубльованим контентом, ви, можливо, захочете перенаправити їх на одну сторінку.

Або використовуйте канонічний тег.

Але що, якщо у вас є сторінки зі схожим змістом?

Що ж, можна створити унікальний контент для кожної сторінки або об’єднати їх в одну мегасторінку.

Наприклад, припустимо, що у вас є 3 статті в блозі на вашому сайті, які технічно різняться, але зміст майже такий же.

Ви можете поєднати ці 3 статті в одну супер корисну статтю в блозі, яка буде на 100% унікальною.

Оскільки ви видалили зі свого сайту контент, що дублюється, ця сторінка повинна мати більш високий рейтинг, ніж інші 3 сторінки разом узяті.

Сторінки тегів чи категорій Noindex WordPress

Якщо ви використовуєте WordPress, ви могли помітити, що він автоматично генерує сторінки тегів та категорій.

Це потенційно велике джерело дубльованого контенту.

Щоб вони були корисні користувачам, найкращим рішенням буде додати тег «noindex» на ці сторінки. Таким чином вони можуть існувати без індексації пошуковими системами.

Ви також можете налаштувати такі речі в WordPress, щоб сторінки взагалі не генерувалися.

Висновок:

Слідкуйте за індексом пошукової системи. Ви навіть можете не підозрювати, що причиною “застою” можуть бути банально новостворені сторінки, на які Google витрачає свій час. І не важливо ви власник бізнесу чи SEO фахівець. Головне пам’ятати, що все просування залежить від того, як ваш сайт бачить Google. Відповідно перевірка індексу та вчасно прийняті рішення обов’язково приведуть вас до шикарного результату.