Дубльований контент

104

Дубльований контент-позначає неунікальний, вже існуючий контент. ПС не хочуть індексувати дубльований контент. Одна справа коли дубльований контент-це новини представлені на різних сайтах, то швидше всього сторінок з потраплять в пошуковий індекс. Але якщо знаходиться продубльована інформація на певній кількості сторінок одного і того ж сайту, то в індексі з великою ймовірністю опиниться лише мала частина сторінок від цієї кількості.

Сайти з дубльованим контентом найчастіше розташовуються в додаткових результатах видачі, потрапляючи під фільтр неунікального контенту. Для того щоб перевірити чи існують на вашому сайті дублі, можна подивитися, знаходяться в додаткових результати сторінки вашого сайту.

Наприклад, у Google це можна зробити за запитом:

site:allproall.com

В кінці сторінки з видачею за даним запитом, буде посилання «повторити пошук, включивши опущені результати». Якщо посилання буде, то на сайті знайдений дубльований контент, а це значить, що треба проаналізувати де саме він знаходиться і видалити його.

Види дубльованого контенту

З появою алгоритму Panda, величезну кількість сайтів відчули даний фільтр на собі. Завдання цього алгоритму стало боротися з сайтами, у яких багато дубльованого або неякісного контенту. З початку постраждали відверті ГС, на яких взагалі не було унікального посту. Потім Panda добралася і до сайтів, які зовсім небагато бавляться дублюванням контенту. Більше того, якщо раніше на внутрішні дублі ніхто особливої уваги не звертав, то тепер і вони теж стали великою загрозою.

Повні дублікати

Це відбувається, коли дві і більше сторінки одного сайту абсолютно ідентичні, але мають різні адреси.

Часткові дублікати

Коли сторінки одного сайту дуже схожі, але не зовсім ідентичні один одному.

Зовнішні дублікати

Це дублікати на різних доменах. Можуть бути частковими, так і повними.

Як не допустити дубльований контент

На сторінках постів, статичних сторінках, завжди використовуйте мета-тег

rel=’canonical’

Якщо ви розміщуєте статтю на зовнішніх ресурсах змініть хоча б деякі абзаци вашого тексту
Посторінкову навігацію, навігацію по коментарям, Архіви, Теги, пошук по сайту найкраще закрити від індексації robots.txt. Що знову повертає нас до мого минулого посту про robots.txt.
Можна ось з такого прикладу:

Disallow: */comments*
Disallow: /search
Disallow: /?s=*
Disallow: /author/*
Disallow: /tag/*
Disallow: /trackback
Disallow: /20*/*
Disallow: /page/*
Disallow: /comment-page*
Disallow: /*?replytocom*

Потрібно так само позбутися дублювання контенту в рубриках, або закрити її від індексації.

Я намагався пояснити вам, що таке дубльований контент і як від нього можна позбутися. Якщо я щось упустив чи ви знаєте ще що те, або інше способи, як позбутися від дубльованого контенту на сайті, то прошу згадати це в коментарях до цього посту.

[adsense]