Как хорошо, что есть такая девушка Энн Смарти. У нее реально талант находить полезные сервисы для вебмастеров и оптимизаторов.
В этот раз она взялась за дублированный контент и сервисы, которые помогают отыскать его на сайте. Думаю, многим из вас будет интересно.
Так вот, дублированный контент.
Почему тема дублированного контента сегодня так актуальна? Если не считать очевидных (копипаст одних и тех же статей на разные страницы), основных причин две:
- использование движков, которые создают кучу урлов на одну и ту же страницу;
- нехватка знаний в области seo. Так, например, урлы www.yoursite.com/page1 и www.yoursite.com/Page1 поисковики видят как две разные страницы, хотя их наполнение совершенно идентично с тем лишь отличием, что во втором урле слово page написано с большой буквы. Но это знают не все.
Предпосылки для появления дублированного контента:
- наличие двух версий сайта: с www и без него;
- присутствие на сайте страниц с одинаковыми тайтлами и мета-описаниями;
- существование нескольких версий главной страницы (www.site.com и www.site.com/index.php);
- неполадки в навигации сайта, приводящие к появлению нескольких урлов на одни и те же страницы (www.site.com/page.php?id=567 и www.site.com/category/page.php?id=567).
Естественно, дублированный контент вам нужен, как телеге пятое колесо. И дело здесь не только в том, что поисковый бот может подхватить и вынести в выдачу не совсем ту страницу, какую бы вы хотели там видеть (хотя это тоже очень важный момент). В дополнение к этому дублированный контент снижает скорость сканирования страниц гуглботами (даже боты не хотят выполнять лишнюю работу и сканировать дубли) и замедляет процесс попадания в индекс молодых сайтов.
НО! НЕ ВСЕ ТАК ПЛОХО! Купите платную подписку на мои сайты HowtoKillYourSitein10Seconds.com и SurefireWaytoDestroyYourRankingsImmediately.com я расскажу, как все исправить 🙂
Ладно, шутки в сторону. Думаю, увидев имя Энн Смарти в начале поста, вы уже поняли, что без полезных инстурментов тут не обойдется. Так и есть.
1. Duplicate Content Tool. Сервис выявляет следующие моменты:
- наличие/отсутствие редиректа с www.site.com на site.com;
- проблемы с кешированием страниц;
- наличие одинаковых страниц в выдаче;
- выдача 404-й ошибки на несуществующие страницы;
- разбазаривание PR между ‘www-‘ и ‘без-www-‘ вариантами сайта.
2. Xenu (десктопное приложение). Программка сканирует сайт и выдает информацию по всем урлам, которые там находит. Вам достаточно отсортировать результат по тайтлу (колонка Title), найти одинаковые заголовки и исправить их. (В программе что-то не так с кодировкой, русские заголовки идут иероглифами. Впрочем, удивляться не приходится (с).)
3. Google Webmaster Tools. Сервис помогает найти идентичные татйлы и мета-описания.
Какие еще знаете инструменты, полезные для этих целей?
п.с. Кстати, найти дубли — это только полдела, их еще нужно и устранить. И в этом вам поможет вот эта статейка.
Записи по теме:
- Быстрое индексирование крупных сайтов
- Изучение обратных ссылок конкурентов
- Прицельный огонь по ключевым фразам
- Продвинутые способы использования оператора link: в Yahoo
ну вообще некоторые пункты, перечисленные в статье, лидирующие поисковики уже давно разбирают и не считают дублированным контентом, но лишняя осторожность конечно не помешает, темболее, что ещё не все поисковики “умные”
Кто может подсказать, как сделать редиректы на существующем сайте:
http://www.name.com -> name.com
index.php -> /
учитывая, что в .htaccess много работающих правил RewriteRule по ЧПУ.
?
На вордпрессе у меня автоматически редиректит с www на без ввв. Интересно, почему у тебя Богдан с www.
🙂 А, у тебя наоборот, с без ввв на www . Тогда зачем ссылка в лого без ввв? 🙂
первый шаг в бизнесе, так оно ведь без разницы 🙂
Я этот редирект делал еще когда толком и не знал, что такое редирект. В каком-то буржуйском блоге подсмотрел такую фишку, прочитал, что это для блога будет гуд, и поставил.
Чо то Duplicate Content Tool некорректно 301 редирект определяет. Вернее вообще не определяет.
а вот тут нормуль.
з.ы.(я не про сайт из своего профиля)
Отличный пост, как раз затронул мою больную тему. Спасибо)
О, Богдан!). А шажок дело говорит. Разберись с редиректом
Тем более у тебя в роботс хост: profithunter.ru
Руслан Ахметов, не пойму, а какая разница с www на без-www или с без-www на www?
Подскажите, как это настроить?
Default Page Check: FAILED
You have not standardized your default pages meaning the following versions of your url return a 200/OK Header, which may cause duplicate content issues. The following extensions work:
Полезные фичи, не спорю. Но как бы базовые моменты вроде 301 редиректа и т.п. у вебмастера это должно “срабатывать по умолчанию”
Так кто-нибудь может подсказать, как сделать 301 редирект:
ввв.name.com -> name.com
name.com/index.php -> name.com
ввв.name.com/index.php -> name.com
учитывая, что в .htaccess много работающих правил RewriteRule для замены ссылок. Заранее спасибо
Богдан. Разницы нет. Просто нужно придерживаться одного варианта.
Сейчас Яша знает твой сайт с www.
А в роботс ты говоришь ему – без www.
Хотя у тебя и идет 301 редирект и яша его понимает.
Такая нестыковка и кто его знает как бот яндекса поведет себя в дальнейшем, например при сбое в работе сайта.
Короче пропиши host: https://www.profithunter.ru на всякий случай
первый шаг
вот здесь почитай http://3pu.info/301-redirect/
Эдуард 10/12/08 @ 23:18
так поступают слабые люди, которые не хотят учится, работать, а хотят срубить бабла как можно быстрее.
этот вариант тоже имеет право на существование
Эдуард 10/12/08 @ 23:18
так поступают слабые люди, которые не хотят учится, работать, а хотят срубить бабла как можно быстрее.
Согласен на все 100%
Ссылочка на Duplicate Content Tool весьма полезная, сенкс