Удаляем replytocom из индекса навсегда. 301 редирект htaccess
Данная статья для тех, у кого на сайте WordPress установлены древовидные комментарии.
Дело в том, что древовидные комментарии генерируют дубли страниц с параметром replytocom, которые попадают в дополнительный индекс Google и делают оригинальную статью не такой уникальной по сайту. Давайте решим проблему раз и навсегда.
301 редирект в .htaccess
Решить проблему с попаданием в доп. индекс Google (еще называют "сопли") страниц вида http://site.ru/post.html?replytocom=1279 поможет вставка двух строчек кода в файл .htaccess у вас в корневой папке сайта на хостинге.
В результате получится 301 редирект страниц с параметром replytocom на оригинальную статью и вы без проблем сможете использовать на своем сайте древовидные комментарии.
Вставляем в файл .htaccess следующее:
RewriteCond %{QUERY_STRING} replytocom=
RewriteRule ^(.*)$ /$1? [R=301,L]
Если до этого файл .htaccess не правили, то предложенный код можно вставить прямо перед этим:
RewriteEngine On
RewriteBase /
RewriteRule ^index\.php$ - [L]
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule . /index.php [L]
После этого сохранили, закинули на хостинг файл и проверьте работу сайта, а так же работает ли редирект (об это ниже).
Как проверить правильность отработки редиректа
Если ранее в файле robots.txt вы создавали подобное правило Disallow: /*?*
или такое Disallow: /*?replytocom
, то сейчас можете пройти в Панель Вебмастера Яндекса http://webmaster.yandex.ru/sites/:
- зайти в свой сайт
- Индексирование сайта
- Исключенные страницы
- Документ запрещен в файле robots.txt
- находите в списке любую страницу с параметром replytocom и кликаете.
Результатом клика по такой странице будет перенаправление вас на оригинальный адрес статьи. Данный факт будет подтверждением правильной вставки кода в файл htaccess. Отныне боты поисковых систем не будут вкидывать в индекс url древовидного комментария, а существующие постепенно "выпадут".
Почему через htaccess
Многие из вас, кто уже сталкивался с проблемами индекса replytocom, скажут, что подобное "сокрытие" можно сделать через файл robots.txt или панель вебмастера Google.
Я так же наивно полагал, что подобное поможет, пока не оставил комментарий у одного блоггера в статье, после чего его ответ посеял во мне сомнение. В результате прошелся по индексу еще раз и заметил, что Google все же кушает странички, не смотря на запреты к индексу в панели и robots.txt
Решение проблемы пришло сразу, только не знал как его реализовать, т.к. не "дружу" с htaccess. Однако пользователь одного из профильных форумов подсказал код и с его разрешения я его опубликовал в данной статье.
Вот вам список профильных форумов, где пользователи охотно вам подскажут решение возникающих с сайтом проблем Есть вопрос по CMS? Список форумов с ответами по WordPress.
Это работает!
А теперь результат проделанных действий.
Яндекс через несколько недель выкинул все лишние страницы с replytocom:
Прямо перед удалением лишних страниц, Яндекс показывал 2294 страницы. На картинке видно, что осталось 358, куда входят опять же "лишние" страницы с параметрами /feed на конце, а так же оригинальные /?p=. C этим тоже разбираюсь и жду результата от поисковиков.
Результат для Yandex смотрим: Панель вебмастера ► Индексирование сайта ► Исключенные страницы ► Документ запрещен в файле robots.txt
В Google процесс идет медленнее, но подвижки есть:
За тот же срок Google "выкинул" только ~160 страниц. Главное - есть прогресс.
Результат для Google можно увидеть так: Панель вебмастера ► Состояние ► Статус индексирования.
Древовидным комментариям быть!
Из общения с одним блоггером узнал, что в школах "стараперов" рекомендуют не ставить на сайте древовидные комментарии на WordPress, как раз из-за генерации replytocom. Теперь вы можете смело заявить своему коучу: "Древовидным комментариям быть!"