Коварный replytocom: что это такое и как его убрать

Сегодня очень полезный пост. А полезный он потому, что лично я раньше не видел ни одного поста на эту тему, которая очень важна для каждого сайта на WordPress. Речь пойдет о генерации страниц этим движком в больших количествах, если вы используете древовидные комментарии. И эта генерация приводит к созданию дублей страниц в глазах ПС, а значит может привести к пессимизации вашего ресурса или вовсе к АГС.


Кстати, именно по этой причине под новый год мой блог побывал под АГС-40. Оказалось, что из-за множества комментариев, что оставляют мне мои читатели и ответов на них у меня образовалась целая туча ненужных страниц. И эта туча привела к плачевным результатам. Поэтому это очень важная тема для любого блоггера, который использует стандартные комментарии.

Наличие подобных страниц вы можете проверить двумя способами:

  1. С помощью гуглопоиска;
  2. С помощью панельки Я.Вебмастер.

Начнем с метода номер раз. Идем в поиск гугла и набираем там следующее: site:whiteprofit.ru replytocom. Только не забудьте поменять адрес сайта на свой. Далее нажимаем «Показать скрытые результаты» и начинаем медитировать.

И таким образом получается, что у меня более 1000 таких страниц в дополнительном индексе гугла. Это уже точно не есть хорошо для моего блога.

Теперь посмотрим, что там творится в панельке от Яндекса. Заходим в Я.ВМ — Иаш сайт — Индексирование сайта — Исключенные страницы — Документ запрещенный в robots.txt и видим примерно следующее.

Вот так вот и выясняется, что даже в яндексе уже наплодилось очень много страниц. И все они негативно влияют на индексацию, а также могут привести к наложению санкций, фильтров, АГС или привести к бану.

Как избавиться от replytocom

Нам поможет 301 редирект в .htaccess. Нам нужно настроить его так, чтобы шел редирект со страницы реплиткома на страницу соответствующей статьи. Делается это очень просто. Нужно вставить этот код в начало вашего файла .htaccess.

RewriteCond %{QUERY_STRING} replytocom=
RewriteRule ^(.*)$ /$1? [R=301,L]

Проверить правильность работы ваших манипуляций тоже достаточно просто. Нужно открыть любую страницу с префиксом replytocom и если идет переадресация на страницу с записью, где оставлен этот комментарий, то все работает отлично.

Для тех, кто думает, что можно ограничиться строками в robots.txt типа:

Disallow: /*?*
Disallow: /*?

Они у меня были прописаны в роботсе с самого начала, только это не сильно помогло, как вы успели заметить. Поэтому проблему нужно решать более кардинально.

Update 22.01.14

Для полного уничтожения этой заразы придется еще несколько файлов отредактировать. Находим файл default_filters.php в папке wp-includes и удаляем там следующие строки.

1
if ( isset( $_GET[’replytocom’] ) ) add_action( ‘wp_head’, ‘wp_no_robots’ );

Сохраняем файл. Далее находим coment-template.php в той же папке и редактируем его. Нажимаем сочетание клавиш Ctrl+F и ищем фразу replytocom и удаляем следующий элемент кода.

1
. esc_url( add_query_arg( ‘replytocom’, $comment->comment_ID ) )

Как удалить из выдачи гугла replytocom

Тут тоже все просто. Заходите в панель вебмастера — Сканирование — Параметры URL и создаете новый параметр. Для наглядности можете смотреть картинку.

На этом все. Через некоторое время эти коварные страницы исчезнут из жизни вашего сайта, к вам снизойдет благодать от ПС и вы почувствуете разницу. Занавес.

Источник: whiteprofit.ru

Добавить комментарий