Дубли страниц на сайте: чем вредят и как убрать

Вы вложились в сайт, написали хорошие тексты, а страница услуги всё равно болтается где-то на второй-третьей странице поиска. Одна из частых и незаметных причин — дубли страниц: когда одно и то же содержимое доступно поисковику по нескольким разным адресам. Владельцу бизнеса это кажется мелочью «для программистов», но именно из-за неё поиск путается, распыляет силы вашего сайта и в итоге показывает вас ниже, чем вы заслуживаете. Давайте разберёмся простыми словами: что это, откуда берётся, чем опасно и как навести порядок.

Что такое дубли простыми словами

Дубль — это когда одна и та же страница открывается по двум и более адресам. Для человека это выглядит как одна и та же карточка услуги: тот же заголовок, тот же текст, те же цены. А для поисковой системы адрес (URL) — это и есть «имя» страницы. Разные адреса — с её точки зрения разные страницы, даже если внутри всё одинаковое.

Представьте, что у вашего офиса пять входов и на каждом висит одинаковая вывеска. Вы-то знаете, что офис один. Но курьер, впервые приехавший, растеряется: какой вход «настоящий», по какому вести клиентов? Примерно так же теряется поисковый робот, встречая пять адресов с одинаковым содержимым.

Откуда вообще берутся дубли

Самое неприятное, что дубли почти всегда возникают сами собой — вы их специально не создаёте. Вот типичные источники:

С «www» и без «www». Адреса www.site.ru и site.ru для поиска — два разных сайта с одинаковым содержимым.
Со слешем в конце и без. /uslugi/remont и /uslugi/remont/ технически считаются разными адресами.
http и https. После установки защищённого протокола старые адреса на http могут остаться доступными и дублировать новые.
Параметры фильтров и сортировок. Когда посетитель выбирает «сначала дешёвые» или ставит галочку фильтра, к адресу добавляется «хвост» вроде ?sort=price или ?filter=…. Содержимое почти то же, а адресов плодятся десятки.
Страницы пагинации. Разбитый на страницы каталог (стр. 2, 3, 4) иногда повторяет описания и вводные тексты.
Копии карточек. Один товар или услуга доступен из нескольких разделов, и под каждый раздел создаётся свой адрес.
Технические копии. Версии для печати, служебные адреса, случайно проиндексированная тестовая копия сайта.

По отдельности каждая мелочь безобидна. Но вместе они превращают сайт из десяти страниц в поисковой картине в сотню почти одинаковых. Особенно быстро дубли размножаются на сайтах с каталогом и фильтрами: каждая комбинация галочек и сортировок теоретически может стать отдельным адресом. Поэтому чем больше на сайте интерактива, тем внимательнее стоит следить за порядком в адресах — и тем важнее, чтобы этим кто-то занимался осознанно, а не по остаточному принципу.

Чем дубли вредят продвижению

Вред неочевидный, но вполне ощутимый в позициях и трафике. Смотрите, что происходит:

Поиск не понимает, какую страницу показывать. Из нескольких одинаковых адресов система сама выбирает «главный». Иногда выбирает не тот — например, версию с кривым адресом или без нужного текста.
Размывается «вес» страницы. Ссылки, поведение пользователей, накопленный авторитет — всё это должно усиливать одну страницу. А вместо этого делится между дублями. Вместо одной сильной страницы у вас три слабых.
Хуже ранжирование. Ослабленная и «непонятная» страница проигрывает конкурентам, у которых всё собрано в одном адресе.
Тратится краулинговый бюджет. У поиска есть лимит: сколько страниц вашего сайта он готов обойти за определённое время. Если робот тратит его на сотню дублей, до по-настоящему важных страниц он может добраться нескоро. Новые услуги дольше попадают в поиск.

Итог простой: вы конкурируете сами с собой и мешаете поиску вас понять. Отдельная неприятность в том, что владелец обычно не связывает слабые позиции с дублями — ведь на глаз сайт выглядит нормально, страницы открываются, тексты на месте. Проблема живёт «под капотом», в адресах, и увидеть её можно только через инструменты поиска. Поэтому дубли так часто месяцами тормозят продвижение незамеченными: их не ищут, потому что не подозревают.

Пример из жизни

Небольшая инженерная компания продвигала страницу услуги — проектирование вентиляции. Страница была хорошая, но месяцами держалась в конце второй страницы Яндекса и почти не давала заявок. При разборе выяснилось: та же услуга открывалась по четырём адресам — с www и без, со слешем и без, плюс версия с параметром сортировки из каталога. Поиск метался между ними и в выдаче показывал то одну, то другую, ни одной не давая набрать силу.

Сделали склейку: назначили один правильный адрес, а остальные три «перенаправили» на него. Ничего в текстах не меняли — только навели порядок с адресами. Через несколько недель после переобхода поиском все накопленные сигналы собрались на одной странице. Она поднялась со второй страницы в верхнюю часть первой, и с неё пошли заявки. По сути, компания уже имела нужный результат — он просто был «размазан» по копиям.

Как найти дубли на своём сайте

Хорошая новость: искать дубли не нужно вручную. Есть простые инструменты, и часть из них доступна вам без разработчика:

Яндекс.Вебмастер. Бесплатная панель для владельца сайта. В разделах про страницы и индексирование он прямо сообщает о дублях и о страницах, исключённых из поиска как повторы. Это первое, куда стоит заглянуть.
Оператор site: в поиске. Введите в строке поиска site:вашсайт.ру — увидите, сколько и какие страницы поиск знает о вашем сайте. Если число подозрительно большое или мелькают одинаковые заголовки с разными адресами — это сигнал.
Программы-краулеры. Специальные сервисы обходят сайт как робот и составляют список всех адресов, помечая одинаковые заголовки и содержимое. Обычно этим пользуется специалист, но отчёт понятен и владельцу.

Вам не обязательно уметь всё это самому. Достаточно знать, что проверка существует, и запросить её результат у тех, кто ведёт ваш сайт.

Как убрать дубли: четыре понятных способа

Убирают дубли не удалением страниц, а тем, что поиску чётко указывают единственный правильный адрес. Основных приёмов четыре:

301-редирект (постоянное перенаправление). Лишний адрес автоматически «пересаживает» и человека, и робота на главный. Так поступают с парами www/без-www, слеш/без-слеша, http/https. Весь накопленный вес переезжает на нужную страницу.
Атрибут canonical. Это пометка в коде страницы: «главная версия вот здесь». Её ставят там, где удалять или перенаправлять нельзя, — например, на страницах фильтров и сортировок. Дубль остаётся доступным людям, но поиск понимает, какую версию считать основной.
Настройка главного зеркала. Один раз выбирается основной вид сайта — с www или без, на https, — и он закрепляется в настройках и в панели вебмастера. Дальше поиск не сомневается.
Закрытие мусорных параметров. Служебные «хвосты» адресов, не несущие ценности для поиска, помечаются как ненужные для индексации. Робот перестаёт плодить из-за них копии.

Звучит технически, но по сути это разовая уборка плюс правильные настройки на будущее.

Мифы, которые мешают

«Дубли — это когда я скопировал чужой текст». Нет. Чаще всего дубли — ваш же собственный контент, доступный по нескольким адресам. Плагиат тут ни при чём.
«У меня маленький сайт, дублей быть не может». Могут. Пара www/без-www и слеши возникают на сайте любого размера, автоматически.
«Надо просто удалить лишние страницы». Опасно. Удаление без перенаправления теряет накопленный вес и может увести в никуда внешние ссылки. Правильно — склеивать, а не рубить.
«Canonical всё решит сам». Не всегда. Это рекомендация поиску, а не строгий приказ. Для зеркал и протоколов надёжнее редиректы.

Что делает разработчик, а что контролируете вы

Разграничим зоны ответственности, чтобы вы понимали, за что спрашивать.

Забота разработчика (техническая часть): настроить 301-редиректы, проставить canonical, закрепить главное зеркало и https, закрыть мусорные параметры, аккуратно обойтись с пагинацией. Это работа в коде и настройках сервера — сами вы её не делаете.

Что должны проконтролировать вы:

Заглянуть в Яндекс.Вебмастер и увидеть, есть ли предупреждения о дублях.
Проверить: сайт открывается только по одному виду адреса? Наберите его с www и без, со слешем и без — вас должно перекидывать на единый вариант.
Задать вопрос исполнителю прямо: «Как у нас закрыты дубли? Настроены ли редиректы и canonical?» Внятный ответ — хороший знак.
После правок попросить показать динамику позиций важной страницы через несколько недель.

Вам не нужно знать код. Нужно знать, что спросить и куда посмотреть, — этого достаточно, чтобы держать ситуацию под контролем.

Короткий вывод и что делать дальше

Дубли страниц — тихая, но реальная причина, по которой хороший сайт недобирает позиций. Одно содержимое по многим адресам путает поиск, дробит вес и съедает краулинговый бюджет. Лечится это не сложным, но аккуратным набором действий: редиректы, canonical, одно главное зеркало, закрытые мусорные параметры. Часто именно склейка даёт быстрый рост — как в примере выше, где страница поднялась просто потому, что перестала конкурировать сама с собой.

Что сделать на этой неделе: откройте Яндекс.Вебмастер и пробегите глазами разделы про страницы; проверьте свой адрес с www и без, со слешем и без; задайте исполнителю вопрос про редиректы и canonical. Если разбираться в этом самому не хочется, а хочется, чтобы сайт был технически чистым с самого начала и оставался таким, — это ровно то, что закрывает работа под ключ: сайт делается и ведётся так, чтобы дубли, зеркала и параметры были настроены правильно, а вы занимались бизнесом, а не разбором адресов.

Дубли страниц на сайте: чем вредят и как убрать

Что такое дубли простыми словами

Откуда вообще берутся дубли

Чем дубли вредят продвижению

Пример из жизни

Как найти дубли на своём сайте

Как убрать дубли: четыре понятных способа

Мифы, которые мешают

Что делает разработчик, а что контролируете вы

Короткий вывод и что делать дальше

ПРОДВИГАЕМ САЙТЫ В ТОП

Читайте также

Техническое SEO простыми словами для владельца

Как ставить задачи и принимать работу у разработчиков

Как перенести или переделать сайт без потери позиций