Структура сайта

Если на проекте нет документации о структуре страниц сайта (или вы делаете анализ сайта конкурента), то самым простым способом узнать структуру сайта — парсинг. Это автоматический процесс, который экономит время, тогда как ручная проверка структуры крайне трудозатратна. При проверке структуры парсят внутренние ссылки и коды ответов этих адресов.

Дополнительным инструментом для анализа структуры может быть файл sitemap.xml являющийся картой сайта.

В результате парсинга сайта специалист получает список адресов, которые можно структурировать и отрисовать структуру в виде схемы. Screaming Frog SEO Spider имеет встроенные инструменты для построения графов.

Структура сайта в виде графа

При помощи визуализации структуры можно легко найти проблемы: дублирование или каннибализацию страниц.

Каннибализация страниц — это ситуация, когда несколько страниц одного сайта оптимизированы под одни и те же ключевые слова, что приводит к их конкуренции между собой в поисковой выдаче.

Выявив такие страницы в структуре, необходимо определить наиболее качественные из них, остальные удалить и настроить с них перенаправления на оставшиеся качественные. Если же, по какой либо причине, удалить дубликаты невозможно, стоит прибегнуть к использованию указания канонических адресов страниц. Это полезный инструмент даже если на вашем сайте нет дубликатов. Указывать канонические адреса полезно в любом случае. Сделать это можно через код, используя элемент link с атрибутом rel="canonical". Подробнее в справке Google.

Структура подразумевает вложенность страниц: есть главная, у неё есть дочерние разделы, а в дочерних разделах есть их собственные дочерние страницы и т.д. Старайтесь создавать логичные иерархии и избегать излишней вложенности.

Подробнее о нём можно почитать в справке:
Google
Яндекс

Правильные адреса страниц

Поисковые системы негативно относятся к сложным и длинным URL адресам. Хороший URL должен быть описательным, т.е. информативным и легко читаемым для человека. Излишне длинные и неинформативные адреса страниц нужно приводить к "человекопонятной" форме (ЧПУ).

Подробнее о ЧПУ можно прочесть в справке Google.

Нормализация URL-адресов

Нормализация это процедура приведения всех адресов сайта к единообразию. Не стоит путать с канонизацией, хотя Google утверждает что нормализация это и есть процесс выбора канонических адресов. На деле, указание канонических адресов это часть комплекса работ по нормализации.

Главное зеркало

Под термином "главное зеркало" (иногда называют "хост") подразумевают правильное написание домена, поскольку любой домен существует минимум по двум адресам: с www и без. Перефикс "www" в доменных адресах это атавизм, который всё ещё используется многими сайтами. Но с технической точки зрения, "www" является поддоменом главного домена. Т.е. URL-адреса www.site.ru и site.ru это фактически два разных сайта, хотя контент на таких страницах, как правило, идентичен.

Кроме вариантов с перефиксом и без него, необходимо помнить о протоколах передачи данных. Если сайт использует SSL сертификат, значит необходимо использовать адреса с протоколом HTTPS, в противном случае — стандартный HTTP.

Если на этапе регистрации доменного имени и настройки работы сервера не было выбрано главное зеркало, то необходимо как можно быстрее настроить соответствующие перенаправления. После их настройки поисковые системы должны "склеить" не корректные адреса с главным зеркалом.

Подробнее о главных зеркалах можно почитать в блоге Яндекс'а.

Перенаправления

Помимо главной страницы, необходимо провести настройку перенаправлений:

Если в процессе реструктуризации URL адреса страниц приводились к ЧПУ форме или просто менялись, то необходимо постранично настроить на перенаправления со старых адресов на новые.

Общие перенаправления настраиваются для всех страниц сайта и нужны они для обработки переходов на страницы с ошибками в адресе. Чаще всего используется: