Советы по организации структуры сайта. Нужно ли расширение .html

Этот пост начну сразу с цитирования своего письма, адресованного Платону Щукину.

Здравствуйте.

Я проектирую структуру нового сайта на Вордпресс. Хочу посоветоваться с вами, как все-таки правильнее делать.

Вопрос: каким с точки зрения Яндекса, должен быть УРЛ?

1) Чтобы УРЛ страницы содержал в себе название рубрики или можно без нее? Например,
example.net/category-name/post-name/ или example.net/post-name/

2) Чем лучше заканчивать УРЛ страницы: правым слешем «/» или расширением «.html» ?

Существует множество мнений. Хотелось бы сделать согласно рекомендации эксперта.

Спасибо.

Организация структуры сайта

My Life Graphic / Shutterstock.com

Ответ в общем-то малоинформативен.

Здравствуйте, Илья!

С нашими рекомендациями по поводу структуры сайта Вы можете ознакомиться на странице Помощи: http://help.yandex.ru/webmaster/?id=1108946.

На этой же странице в пункте 4 изложены наши рекомендации по составлению URL страниц.

К сожалению, более подробно прокомментировать, как тот или иной фактор влияет на присутствие сайта в поиске, мы не можем. В любом случае, если у Вас возникнут проблемы с индексированием или ранжированием Вашего сайта в Яндексе, Вы можете описать их подробно в письме. Мы постараемся разобраться в причинах сложившейся ситуации.


С уважением, Платон Щукин
Служба поддержки Яндекса
http://help.yandex.ru/

Расширение html в УРЛ страницы

Мне всё-таки кажется, что использование в УРЛ расширения «.html» несколько архаичным. Сейчас объясню почему.

Именно благодаря Лебедеву рунет так стремительно начал меняться, когда в прошлом веке его студия создавала шедевры. У всех тогда было другое представление о сайтах. Структура у них всегда одна и та же: слева столбец с кнопками навигации справа контент. Я помню как многие долгое время сопротивлялись правостороннему расположению сайдбара. А элементы навигации называли, согласно установившемуся стереотипу — кнопками. Так вот, Лебедев дал сильный толчок развитию дизайна в России и стран СНГ. Я считаю, что он свою миссию уже выполнил. Россия уже перестала ассоциироваться у буржуев с валенками.

Хочу искренно сказать, что я очень многому научился, смотря на работы Студии. Я уловил их стиль. И он на самом деле минималистичен. Дизайн делается не ради дизайна.

Все сайты, которые делаются в студии, а их как вы понимаете не мало и какие у них клиенты вы наверное знаете. Так вот на этих сайтах УРЛ страниц всегда чистые, без всякого программисткого мусора. Адреса рубрик и сраниц заканчиваются слешем. И что? У них возникли проблемы с индексированием? О ком вы хотите заботитья о поисковиках, мол поисковик быстрее поймет, каталог это или страница только по наличию расширения или слэшу. Не смешите меня! Поисковики не стоят на месте, они научились прекрасно понимать, что находится на странице и способны определить для кого написан текст: для роботов или для людей. Неужели вы думаете, что бедный поисковичик запутается без вашей подсказки?

А почему, кстати «.html», а если сайт сделан на php? Так что, теперь мне добавлять к странице расширение «.php»? Для кого это информация нужна? Для пользователя? Для большинства это дремучий лес. Я очень хорошо запомнил ководство Лебедева:

«Каждый читатель может навигироваться по сайту, стирая справа части адреса до ближайшей косой черты».

И правило:

Посетитель всегда должен получить осмысленное и предсказуемое содержимое, если он стер часть адреса до ближайшей косой черты.

Источник: http://www.artlebedev.ru/kovodstvo/sections/48/

Посмотрите на УРЛ выше. Действительно, всё чётко и понятно. И сразу я сно в каком разделе мы находимся. Между прочим эта концепция соответствует рекомендациям Яндекса: «Каждый документ должен относиться к своему разделу».

Я так всегда и делал, пока не узнал, что от глубины вложенности страницы зависит ее PR. И когда иой блог монетизировался временными ссылками, я решил отступить от этого правила. С блогом всё ОК, он прекрасно индексируется. Но недавно я создавал новый проект, наспех наполняя его контентом деле не имел времени привести дизайн в нормальный вид. Структура сайта была плоской, то есть категория никак не отображалась в адресе страницы. Когда я спрашивал у специалистов, что могло привести к санкциям Яндекса. Никто не мог ответить точно, потому что контент был хорошим. Но в качестве предположения говорили, что у сайта плоская структура.

Если мы еще вспомним о тИЦ, то важность структуры опять-таки будет не на последнем месте. Вы ведь в курсе, что у одного сайта, будучи несколько разделов у каждого раздела может быть разным тИЦ? Раньше это можно было даже увидеть, но потом Яндекс прикрыл доступ к этой информации.+

Вот на этой странице я решил собрать рекомендации Яндекса, прописанный в Помощи Вебмастера, сопровождая их своими комментариями.

А вот, немного информации об УРЛ со слешами

Это тоже фрагмент из 14 пункта Помощи Яндекса http://help.yandex.ru/webmaster/?id=1111307

Страницы, содержащие знак «/» в конце url и без него, являются для робота Яндекса разными. Если эти страницы содержат одинаковый контент, то лучше установить перенаправление 301 с одной страницы на другую (вы можете сделать это с помощью настроек в файле htaccess) или указать канонический url.

Структура сайта

Основой интернета являются ссылки, по которым можно переходить со страницы на другую страницу, с сайта на другой сайт. Работа поискового робота Яндекса основана на переходах по ссылкам и анализе этих ссылок. Почти все известные Яндексу документы попали в поисковую базу благодаря переходам робота по ссылкам, и только некоторые были добавлены в базу вебмастерами вручную через форму «Сообщить о новом сайте». Если на вашем сайте есть документы, на которые не ссылаются другие страницы, робот Яндекса никогда не узнает про их существование, и они не будут учитываться при поиске. Поэтому важно следить за тем, как страницы вашего сайта связаны друг с другом. Вот несколько советов по организации структуры сайта:

Поддерживайте чёткую ссылочную структуру на сайте

Каждый документ должен относиться к своему разделу. (Тут нам Яндекс однозначно говорит, что сайт не должен быть плоским, а иметь иерархическую структуру). Следите, чтобы на каждый документ можно было попасть по обычной ссылке, обозначающейся в HTML-коде страницы тегом <A>: <a href=…>…</a>. Вообще говоря, время, которое необходимо роботу Яндекса, чтобы проиндексировать какую-либо внутреннюю страницу сайта, зависит, в том числе, от глубины вложенности этой страницы (Но не нужно делать большие вложенности, кроме того, что она будет дольше индексироваться, она ещё будет иметь меньший статический вес). Поэтому чем глубже страница, тем больше времени может пройти до включения ее в индекс.

При создании ссылок между документами сайта нужно учитывать еще один момент. Часто входной точкой на ваш сайт является именно главная страница. Ведь людям гораздо проще запомнить название (имя домена) сайта, но не конкретную внутреннюю страницу, URL которой может быть довольно замысловатым. Организация навигации по сайту должна позволять пользователю быстро сориентироваться в его структуре и легко находить нужные документы, чтобы не возникало ситуации, когда, не найдя нужной информации, разочарованный посетитель покидает сайт.

Используйте карту сайта

Для крупных проектов, содержащих множество страниц, рекомендуется использовать sitemap (карту сайта), которую можно загрузить в соответствующем разделе сервиса Яндекс.Вебмастер, или указать ссылку на файл в файле robots.txt. Это поможет поисковому роботу проиндексировать и проанализировать документы вашего сайта.

Ограничивайте индексирование служебной информации

Многочисленные страницы-дубликаты, результаты поиска по сайту, статистика посещений и тому подобные страницы могут тратить ресурсы робота и мешать индексированию основного содержимого сайта. Такие страницы не имеют ценности для поисковой системы, так как пользователям в выдаче они не предоставляют какой-то уникальной информации. Рекомендуем запрещать индексирование таких страниц в файле robots.txt. Если их не исключить из индексирования, то может получиться так, что регулярно добавляющиеся или обновляющиеся технические страницы будут хорошо индексироваться, а факт обновления важной информации на основных страницах сайта для робота останется незамеченным.

Каждая страница должна иметь уникальный адрес (URL)

Желательно, чтобы вид URL давал представление о том, что содержится на соответствующей странице. Использование транслитерации в адресах страниц также позволит роботу понять, о чем может быть страница. Например, один только URL http://download.yandex.ru/company/experience/Baitin_Korrekciya%20gramotnosti.pdf дает поисковому роботу множество информации о документе: его можно скачать; формат, скорее всего, PDF; документ, вероятно, релевантен запросу «коррекция грамотности» и так далее.

Делайте ссылки на другие разделы сайта текстовыми, чтобы предоставить роботу больше информации о материалах, которые в них размещены.

Проверяйте корректность symlink-ов, чтобы при движении по сайту у страниц не получался бесконечно растущий URL. Страницы, у которых в пути содержится много повторений одного и того же токена, например, site.ru/vasya/vasya/vasya/vasya/ могут не индексироваться.

А вот ещё очень важная заметка из Яндекс.Вебмастера. Это когда вы добавляете новый сайт и его только собирается проиндексировать Яндекс, то можно прочесть вот такой текст:

Раздел недоступен, так как сайт не проиндексирован
Структура сайта с точки зрения робота Яндекса. Показаны подразделы, содержащие более 10 страниц и занимающие более 1% от общего числа загруженных страниц.

Теперь вся эта информация в виде тезисов, так лучше запоминается.

Структура интернета

  • Основой интернета являются ссылки.
  • Работа поискового робота Яндекса основана на переходах по ссылкам и анализе этих ссылок.
  • Почти все известные Яндексу документы попали в поисковую базу благодаря переходам робота по ссылкам.

Советы по организации структуры сайта

  • Адрес страницы должен быть по возможности коротким и понятным.
  • Следует подумать о названиях директорий и файлов.
  • Необходимо решить, на каком языке будут даны названия файлов.
  • Каждый документ должен относиться к своему разделу.
  • Каждый подраздел должен содержать не менее 10 страниц.
  • На каждую страницу должна стоять ссылка.

  • Если на вашем сайте есть документы, на которые не ссылаются другие страницы, робот Яндекса никогда не узнает про их существование.

  • Создайте карту сайта (sitemap), чтобы помочь поисковому роботу проиндексировать все ваши страницы.
  • Страницы, не имеющие ценности для поисковой системы (дубли страниц, результаты поиска и тому подобные страницы), так как пользователям в выдаче они не предоставляют какой-то уникальной информации закрыть от индексации, чтобы не тратить ресурсы робота и не мешать индексированию основного содержимого сайта.
  • Желательно, чтобы вид URL давал представление о том, что содержится на соответствующей странице. Использование транслитерации в адресах страниц также позволит роботу понять, о чем она. (Лебедев говорил, что лучше всего использовать английский. В редких случаях уместен русский, точнее, волапюк, транслитерация или клер. Но с точки зрения SEO и пользователей, я рекомендую УРЛ делать транслитом. Не все пользователи знают английский язык, а поисковик, понимая транслитерацию будет подсвечивать адрес страницы, если в нём будет ключевое слово, что дат дополнительный бонус для ранжирования).

Настройки постоянных ссылок в Вордпресс

Как сделать иерархическую структуру постоянных ссылок в Вордпресс подробно написано и на скриншотах показано здесь: Источник: http://www.fortress-design.com/ierarhicheskaya-struktura-ssylok/

Вывод

Для себя я решил делать новый сайт:

  • с указанием категории в УРЛ, чтобы он имел разветвлённую структуру;
  • без html в адресе страниц;
  • и со слешем в конце УРЛ, как у страниц так и категорий.
  • http://shpargalkablog.ru/ NMitra

    Хорошая статья, особенно про html в конце URL — поддерживаю.

    • http://www.fortress-design.com fortresseo

      Спасибо, NMitra. Я рад, что она вам понравилось. Здесь собрана информация из различных источников, поэтому можно проанализировать и выбрать для себя оптимальный вариант.

  • Лойс

    Вот это ты запилил статью. Я обычно не читаю лишнего, но тут вычитал всё.
    Поддерживаю всё вышесказанное.