Зачем нужен файл sitemap.xml
Карта сайта (sitemap.xml) для – Google, Yandex и Yahoo!
Теперь про Рамблер


Зачем нужен файл sitemap.xml

Многие слышали, что чтобы ваш сайт, особенно если он написан на php, хорошо индексировался нужно создать карту сайта.

А если не слышали, то поясню – карта сайта – это специально написанный текстовый файл, который поможет улучшить индексацию вашего сайта в поисковых системах.

Существование этого файла является обязательным для многих сайтов, написанных на php и имеющих или вообще не имеющих SEO оптимизацию под поисковики, хотя не помешают и тем, которые её имеют.
Так как поисковый бот при заходе на сайт индексирует то, что считает нужным, не всегда, особенно, если у нас сайт часто обновляется, он индексирует то, что нам надо.
Допустим у нас есть уникальный материал, а поисковик его упорно игнорирует, зато радостно индексирет всякий флуд с форума.
Вот тут нам и поможет файл карты сайта, где мы впишем ссылку на этот самый уникальный материал и поисковик наконец-то его проиндексирует.

Создать карту сайта легко, если вы используете какой-либо распространённый движок бесплатной CMS, где есть плагин, который генерирует карту сайта.

А если нет или движок самописный?
Можно прибегнуть к помощи сайтов-генераторов карты сайта.
Вот только столкнулся я с такой проблемой, что сгенерировав карту сайта с помощью около 20-ти таких сервисов, я так и не смог предложить гуглу карту сайта, которая бы его устроила. Аналогично было и с Яндексом, т.к. эти поисковики используют немного не такой как обычно вид карты сайта, а у гугла есть целый трактат о том как создать правильную карту сайта.
Я потратил на его чтение около двух недель, ну а теперь с радостью поделюсь вам инструкцией по созданию карты сайта, на прочтение которой у вас уйдёт минут 20, но зато и карту сайта вы сможете создать сразу же после прочтения.

Карта сайта (sitemap.xml) для – Google, Yandex и Yahoo!

Итак. Карта сайта – это файл с названием sitemap и расширением xml.
Файл должен быть обязательно в кодировке UTF-8.

Рекомендую создать этот файл с помощью программы Notepad++, аналогично, как и в случае с RSS-лентой сайта.

Теперь перейдём к содержимому файла.

Открываться файл должен такими строчками:

<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

Это вы сообщаете, что ваш файл является картой сайта.

Далее вы должны указывать ссылки на все страницы вашего сайта или только те, которые хотите, чтобы были проиндексированы поисковой системой в первую очередь, или те, которые всё ещё не проиндексированы оформляя это вот такими тегами:

<url>
<loc>http://jeder.ru/index.php</loc>
<lastmod>2008-10-27T18:00:15+00:00</lastmod>
<priority>1.00</priority>
<changefreq>daily</changefreq>
</url>

Вполне возможно, что вы уже догадались по этой записи, что делать дальше, но всё же расскажу, что означает каждый из тегов в этом куске кода.
Все тэги делятся на два вида – обязательные – те, без которых ваша карта не будет таковой являться, и необязательные – т.е. их наличие необходимо только если вы хотите дать поисковому боту какие-либо дополнительные команды.

Тэг Описание
обязательные тэги
<url></url> Указывается блок, в котором будет указана ссылка некоего материала на вашем сайте
<loc></loc> Внутри этого тега вы должны указать ссылку на страницу, которая должна быть проиндексирована поисковиком
тэги, которые можно не использовать в файле карты сайта
<lastmod></lastmod> Дата когда вы создали добавляемую страницу или дата, когда вы создали файл карты сайта, обязательно должна указываться в виде:
2008-10-27T18:00:15+00:00, где
2008-10-27 – ГОД-МЕСЯЦ-ДЕНЬ
T(англ) – означает время
18:00:15 – время создания с точностью до секунды
+00:00 – сколько необходимо прибавить часов или минут к указанному вами времени относительно Гринвича
<priority></priority> Так называемая очерёдность или приоритетность ссылки – устанавливает вес ссылки относительно других ссылок в файле.
Возможные значения:
0 – низкая
0,5 – средняя
1 – высокая
<changefreq></changefreq> С какой периодичностью индексировать эту страницу заново. Хорошая функция для новостных сайтов, которые выводят новости на главной странице (для остальных страциц можете поставить daily, а когда они будут проиндексированы, убрать ссылки на них из файла)
Возможные значения:
always – всегда
hourly – ежечасно
daily – ежедневно
weekly – еженедельно
monthly – ежемесячно
yearly – раз в год
never – никогда

Таким образом вы вставляете все ссылки страниц, которые должны попасть в поисковик в обязательном порядке.

И в конце файла закрываете начальный тег:

</urlset>

Вот примерно так у вас должно получиться:

<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>


<url>
<loc>http://jeder.ru/</loc>
<lastmod>2008-10-27T18:00:15+00:00</lastmod>
<priority>1.00</priority>
<changefreq>daily</changefreq>
</url>

<url>
<loc>http://jeder.ru/help/help.shtml</loc>
<lastmod>2008-10-19T18:00:15+00:00</lastmod>
<priority>1.00</priority>
<changefreq>daily</changefreq>
</url>

<url>
<loc>http://jeder.ru/help/linux.shtml</loc>
<lastmod>2008-10-19T18:00:15+00:00</lastmod>
<priority>1.00</priority>
<changefreq>daily</changefreq>
</url>

<url>
<loc>http://jeder.ru/help/windows.shtml</loc>
<lastmod>2008-10-19T18:00:15+00:00</lastmod>
<priority>1.00</priority>
<changefreq>daily</changefreq>
</url>

</urlset>

Затем создайте, если его нет, или откройте файл robots.txt и в него добавьте такие строчки:

Sitemap: http://jeder.ru/sitemap.xml

чтобы поисковые боты узнал о том, что у вас есть карта сайта (вместо jeder.ru – введите свой адрес).

Файл sitemap.xml как и файл robots.txt нужно закинуть на хостинг в корень директориив вашего сайта.
И ждать, когда поисковики придут на ваш сайт и увидят карту сайта.

Теперь про Рамблер

Индексирует ли Рамблер файл sitemap.xml так и не получилось узнать. Однако, при регистрации сайта в Рамблере у него есть предупреждение, что их поисковые боты могут и вовсе не индексировать сайт, если он написан на php – ошеломляющее заявление от первого поисковика Рунета в разгар 21 века, неправда ли?

И тем не менее Рамблер это около 10% постетителей на сайт от общей массы.

Что же делать?

Самый действенный метод, который могу посоветовать вам – это наряду с созданием файла sitemap.xml создать страничку html с таким же оформлением как у вашего сайта, назвать её карта сайта (sitemap.html) и согласно требованиями стандарта html также добавить туда ссылки на страницы вашего сайта, а затем забросить этот файл в корень вашего сайта на хостинге рядом с sitemap.xml.

Вот и всё. Надеюсь, что это поможет вам продвинуть свой сайт в поисковиках :)