На главную About Seo Поведение роботов на сайте
Поведение роботов на сайте

Поведение роботов на сайте

Чем отличается поведение робота на сайте от поведения обычного пользова­теля?

  1. Управляемость. Прежде всего "интеллигентный" робот должен запро­сить с сервера файл robots . txt с инструкциями по индексации.
  2. Выборочное выкачивание. При запросе документа робот четко указывает типы запрашиваемых данных, в отличие от обычного браузера, готового принимать все подряд. Основные роботы популярных поисковиков в первую очередь будут запрашивать гипертекстовые и обычные текстовые докумен­ты, оставляя без внимания файлы стилей оформления CSS, изображения, видео, ZIP-архивы и т.п. В настоящее время также востребована информа­ция в форматах PDF, Rich Text, MS Word, MS Excel и некоторых других.
  3. Непредсказуемость. Невозможно отследить или предсказать путь робота по сайту, поскольку он не оставляет информации в поле Referer — адрес страницы, откуда он пришел; робот просто запрашивает список докумен­тов, казалось бы, в случайном порядке, а на самом деле в соответствии со своим внутренним списком или очередью индексации.
  4. Скорость. Небольшое время между запросами разных документов. Здесь речь идет о секундах или долях секунды между запросами двух разных документов. Для некоторых роботов есть даже специальные инструкции, которые указываются в файле robots.txt, по ограничению скорости за­проса документов, чтобы не перегрузить сайт.

Как может выглядеть HTML-страница в глазах робота, мы не знаем, но мо­жем попытаться себе это представить, отключая в браузере отображение графи­ки и стилевого оформления.

 

 

���� ������������



���� ������������


���� ������������
������.�������