На главную About Seo Оптимизация альтернативных форматов документов (Flash, PDF, DOC и XML)
Оптимизация альтернативных форматов документов (Flash, PDF, DOC и XML)

Поисковые системы индексируют не только традиционные для Интернета HTML-доку менты. Их индексы пополняются информацией, полученной из документов, созданных в форматах, более привычных в "офлайновой" среде — PDF, DOC и XML. Расскажем чуть подробнее об этих форматах.

PDF (Portable Document Format). Этот формат записи документов был пред­ложен в 1993 году компанией Adobe. Эта же компания предоставляет програм­му для просмотра и печати документов этого формата — Adobe Acrobat.

Одно из основных преимуществ данного формата — универсальность. PDF позволяет сохранять первоначальный вид документа со всеми шрифтами, гра­фическими элементами и т.п. PDF-файлы можно открывать с помощью про­граммы Adobe Acrobat Reader, существующей для любой платформы. Что не менее важно, разного рода графические схемы можно увеличивать или умень­шать без серьезных потерь в качестве — это достигается за счет использования элементов векторной графики. Последнее свойство PDF-формата объясняет его высокую популярность для сохранения технической документации, руко­водств пользователя и т.п., ведь не секрет, что PDF стал буквально стандартом для описания технических характеристик устройств (особенно электронных) у большинства разработчиков. Поэтому в Интернете нельзя не считаться с этим форматом.

DOC и XLS. Форматы популярнейшего текстового редактора MS Word и ре­дактора таблиц MS Excel, входящих в стандартный пакет офисных программ Microsoft Office. В Интернете содержится много информации в этих форма­тах — рефераты, доклады, отчеты, таблицы и др. Поэтому желание поисковых систем извлекать информацию из этих документов и показывать пользовате­лям вполне понятно.

Flash. Этот формат разработан компанией Macromedia (впоследствии приоб­ретенной компанией Adobe) для мультимедийных объектов — анимационных роликов, звукового сопровождения и т.п. Средства воспроизведения распро­страняются как подключаемый к браузеру модуль (plug-in). В настоящее время этот формат получил широкое распространение, поскольку позволяет в отно­сительно небольшом объеме данных описывать сложную анимацию и опериро­вать векторными объектами.

Если на вашем сайте есть электронные книги, технические описания, доку­ментация, демонстрационные ролики и т.п., записанные в рассматриваемых форматах, можно приложить определенные усилия для повышения видимости этих документов в поисковых системах.

Техника поисковой оптимизации PDF-, DOC- и XLS-файлов принципиаль­но не отличается от работы с HTML-доку ментами, необходимо лишь обратить внимание на одну особенность: в этих форматах текст, видимый пользователю, не всегда является текстом, доступным для поисковых машин.

В принципе поисковые системы могут индексировать текст и ссылки в этих форматах. Но в PDF-файлах часто видимый пользователю текст на самом деле является изображением, а для XLS-файлов вообще характерно малое количест­во текста. Поэтому необходимо следующее:

  • сохранять данные в файле именно в текстовом виде;
  • обеспечить наличие в текстах файлов PDF-, DOC- и XLS-форматов клю­чевых слов и фраз, по которым вы бы хотели видеть ссылки на эти до­кументы в результатах поиска (сделать это достаточно легко с помощью описанной ранее текстовой коррекции и/или внесения в текст необходи­мых развернутых текстовых комментариев — особенно это касается таб­личных файлов XLS);
  • сделать доступными данные файлы для поисковых роботов, т.е. проверить отсутствие защиты паролями и наличие легко индексируемых ссылок на эти файлы со страниц, известных поисковым системам;
  • заполнять поля метаданных документов, главным образом, поля title (заголовок документа), с внесением в них нужных ключевых слов и фраз. Пользователям содержимое титула практически не видно, но его содер­жимое учитывается поисковыми роботами.

Отдельно стоит остановиться на продвижении сайтов, где информация представлена в SWF-формате (Flash-ролики). Некоторые поисковые системы, например Яндекс, умеют индексировать Flash-документы — для этого поиско­вик сохраняет текстовое представление Flash-документа. Но во Flash-ролике невозможно разместить много текстовой информации, поэтому если вы хотите использовать этот очень привлекательный для пользователей формат на сайте, нужно размещать Flash-ролики на обычных текстовых HTML-страницах. При этом необходимо, по возможности, дублировать текстовую информацию из Flash внизу страницы, а также правильно заполнять титульные фразы страниц.

В итоге поисковые системы будут правильно индексировать текстовое содер­жимое из HTML и FLASH и эффективно отображать такую страницу в результа­тах поиска, а пользователи увидят на первом экране (изображение страницы на мониторе без использования прокрутки экрана) яркий Flash-ролик.

 









.