На главную Статейки по PR Как определяется ранг страницы
Как определяется ранг страницы
Теоретически идея автоматического использования ссылок для вычисления авторитета стра­ницы выглядит просто: возьмем матрицу всех ссылок всех страниц Интернета друг на друга, т.е. фактически "Интернет в квадрате". Получится матрица гигантских размеров — скажем, двадцать миллиардов на двадцать миллиардов.

Теперь начнем учитывать ссылки страниц друг на друга. Сначала присвоим всем страницам равный вес (ранг). Затем, начиная с какого-нибудь угла этой огромной матрицы, начнем пере­считывать вес страниц и ссылок примерно таким образом: если на страницу ссылается много страниц (т.е. у нее много "входящих" ссылок), то ранг страницы повышается (по некоторой относительно простой формуле).

Будем также учитывать и ранг ссылок. Ведь ссылка с важной страницы лучше ссылки с мало­значительной страницы, не так ли? Если на вас сослался президент в своей ежегодной речи, то это более ценно, чем если бы вас вчера упомянул во дворе дворник. Итак, при расчете ранга страницы нужно учесть вес каждой "входящей" ссылки.

Наоборот, если со страницы с неким рангом "уходит" несколько ссылок, разделим ранг стра­ницы между всеми ссылками. Действительно, если президент в своей речи сослался исключи­тельно на вас одного — это серьезное событие. Если же он зачитал список из двухсот имен, среди которых было и ваше, то это тоже почетно, но в меньшей степени.

Таким образом, если на страницу ссылается очень авторитетный ресурс, то и ранг самой страни­цы повышатся. Правда, если этот авторитетный ресурс ссылается еще на тысячи других страниц (скажем, это каталог Yahoo), то авторитет каталога "размажется" по всем тысячам ссылок и нам от него достанется немного (другими словами, ранг нашей страницы повысится незначительно).

Заметим, что после первого цикла пересчета матрицы связей Интернета нам придется вернуть­ся к началу и пересчитать все ранги еще раз, так как ранги страниц, ссылающихся на самые первые страницы (с которых мы начинали), уже изменились. И так придется сделать много повторов пересчета, так называемых итераций.

В ходе разработки алгоритма создателям Google пришлось доказать эргодическую теорему о том, что процесс пересчета матрицы сойдется, как говорят математики. Получается, что на самом деле достаточно пересчитать матрицу всего несколько раз, чтобы ранги страниц уже были бо­лее-менее стабильны и ими можно было пользоваться в поисковике для расчета релевантности.


Для расчета авторитетности сайта нужно пересчитывать гигантские табли­цы ссылок с длиной, равной количеству всех страниц в Интернете. Естественно, технически задача такого пересчета гигантских матриц очень сложна. Именно поэтому даже спустя шесть-сесь лет после запуска Google пересчитывает свой индекс не так уж часто, далеко не каждый день, поскольку для пересчета мат­рицы связей требуются огромные вычислительные мощности.

Зато и выигрыш в релевантности поиска в Google был значительным. Сейчас, спустя шесть лет, уже все поисковые машины (Яндекс и Рамблер в том числе) применяют расчет авторитетности страницы и ссылочный ранг в том или ином виде для расчета релевантности результатов поиска.

В дальнейшем поисковики усовершенствовали идею вычисления автори­тетности страницы за счет учета текста на ссылках. Действительно, почти каждая ссылка в Интернете представляет собой какой-то текст (под который и "подложен", собственно, адрес страницы, на которую ссылаются). Естественно учитывать этот текст при расчете ранга той страницы, на которую ведет ссылка. Так возникает ссылочный ранг страницы — ранг, учитывающий тему ссылок.

 

���� ������������



���� ������������


���� ������������
������.�������