Корреляция значений PR и CY


Инструменты анализа сайтов и страниц

В настоящее время общепризнанными в Рунете параметрами, определающими «авторитетность» интернет-ресурсов с учетом качественной характеристики ссылок на них с других сайтов, являются сдедующие индексы:

  • Yandex тИЦ (CY) — тематический индекс цитирования от поисковой системы Яndex
  • Google PageRank (PR) — алгоритм расчёта авторитетности страницы от поисковой системы Google

Знание этих численных показателей ссылочной популярности страниц является необходимым как для адекватного анализа, так и для оптимизации информационных ресурсов. Между тем, закономерным является вопрос, а какова корреляция между значениями PR и CY? Для ответа на этот вопрос была разработана следующая методика. Сначала информер индексов цитирования производил накопление исходных данных по значениям PR и CY. Затем с помощью определённого алгоритма производилось преобразование CY в логарифимический индекс цитирования (lCY). На основании полученных данных строилась диаграмма, на которой показана частота наличия интернет-ресурсов с заданными lCY и PR. Ресурсы, где CY был менее 10 или где PR не был присвоен, не рассматривались. Как видно из рисунка, существует хорошо заметная корреляция между PR и CY в виде диагональной линии. Кроме того, заметен ещё один лепесток с PR=0 и довольно-таки высоким тИЦ (до lCY=5, CY=1600). Это соответствует области внутренних страниц, PR которых низок из-за неэффективной перелинковки, а CY высок, так как он является общим для всех страниц интернет-ресурса.

Таким образом, в данной работе показано наличие сильной корреляции между значениями PR и CY. Кроме того, показано наличие неоптимизированных информационных ресурсов.

 
© 2008, Сергей Холод.
Разрешено копирование материалов статьи с обязательным указанием авторства и линк-ссылки на оригинал.
Поставить закладку на инструмент

Новости

Карта сайта