Логарифмический тИЦ


Инструменты анализа сайтов и страниц

В то время, когда Google и Webalta используют балльные шкалы оценки значимости интернет-ресурсов (Google PageRank = {0..10}, Webalta Rank = {0..100}, Webalta Site Trust Level = {0..10}), тематический индекс цитирования Yandex всегда стоял особняком, поскольку его значения были от 10 для только получивших этот индекс до 145000 у самого Yandex1. Хотя даже интуитивно чувствовалось, что балльная система ценностей является по своей природе логарифмической, так как, чем выше, например PageRank, тем труднее получить PageRank, на единицу больший. Поэтому возник вопрос, нельзя ли определить аналогичную шкалу ценностей и для тематического индекса цитирования. Простое логарифмирование тИЦ нам даёт невразумительные значения, поэтому вспомним о масштабировании. Так как баллы начинаются с нуля, а логарифм 1 равен нулю, то поделим тИЦ на 10. Тогда, по аналогии, натуральный логарифм от десятой части тИЦ сайта Yandex станет равен ln(145000/10) = 9,581904. Это порождает надежду, что получившаяся шкала действительно простирается от 0 до 10. Однако автором обнаружен ресурс, обладающий максимальным на данный момент индексом цитирования: тИЦ (counter.rambler.ru)=237000, натуральный логарифм от десятой части тИЦ которого равен 10,07323. Это свидетельствует о том, что ссылочная масса всех ресурсов растёт, а, следовательно, вместе с ней и растут значения тИЦ. Поэтому необходима каким-либо образом заданная нормировка, позволяющая постоянно отслеживать динамически повышающийся тИЦ максимально весомого ресурса.

Следует отметить, что диапазон в 10 баллов, аналогичный Google PageRank, мал, чтобы различать близкие по тИЦ ресурсы, например тИЦ (www.rambler.ru)=43000 и тИЦ (www.google.ru)=52000. Поэтому предлагается сделать диапазон шкалы {0..100}, путём домножения отношения натуральных логарифмов от десятой части тИЦ искомого и тИЦ максимальн весомого ресурсов на 100. Таким образом, предлагается ввести в оборот логарифмический тематический индекс цитирования (аббревиатуры: лИЦ, LCY), равный:

Определение логарифмического тИЦ.

Из формулы следует, что лИЦ (counter.rambler.ru)=100. В отношении сайтов, лишённых или не имеющих тематического индекса цитирования (<10), рекомендуется, чтобы функция LCY возвращала величину -1.

Автор надеется, что формула является объективной и будет востребована.

Примеры использования LCY: определение индексов цитирования ресурсов по запросу и в виде графических информеров.

После перехода всех индексов цитирования к балльным шкалам возможен объективный подход и к определению среднего индекса цитирования как функции от имеющихся.


  1. тИЦ всех упомянутых ресурсов даны по состоянию на 2008.03.21
 

© 2007, Сергей Холод.
Разрешено копирование материалов статьи с обязательным указанием авторства и линк-ссылки на оригинал.
Поставить закладку на инструмент

Новости

Карта сайта