Некоторые обвиняют меня в околонаучности, поэтому продолжу уже чисто математические выкладки. Может, специалистам - статистикам они покажутся банальными, но где их найти, чтобы проконсультироваться? Опять проблема сложности поиска информации и компетентных специалистов.
Кто подскажет поисковый запрос, чтобы их найти?
Итак, вернемся к нашим лемингам :)
Представим, что какой-то параметр какой-то системы имеет гиперболическое распределение зависимости от номера (рейтинга) Y=1/X .
Рассмотрим статистическую выборку первых десяти элементов:
1 |
1 |
0,341417152 |
0,341417152 |
2 |
0,5 |
0,170708576 |
0,512125728 |
3 |
0,333333333 |
0,113805717 |
0,625931446 |
4 |
0,25 |
0,085354275 |
0,711285721 |
5 |
0,2 |
0,06828342 |
0,779569141 |
6 |
0,166666667 |
0,05690285 |
0,836471991 |
7 |
0,142857143 |
0,048773871 |
0,885245862 |
8 |
0,125 |
0,042677138 |
0,927923 |
9 |
0,111111111 |
0,037935233 |
0,965858233 |
10 |
0,1 |
0,03414171 |
1 |
2,928968254 |
1 |
Где в первой колонке - рейтинг элемента, во второй - его значение, в третьей - значение, приведенное к сумме всех значений, и в четвертой - то-же накопительным итогом ( Распределение Парето)
Итак ,видим, что для рейтинга из 10 элементов сумма ряда = 2,93
срез по 20% равняется 0,512
а коэффициент Парето равен примерно 0,33
т.е первые 3 элемента дают 2/3 результата.
Проделав аналогичные вычисления для 100,1000, 10000,32768,65535 участников рейтинга, получим следующие результаты:
10 |
0,625931446 |
0,33 |
2,928968254 |
100 |
0,693556421 |
0,26 |
5,187377518 |
1000 |
0,785258498 |
0,209 |
7,485470861 |
10000 |
0,835583869 |
0,178 |
9,787606036 |
32768 |
0,853357798 |
0,164520264 |
10,97443863 |
65535 |
0,869034514 |
0,158 |
11,66756292 |
Где в первой колонке- число элементов в рейтинге, во второй - срез по уровню 20%, в третьей -коэффициент Парето, в четвертой - сумма ряда.
Кто бы сумел вычислить эти значения для 100000, 1000000, 1000000000 членов?
Я бы даже согласился заплатить за решение некоторую сумму денег , но, к сожалению моя "система стимулирования конструктивных действий " пока только в стадии теоретической разработки.
Но и так результаты весьма поучительные.
Какие же выводы можно сделать из этого анализа абсолютно абстрактной системы?
Во-первых, правило Парето обьективно существует при описании любых неравномерно распределенных параметров.
Во-вторых, при гиперболической форме распределения правило 80на20 справедливо только при количестве членов в районе 1-2 тыс.
При увеличении числа членов коэффициент Парето уменьшается, а неравномерность распределения увеличивается! Ведь как показано , объект из группы лидеров приносит результата больше, чем из группы аутсайдеров в (1-a)2/a2 раз (где а - коэффициент Парето). Для 80/20 это 16, а для 90/10 - 81 раз!
Вот вам и неравномерное распределение доходов, вот вам и миллионы лемингов!
Правда, распределение параметра совсем необязательно будет иметь гиперболический характер, это просто наиболее часто встречающаяся форма, но принцип Парето справедлив для любых распределений, даже равномерного - при этом коэффициент Парето равен 0,5 :)
Из всего этого можно сделать много интересных выводов по результатам рейтингов, оценке разных статистических данных и пр.
Например, из этого следует, что борьба многочисленных комиссий ООН с социальным неравенством ( в том числе цифровым, под что не один миллиард баксов был успешно распилен) напоминает прошлую борьбу советского народа за то, чтобы к концу пятилетки довести число пи до 4 или в крайнем случае 3,5 , или как доказывал нам майор на военной кафедре, в военное время значение синуса X может достигать 2х и даже 4х!
Очень интересные результаты я получил при анализе статистики liveinternet.ru, но нет времени это все изложить и опубликовать .
Кстати этот закон позволил мне обнаружить обман Google в показе количества найденных результатов (см.статью Google – главный накрутчик планеты) Правда, это все давно неактуально, формулы и коэффициенты Гугля меняются чуть ли не каждый день, но знание общих законов позволяет мне в любой момент найти накрутку, если кому интересно, на спор (или на бартер на какую-то взаимоуслугу :)) всегда могу доказать и сейчас.
Еще один вывод - чем больше будет расти интернет, тем больше при существующих в нем способах и методах работы с информацией и способах получения и распределения доходов будет в нем информационного мусора, в котором найти действительно нужное станет все труднее и труднее. Интернет избранных и лучших плавно переходит в интернет леммингов. Конечно, лемминги тоже имеют право собираться в стаи типа MySpase и идти куда им хочется, но дайте первому 1% найти друг друга и идти в другую сторону!