Я не пропустил, просто никуя не понял. Есть рост, есть сноска. Это как в том исследовании про рост ММ для тех кто использовал деконд (перерыв от тренинга) посередине или нет. Замеры по ММ брались на моментах времени которые были сноской вниз, а между ними шла дуга красивая графиковая, которая была вымышленной т.к. знать они не могли что между замерами делалось. Вот и здесь мне подумалось что так же.
Совершенно неверная аналогия.
Для измерения распределения по росту меряется рост очень большого количества людей, потом строится график /\N/(N/\h), например N = 100 миллионов, а рост 170-171 имеет 10 тысяч человек, и считается функция распределения. Естественно для всех интервалов, а не только вблизи тех точек, которые на графике.
По росту получилось нормальное или гауссово распределение. Оно характеризуется среднеквадратичным отклонением. Тут оно, судя по графику, 7.6 см получилось. Теперь можно, например, посчитать, что 95% мужчин имеют рост от 163 до 194 см. Если ты ниже 163 или выше 194 - ты пятипроцентник, можешь гордиться.
Можно посчитать, и сколько мужчин имеет рост 165-175 и 175-185. Соответственно 29 и 48%.
Но т.к. в анализе количества сообщений делили на число людей такого роста, то не влияет, какой абсолютный процент людей по росту, если их достаточно много для статистической достоверности.
Сообщение изменено: aid (11 декабря 2019 - 08:29)