n-1

Feb. 21st, 2021 02:11 am
sab123: (Default)
[personal profile] sab123
В статистике используется операция взятия среднеквадратичного отклонения, где сумма квадратов отклонений делится не на n, а на (n-1). Почему? Оно, как оказывается, происходит из двух причин.

Первая причина - то, что это среднеквадратичное интересно статистикам не само по себе, а как промежуточная операция. Статистика любит изучать случайную выборку n предметов из большего количества имеющихся N предметов, с конечной целью оценки статистических свойств всего полного набора из N предметов. Для чего оценка имеющейся выборки n предметов является промежуточной операцией.

Вторая причина - то, что выборка n из N предметов делается без замещения, в ней не может такого случиться, что какой-то предмет поучаствует более одного раза. И вот этот факт отсутствия замещения сдвигает соотношение свойств полного набора и выборки ровно так, что в оценке выборки надо делить сумму квадратов отклонений не на n, а на (n-1), чтобы ее использовать в дальнейших вычислениях. Если делать выборку с замещением, то вместо того используется n.

Есть проще объяснение

Date: 2021-02-21 09:37 pm (UTC)
sobriquet9: (Default)
From: [personal profile] sobriquet9
Когда мы считаем отклонение по выборке, мы меряем отклонение от среднего по выборке, а не от среднего по популяции. Ведь среднего по популяции мы не знаем, приходится использовать то, что есть.

Если увеличивать размер выборки, то среднее по выборке сойдётся к среднему по популяции, но это в пределе. А пока выборка меньше, её среднее смещено. Причём смещено в ту сторону, где оказались наши наблюдения. Отсюда и выходит, что отклонение по отношению к среднему по выборке меньше.

Re: Есть проще объяснение

Date: 2021-03-01 02:31 pm (UTC)
sobriquet9: (Default)
From: [personal profile] sobriquet9
Повторно выбранное наблюдение будет участвовать не только в среднем по выборке, но и в среднеквадратичном отклонении. Причём в среднеквадратичном отклонении оно будет участвовать в квадрате.

Re: Есть проще объяснение

Date: 2021-03-01 06:48 pm (UTC)
sobriquet9: (Default)
From: [personal profile] sobriquet9
Вот именно это ^2 и есть квадрат в слове среднеквадратическое. Потом ещё корень из этой суммы.

April 2026

S M T W T F S
   1234
56789 10 11
12 1314151617 18
19202122232425
2627282930  

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Apr. 20th, 2026 05:26 pm
Powered by Dreamwidth Studios