sab123: (face)
[personal profile] sab123
Увидел в http://freedom-of-sea.livejournal.com/278381.html разбиение зарплат (кстати, не доходов!) в России по децилям. Но для децилей указаны не границы, а почему-то средние значения в них (кстати, непонятно, действительно средние, или все же медианы).

Та же фигня имеется с американскими данными: они норовят скажем делить на квинтили и для каждого квинтиля показывать медиану. Вместо границ. То есть, конечно, медиана - тоже граница, но посередине участка, и вместо 20-40-60-80% выходит 10-30-50-70-90%. Но зачем выдумывать такие корявые выдумки и все запутывать? Оттуда же, видимо, растет и когда-то обсуждавшийся с [livejournal.com profile] spamsink вопрос о разбросе данных по верхнему одному проценту. Похоже, что некоторые данные - граница 1%, а некоторые - медиана, то есть граница 0.5%.

Из объяснений мне приходит в голову только увеличенная драматичность. Разница между 90% и 10% выйдет больше, чем между 80% и 20%. А всякие новостные конторы любят драматику.

Date: 2015-08-12 11:03 pm (UTC)
From: [identity profile] spamsink.livejournal.com
Объяснение простое: логично, что если делим на квинтили, то нетривиальных значений должно быть 5, а не 4, раз при отсутствии какого бы то ни было деления мы таки имеем одно нетривиальное значение - медиану, а не только две границы - 0 и "бесконечность" - самый большой доход у отдельного человека в стране.

Date: 2015-08-12 11:30 pm (UTC)
From: [identity profile] sab123.livejournal.com
Не, если делим на участки, то интересны именно границы. Кстати, да, и максимум и минимум тоже. Но если делить по центрам квинтилей, то почему тогда нельзя написать прямыми и понятными словами, что это 10-30-50-70-90, а нужно непременно выдумывать запутанные формулировки?

Date: 2015-08-12 11:48 pm (UTC)
From: [identity profile] spamsink.livejournal.com
Минимум неинтересен, это всегда 0. Максимум - тоже: он зависит от того, было ли в этом году у кого-нибудь из миллиардеров событие, вызывающее крупный налогооблагаемый доход, или нет, а это дело случайное.

Date: 2015-08-13 04:43 am (UTC)
From: [identity profile] kcmamu.livejournal.com
Действительно средние. Сложи и подели на 10 -- получится общее среднее 33800.03, что сходится с написанным у них слева.

Date: 2015-08-13 05:00 am (UTC)
From: [identity profile] sab123.livejournal.com
Тогда получается и вовсе мешанина. Оно может как-то полезно, чтобы составить представление о распределении в крайних группах. Но в-остальном только запутывает.

June 2025

S M T W T F S
1 2 3 4 567
8 9101112 1314
15 16 171819 2021
22 232425262728
2930     

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jun. 24th, 2025 01:04 pm
Powered by Dreamwidth Studios