sab123: (Default)
https://eff-feed.dreamwidth.org/1241573.html

Некая баба оставила отрицательный отзыв про какого-то адвоката на Елпе. Адвокат подал на нее в суд за клевету. Баба не почесалась ответить суду, против нее было венесено решение за отсутствием ответчика, и ей и Елпу было вменено убрать ее отзыв. Теперь ЕФФ и Елп говорят, что как же так, у Елпа даже же не было возможности поверить фактическую сторону жалобы, и требуют отменить решение (но первый аппеляционный суд решил против них). А это, изначальный суд против той бабы - это типа не возможность была? И с каких вообще хренов Елпу иметь какое-то самостоятельное мнение, кроме трансляции мнения комментаторов?

Я лично, кстати, в Елп совершенно не верю. На редкость мудацкий сайт, населенный мудаками.
sab123: (Default)
Вот пример того, какие циферки мне хотелось бы посчитать для каждого фонда. Это посчитано для S&P, про который я наковырял тут: http://pages.stern.nyu.edu/~adamodar/New_Home_Page/datafile/histretSP.html

Для более полноценных цифер хотелось бы, конечно, повычитать инфляцию. Посмотрим, может я ее еще наковыряю где-то. Но для базовых сравнений, наверное, и так годится.

Запуск программы с опцией -a - это пример усреднения за последние N лет, о котором я говорил в предыдущем посте.

Опция -g - это упрощенная модель типа 401K, где каждый год добавляется фиксированное количество денег. То что она выдает - это проценты роста от всей суммы денег. Поскольку вкладываемые деньги распределены по времени, я пока не догадался как эту цифру можно аннуализовать (привести к средне-годовой).

Из других умных наблюдений над результатами: похоже, что исторически существует примерно 30-летний цикл, и если он в этот раз повторится, то мы находимся примерно на пороге его перехода из отрицательной фазы в положительную.

Программа )

Циферки )
sab123: (Default)
Узнал про сайт, в который тычешь C++ный код, а он показывает, во что ассмеблерное оно компилируется, и типа можно не возиться вручную с objdump:

https://godbolt.org/
sab123: (Default)
В нынешних новостях (образец, то же самое перепечатано в разных местах):

http://www.foxbusiness.com/markets/2017/01/13/millennials-are-falling-behind-their-boomer-parents.html

Типа, нынчешняя молодежь зарабатывает гораздо меньше, чем послевоенное поколение в том же возрасте.

Но при этом журналюги совершенно не задумываются над своими же цитатами:

<<
Andrea Ledesma, 28, says her parents owned a house and were raising kids by her age.

Not so for her. Ledesma graduated from college four years ago. After moving through a series of jobs, she now earns $18,000 making pizza at Classic Slice in Milwaukee, shares a two-bedroom apartment with her boyfriend and has $33,000 in student debt.
>>

Именно! Кто шляется по колледжам, у того во время учебы доход будет ниже, чем у того кто работает, а долг больше. Кто шляется по бесполезным колледжам, после которых получается только работать в пиццерии, то у того доход будет и после окончания ниже и чем у шляющихся по полезным колледжам, и чем у тех, кто эти 4 года делали карьеру в пиццерии.

Мораль: весь вред от колледжей. Ну, и от дураков в них.
sab123: (face)
https://sab123.dreamwidth.org/

Но на практике еще посмотрим, сколько времени у меня займет окончательно переползти. Надо еще настроить чтение оттуда. Умеет ли оно аггрегировать жж в дриме ?
sab123: (face)
Вынесу из комментов, поскольку это красивый пример неправильности "очевидных" предположений о неправильности оценок "простыми людьми", практически наравне с примером про "75% водителей считают, что они водят лучше среднего".

http://notabler.livejournal.com/607933.html?thread=15011005#t15011005

<<
Средний француз оценивает долю мусульман в стране в 31%, практически треть. В соответствии с исследованием Pew Research, мусульманское население Франции в 2010 составляло 7,5%, или одну тринадцатую часть.
>>

Тут подменяется датировка информации, а кроме того игнорируется эффект на наблюдателя:

Видимо люди в больших городах (малом числе очень больших городов) отвечали по тому, что видят вокруг себя, люди в маленьких городах отвечали про то, что видят в телевизоре про большие города (и также во время своих визитов в большие города), поскольку логично оценивают, что в больших городах живет больше народу и соответственно у них вес больше. Ну и конечно то, что мусульмане не сидят тихо, а раздувают срач в телевизоре, тоже добавляет к оценке. Из-за чего промахиваются в оценке.

Если условно говоря какой-нибудь француз видит, что в условно говоря каком-нибудь Париже и Марселе треть населения - мусульмане и проецирует это состояние дел на 90% страны (возможно, говоря себе "но я к счастью живу в редком анклаве, до которого это еще не дошло"), то получившаяся оценка будет все еще примерно третью. А если на самом деле условные Париж с Марселем содержат только 10% населения условной Франции и все мусульмане собраны в них, то настоящая цифра будет в 10 раз меньше. То есть получаем отличие оценки от реальности в 10 раз, на 900%. А исследование нашло только в 4 раза. Так что выходит, что оценка из исследования - на самом деле НЕДОоценка количества мусульман, а не переоценка.

Интересен и следующий абзац:

<<
Кроме того, французы сильнее всего преувеличивают перспективу роста мусульманского населения к 2020 году. Среднее предсказание — мусульмане будут составлять 40% населения Франции через 4 года, что в 5 раз больше, чем прогноз Pew Research (8,3%).
>>

Тут сравнение с реальностью подменяется сравнением с другим прогнозом. Где видно, что идею экспоненциального роста эксперты из Pew Research понимают хуже, чем простые люди с улицы. Кстати, Pew Research сделало свой прогноз 6 лет назад, наверное его уже можно сравнить с наблюдаемой реальностью и узнать точность?
sab123: (face)
Как интересно с ним оказалось, со всеми этими криками про "fake news" и "пиццагейт". Оказывается, подо всем этим есть реальные основания. В выложенной на Викиликах переписке Подесты нашлись довольно загадочные фразы "возьмем пиццу на час". Фразы, заметим, действительно загадочные и похожие на код (хотя возможно и совершенно невинные). Про которые кто-то где-то в интернетах натеоретизировал, что это может быть кодом для вызова малолетних проституток. Почему именно проституток и почему именно малолетних - непонятно, но возможно для этого в той переписке были еще какие-то поводы.

Теперь самое интересное: уже год как социалистическая пресса нам талдычит как минимум точно такие же, а в большинстве своем гораздо более выдуманные "новости" про Трампа. Причем не в ключе "возможно что", а в ключе "именно так и есть". И чего-то никакого возмущения среди их читателей не заметно, наоборот читатели в панике ищут подштанники.

Пример обгаженных подштанников:
http://pharyngula.livejournal.com/6318286.html
sab123: (face)
http://babkin-cep.blogspot.com/2016/06/adaboost-4-or-square-root-returns.html
http://babkin-cep.blogspot.com/2016/06/adaboost-5-square-root-and-confidence.html

Более внятно оознал, зачем и почему там возникают квадратные корни, как их можно употреблять в альтернативном варианте, и что там собственно минимизируется.
sab123: (face)
Я нынче прочухал, как АдаБуст выглядит с байесианской точки зрения:

http://babkin-cep.blogspot.com/2016/05/adaboost-3-and-bayesian-logic.html

Заодно и вроде прочухал принцип того, как работает бустинг вообще, изображенный на пальцах. Вот он, оттуда:

The premise of boosting is that we're able to find a number of methods (what they call "hypotheses" in AdaBoost) to predict the correct outcomes of the training cases, each method correctly predicting more than 50% of the training cases. Then if we collect a large-ish number of these methods, we can predict the correct outcomes of all the training cases simply by averaging the predictions of these methods. And the other cases will follow the training cases (unless an overfitting happens). Since more than 50% of the cases are correctly predicted by each method, after the averaging more than 50% of the votes for each training case will be correct, and thus the result will be correct too. Of course this depends on the correct predictions being distributed pretty evenly among the cases. If we have a thousand methods that predict correctly the same cases and incorrectly the other cases, obviously after averaging these other cases will still be predicted incorrectly. So the selection of methods must somehow shuffle the preference for the cases, so that the next picked method will predict well the cases that have been predicted poorly by the previous picked methods. That's it, that's the whole basic idea.
sab123: (face)
Догадался про связь между финальной формулой и весами, используемыми при ее получении:

http://babkin-cep.blogspot.com/2016/05/adaboost-in-simpler-formulas-2.html
sab123: (face)
Прочитал http://lev.livejournal.com/1188220.html про статую "Писающий Ленин" и теперь где вижу статуи Ленина, непременно представляю, как их можно усовершенствовать. Позы в них в-основном уже подходящие.
sab123: (face)
http://www.foxnews.com/politics/2016/05/15/nevada-democratic-convention-becomes-unruly-and-unpredictable-amid-rules-disputes-over-delegates.html

Эпично: стронники Сэндерса устроили драку на собрании демпартии в Неваде. В частности из-за того, что некоторые их них не удосужились зарегистрироваться как сторонники демократической партии и их не допустили к голосованию!
sab123: (face)
Тут вот http://ahilaes.livejournal.com/140029.html обнаружился профиль конца полета. И он своим видом напоминает историю с катастрофы в Казани (10x [livejournal.com profile] dvv): http://www.spb.kp.ru/f/13/attached_file/37/44/3344437.pdf "Окончательный отчет Boeing 737-500 (53А) VQ-BBN"

Тогда неопытный пилот при уходе на второй круг неправильно оценил угол подъема самолета и сначала задрал его слишком большим, а потом прочухал, стал убавлять и не заметил как вошел в пикирование вместо выравнивания. В расследовании казанской аварии приводилась модель о том, как этот угол субективно ощущается не соответствующим реальности, и кто не практиковался смотреть на приборы, тот делает эту типичную ошибку. Они проверили десяток пилотов на тренажере и почти все из них сделали ту же ошибку.

Тут, конечно, непонятно почему один раз он ушел на второй круг нормально, а во второй раз - уже нет. Но фиг знает, может в первый раз посадку делал один пилот, а во второй раз дал другому порулить. В конце концов, между этими попытками прошло два часа. Или может в первый раз видимость была лучше, ну или просто повезло.

AdaBoost

Mar. 18th, 2016 02:06 pm
sab123: (face)
Читаю книжки про machine learning (как это по-русски?), нынче конкретно книжку про бустинг. Следить за изложением у меня получилось только после переписывания для себя главного алгоритма в более человеческой форме:

http://babkin-cep.blogspot.com/2016/03/adaboost-in-simpler-formulas.html
sab123: (face)
инициатива референдума против трансгендерной туалетной е.анутости

https://justwantprivacy.org/

June 2017

S M T W T F S
    1 23
4567 89 10
11 12 1314151617
1819 2021222324
252627282930 

Syndicate

RSS Atom

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jun. 27th, 2017 01:53 pm
Powered by Dreamwidth Studios