Tuesday, April 29, 2014

Виміри і перевиміри ВВП

Цього місяця натрапив аж на дві новини подібного змісту: "статистичні відомства зробили перерахунок, і виявилось, що не так у нас і погано було з ВВП". Зокрема, днями британці довідались про реальні (незначні) масштаби рецесії 1990 року:


А ще до цього, на початку квітня, Нігерія вразила всіх своїм новим перерахованим ВВП, який в одну мить виріс на 89%. У типовий для африканської статистики спосіб, як показує графіка від The Economist:


Той же Economist пояснює, як оновлення "базового року" та уточнення відносної ваги різних секторів економіки дає такі результати. Це тільки один з можливих варіантів "раптового" збільшення чи зменшення ВВП. З огляду на важливість ВВП та інших аналогічних індикаторів для політики, навіть порівняно невеликі неточності у вимірюванні можуть призвести до глобальних наслідків. Був випадок, коли британський уряд затято боровся з рецесією, взяв кредит МВФ, почав скорочувати державні витрати і в підсумку програв вибори - консервативній партії під проводом Маргарет Тетчер. А потім виявилось, що ніякої рецесії не було.

Принаймні, так про це розповідає Діана Койл у книжці GDP: A Brief but Affectionate History. Там є іще декілька курйозних історій, а також розбір пов’язаних статистичних труднощів і огляд еволюції поняття ВВП у ХХ столітті. Ну, що основоположником ВВП був випускник Харківського університету Саймон Кузнець, ви і так знаєте, а вся інша еволюція не особливо цікава.

Зате цікаво вкотре пересвідчитись у важливості якісної статистики. Я уявлення не маю, наскільки все добре з якістю у нашого Держстату та інших відомств. Маю надію, що все гаразд, бо здійснити незалежний "громадський" перерахунок ВВП практично нереально. Можна хіба що перевірити, чи опубліковані цифри не було банально придумано (тобто сфальсифіковано) - на цьому, наприклад, зловили греків, коли почалась криза (був чималий скандал).

Тому поки що лишається тільки сподіватись на добросовісність державних збирачів даних та заохочувати їх ділитись цими даними у адекватних форматах (цим планує займатись проект data.gov.ua).

І ледь не забув головний висновок - навіть там, де йдеться про нібито точні цифри, усе може бути досить відносно і ненадійно, а особливо в макроекономіці. В майбутньому варто мати на увазі.

Friday, April 4, 2014

Кандидати в цифрах

Реєстрація кандидатів у президенти закінчилась, тож тепер можна підбити перші підсумки. Після трагічної відмови Дарту Вейдеру можна вже точно сказати, що в перегони включається 23 кандидати. На них і зосередимось.

Гендерний поділ - типовий для нашої політики: 3 жінки, 20 чоловіків.

Що стосується віку, то наймолодшою виявилась Наталя Королевська (38), найстаршим - ветеран президентських виборів Петро Симоненко (61). Середній вік становить 48.8 років, медіанний - 48. Саме стільки, до речі, Порошенку.

Гістограма виходить така:


Усі кандидати, окрім Вадима Рабіновича, стверджують, що мають вищу освіту.

Переважна більшість проживає в Києві - 16 із 23 кандидатів. Ще двоє мешкають у Харкові, решта - по містах і селах Східної України (наприклад, Ярош у Дніпродзержинську, а Царьов у селі Старі Кодаки).

Серед професій найпоширенішою виявилась, із невеликим відривом, робота народного депутата (7 із 23). Ще 6 людей зараз безробітні, решта - керують партіями чи компаніями, працюють лікарями, адвокатами тощо.

10 із 23 кандидатів не входять до жодної партії. І аж четверо входить до Партії регіонів. Це єдина партія, яка дала більше однієї людини на ці виборчі перегони. Щоправда, за документами ЦВК, усі регіонали є самовисуванцями. Лише 7 із 23 кандидатів офіційно висунуті якоюсь партією.

Передвиборні програми у самих лише цифрах не особливо поаналізуєш, а контентом я займусь пізніше. Але один показник вирішив додати - кількість слів у програмі кандидата. Виявилось, не всі політики однаково багатослівні.

Кузьміну вистачило 397 слів (це мінімум), а Рабіновіч розійшовся на всі 1737 (максимум). Середнє значення - 1113, медіана - 1326.

Найцікавіше, звісно, гроші. Усі кандидати, згідно з законом, подали декларації, і при цьому майже всі не посоромились собі вписати хоч якісь кількасот тисяч гривень доходу. Винятки - Зорян Шкіряк (повний нуль) та Дмитро Ярош (803 гривні, зароблені сім’єю за цілий 2013 рік).

Щоб показати ці доходи на графіку, довелось відокремити від решти кандидатів чотирьох мультимільйонерів - Тігіпка, Добкіна, Бойка, Порошенка та Гриненка.

Тут навіть Рабінович і Тягнибок здаються бідними. А на наступному графіку "бідними" будуть уже Порошенко і Бойко:

Дивовижно, але Тігіпко далеко перегнав мільярдера Порошенка. У бунтівного регіонала - 272 мільйони гривень, зароблених за минулий рік. Найменші доходи, як уже сказано, у Шкіряка та Яроша - 0 та 803 відповідно. Третій найбідніший, Саранов, має вже 139 тисяч гривень

У середньому кандидати в президенти заробляли майже 18 мільйонів за цей рік, але в цьому випадку більш показовою є медіанне значення - 1 мільйон 322 тисячі гривень. Грубо кажучи, приблизно половину застави в ЦВК "середньостатистичний" кандидат може подати із власного річного доходу.

Із 23 кандидатів лише 9 балотувались у народні депутати 2012 року. Оскільки тоді вони теж подавали в ЦВК свої декларації (за 2011 рік), можна порівняти, як змінились їхні доходи за цей час:

Тут ще й довелось "підрізати" Тігіпка, бо насправді його дохід виріс на цілих 245 мільйонів. Отак пощастило людині з "дивідендами і процентами" минулого року (якщо вірити джерелу дохода, вказаному в декларації). Як бачимо, Порошенко зараз куди менш "у шоколаді", ніж у 2011 році, а ось Гриценко з родиною почали жити суттєво краще - дохід зріс майже на мільйон гривень.

Поки що на цьому все. Я точно ще щось писатиму щось про передвиборні програми (для "Владометра"), і спробую теж якісь кількісні методи застосувати, якщо вийде.

Тим часом основний цифровий показник, що цікавить країну - рейтинги. Які поки що виглядають десь так:


Повну табличку з усіма цими даними про кандидатів можна подивитись у гуглдоках.

Thursday, April 3, 2014

Lies, damned lies, and gun control

Побачив у фейсбуці таку ось картинку:


Типовий приклад "Lies, damned lies, and statistics": якщо бачите графік, де тренд триває лише чотири роки, остання дата - 2003 рік, а посилання на джерело немає, обов'язково шукайте нові і повні дані на сайті Office of National Statistics.

Там, зокрема, є розділ про злочинність, де є пункт 02 - Appendix Tables - Focus on Violent Crime and Sexual Offences, тобто маємо ексель-таблицю з даними за 2003-2013 роки. Лист "Table 3.02" містить потрібну нам інформацію. Вуаля, можемо продовжити графік злочинів із вогнепальною зброєю на 2003-2013 роки:

Тобто насправді після короткочасного підвищення, злочинність різко пішла на спад. Те саме стосується статистики вбивств з використанням вогнепальної зброї (той самий файл, таблиця 2.04):



Тренд менш очевидний, але тут менші значення і відповідно більша варіативність.


Між іншим, населення Британії за цей час зросло з 59 до 63 мільйонів, переважно за рахунок мігрантів (яких прийнято звинувачувати в тому, що вони "несуть злочинність").

Я взагалі мало цікавився цим питанням і ті дані, які бачив щодо вогнепальної зброї і пов'язаної злочинності, часом суперечливі. Тому не робитиму далекосяжних висновків, але у цьому конкретному випадку маємо явну маніпуляцію з боку адептів зброї. Перевіряйте дані!