Черная речка, черный пистолет

Если приходится лет 10 подряд примерно каждый день пользоваться нашей российской экономической статистикой, приходит в конце концов какое-то смирение. Но поначалу …

Когда впервые после нескольких часов безуспешных мучений осознаешь, что в отчетах об исполнении бюджета где-нибудь на 2000-ой строчке может быть одна или две точки вместо запятых в разделителе дробной части, хотя везде запятые — и именно эта кочующая хаотично ежемесячная изюминка не дает тебе правильно ссылаться туда формулами — ярость. Когда в денежной статистике Банка России в центре числа может стоять не пробел, а другой невидимый символ — недоумение. Когда Росстат резко меняет методологию расчета ВВП на СНС-2008 и временные ряды в прошлое собирается пересчитать только через два года после такого праздника — действительно, дефляторы за 2014 год никому же не интересны — крик. Когда таблицы Затраты-выпуск опаздывают ровно на 10 лет — боль. Или до ЕМИСС, когда смотришь на фильтры по товарам в ЦБСД — а они все уровни агрегирования в одном списке из нескольких тысяч строчек — а потом когда накликал за полчаса, пожинай Error 43 — смех. Ну а если смог таки прорваться к заветным цифрам, смотришь — ну не может быть такого, все совсем не так, как по идее должно быть в реальном мире и экономике — зеркало кривое — застрелись, все лети к черту, кому это надо! Отрицание, гнев, страх, безумие. А потом принятие — и все стихает …

Остается одно чистое удовольствие:

  • Могу поспорить, никто и не замечает, какой значок Росстат использует для своих еженедельных мониторингов:
  • Без обид, но конкурс частушек о Всероссийской сельскохозяйственной переписи 2016 — по масштабам похоже больше, чем сама перепись. Видео-конкурс! Но зачем?

http://www.vshp2016.ru/contest/kuplet/video/

  • В прогнозах МЭР в табличках иногда остаются артефакты в виде белых цифр на белом фоне и сопутствующие оценочные суждения. Спасибо, именно ради них каждый год жду его с нетерпением!)
  • У нас столько государственных организаций и сайтов про налоги и бюджет, что на них можно прям прокрастинировать качественно. Вот какая-то просто утопическая тема, где можно поменять затраты на разные цели в регионе и чуть ли в планах прямо не проголосовать. Двигать бегунки и смотреть, сколько там фельдшерски-акушерских пунктов будет недозакуплено. Симулятор губернатора регионального бога: http://citizens-budget.ru/
  • Росстат всегда на передовой словообразования:

Ни за что не догадаетесь, как в Карачаево-Черкессии называется.

http://www.gks.ru/wps/wcm/connect/rosstat_main/rosstat/resources/f8ddcf004cf3a9688c0cdd4fc772e0bb/ad-19ea.pdf

Это такие совсем локальные хохмы, и их конечно вагоны. Но, если серьезно, за последний месяц я имел три  контакта с нашими экономическими госорганами — и они были такими профессиональными и мощными, что впору волноваться. Банк России ответил письмом и признал, что на одной из страниц сайта перепутаны строчки цифр, и исправил все за ПОЛДНЯ (это очень быстро, если что). Женщина из Росстата вместе со мной ПОЛТОРА ЧАСА разбиралась по телефону, как логически совместить цифры по оптовой торговле в регулярном сборнике и сводной странице с рядами — ничего не сошлось, но уровень неравнодушия — 95%.  Не иначе, как что-то случилось…

Пол, возраст, скат

Когда долго и упорно решаешь какую-то задачу, после получения результата полезно забыть про ход решения, посмотреть на ответ и понять, почему он был очевиден с самого начала. То же самое в прогнозировании — берешь старый прогноз и пытаешься понять, почему ты просто обязан был выбрать предпосылки, которые не выбрал.

Пришло время всем нам признать, что чтобы спрогнозировать платежный баланс РФ до 2016 года, нужно было просто посмотреть на половозрастную пирамиду 1998 года.

Если что, там дальше вот так получается (пирамида 2015 года -> платежный баланс до 2043):

Можно сделать и следующий шаг, но это уже типа rocket science, big data, F-DSGE, докторская*. Это пирамида с 1960 по 2015 (правда до 1990 — как-то очень уж скачет — странные цифры взял):

output_4otbus

А это какой-то скат:

У меня все.

* колбаса, само собой.

Великое путешествие товарища Деревянного

Моему восхищению нет предела — такого безумного скитальца надо еще поискать — пешком из Африки в Россию за 18 лет. Наш общий знакомый решил покинуть Нигерию в 1998 году, когда почувствовал, что больше не контролирует себя — по собственному признанию, «в смятении, деленный на 1000 маленьких кусочков». В августе 1998 года, пересекая границу Нигерии и Чада, услышал про дефолт в России, понял, что во что бы то ни стало должен вернуться домой, где не бывал с момента крушения Союза. И пошел уверенной походкой на север.

На протяжении следующих 8 лет скитался между Египтом, Саудовской Аравией, Иорданией и Израилем — там набрался сил на хорошем питании и немного потерял смысл существования. В середине 2007 года даже пытался вплавь по Красному морю добраться до Сомали, чтобы стать пиратом, о чем мечтал с детства. В середине моря его застала новость о том, что в мире начинается экономический кризис. «Пора домой!» — во второй раз ясно понял наш герой — «там я нужнее, чем в Сомали». И вылез из моря. К апрелю 2009 года он был уже на ирано-иракской границе, но перейти ее не смог. Тем временем в России кризис уже начал затухать.

С 2009 по 2013 год ошивался в основном в Ираке, торговал на багдадском рынке тем, что найдет или украдет. Нравилось но не особо. Там же на рынке его и настигла треаожная новость: впереди сланцевая революция и непонятки с Китаем, а значит цены на нефть вероятно рухнут. «Этого Россия не перенесет» — подумал непутевый торговец — и в третий волшебный раз решительно двинулся на север. На этот раз ничего не могло помешать — пересек Иран, махнул через Каспий, в ноябре, оказавшись в Казахстане, почувствовал запах Родины и дальше, уже не останавливаясь, бежал.

12 декабря 2014 года Рубль Петрович Деревянный пересек границу России и оказался дома. С тех пор в России все хорошо. И пока он здесь, все будет так же хорошо.

Что за хрень я несу? Вот ответ: по широте — курс рубля к доллару, по долготе — курс рубля к евро.

За кадром осталось много прекрасных историй из этих 18 лет. Как, например, опять же вплавь проверял как живется котикам на архипелаге Северная земля. Почувствовал просто, что они в опасности.

Сам того не ведая, наш общий знакомый повторил один из путей расселения человечества из африканской колыбели. Сейчас рубль находится между Салехардом, Сургутом и Новым Уренгоем. Говорят, в его планах все-таки добраться до Северного полюса- но может году к 2020-му.

P.S. Курсы Банка России официальные. Строил на карте вот так. Идея не новая и не моя — раньше был вот здесь отличный онлайн-замес на эту тему от некоего Вениамина Тамбурина, кто бы это ни был.

 

 

Зачем реально нужны серийные номера

Неизгладимое впечатление в университете на меня произвела военная кафедра и особенно военные сборы по ее окончании. У экономфака специальность называлась МПО  — «морально-психологическое обеспечение» — то есть готовили нас на современный аналог замполита, но вынесли из всего обучения мы, в основном, армейский матерный слог, строевую и непобиваемые рекорды по подтягиванию.  На каких-то кафедрах в других университетах, говорят, есть еще более качественные специальности как-то «сотрудник полевого учреждения Банка России». Да, у Банка России похоже есть план и на случай войны — небось, ключевую ставку засекретят и делов там.

Смех смехом, но если реально война, то вот какой реальный мегаполезный вклад может дать экономист — промышленная разведка. Отличнейшая статья «An Empirical Approach to Economic Intelligence in World War II» описывает как в  начале второй мировой союзники оценивали потенциал, реальную загрузку и географию немецкой военной промышленности по маркировке деталей подбитой и захваченной техники — танков, автомобилей, шин, ракет. Это все было очень важно при выборе целей бомбежек, диверсий и вообще понимании сколько, на каком фронте может оказаться чего, куда что перебрасывать для противостояния. Немецкая пропаганда раз в десять завышала свой реальный потенциал — и это играло важную роль в стратегии блицкрига. Особенно круто в статье описан процесс расшифровки этой маркировки. Если честно, то я впечатлен сравнительной точностью результатов (по рассекреченной после войны статистике) в абсолютном и по отношению к данным шпионажа. Вот, это вам не фонтанирующую канализацию в казарме по ночам сдерживать.

А еще мне всегда нравилась военная же история про Вальда и ошибку выжившего в анализе уязвимостей самолетов. Это про то, что истории про дельфинов, толкающих утопающих к берегу, преувеличивают их доброту, так как те, кого они толкали от берега, ничего никому не расскажут.  Самоотбор в выборках — это все время такая заноза и загвоздка, просто ад.

Кривая Филлипса Японии и тихая гавань в России

Классическая мудрость гласит, что если построить на графике уровни безработицы и инфляцию Японии, то получится ее карта.

Smith, G. Japan’s Phillips Curve Looks Like Japan. Gregor Smith. Queen’s Economics Department Working Paper No. 1083, Queen’s University

japan_svod

Я давно заметил, что по российским всяким графикам можно вообще что угодно нагадать, но, в основном, спокойствие и безмятежность:

янв 1999 — янв 2016

butterfly_mod

май 2003 — янв 2016

smoking_mod

Наша кривая Филлипса (янв 1995 — мар 2016), правда, немного выбивается. Ее можно интерпретировать как падающий самолет или блюющего Гомера Симпсона:

falling

Надеюсь, никто не узнает, что именно так я на работе строю прогнозы — они должны дорисовывать картинку. Теория и уравнения — это от лукавого.

P.S. Уильям Филлипс, в честь которого названа многострадальная кривая Филлипса, на самом деле оказался отличным дядькой. Он построил в LSE гидравлический компьютер MONIAC (Monetary National Income Analogue Computer) — модель экономики Великобритании. Там в основном нацсчета, но гидропанк полный. И название — чума.

 

Наша статистика ок

Пришло время тестировать реальность и статистику на закон Бенфорда! В двух словах, числа из реального мира начинаются на 1, не в 11% случаев, а в 30%. На 9 — меньше, чем в 5%. Конечно, это касается только чисел, меняющихся на два-три порядка величины и больше (хорошо удовлетворяет распределение численности населения по городам и странам, размеры файлов и т.д.). Этот малоизвестный и кто-то скажет контринтуитивный факт недавно начали использовать, чтобы находить подозрительную статистику.

В 2001 году Греция вступила в еврозону, скрывая бюджетный дефицит, занижая его раз в 5-6, чтобы удовлетворять Маастрихтским критериям. Году к 2004 это выяснилось, но было поздно. Из-за таких стран как Греция в Европе в 2010-2012 годах был долговой кризис и вообще рецессия в 2012-2013. А потом многие поняли, что можно было посмотреть на их бюджетную статистику — отклонения там от закона Бенфорда были достаточно большие -, чтобы  заметить неладное пораньше — «Fact and Fiction in EU-Governmental Economic Data«. Конечно, это преувеличение, потому что суть скандала была в том, что все главари как бы знали, что греки вообще не алё: «Over the last few months, former European Commission President Romano Prodi, Greek Prime Minister George Papandreou and EU Commissioner for Trade Karel de Gucht have all admitted that Greece was literally «allowed to cheat» on its accounts in order to comply with the Maastricht criteria and therefore join the euro.» Но тем не менее — это не было достоянием общественности.

Российскую статистику частенько ругают. Но я многое проверил (Нацсчета, демографию, цены, торговую, банковскую, бюджеты) — следов подгонки в смысле распределения первой цифры у нас не видно, ни по годам, ни суммарно. Либо все ок, либо подтасовка осуществляется образованными людьми, статистическими педантами и виртуозами).

Вот, например, распределение первой цифры в выборках из некоторых показателей нашей статистики:

benford

Правда, мою любимую статистику по надоям я пока побаиваюсь проверять: http://www.mcx.ru/moloko/

Еще:

  1. Много статей про приложения и обоснование.
  2. Крутая статья крутого математика Теренса Тао про законы Бенфорда, Ципфа и Парето
  3. Популярно про историю вопроса вообще
  4. Древняя Греция за 18 минут от Арзамаса — очень хорошо