Приказ — не умирать: как российские власти манипулируют статистикой смертности в эпоху пандемии
В официальной статистике по коронавирусу то и дело обнаруживаются парадоксальные закономерности: в Пензе на протяжении нескольких месяцев повторялся «День сурка» — с редкими перерывами ежедневно фиксировали лишь одну смерть, а, например, в Петербурге соотношение выздоровевших к больным на три недели застыло ровно на отметке 1 к 2. Математическая вероятность таких аномалий ничтожна мала и свидетельствует о прямых фальсификациях государственной информации.
Как и зачем чиновники манипулируют количеством смертей? Демограф Алексей Ракша, уволенный летом из-за борьбы с фальсификациями данных о летальных исходах, подробно рассказал об этом в лекции на XII Чтениях Адама Смита. Публикуем конспект выступления бывшего советника Росстата о том, как на самом деле ведется учёт погибших от инфекции в России и других странах, почему нельзя верить официальной статистике смертности, как оценить реальный масштаб эпидемии (спойлер: умножать данные правительства на три), как фальсификации угрожают жизням и зачем в отличие от западных государств российские власти занижают статистику.
Наши власти гордятся тем, что у нас одна из самых низких в мире летальностей, что якобы наша медицина справляется, и что все у нас нормально. Сразу скажу, чем отличается летальность от смертности: летальность — это отношение тех, кто умер от данного заболевания, к тем, у кого заболевание выявлено, а смертность — это отношение числа умерших ко всему населению или к населению в данном возрасте. Это — два принципиально разных показателя.
Говорят, что у нас летальность очень низкая. И на первый взгляд это действительно так — если посмотреть на табличку с сайта Worldometer.info, то в списке стран с самой большой смертностью от коронавируса России нет. Россия находится достаточно далеко, в четвертом десятке, и лишь чуть хуже общемирового показателя. У нас смертность от коронавируса — 0,02%, а в мире — 0,015%.
Топ-10 стран по уровню смертности на 02.12.2020. Спустя почти месяц после выступления Алексея Ракши, Россия значительно поднялась в рейтинге / Таблица с сайта Worldometers.info
Почему все так замечательно и как это соотносится с новостями, которые мы видим в интернете: с трупами в подвалах, с отсутствием мест в больницах? Попробую рассказать. Я начал следить за пандемией еще в январе, когда она вспыхнула в Китае. Там опасность была задавлена быстро, и в следующий раз она проявилась уже в конце февраля в Италии.
Тогда, конечно же, отношение к вирусу было другое. Большинство обывателей были «ковид-диссидентами», и даже не всем профессионалам было очевидно, к чему все это приведет.
КОРОНАВИРУС ПРИХОДИТ В ЕВРОПУ
В Росстате я занимался прогнозированием, делал демографические прогнозы. Я заинтересовался пандемией, потому что мне стало очевидно — ситуация может повлиять на общую смертность в стране, а потом и на рождаемость.
Посколько мне нужно было делать прогноз, я стал отслеживать ситуацию: сперва Италию, потом Испанию, а затем и Россию. Достаточно быстро я столкнулся с тем, что данные по странам были разнородными. Их было трудно сравнивать. Россия, например, гордилась маленькой летальностью, но в России и началось всё гораздо позже.
Тем не менее, в глаза сразу бросилась катастрофа в Бергамо. Там к 20 марта возникла ситуация, когда трупы уже не помещались в моргах. Их не успевали сжигать в крематориях. Пришлось вызывать армию, чтобы грузовиками вывезти трупы в соседние провинции и сжечь их там. Это было неслыханно — на тот момент почти никто не понимал, насколько опасен вирус, к чему он может привести. Я, наверное, был первым, кто в публичном пространстве озвучил новость: вирус может в конкретный период времени сделать так, что в России будет умирать в 4–6 раз больше людей, чем обычно. А это уже серьезно, это не какой-нибудь грипп, как ранее обсуждалось.
Если вы помните, к тому моменту Россия взяла курс на обнуление. Нам со всех телеэкранов благостно и оптимистично обещали, что вирус не страшен, что он не опаснее гриппа, что мы все переболеем и что русским можно не бояться. Данные, поступившие из Бергамо, этому противоречили. Сперва мэр Бергамо заявил, что за неделю вместо 100 человек умерло 400, но только у 90 был вирус. Дальше я увидел скриншот некролога, особой странички в итальянских газетах. Она уведомляет о смертях разных людей, чтобы читатели могли посетить похороны. Обычно это была 1 страница, но уже к 20 марта некрологи занимали 4 страницы, а потом все 7.
ЛУЧШИЙ ИНДИКАТОР СМЕРТНОСТИ
Стало очевидно, что официальный подсчет смертей от вируса не отражает действительность. Особенно поначалу с тестами было плохо, их брали далеко не у всех. Сам факт, что в какой-то короткий период времени где-то умерло в 4 раза или в 7 раз больше людей, чем обычно — очевидно, серьезная заявка на внимательное отношение к вирусу. Буквально за апрель среди демографов сложился консенсус о том, что самый лучший индикатор опасности — избыточная смертность.
Эта переменная показывает, на сколько процентов людей умирает больше, чем обычно, в данной стране, провинции, городе. Обычно число умерших от неделе к неделе и от месяца к месяцу меняется очень мало и плавно: увеличивается или уменьшается в пределах 10%. Когда вы видите прирост в несколько раз — это крайне необычная ситуация.
В России мы достаточно долго не имели доступа к данным об избыточной смертности. Во-первых, пандемия пришла в Россию поздно, и в течение апреля, когда был достаточно жесткий локдаун, у нас не было никакой информации. Когда открылся сайт стопкоронавирус.рф, на котором стали появляться официальные ежедневные цифры, я стал замечать, что с этим сайтом что-то не то.
Как происходит подсчет смертности в России? Человек умирает: либо в больнице, либо дома. Дальше его родственник или законный представитель должен прийти в орган ЗАГС и принести туда медицинскую справку о смерти по форме 106/у-08 (Медицинское свидетельство выдается больничным учреждением или частнопрактикующим врачом после осмотра тела и установления факта смерти. Если человек умер дома или в больнице, и причины смерти ясны, то свидетельство выдается в тот же день. В случае вскрытия справка выдается не позднее, чем через 2 суток после установления причины).
После этого работники ЗАГСа обрабатывают эту информацию, вносят ее в единый государственный реестр органов ЗАГС и выдают родственникам или законным представителям умершего гражданское свидетельство о смерти взамен медицинской справки.
Из ЗАГСов информация о смерти попадает в большую систему базы данных ЕГР (единый государственный реестр) ЗАГС. Там она накапливается, а различные ведомства по кодам доступа могут получать эту информацию, выгружать её и использовать в своих целях. Росстат забирает эти данные 2–3 раза в месяц, затем проверяет дублированные записи и ошибки, рассылает статистику в свои территориальные подразделения на проверку причин смерти, а эти подразделения присылают подтвержденные данные обратно.
Так происходил сбор данных и в начале пандемии. В итоге всей этой достаточно долгой процедуры к концу следующего месяца Росстат публиковал информацию о том, в каких регионах сколько людей умерло. Давали даже такую статистику — сколько людей умерло от больших классов причин смерти: сердечно-сосудистых заболеваний, онкологии, болезней органов пищеварения и дыхания, инфекционных заболеваний.
К сожалению, с апреля публикация причин смерти прекратилась, а с общей статистикой возникли задержки. Почему? Задержки возникли, во-первых, потому что в период пандемии изменился режим работы ЗАГСов. Многие ЗАГСы объявили на своих сайтах, что приостанавливают прием граждан и торжественные регистрации браков или сильно ограничивают число гостей. Во-вторых, изменилось поведение людей: многие стали бояться лишний раз выходить на улицу и приходить в присутственные места. Из-за этого в некоторых регионах ощутимо нарушился порядок регистрации, некоторые смерти пришли с запозданием.
Ингушетия, например, до сих пор размазывает первую волну смертей, которая случилась весной, одновременно с Дагестаном. Число умерших в Ингушетии в этом году в каждом месяце с мая по октябрь было приблизительно на треть больше, чем за тот же месяц в прошлом году. Как правило, так не бывает. Скорее всего, в Ингушетии был огромный всплеск смертности в мае — наверное, в 2–3 раза по сравнению с маем 2019 года. Теперь либо люди приходят в ЗАГСы постепенно, либо власти Ингушетии как-то собрали «лишние» смерти и потихонечку их выкидывают. По накопленному числу смертей можно оценивать и всю эпидемию.
К маю среди всех мировых демографов и ученых сложился консенсус, что только по общей избыточной смертности можно сравнивать, насколько тяжело в разных регионах протекает пандемия, поскольку сам факт определения того, от чего умер человек — наука неточная.
Определение основной причины смерти — отчасти творческая работа. Врач — художник, «он так видит». Существуют разные обстоятельства, пациенты и врачи, в различных странах свои практики. Например, в Великобритании они отличаются от США, в Италии — от Испании. Сравнивать числа, которые мы видим в официальных репортажах — значит, отказаться от правдивого результата.
СТРАШНО БЫТЬ ОТКРЫТЫМ
Сбор данных и сравнение избыточной смертности по регионам требует квалификации и больших затрат времени. На Западе существует несколько полезных для этого сайтов: Human Mortality Database, EuroMOMO — в Европе, у американцев — сайт CDC на базе центра инфекционных заболеваний в Атланте. Эти ресурсы достаточно регулярно публикуют обновления по избыточной смертности. Конечно, есть вопрос, как читать базу: брать ли прошлый год, опираться на среднее число смертей за 5 лет или на какой-то тренд — но это технический вопрос. Так или иначе, вы видите достоверные данные.
К сожалению, в России этот подход столкнулся с проблемой. Как я уже сказал, замедлилась регистрация в ЗАГСах, а Росстат перестал давать информацию о причинах смерти. Когда я спросил «Почему?», ответ был такой: «Сейчас пандемия, все нарушилось. Информация стала менее точной, поэтому во избежание проблем мы не будем этого делать». На самом деле во всех госорганах существует культ страха — люди действительно боятся. Боятся преувеличить опасность, сделать что-то не так, завысить число. Всё из-за того, что весной в стране чувствовалось, что Россия развернулась на обнуление, и пандемию необходимо победить любым способом.
При анализе статистики я не раз встречался с мнением: «А давайте не будем включать спорные случаи, потому что нас за это не похвалят». Пока я работал в Росстате, я настаивал, чтобы информация всегда была максимально полной, достоверной и открытой.
До пандемии я постоянно выступал по вопросам демографии на разных площадках: в Госдуме, на телеканалах. Я привык, что мне звонили достаточно часто. Когда я опубликовал в фейсбуке свои графики и расчеты пандемии, мне начали звонить журналисты и я снова стал давать интервью. Очень быстро выяснилось, что я не имею права давать интервью от своего имени, несмотря на то, что я не указываю, где работаю. И, как потом выяснилось, почти никто из тех, кто мои интервью читал и смотрел, не знали, где я работаю.
Тем не менее, после интервью с The New York Times меня вызвали на ковер. NYT опубликовал информацию, что у нас умерших от коронавируса в 2–3 раза больше, чем по официальной статистике. Я был одним из источников этой статьи. После выхода материала разразился скандал. Тогда мне сказали: «Еще одно такое интервью, и ты будешь уволен немедленно».
ЧЕТЫРЕ КОЛОНКИ АПОКАЛИПСИСА
Я хороший специалист, поэтому расставаться со мной не хотели. В итоге договорились, что впредь интервью от своего имени я буду давать только разрешенным изданиям и только на разрешенные темы. Однако скандал не утихал. Под нажимом этих обстоятельств и с моей подачи, Росстат решил давать статистику по 4 колонкам. Первая — умершие непосредственно от коронавируса. Вторая — умершие по диагнозу, когда вирус не был идентифицирован, но по всем клиническим признакам понятно, что человек умер от него. Третья колонка — это значит, что основная причина не коронавирус, но он в большей мере повлиял на развитие основного заболевания. Четвертая колонка — коронавирус выявлен тестами, но не повлиял на развитие заболевания.
Фиолетовая линия — данные сайта стопкоронавирус.рф. Красная линия — это первая колонка по Росстату, салатовая — первая и вторая вместе, голубая — к ним добавилась третья, а синяя — это все четыре колонки вместе взятые / Слайд из презентации Алексея Ракши
Стало понятно, что данные Росстата в несколько раз выше официальных данных с сайта стопкоронавирус.рф. Однако когда Росстат выгружал все эти данные из баз ЗАГС, я видел, что во многих свидетельствах о смерти коронавирус либо не закодирован нормально, либо закодирован ошибочным кодом, либо поставлен от руки. Получается, что и данные Росстата не полные — и тем не менее, они точнее информации, которую массово цитируют.
Позже я стал получать очень много новостей с мест о том, что врачи в больницах в принципе не ставят диагноз «коронавирус». У врача всегда есть возможность написать ту или иную причину смерти. Есть так называемые коморбидные больные: это люди в возрасте, у которых несколько хронических заболеваний — допустим, сахарный диабет и ишемическая болезнь сердца. Часто у врача есть возможность выбрать причину смерти. Даже если умер человек с коронавирусом, можно указать диагноз как сопутствующий, а можно и вовсе не указывать. При этом шло сильное давление на патологоанатомов и на медицинских статистиков со стороны региональных минздравов и главврачей, чтобы они писали «идеологически» правильные причины смерти.
Статистика Росстата, суммируемая синей линией, гораздо меньше, чем вся избыточная смертность. Избыточная смертность — это черная линия. Она показывает, на сколько в этом месяце умерло человек больше, чем в том же месяце прошлого года. Первый большой месяц — май, потом июнь, пиковый июль, потом август, когда все было неплохо. Скоро выйдут данные Росстата о сентябре. Их выпускают в 9 часов вечера в пятницу, чтобы на них обращали меньше внимания. Там снова будет избыточная смертность порядка 28 тысяч, и накопленный итог с апреля получится уже 113 тысяч человек. Это — насколько больше умерло с апреля до конца сентября, чем в прошлом году за этот же период. Если еще и октябрь оценить, получится порядка 150–160 тысяч.
ТРИ ПИШЕМ, ДВА В УМЕ
Росстат публикует данные примерно через 35 дней после окончания отчетного периода, то есть данные за сентябрь опубликуют 6 ноября. Но многим прогноз нужен раньше, чтобы сравнивать его с лживым сайтом стопкоронавирус.рф. Я уже много лет занимался в Росстате тем, что собирал данные главных управлений ЗАГСов в разных субъектах Федерации. Допустим, какой-нибудь рязанский ЗАГС публикует общее число актов рождений, смертей, заключений брака и разводов по Рязанской области, например, шестого числа каждого месяца. Уже к 15 числу 20–25 субъектов точно отчитывались. Нехитрыми вычислениями можно было их экстраполировать и спрогнозировать, каким же будет месяц. Когда выходили данные из Росстата, они как правило подтверждали прогноз.
Беда в том, что по мере развития пандемии все меньшее число ЗАГСов продолжало отчитываться. Некоторые ЗАГСы вообще перестали публиковать статистику о числе рождений и смертей. Кто-то прекратил публиковать только данные о смерти. Доходило даже до смешного — выходит замечательный пресс-релиз главного управление ЗАГС, например, Челябинской области, и отчитывается о событиях за третий квартал: родилось столько, женилось столько, развелось столько, перемена имени, установление отцовства, усыновление — но про смерть не слова. И таких субъектов много. Многие перешли с ежемесячного отчета на ежеквартальный, кто-то вообще прекратил публикации.
В отличие от России, в других странах в связи с пандемией открытость информации резко увеличилась. Например, американская CDC стала публиковать подробную информацию о смертности понедельно — с разными причинами смерти. То же самое касается Великобритании — по разным регионам понедельно. Испания публикует информацию вообще ежедневно. Италия выложила огромную базу данных: со всеми вообще смертями по возрасту, полу и причинам смерти — вплоть до каждого городка.
Россия пошла совершенно противоположным путем. У нас качество данных ухудшилось, выходить они стали позже и их стало гораздо меньше. Отслеживать и прогнозировать поэтому стало труднее. Я считаю, что все это началось из-за «обнуления» и чтобы не противоречить сайту стопкоронавирус.рф.
Статистика смертности во время пандемии на сайте стопкоронавирус.рф / Слайд из презентации Алексея Ракши
На этом графике, конечно, трудно что-то разглядеть, но если вы видите одинаково окрашенные, идущие подряд клеточки, это означает, что внутри этих клеточек цифры явно неправдоподобные и лживые. Например, в Пензенской области на протяжении 3 недель подряд официально умирало каждый день по 1 человеку. Тот, кто знает математику и теорию вероятностей, понимает, что вероятность такого события ничтожна — единица в минус не знаю какой степени. Потом перерыв, и снова 2 недели умирает каждый день по одному человеку. Опять перерыв, и потом 3 недели умирает по 1 человеку. Другой пример фальсификации — в Санкт-Петербурге на протяжении 3 недель подряд количество выздоровевших составляло ровно половину от количества новых заболевших. Все показатели росли очень гладко, буквально по линеечке. Так не бывает.
Статистика смертности во время пандемии на сайте стопкоронавирус.рф / Слайд из презентации Алексея Ракши
Этот график более правдоподобный. Здесь видна информация по неделям. На выходных регистраций смертей и вообще обновлений статистики должно быть меньше, потому что работает меньшее лабораторий, меньшее врачей и больниц. Это — абсолютно нормально. Если вы посмотрите на сайт Worldometer.info, на любую развитую демократическую страну, то графики развития пандемии колеблются. Они могут подниматься, могут опускаться, могут даже ненадолго остановиться на одном месте — но в целом они колеблются. Если вы видите гладкий график, как у нас в стране, это — однозначно ложь. Я не понимаю, зачем нам дают эту неправдоподобную информацию.
С ФАНТАЗИЕЙ И БЕЗ
Поскольку к сайту стопкоронавирус.рф нет никакого доверия, приходится использовать хитрые способы: умножать их информацию на 3 или на 4, использовать данные ЗАГСов, делать запросы. Это очень трудоемко, а ведь это только подсчет смертности. Смерть — это уже итог пандемии. О ней мы узнаем спустя два месяца после того, как кто-то заразился. Так мы не можем отслеживать, что происходит и как нам готовиться.
Единственный метод против этой лживой статистики — это правильно применять в Яндексе специфические запросы. Самые хорошие запросы: «пропало обоняние» или «не чувствую запаха». Мои коллеги: Борис Овчинников, Александр Драган — маркетологи, они каждую неделю выкладывают отчеты о том, сколько таких запросов в процентном соотношении из городов и регионов было сделано за последний месяц. Только эти данные хоть как-то свидетельствуют о том, какая на самом деле у нас происходит история с пандемией в регионах.
Официальной же статистике верить нельзя. Например, по данным сайта стопкоронавирус.рф в Чечне за всю историю коронавируса им переболели всего 0,1% населения. Это рекордно низкий по России показатель. В то же время, избыточная смертность в Чечне — на втором месте по всей России, то есть с апреля в Чечне умерло в полтора раза больше людей, чем в это же время в прошлом году. Это огромный прирост. Это приближается к Бергамо или к Нью-Йорку. По факту того, что на одном официальном сайте заболеваемость в этом регионе самая низкая в России, а на другом официальном сайте смертность в этом регионе вторая по величине, можно сделать вывод о правдоподобности статистики и отношению к ней.
По крайней мере, люди с сайта стопкоронавирус.рф не умеют пользоваться рандомайзером. Кто знает программирование, понимает, что есть очень простая функция, когда компьютер выдает случайные числа. Если бы они ее использовали, их статистика выглядела бы более правдоподобно. Сейчас она нарисована по линеечке, от руки и без фантазии.
Поскольку я работал в Росстате, я знаю как эти числа собираются, и Росстату я доверяю. Во лжи по демографии Росстат еще ни разу замечен не был. А сайт стопкоронавирус.рф — это специально созданный сайт, чтобы нам врать. Причем врать нагло, тупо и считать нас всех тупыми. Я очень часто в интервью говорю: либо люди, которые рисуют нам статистику, тупые, либо они думают, что тупые мы, либо и то и другое. Выбирайте, какой вариант вам больше нравится.
Источник: