— Сегодня в РФ мы переживаем уже пятый пик пандемии COVID-19, но на момент прихода эпидемии известно об этом вирусе и о том, как он будет себя вести, не было ничего, — рассказывает Евгений Михайлович. — Строить достаточно точные эпидемиологические прогнозы можно только на основании большого количества данных. Если говорить простым языком, чтобы построить график, нужно несколько точек. Чем больше точек — тем более точно можно построить график и рассчитать математическую формулу, которая описывает закономерность расположения этих точек. Один цикл подъем–спад — это одна точка. И только одного цикла пандемии было недостаточно для выстраивания прогнозной кривой, которая была бы близка к жизни. В эпидемиологии часто применяются модель CIR и ее различные модификации, которые могут дать примерный прогноз по нескольким циклам подъемов и спадов, но все же только на основании таких данных понять и дать прогноз хорошей точности, что будет дальше, крайне затруднительно. Степень ошибки часто бывает очень высокой. То есть построить качественный прогноз по одному или двум циклам — тоже невозможно. Но вот когда есть три точки, уже можно пытаться найти закономерности. Поэтому первое время на основе модели CIR строили модели развития эпидемии — и они всегда были неуспешными.
— Но вот у вас появились данные о трех циклах, то есть три точки. Что дальше?
— Для нас очень важны качество и точность данных, и нашу модель мы строили на основе данных заболеваемости для Москвы и Московской области. Мы проанализировали три цикла подъема и спада, нашли схожие участки, поняли закономерность между схожими участками и построили модель, которая отвечала на многие вопросы. Например, когда начнется следующий цикл подъема. Мы не знали динамики фазы подъема и как долго он будет продолжаться, но мы знаем, что в момент, когда достигается максимальная точка, как будет выглядеть фаза спада, сколько она продлится, с какой скоростью будет уменьшаться заболеваемость каждый день, и на основании длительности фазы спада мы можем сказать, когда начнется следующий подъем. В результате по окончании фазы спада третьего цикла мы знали, что начнется фаза подъема четвертого цикла, и, когда он достиг максимальной точки, могли проверить действенность модели на фазе спада.
— Когда это было по времени?
— Это был август 2021 года — тогда мы сделали прогноз, когда начнется четвертый подъем, — и все произошло именно так, как мы и предполагали. После достижения максимальной точки подъема мы верифицировали (проверили) точность нашего прогноза по динамике фазы спада — составили табличку по заболеваемости COVID-19 на каждый день по всей продолжительности фазы спада четвертого цикла. Значения, которые мы вычислили по прогнозной модели, были очень близки к реальным.
— Зависели ли ваши прогнозы от контагиозности и вирулентности штамма?
— Хороший вопрос! Нет, наша модель не зависела от смены доминирующего варианта штамма SARS-CoV-2. Вероятно, она носит универсальный характер. Согласно нашим расчетам, окончание спада четвертого цикла и начало пятого цикла должны приходиться на диапазон 3–5 января 2022 года. Каково же было наше удивление, когда пятый цикл начался 3 января. Примерно в это же время произошла смена доминирующего геноварианта на штамм «Омикрон». То есть время начала пятого цикла у нас совпало абсолютно точно, до дня. Но на момент составления прогноза мы не могли знать, каковы будут динамика и скорость роста. Тогда мы сделали еще одну дополнительную работу — объединили по «кластерам» страны мира, где динамика волн COVID-19 шла по сходным сценариям.
— Эти страны находятся близко?
— Отнюдь! Страны, которые входят в одну группу с РФ, разбросаны по всему миру — это Израиль, Великобритания, США, Нигерия, ЮАР, Мексика и пр. Но при этом в некоторых странах «российского кластера» динамика заболеваемости немного опережает динамику заболеваемости в России. И когда в этих странах начал доминировать «Омикрон», стало очевидно, что к нам он очень скоро придет — и все начнет развиваться по тем же сценариям. То есть мы знали, что рост будет очень быстрым, практически вертикальным; что он будет коротким, а цифры заболеваемости будут на порядок выше, чем в предыдущих циклах. И вот когда в пятом цикле мы дошли до максимальной точки, мы еще раз на периоде спада начали поверять работоспособность модели. Мы знали, с какой скоростью будет падать заболеваемость, и опять посчитали цифры заболеваемости на каждый день. Наш прогноз по дням в пятом цикле и реальная ситуация опять практически совпали. Можно подытожить, что сегодня у нас есть прогнозная модель развития эпидемии COVID-19 в Московском регионе (а практически и в России) с достоверностью 90–95%.
— Тогда можно задать главный вопрос: когда ждать шестой цикл?
— На сегодня у нас есть инструмент, который описывает развитие COVID-19 . Нам нужно несколько недель для формирования прогноза на ближайшие три месяца. Сейчас мы наблюдаем существенное изменение свойств штамма «Омикрон» вируса SARS-CoV-2 — теперь при нем ощутимо легче протекает заболевание. Степень тяжести у заболевших, как правило, легкая. Поэтому введенные в стране локдауны в первом, втором и третьем циклах имели высокое значение и значительно снизили темпы распространения и уровни заболеваемости. Но больше они, скорее всего, не нужны. Они выполнили свою функцию в полном объеме. Они были приняты вовремя и правильно, но необходимость в них отпала. В целом же снижению заболеваемости помогли, во-первых, локдауны; во-вторых, вакцинация и, в-третьих, смена основного циркулирующего штамма на «Омикрон».
— Закладывался ли в вашу модель параметр вакцинации?
— Нет, не закладывался. Вакцинация помогла снизить количество заболевших и степень тяжести болезни. На общую динамику волн она не повлияла. Да и могла бы повлиять лишь в том случае, если бы было вакцинировано 80–90% населения. Зато в нашей работе мы исследовали, как на развитие эпидемии в нашей стране повлияли наши территориальные особенности.
— И какими тут стали основные параметры?
— Математическими методами анализа мы разделили регионы по заболеваемости COVID-19 на кластеры и исследовали методами машинного обучения, какие социально-экономические факторы влияют на разное течение эпидемии в этих кластерах. Например, одной из точек «перегиба» стала плотность дорог с твердым покрытием. Мы определили «красный флажок» — 192 км таких дорог на 1000 кв. км территории. Этот параметр определяет транспортные потоки и, в значительной степени, скорость миграции населения. И когда с помощью локдаунов ограничили перемещения, стало очевидно, что в регионах, где хороших дорог меньше, чем 192 км на 1000 кв. км, COVID-19 распространяется медленнее. Второй фактор — плотность населения. «Красный флажок» — 16 человек на 1 кв. километр. Если больше — динамика распространения эпидемии выше. И когда люди были дома и не контактировали, плотность населения имела важное значение в снижении распространения. Ну и третий параметр — коэффициент рождаемости (число рождений на одну женщину). Мы высчитали его — это 1,4. То есть если у женщины один ребенок, она может довольно много работать, активно перемещаться. Если двое и больше — ее социальная активность ниже, она как бы «выбывает» из цепочки передачи вируса. Все это просчитано машинными методами. По этим трем параметрам — 192 километра на 1000 кв. км территории, 16 человек на 1 кв. километр и 1,4 ребенка на одну женщину — тоже можно делать точные прогнозы о скорости распространения эпидемии в конкретном кластере в регионе России.