Skip to content

Latest commit

 

History

History
46 lines (31 loc) · 4.9 KB

README.md

File metadata and controls

46 lines (31 loc) · 4.9 KB

covid19-tutu

TODO

  • Разбиение на транспорт
    • Добавить рёбра под виды транспорта
    • Посчитать константы для видов траспорта
    • Добавить модель на пересчёт числа заболевших в пути
  • Уточнение модели для города
    • Подобрать константы recovery rate, contact rate
    • Разбиение по возрастным группам (группа риска 65+)
  • Покрутить параметры, посмотреть что получится:
    • Симулировать карантин (снизить contact rate)
    • Удалёнка рёбер (выкинуть часть рейсов)
  • Посмотреть насколько влияет инициализация
    • Официальная статистика собирается через гузно: насемплировать разных случайных инициализаций
    • Данные по транспорту шумные: пошатать частоты перемещения в разных направлениях

Как оно работает сейчас

На каждую итерацию у нас есть два цикла: в первом мы обновляем считаем динамику в городах, в следующем перемещаем между городами людей.

В городе сейчас считается SIR модель. Можно учитывать намного больше разных деталей, вроде возрастных групп, сообществ, случайных факторов, но нужно помнить, что это потребует уточнения и по транспорту (например если добавим возрастные группы в городе, надо будет добавить их и по перемещениям), во-вторых может оказаться, что SIR даст тот же результат, если ей чуть параметры подвинуть.

Между городами перемещение реализовано самым наивным способом. Здесь легко добавить реалистичности не трогая модель города. Однако тоже может оказаться, что тот же результат получится линейным преобразованием от наивного способа, то есть подкруткой скорости транспорта, например.

Первым делом

Перебрать параметры и посмотреть что на что влияет, а что вовсе не важно. Точные числа мы скорее всего не предскажем, или не сможем проверить, а динамику и зависимости знать важно.

Описание data

raw_data.csv - как к нам данные пришли от туту.

cities.csv - заполненные данные по городам из датасета. Везде есть координаты и население.

cities_infection.csv - добавлены столбцы с заболевшими и выздоровевшими по датам: 16.03 - 23.03

full_graph.csv - данные с маршрутами с заполненными полями. Удобно для визуализации.

age65.csv - группа риска 65+ с разбиением по регионам.

cities_infection.csv - добавлены столбцы с заболевшими/выздоровевшими в файл cities с датами: 16.03 - 22.03

CSSEGISandData - исторические данные по заболеваемости от института Джона Хопкинса (https://github.com/CSSEGISandData/COVID-19/tree/master/csse_covid_19_data/csse_covid_19_time_series). Данные обновляются ежедневно

population.csv - народонаселение по городам (https://datahub.io/JohnSnowLabs/population-figures-by-country)

cities_new.csv - добавлены данные по плотности населения (http://worldgeo.ru/russia/lists/?id=26), количеству аппаратов ИВЛ и ЭКМО (https://meduza.io/feature/2020/03/20/v-italii-iz-za-koronavirusa-katastroficheski-ne-hvataet-apparatov-ivl-v-rossii-ih-gorazdo-bolshe-no-eto-ne-znachit-chto-my-luchshe-gotovy-k-epidemii), а также по уровню развития инфраструктуры и общественной жизни (чистота, транспорт, спорт, магазины: https://www.domofond.ru/statya/polnyy_reyting_250_gorodov_rossii_po_kachestvu_zhizni/6764)