Очень длинная, очень подробная — и при том написанная очень понятным неспециалисту языком статья — объясняющая, почему так разнятся прогнозы, которые мы слышим и читаем по поводу развития пандемии.
Простой вывод — сейчас не существует сколь-нибудь надежной модели с приличной предсказательной силой, и пока существовать не может. Интересный и куда более глобальный вывод — касается data science и ее ограничений в принципе. Качество, полнота и объём данных принципиальны, а в случае пандемии нет ни одного из этих атрибутов, хотя со стороны кажется, что данных до фига.
Крайне полезное чтиво именно потому, что оно про data science — на всех сейчас волнующем примере показывает, как из якобы простенькой и очевидной модели с перемножением трёх легко измеряемых цифр задача превращается в тяжелейший когортный анализ с десятками факторов, неопределённость каждого составляет несколько раз; а потом ещё вылезает всякая неприятная нелинейщина. Коронавирус уйдёт, а этот текст надо будет показывать всем, кто хочет оценить блеск и нищету data science. Numbers aren’t facts. They’re the result of a lot of subjective choices that have to be documented transparently and in detail before you can even begin to consider treating the output as fact.
https://fivethirtyeight.com/features/why-its-so-freaking-hard-to-make-a-good-covid-19-model/