С началом эпидемии COVID исследователи по всему миру начали пытаться использовать машинное обучение для ранней диагностики коронавируса по рентгенограммам и снимкам МРТ. За год вышло больше двух тысяч научных публикаций на эту тему. Но их свежее
метаисследование пришло к неутешительному выводу:
none of the models identified are of potential clinical use due to methodological flaws and/or underlying biases. Маленькие датасеты, плохие изображения и дубликаты, несбалансированные по демографии данные в датасетах, невозможность воспроизведения исследования — косяков оказалось так много, что из 2212 публикаций лишь 62 удовлетворяли критериям для финального анализа. И ни одна из них не имеет потенциала для использования в клинической практике.
Теоретически машины должны намного лучше людей видеть паттерны на всяких рентгенограммах. Но пока что выглядит так, что исследователи в спешке клепают слишком оптимистичные пейперы без оглядки на методологию, просто ради публикаций и цитирования.