Как большие данные помогают бороться с пандемией

Как анализ больших данных может помочь победить коронавирус и как технологии машинного обучения позволяют нам анализировать огромные объемы данных? Ответы на эти вопросы ищет ведущий Youtube-канала «Индустрия 4.0» Николай Дубинин.

Анализ больших данных — один из самых мощных способов отслеживать распространение вируса и победить пандемию. 160 лет назад произошла история, которая наглядно показала, насколько важно собирать данные и быстро их анализировать.

Карта распространения коронавируса в Москве и Московской области.

Как все это началось? 1854 год. Лондонский район Сохо поражен вспышкой холеры. За десять дней умирает 500 человек. Никто не понимает источник распространения заболевания. В то время считалось, что болезнь передается из-за вдыхания нездорового воздуха. Все изменил доктор Джон Сноу, ставший одним из основоположников современной эпидемиологии. Он начинает опрашивать местных жителей и наносит на карту все выявленные случаи заболевания. Статистика показала, что большинство погибших находились возле колонки на Брод-стрит. Не воздух, а вода, отравленная нечистотами, стала причиной эпидемии.

Сервис Tectonix на примере пляжа в Майами показывает, как скопление людей может влиять на распространение эпидемий. Карта содержит миллионы фрагментов анонимных данных с геолокацией, поступающими со смартфонов и планшетов.

А теперь представьте, как быстро распространяется коронавирус по нашей стране после пробки в московском метро 15 апреля. Тогда полиция проверила цифровой пропуск каждого человека, спустившегося в метро.

Зачем нужны цифровые пропуска, если система не справляется с их проверкой? Также есть камеры наблюдения.

По словам директора по распространению технологий «Яндекса» Григория Бакунова, действующая сегодня система распознавания лиц распознает 20-30 кадров в секунду на одном компьютере. Это стоит около 10 долларов. При этом в Москве 200 камер. Чтобы все это работало в реальном режиме, нужно установить около 20 тысяч компьютеров. У города нет таких денег.

В то же время 15 марта в Южной Корее прошли офлайн-парламентские выборы. Явка за последние шестнадцать лет была рекордной – 66%. Почему они не боятся людных мест?

Южной Корее удалось обратить вспять развитие эпидемии внутри страны. Подобный опыт у них уже был: в 2015 и 2018 годах, когда в стране были вспышки вируса MERS. В 2018 году они учли свои ошибки трёхлетней давности. На этот раз власти действовали особенно решительно и подключили большие данные.

За движениями пациентов следили с помощью:

  • записи с камер наблюдения

  • транзакции по кредитным картам

  • Данные GPS с автомобилей граждан

  • Мобильные телефоны

Тем, кто находился на карантине, пришлось установить специальное приложение, которое предупреждало власти о нарушителях. Удалось увидеть все движения с точностью до минуты, а также узнать, были ли люди в масках.

Штраф за нарушение составил до $2,5 тыс. Это же приложение уведомляет пользователя, если рядом есть зараженные люди или скопление людей. Все это параллельно с массовым тестированием. Ежедневно в стране проводилось до 20 тестов. Создано 633 центра, специализирующихся только на тестировании на коронавирус. Также на парковках было 50 станций, где можно было сдать тест, не выходя из машины.

Но, как правильно отмечает научный журналист и создатель научного портала N+1 Андрей Коняев, Пандемия пройдет, а персональные данные останутся. Государство и корпорации смогут отслеживать поведение пользователей.

Кстати, по последним данным, коронавирус оказался более заразным, чем мы думали. Это официальное исследование китайских учёных. Стало известно, что COVID-19 может передаваться от одного человека пяти-шести людям, а не двум или трем, как считалось ранее.

Коэффициент заражения гриппом составляет 1.3. Это означает, что один больной заражает одного или двух человек. Начальный коэффициент заражения коронавирусом составляет 5.7. Смертность от гриппа составляет 0.1%, от коронавируса – 1-3%.

Данные представлены по состоянию на начало апреля. Многие случаи остаются недиагностированными, поскольку человек не проходит тестирование на коронавирус или заболевание протекает бессимптомно. Поэтому на данный момент невозможно сделать выводы о цифрах.

Технологии машинного обучения лучше всего анализируют огромное количество данных и помогают не только отслеживать перемещения, контакты, но и:

  • диагностировать коронавирус

  • искать лекарство

  • искать вакцину

Многие компании анонсируют готовые решения на основе искусственного интеллекта, которые будут автоматически выявлять коронавирус не по анализам, а, например, по рентгену или компьютерной томографии легких. Таким образом, врач начинает работать сразу с наиболее тяжелыми случаями.

Но не каждый искусственный интеллект обладает достаточным интеллектом. В конце марта СМИ распространили новость о том, что новый алгоритм с точностью до 97% может определить коронавирус по рентгену легких. Однако оказалось, что нейросеть обучалась всего на 50 фотографиях. Это примерно на 79 фотографий меньше, чем нужно, чтобы начать распознавать болезнь.

DeepMind, подразделение материнской компании Google Alphabet, хочет полностью воссоздать структуру белка вируса с помощью искусственного интеллекта. В начале марта DeepMind заявила, что ее ученые пришли к пониманию структуры белков, связанных с COVID-19. Это поможет понять, как функционирует вирус, и ускорить поиск лекарства.

Что еще почитать по теме:

  • Как технологии предсказывают пандемии
  • Еще одна карта коронавируса в Москве
  • Как нейронные сети отслеживают нас?
  • Мир после коронавируса: столкнемся ли мы с эпидемией тревоги и депрессии?

Подписывайтесь и следите за нами в Яндекс.Дзен — технологии, инновации, экономика, образование и обмен в одном канале.

Оставьте комментарий