3 заметки с тегом

данные

Группы риска не существует: мы все в одной лодке

Часть 8.

Читаю такое: в связи с риском заболевания вирусом предприятие переводится на удаленную работу. Или, в Москве 300 заболевших, мы считаем риск заболеть низким.

Это полная хрень. Риск не в заболевании кого-то на предприятии. Риск не в том, что лично вы подхватите вирус — это вообще не риск. 30-50 человек у нас каждый день гибнут в ДТП, но дороги никто не перекрывает. ДТП — ваш индивидуальный риск. Если кто-то попал в ДТП, это не вызывает еще тысячу ДТП в районе.

Вирус — риск не индивидуальный, а коллективный и нелинейный. Это значит, что произойдет что-то более масштабное, чем просто вы заболеете. Во-первых, не только вы, во-вторых, не только заболеете.

Посмотрим на процесс в США:
изначально было известно, что в медицинских учреждениях в наличии примерно 40 тысяч аппаратов искусственного дыхания. Казалось, что это много. Но, поскольку увеличивается сама скорость роста инфицированных, количество людей, которым требуются аппараты, растет нелинейно, взрывным образом.

http://www.cashin.ru/virus/confirmedgrowth/

В результате даже в США при такой экономической мощи появляются десятки оупен-сорсных проектов по самостоятельному изготовлению аппаратов искусственного дыхания. Гляньте хотя-бы сюда:

https://medium.com/@RobertLeeRead/analysis-of-open-source-covid-19-pandemic-ventilator-projects-27acf9075f7e

Это только один из примеров нелинейных эффектов второго порядка. На что это повлияет далее — нельзя предсказать. Но точно можно предсказать, что последствия будут невероятно плохими, если нелинейный рост продолжится.

Риск в том, что по мере распространения вируса масштаб увеличивается и это приводит к непредсказуемым последствиям. Вирус уже распространяется, и что люди полагают, что риска нет — больше ничего и не нужно. Этих двух составляющих достаточно.

Обычно, когда говорят про риск, имеют в виду нечто из будущего. А у нас это не будущее, а уже сработавший риск. Теперь это не риск, а реальный процесс.

Есть посев, есть высокий коэффициент передачи. Нужно снижать, иначе...

https://meltingasphalt.com/interactive/outbreak/

* * *
P. S.
С симуляторами нынче есть хорошая и плохая новости.

Хорошая — они наглядно показывают распространение инфекции в зависимости от коэффициента передачи и количества социальных контактов.

Плохая — все симуляторы, которые я видел, после достижения пика за каким-то хреном выводят все случаи в состояние «выздоровевших». Этот ход мне кажется безответственным — складывается впечатление, что если просто немного подождать, все станут выздоровевшими сами собой. Это глупость — никак не отображаются последствия. И их в принципе невозможно показать, потому что это непредсказуемые эффекты второго порядка.

Увы, хорошо «визуализировать» сегодня уже недостаточно.

Возможным решением для авторов таких симуляторов было бы вообще не показывать исход. Показывать только стадию роста. Потому что мы не знаем, что за ней последует.

* * *
Ранее:
Часть 1.
Мы путаем локальный риск с системным.
http://www.cashin.ru/blog/all/virus/

Часть 2.
Мы не понимаем сдвига во времени между причиной и следствием.
http://www.cashin.ru/blog/all/virus-2/

Часть 3.
Откуда данные?
http://www.cashin.ru/blog/all/virus-3/

Часть 4.
Ищи то, чего нет на виду.
http://www.cashin.ru/blog/all/virus-4/

Часть 5.
Риск срабатывает моментально
http://www.cashin.ru/blog/all/virus-5/

Часть 6.
Вирус распространяется по Москве
http://www.cashin.ru/blog/all/virus6/

Часть 7.
Действия каждого для общей безопасности
http://www.cashin.ru/blog/all/virus-7/

Часть 8.
Группы риска не существует: мы все в одной лодке
http://www.cashin.ru/blog/all/virus-8/

Все заметки на тему коронавируса
http://www.cashin.ru/blog/tags/koronavirus/

Откуда данные о заболевших

Днём ранее написал про временной сдвиг и природу коэффициента смертности:
http://www.cashin.ru/blog/all/virus-2/

Увидел в Твитере ссылку на заметку ровно с тем же:
https://medium.com/@tabardel/coronavirus-2019-ncov-no-the-case-fatality-rate-is-not-2-48142169a367

Тем временем, Нью-Йорк Таймс публикует ожидания по коэффициентам смертности, и допускает ровно ту ошибку, которую я описал во второй части: сравнивает смертность затихших эпидемий с активно развивающейся:
https://nytimes.com/interactive/2020/world/asia/china-coronavirus-contain.html

Или я чего-то не догоняю, или визуализация вызывает вопросы.
Кидаю вопрос Нассиму Талебу, получаю подтверждение.
https://twitter.com/sergeykashin/status/1225828779748098048

Печальная новость для дизайна:
Высокий графический уровень визуализации данных скрывает опасность — у зрителя создается впечатление надежной и продуманной работы, а на деле работа построена на сомнительном смысловом фундаменте.

Вообще, у меня накопились примеры ошибок в визуализациях, созданных известными командами. Возможно, как-нибудь найду время рассказать. Пугает то, что на известные команды ориентируются другие дизайнеры, которые видят ошибки и думают что так делать окей. Это не окей.

Идем дальше.

Часть 3.
Откуда данные?

Основная масса заболевших — в Китае. Оттуда же почти все цифры. На основе этих цифр все строят статистические оценки и прогнозы.

Возникает вопрос, насколько цифры близки к реальности. Китай может всё, у них есть великий файрвол, тотальный мониторинг и партия.

А когда есть сомнения в данных, действия иногда говорят больше, чем цифры: Китай не стал бы сливать свою экономику, если бы риск был небольшим. Реакция страны на происходящее сильнее, чем можно ожидать только по цифрам. Использование крупных общественных пространств для размещения заболевших, мегазакупки медицинских материалов за рубежом (для Китая-то) — практически военная тема. Это сигнал о том, что реальность может быть хуже.

Заметили две тенденции: до конца января из Китая приходили цифры роста инфицированных по 50% в день, а после 27 января — ровно по 25% в день.
https://twitter.com/salilstatistics/status/1223484153468944384

Инфицирование — случайный процесс. Странно, что поток чисел так ровно ломается с 50% на 25% в один день — непонятно, что произошло именно в этот день. +Непонятно, насколько возможна проблема технического ограничения диагностирования новых случаев — ведь на диагностику нужны ресурсы.

Схожий вопрос к цифрам: очень ровный рост в отчетности — несколько дней подряд точно по квадратичной кривой, будто данные отвешивали вручную:
https://twitter.com/evdefender/status/1224723734680035329

Посмотрим.
P. S. пока я собирал скриншоты, цифры ушли вверх.

 
* * *
Часть 1.
Мы путаем локальный риск с системным.
http://www.cashin.ru/blog/all/virus/

Часть 2.
Мы не понимаем сдвига во времени между причиной и следствием.
http://www.cashin.ru/blog/all/virus-2/

Часть 3.
Откуда данные?
http://www.cashin.ru/blog/all/virus-3/

Часть 4.
Ищи то, чего нет на виду.
http://www.cashin.ru/blog/all/virus-4/

Часть 5.
Риск срабатывает моментально
http://www.cashin.ru/blog/all/virus-5/

Часть 6.
Вирус распространяется по Москве
http://www.cashin.ru/blog/all/virus6/

Часть 7.
Действия каждого для общей безопасности
http://www.cashin.ru/blog/all/virus-7/

Часть 8.
Группы риска не существует: мы все в одной лодке
http://www.cashin.ru/blog/all/virus-8/

Все заметки на тему коронавируса
http://www.cashin.ru/blog/tags/koronavirus/

8 февраля   данные   Коронавирус   риск
2018   Гугл   данные   карты   Эпл