관점에서보고 된 코로나 바이러스 수를 자세히 살펴보십시오

국가 크기와 관련된 사례 번호 분석

면책 조항 : Toward Data Science는 주로 데이터 과학 및 기계 학습에 대한 연구를 기반으로하는 중간 간행물입니다. 우리는 건강 전문가 나 역학자가 아니며,이 기사의 의견을 전문가의 조언으로 해석해서는 안됩니다. 코로나 바이러스 전염병에 대해 자세히 알아 보려면 여기를 클릭하십시오.

불과 몇 달 만에 코로나 바이러스 (COVID-19)는 전 세계에 퍼져 사실상 전 세계적으로 유행하는 전염병으로 이어졌습니다. 많은 국가와 지역에서 확인 된 사례는 여전히 기하 급수적으로 증가하고 있습니다. 매일보고 된 확인 된 사례 수에 따라 바이러스가 사람들의 삶, 시장 및 세계 경제에 어떤 영향을 미치는지 매우 우려하고 있습니다. 원래 중국 베이징에서 시작된 2003 SARS 발생에 대한 기억은 신선합니다. 그러나 나는 서구의 많은 사람들이 COVID-19의 심각성에 너무 무관심하다는 사실에 놀랐습니다.“독감 일뿐입니다.”,“노인에게만 영향을 미칩니다”,“미디어 선전”,“면역력”… 일반 대중의 고도는 밤에 나를 유지합니다.

아마도 일부 사람들은보고 된 사례 수에 감명을받지 않았으며 감염된 사례의 대부분이 세계 반대편에 있다고 생각합니다. 실제로 확인 된 사례 번호를 보면 동의합니다. 여기에 그 숫자를 원근법으로 표현하기위한 플롯을 만들었습니다.

주의 사항 : 모델은 데이터 소스만큼만 우수합니다. 확인 된 COVID-19의 모든 사례는 Johns Hopkins University of Systems Science and Engineering (JHU CSSE) 센터에서 제공하며, WHO 및 전 세계 정부의 공식 보고서를 수집했습니다. 의심 할 여지없이 진단 테스트, 정부의 투명성 부족, 무지로 인해 테스트에 실패한 사람들로 인해 대부분의 국가에서보고가 부족합니다.

아래의 모든 수치는 2020 년 3 월 15 일 현재 확인 된 COVID-19 사례를 기준으로합니다.

지역 수준 누적 사례

누적 확인 된 COVID-19 사례로 영향을받는 상위 국가 / 지역

이와 같은 많은 시각화는 국가 수준 통계 만 표시합니다. 지역 수준의 도표에서 우리는 중국의 다른 지방과 미국의 주를 분리 할 수 ​​있습니다. 한때 COVID-19의 진원지가 된 후베이는 중국의 거의 모든 다른 지방과 함께 확인 된 사례의 수를 평평하게했다. 많은 유럽 국가들과 함께이란, 한국, 이탈리아는 중국에서 두 번째로 큰 타격을 입은 광동을 능가했습니다.

지수 성장에 적합

다음으로 COVID-19가 지역 내에서 얼마나 빨리 확산되는지 살펴 보겠습니다. 누적 확인 사례에 지수 함수 y = exp (a + bx)를 적용했습니다. 여기서는 매개 변수 a와 b를 결정하기 위해 보통 최소 제곱 (OLS)을 사용했으며 기울기 b는 지수 곡선의 가파름에 해당합니다.

실제로 기하 급수적으로 성장하는 것은 거의 없습니다. 그러나, 감염성 질환의 초기 발생은 지수 함수로 모델링 될 수있다. 다른 지역의 경우,이 초기 기간 동안 확인 된 COVID-19 사례의 누적 된 수를 최소 5 일에서 10 일 동안 50 건으로 정의했습니다. 지수 함수에서 적합 한 경사 (b)를 정렬하면이란, 핀란드, 포르투갈, 이탈리아, 한국, 덴마크, 슬로베니아 및 스페인을 포함하여 01/23의 잠금 장치 주변에서 후베이보다 성장률이 큰 국가 목록이 눈에 띄었습니다. 현재 3 월 15 일 기준으로 기하 급수적으로 성장하고 있습니다. 또한 미국의 뉴욕과 워싱턴 주도 세계에서 가장 빠르게 확산되는 지역 중 15 위와 19 위를 차지했습니다.

가장 빠른 확산 지역 / 국가. 범례는 지수 함수에서 b를 나타내며 성장 곡선에 맞는 날짜 기간을 나타냅니다.

반면에, COVID-19의 확산이 가장 느린 지역 및 국가도 발견 할 수 있습니다. 상위 20 개 국가는 거의 독점적으로 아시아에 있으며, 대부분은 닝샤, 내몽골, 신장과 같은 중국의 외딴 지역이며 인구가 적습니다. 참고로 COVID-19 사례는 2 월 중순 이후 싱가포르와 일본에 존재하지만 사회적 분산을 조기에 효과적으로 시행했기 때문에 훨씬 느리게 퍼졌다.

가장 느린 확산 지역 / 국가.

모집단으로 정규화

감염된 사람들의 수를 원근법으로 만드는 한 가지 방법은 지역이나 국가의 인구 규모에 대해 정상화하는 것입니다. 아래에서는 COVID-19에 감염된 인구의 가장 큰 비율을 가진 상위 20 개 지역 / 국가를 표시합니다. 이탈리아로 둘러싸인 포위 된 미세 국가 인 San Marino는 인구 당 COVID-19 밀도에서 1 위를 차지했습니다. 아이슬란드와 같은 다른 저 인구 국가들도 목록에 올라 있습니다.

영역으로 정규화

감염된 사람들의 수를 이해하는 또 다른 방법은 지역 / 국가의 영역을 정규화하여 지리학 적 측면에서 사례의 밀도를 도출하는 것입니다. 작은 지역으로 인해 San Marino가 다시 1 위를 차지했습니다. 마카오, 싱가폴, 워싱턴 DC 등 많은 도시와 도시 국가들도 정상에 있습니다.

병원 수용 능력으로 정상화

COVID-19 사례의 수를 원근감있게 만드는보다 효과적인 방법은 지역 내 병원에 대한 부담을 정량화하는 것입니다. 이는 예상 병상 수에 의해 측정되는 병원 수용 능력에 대해 정규화하여 수행 할 수 있습니다.

현재 COVID-19에 감염된 환자는 병원이 하나 뿐인 San Marino의 병원 침대의 72 %를 차지하기에 충분합니다. 부담이 큰 다른 국가로는 아이슬란드,이란, 이탈리아 및 카타르가 있으며 COVID-19 환자는 병원 침대의 10 % 이상을 차지합니다. 이것은 환자가 병원 주변에 비례 적으로 분포되어 동일한 병원으로 넘치지 않는 최상의 시나리오를 가정 한 것입니다.

중환자 실의 침대 수와 사용 가능한 기계식 인공 호흡기의 수를 고려해야하며, 이는 심각한 증상이있는 환자를 구하는 데 필수적입니다. American Hospital Association에 따르면 ICD의 침대는 미국의 모든 병원 침대의 ~ 5 %를 차지합니다. 모든 환자가 ICU 체류가 필요하다고 가정하면 ~ 10 %의 병상이 ~ 200 %의 ICU 용량이됩니다.

3 월 21 일까지 확인 된 사례에 따라 병원 부담이 업데이트되었습니다.

여기의 데이터를 사용하여 미국의 병원 침대를 추정 할 수있었습니다. 플롯에서 볼 수 있듯이 San Marino의 확인 된 사례는 이미 병원 침대 수를 초과했습니다. 이탈리아의 병원 부담은 ~ 23 %로 증가했습니다. 미국, 뉴욕, 워싱턴, 뉴저지의 3 개 주에서도 상위 20 위권에 올랐으며, 병원 입원이 필요하다고 가정 할 때 확인 된 COVID-19 사례가 잠재적으로 차지하는 모든 병상은 16 %, 12 % 및 4 %입니다.

코드 :

https://github.com/wangz10/covid_19_analyses