순환신경망 기반의 폭염 발생확률 예측 모델 개발: 서울특별시를 중심으로

Development of Heatwave Probability Prediction Model Based on Recurrent Neural Network: A Case of Seoul Metropolitan Government

Article information

J. Korean Soc. Hazard Mitig. 2021;21(5):49-57
Publication date (electronic) : 2021 October 31
doi : https://doi.org/10.9798/KOSHAM.2021.21.5.49
* 정회원, ㈜부린 부설연구소 연구원(E-mail: dwkim@eburin.com)
* Member, Researcher, R&D Center, Burin Co., Ltd.
** 정회원, ㈜부린 부설연구소 책임연구원(E-mail: chorok8869@eburin.com)
** Member, Senior Research Engineer, R&D Center, Burin Co., Ltd.
*** ㈜부린 부설연구소 선임연구원(E-mail: qiqi92@eburin.com)
*** Research Engineer, R&D Center, Burin Co., Ltd.
**** 정회원, ㈜부린 부설연구소 책임연구원(E-mail: myjang@eburin.com)
**** Member, Senior Research Engineer, R&D Center, Burin Co., Ltd.
***** 정회원, ㈜부린 부설연구소 수석연구원
***** Member, Principal Research Engineer, R&D Center, Burin Co., Ltd.
***** 교신저자, 정회원, ㈜부린 부설연구소 수석연구원(Tel: +82-2-521-1286, Fax: +82-2-521-1287, E-mail: jisong@eburin.com)
***** Corresponding Author, Member, Principal Research Engineer, R&D Center, Burin Co., Ltd.
Received 2021 September 14; Revised 2021 September 16; Accepted 2021 September 29.

Abstract

최근 기후변화의 영향으로 폭염 발생이 증가하여 우리나라에서도 인명피해와 사회⋅경제적 피해가 증가하고 있다. 이러한 이유로 국내에서는 폭염과 관련된 연구 개발의 중요성이 대두되고 있다. 폭염 발생확률을 사전에 예측하는 것은 재해 위험 관리의 측면에서 매우 중요하나, 현재까지의 선행 연구들 중 폭염 발생확률을 예측한 연구들은 미비한 실정이다. 따라서 본 연구에서는 서울특별시를 대상으로 일 단위 과거 기상 데이터를 활용해 미래의 폭염 발생확률을 예측하였다. 이를 위해 시계열 데이터의 분석에 유용한 순환신경망 기반의 모델(RNN, LSTM, GRU)을 활용하였다. 본 연구에서 최적 모델로 선정된 GRU 모델의 성능을 평가한 결과 과적합 문제가 발생하지 않았으며, 검증 및 테스트 과정에서 실제 폭염 발생일을 각각 78%, 86% 재현하여 예측 정확도가 높은 것을 확인하였다. 따라서 향후 지자체별로 본 연구 방법을 적용한다면 효율적인 폭염 대비가 가능할 것으로 판단된다.

Trans Abstract

Recently, the incidence of heat waves has increased due to climate change, and the resultant mortalities and socio-economic damage are also increasing in Korea. Hence, emphasis has been placed on research examining heatwaves and their effects. Predicting the probability of heatwave in advance is very important from the perspective of disaster risk management; however, related studies have been insufficient so far. Therefore, in this study, the probability of future heatwave onset was predicted using daily scaled past weather data for Seoul Metropolitan Government. For the analysis, models based on recurrent neural networks (RNN, LSTM, GRU) were used, which are suitable for analyzing time-series data. Upon evaluating the performance of the GRU model, which was selected as the optimized model, no overfitting problem was observed. The prediction accuracy of the model was high as it demonstrated a reproduction of 78% and 86% of actual heatwave days during the validation and test process, respectively. Therefore, this model can be used by each local government to coordinate an efficient response to heat waves.

1. 서 론

폭염은 비정상적인 고온 현상이 여러 날 동안 지속되는 것을 의미하며 인명피해가 가장 큰 자연재해로 알려져 있다. 하지만 폭염은 인명피해 뿐 아니라 사회⋅경제 전 부문에 영향을 미치며, 장기간의 폭염이 지속되면 다른 재해와 복합적으로 큰 피해를 야기하게 된다(KMI, 2021).

최근 기후변화의 영향으로 인해 전 세계적으로 폭염 현상이 증가 추세에 있다. NOAA National Centers for Environmental Information (2021)에 따르면 2021년 7월의 평균 지구 표면 온도는 1880년 관측이 시작된 이래 가장 높았으며, 2021년은 역사상 가장 더운 10년 중 하나가 될 것으로 예상된다. 이로 인해 2021년 여름 미국과 캐나다 서부에서는 역대 최악의 폭염이 발생하여 수백 명의 사망자가 발생하였다.

우리나라 역시 기후변화의 영향으로 폭염의 발생 빈도 및 강도가 증가 추세에 있으며, 폭염으로 인해 인명피해 뿐 아니라 사회⋅경제적으로도 큰 피해를 입었다. 비교적 최근인 2018년에는 기상관측 이래 최고기온인 41 °C가 기록되었고 폭염일 수 또한 전국 평균 31.5일로 평년 대비 3배 이상 큰 값을 보였다(KEI, 2020). 이로 인해 4만여 명이 넘는 온열질환자가 발생하였고, 500만 마리 이상의 가축 폐사 피해, 370억 원 이상의 수산 양식 피해가 발생했다(KEI, 2020). 이러한 문제로 우리나라에서는 2018년 ‘재난 및 안전관리 기본법’에 폭염을 자연재해로 지정하여 폭염 정책 및 대응수칙을 수립하고 있으며, 관련 연구의 중요성 또한 대두되고 있다(NDMI, 2019; KMI, 2021).

국내에서는 폭염 발생과 관련하여 다양한 연구가 진행되고 있다. E.-B. Kim et al. (2014)은 기상 데이터를 활용해 서울특별시, 부산광역시 등 우리나라 주요 도시의 폭염 및 열대야 발생 특성을 분석하여 7, 8월의 폭염 발생 빈도가 80% 이상임을 확인하였다. Park et al. (2016)은 폭염으로 인한 사망자 통계 데이터와 지역별 폭염 발생 빈도를 분석하였고, 대부분의 지역에서 폭염 지속일과 인명피해가 양의 상관관계를 보임을 확인하였다.

최근 인공신경망 기반 모델을 폭염 및 기온 예측에 적용한 연구들 또한 국내⋅외에서 다수 진행되었다. Yoon and Jeon (2017)은 순환신경망 기반 모델 중 하나인 LSTM 모델을 활용하여 광주광역시의 시간 단위 기상 데이터를 학습해 24시간 이후의 기온을 예측하였다. Kim et al. (2020)은 시간 단위 기상 데이터와 LSTM 모델을 활용하여 4시간 후의 기온 예측을 수행하였고 모델의 정확도를 검토하였다. Kang and Kim (2021)은 도시⋅사회적 특성을 고려하여 LSTM 모델을 활용한 부산광역시의 일 단위 폭염 예측을 수행하였다. Toharudin et al. (2021)은 LSTM 모델과 Facebook Prophet 모델을 활용해 Bandung 지역의 일 단위 최고기온 및 최저기온 예측을 수행하였고 두 모델 모두 작은 오차를 보여 활용성이 있음을 밝혔다. Ozbek et al. (2021)은 LSTM, ANFIS, ARMA 모델을 활용해 터키의 Belen, Mersin 지점의 10분, 1시간, 일 단위 기온 데이터의 예측을 수행하였고 LSTM 모델의 예측 정확도가 가장 높음을 입증하였다.

재난 관리의 측면에서 폭염 발생을 사전에 예측하는 것은 중요하다. 하지만 기존의 연구들은 대부분 폭염 빈도를 분석하고 폭염 피해와의 연관성을 규명하는데 초점이 맞춰져 있으며, 인공지능 기법을 활용한 선행 연구들의 경우에도 기온을 예측하는 연구들이 대다수이다. IPCC (2014)의 제5차 보고서에 따르면 재해 위험은 위험한 사상이 발생할 확률과 이것이 발생했을 때 노출된 요소들이 취약한 정도에 따라 받는 영향의 함수로 정의된다. 이러한 측면에서 본 연구에서는 서울특별시를 중심으로 폭염 사상의 일 단위 발생확률을 산정하는 것을 목표로 하였다. 이를 위해 인공지능 기법 중 시계열 데이터를 분석하는데 적합한 순환신경망 기반의 모델(RNN, LSTM, GRU)을 활용하였고, 과거 데이터를 통해 학습한 모델이 미래의 일 단위 폭염 발생확률을 산정할 수 있도록 모델을 설계하였다.

2. 연구 대상 지역 및 자료

본 연구는 서울특별시(Fig. 1)를 대상으로 진행되었다. 서울특별시는 최고기온과 폭염 및 열대야일수가 증가 추세에 있으며, 2018년의 경우 일 최고기온이 33 °C 이상인 날을 의미하는 폭염일수(Fig. 2)가 35일로 1908년부터 2017년까지의 연 평균 폭염일수인 9일을 크게 웃돌았다(Cho and Yi, 2018). 게다가 거듭된 도시화로 불투수율이 높아져 태양열 저장량 및 인공열 배출량이 증가하였고 열 흡수원이 감소하여 서울특별시는 폭염 영향에 취약한 환경이 되었다(Cho and Yi, 2018).

Fig. 1

Study Area (Seoul Metropolitan Government)

Fig. 2

Heatwave Days of Seoul (1981~2021)

본 연구에서는 기상청의 종관기상관측(Automated Synoptic Observing System, ASOS) 서울 지점에서 관측된 일 단위 기상 데이터를 활용하였다. 분석에 활용한 데이터는 1981년부터 2021년 8월까지의 데이터 중 폭염 대책기간에 해당하는 5월부터 9월까지의 데이터이다. 구축 데이터 중 풍속과 습도는 기온과 함께 고온의 날씨에서 인체에 영향을 주는 요인으로 체감온도의 산정에 활용된다(Schoen, 2005). 기압은 바람의 발생 및 기온과 습도의 변화를 유발하는 요인으로, 폭염의 발생 및 발달과 기압은 높은 연관성을 가진다(Y.-J. Kim et al., 2014; H.-C. Lee et al., 2020; H.-D. Lee et al., 2020).

이를 바탕으로 본 연구에서는 폭염 발생확률 산정을 위해 독립변수로는 기온(평균, 최저), 평균 지면온도, 강수량, 풍속(평균, 최고), 상대습도(평균, 최저), 평균 현지기압, 해면기압(평균, 최고, 최저), 일조시간, 일사량을 활용하였고, 종속변수로는 폭염 발생여부를 활용하였다. 폭염 발생여부는 일 최고기온이 33 °C 이상인 경우를 1, 미만인 경우를 0으로 하여 구축하였다. 분석에 활용한 각 변수들의 결측값은 해당일 전, 후의 상황을 고려해 평균값으로 대체하였다.

3. 연구 방법

3.1 인공신경망

인공신경망(Artificial Neural Network, ANN)은 인간 두뇌의 생물학적 신경망에서 영감을 받아 개발된 머신러닝 알고리즘으로 시계열 예측, 패턴 인식, 컴퓨터 비전 등 다양한 분야에서 활용되고 있다. 인공신경망은 입력층(Input Layer), 은닉층(Hidden Layer), 출력층(Output Layer)으로 구성되며, 은닉층이 2개 이상으로 이루어진 신경망을 심층신경망(Deep Neural Network, DNN)으로 정의한다.

3.1.1 순환신경망

본 연구에서 활용한 시계열 데이터와 같이 연속적인 데이터를 분석하는데 유용한 신경망 모델로 Rumelhart et al. (1986)이 제안한 순환신경망(Recurrent Neural Network, RNN)이 있다. RNN은 은닉층의 결과를 출력층으로만 보내는 기존의 인공신경망과는 달리 은닉층의 결과를 출력으로 보내는 동시에 은닉층의 다음 입력 값으로 활용한다(Kim et al., 2020). 즉, 은닉층에 이전 정보를 기억시켜 학습을 진행하기 때문에 데이터의 시간적 순서 관계가 중요한 시계열 데이터에 적합한 모델이다(Joo and Choi, 2018).

RNN은 Fig. 3과 같이 구성되며 은닉층에서의 연산 값과 출력 값을 Eqs. (1), (2)와 같이 나타낼 수 있다. 여기서 htt시점에서의 은닉층을, φ는 은닉층과 출력층에서의 활성화 함수를, Wxh는 입력층에서 은닉층으로의 가중치 행렬을, Why는 은닉층에서 출력층으로의 가중치 행렬을, b는 은닉층과 출력층에서의 편향 벡터를 의미한다.

Fig. 3

Structure of RNN

(1)ht=ϕh(Whxxt+Whhht1+bh)
(2)yt=ϕy(Whyht+by)

3.1.2 Long Short Term Memory

일반적인 RNN 모델은 입력값과 은닉층을 거친 이전 결과값을 반복하여 학습한다. 하지만 학습이 진행됨에 따라 출력과 먼 위치에 있는 정보를 기억할 수 없게 되는데 이를 장기 의존성(Long Term Dependency)의 문제라고 한다. 즉, 입력값과 출력 시점의 거리가 멀어질수록 오차 역전파 과정에서 기울기가 소실되거나 폭주하여 모델의 학습 능력이 저하된다. 이러한 문제를 극복하기 위해 제안된 RNN 기반의 모델이 Hochreiter and Schmidhuber (1997)가 개발한 Long Short Term Memory (LSTM)이다.

LSTM의 구조는 Fig. 4와 같이 표현되며, LSTM에서는 기울기 소실 및 폭주의 문제를 해결하기 위해 일반적인 RNN의 은닉층을 대체하는 LSTM 셀(Cell)이 활용된다. LSTM 셀은 RNN에서 활용된 은닉 상태(Hidden State)에 더해 셀 상태(Cell State)가 도입되었는데, 셀 상태는 이전 정보가 다음으로 흐르게 하는 역할을 한다. LSTM 셀에서는 이전 셀 상태의 정보를 제어하여 다음 셀 상태로 출력하는 과정에서 망각 게이트(Forget Gate), 입력 게이트(Input Gate), 출력 게이트(Output Gate)가 활용된다.

Fig. 4

Structure of LSTM

우선 망각 게이트(Eq. (3))는 과거의 정보를 얼마나 잊을지 결정하는 단계로, 시그모이드 함수(σ)를 거쳐 표출된 0에서 1사이의 값을 이전 셀 상태에 곱하게 된다. 여기서 시그모이드 함수 값이 0에 가까울수록 과거 정보를 많이 잃게 되고, 1에 가까울수록 과거 정보를 많이 기억하게 된다. 망각 게이트 ft는 입력 데이터 벡터 xt와 가중치 행렬 Wxf의 곱, 은닉 상태 ht-1과 가중치 행렬 Whf의 곱, 그리고 편향 bf를 더한 후 시그모이드 함수를 취해 산정한다.

(3)ft=σ(Wxfxt+Whfht1+bf)

다음 단계인 입력 게이트(Eq. (4))에서는 새로운 정보 중 어떤 정보를 통해 셀 상태를 업데이트할 것인지 결정하는 단계이다. 여기서 Eq. (4a)를 통해 새로운 정보를 어느 정도 반영할지 결정하고, Eq. (4b)를 통해 새로운 정보의 후보 벡터(Ct~)를 구한다. 다음으로 망각 게이트와 입력 게이트에서 도출한 값을 활용해 이전 셀 상태를 다음 셀 상태로 업데이트한다(Eq. (5)). 여기서*는 각 행렬 인자 간의 곱셈을 의미한다.

(4a)it=σ(Wxixt+Whiht1+bi)
(4b)C˜t=tanh(Wx C˜xt+Wh C˜ht1+bC˜)
(5)Ct=ft*Ct1+it*C˜t

마지막으로 출력 게이트(Eq. (6))에서는 업데이트된 셀 상태를 다음 은닉 상태로 얼마나 전달할 것인지 계산한다.

(6a)ot=σ(Wxoxt+Whoht1+bo)
(6b)ht=ot*tanh(Ct)

3.1.3 Gated Recurrent Unit

LSTM과 같이 RNN의 한계점을 개선하기 위해 Cho et al. (2014)에 의해 개발된 Gated Recurrent Unit (GRU)는 LSTM보다 간결한 구조를 가진다. 망각 게이트, 입력 게이트, 출력 게이트를 포함하는 LSTM과는 달리, GRU (Fig. 5)는 초기화 게이트(Reset Gate)와 업데이트 게이트(Update Gate)로 이루어져 있다. GRU는 LSTM에 비해 파라미터가 적지만 연산 속도가 빠르고 LSTM과 유사한 성능을 보인다는 장점이 있으며 LSTM보다 소규모 데이터 셋에 적합하다고 보고된 바 있다(Chung et al., 2014; Yang et al., 2020).

Fig. 5

Structure of GRU

GRU의 연산은 다음과 같은 과정을 거쳐 수행된다. 먼저 초기화 게이트( rt)는 과거의 정보 중 얼마만큼의 정보를 잊어야 하는지 결정하며 Eq. (7)과 같이 표현된다. 다음으로 업데이트 게이트( zt)는 과거의 정보와 현재의 정보를 얼마나 반영할지 결정하며 Eq. (8)과 같이 표현된다.

(7)rt=σ(Wxrxt+Whrht1+br)
(8)zt=σ(Wxzxt+Whzht1+bz)

마지막으로 Eq. (9)를 활용하여 과거 은닉 상태와 초기화 게이트의 결과를 곱해 후보 활성화 벡터(Candidate Activation Vector, ht~)를 산정한 후 최종적으로 다음 은닉 상태(Eq. (10))를 계산한다.

(9)h˜t=tanh(Wxh˜xt+Whh˜(rt*ht1)+bh˜)
(10)ht=zt*ht1+(1zt)*h˜t

3.2 데이터 스케일링

본 연구에서 활용한 변수들의 스케일은 각각 다르다. 스케일이 다른 변수들을 통해 모델을 학습시키게 되면 각 변수 값의 크기에 모델이 영향을 받아 학습 성능이 떨어질 수 있다. 따라서 분석에 활용되는 변수들의 범위나 분포를 동일하게 조정하는 과정이 필요하다. 데이터 스케일링 방법은 여러 가지가 있으나 본 연구에서는 표준화(Standardization)를 통해 데이터 스케일링을 수행하였다. 표준화는 데이터를 평균이 0이고 분산이 1인 표준정규분포로 변환하는 방법으로 Eq. (11)과 같이 표현된다.

(11)xi*=xiμσ

3.3 가중치 균형 방법

본 연구에서는 모델의 학습과 검증 및 테스트를 위해 데이터를 Table 1과 같이 분리하였다. 먼저, 1981년부터 2014년까지의 데이터를 모델의 학습에 활용하였다. 그 다음 2015년부터 2017년까지의 데이터를 학습된 모델의 검증에 활용하였고, 최적 모델의 성능을 평가하기 위해 2018년부터 2021년 8월까지의 데이터를 활용하였다.

Number of Heatwave Days

하지만 Table 1에 나타난 바와 같이 폭염이 아닌 날에 비해 폭염일이 매우 적어 클래스 불균형 문제가 있다. 가중치 균형 방법(Weight Balancing)은 클래스 비율에 따라 손실 함수에 가중치를 설정하는 방법으로, 두 클래스의 비율이 1:3이면 가중치를 3:1로 설정하여 균형을 맞추는 방법이다. 본 연구에서는 폭염일과 폭염이 아닌 날의 비율에 따라 데이터가 적은 쪽에 더 큰 가중치를 부여해 클래스 불균형을 고려하였다.

3.4 모델의 성능 평가

머신러닝 모델의 성능 평가는 일반적으로 연구의 목적이 회귀 문제인지 분류 문제인지에 따라 다른 평가 지표를 활용한다. 본 연구에서는 종속변수로 폭염이 발생하는 경우를 1, 발생하지 않는 경우를 0으로 정의하여 폭염의 발생확률을 예측하는 것을 목표로 하였다. 따라서 이진 분류 문제에 해당하는 평가 지표를 통해 모델의 성능을 평가하였다.

분류 모델의 성능을 평가하기 위한 지표로는 혼동행렬(Confusion Matrix), 정확도(Accuracy), 정밀도(Precision), 재현율(Recall), F1 점수(F1-Score), AUC (Area Under the Curve), Kappa 계수(Cohen’s Kappa Coefficient) 등이 활용된다. 혼동행렬은 실제데이터와 모델 예측 데이터의 조합을 행렬로 표현한 것으로 이진 분류 문제의 경우 True Positive (TP), True Negative (TN), False Positive (FP), False Negative (FN) 4가지 경우가 나온다. 여기서 정확도는 전체 데이터에서 맞게 예측한 데이터의 비율을 의미하며 Eq. (12)와 같이 표현된다. 정확도는 분류 모델의 성능을 평가하는 가장 대표적인 평가 지표이지만 분류하고자 하는 데이터가 불균형한 경우 적합하지 않다.

(12)Accuracy=TP+TNTP+TN+FP+FN

정밀도(Eq. (13))는 양성으로 예측한 데이터 중 실제 양성 데이터가 얼마나 있는지를 의미하고, 재현율(Eq. (14))은 실제 양성 데이터 중 얼마나 양성으로 잘 예측했는지를 의미한다. 일반적으로 정밀도는 실제 음성인 데이터를 양성으로 예측하면 문제가 발생하는 경우, 재현율은 실제 양성인 데이터를 음성으로 예측하면 문제가 발생하는 경우에 중요하게 활용된다.

(13)Precision=TPTP+FP
(14)Recall=TPTP+FN

불균형 데이터를 분류하는 문제에서는 모델 성능의 평가 지표로 F1 점수, AUC, Kappa 계수가 적합하다(Kim, 2009; Lee and Lee, 2014; Hwang et al., 2021). F1 점수(Eq. (15))는 정밀도와 재현율의 조화평균을 의미하며 정밀도와 재현율이 어느 한쪽으로 치우치지 않을 때 높은 값을 보인다. ROC 곡선(Receiver Operator Characteristic Curve)은 위양성율(False Positive Rate)이 변할 때 재현율이 어떻게 변하는지를 나타낸 것으로 이 곡선 아래의 면적을 AUC라고 한다. 일반적으로 AUC가 0.8 이상일 경우 모델이 좋은 분류 성능을 보인다고 판단한다. Kappa 계수(κ)는 동일한 대상에 대해 두 관찰자의 분류 결과가 우연히 일치할 가능성을 보정하여 정확도를 측정하는 것이며 Eq. (16)과 같이 표현된다. 여기서 p0는 모델의 정확도를, pe는 예측 데이터가 실제 데이터와 우연히 일치할 확률을 의미한다. Landis and Koch (1977)이 제시한 기준을 참고하였을 때 Kappa 계수가 0.6 이상 0.8 미만인 경우 상당히 일치함을, 0.8 이상인 경우 거의 완벽히 일치함을 의미한다.

(15)F1Score=2×Precision×RecallPrecision+Recall
(16)κ=p0pe1pe

4. 연구 결과

본 연구에서는 RNN, LSTM, GRU 모델을 활용하여 일 단위 폭염 발생확률을 예측하는 것을 목표로 하였다. 모델의 학습은 이전 14일의 독립변수 데이터를 학습해 다음날(15일)의 폭염 발생확률을 예측하는 것으로 설정하였으며, 모델이 산정한 폭염 발생확률이 50% 이상인 경우 폭염 발생일로, 50% 미만인 경우 폭염 비발생일로 판단하였다.

4.1 모델의 하이퍼파라미터 및 학습

모델의 하이퍼파라미터(Hyperparameter)는 모델링 시 연구자가 직접 설정해주는 값을 의미한다. 하이퍼파라미터는 학습률(Learning Rate), 배치 크기(Batch Size), 손실 함수(Cost Function) 등 여러 가지가 있으며, 하이퍼파라미터를 어떻게 설정하는지에 따라 분석 결과는 달라진다. 하지만 수많은 경우의 하이퍼파라미터 조합을 시도하는 것은 현실적으로 한계가 있기 때문에 본 연구에서는 배치 크기, 활성화 함수(Activation Function), 은닉층 수, 뉴런 수를 변경하며 결과를 도출하였고, 분석에 활용한 하이퍼파라미터의 조합을 Table 2에 나타냈다. 모델의 학습 과정에서 과적합 방지를 위해 Dropout 층, L2 규제(L2 Regularization), Early Stopping을 고려하였다.

Combinations of Hyperparameters

4.2 모델 성능 평가 및 최적 모델 선정

폭염은 인명 피해를 비롯해 사회⋅경제적 피해를 유발하는 자연 재해로 이를 제대로 예측하지 못한다면 대비 및 대응 과정에서 문제가 발생할 수 있다. 이러한 부분을 고려하기 위해 본 연구에서는 모델의 성능 평가 지표로 재현율을 활용하여 실제 폭염일을 모델이 제대로 예측했는지 확인하였다. 또한 불균형 데이터의 평가 지표로 적합한 F1 점수와 AUC, Kappa 계수를 활용하여 모형의 전반적인 성능을 평가하였다. 학습 데이터로 모델을 구성하고 검증 및 테스트 데이터를 활용해 모델의 성능을 평가한 결과 Fig. 6이 최적 모델로 선정되었고, 평가 결과를 Table 3에 나타냈다.

Fig. 6

Structure of Optimized Model

Results of Quantitative Evaluation from Optimized Model

Fig. 6에 나타난 바와 같이 최적 모델의 경우 4개의 GRU층을 쌓아올린 심층 구조 구성되었으며, GRU층 사이의 Dropout 층과 출력층에서의 L2 규제로 과적합을 방지하였다. 또한, 출력층에서의 활성화 함수를 시그모이드 함수로 설정하여 폭염 발생확률을 산정할 수 있었다. 검증 데이터와 테스트 데이터를 통한 모델의 성능 평가 결과 F1 점수와 AUC의 경우 0.8 이상의 높은 값을 보였고, Kappa 계수는 높은 일치도를 의미하는 0.6 초과의 값을 보였다. 따라서 최적 모델은 과적합이 발생하지 않았다고 판단할 수 있으며, 데이터의 불균형에도 불구하고 높은 성능을 보임을 확인할 수 있다.

재현율 측면에서 최적 모델을 평가한 결과, 최적 모델은 검증 및 테스트 데이터의 실제 폭염일 45일과 72일 중 각각 78%와 86%를 맞춰 높은 예측 성능을 보였다. 특히 테스트 데이터(Table 4)의 경우 폭염 피해가 극심했던 2018년(5월 15일~9월 30일)에 대해 폭염일 35일 중 1건을 제외한 34건을 맞췄고, 폭염이 아닌 날 또한 104건 중 97건을 바르게 예측하였다. 실제 폭염일을 제대로 예측하지 못했을 경우 인명 피해와 같은 심각한 피해가 발생할 수 있다. 따라서 본 연구에서는 폭염 재난의 대응 측면에서 활용할 수 있을만한 유의미한 결과를 도출하였다고 판단된다.

Prediction of Test Dataset

5. 결 론

본 연구에서는 기상 데이터 및 심층신경망 기반의 인공지능 모델을 활용하여 서울특별시의 일 단위 폭염 발생확률을 예측하였다. 본 연구를 수행한 결과는 다음과 같다.

본 연구에서는 1981년부터 2021년 8월까지의 데이터를 훈련, 검증, 테스트 데이터로 구분한 후 훈련 데이터를 활용해 RNN, LSTM, GRU 모델의 학습을 진행하였다. 모델의 학습 결과 심층 GRU 모델이 최적 모델로 선정되었으며 과적합 문제도 발생하지 않았다. 또한 불균형한 데이터를 통해 학습되었음에도 성능 평가 지표 모두 높은 값을 보였다. 특히 검증 및 테스트 데이터에서 실제 폭염 발생일 중 78%, 86%를 알맞게 예측하여 높은 예측 정확도를 보였다.

현재 기상청에서는 수치예보 모델을 활용해 폭염 정보를 예측하는데 이러한 방법은 데이터를 가공하고 분석하는데 긴 시간이 소요된다. 본 연구에서 개발한 폭염 발생확률 예측 모델은 기존의 수치예보 모델에 비해 상대적으로 간단하지만 신속한 결과를 도출할 수 있다는 장점이 있으며, 높은 예측 정확도를 보이기 때문에 실용성이 있다. 따라서 서울특별시의 폭염 대응을 위한 의사결정 과정에서 본 연구의 결과가 활용될 수 있을 것으로 판단된다. 또한, 서울특별시 이외에 다른 지자체에서도 본 연구 방법을 적용할 수 있기 때문에 예측을 위한 시⋅공간 해상도를 변경하여 분석을 진행한다면 지자체 단위로 사전 대비 및 대응 역량을 선택적으로 집중하여 효율적으로 폭염 재난을 관리할 수 있을 것이라 판단된다.

감사의 글

본 연구는 행정안전부 재난안전 취약핵심역량 도약기술 개발 사업(2020-MOIS33-006)의 지원을 받아 수행되었습니다.

References

1. Cho H.-M, Yi Y.-H. 2018. A plan to improve response to heatwave in Seoul Seoul Institute. (조항문, 이윤혜. (2018). 서울시 폭염 대응력 향상 방안. 서울연구원).
2. Cho K, Van Merriënboer B, Gulcehre C, Bahdanau D, Bougares F, Schwenk H, Bengio Y. 2014. Learning phrase representations using RNN encoder- decoder for statistical machine translation. Proceedings of the Empirical Methods in Natural Language Processing Doha, Qatar: p. 1724–1734.
3. Chung J, Gulcehre C, Cho K, Bengio Y. 2014;Empirical evaluation of gated recurrent neural networks on sequence modeling. arXiv preprint arXiv:1412.3555
4. Hochreiter S, Schmidhuber J. 1997;Long short-term memory. Neural Computation 9(8):1735–1780.
5. Hwang G, Lee W.-J, Oh S.-J. 2021;Change attention based dense siamese network for remote sensing change detection. Journal of Broadcast Engineering 26(1):14–25.
6. Intergovernmental Panel on Climate Change (IPCC). 2014. Climate change 2014:Impacts, adaptation and vulnerability Cambridge: Cambridge University Press.
7. Joo I.-T, Choi S.H. 2018;Stock prediction model based on bidirectional LSTM recurrent neural network. J. Korea Inst. Inf. Commun. Eng 18(4):204–208.
8. Kang M, Kim H. 2021;Prediction of heat wave based on LSTM considering urban-social characteristics of Busan. The Korea Spatial Planning Review 109:23–36.
9. Kim E.-B, Park J.-K, Jung W.-S. 2014;A study on the occurrence characteristics of tropical night day and extreme heat day in the metropolitan city, Korea. Journal of Environmental Science International 23(5):873–885.
10. Kim M.-J. 2009;Ensemble learning for solving data imbalance in bankruptcy prediction. Journal of Korean Institute of Intelligent Systems 15(3):1–15.
11. Kim Y.I, Kim D, Lee S.O. 2020;Prediction of temperature and heat wave occurrence for summer season using machine learning. J. Korean Soc. Disaster Secur 13(2):27–38.
12. Kim Y.-J, Kim H, Kim Y.-K, Kim J.-K, Kim Y.-M. 2014;Evaluation of thermal environments during the heat waves of summer 2013 in Busan Metropolitan Area. Journal of Environmental Science International 23(11):1929–1941.
13. Korea Environment Institute (KEI). 2020;2020 Heat wave impact report. (한국환경정책⋅평가연구원. (2020). 2020 폭염영향 보고서.)
14. Korea Meteorological Institute (KMI). 2021; Development of hazard impact model for heat wave. (한국기상산업기술원. (2021). 폭염 분야 재해영향모델 개발 최종보고서.)
15. Landis J.R, Koch G.G. 1977;The measurement of observer agreement for categorical data. Biometrics 33:159–174.
16. Lee H.-C, Cho Y.-J, Lim B, Kim S.-B. 2020;Study on the association of casualties and classification of heat wave weather patterns in South Korea using k-means clustering analysis. J. Korean Soc. Hazard Mitig 20(3):11–18.
17. Lee H.-D, Min K.-H, Bae J.-H, Cha D.-H. 2020;Characteristics and comparison of 2016 2018 heat wave in Korea. Atmosphere 30(1):1–15.
18. Lee H.-J, Lee S. 2014;A comparison of ensemble methods combining resampling techniques for class imbalanced data. The Korean Journal of Applied Statistics 27(3):357–371.
19. National Disaster Management Institute (NDMI). 2019;Assessment and prediction analysis on regional heat wave and cold wave risk
20. NOAA National Centers for Environmental Information. 2021. State of the climate. Global climate report for July 2021 Retrieved September 13, 2021. from https://www.ncdc.noaa.gov/sotc/global/202107.
21. Ozbek A, Sekertekin A, Bilgili M, Arslan N. 2021;Prediction of 10-min, hourly, and daily atmospheric air temperature:Comparison of LSTM, ANFIC-FCM, and ARMA. Arab. J. Geosci 14:622.
22. Park J.E, Heo B.Y, Sunwoo Y. 2016;A study on human damage due to heat wave by region. J. Korean Soc. Hazard Mitig 16(1):103–109.
23. Rumelhart D.E, Hinton G.E, Williams R.J. 1986;Learning representations by back-propagating errors. Nature 323:533–536.
24. Schoen C. 2005;A new empirical model of the temperature- humidity index. J. Appl. Meteor. Climatol 44:1413–1420.
25. Toharudin T, Pontoh R.S, Caraka R.E, Zahroh S, Lee Y, Chen R.C. 2021;Employing long short-term memory and Facebook prophet model in air temperature forecasting. Commun. Stat. Simul. Comput :1–24.
26. Yang S, Yu X, Zhou Y. 2020. LSTM and GRU neural network performance comparison study:Taking Yelp review dataset as an example. Proceedings of the 2020 International Workshop on Electronic Communication and Artificial Intelligence Shanghai, China. p. 98–101.
27. Yoon J, Jeon M. 2017. Temperature forecasting model by using deep learning technology based on LSTM. Proceedings of 2017 The Institute of Electronics and Information Engineers Fall Conference Incheon, Korea. p. 912–915.

Article information Continued

Fig. 1

Study Area (Seoul Metropolitan Government)

Fig. 2

Heatwave Days of Seoul (1981~2021)

Fig. 3

Structure of RNN

Fig. 4

Structure of LSTM

Fig. 5

Structure of GRU

Table 1

Number of Heatwave Days

Dataset Heatwave Dataset
1 (Heatwave O) 0 (Heatwave X)
Train Set
1981~2014
226 4,976
Validation Set
2015~2017
45 414
Test Set
2018~2021
72 509

Table 2

Combinations of Hyperparameters

Hyperparameter Settings
Batch Size 32, 64
Neurons 128, 256, 512
No. Hidden Layers 1, 2, 3, 4, 5
Activation Function tanh, ReLu, Elu
Optimizer Adam
Initial Learning Rate 0.001
Epochs 1,000
EarlyStopping 20
Loss Function Binary Cross Entropy

Table 3

Results of Quantitative Evaluation from Optimized Model

Dataset Precision Recall F1 - Score Cohen’s κ AUC
Validation Set 0.556 0.778 0.801 0.603 0.855
Test Set 0.579 0.861 0.818 0.638 0.885

Fig. 6

Structure of Optimized Model

Table 4

Prediction of Test Dataset

Dataset Heatwave O Heatwave X
Actual Predicted Actual Predicted
2018 35 34 104 97
2019 15 9 138 126
2020 4 3 149 137
2021 18 16 104 90