국내 기상 데이터를 활용하여 건설현장 화재 위험 예측을 위한 ANN 모델 개발

Development of an Artificial Neural Network Model to Predict Fire Risk at Construction Sites Using Domestic Meteorological Data

Article information

J. Korean Soc. Hazard Mitig. 2025;25(4):1-8
Publication date (electronic) : 2025 August 31
doi : https://doi.org/10.9798/KOSHAM.2025.25.4.1
김원창*, 이태규**
* 정회원, 세명대학교 소방방재공학과 박사과정(E-mail: firesafety9505@gmail.com)
* Member, Ph.D. Candidate, Department of Fire and Disaster Prevention Engineering, Semyung University
** 정회원, 세명대학교 소방방재학과 교수(Tel: +82-43-649-1315, Fax: +82-43-649-1787, E-mail: ltg777@semyung.ac.kr
** Member, Professor, Department of Fire and Disaster Prevention, Semyung University
** 교신저자, 정회원, 세명대학교 소방방재학과 교수(Tel: +82-43-649-1315, Fax: +82-43-649-1787, E-mail: ltg777@semyung.ac.kr
** Corresponding Author, Member, Professor, Department of Fire and Disaster Prevention, Semyung University
Received 2025 June 25; Revised 2025 June 26; Accepted 2025 July 24.

Abstract

본 연구는 국내 기상 데이터를 활용하여 건설현장 화재 위험성을 예측하는 인공신경망(Artificial Neural Network, ANN) 기반 회귀 모델을 개발하고, 은닉층 수에 따른 예측 성능의 변화를 비교⋅분석하였다. 2010년부터 2023년까지의 월별 건설현장 화재 발생 건수 및 주요 기상 변수를 수집한 후, 피어슨 상관관계를 바탕으로 기온, 습도, 이슬점 등 상관성이 높은 변수들을 독립변수로 선정하였다. 모델 성능 비교 결과, 은닉층 1개로 구성된 ANN 모델이 가장 우수한 예측 정확도를 나타냈으며, 은닉층이 증가할수록 성능이 저하되고 과적합 가능성이 증가하는 경향이 확인되었다. 변수 중요도 분석에서는 최저기온과 체감온도가 주요 예측 요인으로 도출되었다.

Trans Abstract

This study developed a regression model based on an artificial neural network (ANN) to predict fire risk at construction sites based on domestic meteorological data. Monthly fire incident records and key meteorological variables from 2010 to 2023 were collected. Independent features were selected based on strong Pearson correlations, including temperature, humidity, and dew point. The performance comparison showed that the ANN model with a single hidden layer achieved the highest prediction accuracy, while additional hidden layers led to reduced performance and an increased risk of overfitting. Permutation importance analysis identified minimum temperature and apparent temperature as the most influential predictors.

1. 서 론

건설현장은 구조물 조립, 용접, 단열재 시공 등 화기성 공정이 빈번하게 이루어지기 때문에 화재 발생 가능성이 매우 높다. 2014년 고양터미널 화재에서는 8명이 사망하고 119명의 부상자가 발생하였으며, 2008년 이천 냉동창고 화재에서는 40명의 사상자가 발생하였다(Lee, 2018). 김회수 외 연구진은 2015년부터 건설현장에서의 화재 발생 건수가 지속적으로 증가하고 있음을 언급하며, 이는 다양한 안전 대책에도 불구하고 건설현장이 여전히 작업자의 행동과 외부 환경에 크게 영향을 받는 불안정한 환경임을 시사한다고 보았다. 이들은 화재의 주요 원인으로 작업자, 매체, 관리 요인 순으로 언급하였다(Kim et al., 2019).

최근 연구에서는 AI (artificial intelligence) 접목하여 기상 데이터와 화재 위험을 정량적으로 예측하고자 하는 연구가 활발히 수행되고 있다(Hong et al., 2019; Ryu and Kwak, 2020). 장진명 외 연구진은 기온, 풍속, 습도 등의 기상 요인을 반영하여 산림화재를 예측하였으며, 서민송 외 연구진은 머신러닝 기반으로 경기도 지역의 기상정보를 활용한 화재위험요인 분석을 통해 예측 가능성을 제시하였다(Seo et al., 2021; Jang et al., 2023). 선행연구를 통해 기상 조건이 화재 발생에 유의미한 영향을 미친다는 점을 확인할 수 있으며, 이러한 점을 고려할 때 외부 환경에 지속적으로 노출되는 건설현장은 계절에 따른 기온, 습도 등의 변화에 따라 화재 위험에 더욱 민감하기 때문에 기상 데이터를 활용한 정량적 예측이 충분히 가능할 것으로 판단된다.

또한 다양한 재난 예측 분야에서머신러닝 뿐만이 아닌 다양한 변수들의 복잡한 관계성을 해석할 수 있는 인공신경망(Artificial Neural Network, ANN) 모델이 널리 활용되고 있다. Ku 외 연구진은 대만의 ‘Keelung’시를 대상으로 기상 데이터를 활용하여 화재 발생을 예측하는 ANN 모델을 개발하였으며, 해당 모델은 결정계수(R2) 0.89, 평균절대오차(MAE) 0.06의 우수한 예측 성능을 보였다. 특히 단일 은닉층 구조에서도 안정적인 정확도를 달성하였으며, 복잡한 다층 신경망 구조가 학습 성능 향상에는 효과적일 수 있으나 과적합 가능성을 수반한다는 점에서 은닉층 구조 설정의 신중함을 강조하였다(Ku and Liu, 2024). 이와 유사하게, Saraswat 외 연구진은 은닉층 수와 깊이에 따라 산불 확산 속도 예측 정확도 및 입력 변수 중요도에 유의미한 차이가 발생함을 보고하였으며, 이는 은닉층 구조가 ANN 모델의 성능에 중요한 영향을 미친다는 점을 의미한다(Saraswat et al., 2024).

하지만 선행연구들은 예측 정확도를 높이기 위해 건축물 정보나 고가의 센서 데이터까지 활용하는 등 모델의 복잡성을 높이는 경향이 있었다. 이러한 접근법은 데이터 수집의 어려움과 비용 문제로 인해 실제 건설현장에서 보편적으로 적용하기에는 명백한 한계를 갖는다. 이로 인해 특히 자원이 부족한 대다수의 현장에서 즉시 도입할 수 있는 실용적인 화재 위험 예측 도구가 부재한 실정이다.

이에 본 연구는 국내 기상 데이터를 기반으로 ANN 모델을 구축하고, 은닉층 구조에 따른 예측 성능 변화를 비교⋅분석하여 건설현장 화재 위험 예측에 적합한 최적의 모델 구조를 제시하고자 한다.

2. 분석 계획 및 방법

2.1 데이터 수집

Table 1에는 본연구에 활용된 데이터 정보를 나타냈다. 건설현장 화재 데이터는 소방청 화재대응조사과에서 제공하는 공공데이터를 활용하였다. 국내 기상 데이터는 기상청 주관 기상자료개방포털에 등록되어있는 자료를 활용하였다.

Research Plan

2.2 모델링(modeling) 및 평가

본 연구에서는 인공신경망(Artificial Neural Network, ANN)을 기반으로 건설현장 화재 위험성을 예측하기 위한 회귀 모델을 구축하였다. 종속변수는 실제 화재 발생 건수를 직접 활용하지 않고, 기상조건별 누적 화재 건수를 바탕으로 도출된 위험성 지표(risk index)를 활용하였다. 해당 지표는 주요 기상 변수에 대한 가중치 기반 비율 산정을 통해 정량화되었다.

독립변수는 다양한 기상 요소 중 종속변수와의 상관관계 분석 결과를 바탕으로 선별하였으며, 선정된 변수에 대해 표준화(StandardScaler)를 수행하여 모델 입력값으로 사용하였다.

ANN 모델의 구조를 Table 2에 정리하여 나타냈다. 신경망 모델은 Keras Sequential API를 기반으로 구성하였으며, 출력층은 단일 뉴런으로 구성되어 있고 활성화 함수 없이 연속형 값을 출력한다(Darkhanbat et al., 2021).

Configuration of the ANN Model

ANN 모델의 예측 성능 평가는 학습 및 테스트 데이터셋을 기준으로 평균제곱근오차(Root Mean Squared Error, RMSE), 결정계수(Coefficient of Determination, R2 Score)를 활용하였다.

(1)RMSE=1ni=1n(yiyi)2
(2)R2=1i=1n(yiyi)2i=1n(yiy¯i)2

3. 건설현장 화재 위험성 예측 모델 개발

3.1 건설현장 화재 데이터 탐색

Fig. 1에는 2010년부터 2023년 07월까지의 건설현장 화재 누적 발생 건수 시계열로 나타냈다. 월별로 화재 발생 건수는 약 30건에서 최대 190건까지 큰 폭으로 변동하며, 특정 시기에는 단기간 급증하거나 급감하는 현상이 반복적으로 나타난다. 2018년 1월에는 190건의 화재가 발생하여 가장 높은 수치를 기록하였고, 2019년 1월에도 133건으로 급증하였다. 반면 2020년 4월, 2021년 5월, 2023년 6월 등에서는 30건 이하로 급감하는 양상이 나타난다. 이러한 계절적⋅시계열적 패턴은 기상 조건의 영향 가능성이 높을 것으로 판단된다. 특히 화재 건수가 급증하는 시기는 겨울에서 초봄(1~3월), 급감하는 시기는 여름에서 초가을(7~9월)에 집중되어 있으며, 이는 국내 계절별 기상 변화, 즉 건조한 대기 상태, 낮은 습도, 강한 바람 등이 화재 위험성에 영향을 미칠 수 있음을 의미한다.

Fig. 1

Monthly Cumulative Number of Construction Site Fire Incidents

이러한 분석 결과는 건설현장의 화재 발생이 외부 환경 요소인 기상조건과 유의미한 관계가 있을 수 있다는 가설을 지지하며, 이에 따라 높은 신뢰성을 갖는 기상 데이터를 기반으로 한 건설현장 화재 위험성 예측 개발이 가능할 것으로 판단된다.

3.2 건설현장 화재와 기상 조건의 관계성 분석

Table 3에는 2010년부터 2023년 7월까지의 월별 건설현장 화재 발생 건수 데이터를 기반으로 기상 조건과의 피어슨 상관계수(Pearson correlation coefficient)를 분석 결과를 나타냈다. 기압은 화재 건수와 0.66의 양의 상관관계를 보였으나, 기온 관련 변수(평균기온, 최고기온, 최저기온) 및 이슬점과는 모두 -0.70 이상 수준의 강한 음의 상관관계를 보였다. 특히, 이슬점과의 상관계수는 -0.75로 가장 강한 음의 관계를 나타냈으며, 이는 공기 중 수증기 포화 상태가 낮을수록 화재 발생 위험이 증가함을 의미한다. 또한, 습도, 유효습도, 체감온도 등도 모두 -0.70 내외의 상관계수를 보였으며, 습도가 낮을수록 건조한 환경에서 화재 발생 가능성이 높다는 전형적인 패턴이 관측되었다. 강수량 역시 화재 건수와 -0.62의 상관관계를 보였으며, 비가 적을수록 화재가 더 많이 발생하는 경향을 나타냈다. 반면, 풍속 계열 변수들은 모두 약한 상관관계를 보였으며, 유의미한 연관성이 없는 것으로 해석된다. 이러한 결과를 기반으로, 인공신경망(ANN) 모델의 입력 변수 구성은 화재 건수와의 상관관계가 절댓값 기준으로 0.6 이상인 항목들로 설정하였다. 이는 ANN 모델이 화재 발생을 예측하는 데 있어, 건조하고 기온이 낮은 환경, 즉 수분이 적고 차가운 조건에서 화재 위험성이 높다는 패턴을 학습하게 된다는 의미이며, 이러한 변수들의 방향성(양/음)이 모델의 판단 기준에 중요한 요소로 작용할 것이다.

Results of Correlation Analysis

3.3 ANN 모델링(modeling) 및 평가

본 연구에서는 건설현장 화재 발생 건수 데이터를 활용하여 국내 기상 조건에 따른 위험성을 ‘0~1’ 사이의 정량적 지표로 구축하기 위해서 Fig. 2와 같이 각 기상조건별 누적 건설현장 화재 건수를 가중치로 구축하여 아래의 식으로 계산하였다.xi는 기상 조건별 건설현장 화재 발생 비율이다.

Fig. 2

Monthly Cumulative Number of Construction Site Fire Incidents

(3)Rish=1.0i=1n(1.0xi)

본 연구에서 ANN 모델이 예측하는 최종 출력값, 즉 ‘화재 위험성(Fire Risk)’은 단순 발생 건수가 아닌, 특정 기상 조건 하에서의 상대적인 화재 발생 빈도를 나타내는 정규화된 지표(Index)이다. 학습 데이터의 라벨(Label)을 생성하기 위해, 먼저 소방청 화재대응조사과에서 제공하는 ‘일별 전국 건설현장 화재 발생 데이터’를 기상청의 ‘일별 기상 데이터’와 결합하였다. 그 후, 본 연구에서는 각 기상 조건에서 발생한 실제 화재 건수를 집계하였다. 이렇게 특정 기상 조건과 연계된 화재 발생 건수를 일종의 가중치(Weight)로 삼아, 전체 데이터 분포를 고려한 최소-최대 정규화(Min-Max Scaling)를 통해 0과 1 사이의 ‘화재 위험성 지표’로 변환하였다.

따라서, 본 모델이 학습하는 라벨 값은 ‘화재가 0건 발생했다’ 또는 ‘30건 발생했다’는 식의 절대적 수치가 아니라, ‘평균기온 20 ℃, 습도 40%와 같은 기상 조건은 화재 발생 위험이 0.85 수준이다’와 같이 해당 기상 조건이 내포하는 상대적 위험 수준을 의미한다.

이러한 접근은 모델이 각기 다른 기상 요소들의 복합적인 관계 속에서 화재 발생 가능성을 보다 정밀하게 학습하게 한다.

Fig. 3에는 ANN 모델의 구조를 나타냈으며, 국내 기상 데이터를 활용하여 건설현장 화재 위험성을 예측하기 위해 설계되었다. 해당 모델은 다층 퍼셉트론(Multilayer Perceptron, MLP) 구조를 기반으로 구성되었으며, 모델의 예측 성능에 미치는 은닉층 깊이의 영향을 분석하기 위해 은닉층을 1층에서 4층까지 변화시키며 실험을 진행하였다. 강수량 데이터는 전체 관측치 중 70% 이상이 ‘0 mm’로 심각한 편향(Skewed distribution)을 보였으며, 회귀 모델의 안정성과 예측 성능에 부정적 영향을 줄 수 있는 것으로 판단되어 독립변수에서 제외하였다.

Fig. 3

Architecture of the ANN Model

Fig. 4에는 은닉층의 수를 1층부터 4층까지 변화시키며 ANN 모델을 학습시킨 결과를 나타냈다. 은닉층이 1층일 때 R2값은 0.88, RMSE는 0.06로 가장 우수한 예측 성능을 보였다. 그러나, 은닉층 수가 증가함에 따라 성능이 일정 수준 하락하였으며, 4층 모델의 경우 R2값은 0.69, RMSE는 0.10으로 가장 낮은 성능을 기록하였다. 이는 은닉층이 과도하게 많을 경우 오히려 과적합(overfitting)의 위험이 커지며, 단순한 모델이 더 나은 일반화 성능을 가질 수 있음을 시사한다. 따라서 기상 조건을 활용하여 건설현장 화재의 위험성을 예측하기 위한 ANN 모델은 은닉층 1개를 구성하는 것이 가장 적합한 것으로 판단된다.

Fig. 4

Model Evaluation Results

Fig. 5에는 ANN 모델의 예측 성능을 시각적으로 비교하기 위해 실제값과 예측값 간의 산점도를 도식화하여 나타냈다. 은닉층이 1개인 모델의 경우, 예측값이 실제값과 매우 근접하게 분포하며 전반적인 선형성이 잘 유지되었다. 특히 고위험 구간에서도 예측값이 과소하거나 포화되지 않고, 실제값과 유사한 수준으로 정확하게 반응하였다. 반면, 은닉층이 2개와 3개로 증가할수록 예측 분포는 점차 퍼지는 경향을 보였으며, 실제값이 증가함에 따라 예측값이 다소 보수적으로 수렴하거나 과소추정되는 양상이 나타났다. 특히 3층 모델의 경우, 고위험 영역에서 예측값이 일정 수준 이상으로 상승하지 못하고 정체되는 경향이 뚜렷하였다. 은닉층이 4개인 모델에서는 이러한 포화 현상이 더욱 두드러졌으며, 대부분의 예측값이 중간값 부근에 밀집되어 실제 고위험 상황을 적절히 반영하지 못하는 한계를 보였다. 이는 과도한 네트워크 복잡도로 인해 학습이 포화되거나, 일반화 성능이 저하된 것으로 해석할 수 있다.

Fig. 5

Training and Validation Loss Curves of the ANN Model

Fig. 6에는 은닉층 1개로 구성된 ANN 모델에 대해 입력 변수들의 상대적 중요도를 분석하였다. 분석 결과, 최저기온이 가장 높은 중요도 값을 보였으며, 모델 예측에 가장 큰 영향을 미치는 핵심 요인으로 나타났다. 이는 건설현장 화재 위험성이 기온이 낮은 환경에서 더욱 민감하게 반응한다는 기존 통계적 경향과도 일치한다. 두 번째로 중요한 변수는 체감온도로서, 외부 기온뿐만 아니라 습도, 풍속 등의 체감 요소가 복합적으로 작용하여 실제 위험 인식에 영향을 줄 수 있음을 시사한다. 그 외에는 이슬점이 상대적으로 높은 중요도를 보였으며, 평균기온), 최대기온, 유효습도 등은 중간 이하 수준의 기여도를 나타냈다. 반면, 습도와 기압 변수는 상대적으로 낮은 중요도를 보여, 해당 ANN 모델에서는 예측에 미치는 영향이 미미한 것으로 분석되었다. 이러한 결과는 인공신경망이 학습한 입력 변수 간의 비선형 관계를 바탕으로 기온 관련 요소가 주요 예측 변수로 작용하고 있음을 보여주며, 향후 예측 모델 최적화 및 변수 선택 과정에서의 참고 기준으로 활용될 수 있다.

Fig. 6

Importance of Variables of ANN

Fig. 7에는 ANN 모델의 학습 과정을 분석하기 위해, 에포크(epoch)에 따른 학습 손실(loss)과 검증 손실(val_loss)을 비교한 결과를 나타냈다. 1개 은닉층 모델이 가장 낮은 검증 손실(Validation Loss)을 보였으며 가장 안정적이고 정확한 학습 성능을 보였으며, 3개 및 4개 은닉층 모델은 검증 손실이 증가하는 과적합 경향을 나타냈다. 이는 은닉층 수가 증가함에 따라 모델의 복잡도는 높아졌지만, 오히려 일반화 성능은 저하되었음을 의미한다.

Fig. 7

Training and Validation Loss Curves of the ANN Model

전체 100 에포크 동안 손실 함수는 빠르게 수렴하는 양상을 보였으며, 초기에는 loss = 0.1308, val_loss = 0.0486으로 시작하였으며, 학습이 진행될수록 양쪽 모두 급격히 감소하였다. 특히 20 epoch 이후부터는 학습 손실과 검증 손실 모두 0.01 이하로 안정적으로 수렴하였으며, 최종 에포크에서는 loss = 0.0057, val_loss = 0.0032 수준으로 매우 낮은 값을 기록하였다. 이는 모델이 과적합 없이 안정적으로 학습되었음을 의미하며, 학습 데이터와 검증 데이터 모두에 대해 높은 예측 일관성을 보인 것으로 판단된다. 또한 두 곡선 사이의 간격이 에포크가 증가함에 따라 점차 줄어들다가 거의 평행을 이루고 있어, 모델의 일반화 성능이 우수함을 간접적으로 보여준다. 따라서, 본 모델은 비교적 단순한 구조임에도 불구하고, 기상 데이터를 기반으로 한 건설현장 화재 위험 예측에 있어 높은 학습 안정성과 예측 정확도를 동시에 확보한 것으로 판단된다.

본 연구 결과는 기술적 성능 평가를 넘어, 건설현장 안전관리 실무에 적용될 수 있는 구체적인 시사점을 제공한다. 고가의 컴퓨팅 자원 없이도 단순한 1개 은닉층 모델이 가장 높은 예측 정확도를 보였다는 점은, 중소 규모 현장에서도 최소한의 비용으로 데이터 기반 화재 위험 예측 시스템을 도입할 수 있는 가능성을 보여준다. 안전 관리자는 일일 기상 예보 데이터를 모델에 입력하여 ‘오늘의 화재 위험 지수’를 정량적으로 예측하고, 이를 근거로 화기 작업 감시 인력 추가 배치나 현장 순찰 강화와 같은 제한된 안전관리 자원을 고위험 시기에 집중할 수 있습니다. 궁극적으로 본 모델은 기존의 경험적, 사후적 대응에서 벗어나, 데이터를 근거로 한 과학적이고 예방적인 안전관리 체계로 전환하는 실질적인 도구로서 높은 활용 가치를 지닌다.

4. 결 론

본 연구는 국내 기상 데이터를 활용하여 건설현장의 화재 위험을 예측하는 ANN (인공신경망) 모델을 개발하고, 모델의 구조적 복잡성이 예측 성능에 미치는 영향을 규명하고자 했다. 분석 결과, 은닉층이 1개인 단순한 구조의 ANN 모델이 결정계수(R2) 0.88, 평균제곱근오차(RMSE) 0.06의 가장 우수한 예측 성능을 보였으며, 은닉층이 2개 이상으로 증가할수록 오히려 성능이 저하되는 현상을 확인했다. 이 결과는 예측 모델 설계 시 무조건적인 복잡성 추구가 아닌, 데이터 특성에 맞는 최적의 구조를 찾는 것이 중요함을 실증적으로 보여준다. 최근 심층신경망의 우수성이 강조되는 추세와 달리, 본 연구는 특정 과업에서 간결한 모델이 과적합(overfitting)을 방지하고 일반화 성능을 높이는 데 더 효과적임을 입증하며 중요한 학술적 시사점을 제공한다.

또한 본 연구는 접근성이 높은 공공 기상 데이터만으로 건설현장 화재 위험도를 유의미한 수준으로 예측할 수 있음을 입증했다. 순열 중요도 분석에서 최저기온, 체감온도, 이슬점이 예측의 핵심 변수로 작용했는데, 이는 건조하고 추운 날씨가 화재 위험을 높인다는 경험적 사실을 데이터로 뒷받침하는 것이다. 복잡한 인적⋅건축적 요인을 요구하는 다른 모델들과 달리, 본 연구는 기상 예보만으로 현장에서 즉시 활용 가능한 ‘기준 모델’을 제시했다. 이를 통해 안전 관리자는 ‘오늘의 화재 위험 지수’를 정량적으로 도출하고, 고위험일의 안전 점검 강화나 화기 작업 특별 허가 같은 구체적인 실행 계획과 연동하여 데이터 기반 의사결정을 내릴 수 있다.

본 연구는 기상 정보만 사용함으로써 예측 범위가 거시적인 ‘배경 위험(Ambient Risk)’에 국한되는 명백한 한계를 갖는다. 이는 용접 불꽃 비산이나 작업자 부주의와 같은 특정 ‘사건 기반(Event-based)’ 위험은 예측할 수 없음을 의미한다. 향후 연구에서는 이러한 한계를 극복하고 예측 정밀도를 높이기 위한 다차원적 접근이 필요하다.

본 연구의 모델을 ‘기초 위험도 모듈’로 삼고, BIM 데이터나 일일 작업 보고서의 고위험 공정 정보를 반영하는 ‘공정 위험도 모듈’을 결합하는 하이브리드 모델로 확장할 수 있다. 또한, 전국 단위의 월별 데이터를 시군구 단위의 일별 데이터로 세분화하고, GIS 정보와 건축물 특성을 결합하여 모델의 시공간적 정밀도를 높여야할 필요가 있다. 나아가 화재 발생 건수 예측을 넘어, 국가화재정보시스템(NFDS) 데이터를 연계하여 화재 원인을 분류하는 다중 클래스 분류 모델로 확장하는 연구도 요구된다. 이러한 다각적인 접근은 건설 현장의 잠재적 위험을 종합적으로 진단하고 현장 맞춤형 예방 대책을 수립하는 데 핵심적인 기여를 할 것이다.

References

1. Darkhanbat K, Heo I.W, Choi S.H, Kim J.H, Kim K.S. 2021;Evaluation on fire available safe egress time of commercial buildings based on artificial neural network. Journal of the Korea Institute for Structural Maintenance and Inspection 25(6):111–120.
2. Hong S.Y, Cho S.H, Kim M.S, Moon I. 2019;Fire prediction based on weather and fire data using artificial neural network. J. Korean Soc. Hazard Mitig. 19(7):275–281.
3. Jang J.M, Kim J.C, Kim H.J, Kim K.T. 2023;Predicting forest fires using machine learning considering human factors. Journal of Korea Society of Industrial Information Systems 28(5):109–126.
4. Kim H.S, Jang S.C, Joo J.G. 2019;Preventive priority methods based on the analysis of fire accident causes in construction site. Journal of the Korea Institute of Construction Safety 2(2):50–55.
5. Ku C.Y, Liu C.Y. 2024;Predictive modeling of fire incidence using deep neural networks. Fire 7(4):136.
6. Lee E.P. 2018;Analysis of the working conditions of fire protection systems in the goyang bus terminal building fire. Korean Institute of Fire Science and Engineering 32(3):95–107.
7. Ryu J.K, Kwak D.K. 2020;A study on flame and smoke detection algorithm using convolutional neural network based on deep learning. Journal of Korean Society of Hazard Mitigation 20(1):223–232.
8. Saraswat M, Wadhwani A.K, Wadhwani S. 2024;Intelligent deep model based on convolutional neural network's and multi-layer perceptron to classify cardiac abnormality in diabetic patients. Physical and Engineering Sciences in Medicine 47(3):1245–1258.
9. Seo M.S, Castillo O, Ever E. 2021;Predictive analysis of fire risk factors in Gyeonggi-do using machine learning. Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography 39(6):351–361.

Article information Continued

Table 1

Research Plan

Data Details
Construction site fires data • 4,154 row × 2 columns
• Number of construction site fires
• 2010/01/01~2023/09/28
• Number of fires
• Date (year/month/day)
Meteorological data • Average temperature
• Minimum temperature
• Maximum temperature
• Precipitation
• Wind speed
• Maximum wind speed
• Peak maximum wind speed
• Dewpoint
• Humidity
• Minimum humidity
• Atmospheric pressure
• Effective humidity
• Minimum effective humidity
• Apparent temperature

Table 2

Configuration of the ANN Model

Category Description
Hidden layer structure 1-4 hidden layers + output layer
Number of neurons per layer 16 neurons per hidden layer (Dense (16))
Activation functions ‘ReLU’ for hidden layers, ‘Linear’ for the output layer
Regularization method Dropout (0.2) applied after each hidden layer
Optimizer Adam optimizer with learning rate = 0.001

Fig. 1

Monthly Cumulative Number of Construction Site Fire Incidents

Table 3

Results of Correlation Analysis

Variables Value
Average temperature -0.73
Minimum temperature -0.74
Maximum temperature -0.72
Precipitation -0.92
Wind speed 0.45
Maximum wind speed 0.01
Peak maximum wind speed -0.02
Dewpoint -0.75
Humidity -0.72
Minimum humidity 0.06
Atmospheric pressure 0.66
Effective humidity -0.71
Minimum effective humidity 0.06
Apparent temperature -0.70

Fig. 2

Monthly Cumulative Number of Construction Site Fire Incidents

Fig. 3

Architecture of the ANN Model

Fig. 4

Model Evaluation Results

Fig. 5

Training and Validation Loss Curves of the ANN Model

Fig. 6

Importance of Variables of ANN

Fig. 7

Training and Validation Loss Curves of the ANN Model