LightGBM 기반 교량 상부구조 부재 성능 예측 모델

Bridge Superstructure Component Performance Prediction Model Based on LightGBM

Article information

J. Korean Soc. Hazard Mitig. 2024;24(6):253-261
Publication date (electronic) : 2024 December 31
doi : https://doi.org/10.9798/KOSHAM.2024.24.6.253
* 정회원, 고려대학교 건축사회환경공학과 석사과정(E-mail: eric9723@korea.ac.kr)
* Member, Master’s Program, School of Civil, Environmental and Architectural Engineering, Korea University
** 정회원, 고려대학교 건축사회환경공학과 박사과정
** Member, Ph.D. Program, School of Civil, Environmental and Architectural Engineering, Korea University
*** 고려대학교 건축사회환경공학과 석박통합과정
*** Integrated Master’s and Ph.D. Program, School of Civil, Environmental and Architectural Engineering, Korea University
**** 고려대학교 건축사회환경공학과 석사과정
**** Master’s Program, School of Civil, Environmental and Architectural Engineering, Korea University
***** 고려대학교 건축사회환경공학과 학사과정
***** Bachelor’s Program, School of Civil, Environmental and Architectural Engineering, Korea University
****** 정회원 고려대학교 건축사회환경공학과 교수(Tel: +82-2-3290-3323, Fax: +82-2-3290-5999, E-mail: jskong@korea.ac.kr)
****** Member, Professor, School of Civil, Environmental and Architectural Engineering, Korea University
****** 교신저자, 정회원 고려대학교 건축사회환경공학과 교수(Tel: +82-2-3290-3323, Fax: +82-2-3290-5999, E-mail: jskong@korea.ac.kr)
****** Corresponding Author, Member, Professor, School of Civil, Environmental and Architectural Engineering, Korea University
Received 2024 November 07; Revised 2024 November 11; Accepted 2024 November 22.

Abstract

국내 노후화 교량의 급격한 증가로 인해 효율적인 유지관리 전략을 수립할 필요가 있으며, 이때 교량의 성능 예측 모델이 활용될 수 있다. 본 연구에서는 BMS (Bridge Management System)에서 관리하는 데이터를 활용하여 상부구조 중 데이터 수가 많은 부재들(콘크리트 바닥판, PSC I거더, 강박스 거더, 콘크리트 가로보, 강재 가로보)의 성능 예측 모델을 개발하였다. 이전 점검에서의 상태 등급(이전 등급)이 예측에 가장 큰 영향을 미치는 것을 확인하였으며, 회귀분석을 통해 이전 등급을 대푯값이 아닌 회귀값으로 학습시켰다. 그 결과, 학습 모델의 예측 성능이 향상되었으며, 다른 상부구조 부재에 대해서도 이와 같은 방법으로 학습을 진행하였다. 최종적으로 실제 교량 데이터를 적용하여 예측 결과를 분석하였다.

Trans Abstract

The rapid increase in the number of aging bridges domestically requires efficient maintenance strategies, which may utilize bridge performance prediction models. In this study, performance prediction models were developed for structural components with large amounts of data in the superstructure (concrete decks, PSC I girders, steel box girders, concrete crossbeams, and steel crossbeams) using data managed by a Bridge Management System. The condition rating from previous inspections (previous rating) had the greatest impact on the predictions, and regression analysis was used to train the model with the regression value of the previous rating rather than its representative value. Consequently, the prediction performance of the learning model improved, and the same method was applied to other superstructure components. Finally, the prediction results were analyzed by applying actual bridge data to the model.

1. 서 론

현재 국내 노후화 교량이 점점 증가하고 있다. 2020년 기준 전체 31,806개 교량 중 공용연수가 30년 이상 된 노후화 교량이 5,926개, 약 18.6%를 차지하였다. Fig. 1에서 나타난 준공연도별 교량 현황을 보면 1991년 이후 많은 교량이 준공되어 2030년에는 노후화 교량이 전체의 약 51.3% (16,310/31,806)를 차지하게 된다(KALIS, 2021). 노후화 교량의 증가에 따라 유지보수에 사용되는 도로 유지보수비 또한 같이 증가하고 있다(CERIK, 2023). 하지만 Fig. 2에서 나타난 도로 유지보수비의 증가율이 노후화 교량 증가율에 비해 낮다고 판단된다. 향후 현재와 같은 수준으로 유지보수를 하기 위해서는 도로 유지보수비의 증액이 필수적이지만 기대하기 어려운 상황이다. 따라서 한정된 예산 내에서 적절한 유지관리 전략이 요구된다.

Fig. 1

Status of Bridges by Year of Completion

Fig. 2

Status of Road Maintenance Costs

교량의 상태 열화 정도를 예측하는 모델을 개발함으로써 미래의 열화 정도를 파악하고 이를 바탕으로 제한된 예산 내에서 효율적인 유지관리 전략 수립이 가능할 것이다. 본 연구에서는 BMS (Bridge Management System) 데이터를 활용하여 상부구조 부재별(콘크리트 바닥판, PSC (PreStressed Concrete) I거더, 강박스거더, 콘크리트 가로보, 강재 가로보)로 성능 열화 예측 모델을 개발하였다.

기존에 수행된 교량 성능 예측 연구에서 Lee et al. (2018)와 Lee et al. (2019)는 시간에 대해 1차 및 2차 회귀분석을 통해 구한 열화율 기울기를 종속변수로 하고 4가지 영향인자(경간장, 연평균일트럭교통량, 표면염화물량, 평균습도)에 대해 다변수 회귀분석을 수행하여 상태 예측 모델을 개발하였다. 이후 확률론적 기법인 베이지안 정리를 결합하여 상태 예측 모델을 업데이트하였지만 정규분포로 가정한 사전 분포가 부정확할 경우 사후 분포의 신뢰성에 영향을 미치는 한계가 있다. 머신러닝 방법을 적용한 연구인 Chang et al. (2023)은 앙상블 학습 방법 중 하나인 XGBoost를 적용하여 강박스거더교와 PSC I거더교를 대상으로 바닥판, 주형, 교대/교각에 대해서 상태 예측 모델을 개발하였다. 이때 이전 점검의 상태등급을 그대로 학습시킨 것과 다르게 본 연구에서는 이전 상태등급을 회귀분석을 통한 회귀값으로 학습시킨 차이가 있다. 그리고 Hong and Jeon (2023)은 데이터의 불균형을 고려하여 언더샘플링, 오버샘플링, 복합샘플링 기법을 사용하고 의사결정나무와 랜덤포레스트로 개발했다.

국외 연구로는 Choi et al. (2020)이 시계열적 특성을 잘 반영하는 LSTM (Long Short-Term Memory)을 적용하여 콘크리트 바닥판의 성능 예측 모델을 개발했다. 하지만 현재 BMS 데이터는 점검이력이 짧아서 긴 점검이력을 필요로 하는 LSTM을 적용하기에는 어려움이 있다. 대신 단기적인 시계열적 특성을 반영한 이전 점검의 상태등급을 학습시킴으로 보완하였다. Hong and Jeon (2025)는 Hong and Jeon (2023)써와 동일하게 안정등급을 예측하고 추가적으로 여러 가지 앙상블 학습을 적용하였으며 그 중 XGBoost와 LightGBM이 높은 성능을 보였다. 하지만 교량의 전체적인 상태를 반영한 안전등급을 예측하는 연구로서 본 연구에서 다루는 세부부재별 상태등급을 예측하는 연구와는 차이가 있다. 그리고 Lim and Chi (2019)는 XGboost를 적용하여 교량의 상부구조별로 손상유형을 예측하는 모델을 개발하였지만 손상의 정도를 파악하진 못하는 한계가 있다. NBI 데이터를 활용한 선행연구로는 Bektas et al. (2013)가 CART (Classification and Regression Trees)를 적용하여 교량의 상태등급을 예측하였지만 본 연구에서는 단일 결정 트리보다 높은 예측 성능을 가지고 과적합의 가능성이 낮은 앙상블 학습을 활용하였다.

NBI (National Bridge Inventory)는 미국에서 운영되는 국가 교량 데이터 베이스로 교량의 성능 및 상태에 대한 데이터를 제공한다(FHWA, 1995). 그리고 NBI의 상태등급은 0~9까지 10개의 등급으로 평가된다. NBI 데이터를 활용하여 교량의 성능을 예측한 연구를 Table 1에 정리하였으며 앙상블 학습이 가장 높은 성능을 보였다. 하지만 해외 교량과 국내 교량은 설계와 유지보수 기준이 다르고 지역별 기후와 환경적 요인에 의한 노후화 패턴도 다르므로 국내 교량에 적합한 성능 예측 모델을 개발할 필요가 있다. 이때 NBI와 비슷한 정형 데이터 구조를 가진 BMS 데이터를 활용하기 때문에 앙상블 학습이 높은 성능을 보일 것이라 판단된다. 그리고 앙상블 학습 중 대규모 데이터를 다루는 데 있어서 빠른 학습 시간을 가지고 높은 성능을 보이는 LightGBM을 채택하여 세부부재별 성능 예측 모델을 개발하였다.

NBI-Based Prior Research

2. 데이터 및 방법론

2.1 BMS (Bridge Management System) 데이터

BMS 데이터는 10가지 대표부재(바닥판, 거더, 2차부재, 교대/교각, 기초, 교량받침, 신축이음, 교면포장, 배수시설, 난간/연석)으로 나뉘고 각 대표부재도 세부부재로 구분된다. 세부부재별로 상태평가 기준에 의해 A부터 D 또는 E까지 평가된다. 또한 데이터는 다양한 종류의 점검으로부터 수집된다. 그중 신뢰도가 높은 정밀안전점검과 정밀안전진단의 데이터만을 사용하였다. 두 점검은 안전등급에 따라 점검 주기가 정해지며 정밀안전점검은 최대 3년, 정밀안전진단은 최대 6년의 주기를 가진다.

Table 2는 BMS 데이터에서 상부구조 부재들의 데이터 분포를 나타낸다. 바닥판과 거더 부재의 경우 B등급에 분포가 집중되고 가로보 부재는 A등급에 집중된 분포를 이룬다. 또한 데이터 전처리 이후에도 비슷한 불균형 데이터 분포를 갖기 때문에 학습 시 클래스의 가중치를 조정하여 소수 클래스의 예측을 보완하였다. 그리고 보수⋅보강으로 인해 C등급부터 데이터의 비율이 감소한다. 따라서 콘크리트 바닥판을 제외한 부재들은 D등급까지 예측하기에는 D등급의 데이터 수가 부족하다 판단되어 A~C등급까지 예측하는 모델을 개발하였고 콘크리트 바닥판은 D등급까지 예측이 가능하다.

Distribution of BMS Data

2.2 학습 데이터셋

LightGBM을 적용하기 위해서는 많은 양의 데이터가 필요하므로 세부부재 중 구조부재인 콘크리트 바닥판, PSC I거더, 강박스거더, 콘크리트 가로보 그리고 강재 가로보에 대해 학습 데이터 셋을 구축하였다. 학습 데이터셋은 Table 3과 같이 구성하였으며 총 8가지 특성을 사용하였다. 기존 연구에서 8가지 특성 이외에도 세부부재별 구조적인 특성을 사용하여 성능 예측 모델 개발 시 구조적인 변수의 영향이 적은 것을 확인하였다. 또한 시계열적인 특성을 반영한 이전등급, 공용연수 그리고 점검간격 순으로 높은 영향인자인 것을 확인했다. 이후 교통량, 포장면적, 총폭, 경간장의 영향이높았다. 학습 데이터의 특성이 많아질수록 과적합의 위험이 있어 불필요한 특성을 제거할 필요가 있고 영향이 적은 구조적인 변수들을 제거하였다. 그리고 선행연구에서 이전 점검의 상태등급을 학습시켜 높은 예측 성능을 보였다(Chang et al., 2023). 그래서 이전 점검에서의 상태등급인 이전등급을 고려하였으며 이전 점검일로부터 현재 점검일까지 얼마나 지났는지를 나타내는 점검간격도 반영하였다. 그리고 상태등급으로 평가된 A~E등급은 순서대로 0.1, 0.2, 0.4, 0.7, 1.0인 결함도 지수 대푯값으로 표현될 수 있다. 상태등급 이력을 결함도 지수 대푯값으로 변환하고 활용하여 Fig. 3과 같이 1차 회귀분석을 수행하였다. 이렇게 계산되는 회귀값들을 이전등급상세라 명하였으며 이전등급 대신 이전등급상세를 학습하여 두 가지 모델의 성능을 비교하였다.

Information of Dataset

Fig. 3

Example of Detailing a Previous Condition Rating

2.3 데이터 전처리

학습 데이터셋을 구성하는 특성 중 부재별 상태등급, 교통량, 지간장, 포장면적이 누락된 데이터를 제거하였다. 그리고 점검이력이 하나인 데이터는 이전 등급에 대한 정보가 없고 열화 정도를 파악하기 어려워 제거하였으며 보수⋅보강의 영향을 줄이기 위해 등급이 향상되는 데이터도 제외하였다. 이전 점검과의 시간 간격은 최대 3년 이내이므로 이전등급으로부터 상태등급이 3년 이내에 2단계 이상 열화가 발생하기에는 어렵다고 판단된다. 따라서 상태등급이 단기간에 급격한 열화를 보이는 데이터 또한 제거하였다. Fig. 4는 데이터 전처리 과정을 나타낸다.

Fig. 4

Data Preprocessing

2.4 LightGBM

LigthGBM은 Gradient Boosting Mahchine (GBM) 중 하나로 점진적인 학습을 한다는 특징을 가진다. 본 연구에서 개발한 성능 예측 모델은 다중 분류 문제로 결정 트리 분할 시 Softmax Cross -Entropy Loss를 손실 함수로 사용하였다. Eq. (1)은 Softmax 함수로 C는 클래스 개수, Zk는 클래스 k에 대한 모델의 출력값으로 해당 함수는 클래스 k에 대한 확률을 나타낸다. Eq. (2)는 Cross-Entropy Loss로 실제 클래스 k에 해당하는 확률, P(Zk)가 1에 가까워 질수록 Loss는 0에 가까워진다. 따라서 Cross-Entropy Loss가 최소가 되도록 결정 트리가 분할한다.

(1)P(zk)=exp(zk)j=1cexp(zj)
(2)Loss=k=1cyklogP(zk)

Fig. 5는 LightGBM의 트리 분할 과정을 나타낸다. LightGBM은 트리의 균형을 맞추지 않아 더 깊고 복잡한 트리를 생성하여 복잡한 데이터를 학습하는 데에 유리하다는 장점이 있다. 그리고 대규모 데이터를 처리하는데 적합하며 XG-Boost보다 빠른 학습 속도를 가진다. 하지만 과적합의 가능성이 존재한다. 이는 LightGBM의 매개변수(learning_rate, num_leaves, max_depth, n_estimators)를 조절하여 트리의 복잡도를 낮출 수 있다.

Fig. 5

LightGBM

NBI데이터를 활용한 선행연구 중 대부분 XGBoost가 가장 높은 성능을 보였지만 LightGBM 또한 유사한 성능을 보였다(Li and Song, 2022; Almarahlleh et al., 2024). 본 연구에서 다루는 부재들은 10,000개 이상의 대규모 데이터로 학습 시간 또한 중요한 지표가 될 수 있다. 따라서 대규모 데이터에 유리하고 높은 성능을 보이며 빠른 학습 시간을 가진 LightGBM을 채택하였다.

2.5 성능 지표

예측 성능을 파악하는데 많은 성능 지표들이 사용된다. Fig. 6은 오차 행렬을 나타내고 이를 활용하여 성능 지표들이 계산된다. 예를 들어, 정밀도는 모델이 예측한 양성 클래스 중 실제로 양성인 비율을 의미하고 Eq. (3)으로 표현된다. 재현율은 실제 양성 클래스 중 올바르게 양성으로 예측한 비율을 말하고 Eq. (4)와 같이 표현된다. 그리고 각 클래스의 F1 점수는 각 클래스의 정밀도와 재현율의 조화평균으로 Eq. (5)와 같이 나타난다. 그리고 모델의 종합적인 성능을 파악하는데 사용되는 F1 macro는 F1 점수의 산술평균으로 Eq. (6)과 같으며 N은 클래스 개수를 의미한다. F1 weighted는 Eq. (7)로 나타나며 F1 점수의 가중평균이다.wi는 전체 샘플 수에 대해 각 클래스의 샘플 비율을 의미한다. 따라서 F1 weighted를 기준으로 평가하면 B등급의 샘플 수가 많은 학습 모델의 F1 weighted가 B등급의 F1 점수에 가까운 점수를 보이며 다른 소수의 등급에 대한 성능이 무시될 수 있다. 본 연구에서는 모델의 특정 등급에 대한 성능 보다 전체적인 등급에 대한 예측 성능을 고려하기 위해 F1 macro를 기준으로 진행하였다.

Fig. 6

Confusion Matrix

(3)Precision=TPTP+FP
(4)Recall=TPTP+FN
(5)F1 score=2×Precision×RecallPrecision+Recall
(6)F1 macro=1Ni=1NF1scorei
(7)F1 weighted=i=1Nwi×F1scorei

2.6 학습 모델 개발 과정

데이터 전처리 과정을 거친 학습 데이터를 활용하여 Fig. 7과 같이 모델의 개발 과정을 진행하였다. 테스트할 데이터가 학습에 반영되지 않도록 학습 데이터를 9:1 비율로 훈련 데이터와 테스트 데이터로 나눈다. 이후 훈련 데이터의 데이터 불균형을 고려하기 위해 compute_class_weight 기능을 사용하였다. 위 기능은 Eq. (8)을 사용하여 클래스의 빈도 비율을 기반으로 가중치를 계산한다. 그리고 가중치를 자동적으로 계산하여 학습에 반영한다. N은 전체 샘플의 수, C는 클래스의 수이고 ni는 클래스 i에 속한 샘플의 수를 의미한다. 따라서 소수 클래스에는 더 높은 가중치를 적용하여 소수 클래스에 대한 예측 정확도를 개선할 수 있다.

Fig. 7

Development Process of a Learning Model

(8)Class Weighti=NC×ni

모델의 복잡도와 성능을 직접 조절하는 핵심 매개변수인 num_leaves, max_depth, learning_rate, n_ estimators를 사용하였다. num_leaves는 트리가 가질 수 있는 끝 노드의 개수이고 max_depth는 트리가 성장할 수 있는 최대 깊이이다. 그리고 learning_ rate은 각 트리가 최종 모델에 기여하는 정도를 조절하는 변수이고 n_estimators는 학습에 사용될 트리의 총 개수를 의미한다. 위 네 가지 매개변수들은 높게 설정할수록 과적합의 위험성이 존재한다. 또한 매개변수 조합에 따라 성능의 변화를 보이기 때문에 최고의 성능을 보이는 최적의 매개변수 조합을 찾을 필요가 있다. num_ leaves, max_depth, learning_rate, n_estimators 매개변수의 범위를 Fig. 7과 같이 지정하였다. 이렇게 사용자가 설정한 매개변수 값의 모든 가능한 조합을 탐색하여 각 조합에 대해서 모델을 학습하고 성능을 평가한 뒤, 가장 좋은 성능을 내는 조합을 선택한다. 위 과정을 그리드 서치라 하며 교차검증을 사용해 모델의 일반화 성능을 평가한다. 이때 F1 macro를 기준으로 10겹의 교차 검증을 수행하여 9개 폴드를 훈련에 사용하고 남은 1개를 검증용 데이터로 사용한다. 성능 지표 기준으로 10번의 평균 성능이 가장 높은 조합이 최종 학습 모델이 된다. Table 4는 부재별 그리드 서치를 진행하여 찾은 매개변수 조합이다. 마지막으로 미리 분리된 테스트 데이터를 활용하여 학습 모델의 성능을 확인함으로써 모델의 개발 과정이 끝난다.

Optimal Combination of Parameters

3. 결과 및 테스트

3.1 이전등급과 이전등급상세를 학습한 모델 비교

Table 5은 콘크리트 바닥판을 대상으로 이전등급을 학습한 모델과 이전등급상세를 학습한 모델의 성능 결과를 비교한 것이다. 콘크리트 바닥판의 성능 예측 모델은 D 등급까지의 데이터 수가 적절하여 4가지 클래스를 예측하는 분류 모델이다. F1 macro, F1 weighted 그리고 정확도 면에서 5% 이상 성능이 향상되었으며 이전등급 대신 이전등급상세를 학습하는 것이 성능 향상에 더 많이 기여하는 것을 확인하였다. 따라서 이후 학습 데이터는 이전등급상세를 반영하여 성능 예측 모델을 개발하였다.

Comparison of Model Performance (Concrete Deck)

3.2 부재별 성능 결과

PSC I거더, 강박스거더, 콘크리트 가로보 그리고 강재 가로보의 성능 예측 모델을 개발하였으며 위 부재들은 D등급에 대한 데이터 수가 부족하여 A~C만을 예측하였다. Fig. 8은 부재별 성능을 나타낸 것으로, 그리드 서치 시 기준으로 설정한 F1 macro 측면에서 90% 이상의 높은 성능을 보인다. 강재 가로보가 F1 macro 94.19%, F1 weighted 96.49% 그리고 정확도 96.51%로 가장 높은 성능을 나타낸다.

Fig. 8

Model Performance by Member

3.3 모델 테스트 및 실적용

앞에서 개발한 부재별 성능 예측 모델을 활용하여 실제 교량 데이터를 바탕으로 예측을 진행하였다. 예측 시 softmax Eq. (1)을 이용하여 각 클래스에 대한 확률을 계산할 수 있고 가장 높은 확률을 가진 클래스가 예측값이 된다. 하지만 예측 클래스를 그냥 사용하기 보다는 Eq. (9)을 사용하여 가중 평균으로 나타내고 열화의 정도를 더 세밀하게 표현하였다. N은 클래스의 수이고 ri는 각 등급별 결함도 지수 대푯값을 의미한다. Pi는 클래스 i에 대한 확률을 나타낸다. Fig. 9에 3가지 부재별 예측 결과를 나타냈다.

Fig. 9

Test Result (Concrete Deck, PSC I Girder, Concrete Cross Beam)

(9)Weighted Average=i=1Nri×Pi

콘크리트 바닥판, PSC I거더, 콘크리트 가로보 순서로 테스트한 교량의 입력값은 Table 6에 정리하였다. 노후 교량들로 선정했으며 콘크리트 바닥판은 A등급이 최종적으로 B에 도달하는 점진적인 점수를 보였고 PSC I거더의 경우 B등급이 유지되다 C등급으로 열화했다. 콘크리트 가로보는 A등급을 유지하다 마지막에 B등급으로 성능이 저하됐다.

Input Data of Test Bridge

학습 모델에 가장 많은 영향을 미치는 것은 이전등급상세이고 시간에 대한 변수인 공용연수와 점검간격이 다음으로 높은 영향을 가졌다. 두 변수의 영향이 이전등급상세 보다 현저히 작아서 1년씩 시간이 지남에 따른 예측이 항상 Fig. 9와 같이 점진적인 열화를 보이진 않는다. 하지만 이전 점검의 상태보다 열화된 상태를 보이고 1, 2, 3년 후의 예측은 모두 비슷한 상태등급을 보인다. 따라서 단기적인 시계열 패턴을 잘 학습한 것으로 판단되고 3년 내의 수행하는 다음 점검에서의 상태등급 예측 시 활용이 가능하다.

4. 결 론

세부부재별 BMS (Bridge Management System) 상태등급 데이터를 활용하여 각 성능 예측 모델을 개발하였다. 비슷한 데이터 구조를 가진 NBI (National Bridge Inventory)에서도 앙상블 학습이 높은 성능을 보여 본 연구에서도 앙상블 학습을 적용하였고 그중 빠른 처리시간이 장점인 LightGBM 모델을 적용했다.

상부구조 부재 중 많은 데이터를 보유한 콘크리트 바닥판, PSC I거더, 강박스거더, 콘크리트 가로보, 강재 가로보를 대상으로 각각 데이터 전처리 후 학습 모델을 개발하였다. 이때 전체적인 학습 모델의 성능을 고려하기 위해 F1 macro를 기준으로 그리드 서치 작업을 수행했다.

이전등급 보다는 이전등급 이력을 활용해 1차 회귀분석을 통해 계산된 회귀값을 학습시키는 것이 성능 예측 향상에 더 영향을 미치는 것을 콘크리트 바닥판을 대상으로 한 결과에서 확인할 수 있었다. 이후 다른 부재들에 대해서도 이전등급 대신 이전등급상세로 학습을 진행한 것이 높은 성능을 보인 것을 확인하였다.

콘크리트 바닥판은 F1 macro 88.2%, F1 weighted 88.89% 그리고 정확도 88.91%인 성능을 보였다. 다른 부재들 중 강재 가로보가 F1 macro 94.19%와 정확도 96.51%로 가장 높은 성능이 나타났다. 그리고 강박스거더가 F1 macro 92.35%, 정확도 96.07%인 두 번째로 높은 성능을 보였다.

마지막으로 개발한 부재별 성능 예측 모델을 활용하여 실제 교량 경간에 적용하여 결과를 정리했다. 또한 예측 시 나타나는 등급별 확률을 활용하여 가중평균으로 표현했다. 3년 이내의 성능을 예측하였으며 대체로 낮은 열화율을 보여주었다. 그리고 1년, 2년, 3년이 지난 시점들의 예측이 모두 비슷한 결과를 예측한다는 점에서 개발된 모델이 다음 점검 시의 상태등급을 일정하게 예측할 수 있고 일정한 상태 열화 패턴을 학습했다고 판단된다.

본 연구는 다음 점검의 상태만을 대상으로 예측한다는 한계가 있다. 추후 점검이력 데이터가 쌓인다면 긴 시계열 데이터에 적합한 학습 모델이 적용 가능하다. 그리고 추후 D, E등급의 데이터가 보충된다면 더 넓은 범위의 예측이 가능하다.

개발된 모델은 기존 평가된 상태등급을 바탕으로 다음 점검의 상태등급 예측 시 활용 가능하며 단기적인 보수⋅보강 또는 유지관리 우선순위를 결정하는 데에 기여할 수 있다.

감사의 글

본 연구는 국토교통부 기반시설 첨단관리 기술개발사업(RS-2022-00142566)의 연구비 지원으로 수행되었으며, 이에 감사드립니다.

References

1. Almarahlleh N, Liu H, Abudayyeh O, Almamlook R. 2024;Predicting Concrete Bridge Deck Deterioration:A Hyperparameter Optimization Approach. Journal of Performance of Constructed Facilities 38(3):04024009.
2. Bektas B.A, Carriquiry A, Smadi O. 2013;Using classification trees for predicting national bridge inventory condition ratings. Journal of Infrastructure Systems 19:4–425.
3. CERIK. 2023;Status and Outlook of Aging Road Bridges
4. Chang T, Yoon S, Chi S, Im S. 2023;Condition Estimation of Facility Elements Using XGBoost. Korean Journal of Construction Engineering and Management 24:1–31.
5. Choi Y, Lee J, Kong J. 2020;Performance degradation model for concrete deck of bridge using pseudo-LSTM. Sustainability 12(9):3848.
6. Fang J, Hu J, Elzarka H, Zhao H, Gao C. 2023;An improved inspection process and machine-learning-assisted bridge condition prediction model. Buildings 13(10):2459.
7. Fard F, Sadeghi Naieni Fard F. 2024;Development and Utilization of Bridge Data of the United States for Predicting Deck Condition Rating Using Random Forest, XGBoost, and Artificial Neural Network. Remote Sensing 16(2):367.
8. FHWA. 1995;Recording and Coding Guide for the Structure Inventory and Appraisal of the Nation's Bridges
9. Hong J, Jeon S. 2023;Prediction of safety grade of bridges using the classification models of decision tree and random forest. Journal of The Korean Society of Civel Engineers 43:43–397.
10. Hong J, Jeon S. J. 2025;Efficient Decision Tree-Based Classification Models to Predict Safety Rating for Bridge Maintenance. Journal of Infrastructure Systems 31(1):04024031.
11. KALIS. 2021;2021 Facility Statistics Yearbook
12. Kong X, Li Z, Zhang Y, Das S. 2022;Bridge deck deterioration:Reasons and patterns. Transportation Research Record 2676:7–570.
13. Lee J.H, Choi Y.R, Ann H, Kong J.S. 2019;The Preventive Maintenance Strategy in Operation Stage of Bridge using Bayesian Inference. KSCE Journal of Civil and Environmental Engineering Research 39:1–135.
14. Lee J.H, Lee K.Y, Ahn S.M, Kong J.S. 2018;Proposal of maintenance scenario and feasibility analysis of bridge inspection using bayesian approach. KSCE Journal of Civil and Environmental Engineering Research 38:4–505.
15. Li Q, Song Z. 2022;Ensemble-learning-based prediction of steel bridge deck defect condition. Applied Sciences 12(11):5442.
16. Lim S, Chi S. 2019;Xgboost application on bridge management systems for proactive damage estimation. Advanced Engineering Informatics 41:100922.
17. Rashidi Nasab A, Elzarka H. 2023;Optimizing machine learning algorithms for improving prediction of bridge deck deterioration:A case study of Ohio bridges. Buildings 13(6):1517.

Article information Continued

Fig. 1

Status of Bridges by Year of Completion

Fig. 2

Status of Road Maintenance Costs

Table 1

NBI-Based Prior Research

Paper ML model Best ML model Best accuracy
Rashidi Nasab and Elzarka (2023) KNN (K nearest neighbor), ANN (Artificial neural network), LR (Linear regression), SVM (Support vector machine), DT (Decision tree), XGBoost (Extreme gradient boost), RF (Random forest) XGBoost 86.64%
Fard and Sadeghi Naieni Fard (2024) RF, XGBoost, ANN Random Forest 83.40%
Li and Song (2022) RF, ExtraTree, AdaBoost, GBM (Gradient boosting machine), XGBoost, LightGBM XGBoost 94.95%
Almarahlleh et al. (2024) AdaBoost, KNN, GBM, DT, RF, ExtraTree, LightGBM, Cat Boost Cat Boost 96.66%
Kong et al. (2022) LightGBM, GBM, AdaBoost, XGBoost XGBoost 91.00%
Fang et al. (2023) AdaBoost AdaBoost 94.23%

Table 2

Distribution of BMS Data

Condition rating Concrete deck PSC I girder Steel box girder Concrete cross beam Steel cross beam
A 14,488 (23.91%) 10,841 (42.83%) 6,687 (20.32%) 12,392 (47.57%) 25,429 (74.43%)
B 33,113 (54.64%) 11,845 (46.79%) 23,855 (72.48%) 9,689 (37.19%) 7,593 (22.22%)
C 11,657 (19.24%) 2,346 (9.27%) 2,196 (6.67%) 3,530 (13.55%) 628 (1.84%)
D 1,006 (1.66%) 102 (0.40%) 54 (0.16%) 169 (0.65%) 22 (0.06%)
E 18 (0.03%) 11 (0.04%) 1 (0%) - -
X 317 169 119 272 495
Total 60,599 25,314 32,912 26,052 34,167

Table 3

Information of Dataset

Target Features
Condition rating Total width Pavement area Cumulative traffic volume Cumulative truck traffic volume
Span length Service life Inspection interval Previous condition rating

Fig. 3

Example of Detailing a Previous Condition Rating

Fig. 4

Data Preprocessing

Fig. 5

LightGBM

Fig. 6

Confusion Matrix

Fig. 7

Development Process of a Learning Model

Table 4

Optimal Combination of Parameters

Parameter Concrete deck PSC I girder Steel box girder Concrete cross beam Steel cross beam
num_leaves 20 30 30 20 10
max_depth 5 7 10 10 10
learning_rate 0.2 0.2 0.03 0.2 0.2
n_estimators 500 200 500 200 500

Table 5

Comparison of Model Performance (Concrete Deck)

Model Condition Precision Recall F1 score F1 score (Macro) F1 score (Weighted) Accuracy
Previous condition rating a 71.93% 78.28% 74.97% 82.88% 82.92% 82.98%
b 84.10% 88.21% 86.11%
c 87.48% 72.94% 79.55%
d 90.91% 90.91% 90.91%
Previous condition rating detailed a 86.49% 82.02% 84.20% 88.20% 88.89% 88.91%
b 90.51% 91.41% 90.95%
c 86.04% 87.10% 86.56%
d 93.88% 88.46% 91.09%

Fig. 8

Model Performance by Member

Table 6

Input Data of Test Bridge

Bridge (No. Bridge – No. Span) Total width (m) Pavement area (m2) Cumulative traffic volume Cumulative truck traffic volume Span length (m)
Jeokpo bridge (1918-2) 11.5 6,000 41,811 5,212.31 50
Ganggyeong bridge (27502-1) 11 5,052 218,786 11,087.1 30
Pyeongchang bridge (496-3) 10 1,303.9 82,688 7,004 30.7

Fig. 9

Test Result (Concrete Deck, PSC I Girder, Concrete Cross Beam)