1. 서 론
안정적인 수자원 관리를 저해하는 다양한 위험요소들이 있는데 그 중 기상 및 기후요소는 용수공급의 불확실성을 유발하는 대표적인 원인으로 꼽힌다(Li et al., 2016). 적은 양의 강수로 인해 2012년부터 2014년까지 이어진 미국 캘리포니아의 가뭄은 그 지역에 용수공급 제한을 유발하였다(Williams et al., 2015). 국내에서도 봄철 강수량 부족 및 마른장마의 영향으로 충청남도에 위치한 보령댐의 저수율이 역대 최저인 18.9%를 기록하기도 하였다(Kim et al., 2016). 반대로 과도한 강수로 인한 홍수는 치수 목적의 수자원 운영에 문제를 유발한다. 우리나라에서 2020년에 발생한 장기간의 장마는 댐하류 지역에 극심한 홍수피해를 유발하였다(Lee et al., 2020). 특히 기후변화가 점점 심화되면서 빈번하고 극심한 기상현상이 더 자주 발생함으로써 수자원 관리의 불확실성과 어려움은 더욱 커지고 있다(Romero-Lankao et al., 2014).
용수공급 제한 및 홍수의 피해를 최소화하기 위해 위험회피(risk aversion) 개념 기반의 수자원 관리가 이루어진다. 위험회피 개념에 기반한다는 의미는 수자원 시스템 전체 혹은 일부의 피해를 최소화하는 방향으로 수자원 공급을 계획 및 운영하는 것을 의미한다(Watkins Jr and McKinney, 1997). Gandolfi et al. (1989)는 수자원 관리의 측면에서 위험회피능력를 극심한 홍수나 가뭄과 같은 심각한 붕괴(dramatic failure)에 선제적으로 대응할 수 있는 능력이라고 정의하였다. 예를 들어 가뭄 발생이 예상되는 경우 미래의 용수 공급 제한을 최소화하고자 현재의 댐 운영방식을 조정하여 피해를 예방하는 것이다(You and Cai, 2008). 홍수 발생이 예상되는 경우에는 댐 월류의 위험과 댐하류 범람 피해를 최소화하고자 댐 상하류의 수위를 고려하여 방류 방식을 미리 조정하는 것 또한 위험회피 개념 기반의 수자원 관리에 해당한다.
댐 운영 문제는 위험회피 개념이 적용될 수 있는 대표적인 예시이다(Bower et al., 1962; You and Cai, 2008; Jin et al., 2021). 안정된 수자원 관리 및 원활한 용수공급을 위해서는 미래의 상황을 고려한 댐 운영이 필수적이다. 이러한 운영방식은 미래의 홍수 및 가뭄 발생으로 유발되는 위험을 회피하려는 목적에 의한 것이다. 미래에 가뭄이 발생할 것으로 예상된다면 현재의 공급량을 줄여 댐의 저수량을 늘리고, 이를 미래의 공급에 사용함으로써 갈수피해를 예방한다. 홍수가 발생할 것으로 예상된다면 댐의 저류량을 미리 방류시켜 충분한 홍수저류용량을 확보함으로써 댐하류의 홍수피해를 예방한다. 즉, 현재의 댐 운영방식이 미래의 용수 수급 제한 위험이나 홍수 위험을 회피하는 방향으로 결정되는 것이다(Nardini et al., 1992).
댐 유입량의 많고 적음에 대한 정보는 기상 및 기후 상태에 대한 예측자료로부터 알 수 있다. 우리나라에서는 대표적으로 기상청에서 제공하는 장기예보 자료가 이에 해당한다. 기상청의 장기예보는 기후예측시스템인 Global Seasonal forecast system version 5 (GloSea5)의 수치모델링 결과로부터 기온, 강수와 같은 기상요소를 최대 3개월까지 예측한 자료이다. 기상청의 장기예보는 수자원 관리뿐만 아니라 재난재해, 전력 및 에너지, 농식품, 보험, 관광레저, 의류, 가전 산업 등의 다양한 분야에서 활용된다(KMA, 2015a). 수자원 분야에서는 장기예보를 주로 댐 운영에 활용한다. 장기예보 예측치를 반영하여 댐 유입량을 모의하고 그에 따라 댐 운영방식을 결정한다. 또한 댐 유입량의 불확실성을 고려하는 앙상블 유량예측시스템의 앙상블 멤버 가중치 결정에 활용하기도 한다(Croley, 2000; Schaake et al., 2007; Kang et al., 2007; Stedinger and Kim, 2010).
그러나 기상청 장기예보는 신뢰도의 문제가 있어 장기예보의 활용이 득이 될 수도, 실이 될 수도 있다. 먼저, 예측선행시간이 긴 장기예보는 기후시스템의 비선형성과 복잡한 상호작용으로 인해 단기 및 중기예보에 비해 상대적으로 정확성은 낮고 불확실성은 큰 특징이 있다(Son et al., 2017). 예측 초기 시점의 작은 오차가 미래시점으로 갈수록 점점 더 커지는 특성에 의한 한계가 있다(Slingo and Palmer, 2011). 여러 연구들에서는 장기예보의 예측 정확도를 40% 이하 수준으로 평가하였다(Lee et al., 2006; Son et al., 2017). 또한, 국내에서 활용하는 기후예측모델의 성능이 그리 높지 않다는 한계가 있다. 우리나라는 독자적인 모델 개발 능력의 부족으로 영국에서 도입한 Glosea5에 의존하고 있다. 또한, 초기장도 외국에서 생산한 자료에 의존하고 있어 우리나라에 대한 예측성능이 확보되지 않는 문제가 있다. 이러한 이유로 국내 장기예측 결과에 대한 신뢰도는 미국, 일본, 유럽 등 기상선진국의 60~70% 정도밖에 되지 않는다. 이외에도 기후변화, 예보관의 주관성 개입, 업무의 분산 및 전문인력의 부족 등이 장기예보의 또다른 한계이다(KMA, 2017a). 이러한 한계들로 인해 신뢰성이 떨어지는 장기예보는 미래에 대한 부정확한 정보를 제공할 수도 있는 문제가 있다.
본 연구에서는 장기예보 자료를 수자원 관리의 목적으로 활용하기 위한 방법을 제안하고자 한다. 이 방법은 위험회피 개념에 근거한다. 기존의 장기예보 등급에서 A (Above normal)와 B (Below normal)는 각각 홍수를 유발할 수 있는 과다한 강수와 가뭄을 유발할 수 있는 과소한 강수를 의미한다. 위험회피의 대상인 것이다. 그러나 N (Normal)은 위험 정보에 해당하지 않는다. 따라서 N의 정보를 A와 B에 포함시켜 B를 회피하는 A와 N (즉, AN), A를 회피하는 B와 N (즉, BN)으로 재분류하는 방법을 적용하고자 한다. 이 개념은 대상 위험과 대상 위험을 제외한 나머지 전체를 구분하여 적용하는 것으로, 정상상태를 제외한 두 개의 다른 위험만을 고려하는 경우와 다른 개념이다. 즉, 기존의 접근 방법에서 ‘홍수 발생 가능성이 있느냐, 정상 범주냐, 가뭄 발생 가능성이 있느냐?’를 비교하는 것과 달리, 본 연구의 접근 방법에서는 ‘홍수 발생 가능성이 있느냐 없느냐?’ ‘가뭄 발생 가능성이 있느냐 없느냐?’를 비교하는 것이다. 본 연구에서는 이 접근 방법을 충주댐유역이 위치하는 충청북도 지역의 1, 2, 3개월 장기예보에 적용하고, 활용 가능성을 평가해 보고자 한다. 궁극적으로 현 정확도 수준의 기상청 장기예보가 효율적으로 사용될 수 있는지를 판단해 보는 것을 연구의 목적으로 한다.
2. 기상청 장기예보
2.1 장기예보 생산 현황
우리나라의 장기예보 생성 및 발령업무는 기상청에서 담당하고 있다. 기상청의 장기예보는 1973년 월간예보로부터 시작되어 1984년 5월부터 계절예보(여름, 겨울), 2001년부터 1개월 예보와 6개월 예보를 추가적으로 시행하였다. 2006년 3월부터는 계절예보를 3개월예보로 대체하여 운영하고 있다. 1999년 이전까지는 주로 기후값, 주기법, 다중회귀 등의 통계학적 방법에 기반하였다. 1999년 이후부터는 물리적인 방법에 근거하여 전지구 역학모델인 GDAPS를 도입하였고, 2008년에는 영국 UM 모델의 GloSea5와 같은 역학모델의 예측자료에 근거한 장기예보를 시행하고 있다(KMA, 2015b). 2009년 10월부터는 지역별 기후 특성을 고려하고자 전국을 12개 구역으로 분할하여 구역별로 장기예보를 제공하고 있다. 한편, 장기예보의 활용도를 높이고 의사결정 지원을 위하여 2014년 5월부터는 단정예보에서 확률예보로 변경하여 현재까지 이어지고 있다(KMA, 2017a).
기상청 장기예보는 기후요소의 현황 감시, 모델링 및 분석, 전국 예보 초안 결정을 위한 토의, 전국 및 지역 예보 최종 결정, 예보 발표의 절차로 진행된다(KMA, 2017a). 먼저, 기후 감시 및 분석은 우리나라의 기온, 강수 및 다양한 기후요소를 감시하고 예보관의 예보 및 통보 업무를 지원하는 현업시스템에 의해 이루어진다. 기후감시시스템, 브리핑시스템, 예보⋅통보⋅검증시스템, 영상회의시스템 등으로 구성되어 있다. 다음으로 모델링 및 분석 단계에서는 기후감시 결과를 이용하여 GloSea5 예측모델의 기온 및 강수량 예측 결과를 분석한다. 모델링 결과에 기반한 토의를 통해 전국 예보 초안을 결정하는데, 이때 기상요소의 많음, 비슷, 적음의 기준은 과거 평년 관측치를 토대로 결정하고 앙상블 분석의 결과를 토대로 각 등급에 대한 확률을 부여한다. 최종적으로 장기예보에 고려되어야 할 추가적인 정보(기후감시요소 등)에 대한 분석 결과를 반영하여 전국 및 지역별 확률예보를 발령한다.
기상청 장기예보는 주 단위 및 월 단위 예보로 나뉜다(KMA, 2015b). 주 단위 장기예보는 매주 발표되며, 발표일이 속한 주의 다음 주부터 향후 4주 동안의 기온, 강수량 전망 및 주요 사항에 대한 예보 결과를 포함한다. 월 단위 장기예보는 매달 발표되며, 발표일이 속한 월의 다음 월부터 향후 3개월 동안의 월별 기온 및 강수량 전망과 기압계 동향 및 전망, 황사, 태풍 등 계절별 주요 사항에 대한 내용을 포함한다. 기온과 강수의 장기예보 표현 방식은 평년보다 높음, 비슷, 낮음 세 등급으로 표현되며, 각 등급에 대한 확률을 제시한다. 강수량의 경우, 세 등급을 구분하는 기준은 평년(1981-2010년)의 월별 강수량의 상위 33% 및 66%이다. 발표된 장기예보는 기상청 홈페이지(https://www.weather.go.kr/)에 공지된다.
2.2 장기예보의 성능 평가
기상청 장기예보에 대한 성능평가를 수행한 연구로는 Lee et al. (2006)과 Son et al. (2017)이 있다. Lee et al. (2006)은 충주댐유역을 대상으로 월간기상정보의 예측성능을 평가하였다. 예측성능 평가에는 적중횟수(hit number)와 적중률(hit ratio)를 이용하였다. 관측치가 예보와 일치한 경우에는 1, 일치하지 않은 경우에는 0을 부여한 후 검증기간 동안 모두 합하여 적중횟수를 계산하였다. 적중률은 적중횟수를 검증기간으로 나눈 값이다. Son et al. (2017)에서는 2014년 6월부터 2016년 6월까지의 확률장기예보의 예측성능을 평가하였다. 평가방법으로는 Hit Rate, Reliability Diagram, Relative Operating Curve를 이용하였다. 여기서 Hit Rate는 전체 횟수 중 적중한 경우의 비율을 의미한다. Reliability Diagram은 각 확률구간에 따라 예측한 확률과 관측 빈도의 유사한 정도를 평가하는 방법이다. Relative Operating Curve는 예측한 경우의 비율(Probability of Detection, POD)과 예측하지 못한 경우의 비율(False Alarm Ration, FAR)의 대립되는 두 결과를 구분하는 예보 능력을 평가하는 방법이다. 두 선행 연구의 예측성능 평가방법 모두 관측치와 예측치를 비교하여 작성한 실적표에 기반한다는 점을 알 수 있다.
선행연구에 근거하면 기상청 장기예보의 예측성능은 신뢰할 수준은 아닌 것으로 판단할 수 있다. 기상예보의 신뢰도를 평가한 KMA (2017a)에 의하면, 장기간의 투자와 노력을 통해 단기예보는 90% 이상의 예측성능을 보이는 반면에 장기예보는 2015년 기준 36% 수준에 불과한 것으로 나타났다. Lee et al. (2006)은 충주댐유역의 1991~2002년 월간예보 적중률이 평균 28% 정도이며, 연도별로 따졌을 때에도 대부분의 경우 33%보다 낮다고 분석하였다. Son et al. (2017)에서는 용담댐과 남강댐유역을 대상으로 2014년부터 2016년까지 발령된 1개월 및 3개월 장기예보에 대한 예측성능을 평가하였는데 3개월 장기예보의 경우 약 30~40% 정도의 적중률을 보이는 것을 확인하였다. 33%의 예측성능은 3개 구간에 대한 예측 문제에서 예측 자체가 무의미하다는 것을 의미한다.
장기예보 예측성능 저하의 원인으로는 장기적 예측에 대한 불확실성, 기후예측모델 성능의 한계, 독자적 예보시스템의 부재, 기후변화의 영향 등이 꼽힌다. 장기예보를 위한 수치예측모델링은 기후시스템의 복잡한 상호작용과 비정상성을 고려해야 하는데, 현황으로는 정도 높은 모의가 어려운 것이 사실이다(Son et al., 2017). 또한, 대기, 해상, 식생 등 다양한 기후 조건을 종합적으로 반영하여 수개월을 선행 예측해야 하는 어려움이 있다(KMA, 2017b). 아울러 우리나라는 최근까지 독자적인 모델을 이용하지 않고 영국에서 도입한 Glosea5에 의존하고 있었다. 이와 함께 초기장 관련 기술의 부족으로 외국 자료에 크게 의존하고 있으며, 이에 따른 모델 운영 및 관리 역량이 미숙하다는 점이 문제점으로 제기되고 있다(KMA, 2017a). 기후변화로 인해 전지구 곳곳에서 나타나는 기상현상들이 대기순환을 통해 다른 지역에 영향을 미치는 원격상관의 문제도 예측성능 저하에 영향을 미친다(KMA, 2015b).
2.3 위험회피 개념에 근거한 성능 평가
장기예보의 예측성능에 대한 기존의 평가 방법은 평년 대비 많음(A), 비슷(N), 적음(B) 세 가지 등급으로 구성되는 실적표의 작성 및 평가지표를 이용한 정량적 평가로 이루어진다. 먼저, 장기예보의 예측치와 관측치 사이의 관계를 나타내는 실적표를 작성한다. 장기예보 예측치와 관측치를 모두 A, N, B의 세 등급으로 구분하여 Fig. 1과 같은 표를 만들고, 예측치와 관측치의 등급에 따라 횟수를 추가한다. 예를 들어 장기예보가 A등급을 예측하였을 때 N등급에 해당하는 강수량이 관측되었다면 실적표의 b를 1 증가시킨다. 실적표가 완성된 이후에는 Hit Rate (HR), Relative Operating Characteristics (ROC)와 같은 평가지표를 이용하여 장기예보의 성능을 정량적으로 평가한다. HR은 전체 예측 횟수(a+b+c+d+e+f+g+h+i) 중 예측치 등급과 관측치 등급이 일치하는 즉, 장기예보의 예측이 적중한 횟수(a+e+i)의 비율을 의미한다. HR의 범위는 0부터 1까지이며, 1에 가까울수록 예측성능이 뛰어난 것으로 평가할 수 있다. Son et al. (2017)이 충청남도 지역을 대상으로 기상청 장기예보의 HR을 산정한 결과, 평균 0.3~0.4 정도인 것으로 나타났다.
기상청에서는 장기예보의 정확도를 평가하기 위해 주로 ROC를 이용한다(NIMS, 2019). ROC는 크게 세 가지 과정을 거쳐 산정된다. 먼저 관측치를 기준으로 등급에 따라 적중률과 비적중률을 산정한다. Fig. 1의 실적표로부터 A에 대한 관측 적중률은 a/(a+d+g)이며, 비적중률은 (d+g)/(a+d+g)로 계산된다. N과 B에 대해서도 동일한 계산을 수행한다. 다음으로 등급별로 계산된 적중률과 비적중률을 좌표계에 도시한다. 적중률을 y값, 비적중률을 x값으로 하는 점을 표시한 뒤 이 점들과 (0,0), (1,1)을 연결하여 곡선을 만든다. 그려진 곡선 아래쪽에 있는 면적이 ROC에 해당한다. 따라서 ROC는 0과 1 사이의 값이며, 모든 예측이 100% 적중했을 경우 ROC 값은 1이고 예측이 모두 빗나간 경우의 ROC 값은 0이다. ROC 값이 0.5~0.6 구간에 속하면 예측 “fail”, 0.6~0.7 구간이면 “poor”, 0.7~0.8은 “fair”, 0.8~0.9는 “good”, 0.9~1.0은 “excellent”로 평가할 수 있다(NIMS, 2019).
본 연구에서 이용하는 평가 방법은 기존 등급 체계에서 N을 A와 B 등급에 할당하여 재분류하는 것이 특징이다. 이는 위험회피 개념에 근거한 것이다. 위험회피 개념의 접근 방법은 ‘홍수 발생 가능성이 있느냐 없느냐?’ ‘가뭄 발생 가능성이 있느냐 없느냐?를 비교하는 것이다. 먼저, A는 과다한 강수로 인한 홍수 위험의 발생 가능성을 의미한다. 이 경우에 대상 위험은 A이고, N과 B는 ‘대상 위험 A를 회피한다’는 점에서 같은 범주로 분류될 수 있다. 따라서 대상 위험인 A와 대상 위험이 아닌 N과 B의 결합인 BN으로 등급을 재구성한다. 기존의 실적표를 재분류하는 방법은 Fig. 2와 같다. 대상 위험 A를 회피하는 BN 예측이 적중할 횟수는 e+f+h+i이고 확률은 (e+f+h+i)/(d+e+f+g+h+i)이며, 비적중할 횟수는 d+g이고 확률은 (d+g)/(d+e+f+g+h+i)가 된다. 반대로 B는 과소한 강수로 인한 가뭄 위험의 발생 가능성을 의미한다. 대상 위험이 B이고 위험을 회피하는 등급이 A와 N이 되어 이때에는 B와 AN으로 재분류된다. Fig. 2에서 대상 위험 B를 회피하는 AN 예측이 적중할 횟수는 a+b+d+e이고 확률은 (a+b+d+e)/(a+b+c+d+e+f)이며, 비적중할 횟수는 c+f, 확률은 (c+f)/(a+b+c+d+e+f)로 계산된다.
이러한 개념을 적용할 경우, 즉, 위험회피 개념을 적용할 경우의 실적표는 두 범주(A와 BN, 혹은 B와 AN)로만 구성된다. 기존 A, N, B를 구분하여 표현하는 실적표와는 달리 N의 경우가 A와 B에 모두 포함되는 형태로 변형되는 되는 것이다. 이러한 변화는 사실, 기존의 예측결과를 이용하거나 평가하는 방식만이 달라지는 것이지 예측 그 자체가 달라지는 것은 아니다. 예측된 결과를 이용하는 방식만이 달라지는 것이다.
3. 대상 지역 및 자료
3.1 대상지역
본 연구에서는 우리나라의 중앙에 위치하는 댐 유역인 충주댐유역을 대상 지역으로 선정하였다. 충주댐은 충청북도 충주시 동북방 남한강 수계에 건설된 우리나라 최대 규모의 다목적댐으로 현재 K-Water에서 운영하고 있다. 한강수계의 수자원을 개발하여 수도권 지역의 용수공급 및 홍수조절과 발전을 목적으로 한다(Jun, 2009). 충주댐유역은 충청북도의 3개 시군(충주시, 제천시, 단양군)과 강원도의 8개 시군(원주시, 태백시, 삼척시, 강릉시, 영월군, 평창군, 정선군, 횡성군) 그리고 경상북도의 3개 시군(문경시, 영주시, 봉화군) 등 3도 8시 6군으로 구성된다. 유역면적은 6,648 km2로 전 국토면적의 6.7%에 해당한다. Fig. 3은 충주댐유역의 위치 및 유역도를 나타낸 것이다.
3.2 자료
본 연구에서는 지상관측 강우자료와 기상청 장기예보 자료를 이용하였다. 확보할 수 있는 기상청 장기예보 자료의 기간이 2011년부터 2020년까지이기 때문에 관측자료도 동일한 기간을 이용하였다. 기상청 장기예보는 충청북도를 대상으로 발표된 자료를 이용하였으며, 지상관측 강우자료 또한 충청북도에 위치하는 5개의 ASOS 관측소(충주, 청주, 추풍령, 제천, 보은) 자료를 이용하였다. 장기예보는 1, 2, 3개월을 예측한 자료를 모두 이용하였다. Fig. 4(a)는 5개의 지상관측소에서 관측한 월강수량을 티센가중법을 이용하여 면적평균한 시계열을 나타낸다. 또한, 2020년 5월에 발표된 12개 구역별 장기예보는 아래와 같다.
관측치와 예측치 사이의 실적표는 월강수량 등급에 기반하여 작성된다. 장기예보 예측치는 등급으로 발표되지만 관측치에 대한 등급 분류가 필요하다. 앞서 언급하였다시피 A, N, B를 구분하는 기준은 평년 강수량이다. 즉, 평년 강수량과 관측치가 비슷한 경우 N으로 구분하며 그보다 클 경우 A, 작을 경우 B이다. 따라서 평년 기간인 1981년부터 2010년까지 30년 동안의 충청북도 지역 월관측치를 이용하여 등급을 구분하였다. N의 범위는 평년 기간의 월강수량 중 상위 33%와 하위 33%가 포괄하는 강수량에 해당하며, Table 1은 월별 N 범위를 구분하는 상한계와 하한계를 정리한 것이다. 이 수치에 근거하여 2011년부터 2020년까지의 관측치 등급을 분류하였다.
Table 1
Jan | Feb | Mar | Apr | May | Jun | Jul | Aug | Sep | Oct | Nov | Dec | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
Upper Limit | 14.8 | 14.0 | 39.2 | 43.3 | 67.4 | 117.4 | 238.7 | 213.5 | 63.3 | 28.8 | 25.5 | 16.7 |
Lower Limit | 24.5 | 35.2 | 51.0 | 74.5 | 108.6 | 174.5 | 348.2 | 298.6 | 215.5 | 43.5 | 52.2 | 24.6 |
A, N, B 등급 분류 기준에 따라 2011년부터 2020년까지의 월강수량 관측치의 등급을 구분한 결과는 Table 2와 같다. 관측치에 대해 등급이 결정된 120회 중 A가 총 45회, N이 35회, B가 40회로 나타났다(Table 2). 그러나 장기예보는 1개월 예측의 경우, A가 28회, N이 54회, B가 36으로, 평년범위와 유사할 것으로 예측한 경우가 많았다. 이러한 경향은 2개월 예측(A: 25, N: 55, B: 38)과 3개월 예측(A: 21, N: 57, B: 39)에서도 확인되었다. 즉, 기상청 장기예보는 A와 B보다 N을 더 많이 예측하는 보수적인 측면을 보여주며, 이러한 특성은 수자원의 위험회피적 관리 측면에서는 불리하게 작용한다.
Table 2
3.3 관측 및 예측자료에 나타난 전이확률 평가 (기존 A, N, B의 평가)
장기예보 예측치와 실제 관측 강수량의 추계학적 거동에 대한 유사성을 평가하기 위하여 전이확률을 산정하였다. 전이확률은 정적(static)인 개념의 확률이 아닌 동적(dynamic)인 개념의 확률을 의미하며, Markov process의 성질에 기반하여 산정된다(Isaacson and Madsen, 1976; Norris, 1998). Markov process는 미래시점의 상태를 추정하는데 현재시점과 바로 이전시점의 상태만을 이용하는 추계학적 과정이다(Kang and Yoon, 2002). 이를 본 연구에 적용하면 월강수량 등급의 전이확률은 n월의 i등급에서Δ t월 이후인 (n+ Δ t)월의 j등급으로 전이되는 확률을 의미하며, Eq. (1)과 같이 정의된다.
또한, 전이확률은 Eq. (2)와 같이 계산된다.
여기서 Ni,j(n,n+Δt)은 n월 i등급에서 (n+ Δ t)월 j등급으로 전이되는 횟수를 의미하고, Ni(n)은 n월의 i등급 발생 횟수를 의미한다.
Eq. (2)를 이용하여 관측치와 장기예보에 대한 전이확률을 산정하였다. Table 3은Δ t = 1개월에 대한 전이확률 산정 결과이다. 그 결과, 관측치와 예측치 전이확률의 차이가 있는 것으로 나타났다. 전이확률 산정 간격인Δ t, 전이 기준시점 i, 전이 대상시점 j에 따라 약간의 변동은 있었으나 전이 기준시점의 등급에 관계없이 관측치는 대체적으로 A로 전이될 확률이 크게, 예측치는 N으로 전이될 확률이 크게 나타났다. Δ t= 1개월인 경우의 1월부터 12월까지의 관측치 전이확률을 평균한 결과, 관측치가 A에서 A로 전이될 확률은 0.471, N에서 A로 전이될 확률은 0.444, B에서 A로 전이될 확률은 0.397로 N, B로 전이되는 확률에 비해 높은 것으로 나타났다. 예측치 전이확률의 경우에는 A에서 N으로 전이될 확률이 0.473, N에서 N으로 전이될 확률이 0.462, B에서 N으로 전이될 확률이 0.377로 다른 등급으로 전이될 확률에 비해 큰 것으로 나타났다. 이러한 경향은Δ t= 2, 3개월인 경우에도 유사하였다.
Table 3
다음으로 월별 정상상태확률을 유도하였다. 정상상태확률은 상태 i에서 상태 j로의 변환을 무한히 반복하였을 때, 초기의 확률과 관계없이 수렴되는 특정 확률을 의미한다(Isaacson and Madsen, 1976; Norris, 1998). 월 정상상태확률 Psteady(n,n+Δt)는 시작월 n과 대상월 n+Δ t에 따라 다른 값으로 유도된다. 12개월 주기로 연속되는 전이확률을 지속적으로 곱한 결과의 행(row) 벡터가 월 정상상태확률이 된다. 예를 들어Δ t= 1개월인 경우의 1월 정상상태확률은 Eq. (3)을 통해 계산된다.
여기서 Psteady(12,1)는 1월의 정상상태확률을, P(n,n+1)는 n월에서 n+1월로의 전이확률을 의미한다. 시작월 n과 간격Δ t에 따라 식이 변형된다.
관측치와 예측치의 전이확률을 이용하여 유도한 정상상태확률은 Table 4 (Δ t= 1개월인 경우만 제시함)와 같다. 모든 경우에 대해 정상상태확률은 잘 수렴하는 것으로 확인되었다. 전이확률과 마찬가지로 관측치와 예측치에 대한 정상상태확률 또한 차이가 있었다. Δ t에 관계없이 관측치의 경우에는 A의 정상상태확률이 가장 높게 나타났고, B, N 순으로 나타났다. 예측치의 경우에는 N의 정상상태확률이 가장 높고 다음으로 B, A 순이었다. 이러한 결과는 관측치와 예측치 각각 A, N 등급으로 전이될 확률이 가장 높게 나타났기 때문에 정상상태확률 또한 유사한 경향을 보인 것으로 판단된다. 월별로 정상상태확률의 변동은 큰 것으로 나타났다.
Table 4
4. 위험회피 개념에 근거한 장기예보의 예측성능 평가
4.1 기존 방식의 평가(A, N, B의 평가)
기상청 장기예보에 대한 실적표를 작성하고, 예측성능을 평가하였다. 기존의 장기예보는 A, N, B의 세 가지 등급으로 제시된다. 따라서 실적표는 3개의 행과 3개의 열로 구성되며, 예측치는 i행에, 관측치는 j열에 배치된다. 예를 들어 장기예보는 N을 예측하였는데 실제 관측치는 B인 경우, i = 2, j = 3 성분 a23를 1 증가시킨다. 본 연구에서는 2011년부터 2020년까지의 장기예보 자료를 이용하였으므로 각 월에 대한 실적표의 표본수를 모두 합하면 10이 되어야 한다. 그리고 실적표의 확률 pij은 예측치에 대한 조건부확률로 각 열의 확률의 합이 1이 되도록 산정한다. 즉, 장기예보가 A를 예측한 경우 실제 관측치가 A인 경우가 1회, N인 경우가 2회, B인 경우가 1회였다면 i = 1, j = 1, 2, 3의 확률은 각각 p11= 0.250(=1/4), p12= 0.500(=2/4), p13= 0.250(=1/4)이 된다. 또한, 실적표 대각성분의 확률(p11, p22, p33)이 클수록 장기예보의 예측성능이 우수함을 의미한다.
2011년부터 2020년까지의 기상청 장기예보에 대해 예측 실적표를 작성하고 예측성능을 산정한 결과, 현재 장기예보의 예측성능은 그리 높지 않은 것으로 평가되었다. Table 5는 장기예보의 예측 선행시간이 1개월인 경우에 대해 작성한 실적표이다. 각 성분의 확률과 함께 괄호 안에 횟수를 작성하였다. 동일한 형식의 실적표를 2, 3개월 선행시간에 대해서도 작성하여 예측성능 평가에 이용하였다. 전체적으로 기상청 장기예보는 N을 예측하는 경향이 크고, A를 예측하는 경향이 작은 것으로 나타났다. 그리고 좌상단부터 우하단까지의 대각행렬의 확률이 높지 않은 것으로 나타나 예측성능이 높지 않은 것으로 판단된다. 정량적 평가를 위하여 1월부터 12월까지 전체 기간에 대해 HR과 ROC를 산정하였다. HR은 1개월 예측의 경우 0.305, 2개월과 3개월 예측의 경우 각각 0.305과 0.299으로 산정되었다. ROC는 1개월 예측의 경우 0.323, 2개월 예측은 0.296, 3개월 예측은 0.300으로 산정되었다. 모든 경우에 대해 HR과 ROC가 0.5보다 작은 값으로 계산되었는데, 이는 현재 장기예보의 예측성능이 좋지 않다고 판단할 수 있는 근거가 된다. 또한, 예측 선행시간이 길어질수록 예측성능은 약간 저하되는 것으로 나타났다.
Table 5
계절별로 HR과 ROC를 산정함으로써 계절별 장기예보의 예측성능을 평가하였다(Table 6). 그 결과, 1개월 선행 예측의 경우에는 여름철(6, 7, 8월)과 가을철(9, 10, 11월)의 예측성능이 높고 봄철(3, 4, 5월)과 겨울철(12, 1, 2월)의 예측성능이 낮은 것으로 평가되었다. 그러나 2, 3개월 선행 예측의 경우에는 1개월과 반대로 봄철과 겨울철의 예측성능이 높고 여름철과 가을철의 예측성능이 낮았다. 1, 2, 3개월 선행 예측의 HR과 ROC를 평균한 결과, HR은 봄철에 0.345로 가장 높았으며 가을철에 0.262로 가장 낮았다. ROC는 겨울철에 0.362로 가장 높았고, 가을철에 0.253으로 가장 낮았다. 종합적으로 봄철과 겨울철의 예측성능이 비교적 높고 여름철과 가을철의 예측성능은 낮은 것으로 나타났다. 그러나 네 계절의 HR과 ROC 모두 0.5보다 작은 값으로 산정되어 계절별 예측의 정확도 또한 전체적으로 낮은 수준(fail 수준)인 것으로 확인되었다. 특히 여름철의 예측성능이 낮다는 점은 기상청 장기예보를 이용한 홍수 위험에 대한 대응이 어려울 수 있다는 것을 보여준다.
4.2 위험회피 개념에 근거한 장기예보 자료의 재구성 및 평가(AN, BN의 평가)
2.3절에서 제시한 위험회피 개념 기반의 장기예보 평가 방법에 따라 등급을 재분류하고 실적표를 작성하여 예측성능을 평가하였다. 이 방법은 위험회피 개념에 근거하여 N 등급을 A 혹은 B 등급에 할당하는 것과 같다. 먼저, 4.1절에서 작성한 실적표와 유사한 형식으로 기존의 세 등급이 아닌 두 개의 등급으로 구성한다. 2.3절의 Fig. 2에서 설명하는 방법에 근거하여 N을 예측한 경우의 확률과 횟수를 A와 B에 할당하여 AN, BN 등급으로 재분류하는 것이다. 즉, A에 대한 위험회피 등급은 BN이고 B에 대한 위험회피 등급은 AN에 해당한다. 따라서 3행 3열로 구성된 실적표가 2행 2열로 재구성된다. Table 7은 예측선행시간 1개월에 대해 작성한 위험회피 개념 기반 장기예보 실적표이다. 대상 위험에 대한 등급인 A, B와 위험회피 등급인 AN (=Not B), BN (=Not A)으로 구성된다. 그리고 이 실적표를 기반으로 HR, ROC와 같은 평가지표를 계산함으로써 예측성능을 평가한다.
Table 7
HR과 ROC를 이용한 평가 결과, 위험회피 개념에 근거한 장기예보의 활용도는 큰 것으로 나타났다. 실적표의 좌상단에서 우하단으로 이어지는 대각행렬의 확률이 클수록 예측치와 관측치가 일치하는 경향이 크다는 것을 의미한다. 위험회피 개념에 근거한 실적표의 대각행렬 확률은 대부분의 경우 0.5 이상이었다. 또한, 위험회피 개념을 적용하면 1월부터 12월 전체 기간에 대해 산정한 HR과 ROC가 0.65 정도인 것으로 나타났다. 1개월 예측의 HR은 0.642, ROC는 0.640으로 세 예측시간 중 가장 낮았고, 2개월 예측의 HR은 0.653, ROC은 0.655으로 가장 높았다. 이정도 수치는 NIMS (2019)의 예측성능 판단기준에 근거하면 “fair”에 가까운 것으로 판단된다. 상기의 결과는 기상청에서 제공하는 장기예보 자료를 위험회피 개념에 근거하여 이용하는 것의 가치가 있다는 것을 보여준다.
계절별로 장기예보 예측성능을 평가한 결과, 위험회피 개념을 적용할 경우 홍수 및 가뭄의 발생 가능성에 대한 예측성능도 큰 것으로 나타났다(Table 8). 계절별로 1, 2, 3개월의 평가지표를 산정하고 평균한 결과, 가을철의 HR은 0.710, ROC는 0.730로 가장 높았으며, 여름철의 HR은 0.596, ROC는 0.592로 가장 낮았다. 대체적으로 네 계절 모두 0.6~0.7 정도의 범위 내에서 평가지표 값이 산정되었다. 이러한 결과를 통해 홍수 및 가뭄 회피의 측면에서 장기예보를 활용할 경우 예측성능이 양호하다는 것을 알 수 있다. 다만 여름철의 평가지표가 가장 작은 것으로 산정되었는데, 홍수에 대한 위험을 회피하기 위한 측면에서는 기상청 장기예보의 여름철 예측성능을 향상시킬 필요가 있어 보인다.
5. 결 론
본 연구에서는 장기예보 자료를 수자원 관리의 목적으로 활용하기 위한 방법을 제안하였다. 이 방법은 위험회피 개념에 근거한다. 기존의 장기예보 등급에서 A와 B는 각각 홍수를 유발할 수 있는 과다한 강수와 가뭄을 유발할 수 있는 과소한 강수에 대한 정보를 포함한다. 위험회피의 대상인 것이다. 그러나 N은 위험 정보를 제공하지 않는다. 따라서 N의 정보를 A와 B에 포함시켜 B를 회피하는 A와 N (AN), A를 회피하는 B와 N (BN)으로 재분류하는 방법을 적용하였다. 이 개념은 대상 위험과 대상 위험을 제외한 나머지 전체를 구분하여 적용하는 것으로, 정상상태를 제외한 두 개의 다른 위험만을 고려하는 경우와 다른 개념이다. 즉, 기존의 접근 방법에서 ‘홍수 발생 가능성이 있느냐 정상 범주냐?’ ‘가뭄 발생 가능성이 있느냐 정상 범주냐?’를 비교하는 것과 달리, 본 연구의 접근 방법에서는 ‘홍수 발생 가능성이 있느냐 없느냐?’ ‘가뭄 발생 가능성이 있느냐 없느냐?’를 비교하는 것이다. 본 연구에서는 이 방법론을 충주댐유역이 위치하는 충청북도 지역의 1, 2, 3개월 장기예보에 적용하고, 활용 가능성을 평가하였다. 궁극적으로 현 정확도 수준의 기상청 장기예보가 효율적으로 사용될 수 있는지를 판단하였다.
먼저, 기존의 장기예보 등급 A, N, B로 구분한 경우에 대해 예측성능을 평가하였다. 예측치 및 관측치를 이용하여 실적표를 작성하고, 평가지표로는 실적표에 기반하여 산정되는 HR과 ROC를 이용하였다. 평가 결과, 기존의 기상청 장기예보의 예측성능은 그리 높지 않은 것으로 나타났다. HR과 ROC가 1, 2, 3개월 예측에 대해 모두 0.5 이하의 값으로 산정되었다. 이는 현재 장기예보의 예측성능이 좋지 않다고 판단할 수 있는 근거가 된다. 또한, 예측 선행시간이 길어질수록 예측성능은 약간 저하되는 것으로 나타났다. 계절별로 HR과 ROC를 산정한 결과, 평균적으로 봄철과 겨울철의 예측성능이 높고 여름철과 가을철의 예측성능이 낮은 것으로 평가되었다. 그러나 네 계절의 HR과 ROC 모두 0.5보다 작은 값으로 산정되어 계절별 예측의 정확도 또한 전체적으로 낮은 수준인 것으로 확인되었다. 특히 여름철 예측성능이 낮다는 점은 기상청 장기예보를 이용한 홍수 위험에 대한 대응이 어려울 수 있다는 것을 보여준다.
다음으로 위험회피의 개념에 근거하여 장기예보의 등급 체계를 재분류하고 예측성능을 평가하였다. 먼저, A, N, B 세 등급으로 구분되는 기존 장기예보의 등급 체계를 변형하였다. A와 B는 각각 홍수와 가뭄 발생 가능성에 대한 위험 정보이지만 N은 위험회피와 관련된 정보에 해당하지 않는다. 따라서 N을 A와 B 등급에 할당하여 A를 회피하는 BN 등급과 B를 회피하는 AN 등급으로 구분하였다. 재분류된 등급 체계에 따라 예측성능을 평가한 결과, 장기예보의 활용도가 큰 것으로 나타났다. 위험회피 개념을 적용하여 AN과 BN 등급으로 재분류한 경우에는 1, 2, 3개월 모두 HR과 ROC가 0.6 이상인 것으로 평가되었다. 계절별로 비교한 결과, 가을철의 HR은 0.716, ROC는 0.729로 높았으며, 여름철의 HR은 0.586, ROC는 0.590으로 낮았다. 대체적으로 네 계절에서 0.6~0.7 정도의 범위 내에서 평가지표 값이 산정되었다. 결과적으로 홍수 및 가뭄 회피의 측면에서 장기예보를 활용할 경우 예측성능이 양호하다는 것을 알 수 있다.
본 연구의 결과는 수자원 관리 목적으로 장기예보를 활용하는 경우 위험회피 개념에 근거하는 것이 효과가 있다는 점을 보여준다. 기상청에서 제공하는 장기예보 등급 체계를 위험회피 개념에 근거하여 재분류하는 경우 예측성능이 높은 것으로 나타났다. 따라서 위험회피 개념에 기반하여 장기예보를 활용한다면 갈수시 가뭄대응 목적의 Hedging rule 및 홍수시 댐방류 결정과 같은 댐 운영에 대한 위험을 줄일 수 있어 홍수와 가뭄으로 인한 피해 저감을 기대할 수 있을 것이다. 그러나 위험회피 개념에 근거함에도 HR이나 ROC가 여전히 절반 정도 수준에 머무르는 경우도 있기에 기상청 장기예보 자체의 예측성능을 높일 필요는 있어 보인다. 향후 본 연구에서 제안하는 방법론을 우리나라의 댐 유역에 확장 적용하고, 결과에 대한 평가가 이루어진다면 전국을 대상으로 하는 효율적인 수자원 관리에 기상청 장기예보를 활용할 수 있을 것이다.