올들어 우리 나라 고품질 데이타셋 분야의 정책이 잇따라 마련되면서 관련 산업 생태계가 빠르게 조성되고 있다.
류렬굉 국가데이타국 국장은 최근 '2026 세계스마트산업박람회'에서 고품질 데이타셋은 체화지능의 '감지—의사결정—실행'을 뒤받침하는 중요한 기반이라면서 "국가데이타국이 <업계 고품질 데이타셋 건설 행동 추진에 관한 실시방안>을 발표할 예정"이라고 설명했다.
류국장은 고품질 데이타셋이 선진 제조업의 스마트화 업그레이드를 위한 기초 자원이자 혁신 엔진이라고 강조했다. 그러면서 실제 생산라인, 장비 운용 및 품질 검사 등 데이타를 체계적으로 수집·관리·활용해 산업용 파운데이션 모델과 인공지능(AI) 에이전트가 산업 메커니즘을 리해하고 산업 시나리오에 적응할 수 있도록 더 잘 뒤받침해야 한다고 말했다.
올들어 우리 나라에선 고품질 데이타셋 분야와 관련한 움직임이 많이 포착됐다. 특히 공업정보화부와 국가데이타국은 AI 모델과 데이타 자원의 협동·상호 촉진을 추진하는 통지를 발표했다.
산업 플랫폼 차원에서는 지난 4월 29일 국가 데이타셋 관리 써비스 플랫폼이 시범 운영에 들어갔다. 지난달 31일 기준 516개 기관이 인증을 마쳤고 농업, 공업 제조, 교통, 문화관광 등 중점 분야를 아우르는 1,350개의 데이타셋이 공개됐다.
올 1분기 기준 전국에 구축된 고품질 데이타셋은 11만 6,000개를 넘어서며 데이타 총량은 960PB를 돌파했다. 또한 올 3월 기준 우리 나라의 하루 평균 토큰 호출량은 140조개를 넘어선 것으로 전해졌다.
신화통신