국토교통부

국토교통부는 지난 2월 1일 공간 빅데이터 체계 구축 사업의 일환으로 공간 빅데이터를 분석할 수 있는 하둡을 개발한다고 밝혔다. 이에 국토부는 ‘국토교통부 공간 빅데이터 연구 사업’을 진행하고 있으며, 엘에이치는 한국과학기술원(KAIST)와 연세대학교 산학협력단과 함께 공동연구기관으로 선정된 후 연구사업을 시작한지 약 1년을 맞이했다.

약 4년 간 진행되는 이번 사업은 올해 말까지 국토부 대상으로 공간 빅데이터 하둡 적용 체계를 마련하고 내년에는 범부처 공간 빅데이터 체계에 확대 적용하며, 2017년부터는 대민 서비스에 공간 빅데이터 하둡을 활용한 후 민간에도 제공할 계획이다.

하둡은 여러 개의 저렴한 컴퓨터를 하나인 것처럼 묶어 대용량 데이터를 처리하는 기술이다. 기존에 이미지나 텍스트 등 2차원적인 빅데이터만을 수집, 저장, 분석 처리할 수 있었다면, 이번 공간 빅데이터 연구사업을 통해3차원인 공간 정보 빅데이터 (연속지적도, 항공 사진, 3차원 영상 등)를 분석하여 활용할 수 있게 된다. 

국토교통부

현재 엘에이치는 국토교통과학기술진흥원의 2014년 국토공간정보연구사업 컨소시엄에 참여해 ‘공간 빅데이터 분석 및 가시화 기술 개발’을 담당하고 있다.

세부적으로 ‘공간 빅데이터 일괄(Batch) 분석 컴포넌트 시스템 구현’에 관한 역할을 수행하고 있으며, 지난 1년 동안 연세대학교 산학협력단과 함께 공간 빅데이터 통계•비통계 기반 요구조건 분석, 컴포넌트 인터페이스 설계, 아키텍처 설계 등의 정성적 목표를 달성하였다.

현재 진행 중인 공간 빅데이터 연구 과제 중에서 엘에이치가 분석 부분을 맡아서 진행할 수 있었던 가장 큰 이유는 빅데이터 비정형 데이터를 다룬 경험과 데이터를 분석 플랫폼 ‘소셜 보이스(socialvoice)’ 를 가지고 있었기 때문이다.

2011년 오픈한 엘에이치의 빅데이터 분석 플랫폼 ‘소셜 보이스’는 트위터, 네이버, 다음 등 포탈사이트와SNS데이터를 이용하여 인터넷 상에서 사용자들이 생산해 내는 문장들을 수집하는 것을 기본으로 한다. 수집된 데이터는 관계형 데이터베이스 관리 시스템(RDBMS)인 MySQL과 비정형 데이터를 다룰 수 있는 하둡 분산파일 시스템(HDFS)에 저장되고, 저장된 데이터는 맵 리듀스(Map Reduce)함수를 통하여 분석해 그 결과를 사용자의 페이지에 표시하는 원리이다.

한편, 앞으로의 연구사업으로 개발될 공간 빅데이터 플랫폼은 안전, 복지, 보육, 교통, 관광, 의료, 부동산, 민원 등 정책적 제반 사항들에 대한 현재 상황을 진단하고 시각화하여 합리적인 정책의사 결정을 지원 할 수 있게 된다. 또한 공공기관뿐만 아니라 민간부분에 데이터와 분석 방법 등이 공개 되면 개별적으로 관리되던 공간정보를 연계, 통합하여 활용할 수 있다.

엘에이치는 이번 공간 빅데이터 연구과제를 수행으로 비정형 대용량 데이터를 수집, 관리하고 분석하는 기술을 축적함과 동시에 빅데이터 시대에 살고 있는 사람들의 생활과 행동에 보다 깊이 있게 영향을 줄 수 있는 계기가 되길 기대한다.