난 공산당을 싫어하는, 그리고 대한민국을 사랑하는 국민입니다.

지난 1월 6일 국가지점번호 지도서비스를 종료할 것을 국가로부터 권고받았습니다. 공식 요청이라고 하기에는 애매합니다. 일단 화가 납니다.

<출처 : https://image.librewiki.net/8/8f/%EC%88%98%EA%B0%91.jpg>

바로가기: 프로그웍스 - 국가지점번호 지도서비스

프로그웍스는 2년 전 자비와 노고를 들여 국가지점번호지도서비스(이하 지점번호)를 제작하여 인터넷에 공개했습니다. 지점번호를 제작한 이유는 인터넷을 통해 조회되거나 또는 다운로드 받을 수 있는 공공개방정보가 없었기 때문입니다. 지도서비스로 공개한 이유는 긴급 구조 등으로 이용되는 지점번호의 좋은 취지를 알리기 위함입니다.

그러나 행정안전부 주소정책과에서 서비스를 내릴 것을 전화를 통해 권고하더군요(좋게 표현해서). 제가 비공개 공간정보를 허락없이 제작하여 서비스한다는 사유였습니다.

2년전 지도서비스 개설 후 국토지리정보원으로부터 보안사항 위반을 연락 받았습니다. 지도서비스의 배경지도로 OSM(OpenStreetMap)을 사용했는데 이 부분을 지적하며, 서비스를 폐쇄하던지 또는 배경지도를 바꿀 것을 권고했습니다. 그래서 브이월드 2D 배경지도로 변경한 사례가 있습니다. 아래 링크를 참고하십시오.

바로가기: 프로그웍스 - 오픈스트리트맵 사용과 관련하여

주소정책과에서 행정안전부 및 국토교통부의 보안관련 규정을 언급하며 서비스를 내려야한다고 저에게 얘기했습니다. 사유는 납득할 수 없습니다. 단지 그런 규정이 있다는 것만 얘기하고 저의 물음에는 답이 없는 일방적 통보이니까요.

제가 납득하지 못하는 이유는 아래와 같습니다.

첫번째, 비공개 공간정보라면 그에 대한 명확한 공지가 있어야 합니다. 지점번호의 공개가 범법행위라면 지점번호 부여체계 등 관련 정보를 미디어에 지속적으로 노출시킨 관련 부처 및 공공기관은 범법행위를 저지르고 있는 것인가요? 매년 지자체가 등산로 등에 설치하는 지점번호 표지판 설치도 불법 행위인가요? 지점번호 표지판의 훼손은 없는지, 필요한 곳은 없는지, 어떻게 알려야 하는지 활동을 하는 2020년 6월 발대식을 가진 "국가지점번호 지킴이"도 보안 위반 단체인가요?

바로가기 : 행정안전부 블로그 - 신속한 구조 활동에 활용되는 '국가지점번호', 지킴이와 함께 관리합니다.

두번째, 만일 지점번호의 인터넷 공개가 불법이었다면 2년 전 이미 언급이 되었어야 합니다. 2년전 OSM으로 제한하여 사용을 금지시킨 국토지리정보원이 책임을 다하지 않은 것입니까? 행정안전부의 산하 기관이 아니라서 기관이 담당하는 부분만 언급하고 2년 동안의 범법 행위를 방관한 것입니까? 아니라면 행정안전부와 국토지리정보원의 공간정보 관련 보안 규정이 다른 것입니까? 또는 사용이 적법하지 않은 OSM을 아예 인터넷 접속 단계에서 막지 않은 경찰청 내지는 인터넷진흥원 등의 잘못입니까?

세번째, 국가지점번호는 공간정보가 아닙니다. 공간정보기본법에 따르면 공간정보를 아래와 같이 정의합니다.
< "공간정보"란 지상ㆍ지하ㆍ수상ㆍ수중 등 공간상에 존재하는 자연적 또는 인공적인 객체에 대한 위치정보 및 이와 관련된 공간적 인지 및 의사결정에 필요한 정보를 말한다.>

지점번호는 산, 강, 나무 같은 자연적인 객체가 아닙니다. 도로, 항만, 건물 같은 인위적인 객체도 아닙니다. 지점번호는 단지 식별명을 가지는 가상의 위치 격자 명칭입니다. 따라서 국가지점번호 단독으로 개인 또는 시설을 특정할 수 있는 의사 결정에 필요한 어떤 정보도 가지지 않습니다. 배경지도 위에 표현되는 지점번호가 특정 위치를 나타내는 것이 문제가 된다면, 인터넷을 통해 주소/시설물 검색을 지원하는 모든 지도서비스가 금지되어야 합니다.

바로가기 : 법령정보 - 공간정보기본법

네번째, 통화로 언급한 보안관리규정의 적용 대상이 일반 국민은 아닙니다. 국가의 안보를 위협하는 비공개 정보라면 지점번호가 명확하게 비공개 정보로 규정되어있어야 합니다. 단지 중앙부처와 산하기관에 적용되는 훈령, 예규 등의 규정으로 핍박하는 것은 받아들일 수 없습니다. 국가지점번호는 비공개정보이니 절대 공공이든 민간이든 인터넷에 공개하면 안된다는 정확한 근거가 있어야 합니다.

바로가기: 법령정보 - 국토교통부 국가공간정보 보안관리규정 (훈령)
바로가기: 법령정보 - 행정안전부 공간정보 보안관리규정 (훈령)
바로가기: 법령정보 - 국토지리정보원 국가공간정보 보안관리규정 (예규)

다섯번째, 국가는 국민의 안전과 재산을 위해 존재한다고 배웠습니다. 헌법 제34조 6항은 "국가는 재해를 예방하고 그 위험으로부터 국민을 보호하기 위하여 노력하여야 한다." 라고 규정합니다.
국가지점번호가 "산악, 해양 등 비거주지역에서의 기관마다 서로 다른 위치표시체계를 일원화하여 소방·경찰·국립공원 등 관계기관이 정보공유·협업을 통해 신속한 구조·구급 등 취약지역의 안전관리체계 강화 "하는 목적을 가지고 있다면, 국민이 이를 알고 있어야 그 목적을 이룰 수 있습니다. 

바로가기 : 법령정보 - 헌법

 

내려야 할까요? 공식적인 요청에 응답하겠습니다.

개인이 인터넷에 정보를 공개하는 것은 많은 책임이 따릅니다. 저는 블로그를 운영하며 지점번호 관련 많은 문의를 받았습니다. 생활주소인 도로명주소를 얘기하고 도로명주소를 보완하는 지점번호에 대해 왜 필요한지 알렸습니다. 지점번호에 관심이 있는 구독자가 계십시다. 이에 관심이 있는 구독자가 소수라 할지라도 저는 그 분들을 위해 서비스를 유지할 책임을 가지고 있습니다. 정말 내려야 한다면, 프로그웍스를 이용하고 격려해주신 구독자님들을 납득시킬 수 있는 사유와 함께 서비스 폐쇄를 요청하셔야 합니다.

지금 사용하는 클라우드서비스의 이용기간이 만료되어 당분간 국가지점번호지도서비스를 내려야할 것 같습니다. 절대 부당한 요청에 굴복하는 것이 아님을 말씀드립니다^^ 약간의 시간이 걸리겠지만 더 좋은 환경에서 서비스를 이어나가겠습니다.

프로그웍스를 성원해주시는 구독자님들께 깊이 감사드리며, 좋은 정보 공유를 위해 계속하여 정진하겠습니다.

 

"지아이에스엔진"을 누구나 이해할 수 있도록 정의하고 싶습니다. 가능할까요?

공공정보화사업 부문에 편중될 수 밖에 없는 공간정보산업의 영세함으로, 접하게 되는 고객의 대부분은 공공부문에 근무하고 계십니다. 프로젝트 관련하여 많이 받게되는 질문은 "GIS Engine은 어떤 것을 사용합니까?" 입니다. 수행해야 하는 프로젝트가 물품구매 형식의 GIS Package SW 납품이라면 쉽게 답할 수 있습니다. 그러나 보통 공간정보 분야 용역사업은 어떤 목적을 이루기 위한 개발 사업입니다.
필자는 "GIS Engine" 이 무엇이지 쉽게 설명하고 싶은데 사전에서 찾을 수 없습니다. 물론 Wikipedia에서도 찾을 수 없는 Local 정의어 입니다. 어떻게 표기를 해야할지도 모르겠습니다. 

인터넷 탐색으로 Arcgis Engine의 정의는 찾을 수 있습니다.
"ArcGIS Engine is a complete library of embeddable GIS components for developers to build custom applications"

전문보기 : What is ArcGIS Engine?

ArcGIS 엔진은 개발자가 GIS 응용 어플리케이션 개발을 할 수 있도록 지원하는 컴포넌트의 집합인 것 같습니다. 그렇다면 GIS엔진은 흔히 말하는 경로찾기, 지오코딩 등 수많은 서비스 또는 컴포넌트가 언어나 사용자 환경에 상관없이 호출되어 사용될 수 있도록 하는 어떤 것들의 집합이라고 정의할 수 있을까요? 어렵습니다. 여기에도 모순은 존재합니다.
안타깝게도 저에게 질문을 던진 고객은 공무원 이며 개발자가 아닙니다. 아무리 좋은 컴포넌트를 준다고 한 들 사용할 수 없습니다. 또한 프로젝트 결과물의 최종 사용자도 대부분 일반 사용자이거나 공공기관 업무용 SW로 공무원을 대상으로 합니다. 이 분들은 절대 개발을 하지 않습니다. 컴포넌트 집합이라고 정의하면 사용자가 너무 한정됩니다.

일반적으로 GIS SW 또는 공간정보 분야 서비스 어플리케이션은 아래와 같이 구성됩니다. 저는 사용자 UI를 가지고 GIS Data에 대한 CRUD가 발생하기 위해 대부분 3계층으로 구성합니다.

1. 데이터를 제공하는 "Data Provider 계층" ==> 서버영역
2. 데이터를 처리하는 "Process 계층" ==> 서버, 클라이언트 영역
3. 데이터를 보여주는 "Presentation 계층" ==> 클라이언트 영역

3계층으로 구성되는 배치 구성을 통해 GIS Engine을 정의할 수 있을까요? 위의 3가지가 유기적으로 연결되는 것은 특정 비즈니스 목적에 맞도록 어플리케이션이 제작되는 것입니다. 이는 주문형 SW로 특정 업무분야(재난, 교통, 통계,...)에 최적화되는 것으로 GIS엔진이라고 정의하기는 무리가 있습니다. 

"Data Provider" 계층은 파일시스템 또는 DBMS 영역으로 독립적 구성을 가집니다. 공간속성을 가지는 GIS Data는 "Data Provider"계층에서 수용해야하는 많은 종류의 데이터 중 단지 하나일 뿐입니다. 범용성, 활용성 등을 고려하면 오히려 GIS엔진보다 훨씬 넓은 영역입니다. 

"Process"계층은 어쩌면 GIS엔진이라고 정의할 수 있을 것 같습니다. 흔히 말하는 공간연산 등 굳이 공간정보를 다루는 특화된 기능이 적재될 수 있는 공간입니다. 여기에도 모호한 부분이 존재합니다. 공간정보를 다루는 기능의 구현형식이 XML Web Service, Restful Service,.. 무엇이 되든 결국은 개발자 또는 전문가를 대상으로 하고 단독으로는 존재할 수 없는 문제가 있습니다.

"Presentation"계층은 GIS엔진이라고 정의할 수 있을까요? 이 또한 어려워 보입니다. Presentation계층에서 가장 중요한 것은 Data 시각화 입니다. 최근의 정보화 추세는 Thin Client 방식의 구성을 선호합니다. 당연히 데이터 영역과 시각화 영역을 분리합니다.
업무 목적에 따라 같은 데이터라도 시각화 형식은 다를 수 있습니다. 시각화의 목적은 데이터를 통해 Insight를 얻는 것입니다. 이는 보통 "BI(Business Intelligence"라고 말하며 그 부분에 공간정보의 시각화도 포합됩니다.

일반적으로 말하는 GIS정의만으로 어떤 목적을 설명하기는 어렵습니다. 빅데이터가 생산되는 최근의 정보 환경에서 하나의 기술 또는 정의만으로 목표를 달성하기는 너무 어렵습니다. 실제 요즘 모든 분야에서 GIS 기술은 활용되고 있습니다.
최근 코로나 바이러스 상황에서 코로나 지도가 바로 인터넷에 공개되는 것은 GIS기술이 얼마나 빠르게 수요시점에 적용될 수 있는가를 말하고 있습니다. 이러한 수요란 공급자가 아닌 사용자가 결정하는 것으로 GIS 엔진의 필요성이나 기능은 사용자 환경에 따라 다를 수 있습니다.

확실한 한가지는 타 기술 분야와 융합될 수 있는 유연함이 GIS엔진이 가져야하는 조건입니다. 필자의 20년 경험으로 GIS엔진을 정의할 수 없네요.두서없이 길었지만 필자가 전하는 의견은 단 하나입니다.

무얼 만들지, 누구를 위해 만들지가 중요한 것 같습니다. GIS엔진의 모호한 정의는 자칫 프로젝트를 어렵게 할 수 있습니다. 애매모호한 요청에는 두리뭉실한 답변이 갈 수 밖에 없습니다. 굳이 공공정보화사업이라면 GIS엔진을 말하기보다는 이루고자하는 가치를 명확히 하는 것이 중요합니다.
GIS엔진(?)은 그 다음에 고민하는 것이 맞을 것 같습니다. 공간분석이라는 그 들만의 리그에서 벗어나야 하지 않을까하는 소견을 밝히며 마무리합니다.

들어가며

 (이미지 출처: Switch from Shapefile )

작년 가을 국가지점번호를 제작하고 이를 공개하는 수단으로 Shape File (이하 SHP)을 고려했습니다. 그러나 당시 내린 결론은 "SHP는 빅 데이터(빅테이블)을 저장하거나 전달하는 수단이 될 수 없다" 입니다.  저희는 "왜 SHP를 사용하지?"라는 의문을 가지게 되었습니다.

본 글의 작성 목적은 다음과 같습니다. SHP는 우리가 사용해야 하는 데이터 형식 중 하나일 뿐이다. 하지만 현 시점에서 굳이 사용할 필요가 있을까하는 고민을 해보자는 것입니다.

SHP 파일은 무엇인가?

GIS분야에서 에서 널리 사용되는 SHP파일은 두 가지 분류가 존재합니다.  (참조: fileinfo )

  • AutoCAD shp file
    다양한 3D 디자인 프로그램에서 사용되는 객체,일반적으로 정점과 선으로 정의된 다각형을 표현
  • ESRI Shpfile
    ESRI 제품군에서 사용하는 데이터 셋으로 GIS 응용프로그램에서 점, 선, 면 같은 공간 형상요소를 저장하는데 사용

GIS사업 태동기 ESRI 제품군이 국내 GIS산업의 발전에 기여한 것은 부인할 수 없는 사실입니다. 공개SW나 대체할 수 있는 기술의 부재로 ESRI의 Arc* 제품군은 널리 사용되었습니다. 그런 이유로 SHP는 국내에서는 특히 사실 상(de facto)의 표준처럼 사용되었습니다.

 그러나 Big Data 의 출현 등 정보 이용 환경이 변함에 따라 그 한계 또한 보이고 있습니다. ESRI 또한 자신들의 사이트에서 이런 한계를 인정하고 극복하고자 노력하고 있음을 알리고 있다.

"shp 파일"은 단순 형상 지오메트리를 저장하는 데 사용할 수 있으나, 속성에 심각한 문제를 가지고 있다. 예를 들어 null 값을 저장할 수없고, 숫자를 반올림하며, 유니 코드 문자열을 제대로 지원하지 못하고, 10 자보다 긴 필드 이름을 사용할 수 없으며 날짜필드에 시간을 저장할 수 없다. 또한 도메인 및 하위 유형과 같은 지오 데이터베이스의 기능을 지원하지 않으므로,아주 단순한 속성이없고 지오 데이터베이스 기능이 필요하지 않으면 shp 파일을 사용할 필요가 없다."
(출처: ArcGIS )

SHP 문제 : 용량 제한 (Object별 2Gb)

 

다뤄야하는 데이터의 크기가 지금처럼 크지 않을 을 때 시스템간 데이터를 옮기는데 이보다 좋은 GIS 파일 형식은 존재하지 않았습니다.

 그러나 현재는 Big Data 시대입니다. 개인용 컴퓨터도 64bit이며, 사용가능한 디스크도 차고 넘치지만 SHP는 Object별(.shp, shx, dbf) 크기가 2Gb를 넘을 수 없습니다. 시대의 흐름에 맞춰 SHP가 진화를 하지 못했습니다. 


국가공간정보포털이 제공하는 연속지적도는 시도 또는 시군구로 나뉘어 배포되고 있습니다. 누군가는 구분된 것이 편하지만 그렇지 않을 경우도 있습니다.
하지만 SHP의 파일 크기 제한으로 지역별로 구분되어 배포될 수 밖에 없습니다. 
(이미지 출처: 
Switch from Shapefile )

예를 들면 Excel, Lotus123, dBaseⅢ 등은 동시대에 최고의 업무 도구였지만 지금은 파일 적재용량을 진화시켜 온 Excel만이 시장을 지키고 있습니다.  
(사실 이 부분도 시장에서 64bit 체계가 본격화 되면서 자연스레 진화 한 것이지 억지 용량을 확장 시키려 진화 한 것은 아니라고 생각된다.)

SHP는 3가지 핵심 구성요소 를 가지고 있다. *.shp, *shx, *.dbf

이 중 속성 적재 체계(*.dbf) 는 dBase의 파일적재 구조를 차용해서 사용하고 있다. 
(dBASE는 1980 년대 초에 개발 된 형식으로, 당시에는 특성 테이블을 저장하는 데 사용)

전체 3가지 구성요소 각각은 이론적으로 용량이 무제한이지만, 벡터요소를 저장하고 속성과 매칭 시켰을때 기술적 문제때문에 각각의 구성파일로 한개의 공간정보를 표출 할 수 있는 한계가 2Gb 였던 것으로 알고 있다. 
덕분에 shp 파일을 지원하는 도구들의 처리용량도 종속되어 shp 파일 용량 이상으로 확장 할 수 없다.

shp 파일은 명시적으로 32 비트 오프셋을 사용함으로 최대 8Gb 를 넘을 수 없지만 실제로는 16비트 word에 32 비트 오프셋을 사용 한다. 하지만 OGR shapefile 은 4Gb로 제한 되어 있다. 

 

SHP 문제 : 헐~ 이렇게나 많이

  • 좌표계 정의를 위한 별도 파일 요구
    좌표계를 가지기 위해 부가적으로 *.prj 파일 요구
  • 벡터, 속성, 인덱스가 분리된 다중 파일 형식
    사용자는 하나의 파일로 데이터를 주고 받을 수 없어, 네트워크 환경에서 이용하기에 제약이 존재
    (현재 zip 형식으로 배포하는 것이 가장 일반적임)
  • 속성 필드 명칭 길이 제한 (10자 보다 긴 이름을 사용할 수 없음)
  • 최대 필드 개수 제한 (DBF는 255개 이상 필드를 지원하지 않음)
  • 제한된 자료형 (Float, Integer, Date, text형의 254 character)
  • 문자 셋 이용 제한
    알 수 없는 문자 셋, 데이터베이스에서 사용되는 일부 문자셋 사용 불가, UTF-8 미지원
  • 토폴로지 (Topology)를 지원하지 않음
    지형 객체간 관계를 가질 수 없어 별도 3rd Party 도구 요구
    (Topology란 쉽게 말해서 "홍길동과 홍길순이 손을 잡았다"에서 "손을 잡았다(관계)"를 말합니다)
  • 다중 Geometry를 지원하지 않음
    하나의 SHP에 점, 선, 면을 함께 자장할 수 없습니다. 오직 한가지 형태의 도형만 저장
  • 단일 테이블만 지원
    테이블의 상속, 관계 등이 없음으로 전체 데이터 셋을 관리할 수 있는 방법을 제공하지 않음
  • Binary 형식으로 벤더 종속
    대용량 데이터의 Streaming Service 이행 불가, 기계판독(Machine-Readable)이 불가능한 벤더 종속적인 형식으로 데이터의 일부분을 가지고 시각화가 어려움

 

마치며

데이터를 개방하고 공유하는 시대입니다. SHP는 전체 시스템 관점에서 데이터를 생산하는 도구에서 사용되는 좋은 포맷일 수 있지만 개방 및 서비스를 위한 좋은 포맷은 아닙니다. 오랜기간 사용되어 친숙합니다. 편한 것 같기도 합니다. 하지만 주위를 둘러보면 이제는 다른 대안이 필요하다는 것을 알 수 있습니다.

작성하고 보니 SHP가 나쁜 놈처럼 보입니다. 그렇지 않습니다. SHP는 그 용도가 분명히 있습니다. 전체 시스템 관점에서 볼 때 언제 어떤 것이 쓰이는 것이 가장 좋을지 판단하고 사용하자라는 것입니다.

남북 대치 상황에서 보안 관련 사항은 무엇보다 중요합니다.

저희는 공개SW를 이용한 GIS 활용을 돕고자하는 순수한 뜻으로 글을 작성하고, 예제를 제공합니다. 하지만 본의 아니게 저희의 예제가 군사 시설 등을 그대로 노출하고 있어 일부 서비스에 대한 변경을 가져갈 수 밖에 없음을 알려드립니다.

저희가 제공하는 예제의 일부는 배경지도로써 "OpenStreetMap"(이하 OSM) 을 이용합니다.  OSM은 전세계 사용자의 참여에 의해 만들어지는 지도이다보니 남북이 대치하는 국내 실정을 반영하지 않습니다. OSM에는 군사시설 등의 위치가 그대로 노출되는 문제가 있습니다.

금일 모기관에서 OSM을 사용하지말 것을 권고 받았습니다. 속상하지만 국가 정책은 당연히 따라야 한다고 생각합니다. 그래서 어쩔 수 없이 저희가 게시하는 국가지점번호지도서비스의 배경도를 Vworld로 변경합니다.  국가가 공공개방하는 정보와 인터넷을 통해 널리 활용되는 것의 사용에도 제약이 존재하네요.

Vworld 2D Map의 경우지원하는 축적범위가 최대 확대 수준을 기준으로 OSM 대비 2단계 낮습니다. 이에 앞으로 저희가 공개하고 있는 "국가지점번호 지도서비스"에서 "10m X 10m"격자가 가리키는 지형사물을 식별 할 수 없습니다. 양해 부탁드립니다.

아래 그림은 OSM과 Vworld Map 의 동일지역의 Portrayal 차이입니다.

 

> 바로가기 : 국가지점번호 지도서비스 게시글
> 바로가기 : 국가지점번호 지도서비스

공공 부문 클라우드 컴퓨팅 필요성

비용 효율성이 높기 때문이 아닌 클라우드라서 가능한 사용사례를 제시합니다.


1. 공간정보 및 공간정보 활용 도구를 제공하는 수단

  • 공간정보(지적 등 측량정보 포함)는 초기 구축 비용이 비교적 많이 소요되고 공공부문에서 주도적으로 생산될 수 밖에 자료 특성을 가지고 있음
    ==> 클라우드를 통해 즉시 이용 가능한 형식으로 수요처에 제공

  • 공간정보 응용 시스템의 경우 일반 정보시스템 대비 기반환경 구축비용이 비교적 많이 소요됨
    ( 데이터 프로바이더 : Spatial Data Extension 등, 자료 처리: 비교적 많은 컴퓨팅 자원을 사용)
    ==> 사용자 비즈니스 검증 및 공간정보 활용을 위한 제반 도구를 제공

  • 정보제공방법으로  OpenAPI를 통하여 제공되는 서비스의 경우 일일 이용횟수 제한 및 네트웍을 통해 제한적으로 전송되는 패킷 제한으로 대용량 데이터 취득에 부적합
    ==> 클라우드를 통해 가상머신(서버)에 수요자가 원하는 데이터를 전체 세트로 제공

  • 정보제공 방법으로 파일 다운로드는 최신성 유지 및 활용을을 위한 전처리에 비교적 많은 수작업이 요구
    ==> 클라우드를 통해 Spatial DBMS에 탑재되는 Table 형식으로 즉시 이용가능하도록 제공

  • 클라우드 환경에서 공간정보데이터셋(ex: file, Spatial dbms) 및 활용도구(ex: OpenAPI, Quantum GIS, 전자정부프레임워크, EndUser App.)를 가상머신으로 제공한다면 진입장벽을 낮추는 효과 및 다양한 응용을 기대할 수 있음


2. SW 생명주기를 관리하는 시스템

  • SW는 장기적 관점에서 기획되고 운영되는 것과 특정 이벤트가 원인이 되어 단기적으로 운영되는 SW가 존재함
    (메르스, 구제역 등 특정 시점에 운영되는 SW에 자원을 할당, 이 후 상황 해제에 따라 자원을 회수 및 백업)

  • 단기간 운영되는 SW의 물리적 서버환경에 대한 체계적 관리 방안이 요구
    ==> 통합된 클라우드 인프라 환경 위에 개별 SW를 가상환경에서 운영한다면 물리적 인프라 자원을 효율적으로 사용할 수 있음

  • SW 생명주기가 관리를 위한 기준 정보로 활용됨으로써 거시적 관점에서 운영계획을 수립할 수 있음


3. 업무 중요도에 따라 컴퓨팅 자원의 활용이 자유로운 플랫폼

  • 비즈니스를 위한 의사결정은 환경적 요인의 영향을 많이 받음으로써 의사결정에 요구되는 정보의 우선 순위는 항상 바뀔 수 밖에 없음
    ==> 수요자의 선호도 및 업무 중요도에 따라 시스템 자원 점유의 우선 순위를 가지도록 하는 것은 무엇보다 중요함

  • 시장의 다양한 요구를 수용하는 서비스 제공은 원칙적으로 불가능함 
    ==> 정보 수요에 따라 개발과 전개가 자유로운 서비스 모델이 요구되며 이는 플랫폼이 지향해야하는 최고 가치임

  • 클라우드는 유연한 확장 및 조정이라는 특징을 기반으로 데이터 수용 능력, 적시에 어플리케이션을 제공하는 능력 등 비즈니스 환경변화에 대응할 수 있는 기반 기술임


언제쯤 정확한 필지 정보를 볼 수 있을

ICBM(IoT, Cloud, BigData, Mobile의 약칭)으로 설명되는 스마트 기술의 발전에 따라 4차 산업혁명이 만들어 갈 새로운 세상을 기대하고 있다. 공간정보는 새로운 세상을 만드는 기반 지식재로 그 가치와 중요성이 더욱 커지고 있다. 공간정보 분야의 정책 방향은 스마트시티의 확산과 디지털 트윈(Digital Twin) 기술의 확보를 통해 다양한 산업분야에 영향력을 확대하고자 한다.
디지털 트윈은 미국 제너럴 일렉트릭(GE)이 주창한 개념으로, 컴퓨터에 현실 속 사물의 쌍둥이를 만들고 현실에서 발생할 수 있는 상황을 컴퓨터로 시뮬레이션하여 결과를 미리 예측하는 기술이다. 디지털 트윈은 제조업뿐 아니라 다양한 산업·사회 문제를 해결할 수 있는 기술로 주목 받는다. (위키피디아)

가상공간이 정교할수록 얻을 수 있는 가치는 더욱 커지겠지만 과연 그렇게 될 수 있을지 의문이 드는 것도 사실이다. 기술이 문제가 아니라 콘텐츠로써 공간정보가 가지는 품질이 그리 좋지 못하다는 것이다. 본 글에서는 간단한 육안 점검을 통해 현재 국가가 개방하는 연속지적도의 품질을 살펴보고자 한다. 연속지적도는 국가가 개방하는 공간정보 중 가장 널리 활용되는 데이터로 토지거래 등 국민 실생활과 밀접한 관련이 있는 데이터이다.

연속지적도 품질 점검

1. 서울시에 주인이 없는 땅이 존재할 수 있을까?

대한민국은 국민이 가진 재산의 상당 부분이 부동산에 묶여있는 나라이다. 그만큼 정확한 토지 경계의 보유가 중요하지만 우리나라의 지적도는 종이도면에 점과 선으로 표현되어있는 것을 디지털화한 지적도를 기본으로 사용한다(도해지적).
정부는 도해지적이 가지는 근본적 문제 (품질 등, 원도의 제작시기가 일제강점기)의 해결을 위해 "도해지적 수치화 추진계획"을 통해 도해지적을 수치지적(측량을 통해 수치화한 정확한 지적)으로 전환하는 중이다. 이를 2030년까지 완료할 계획이고 전국 약 3,800만 필지 중 약 30%에 해당하는 1,140만 필지를 대상으로 한다.
결국 나머지 2,000만 필지가 넘는 70%는 부족한 품질 문제를 가지고 갈 수 밖에 없다는 것, 완료시기 또한 늦어 과연 가상 국토에 정확한 지적이 담길 수 있을지 걱정이 된다.

> 바로보기 : 도해지적 수치화 추진 계획

아래 그림은 국가공간정보포털이 개방하는 연속지적도(서울특별시 서초구)로, 표시된 지역은 필지가 어긋나거나 누락된 경우이다. 실제 누락이 아닌 개방데이터의 문제이겠지만 민간의 지도서비스는 해당 지역에 누락이 없음을 알 수 있다. 


2. 대구시는 어떻게 설명할 까요?

도해지적이 가지는 문제점은 개별 시군구로 작업을 진행하고 이를 통합해 연속지적을 만든다는 것이다. 여기서 개별 시군구에 적용되는 작업절차에 문제가 있었는지 또는 작업자의 단순 실수였는지 개방되는 연속지적도의 대구시는 심각한 오류를 가지고 있어 사용 하지 말 것을 권장하고 싶다.
대구시 연속지적의 가장 큰 문제는 시군구 별 나타나는 위치 오차 패턴이 서로 다르다는 것이다. 어쨌든 이런 저품질의 데이터를 편집하여 지적도 조회서비스를 제공하는 다음, 네이버 등 대형 포털의 기업 역량에 새삼 감탄하게 된다.
가장 많이 애용되는 개방 데이터라면 개방 품질에 조금 더 신경을 써 주었으면 하는 바람이 있다.


맺음 말

필자는 4차 산업혁명도 기대하지만 그 전에 현재 개방하고 있는 공간정보의 품질 관련 문제를 먼저 해결하기를 간절히 바라고 있다.
정부가 개방하는 공간정보는 활용을 위한 전처리에 많은 비용이 든다. 연속지적도로 한정한다고 해도 정확한 지적경계를 조회하고 싶다. 이를 위해 지적측량을 담당하는 한국국토정보공사만으로는 부족하다는 생각이다. 한국국토정보공사를 지원하는 민간 기업의 역할 확대를 통해 정확한 토지 정보를 충분히 가질 수 있다.

도로, 항만, 공항을 건설하고 하는 것만이 SOC(사회간접자본, Social Overhead Capital)범주에 포함되는 것은 아니다. 공익 목적에서 보면 정확한 토지정보 또한 Digital SOC라고 정의할 수 있다. 정밀한 토지정보를 만드는 정부의 의지를 통해 관련업계의 수익성이 개선되고 새로운 일자리를 만들 수 있다.
일제강점기에도 토지재조사사업을 통해  지적을 만들었는데 국민소득 3만불이 넘은 지금 하지 못할 이유는 없다. 공간정보 분야에 종사하는 많은 업체가 다른 것은 몰라도 수치 지도를 만드는 기술 역량은 충분히 가지고 있다. 

과거 전자정부 초창기 시절 행정DB 구축 사업처럼 정부 의지만 있다면 정확한 지적을 가지는 것이 그리 어렵지 않을 것이다.

 

클라우드가 주는 산업 구조 개편 기회를 가질 수 있다면...

국가정보화사업을 업으로 하는 필자의 입장에서 KLIS, 국가공간정보통합체계(이하 국통), UPIS 등 국토정보시스템의 기반 인프라 구성은 많은 의문점이 들게 한다. 국토정보시스템의 기반 인프라가 고마운 것은 수많은 서버로 인해 많은 유지관리 항목이 많은 것,
황당한 것은 굳이 저리 많은 장비가 필요했는지 여부, 화가 나는 것은 내가 낸 소중한 세금이 장비에 대한 유지보수 비용 명목으로 외국 기업으로 나간다는 것,
여기까지 생각이 도달하면, 언론에 공개되는 보도자료가 말하는 것처럼 공간정보산업은 일자리를 만들고 있는가 하는 것에 동의할 수 없게 된다.

국가공간정보통합체계(이하 국통)는
전통적으로 중앙정부, 지자체에서 업무별로 GIS시스템을 개별 구축하여 공간정보의 공유 및 활용도가 낮고 중복투자 문제 등이 발생했다. 이에 대한 개선으로 국통은 국가가 보유한 공간정보를 연계 또는 통합하여 공동 활용하기 위한 서비스 체계를 구축하는 원대한 비전을 가지고 구축되었다. 

국통은 중앙센터시스템을 기준으로 200개 이상의 기초자치단체, 15개 이상의 광역자치단계, 중앙부처가 EAI를 통해 행정망 내에서 연계되는 시스템 구성을 가진다.
EAI 연계는 정보 송수신 측에 있어 EAI Adapter를 필수적으로 요구한다. 국통에 포함되는 개별 기관의 국통 인프라는 EAI 서버를 시작으로 차이는 있겠지만, 자료처리서버, GIS 서버, 데이터베이스 서버, 저장서버(또는 스토리지) 등 다수의 서버 자원을 포함한다.
구성 특성에 따라 물리서버를 이용하든 가상서버를 사용하든 하겠지만, 중앙센터시스템을 빼더라도 2,000개 이상의 서버로 구성되어 있음이 추정된다.
물리서버라면 대부분 HP, IBM, DELL의 장비 일 것이고, 가상화 서버라면 기반 소프트웨어는 VMWare가 대부분을 차지할 것이다.

국가정보화예산 중 유지관리 예산에서 실제 이들 장비의 유지관리 비용으로 일정 부분 소요된다.
일반적으로 서버가 감가상각되는 기간이 5년이라고 할 때, 그 5년 동안 장비에 대한 유지관리 비용 및 예비 파트 비용이 지속적으로 소요되고 시스템을 유지하기 위하여 일정 기간 사용 후 장비 교체 수요가 발생한다. 100% 외산인 서버 장비의 경우 유지관리비용의 최대 수혜자는 결국 글로벌 서버 제조사일 수 밖없다. 
또한 가상화서버를 이용할 경우에도 상용 SW 등의 패치를 위한  비용 등은 지속적으로 지불될 것이다.
해마다 연말이 되면 각 자치단체 별로 해당 시스템의 유지관리를 위한 제안요청서가 나라장터에 공개된다. 자급율이 낮은 대부분의 자치단체는 이를 유지하기 위한 비용이 사용율과 비교할 때 그리 효율성이 높은 비용은 아닐 것이다.
심각한 문제는 이런 류의 시스템이 비단 국통 뿐만 아니라 KLIS, UPIS, 도로명주소 등 GIS라는 이름이 붙은 것은 거의 대부분이 이와 비슷한 구성을 가진다는 것이다. 국통을 포함한 국토정보시스템을 구성하는 물리적 서버 갯수 만으로도 이미 공간정보 전용 클라우드 운영의 타당성이 성립된다.

물리 서버를 제작하는 국산 기술력이 낮다거나 또는 국내 시장이 작아 경쟁력을 가질 수 없다는 등의 사유는 존재하겠지만, 적어도 서버 위에 설치되는 가상화 등의 SW영역 뿐이라도 국산SW가 사용되기를 조심스레 바라본다.
공공 부문이 국산SW를 외면한다면 관련 기술의 발전 및 산업 생태계 형성을 기대할 수 없다. 현재처럼 공공부분 대부분의 정보전산담장자가 외산SW를 선호하는 환경, 어쩔 수 없을 때 국산 SW를 선택하는 상황은 결코 바람직하지 않다.
정보화사업을 진행하다보면 대부분의 정보운영실 담당자는 안정성이 중요하기 때문에 VMWare, Oracle 등을 얘기하지만 국민의 세금으로 운영되는 국가시스템이 국산 SW를 외면하면 절대 국산 SW산업은 발전 할 수 없다.
또한 최근의 화웨이 문제에서 드러나듯이 정보시스템을 구성하는 개별 요소의 국산화는 외교 무대에서 자기 목소리를 낼  수 있는 수단이다.

물론 개발자들의 외산SW 선호도 문제이다. 개발자 스스로 공공부문에서라도 불편하지만 국산SW 환경에서 개발을 수행하는 것이 내 가치(수행 단가)를 올리는 가장 빠른 길임을 공감했으면 하면 바람을 가지고 있다.

결국 필자가 공간정보분야의 클라우드를 주장하는 이유는 공간정보 관련 정보시스템의 기반 인프라를 구성하는 물리적 서버 등 장비의 갯수를 줄이고, 클라우드 서비스 운영을 위한 SW 스택을 국산을 통해 이행하자는 것이다.
이를 통해 절약되는 비용만큼을 공간정보 응용 서비스를 개발하고 유지하는 비용으로 사용한다면, 지금보다 좋은 품질의 데이터 및 서비스를 제공하게 되지 않을까하는 막연한 기대를 하는 것이다.

길었지만 개인적 견해를 밝히자면, 다음과 같다.

1. 국통의 본 취지를 재해석하여 모든 기반 인프라는 한 곳으로 모은다.
2. 이를 효율적으로 관리하기 위한 방법으로써 국토정보 전용 클라우드를 구축하여 물리적 외산서버의 갯수를 최대한 줄인다.
3. 클라우드 관리 및 운영 SW는 기반기술의 축적을 위하여 국산SW를 적용한다.
4. 클라우드에 탑재하여 동작하는 GIS SW, 연계 SW, DBMS 등도 철저히 국산 SW를 적용한다.
5. 국산 SW가 존재하지 않을 경우 외산 SW가 아닌 공개SW를 사용한다.
6. 국통 또는 다른 시스템 운용을 위한 SW 요구조건을 명세화하여 이를 클라우드가 제공하는 서비스 카탈로그로 관리하고,
7. 이러한 요구조건을 만족하는 어떠한 국산SW라도 클라우드의 서비스 카탈로그로 등록한다.
8. 사용자는 서비스 카탈로그에 등록된 국산SW를 선택하여 개별(지자체) 시스템을 구성하도록 한다.
9. 이를 통해 국산SW의 판로를 제공해 주고, GIS업체가 정보화 사업이 아닌 솔루션 판매를 통한 매출구조를 가져갈 수 있도록 지원한다.


사실은 너무 어려운 얘기를 했습니다. Oracle, ESRI, VMware 등을 배재하고, 기반 인프라 구성을 얘기하는 것은 어쩌면 말도 안되는 주장으로 비춰질 가능성이 높을 테니..... 역적일까요?





 

공간정보산업 발전을 위한 성찰의 시간을 갖고자 합니다.


서론

곧 다음 해(2019년) 정보 예산안의 심의가 열릴 것이다. 작 년 이 맘때즘 기사화된 신문 지면을 참조하면 국가정보화 부문의 2018년도 실행 예산은 약 5조 2천억원으로, 중앙정부가 4조 2천억원, 지자체가 약 1조원을 투입하는 것으로 되어 있다. 어느 정도 규모인지 가늠하기도 힘든 금액임에도 불구하고 정보화사업을 주업으로 하는 대다수의 중소기업, 특히 공간정보 분야의 국가정보화사업을 주업으로 하는 중소기업들이 더욱 힘들 수 밖에 없는지 원인을 고민해 본다.


 공간정보 분야의 중소기업을 유독 힘들게 하는 여러 문제점들을 살펴보면, 상대적으로 미미한 공간정보산업규모, 신규 발주되는 사업의 축소와 기 구축 시스템의 유지관리비용 증가, 외산 솔루션 또는 공개SW 에 종속된 기반 기술력 부족으로 신규 시장 창출 역량 부족, 저임금과 잦은 출장으로 고용의 질이 좋지 못한 것, 마지막으로 경영난 타개를 위하여 전문 분야가 아닌 부문의 사업수행 실패로 인한 기업 신뢰도 하락 등을 들 수 있다.


본론

1. 상대적으로 미약한 공간정보산업 규모 및 신규 사업의 감소

국토교통부의 "2017년 공간정보산업조사 통계보고서"를 보면 2016년 기준 공간정보사업체수는 4,569개사이며, 그 중 약 67%가 공간 정보 관련 기술 서비스업에 종사하는 것으로 조사되고 있다. 또한 세부 매출 항목을 보면 "공간정보 시스템 통합 자문 및 구축 서비스업"이 약 1조 1천억원으로 조사되고 있다. 동 보고서에 기술된 한국산업은행의 "한국은행 기업분석 매출액 비교"를 보면 공간정보기업이 발생시키는 매출은 전체에서 약 0.8%이고, 이중 12%가 흔히 말하는 공간정보분야의 정보화사업부문 매출인 것이다.

정보화사업 부문 매출은 세부적으로 컨설팅 및 자문, 신규 구축, 유지보수(유지관리 및 운영)로 나뉘어 진다. 소프트웨어정책연구소 이슈리포트에는 2015년 기준으로 유지보수 부문의 비중이 50%를 넘어선 것으로 조사되었고 그 비중은 계속 증가하고 있는 추세이다. 이는 공공 및 민간 부문을 포함하여 약 5,000억원 규모의 공간정보 시장에서 3,000개 이상의 업체가 경쟁하는 시장이라는 것을 의미한다.

복지 및 교육 예산의 증가로 인해 실제 공공정보화산업 분야의 예산은 늘어나기 어려운 형편임을 고려할 때 산업계 스스로 정부에 의지하는 사업구조를 개편하지 못한다면, 이런 어려움에서 벗어나기 힘들 것이다.


2. 외산 솔루션에 의존적인 기술 환경

2000년대 중반 프리랜서와 함께 일할 경우 고급의 경우 월별 약 800만원부터 1,000만원까지 금액으로 계약을 진행했다. 현재 관리하고 있는 사이트의 경우 특급임에도 월 900만원 미만의 금액으로 계약을 진행할 수 있었다. 그 동안의 물가 상승률 등을 고려할 때, 오히려 프리랜서와의 계약 단가는 낮아졌는데 왜 경영난은 계속되는지 고민해보니 의외로 단순한 결론을 얻게 되었다.
외산 솔루션 의존도가 높다보니 최초 도입 후 유지관리비용이 지속적으로 상승했다. 이러한 유지관리예산이 지속적으로 증가함에 따라 과거대비 동일 비용으로 수행해야하는 업무가 많아졌고 고용을 창출할 수 있는 신규사업도 감소했다. 하지만 단순히 정보화 예산 부족만으로 원인을 따지기에는 뭔가 부족해 보인다.

첫째, ESRI사의 솔루션, Oracle을 선호하는 발주기관이 대다수를 차지하는 환경에서 기업은 요건에 따라 사업을 진행했으며 이는 기구축시스템의 유지관리비용(SW라이센스 비용)을 증가시켰고 신규 사업을 기획하고 진행할 수 있는 예산 축소의 원인이 되었다.
Oracle의 경우 유지관리를 위한 Subscription을 구매하지 않을 경우, 다음 해 유지관리 서비스를 받고자하면 이 전에 구매하지 못한 것까지 포함해서 구매해야 한다. 이 비용이 의외로 커서 두 해만 거르더라도 신규로 Oracle을 구매하는 비용에 도달하곤 한다.
또한 시스템을 구성하는 장비의 예비 파트비용은 모두 정보화 예산에 포함되는 금액으로 개발예산을 줄이는 원인이 된다. 국내의 많은 공간정보 또는 GIS 관련 시스템은 최초 구축 시 시군구서버, 시도서버, 중앙서버를 연계하는 방식으로 업무양 대비 과도한 장비를 도입하였고 현재는 이를 위한 유지관리에 많은 예산을 투입하는 실정이다.
(지자체가 발주하는 공간정보관련 사업은 대부분이 유지관리 사업임 : 나라장터 조회)


둘째, 더 이상 특별하지 않은 공간정보 어플리케이션을 들 수 있다. 서비스 부문으로 한정하면 대부분의 사이트에서 Geoserver를 이용하고, 웹 브라우저에서 OpenLayers 등을 이용하여 사용자페이지를 구성한다. 누구라도 공간정보 앱을 개발할 수 있게 된 것으로써 굳이 본사의 정규직 인력이 아닌 계약직 인력으로도 계약을 이행할 수 있도록 해주었다. 

그러나 발주처의 눈높이가 높아지고 정보화 기술의 발전에 따라 처리해야하는 데이터 양은 기하급수적으로 늘고 있는데 비해 공공부문 공잔정보시스템 개발에 적용하는 기술요소 또는 공개SW는 이를 따라가지 못하고 있다. 이는 사업 성과물에 대한 고객 불만족과 기업 불신의 원인이 되고 있다.
업체 스스로가 4차산업혁명, ICBM 등 최신 기술 트렌드에 맞는 뭔가를 제시할 수 없다면 공간정보서비스란 누구나 할 수 있는 그저 그런 것이 될 수 밖에 없을 것이다. 


3. 근속 년수 부족 및 인력 이탈

국토교통부의 "2017년 공간정보산업조사 통계보고서"를 보게 되면 근속년수가 1~3년 미만이 전체의 약 62% 정도를 차지하는 것을 볼 수 있다. 인력 이탈 원인은 누구라도 급여에 대반 불만족이 가장 크다는 것을 쉽게 짐작할 수 있다. 동일 년 수 대비 계약직(프리랜서) 직원이 받는 급여와 내 급여의 차이가 현저하다면 누구든 불만을 갖기 마련이다.(이직에 대한 고민을 하게 될 것이다.)

기업은 고용을 유지하기 위해 지속적으로 급여를 인상해야 하지만, 내가 만든 재화를 판매하는 것이 아닌 사업을 수주하여 발생하는 매출이라면 미래 불확실성으로 직원의 급여 인상에 소극적일 수 밖에 없고 양질의 일자리를 제공하기 위한 정규직 채용에도 적극적이지 못할 것이다.


근속 년수가 길지 않으므로 기술 개발의 연속성을 가져갈 수 없다. 공간정보분야의 대부분 국산 SW는 최초 개발된 원형에서 발전이 더디며 유지관리서비스 또는 외산 솔루션 대비 미흡한 것이 사실이다.

지속적으로 기술을 발전시키기 위한 인력확보의 전제조건은 만족할만한 보상의 제공이다. 소프트웨어산업협회는 매년 "SW대가산정가이드"를 공표하지만 실제 이를 준수하는지 관리감독하지는 않는다.  FP(Function Point)기준으로 개발규모를 산정하고 일일생산성 기준에 따라 투입인원을 산정하는 현재 방식에는 문제가 없지만 현장에 적용되는 괴리를 줄이지 못한다면 발주기관 또한 납품되는 시스템의 품질을 보장받기 어려울 것이고,  기업은 소비되는 자원 투입 방식의 인력관리를 진행 할 수 밖에 없을 것이다. 

부끄럽게도 국내 공간정보산업은 국가 발주 사업에 회사의 명운을 거는 분야이다. 이미 업체 스스로 왜곡된 시장구조를 바꿀 수 있는 능력을 갖추고 있지 못하며, 공간정보가 미래 먹거리를 지원하는 기반 정보라면 국내 기업이 만든 SW를 사용하도록 장려할 수 있는 제도적 지원 등이 동반되어야 할 것이다.


결론

전자정부의 발전에 따라 유지비용의 증가로 신규 사업예산이 줄어드는 것, 자체 기술력 부족으로 시장의 신뢰를 잃어버리는 것, 정부 의존적 사업구조로 인해 고용의 질을 보장하지 못하는 것 등 공간정보기업이 처한 어려운 상황에 대한 변명 아님 변명을 해보았다.
사견이지만 개발자 스스로도 외산 솔루션을 찾는 편함보다는 새로운 것을 창조하는 기쁨을 찾기를 바라며 짧지 않은 글 마무리 한다.


프로그웍스는 항상 고민하고 고품질의 서비스를 제공하기위한 개발자가 되겠습니다.

+ Recent posts