자료구조-벡터와 레스터

작성자두리샘|작성시간06.08.14|조회수2,297 목록 댓글 0

1.자료의 개념

  • 지리정보 시스템에 사용되는 여러 종류의 변수들에 대한 이해가 요구됨.
  • 분류 가준에 따라 여러 형태로 나누어짐.
  • 자료가 갖는 특성에 따라 4가지로 분류됨.

 1) Norminal 변수 : 특정한 순서없이 명칭으로 구분됨.
(예 : 토지 이용 항목 - 공원, 야생동물지역, 주거지역, 중심상업지구..... 수종명 - 소나무, 전나무, 참나무..... 여러 주제도 들에서 사용되는 공통 명칭 )

 2) Ordinal 변수 : 고유등급이 있는 서로 분리된 항목들
(예 : 하천 - 지류의 수에 따라 매겨지는 1등하천, 2등하천... 교육수준 - 초등학교, 중학교, 고등학교, 전문대학, 대학교... 자연적인 연속성에 존재함.)

 3) Interval 변수 : 자연적인 연속성이 있으며 거리 개념이 내포됨.
(예 : 섭씨온도 - 10°C ~ 20°C 간격은 20°C ~ 30°C의 간격과 동일 )

 4) Ratio 변수 : Interval 변수와 같은 의미를 가지고 있으며 절대적인 시작점이 존재
(예 : 절대온도 - 섭씨온도는 물이 어는 점을 영점으로 가진 측정값이나 절대 온도는 절대적인 영점을 갖는다. 월별 강수량, 도시별 가구수입 등)

- GIS의 자료는 위의 4가지 항목으로 분류 방법 외에, 대부분의 GIS에서 사용되는 개념으로 다음의 2가지 형태로 나뉘어 정의된다.

 1) 공간자료 : 지상의 위치(예:우물의 위도, 경도)

 2)비공간자료 : 속성자료라고도 함. 추가적인 정보로서 논리적인 공간자료와 연결됨. (예: 우물의 깊이, 수량...)
- 속성 자료의 양이 공간 자료의 양보다 훨씬 더 많을 수도 있다.

- 공간 자료는 대상물의 공간적 차원에 기초하여 3가지로 분류될 수 있다.

 1) 0차원 > 기하학적 위치를 결정하는 점. > 점은 면적이 없는 근원적 위치 > 점은 지리정보시스템, 컴퓨터 그래픽, 수치지도 데이터에서 다양하게 사용됨 > 예를 들면 우물의 중심, 도로의 끝, 단지 모서리를 표시하는데 사용됨 > 또한 지도상에서는 라벨(장소 이름), 심볼(공항, 학교, 삼각점)들의 위치로 사용됨 > 선과 면적을 구성하는데 기본요소로 사용됨.

 2) 1차원 > 가장 간단한 형태의 1차원 대상물은 두 점을 연결한 직선임. > 수학적 함수에 기초한 곡선 > 선분이 방향정보를 포함하면 선의 왼쪽과 오른편의 영역을 구분할 수 있음.

 3) 2차원 > 면적 : 경계선 내의 영역

 

2.자료의 구조

 - 지리정보의 공간구성을 표현하는 자료구조에는 기본적으로 Raster 자료구조와 vector 자료구조가 사용됨.
 - vector모델에서 실세계의 사상 또는 좌표는 이들의 경계를 정의하는 Point, Line으로 구성됨.
 - 각 사상의 위치는 지도에서 좌표체계에 의해 정의되며 지도 내에서 각 위치는 동일한 좌표체계를 유지함.
 - Point, Line, Polygon은 실세계에서 불규칙하게 분포하는 지리상이나 좌표를 표현하기 위해 사용됨. Line은 도로를, Polygon은 숲 등을 나타냄.
 - Raster 모델에서 공간은 pixel 또는 cell로 균등하게 분할됨. 지리사상이나 좌표의 위치는 그 사상이나 좌표가 존재하는 pixel, cell의 행렬로 정의됨. 각 cell이 표현하는 영역은 공간 해상력을 의미함. 그것은 위치가 행렬의 수로 표현되기 때문에 지리사상의 위치는 10*10m에서 가장 가까운 cell에 저장됨.
 - cell 안에 있는 지역은 하위 지역으로 분할되지 않으며, cell 속성은 cell안의 모든 위치에 적용됨. 모든 cell의 크기는 같음. 일반적으로 Raster 모델은 수 백만개의 cell로 분할됨.
 - vector모델에서의 단위는 Point, Line, Polygon 임. Raster 모델에 비해 단위의 숫자가 작고 크기도 다양함.  vector화일에서 요소의 수는 수 천 개 정도임. vector에서의 위치는 연속되는 좌표의 값에 의해 정의됨.
이 방법은 Raster 모델에서 사용하는 행렬보다 더 확장이 쉽고 정확함.


2.1 자료구조의 종류

2.1.1 Raster 자료구조

 가) 단순 Raster 배열
 - 공간자료(spatial data)의 가장 간단한 자료구조 중의 하나이며, 전통적으로 많이 활용되어 온 구조가 Raster(raster)형 자료구조 또는 세포(cellular)형 자료구조임.
 - 이 방식은 TV 화상의 구현방법과 동일. 주어진 도면(scene)을 다수의 스캔라인(scan line, 즉 Raster)으로 구분하고, 각 스캔라인은 다시 여러개의 pixel(pixel, 또는 cell)로 구분됨.
그 다음 스캐너(scanner)가 스캔라인을 지나면서 차례로 각 pixel 별로 정보의 유무에 따라 "on", "off"(또는 "1","0")의 형태로이미지 를 저장합. 이때, 각 pixel의 형태와 크기는 그 자료화일(data file) 내에서는 동일하며, 따라서 위치정보는 행(row)과 열(column)에 의해 자동적으로 결정되므로 화일의 구조는 매우 단순해짐.
 - 평면을 같은 크기의 Pixel로 나누는 것을 공간분할(tessellation)이라 함. 이때 원래의 공간은 평평한 데카르트평면으로 간주됨. Raster 자료구조의 경우, 모든 평면은 분할된 한 pixel에 의해 표현되기 때문에 공간분할 방식은 매우 중요함.
 [그림2] 에서 보는 바와 같이, 주로 사용되는 공간분할방식에는 사각구조 (rectangular), 육각형구조(hexagonal), 삼각형구조(triangular) 등이 있으며, 이중 사각구조방식의 공간 분할이 그 구조에서 가장 단순하여 많이 사용되어 옴.

 

[그림 2 공간 분할의 종류]

 - Raster 자료구조에서의 공간분할에서는 특히, 각 pixel의 크기와 형태를 결정하는 일이 무척 중요함. pixel의 크기가 지나치게 작아졌을 경우, 대상체는 보다 정확하게 표현 될 수 있으나 자료의 양은 기하급수적으로 증가하게 되어, 자료의 저장과 처리 효율을 감소시킴.
 반대로 pixel의 크기를 지나치게 크게하면, 자료의 양은 작아져 저장과 처리효율은 증가하나, 대상체의 정보를 잃어버릴 위험이 커짐. 따라서 pixel의 크기는 최소지도단위(minimum mapping unit : 지도에서 가장 작은 대상체, ([그림 3] 참조)와 컴퓨터의 저장능력, 자료처리의 효율성 등을 동시에 고려하여 결정해야 함.

 

[그림 3. 최소지도단위]

- pixel의 형태는 좌표체계, 등분할성, 공간적 인접등질성(spatial neighborhood similarity)등을 고려하여 결정함. 가장 간단한 구조인 사각구조 방식의 경우, 자료의 저장형태가 행렬방식(matrix)이므로 좌표체계의 정의가 쉽고, 각 pixel을 세분할 경우 동일한 형태와 크기로 나눌 수 있으나, 인접 pixel에 대한 정의에 문제 가 있음.

 

[그림 4. Raster 자료구조에서의 공간적 인접]

 - 사각구조방식의 경우 인접 격자의 정의는 두가지 방식이 가능한데, 하나는 4-connected neighborhood이며, 다른 하나는 8-connected neighborhood 임. 그림4는 사각구조방식의 인접격자 정의 방식을 나타냄.
 - [그림4]에서 보는 바와 같이, 4방향의 pixel를 인접격자로 정의했을 경우, 각 pixel간의 거리는 모두 동일함. 8방향의 pixel를 인접격자로 정의했을 경우는 대각선 방향의 인접 격자들의 거리가 상하좌우의 인접격자와는 다르게 정의되어 인접연산에 있어서 문제가 발생함.
 - 육각형 구조와 삼각 구조는 모든 인접 pixel와의 거리가 일정하다는 장점 때문에 지속적인 관심을 끌고 있으나, 각 pixel를 보다 세분할 경우 동일한 형태와 크기의 하위 pixel를 만들기 힘들고, 좌표체계의 정의가 상당히 까다로와 파일의 구조가 사각구조보다 복잡해지는 문제가 있음. 따라서, 특별한 경우가 아니면 사각구조의 공간분할 방식이 주로 사용됨.

 나) 단순 Raster배열 자료의 축약기법
 - Raster 자료구조의 경우, 구현의 용이성과 단순한 화일구조에도 불구하고 많은 비판을 받는 이유는 단적으로 자료의 방대함에 있다고 할 수 있음. 이 문제를 해결하기 위한 자료 축약기법들 중에서는 체인코드(Chain codes)방식과 런 렝스 코드(Run length code)방식이 대표적임.

 1) 체인 코드 (Chain Code)
 - 체인 코드는 4방향으로 정의할 경우 동/서/남/북을 각각 0,2,3,1로 정의(8방향으로 정의될 경우 0에서 7까지의 숫자가 사용됨)하고, 면 대상체의 경계선을 특정한 지점으로 부터 시작하여 순차진행하는 단위 vector로 정의함. 체인 코드방식의 예는 [그림 5]와 같음.

 

[그림 5. 체인코드의 예]

 - [그림 5]의 지역을 단순 Raster 배열에 의해 입력했을 경우 입력 자료는 다음과 같음.

0,

0,

0,

0,

0,

0,

1,

0,

0,

0,

0,

1,

1,

1,

0,

0,

1,

1,

0,

0,

0,

0,

0,

0,

0,


 - 체인코드 방식은 자료의 압축에 매우 효과적일 뿐만 아니라, 면적과 굴레의 계산, 곡선의 변위점, 요철면의 탐색 등의 연산이 가능함. 그러나, 합집합, 교집합 등의 연산이 어려우며, 영역 사이의 모든 경계가 두 번 중복되므로 저장용량이 소모됨.

 2) Run Length Code
 
- 런 렝스 코드는 각 행이 왼쪽에서 오른쪽으로 진행하면서 시작 pixel와 끝 pixel를 지정하는 방법. 그림5의 경우를 예로 들면 런 렝스 코드는 다음과 같이 입력됨.

 

(5 0)

:'5'는 pixel의 개수, '0'은 속성값

(1 0)

(1 1)

(3 0)

(1 0)

(3 1)

(1 0)

(1 0)

(2 1)

(2 0)

(5 0)


 - 위의 예에서 보는 바와 같이 런 렝스 코드는 체인 코드와는 달리 자료의 비위치적 속성 값을 직접 입력할 수 있으며, 자료의 경계선이 단순할 수록 압축효과는 증가함. 또한, 단순 Raster 배열구조와의 변환이 매우 쉽게 구현되어 소형컴퓨터에서 축약기법으로 많이 이용됨.

 다) 계층적 Raster 구조
 - 피라미드형 자료구조라고도 함.
 - 대표적으로 사지수형 자료구조를 들 수 있음. 이는 대상체를 정보의 조밀여부에 따라 세분해 나가는 방법 임.
[그림6] 에서 보는 바와 같이 사지수형 자료구조는 계층적 Raster 자료구조의 변형임.
 계층적 자료구조란 공간 분할에 사용되는 단위의 크기를 달리해 데이타베이스를 구축하는 기법으로 넓은 지역에 대한 데이타베이스 구축에 매우 용이하게 적용될 수 있음. 사지수형 자료구조는 계층적 자료구조를 변용하여, 정보의 형태가 단순 한 지역은 큰 pixel사이즈로 공간 분할하여 표현하고, 보다 복잡한 지역은 좀 더 세밀하게 공간 분할하여 데이터 베이스를 구축하는 방법.
 이 기법은 원자료의 정보 그대로 자료를 저장하고 있어, 단순히 자료압축의 한 기법이 아니라 Raster의 또 다른 자료구조로서 인식됨. [그림8]은 maximum block representation의 사지수형 자료수조를 표현함.

 

[그림 6. 계층적 Raster 자료구조]

 

[그림 7. 사지수형 자료구조를 통한 효율적인 최대값 탐색]

 

[그림 8. maximum block representation]

 - 사지수형 자료구조는 다른 방법에 비해 지역의 특성(standard region property)을 효율적으로 계산할 수 있고, 가변적 해상도를 가지는 배열(variable resolution array)이므로 저장공간을 효율적으로 관리할 수 있다는 장점이 있음.
 그러나 [그림9] 에서 보는 바와 같이 격자위치만 한 pixel 오른쪽으로 이동한 경우 다른 결과로 나타 나므로, 이 기법은 형상의 분석이나 형태의 인식에는 적합하지 않음. 그러나, 이 기법은 Raster 자료의 축약 기법으로서, 그리고 매우 장점이 많은 기법으로 이용되고 있음.

 

[그림 9. 사지수형의 전이]

 

 2.1.2 vector 자료구조


 - 대상체(object) 중 가장 관심의 대상이 되는 것은 면사상(area, polygon)인데, 이는 점 대상체나 선 대상체에 비해 그 표현이 가장 복잡하고, 또한 가장 많은 대상체가 면으로 표현되고 있기 때문임.
면 대상체는 점의 연속 또는 몇개 라인의 연합체로 정의되며, vector란 용어도 폴리곤(polygon)의 표현에 쓰이기 시작한데서 부터 유래.
 - vector 자료구조의 목적은 자료를 가능한한 정확하게 표현하는데 있음. 지정된 좌표공간은 Raster 구조에서처럼 분할된 것이 아니라 위치, 길이, 차원을 정확하게 표현할 수 있는 연속적인 공간임.
 - vector 자료구조가 갖는 위치자료의 종류는 점, 선, 면의 세가지이며, 이외에 그 위치에 대한 정보가 속성자료 로서 필요함.
 - 점은 하나의 x, y 좌표로서 위치가 정의되는 대상체이며, 좌표 이외에도 어떤 속성을 지니는 가에 따라서 정보가 추가됨. 점의 기호와 크기, 기호의 방향, 문자일 경우 문자의 형태, 색깔, 축척 등에 대한 관련 정보도 필요함.
 - 선은 둘 이상의 x, y 좌표로 구성되어 있는 선형(linear feature) 대상체. 가장 단순한 형태는 시작점과 끝점이 x, y 좌표만 지정되어 있는 선분의 형태임. 이외에 여러개의 선분이 모여 하나의 선형 정보(arc, chain, string 등)를 나타냄.
 - 면은 점과 선에 의해 정의. 일반적으로 면은 몇 개의 아크 또는 체인의 조합에 의해 그 위치와 형태적 특성이 정의됨. 면은 형태, 인접 다각형, 위상적 속성 등을 효율적으로 운용하여 다각형이 가지고 있는 특정한 속성을 주제도(thematic map)등에서 표현하고 조작하는데 많이 이용됨.

 가) Whole Polygon 자료구조
 - Whole Polygon 구조는 Point dictionary structure라고도 불리는 기법. 이 자료구조에서는 모든 대상체를 면으로 간주하고, 각 Polygon을 구성하는 좌표들을 개별 폴리곤 별로 순차적으로 입력하는 방법임. 순차적으로 입력됨 좌표쌍(coordinate pair)에는 일련번호가 부여되며, 일련번호에 의해 다각형의 구성점들이 참조(point dictionary 에 의한 참조)되어 면이 인식됨. [그림10] 참조

 

[그림 10. Whole Polygon 구조의 예]

 - 이 기법은 하버드 대학의 CALFORM 계열의 프로그램에서 사용됨.
 - 이 방식은 Raster 자료구조의 체인 코드와 유사하며, 각각의 면 대상체가 독립적으로 저장되어 관리되기 때문에, 자료 화일의 구조가 단순해지고, 각 면 대상체를 구성하는 점들의 수가 필요 이상으로 많아질 경우 손쉽게 위딩 (weeding)할 수 있다는 장점이 있음. 그러나 위상적 관계는 순수하게 point dictionary에 의한 참조만으로 구현 되므로 개별 다각형의 수정이 이루어진 이후에는 전체 다각형에 대한 point dictionary의 완전 구정이 불가피하고, 자료의 중첩을 피할 수 없다는 단점이 존재함. 또한, 섬(island)의 처리가 거의 불가능하다는 문제가 존재.

 나) Arc-Node 자료 구조
 - Arc-Node 구조는 아크와 노드를 이용하여 면 대상체를 구성하는 방식.
 - 아크는 시작점(하나의 노드)과 끝점(하나의 노드)으로 정의되어진 선분들의 조합.
 - 노드는 둘 이상의 선분이 교차되는 지점을 의미.
 - Arc-Node 구조는 대상체를 계층적으로 조직해서 저장. 대상체의 좌표값이 입력되면 이 좌표값은 각 선분의 구성요소로, 각 선분들은 다시 아크의 구성 요소로, 각 아크는 면 대상체의 구성요소로 참조됨.
 - 이 방식의 최대 장점은 좌표의 계층적 저직으로 인해 자료의 중복이 발생하지 않는다는 점. 따라서, 일부분만의 자료수정이 매우 용이하며, 자료의 부분 수정은 특별한 처리과정 없이 곧바로 전체 자료의 위상적 관계에 반영됨.
 - 이 방식의 최대 장점은 좌표의 계층적 조직으로 인해 자료의 중복이 발생하지 않는다는 점. 따라서, 일부분만의 자료 수정이 매우 용이하며, 자료의 부분 수정은 특별한 처리과정 없이 곧바로 전체 자료의 위상적 관계에 반영됨. DIME과는 달리 비공간적 속성에 대한 자료의 입력과 관리가 한결 용이함. 이러한 장점으로 인해 이 방식은 대다수의 상업용 응용 프로그램에 채택되어 사용됨.

 

[그림 11. Arc-Node 자료구조의 예]

 다) DIME 자료구조
 - DIME(Dual Independent Map Encoding)은 미국 통계청에서 인구 분석을 목적으로 도시지역의 공간정보를 위상적( topology)으로 제작하기 위해 구축한 시스템.
 - 이 기법은 명시적 위상관계를 최초로 도입한 자료구조로서, 기본 화일의 구성요소는 두개의 끝점으로 정의된 선분 (Line segment)임.
 - 복잡한 곡선은 각 선분의 조합으로 나타남.
 - 선분의 주요 구성요소는 선분의 이름(예 도로명), 시작점과 끝점, 왼쪽과 오른쪽의 면 대상체 아이디(ID)등의 세가지 임.
 - 각 선분의 비위치적 속성은 DIME 자료화일에 별도로 저장됨. 단점은 결절(node)에서 만나는 선분에 대한 역방향 검색이 불가능하다는 점. 따라서 다각형의 경계선을 일치시키는 일은 대단히 복잡함. 반면, 각 선분의 속성 중 하나로 주소( address)가 직접 정보로 자료화일에 입력되어 있기 때문에, 이의 검색은 매우 용이하다는 장점이 있음.

 

[그림 12. DIME 화일 구조의 예]

 라) 관계형 자료구조
 - 관계형 구조는 Arc-Node 구조의 변형이라고 할 수 있음.
 - Arc-Node 구조에서는 위상정보와 속성정보가 같이 저장됨.
 - 관계형 구조는 속성정보를 별도로 분리해서 관리함.
 - 관계형 구조에서 위상정보는 Arc-Node 구조와 같은 형태로 저장됨.
 - 속성값이 관계 테이블로 관리되기 때문에 속성값의 관리가 매우 용이함.
 - 최근의 상업용 시스템에서 이 구조를 채택.

 

[그림 13. 관계형 자료구조의 예]

 2.2 상용 자료구조

 2.2.1 Raster 자료구조

 (1) TIFF(Tag Image File Format)
 - TIFF는 Aldus와 Microsoft에 의해 개발되고 지원되는 구조로 desktop 출판과 관련된 응용분야에서 데이터 변환을 위해 개발됨. 이 구조를 지원하는 플랫폼은 매킨토시, PC, 유닉스 워크스테이션 등임. TIFF 구조는 화일 헤더, IFD, 태그 포인터, 데이터로 구성됨. - 화일 헤더에서 바이트 순서를 가리키는 코드, TIFF로 화일을 정의하는 코드넘버, IFD에 대한 포인터를 가지고 있음.
 - IFD는 순서적인 포인터를 가지고 있음. 이 포인터들은 화일에서 시작되는 데이터 필드와 필드 데이터의 유형과 길이를 가리킴. 따라서 데이터 필드는 화일의 아무 곳에나 위치해도 됨. 예를 들면 한 포인터가 칼라 팔레트 데이터의 768 바이트 필드를 가리킨다면 다른 포인터는 스캐너에 대해 64 바이트 그레이 스케일을 가짐.
 - 각 포인터는 TAG를 가지고 있음. 이는 데이터 필드가 무엇인가를 정의하기 위한 코드임.

 (2) PCX
 - PCX는 가장 오래된 포맷중의 하나로 PC를 위한 Raster 포맷임.
 - 24비트 칼라를 지원하고 64x64 pixel 크기의 이미지를 가진 256칼라 팔레트나 24비트 full RGB를 제공.
 - 데이터는 run-length code로 압축.(스캐닝되거나 비디오 이미지에 대해 Run length code는 비효율적)
 - 그레이 스케일 또는 칼라 수정 테이블을 저장 못함.
 - PCX 화일은 다양한 팔레트 테크닉을 사용함. 결과적으로 대부분의 사람들은 PCX의 모든 부분을 조작하지는 못함.

 (3) GIF
 - GIF는 컴퓨터 네트워크를 통해 그래픽 데이터를 전송하기 위한 포맷.
 - 이 구조는 이미지의 크기와 칼라는 PCX와 비슷함. 구조면에서 TIFF와 매우 유사하다.
 - GIF는 많은 입출력 장치에서 이미지를 쉽게 교환할 수 있도록 충분한 정보와 조직을 제공함.
 - 컴퓨터 통신의 발달로 GIF는 다양한 플랫폼을 지원함.
 - GIF는 24비트 칼라를 지원하고 256칼라까지 팔레트로서 가능.
 - 이미지 크기는 64x64k pixel까지 지원됨.
 - GIF는 LZW 압축기법을 사용.

 (4) BMP
 - BMP는 마이크로소프트 원도우에서 비트맵 화일들을 쓰기 위해서 만든 포맷.
 - 이 구조는 이미지의 크기, 칼라, 구조는 PCX와 비슷함.
 - 이미지의 형태는 비트맵, 만든 회사는 마이크로소프트사이고 제공하는 application은 Windows Paint이며, Windows Application들에서 쓰임.
 - 장점 : 마이크로소프트 윈도우를 잘 지원함.
 - 단점 : 호환성이 낮음.
 - 각각의 파일은 파일헤더, 비트맵 헤더, 파레트정보(단, 이미지가 24비트 천연색이 아닐때), 이미지 데이타 순으로 정보를 가짐.

 (5) XWD
 - XWD는 X윈도우 상에서 윈도우의 이미지를 저장하거나 복원하기 위해 사용된 포맷.
 - 이미지의 형태는 비트맵, 만든 회사는 MIT X Consortium이며 X윈도우의 xwd, xwud, xloadimage등에 쓰임.
 - 장점 : 표준 X Window application을 지원.
 - 단점 : X Window 이외의 시스템에서는 쓰이지 않음. 저장크기도 비효율적

 (6) XBM
 - XBM은 X Windows상의 모노크롬 비트맵 포맷.
 - 이미지의 형태는 비트맵, 만든 회사는 마이트 엑스 콘설티엄이며 프로그램상에서 비트맵을 에디팅하는데 쓰임.
 - 장점 : 직접적으로 읽기가 쉬움.
 -단점 : 너무 거추장스럽고 X상에서 만 쓰임.
 - 이 포맷은 X상의 커서나 아이콘의 정의에 쓰임.
 - 구조는 C 프로그래밍 형태로 되어 있어 읽을 수 있으며, 처음에 가로, 세로크기, 그리고 이 파일의 중심(hot spot)을 나타내는 x, y좌표가 있고, 그 다음부터는 이미지 데이타가 16진수 형태로 존재.

 (7) Macpaint
 - Mac화일은 매킨토시에서 비트맵 이미지를 다루기 위해 만든 화일 포맷.
 - 애플 컴퓨터에서 만듬. Mac-based application에서 쓰임.
 - 장점 : Macintosh하의 시스템에서 쓰일 수 있으며 구현이 간단.
 - 단점 : 1비트의 흑과 백만 쓸 수 있으며 이미지의 사이즈도 720x576으로 제한. 2.2.2 vector 자료구조

 (8) DXF
 - DXF(Drawing eXchange Format)은 AutoCAD용 데이타 화일을 다른 그래픽 시스템에서 사용될 수 있도록 AutoDESK사에서 제작한 아스키 형태의 그래픽 데이타 화일의 형식
 - DXF 화일의 구조는 여러개의 섹션으로 구성됨.
 - DXF는 AutoCAD의 사용자가 증가되면서 급격히 사용분야가 넓어지고 있으며, 최근에는 대개의 그래픽 소프트웨어에서 DXF를 처리할 수 있는 기능을 제공함.

 (9) IGES
 - IGES(International Graphics Exchange Specification)은 1989년 ANSI표준 Y14.26M으로 승인된 CAD 산업계에서 비전용 표준 그래픽스 화일 형식임.
 - IGES는 CAD시스템이 초기에는 중형 컴퓨터에서 운영됨으로써 주로 마그네틱 테이프를 이용하여 데이타를 변환하였으나, 점진적으로 CAD시스템이 마이크로시스템에서 운용되고 DXF의 사용이 증가되면서 최근에는 그 사용이 점차 줄고 있음.
 - IGES의 화일구조는 Global Section, Dictionary Entry Section, Geometric Entites, Annotation Entites, Structure Entites등 5개로 크게 구분됨.

 (3) TIGER(Topologically Integrated Geographic Encoding and Referencing)
 - TIGER는 미국의 Census Bureau의 센서스 조사에서 수치지도와 관련된 지리적 활동을 지원하기 위해 1990년 개발됨.
 - TIGER는 가장 잘 통합되고 자동화된 지리 데이터베이스임.
- TIGER의 의미는 다음과 같다.

  • Topologically - 위상은 지리적 영역을 정의하기 위해 지도에서 point와 line이 어떤 관련을 가지고 있는 지에 대한 과학적인 설명임. TIGER 시스템의 데이터베이스는 미국의 지리적 구조를 설명하기 위해 위상의 이론, 원칙을 제공하기 위한 관련된 수학분야의 기술을 채택함.
  • Integrated - Tiger 시스템의 핵심은 지표의 특징과 경계의 특징을 관계화하고, 통합하고, 자동적으로 기술하는데 있음. TIGER 화일의 위상구조는 센서스와 측량으로부터 방대한 지역에 대해 가로, 강, 철도 등의 위치와 관계를 정의함. 이러한 기본적인 지리정보는 분리되고, 독립된 지도가 아닌 하나의 컴퓨터 데이터베이스의 부분이 됨.
  • Geographic - TIGER화일은 통계국에서 그들의 센서스 조사와 측량에 이용하기 위한 자동적 기술을 저장하는 보고임. 이 컴퓨터 데이터베이스는 센서스와 관련된 모든 정보를 가지고 있음. TIGER 시스템의 주 목적은 이러한 특징이나 영역의 중복 또는 생략을 방지하는데 있음.
  • Encoding - 부호화는 기본적인 지리정보를 컴퓨터가 읽을 수 있는 형태로 다시 표현하는 과정. TIGER 화일을 만드는 이러한 과정은 지도 스캐닝, 수작업 디지타이징, 표준 데이터 입력, 정교한 컴퓨터 화일 매칭 등과 같은 다양한 부호화 기법을 채택함.
  • Referencing - 미국 전역의 센서스 관련 정보를 자동으로 접근하고 검색할 수 있게 되어 지도와 지역 분류에 있어서 혼동을 방지할 수 있음.

 

 2.3 자료구조의 비교

 2.3.1 vector 자료구조의 특징


 
- 수치지도에서는 일반적으로 방대한 자료에 대한 데이타베이스의 구축이 전제로 되기 때문에, 특별한 경우가 아니면 vector 자료구조를 선택하는 것이 일반적임
 - 동일한 vector 자료구조라 하더라도, 사용 목적에 따라 각기 고유의 장단점을 가진 다양한 기법들이 존재. 따라서, 수치지도 제작의 목적에 가장 적합한 자료구조의 선정이 매우 중요함. 표1은 vector 자료구조의 장단점을 기술함.

표1. 벡터 자료구조의 장/단점

구 분

장 점

단 점

whole
polygon
structure

자료화일의 구조가 단순.
과다한 점의 위딩이 용이.

자료의 부분 수정이 어려움.
자료의 부분 수정이 어려움.
섬(island)의 처리가 불가능.

DIME
structure

명시적 위상 관계.
주소/속성 검색이 용이.

선분의 역방향 검색 불가.
경계선 자료의 수정이 어려움.
속성자료의 입력에 한계가 있음.

Arc-Node
structure

위상관계 명확.
자료의 중첩이 전혀 없음.
부분 자료 수정이 매우 용이.

속성자료가 많아지면 위치자료의 처리시간도 증가. 위상체계의 수립이 비교적 복잡.

Relational
structure

속성자료와 위상체계와의 연결.

속성자료와 위치자료의 분리 과정이 비교적 복잡.

 


 
2.3.2 vector와 Raster 자료구조의 비교

 - Raster와 vector의 자료구조는 근본적으로 차이점이 많음. 이 차이점은 자료구조의 구축 뿐 아니라 수치지도 제작의 응용, 또는 그 활용에 있어서까지 영향을 미침. 단순히 양 구조 중 어느 구조가 우수한가에 대한 논의는 무의미 하다. 그러나 특정 목적에 대해 어느 구조가 뛰어난지에 대한 논의는 필요함.

표2. 래스터와 벡터 자료구조의 비교

구 분

장 점

단 점


현상적 자료구조의 표현 용이
자료구조의 효율적 축약
위상관계구축 용이
정확한 그래픽의 표현
위치와 속성의 일반화가 가능

자료구조의 복잡
지도중첩 어려움
단위별로 위상형태가 다름
고가의 장비 필요
공간연산이 복잡



공간분석 용이
자료구조가 단순명료
단위별로 위상형태 동일
지도중첩 용이
저가의 기술과 빠른 발달속도
원격탐사자료와 연결 용이

네트워크 연계 구현 어려움
투영반환에 많은 시간 소모
그래픽자료의 양이 방대
자료축약시 정보의 손실 큼
출력의 질이 떨어짐

 


 
2.3.3 자료 구조의 혼합


 - 1970년대까지만 하더라도 Raster와 vector 자료구조는 상호 호환될 수 없는 방법들이었음.
 - Raster 자료수도는 자료 저장에 많은 공간을 필요로 하지만 layer간의 중첩과 같은 공간 연산에서는 탁월한 기능을 발휘함.
 - vector 자료구조는 고해상도의 그래픽 출력과 같은 장점에도 불구하고 연산에 따르는 시간과 기기의 과다한 비용, 조악한 공간영상 기능 등의 문제점으로 지적.
 - 양 자료구조의 현저한 장/단점에도 불구하고, 실상은 기술상의 문제로 인해 이들 양 구조의 통합 내지는 양 구조간의 자료 변환, 양 자료구조의 동시 사용 등은 난제임.
 - 1970년대 말에 이르러 Peuquet, Nagy & Wagle 등은 Raster와 vector 자료구조의 장점만을 취할 수 있는 새로운 혼합 자료구조의 가능성을 제시하고 양 구조의 혼합사용이 보다 효율적임을 증명함.
 - Peuquet는 선 대상체 정보의 저장에 있어 Raster의 체인 코드와 vector 자료구조를 혼합한 Raster 자료구조를 창안함으로써 그 구체적 가능성을 제시함. 그러나 이러한 혼합구조의 발전은 미미한 수준임.
 이는 아직 혼합구조에 대한 개념들이 추상적인 수준에 머무르고 있고, 일련의 기술발전이 혼합구조의 개발보다는 Raster와 vector 양 자료구조의 효율적인 혼합사용에 치중하고 있기 때문임.
 - 수치 지도에 있어서 자료 구조의 결정은 매우 중요. 일단 구축된 데이타베이스는 그것이 어떤 자료구조이든 간에 다른 구조의 효율적 기능을 이용하기 위해 변환시켰을 때에는 어느 정도의 손실을 감수해야 함.
손실 정보량이 상당히 감소하고 있기는 하지만, 정교한 자료의 데이터베이스 구축시에는 신중한 결정이 있어야 함.

다음검색
현재 게시글 추가 기능 열기

댓글

댓글 리스트
맨위로

카페 검색

카페 검색어 입력폼