-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-06 라벨링데이터 수정 1.0 2022-07-28 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-10-20 신규 샘플데이터 개방 2022-07-28 콘텐츠 최초 등록 소개
국토지리정보원 항공사진 및 ESA Sentinel-2 위성영상을 이용하여 제주지역의 건물, 주차장, 도로 등을 분류한 학습용 토지 피복지도 항공/위성 이미지 데이터로, 제주지역의 다양한 환경변화를 효율적으로 탐지하기 위한 토지 피복 자동분할(Segmentation) 및 변화지역 탐지 AI 알고리즘 모델 개발에 사용됨
구축목적
제주지역 환경변화탐지 인공지능 기술 개발을 위한 건물, 주차장, 도로, 가로수, 비닐하우스, 밭, 산림, 나지 8종의 토지 피복지도 항공 학습용 이미지 데이터와 건물, 도로, 농경지, 산림 4종의 토지 피복지도 위성 학습용 이미지 데이터 구축
-
메타데이터 구조표 데이터 영역 재난안전환경 데이터 유형 이미지 데이터 형식 TIF 데이터 출처 국토지리정보원 항공사진 및 ESA Sentinel-2 위성영상 라벨링 유형 세그멘테이션(이미지) 라벨링 형식 TIF, JSON 데이터 활용 서비스 국토환경의 변화탐지 및 토지이용에 대한 모니터링 기반 자료 데이터 구축년도/
데이터 구축량2021년/26,135장 -
데이터 구축 규모
- 국토지리정보원 해상도 0.25M 항공사진 원천데이터를 활용하여 건물, 주차장, 도로, 가로수, 비닐하우스, 밭, 산림, 나지 8항목의 제주지역 토지 피복지도 항공 이미지 데이터 25,135장 작성
- ESA 해상도 10M Sentinel-2 위성영상 원천데이터를 활용하여 건물, 도로, 농경지, 산림 4항목의 제주지역 토지 피복지도 위성 이미지 Fine annotation 데이터 1,000장 작성
데이터 구축 규모 데이터종류 해상도 분류항목 어노테이션 방법 학습데이터크기 수량 (장) 토지 피복지도 0.25m 건물, 주차장, 도로, 가로수, 비닐하우스, 밭, 산림, 나지 (8항목) Fine annotation 512×512 12,719 항공 이미지 데이터 1024×1024 2,102 Coarse annotation 512×512 10,314 토지 피복지도 10m 건물, 도로, 농경지, 산림 (4항목) Fine annotation 512×512 1,000 위성 이미지 데이터 총계 26,135 데이터 분포
- 클래스별 이미지 분포
- 항공 : 건물, 주차장, 도로, 가로수, 비닐하우스, 밭, 산림, 나지
- 위성 : 건물, 도로, 농경지, 산림
- 항공 클래스별 이미지 분포
데이터 분포 항공 클래스별 이미지 분포 구분 클래스별 이미지 수 비율 항공 이미지 수 건물 16,034 63.8% 25,135 주차장 5,557 22.1% 도로 9,784 38.9% 가로수 1,249 5.0% 비닐하우스 7,090 28.2% 밭 20,135 80.1% 산림 5,499 21.9% 나지 1,189 4.7%
- 위성 클래스별 이미지 분포
데이터 분포 위성 클래스별 이미지 분포 구분 클래스별 이미지 수 비율 위성 이미지 수 건물 956 95.6% 1,000 도로 980 98.0% 농경지 984 98.4% 산림 996 99.6%
-
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드딥러닝 네크워크를 활용한 항공위성 이미지 Semantic Segmentation
- Semantic Segmentation 알고리즘 선정 : HRNet, DeepLab v3+, U-Net, SegNet의 학습모델을 가지고 10%, 30, 50% 단계별로 성능이 가장 좋은 학습모델을 선정한 결과 U-Net이 가장 좋은 성능을 보여줌.
- U-Net : U 형태의 encoder-decoder 구조를 가지고 있으며, encoder에서 spatial dimension 축소로 인한 손실 정보를 decoder에서 skip-connection을 통해 점진적으로 복원.
- 학습 데이터 (제주)
딥러닝 네크워크를 활용한 항공위성 이미지 Semantic Segmentation 학습 데이터 (제주) 항공사진(25cm) Fine
512×512px항공사진(25cm) Coarse
512×512px항공사진(25cm) Fine
1024×1024px위성영상(10m) Fine
512×512pxTraining 9600 8000 800 Validation 1200 100 Test 1200 200 100 - 모델 성능(Overall Pixel Accuracy. %)
딥러닝 네크워크를 활용한 항공위성 이미지 Semantic Segmentation 모델 성능(Overall Pixel Accuracy. %) 항공사진(25cm) 512px 항공사진(25cm) 1024px 위성영상(10m) 512px 93.99 96.48 95.95
서비스활용 시나리오
- 국가나 지자체가 관리하고 있는 하천을 점유하기 위해서는 점유허가를 받아야 하는데, 무단으로 건물이나 밭, 비닐하우스 등으로 점유하여 문제가 되고 있음
- 하천에 무단점유하고 있는 시설이나 농지 등에 대해 불법 사항을 확인하기 위해서는 현장 확인을 해야 하는 어려움이 있음
- 항공사진을 자동으로 분석하여 하천의 건물, 밭 등을 추출하는 기능을 개발함
- 분석하고자 하는 항공사진을 입력하면 AI 모델이 토지피복을 추론하고, 추론한 이미지와 하천 경계를 중첩분석하여 하천을 점유하고 있는 건물, 논, 밭을 추출하여 무단점유 의심지역을 자동으로 추출하는 기능 개발
- Semantic Segmentation 알고리즘 선정 : HRNet, DeepLab v3+, U-Net, SegNet의 학습모델을 가지고 10%, 30, 50% 단계별로 성능이 가장 좋은 학습모델을 선정한 결과 U-Net이 가장 좋은 성능을 보여줌.
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 토지 피복지도 세그멘테이션 학습 모델 (항공사진 25cm) Image Classification U-Net Accuracy(Pixel 단위) 85 % 95.24 % 2 토지 피복지도 세그멘테이션 학습 모델 (위성영상 10M) Image Classification U-Net Accuracy(Pixel 단위) 85 % 95.95 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 포맷
- 토지 피복지도 항공 이미지 데이터
데이터 포맷 토지 피복지도 항공 이미지 데이터 원천데이터 (*.tif) 라벨링데이터 (*.tif) 라벨링데이터 (*.json) 메타데이터 (*.json) - 토지 피복지도 위성 이미지 데이터
데이터 포맷 토지 피복지도 위성 이미지 데이터 원천데이터 (*.tif) 라벨링데이터 (*.tif) 라벨링데이터 (*.json) 메타데이터 (*.json)
데이터 구성
- 어노테이션 포맷
데이터 구성 어노테이션 포맷 구분 타입 필수여부 범위 항목명 설명 type 파일타입 string name 파일명 string crs 좌표계 object type 좌표타입 string properties 좌표정보 object name 좌표계코드 string features 객체정보 array type 객체타입 string properties 객체항목 object ANN_CD 어노테이션 코드 number Y [10,20,30,40,55,60,70,80,90,100] ANN_NM 어노테이션 명 string Y ["건물","주차장","도로","가로수","비닐하우스","밭","산림","나지",“농경지”"비대상지"] ANN_TYPE 어노테이션 방법 string Y "fine","coarse" geometry 공간정보 object type 어노테이션 방식 string Y Polygon coordinates 폴리곤 점의 좌표 array Y - 메타데이터 포맷
데이터 구성 메타데이터 포맷 구분 타입 필수
여부예시 항목명 설명 img_id 이미지 파일명 String Y LC_JJ_AP25_33606070_001_2019_FGT img_width 이미지 너비 Number Y 512 img_height 이미지 높이 Number Y 512 img_type 이미지 종류 String Y aerophoto img_coordinate 이미지 좌표계 String Y EPSG:5186 coordinates 이미지 좌상단 XY좌표 String Y 151321.125, 100771.875 img_resolution 이미지 해상도 Number Y 0.25 img_time 원천 이미지 촬영시기 String Y 2019 img_provided 원천 이미지 제공기관 String Y 국토지리정보원 ann_id 어노테이션 식별자 String Y LC_JJ_AP25_33606070_001_2019_FGT ann_type 어노테이션 방법 String Y polygon ann_file_type 어노테이션 파일 유형 String Y tif provided_nm 제공기관명 String Y 한국지능정보사회진흥원
실제 예시
- 토지 피복지도 항공 이미지 데이터
-
데이터셋 구축 담당자
수행기관(주관) : 네이버시스템(주)
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 한근혁 070-8821-1178 [email protected] · 사업 총괄 · 토지 피복지도 데이터 구축 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜이테라 · 토지 피복지도 데이터 구축 ㈜무림지앤아이 · 토지 피복지도 데이터 구축 사회적협동조합 푸른하늘 · 토지 피복지도 데이터 구축 ㈜지오앤 · 토지 피복지도 데이터 구축 ㈜마인드포지 · AI 알고리즘 개발 한국환경연구원 · 품질관리 ㈜올포랜드 · 품질관리 ㈜올포랜드 · 품질관리 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 한근혁 070-8821-1178 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.