-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2021-06-18 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-10-13 신규 샘플데이터 개방 소개
강원 및 충청 지역 환경 변화 탐지 AI 기술 개발을 위한 산림수종(소나무, 낙엽송, 기타 침엽수, 활엽수) 항공 및 모사 이미지 데이터
구축목적
항공사진과 모사영상으로부터 산림수종을 분석할 수 있는 AI학습데이터셋 구축
-
메타데이터 구조표 데이터 영역 재난안전환경 데이터 유형 이미지 데이터 형식 데이터 출처 라벨링 유형 라벨링 형식 데이터 활용 서비스 데이터 구축년도/
데이터 구축량2020년/106,700 -
구축 내용 및 제공 데이터량
- 항공사진 105,700장(Fine Annotation 39,370장, Coarse Annotation 66,330장)
- 모사영상 1,000장(Fine Annotation 330장, Coarse Annotation 670장)
구축 내용 및 제공 데이터량 표 구분 데이터 구축 내용 구축 수량 (장) 데이터 설명 학습데이터 크기 항공사진
(0.25m)Fine
Annotation· 항공사진(25cm)기반의 산림수종 4종 512 X 512
(Tiff, Json)32,670 Fine
Annotation· 항공사진(25cm) 512px 영상 병합(추가) 1024 X 1024
(Tiff, Json)6,700 Coarse
Annotation· 항공사진(25cm)기반의 산림수종 4종 512 X 512
(Tiff, Json)66,330 모사영상
(5m)Fine
Annotation· 모사영상(5m) 기반의 산림수종 2종 512 X 512
(Tiff, Json)330 Coarse
Annotation· 모사영상(5m) 기반의 산림수종 2종 512 X 512
(Tiff, Json)670
-
-
AI 모델 상세 설명서 다운로드
AI 모델 다운로드 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 산림수종 데이터 Semantic Segmentation 정확도(항공이미지, 수종) Segmentation DeepLab v3+ Accuracy(Pixel 단위) 75 % 82 % 2 산림수종 데이터 Semantic Segmentation 정확도(항공이미지, 침활) Segmentation DeepLab v3+ Accuracy(Pixel 단위) 80 % 92 % 3 산림수종 데이터 Semantic Segmentation 정확도(모사이미지, 침활) Segmentation DeepLab v3+ Accuracy(Pixel 단위) 80 % 84 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 변경이력
산림수종 이미지(강원및충청)-데이터변경이력 버전 일자 변경내용 비고 1.0 2021.06.18 데이터 최초 개방 구축 목적
- 항공사진과 모사영상으로부터 산림수종을 분석할 수 있는 AI학습데이터셋 구축
활용 분야
- 국토환경의 변화, 산림의 분포 변화 탐지를 용이하게하여 임상도 등과 같은 국가 주제도 현행화 기간 단축 효과와 지도관련 기초데이터에 활용이 가능한 기술 개발
소개
- 강원충청 지역 항공사진과 모사영상으로부터 산림수종 상태를 파악할 수 있는 알고리즘 개발을 위한 AI데이터셋으로, 저작권과 보안처리된 데이터를 사용하여 배포와 재사용에 문제가 없는 데이터임
구축 내용 및 제공 데이터량
- 항공사진 105,700장(Fine Annotation 39,370장, Coarse Annotation 66,330장)
- 모사영상 1,000장(Fine Annotation 330장, Coarse Annotation 670장)
구축 내용 및 제공 데이터량 표 구분 데이터 구축 내용 구축 수량 (장) 데이터 설명 학습데이터 크기 항공사진
(0.25m)Fine
Annotation· 항공사진(25cm)기반의 산림수종 4종 512 X 512
(Tiff, Json)32,670 Fine
Annotation· 항공사진(25cm) 512px 영상 병합(추가) 1024 X 1024
(Tiff, Json)6,700 Coarse
Annotation· 항공사진(25cm)기반의 산림수종 4종 512 X 512
(Tiff, Json)66,330 모사영상
(5m)Fine
Annotation· 모사영상(5m) 기반의 산림수종 2종 512 X 512
(Tiff, Json)330 Coarse
Annotation· 모사영상(5m) 기반의 산림수종 2종 512 X 512
(Tiff, Json)670
대표도면
<항공사진 원천데이터>
<항공사진 라벨링데이터>
<모사영상 원천데이터>
<모사영상 라벨링데이터>
필요성
- 오픈소스 기반의 딥러닝 라이브러리인 텐서플로우 공개 후 하드웨어 인프라와 알고리즘이 급속히 발전함
- 인공지능의 정확도는 늘어나고 있으나 산림수종 분석 관련 학습데이터로 사용할 수 있는 데이터가 부족함
- 임상도와 같은 국가에서 제작하고 있는 주제도는 항공사진을 육안으로 판독하고 구획하는 방식으로 주제도를 갱신하고 있음
- 본 사업을 통해 주제도 변화지역 탐지에 활용하여, 업무 효율성 향상을 기대할 수 있음
데이터 구조
- 데이터 구성
- 산림수종 데이터 구조산림수종 데이터 구조 표 컬럼명 데이터타입(길이) 컬럼명 설명 ANN_CD NUMERIC(3) 어노테이션 코드 ANN_NM VARCHAR2(20) 어노테이션 명칭 산림수종 데이터 어노테이션 포맷 표 컬럼명 코드값 컬럼명 설명 ANN_CD 110 소나무 120 낙엽송 130 기타침엽수 140 활엽수 150 침엽수 0 판독불가 190 비산림 피복지도 데이터 메타데이터 목록 표 No 항목 타입 필수여부 예시 영문명 한글명 1 Image 원시 이미지 정보 1-1 image_id 원시 이미지 식별자 String Y FR_AP_00000000_001 1-2 img_width 원시 이미지 너비 Number Y 512 1-3 img_height 원시 이미지 높이 Number Y 512 1-4 img_type 원시 이미지 종류 String Y aerophoto 1-5 img_coordinate 원시 이미지 좌표계 String Y EPSG:5186 1-6 coordinates 원시 이미지 좌상단 좌표 String Y 000, 000 1-7 img_resolution 원시 이미지 해상도 Number Y 0.25 1-8 img_provied 원시 이미지 제공기관 String Y 국토지리정보원 1-9 img_time 원시 이미지 촬영시기 String Y 2019 1-10 img_winter 참조 이미지 겨울 유무 String Y 0, 1 2 annotations 어노테이션 정보 2-1 ann_id 어노테이션 식별자 String Y FR_AP_00000000_001_FGT 2-2 ann_type 어노테이션 타입 String Y polygon 2-3 ann_file_type 어노테이션 파일 유형 String Y tif 3 provided 제공기관 정보 3-1 provied_nm 제공기관명 String Y 한국지능정보사회진흥원 - 어노테이션 포맷
- 산림수종 AI 데이터 포맷은 gray 스케일의 Tiff 파일
-
데이터셋 구축 담당자
수행기관(주관) : 네이버시스템
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 한근혁 070-8821-1178 [email protected] · 데이터 구축 총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 한국항공촬영 · 자체 촬영한 항공사진 제공 한국산지보전협회 · AI 학습용 데이터 구축 우림엔알 · AI 학습용 데이터 구축 (사협)푸른하늘 · AI 학습용 데이터 구축 마인드포지 · AI 알고리즘 개발 마인즈앤컴퍼니 · AI 알고리즘 개발 ENDK · 품질관리 한국임업진흥원 · 품질관리 올포랜드 · 품질관리 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 한근혁(네이버시스템) 070-8821-1178 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.