태풍 및 홍수로 인한 피해 및 위험 데이터
- 분야재난안전환경
- 유형 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2022-07-29 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-07-05 산출물 수정 공개 AI모델 2023-10-05 AI모델 소스코드 등록 2022-10-21 신규 샘플데이터 개방 2022-07-29 콘텐츠 최초 등록 소개
태풍, 홍수의 발생 전후 의 전경 및 상세사진을 비교·분석하여, 향후 동종의 자연재해 발생시, 피해 발생여부 및 피해규모를 예측할 수 있으며, 재사용에 제한이 없도록 저작권 문제를 완전히 해결한 원천 데이터를 확보
구축목적
풍수해, 지진 등 자연재해로 인해 도심지 및 농촌지역의 생활시설에 많은 피해가 발생하기에 본 데이터셋 구축을 통해 자연재해로 인해 파괴되거나 복구가 필요한 위험한 상태를 선제적으로 제거하며, 복구사업과 피해보상을 빠르게 수행하기 위한 학습 데이터셋
-
메타데이터 구조표 데이터 영역 재난안전환경 데이터 유형 이미지 데이터 형식 jpg 데이터 출처 직접촬영, 연합뉴스, 충남일보, 조선일보 라벨링 유형 바운딩박스(이미지), 폴리곤(이미지) 라벨링 형식 JSON 데이터 활용 서비스 태풍, 홍수로 자연재해 발생 시 피해여부 예측 서비스 데이터 구축년도/
데이터 구축량2021년/212GB -
데이터 통계
1. 데이터 구축 규모- 원천데이터 총 30만장(정상데이터 18만장 / 재해데이터 12만장)
-
1. 데이터 구축 규모 NO. 112번 데이터 제출물 1 JPG 이미지 파일 333,828장 2 JSON 파일(어노테이션 정보 및 메타 데이터 정보) 333,828개
2. 데이터 분포
- (단위 : 건)
2. 데이터 분포 구분 구축계획 카테고리 객체 합계 정상 피해 하천 댐 6,822 3,663 3,159 제방(운동기구/놀이기구/기타) 60,441 38,043 22,398 교량 및 교각 19,160 11,759 7,401 소계 86,423 53,465 32,958 도시 교통신호등 14,567 10,476 4,091 보행신호등 16,898 12,776 4,122 교통안전표지판(소형) 15,394 11,154 4,240 이정표표지판(대형) 14,241 10,117 4,124 사람 20,351 10,337 10,014 자동차 27,982 15,513 12,469 산사태 10,480 4,286 6,194 도로 21,334 11,133 10,201 건물 23,433 13,362 10,071 소계 164,680 99,154 65,526 공통·기타 가로등 24,106 18,042 6,064 조경수 26,409 19,283 7,126 전신주 23,693 17,611 6,082 지하차도 8,517 3,193 5,324 소계 82,725 58,129 24,596 구축합계 333,828 210,748 123,080
-
AI 모델 상세 설명서 다운로드
AI 모델 다운로드활용모델
1. 모델학습- Mask-R-CNN 알고리즘
- Convolutional backbone architecture를 통한 인풋 이미지에서 특징점 추출
- 분류 네트워크를 통한 bounding- box와 mask 예측
- Deep Network를 사용하여 Region Proposal 진행
- YOLO V4
- Bounding Box 조정과 분류(Classification)를 동일 신경망 구조를 통해 동시에 실행하는 통합인식(Unified Detection)을 구현
- 전체 이미지의 특징을 사용하여 각 바운딩 박스를 예측
- 합성곱 신경망을 이용하여 실시간 분석에 최적화된 알고리즘
- 실시간으로 Object Detection이 가능하며 Faster R-CNN보다 6배 빠르고 백그라운드 오류 수는 절반 미만
2. 서비스 활용 시나리오
- 강수량과 피해규모/종류 분석
- 지역별 인프라의 규모와 피해규모의 파악
- 도시형상과 피해의 종류 분석/조치
[ 그림. 자연재해로 인한 생활시설 안전 데이터 적용 방안 ]
- Mask-R-CNN 알고리즘
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 위험 레벨 판별 모델 Image Classification Mask R-CNN, YOLO v4 AUC-ROC(@0.5) 0.75 단위없음 0.8515 단위없음 2 객체 검출 학습 모델 Object Detection Mask R-CNN, YOLO v4 mAP@IoU 0.5 75 % 77.26 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1. 데이터 포맷
- 촬영 메타 데이터
촬영 메타 데이터 NO 범주 속성명 속성설명 Type 필수여부 작성예시 1 IMG image 촬영 이미지 Binary Y "IMAGE_01.jpg" 2 IMG time.image 촬영 시간 uint64 Y 2.02104E+13 (yyyymmddhhmmss) 3 IMG size.image 촬영한 이미지 크기 string Y FHD (1920x1080) 4 GPS GPS 촬영 이미지의 GPS 위치 string Y 37.56656, 126.97846 5 SRC SRC 이미지의 출처 string Y Self (출처 url) - 어노테이션 데이터
어노테이션 데이터 항목 타입 필수여부 비고 한글명 영문명 데이터셋정보 info string Y 데이터셋명 info_name string Y 데이터셋상세설명 info_desc string Y 데이터셋 URL info_url string Y 데이터셋 생성일자 info_data_created string Y 어노테이션 정보 annotations string Y 파일명 filename string Y 경로명 parent_path string Y 어노테이션 ID id string Y 자동생성 어노테이션 타입 type string Y 자동생성 해상도 pixel integer Y 재해 이전 일자 before_date integer Y 재해 이후 일자 after_date integer Y 객체 대분류 lable string Y 객체 소분류 atributes string Y - 원본데이터 포맷 예시 : jpg
- JSON 형식
2. 데이터 구성
-
2. 데이터 구성 구분 통계 정보 라벨 항목명 타입 필수 여부 비고 1 이미지 당 객체 수 annotations[].segmentation array - annotations[].bbox 2 자연재해 종류 annotations[].disaster string Y 하천(river), 도시(city), 공통(commenness) 3 객체분류 annotations[].category string Y "river_levee_level0", "river_dam_level0", "river_house_level0", "river_building_level0", "river_bridge, pier_level0", "river_landslide_level0", "river_telegraph pole_level0", "river_street lamp_level0", "river_car_level0", "river_person_level0", "river_tree_level0", "river_broken damaged area_level0", "river_car traffic light_level0", "river_pedestrian traffic light_level0", "river_traffic sign_level0", "river_distance sign_level0", "river_road_level0", "river_underpass_level0", "river_flood damaged area_level0", "river_flood debris damaged area_level0", "river_landslide damaged area_level0", "river_levee_level2", "river_dam_level2", "river_house_level2", "river_building_level2", "river_bridge, pier_level2", "river_landslide_level2", "river_telegraph pole_level2", "river_street lamp_level2", "river_car_level2", "river_person_level2", "river_tree_level2", "river_broken damaged area_level2", "river_car traffic light_level2", "river_pedestrian traffic light_level2", "river_traffic sign_level2", "river_distance sign_level2", "river_road_level2", "river_underpass_level2", "river_flood damaged area_level2", "river_flood debris damaged area_level2", "river_landslide damaged area_level2", "city_levee_level0", "city_dam_level0", "city_house_level0", "city_building_level0", "city_bridge, pier_level0", "city_landslide_level0", "city_telegraph pole_level0", "city_street lamp_level0", "city_car_level0", "city_person_level0", "city_tree_level0", "city_broken damaged area_level0", "city_car traffic light_level0", "city_pedestrian traffic light_level0", "city_traffic sign_level0", "city_distance sign_level0", "city_road_level0", "city_underpass_level0", "city_flood damaged area_level0", "city_flood debris damaged area_level0", "city_landslide damaged area_level0", "city_levee_level2", "city_dam_level2", "city_house_level2", "city_building_level2", "city_bridge, pier_level2", "city_landslide_level2", "city_telegraph pole_level2", "city_street lamp_level2", "city_car_level2", "city_person_level2", "city_tree_level2", "city_broken damaged area_level2", "city_car traffic light_level2", "city_pedestrian traffic light_level2", "city_traffic sign_level2", "city_distance sign_level2", "city_road_level2", "city_underpass_level2", "city_flood damaged area_level2", "city_flood debris damaged area_level2", "city_landslide damaged area_level2", "common_levee_level0", "common_dam_level0", "common_house_level0", "common_building_level0", "common_bridge, pier_level0", "common_landslide_level0", "common_telegraph pole_level0", "common_street lamp_level0", "common_car_level0", "common_person_level0", "common_tree_level0", "common_broken damaged area_level0", "common_car traffic light_level0", "common_pedestrian traffic light_level0", "common_traffic sign_level0", "common_distance sign_level0", "common_road_level0", "common_underpass_level0", "common_flood damaged area_level0", "common_flood debris damaged area_level0", "common_landslide damaged area_level0", "common_levee_level2", "common_dam_level2", "common_house_level2", "common_building_level2", "common_bridge, pier_level2", "common_landslide_level2", "common_telegraph pole_level2", "common_street lamp_level2", "common_car_level2", "common_person_level2", "common_tree_level2", "common_broken damaged area_level2", "common_car traffic light_level2", "common_pedestrian traffic light_level2", "common_traffic sign_level2", "common_distance sign_level2", "common_road_level2", "common_underpass_level2", "common_flood damaged area_level2", "common_flood debris damaged area_level2", "common_landslide damaged area_level2" 4 수집수단별 분류 image[].device string Y 휴대폰(mobile_phone), 카메라(camera) 5 재해레벨별 분류 annotations[].subcategory number Y 위험레벨
(0~1까지 단계별)
3. 어노테이션 포맷
-
3. 어노테이션 포맷 구분 항목명 타입 필수여부 설명 범위 비고 1 info object 데이터셋정보 1–1 info[].name string Y 데이터셋 명 1–2 info[].desc string Y 데이터셋 상세설명 1–3 info[].url string Y 데이터셋 URL 1–4 info[].data_created string Y 데이터셋 생성일자 1–5 info[].filename string Y 파일명 2 image object 이미지정보 2–1 image[].mission number Y 촬영 위치정보 2–2 image[].img_name string 이미지 이름 2–3 image[].resolution string Y 이미지 해상도 2–4 image[].Date number Y 촬영날짜 2–5 image[].device string Y 데이터 수집 도구 2–6 image[].license string Y 이미지 출처 2–7 image[].type string Y 데이터 형식 2–8 image[].location string Y 위치 종류 3 annotations object 라벨링정보 3–1 annotations[].image_id string Y 이미지 ID 3–2 annotations[].disaster string Y 자연재해 종류 3–3 annotations[].segmentation array semantic segmentation 값 3–4 annotations[].bbox array Y x 좌표값, y 좌표값, 높이값, 너비값 3–5 annotations[].category string Y 자연재해 피해 대상 3–6 annotations[].category_id string 객체 카테고리 ID 3–7 annotations[].subcategory number Y 위험 레벨 Lv.0(정상, Lv.1(재해)
4. 실제 예시
- 촬영 메타 데이터
-
데이터셋 구축 담당자
수행기관(주관) : 스마트쿱㈜
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 최진욱 02-548-6969 [email protected] · 총괄 및 품질검증, 가공 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜엘씨씨코리아 · 데이터 수집 ㈜인더스웰 · 정제 및 가공 디노플러스㈜ · 검수 및 모델링 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 최진욱 02-548-6969 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.