-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2022-07-28 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-10-20 신규 샘플데이터 개방 2022-07-28 콘텐츠 최초 등록 소개
• 포유류 9종(고라니, 멧돼지, 청설모, 다람쥐, 너구리, 반달가슴곰, 노루, 멧토끼, 족제비), 조류 2종(왜가리, 중대백로), 총 11종에 대해 주/야간 및 장비 형태별로 원시데이터(영상) 500시간 수집 및 이미지 어노테이션 27만장 이상 구축
구축목적
• 야생동물의 로드킬을 방지하고, 데이터를 활용한 효과적인 보전·관리와 ASF(아프리카돼지열병) 등과 같은 위험요소에 대한 신속한 관리 대응을 위해 구축한 인공지능 학습용 데이터
-
메타데이터 구조표 데이터 영역 재난안전환경 데이터 유형 이미지 데이터 형식 txt, jpg 데이터 출처 국립공원공단, 구례군청, 직접촬영 등 라벨링 유형 바운딩박스, 세그멘테이션 라벨링 형식 JSON 데이터 활용 서비스 야생동물 접근 방지, 로드킬 방지 데이터 구축년도/
데이터 구축량2021년/334,851건 -
데이터 통계
- 데이터 구축 규모
<원시데이터 – 영상(시간)>데이터 구축 규모<원시데이터 – 영상(시간)> 구분 주간 야간 합계 고라니 39:23:56 25:24:10 64:48:06 너구리 22:56:08 15:44:32 38:40:40 노루 33:23:25 24:54:40 58:18:05 다람쥐 70:12:47 0:00:10 70:12:57 멧돼지 32:31:46 22:47:16 55:19:02 멧토끼 30:23:53 22:36:12 53:00:05 반달가슴곰 18:29:08 16:11:49 34:40:57 왜가리 55:26:29 0:00:20 55:26:49 족제비 19:53:26 14:19:03 34:12:29 중대백로 59:18:03 - 59:18:03 청설모 56:18:04 0:00:10 56:18:14 합계 438:17:05 141:58:22 580:15:27
<원천데이터 – 이미지(장)>데이터 구축 규모<원천데이터 – 이미지(장)> 구분 Bounding Box Segmentation 주간 야간 합계 주간 야간 합계 고라니 19,361 16,386 35,747 1,454 1,491 2,945 너구리 8,237 7,422 15,659 765 754 1,519 노루 17,893 10,648 28,541 1,538 1,466 3,004 다람쥐 39,273 180 39,453 3,238 3,238 멧돼지 15,436 19,931 35,367 1,452 1,481 2,933 멧토끼 15,299 13,489 28,788 301 1,541 1,842 반달가슴곰 9,689 7,229 16,918 876 912 1,788 왜가리 29,550 4 29,554 2,923 2,923 족제비 9,498 7,506 17,004 775 791 1,566 중대백로 24,205 3 24,208 2,914 2,914 청설모 24,869 64 24,933 2,913 3 2,916 총합계 213,310 82,862 296,172 19,149 8,439 27,588
<멧돼지 열화상>데이터 구축 규모<멧돼지 열화상> 구분 정상 비정상 합계 영상(시간) 47:03:28 2:16:42 49:20:10 이미지(장) 1,236 9,855 11,091
데이터 분포
- 데이터 분포
<객체 클래스별 분포>데이터 분포<객체 클래스별 분포> 구분 이미지 수 비율 객체 수 비율 고라니 38,692 11.60% 40,329 10.70% 너구리 17,178 5.10% 17,338 4.60% 노루 31,545 9.40% 37,181 9.90% 다람쥐 42,691 12.70% 43,513 11.60% 멧돼지 49,391 14.80% 54,195 14.40% 멧토끼 30,630 9.10% 40,871 10.90% 반달곰 18,706 5.60% 29,749 7.90% 왜가리 32,477 9.70% 34,640 9.20% 족제비 18,570 5.50% 18,575 4.90% 중대백로 27,122 8.10% 31,071 8.30% 청설모 27,849 8.30% 29,004 7.70% 합계 334,851 100.00% 376,466 100.00%
<야행성 동물(7종) 주야간 분포(영상)>데이터 분포<야행성 동물(7종) 주야간 분포(영상)> 구분 주간 비율 야간 비율 고라니 39:23:56 61% 25:24:10 39% 너구리 22:56:08 59% 15:44:32 41% 노루 33:23:25 57% 24:54:40 43% 멧돼지 32:31:46 59% 22:47:16 41% 멧토끼 30:23:53 57% 22:36:12 43% 반달가슴곰 18:29:08 53% 16:11:49 47% 족제비 19:53:26 58% 14:19:03 42% 합계 197:01:42 58% 141:57:42 42%
<야행성 동물(7종) 주야간 분포(이미지)>데이터 분포<야행성 동물(7종) 주야간 분포(이미지)> 구분 주간 비율 야간 비율 고라니 20,815 54% 17,877 46% 너구리 9,002 52% 8,176 48% 노루 19,431 62% 12,114 38% 멧돼지 16,888 44% 21,412 56% 멧토끼 15,600 51% 15,030 49% 반달가슴곰 10,565 56% 8,141 44% 족제비 10,273 55% 8,297 45% 총합계 102,574 53% 91,047 47%
<촬영 장비별 분포(이미지)>데이터 분포<촬영 장비별 분포(이미지)> 촬영 장비 이미지 수 비율 CCTV 9,843 2.90% DSLR 113,553 33.90% TIC 11,091 3.30% phone 61,010 18.20% sensor camera 139,369 41.60% 총 합 334,866 100%
- 데이터 구축 규모
-
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드모델
- Object Detection 모델로서 YOLOv5 모델을 활용, 야생동물 이미지를 학습하여 종을 판별
모델 모델분류 알고리즘 야생동물 탐지 모델 YOLOv5 멧돼지 열화상 분류 모델 Efficientnet
서비스 활용 시나리오
- 야생동물의 판별과 탐지등의 서비스, 연구에 활용될 수 있음
- 야생돔물 탐지 서비스
– CCTV등과 같은 영상 기반의 디바이스에서 주요 야생동물을 탐지하고 탐지된 야생동물의 종을 분류하여 다양한 서비스 시나리오에 도입이 가능
– 탐지 기능을 응용하여 위험지역에서의 출현을 사전에 알림
– 종분류 기능을 응용하여 특정 지역의 출현 횟수를 집계 - 연구, 서비스 영역에서의 모델의 학습 활용
– 제공되는 야생동물 탐지 모델은 12종의 국내 야생동물을 학습한 모델로서 전이 학습을 통해 분류 가능한 종의 확대, 유사 동물 판별 정확도 향상 등을 도모할 수 있음
본 과제 성과 모델의 특이 사항
- 외관상 유사한 특징을 가지는 종을 일부 포함하여 학습
- 조류 2종을 포함하여 포유류 외 조류 종의 확장 모델로 전이학습 가능
- 주,야간 데이터 동시 학습
=> 야생동물 종, 주야간 환경 클래스의 확장 가능성을 검토
- Object Detection 모델로서 YOLOv5 모델을 활용, 야생동물 이미지를 학습하여 종을 판별
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 비정상 분류 모델 Image Classification YOLO v5 F1-Score 0.85 점 0.996 점 2 객체 인지 Object Detection EfficientDet mAP 60 % 99.3 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 소개
- 야생동물의 로드킬을 방지하고, 데이터를 활용한 효과적인 보전·관리와 ASF(아프리카돼지열병) 등과 같은 위험요소에 대한 신속한 관리 대응을 위해 구축한 인공지능 학습용 데이터
- 포유류 9종 : 고라니, 멧돼지, 청설모, 다람쥐, 너구리, 반달가슴곰, 노루, 멧토끼, 족제비
조류 2종 : 왜가리, 중대백로
총 11종에 대해 주/야간 및 장비 형태별로 원시데이터(영상) 500시간 수집 및 이미지 어노테이션 27만장 이상 구축.
데이터 구성
데이터 구성 Key 타입 설명 예 [ name String 데이터셋명 animal description String 데이터셋상세설명 AI Data url String 데이터셋URL https://aihub.or.kr date String 데이터셋생성일자 2021.12.23 ] [ id Number 이미지식별자 50 width Number 이미지너비 1024 height Number 이미지높이 768 file_name String 이미지파일명 A01_G07_G001_G_210122_1003_15S_000006.137.jpg date_created String 촬영날짜(년, 월)시간 2021.01.22 23:46:00 day String 주간, 야간 주간, 야간 type String 데이터 형식 RGB, IR, TIC photographer String 촬영자(제공처) 코드 C051 device String 촬영 장비명(센서 카메라, CCTV, DSLR) 센서 카메라, CCTV, DSLR location String 촬영 지역명 서울대공원 GPS String 촬영위치 36.572188, 127.855409 length String 영상길이 10M, 10s FPS string 프레임 30 frames Number 총 프레임 수(FPS) 60 aspect_ratio String 종횡비 4:03 resolution String 해상도 1280 x 640 bit String 비트값 24bit pixel String 화소 4K color_depth String 색심도 sRGB ISO String ISO 감도 3200 whit_balance String 화이트 밸런스 5500K exposure_time String 노출시간 f2.8 1/80 F-stop String 조리개값 f2.8 flash String 플래시 자동 focal_length String 초점거리 50mm angle_view String 화각 46 angle String 촬영각도 120도 weather String 날씨정보 맑음 time String 이미지 시리얼 1.838 (영상 내 프레임위치) ] [ labelingcount Number 해당 이미지 내 어노테이션 개수 [1,2...] id Number 라벨링식별자 [1, 2...] category_id Number 클래스정보 [1,2,...] category_ String 동물명 [inermis,scrofa,...] name nocturnality String 야행성 여부 yes hazardous String 유해야생동물여부 no temperature String 멧돼지 체온 정보 40도 regularity String 멧돼지 체온 멧돼지 정상 : 40도 미만 열화상 데이터 비정상 : 40도 이상 color String 동물색 red, black, N/A (IR영상, 열화상 영상) Shape String 동물 모양 둥근귀, 뿔 없음,.. size String 동물 크기 75~100cm class String 동물 강 분류 포유동물강 order String 동물 목 분류 우제목 family String 동물 과 분류 사슴과 genus String 동물 속 분류 고라니속 species String 동물 종 분류 고라니 drawing_id Number box/polygon 둘 중 하나 선택 bbox List(Number) 바운딩박스 좌표값 Bbox 진행시 필수 [[X1, Y1], [X2, Y2]] Segmenataion List(Number) 세그맨테이션 좌표값 Segmentation 진행시 필수 [[X1, Y1], [X2, Y2]..] ] [ name String 라이선스명 구매 데이터 url String 라이선스URL 구매 데이터 ] 11 어노테이션 포맷
어노테이션 포맷 구분 항목명 타입 필수여부 설명 범위 비고 1 info Object 데이터셋정보 1-01 info.name String Y 데이터셋명 1-02 info.description String 데이터셋상세설명 1-03 info.url String 데이터셋URL 1-04 info.date_created String Y 데이터셋생성일자 2 images Object 이미지정보 2-01 images[].id Number Y 이미지식별자 2-02 images[].width Number Y 이미지너비 [0~1920] 2-03 images[].height Number Y 이미지높이 [0~1080] 2-04 images[].file_name String Y 이미지파일명 2-05 images[].date_created String Y 촬영날짜 2021.04.01. 10:20:00 (년, 월)시간 2-06 images[].day String Y 주간, 야간 [day, night] 주간, 야간 2-07 images[].type String Y 데이터 형식 RGB, IR, TIC 2-08 images[].photographer String Y 촬영자(제공처) 코드 C051 2-09 images[].device String Y 촬영 장비명 [sensor camera, CCTV, DSLR, phone, TIC] 센서 카메라, CCTV, DSLR 2-10 images[].location String Y 촬영 지역명 서울대공원 2-11 images[].GPS String Y 촬영위치 36.572188, 127.855409 2-12 images[].length String Y 영상길이 10M, 10s 2-13 images[].FPS string Y 프레임 30 2-14 images[].frames Number Y 총 프레임 수(FPS) 60 2-15 images[].aspect_ratio String Y 종횡비 4:03 2-16 images[].resolution String Y 해상도 1280 x 640 2-17 images[].bit String 비트값 24bit 2-18 images[].pixel String 화소 4K 2-19 images[].color_depth String 색심도 sRGB 2-20 images[].ISO String ISO 감도 3200 2-21 images[].whit_balance String 화이트 밸런스 5500K 2-22 images[].exposure_time String 노출시간 f2.8 1/80 2-23 images[].F-stop String 조리개값 f2.8 2-24 images[].flash String 플래시 [auto, yes, no] 자동 2-25 images[].focal_length String 초점거리 50mm 2-26 images[].angle_view String 화각 46 2-27 images[].angle String 촬영각도 120도 2-28 images[].weather String Y 날씨정보 [suuny, cloudy, rain, snow] 맑음 2-29 images[].time String Y 이미지 시리얼 1.838 (영상 내 프레임위치) 3 annotations Object 라벨링정보 3-01 annotations[].labelingcount Number Y 해당 이미지 내 어노테이션 개수 [1,2...] 3-02 annotations[].id Number Y 라벨링식별자 [1, 2...] 3-03 annotations[].category_id Number Y 클래스정보 [1,2,...] 3-04 annotations[].category_ String Y 동물명 [inermis,scrofa,...] name 3-05 annotations[].nocturnality String Y 야행성 여부 [yes, no] 3-06 annotations[].hazardous String Y 유해야생동물여부 [yes, no] 3-07 annotations[].temperature String 멧돼지 체온 정보 40도 3-08 annotations[].regularity String 멧돼지 체온
정상 : 40도 미만
비정상 : 40도 이상[normal, abnormal] 멧돼지
열화상 데이터3-09 annotations[].color String 동물색 red, black, N/A (IR영상, 열화상 영상) 3-10 annotations[].Shape String 동물 모양 둥근귀, 뿔 없음,.. 3-11 annotations[].size String 동물 크기 75~100cm 3-12 annotations[].class String Y 동물 강 분류 3-13 annotations[].order String Y 동물 목 분류 3-14 annotations[].family String Y 동물 과 분류 3-15 annotations[].genus String Y 동물 속 분류 3-16 annotations[].species String Y 동물 종 분류 3-17 annotations[].drawing_id Number Y box/polygon [1, 2] 둘 중 하나 선택 3-18 annotations[].bbox List(Number) 바운딩박스 좌표값
[[X1, Y1], [X2, Y2]]Bbox 진행시 필수 3-19 annotations[].Segmenataion List(Number) 세그맨테이션 좌표값
[[X1, Y1], [X2, Y2]..]Segmentation 진행시 필수 4 licenses Object 라이선스 4-01 licenses[].name String N 라이선스명 구매 데이터 4-02 licenses[].url String N 라이선스URL 구매 데이터 실제 예시
- 야생동물의 로드킬을 방지하고, 데이터를 활용한 효과적인 보전·관리와 ASF(아프리카돼지열병) 등과 같은 위험요소에 대한 신속한 관리 대응을 위해 구축한 인공지능 학습용 데이터
-
데이터셋 구축 담당자
수행기관(주관) : 노아에스엔씨㈜
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 장우영 02-6105-6619 [email protected] · 가공 · 검수 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜에스디엠이엔씨 · 정제 뉴컨㈜ · 수집 엠케이지㈜ · 인공지능 모델 구례군청 · 수집 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 장우영 02-6105-6619 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.