-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-06 데이터 최종 개방 1.0 2023-07-26 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2023-12-15 산출물 전체 공개 소개
라켓 스포츠 영상 분석을 위한 영상 내 주요 객체 (선수, 심판, 코트, 네트) 및 동작 데이터
구축목적
스포츠 분야 인공지능 생태계 활성화를 위해 대표적인 라켓스포츠인 배드민턴과 테니스 종목의 AI 학습용 데이터셋 구축
-
메타데이터 구조표 데이터 영역 스포츠 데이터 유형 이미지 데이터 형식 jpg, mp4 데이터 출처 직접 촬영 라벨링 유형 B-box, Polygon, Key point 라벨링 형식 json 데이터 활용 서비스 데이터 구축년도/
데이터 구축량2022년/192,000장 -
4. 데이터 통계
구축 내용 및 제공 데이터량
테니스 영상 각 8,000시간이상 수집 및 각 이미지 192,000장 가공
객체 정보와 환경 정보, 동작 정보 등이 포함된 json형식의 파일을 결과로 산출
1) 테니스데이터 통계 숙련도 대회/훈련 단/복/남/녀/혼합 경기유형 남/여/혼합 전문
90%대회
71%단식
45%실업
40%남 11,042 여 11,042 대학
40%남 11,042 여 11,042 주니어
20%남 5,521 여 5,521 복식
45%실업
40%남 11,042 여 11,042 대학
40%남 11,042 여 11,042 주니어
20%남 5,521 여 5,521 혼합
10%실업
50%혼합 6,135 대학
50%혼합 6,134 훈련
29%스윙
20%단식
20%실업
50%남 2,506 여 2,505 대학
50%남 2,506 여 2,505 트레이닝
20%단식
20%실업
50%남 2,506 여 2,505 대학
50%남 2,506 여 2,505 경기
60%단식
60%실업
50%남 7,517 여 7,517 대학
50%남 7,517 여 7,516 소계 172,800 동호회
10%복식
80%남 7,680 여 7,680 혼합
20%혼합 3,840 소계 19,200 합계 192,000 -
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 경기 영상 내 주요 객체 인식 (선수, 심판, 코트, 네트) Object Detection FasterRCNN mAP@IoU 0.5 65 % 81.29 % 2 경기 영상 내 주요 객체 인식 (코트, 네트) Object Detection Mask RCNN mAP@IoU 0.5 65 % 10 % 3 선수별 관절 키포인트 검출 Keypoint Detection HRNet MPJPE 90 mm 44.08 mm 4 선수별 관절 키포인트 검출 Keypoint Detection HRNet PCK 75 % 97.56 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드5. 어노테이션 포맷 및 데이터 구조
1) 대표 도면
- 테니스어노테이션 포맷 구분 속성명 타입 필수여부 설명 범위 비고 1 rawDataInfo Object Y 원시데이터 1-1 rawDataInfo.rawDataId String Y 원시데이터명 1-2 rawDataInfo.fileExtension String Y 확장자 “mp4”, “avi” 1-3 rawDataInfo.copyrighter String Y 총괄사업자 “㈜미디어그룹사람과숲” 1-4 rawDataInfo.resolution String Y 해상도 “1920*1080” 1-5 rawDataInfo.date String Y 촬영일자 1-6 rawDataInfo.length Number Y 영상길(초) 1-7 rawDataInfo.place String Y 실내/실외 구분 “실내”, “실외” 1-8 rawDataInfo.region String Y 촬영지역 1-9 rawDataInfo.season String Y 계절 프로퍼티설명 참조 1-10 rawDataInfo.weather String Y 날씨 프로퍼티설명 참조 1-11 rawDataInfo.precipitation Number N 강수량 1-12 rawDataInfo.temperature Number Y 기온 1-13 rawDataInfo.fps Number Y 프레임 1-14 rawDataInfo.fStop String Y 조리개 수치 1-15 rawDataInfo.exposureTime String Y 노출시간 1-16 rawDataInfo.iso Number Y 감도 1-17 rawDataInfo.cameraNumber String Y 카메라번호 프로퍼티설명 참조 1-18 rawDataInfo.playType String Y 경기유형 프로퍼티설명 참조 1-19 rawDataInfo.matchType String Y 단/복/남/여/혼합 유형 프로퍼티설명 참조 1-20 rawDataInfo.tournamentName String N 대회명 1-21 rawDataInfo.courtNumber String N 코트번호 2 sourceDataInfo Object Y 원천데이터 2-1 sourceDataInfo.sourceDataId String Y 원천데이터명 2-2 sourceDataInfo.fileExtension String Y 확장자 “jpg” 3 learningDataInfo Object Y 라벨링데이터 3-1 learningDataInfo.learningDataId String Y 라벨링데이터명 3-2 learningDataInfo.fileExtension String Y 확장자 “json” 3-3 learningDataInfo.annotations Object Y 라벨링데이터 상세정보 파일명 구성 정보 예시 세부 구성 설명 T_220630_EU_MS_R1_01_AM_01_SRV-FSS_01_001.json 테니스_날짜_(2차 경로)_(3차 경로)_카메라번호_원시데이터일련번호_동작분석_시퀀스일련번호_동작분석클래스_동작분석일련번호_이미지일련번호.json 어노테이션 포맷2 구분 속성명 타입 설명 상세설명 1 rawDataInfo.season String 계절 “Spring”, “Summer”, “Autumn”, “Winter” 2 rawDataInfo.weather String 날씨 “Sunny“ “Cloudy”, “Foggy”, “Rainy”, “Snowy” 3 rawDataInfo.cameraNumber String 카메라번호 “R1”, “R2”, “R3”, “R4”, “R5”, “R6”, “R7”, “R8” 4 rawDataInfo.playType String 경기실업(전문) “CP” 경기대학(전문) “CU“ 경기주니어(전문) “CJ” 경기동호회(일반) “CG” 훈련스윙실업(전문) “SP” 훈련스윙대학(전문) “SU” 훈련트레이닝실업
(전문)“TP” 훈련트레이닝대학
(전문)“TU” 훈련경기실업(전문) “EP” 훈련경기대학(전문) “EU” 5 rawDataInfo.matchType String 남자단식 “MS” 남자복식 “MD” 여자단식 “WS” 여자복식 “WD” 혼합복식 “XD” -
데이터셋 구축 담당자
수행기관(주관) : ㈜미디어그룹사람과숲
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 우승호 02-830-8583 [email protected] 사업총괄 데이터 정제 데이터 가공 수행기관(참여)
수행기관(참여) 기관명 담당업무 디에프코리아 데이터 가공 ㈜디제이매니지먼트 데이터 정제 벡터바이오 데이터 수집 ㈜써로마인드 데이터 유효성 검증 ㈜인피닉 데이터 가공 포디리플레이코리아㈜ 데이터 수집 한알음정보㈜ 데이터 검수 한국스포츠정책과학원 데이터 수집, 정제 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 우승호 02-830-8583 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.