건설 현장 장비 모니터링 및 생산성 측정 데이터
- 분야영상이미지
- 유형 센서 , 이미지 , 비디오 , 텍스트
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-20 데이터 최종 개방 1.0 2023-05-04 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-03-15 최종산출물 수정 저작도구 2023-12-27 산출물 전체 공개 소개
건설 현장 투입 장비의 실시간 모니터링 및 활동 추적을 통해 작업 효율성 및 생산성을 측정․분석하기 위한 데이터를 구축함
구축목적
● 연구 분야 : 건설자원(자재, 인력, 장비) 등의 생산성 측정연구 ● 산업 분야 : 투입 중장비 실시간 모니터링 시스템 구축 등 연구 분야 활용
-
메타데이터 구조표 데이터 영역 영상이미지 데이터 유형 센서 , 이미지 , 비디오 , 텍스트 데이터 형식 txt, jpg, jpeg, avi, mp4 데이터 출처 직접 수집 라벨링 유형 바운딩 박스(이미지), 키포인트(이미지), 세그멘테이션(이미지), 내용요약(자연어) 라벨링 형식 JSON, CSV 데이터 활용 서비스 AI 모델 활용 서비스 데이터 구축년도/
데이터 구축량2022년/위치궤적 데이터 3,870일/자재입출고영상 312시간,이미지 10,158장/ 자재 이미지 101,459장/ 굴착기 데이터 100,406장 / 총 1.58TB -
1. 데이터 통계
가. 데이터 구축 규모1. 데이터 통계 가. 데이터 구축 규모 종류 규모 확보 방안 건설/건축자재 이미지 101,459장 직접 촬영 (자재 종류 20종) 운송장비의 자재입출고 이미지 10,158장 영상 312시간 수집 영상에서 정의된 동작 구간 추출 위치궤적(활동) 데이터 3,870일 - 건설장비에 위치데이터 로거를 통해 직접 수집된 위치데이터 (투입장비 20종) - MG, MC등 텔래매틱스 장착 장비는 탤레매틱스 인터페이스를 통해 수집후 처리 굴착기 데이터 100.406장 수집 영상에서 해당 이미지 추출 나. 데이터 분포
1) 날씨 정보 분포1. 데이터 통계 나. 데이터 분포 1) 날씨 정보 분포 weather count 비율 cloudy 416 10.75% rainy 1,661 42.92% snowy 6 0.16% sunny 1,787 46.18% 합계 3,870 100% [그림 1] 날씨 정보 분포
2) 단위공정 분포
1. 데이터 통계 나. 데이터 분포 2) 단위공정 분포 workingtype count 비율 비고 0 415,31 2.16% 해당없음 3 9,430,606 49.06% 토공 4 1,026,241 5.34% 운송 5 1,111,829 5.78% 콘크리트 운송 6 1,482,805 7.71% 상차 7 1,726,261 8.98% 양중 8 2,680,561 13.95% 지면 천공 9 256,939 1.34% 타설 10 91,410 0.48% 살수 11 776,684 4.04% 벽면 천공 12 223,705 1.16% 운반 합계 19,222,172 100% [그림 2] 단위공정 분포
3) 자재종류 분포
1. 데이터 통계 나. 데이터 분포 3) 자재종류 분포 class count 비율 brailleBlock 5,084 3.76% brick 6,151 4.55% castIronCover 61 0.05% castIronCover 5,671 4.19% circle Manhole 7,202 5.33% collectorWall 5,467 4.04% curbStone 6,203 4.59% deckPlate 6,448 4.77% doubleWallPipe 8,640 6.39% floorPost 7,803 5.77% flumeTube 6,663 4.93% forms 6,759 5.00% pvcPipe 6,978 5.16% rubberCone 8,118 6.00% scaffold 6,349 4.70% squareManhole 6,495 4.80% steelBar 9,765 7.22% steelGrating 6,164 4.56% trenchCover 6,021 4.45% waterBarrier 5,137 3.80% wideflangeShapes 8,043 5.95% 합계 135,222 100% [그림 3] 자재종류 분포
4) 건설장비 종류 분포
1. 데이터 통계 나. 데이터 분포 4) 건설장비 종류 분포 Type count 비율 비고 concretecar 608 15.71% 레미콘 crane 124 3.20% 크레인 dump 1,684 43.51% 덤프 earthanchor 33 0.85% 어스앙카 excavator 181 468% 굴착기 excavator14t 156 4.03% 굴착기14T excavator5t 52 1.34% 굴착기5T forklift 72 1.86% 지게차 hceexcavator30t 80 2.07% 굴착기 현대 30T piledrivera 33 0.85% 천공기 piledriverb 37 0.96% 항타기 piledriverc 30 0.78% 타공기 pumpcar 31 0.80% 펌프카 trailer 130 3.36% 트레일러 truck 401 10.36% 그 외 트럭 truck2d5t 34 0.88% 트럭 2.5T truck4d5t 32 0.83% 트럭 4.5T truck5t 32 0.83% 트럭 5T volexcavator30t 82 2.12% 굴착기 볼보 30T watersprinkler 38 0.98% 상수차 합계 3,870 100% [그림 4] 건설장비 종류 분포
5) 수집 건설현장 분포
1. 데이터 통계 나. 데이터 분포 5) 수집 건설현장 분포 filename count 비율 비고 site1 1,757 45.40% 힐스테이트 시화호 site2 1,138 29.41% 고양삼송5-2블럭 지식산업센터 신축공사 site3 975 25.19% 힐스테이트 더 운정 신축공사 합계 3,870 100% [그림 5] 수집 건설현장 분포
6) 건설장비 날짜분포
1. 데이터 통계 나. 데이터 분포 6) 건설장비 날짜분포 start_time count 비율 2022-07-13 10 0.26% 2022-07-14 3 0.08% 2022-07-15 24 0.62% 2022-07-16 1 0.03% 2022-07-18 2 0.05% 2022-07-19 4 0.10% 2022-07-20 11 0.28% 2022-07-21 8 0.21% 2022-07-22 29 0.75% 2022-07-23 31 0.80% 2022-07-24 4 0.10% 2022-07-25 21 0.54% 2022-07-26 31 0.80% 2022-07-27 41 1.06% 2022-07-28 30 0.78% 2022-07-29 45 1.16% 2022-07-30 34 0.88% 2022-08-01 31 0.80% 2022-08-02 35 0.90% 2022-08-04 37 0.96% 2022-08-05 25 0.65% 2022-08-06 40 1.03% 2022-08-07 1 0.03% 2022-08-09 16 0.41% 2022-08-10 87 2.25% 2022-08-11 73 1.89% 2022-08-12 36 0.93% 2022-08-13 28 0.72% 2022-08-14 1 0.03% 2022-08-15 11 0.28% 2022-08-16 83 2.14% 2022-08-17 121 3.13% 2022-08-18 49 1.27% 2022-08-19 34 0.88% 2022-08-20 52 1.34% 2022-08-22 63 1.63% 2022-08-23 50 1.29% 2022-08-24 69 1.78% 2022-08-25 47 1.21% 2022-08-26 149 3.85% 2022-08-27 50 1.29% 2022-08-29 43 1.11% 2022-08-30 26 0.67% 2022-08-31 51 1.32% 2022-09-01 23 0.59% 2022-09-02 53 1.37% 2022-09-03 30 0.78% 2022-09-06 17 0.44% 2022-09-07 44 1.14% 2022-09-13 53 1.37% 2022-09-14 70 1.81% 2022-09-15 71 1.83% 2022-09-16 97 2.51% 2022-09-17 39 1.01% 2022-09-18 2 0.05% 2022-09-19 99 2.56% 2022-09-20 97 2.51% 2022-09-21 90 2.33% 2022-09-22 73 1.89% 2022-09-23 59 1.52% 2022-09-24 12 0.31% 2022-09-26 87 2.25% 2022-09-27 82 2.12% 2022-09-28 96 2.48% 2022-09-29 54 1.40% 2022-09-30 70 1.81% 2022-10-01 40 1.03% 2022-10-03 15 0.39% 2022-10-04 47 1.21% 2022-10-05 50 1.29% 2022-10-06 38 0.98% 2022-10-07 57 1.47% 2022-10-08 14 0.36% 2022-10-10 5 0.13% 2022-10-11 30 0.78% 2022-10-12 43 1.11% 2022-10-13 48 1.24% 2022-10-14 23 0.59% 2022-10-15 20 0.52% 2022-10-17 25 0.65% 2022-10-18 27 0.70% 2022-10-19 27 0.70% 2022-10-20 37 0.96% 2022-10-21 4 0.10% 2022-10-22 7 0.18% 2022-10-24 4 0.10% 2022-10-25 3 0.08% 2022-10-26 4 0.10% 2022-10-27 8 0.21% 2022-10-28 4 0.10% 2022-10-29 4 0.10% 2022-10-31 6 0.16% 2022-11-04 16 0.41% 2022-11-05 13 0.34% 2022-11-07 19 0.49% 2022-11-08 17 0.44% 2022-11-09 14 0.36% 2022-11-10 16 0.41% 2022-11-11 20 0.52% 2022-11-12 12 0.31% 2022-11-14 12 0.31% 2022-11-15 17 0.44% 2022-11-16 20 0.52% 2022-11-17 14 0.36% 2022-11-18 13 0.34% 2022-11-19 15 0.39% 2022-11-21 14 0.36% 2022-11-22 14 0.36% 2022-11-23 13 0.34% 2022-11-24 12 0.31% 2022-11-25 11 0.28% 2022-11-26 11 0.28% 2022-11-28 11 0.28% 2022-11-29 11 0.28% 2022-12-02 2 0.05% 2022-12-03 2 0.05% 2022-12-05 2 0.05% 2022-12-06 2 0.05% 2022-12-07 2 0.05% 합계 3,870 100% [그림 6] 건설장비 날짜 분포
-
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드1. 활용 모델
가. 모델학습1. 활용 모델 가. 모델학습 유효성 검증 항목 항목명 굴착기 키포인트 객체 인식 검증 방법 모델 성능 그래프 목적 포즈 추정, 굴착기 분의 관절인 키포인트(keypoint)가 어떻게 구성되어 있는지 위치를 측정(Localization)하고 추정(Estimation)하고자 함 지표 PCK(Percentage of Correct Keypoint) 측정 산식 도커 이미지 pose_estimation.tar 실행 파일명 evaluation.py 유효성 검증 환경 CPU AMD Ryzen 7 5800*3D 8-Core Processor Memory 16GB GPU RTX 3090 Storage 3.6TB OS Ubuntu 20.04.5 LTS 유효성 검증 모델 학습 및 검증 조건 개발 언어 Python 3.8 프레임워크 Pytorch 1.13.1 + cu116 학습 알고리즘 HRNet(High Resolution Network) • HRNet은 CNN architecture 중 하나로 pose estimation 분야에 높은 정확도를 보이고 있음 • 일반적으로 CNN의 Convolutional layer는 정보가 압축되기 때문에 저해상도의 표현으로 나타남 • 하지만, Classification을 제외한 Segmentation, Detection, Pose estimation의 경우 픽셀 단위로 구분되기 때문에 고해상도의 이미지가 필요한 상황임 • 고해상도의 회복을 위하여 Upsampling을 통해 원래 상태로 복구함 • HRNet의 장점은 아래와 같은 이유로 다른 CNN architecture들에 비해 upsampling을 효과적으로 수행함 학습 조건 epoch: 50, batch: 32, optimizer: adam 파일 형식 • 학습 데이터셋: JPG • 평가 데이터셋: JSON 전체 구축 데이터 대비
모델에 적용되는 비율
AI모델 사용 이미지 비율(수량) - 클래스 1(굴삭기): 100% (100,406장) ※ 유효성 검증은 구축된 데이터 전체를 적용하며, 변경이 필요한 경우 TTA 담당자와 협의한다. 모델 학습 과정별
데이터 분류 및 비율 정보- Training Set 비율(수량) (1) 클래스 1(굴삭기): 79.76% (80,169장) - Validation Set (1) 클래스 1(굴삭기): 10.12% (10,118장) - Test Set (1) 클래스 1(굴삭기): 10.12% (10,119장) 유효성 검증 항목 항목명 자재 바운딩박스 객체 인식 검증 방법 모델 성능 그래프 목적 객체 탐지 지표 mAP(mean Average Precision) 측정 산식 도커 이미지 heuristic_villani.tar 실행 파일명 val.py 유효성 검증 환경 CPU AMD Ryzen 7 7800*3D 8-Core Processor Memory 16GB GPU RTX 3090 Storage 3.6TB OS Ubuntu 20.04.5 LTS 유효성 검증 모델 학습 및 검증 조건 개발 언어 Python 3.8.10 프레임워크 pytorch 1.13.1+cu117 학습 알고리즘 YOLO • YOLO는 대표적인 단일 단계 방식의 객체 탐지 알고리즘으로 CNN에서 발전하였으며, 최대한 단순화시켜 이미지를 인식 판별할 수 있음 학습 조건 epoch: 1, batch: 8, optimizer: adam 파일 형식 • 학습 데이터셋: JPG, JPEG • 평가 데이터셋: txt(json > txt로 변환) 전체 구축 데이터 대비
모델에 적용되는 비율AI모델 사용 이미지 비율(수량) - 100% (101,459장) 모델 학습 과정별
데이터 분류 및 비율 정보- Training Set 비율(수량) - 72.20% (73,256장) - Validation Set 비율 (수량) - 14.42%(14,627장) - Test Set 비율 (수량) - 13.38% (13,576장) -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 자재 바운딩박스 객체 인식 Object Detection YOLO mAP@IoU 0.5 45 % 77.6 % 2 굴착기 키포인트 객체 인식 Object Detection HRNet PCK 80 % 96.16 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1. 데이터 포맷
1. 데이터 포맷 종류 형식 동영상 mp4, avi 이미지 jpg,jpeg 위치궤적(활동) 데이터 txt, csv 등 2. 데이터 구성 및 어노테이션 포맷
가. 위치궤적 데이터_JSON2. 데이터 구성 및 어노테이션 포맷 가. 위치궤적 데이터_JSON NO 항목 타입 필수여부 한글명 영문명 1 기본 정보 information Object Y 1-1 연도 year String Y 1-2 파일 제작사 maker String N 1-3 날씨 weather String Y 2 파일 정보 file_info Object Y 2-1 파일명 filename String Y 2-2 날씨 weather String N 2-3 포인트 개수 number_of_points Number Y 2-4 시작시간 start_time String Y 3 구성요소 identities Array Y 3-1 {} - Object Y 3-1-1 장비종류 Type String Y 3-1-2 장비 식별 ID UID Number Y 3-1-3 장비 추가 설명 Desc String N 3-1-4 장비 용량 Capacity String N 3-1-5 장비 제조사 Maker Sring N 3-1-6 자동화굴착기 여부 MGMC boolean Y
나. 위치궤적데이터_CSV2. 데이터 구성 및 어노테이션 포맷 나. 위치궤적데이터_CSV NO 항목 타입 필수여부 한글명 영문명 1 장비종류 equipment_type String Y 2 장비종류별 일련번호 equipment_id Number Y 3 시간 timestamp String Y 4 위도 latitude Number Y 5 경도 longitude Number Y 6 고도 altitude Number N 7 신호성능 quality Number N 8 이동속도 velocity_gps Number Y 9 작업종류 workingtype Number N *언어 식별자
속성값 의미 excavator 굴착기 excavator 14t 굴착기14T hceexcavator 30t 굴착기 현대 30T excavator5t 굴착기 5T volexcavator30t 굴착기 볼보 30T forklift 지게차 concretecar 레미콘 earthanchor 어스앙카 pumpcar 펌프카 watersprinkler 살수차 trailer 트레일러 truck 그 외 트럭 truck2d5t 트럭 2.5T truck4d5t 트럭 4.5T truck5t 트럭 5T piledrivera 천공기 piledriverb 항타기 piledriverc 타공기 dump 덤프 crane 크레인 다. 자재 이미지데이터_JSON
2. 데이터 구성 및 어노테이션 포맷 다. 자재 이미지데이터_JSON NO 항목 타입 필수여부 한글명 영문명 1 사진 정보 information Object Y 1-1 파일명 filename String Y 1-2 사진 너비 정보 width integer Y 1-3 사진 높이 정보 height integer Y 2 가공 정보 annotations Object Y 2-1 폴리곤 값 polygon Array Y 2-2 클래스 정보 class String Y 라. 장비 및 자재 입출고 영상/자재 이미지 데이터
2. 데이터 구성 및 어노테이션 포맷 라. 장비 및 자재 입출고 영상/자재 이미지 데이터 NO 항목 타입 필수여부 한글명 영문명 1 사진 정보 information Object Y 1-1 파일명 filename String Y 1-2 사진 너비 정보 width Integer Y 1-3 사진 높이 정보 height Integer Y 2 가공 정보 annotations Object Y 2-1 박스 값 box Array Y 2-2 클래스 정보 class String Y 마. 굴착기 데이터
2. 데이터 구성 및 어노테이션 포맷 마. 굴착기 데이터 NO 항목 타입 필수여부 한글명 영문명 1 사진 정보 information Object Y 1-1 파일명 filename String Y 1-2 사진 너비 정보 width Integer Y 1-3 사진 높이 정보 height Integer Y 2 가공정보 annotations Object Y 2-1 박스 값 box Array Y 2-2 클래스 정보 class String Y 2-3 키 포인트 값 keypoint Array Y 2-4 클래스 정보 class String Y 3. 실제 예시
● 건설기계 위치/궤적 데이터(CSV, JSON)● 자재 이미지 라벨 데이터(JSON)
{ "images": [
{
"filename": "site7_brick_0001_20220712.jpg",
"width": 4032,
"height": 3024
}
],
"annotations": [
{
"polygon": [
1758,
(중략),
2883,
1614,
3006,
1633,
3024
],
"class": "brick"
}
]
}
● 입출입 자재/운송장비 데이터(JSON)
{ "images": [
{
"filename": "20220813_1 01.jpg",
"width": 1920,
"height": 1080
}
],
"annotations": [
{
"box": [
951,
445,
792,
635
],
"class": "truck"
},
{
"box": [
1109,
840,
560,
240
],
"class": " materials"
}
]
}● 굴착기 데이터(JSON)
{ "images": [
{
"filename": "site1_excavator_20220810_0001.jpg",
"width": 1920,
"height": 1080
}
],
"annotations": [
{
"box": [
148,
290,
350,
279
],
"class": "excavator"
},
{
"keypoint": [
462,
469,
2,
343,
486,
1,
212,
333,
1,
174,
437,
2,
239,
457,
2,
219,
454,
2
],
"class": "excavator"
}
]
}
-
데이터셋 구축 담당자
수행기관(주관) : 영신디엔씨
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 노동원 031-8027-9625 [email protected] 실무 책임자 수행기관(참여)
수행기관(참여) 기관명 담당업무 인피닉 이미지, 동영상 데이터 가공 건설기계부품연구원 위치궤적 데이터 가공 컨스퀘어 AI 모델 개발 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 노동원 031-8027-9625 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.