NEW 기반암 시추 시료를 이용한 암반 등급 분류 데이터
- 분야재난안전환경
- 유형 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2024-10-30 데이터 최종 개방 1.0 2024-06-28 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-06-28 산출물 공개 Beta Version 소개
- 기반암 시추 시료로부터 암종 분류/절리 탐지 임무를 수행하기 위한 기반암 시추 시료 이미지 및 라벨링 데이터 셋으로, 1) 국내 지질 환경에 맞는 대표 암종에 대한 분류와 2) 절리/단층 탐지를 위한 폴리곤 세그멘테이션 라벨링 정보 및 30여 개의 메타 정보 데이터
구축목적
- 기반암 시추 시료를 이용해 암반등급 분류 데이터를 구축하기 위해 시추 코어 상자의 정보를 데이터베이스화하고, 암반등급 평가에 필요한 항목을 추출하여 자동으로 분석할 수 있는 AI 모델의 학습데이터를 구축하는 것이 주목적임
-
메타데이터 구조표 데이터 영역 재난안전환경 데이터 유형 이미지 데이터 형식 JPG 데이터 출처 자체 수집 라벨링 유형 객체 분류(Classification), 폴리곤 세그멘테이션 라벨링 형식 JSON 데이터 활용 서비스 시료 수집 시 암종 품질 판단 자동화 데이터 구축년도/
데이터 구축량2023년/661,425 -
- 데이터 구축 규모
데이터 구축 규모 구분 데이터 형태 목표 구축 수량 달성율 기반암 암종 분류 데이터 기반암 암종 분류 이미지(JPG) 550,000 550,080 100% 라벨링 데이터(JSON) 550,000 550,080 100% 기반암 절리 탐지 데이터 기반암 절리 탐지 이미지(JPG) 110,000 111,345 101% 라벨링 데이터(JSON) 110,000 111,345 101% - 데이터 분포
데이터 분포 구분 Lv1 구축 수량 비율 기반암 암종 분류 데이터 화성암 231,973 42.20% 변성암 249,152 45.30% 퇴적암 68,955 12.50% 소계 550,080 100% 기반암 절리 탐지 데이터 화성암 45,620 41.00% 변성암 51,766 46.50% 퇴적암 13,959 12.50% 소계 111,345 100% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드- 활용 모델
ㅇ 개요활용 모델 데이터명 AI모델 task AI모델 지질 분류 ResNet (암종) 분류 데이터 절리/단층 탐지 데이터 AI모델 task AI모델 세그멘테이션 Deeplab V3 ㅇ 모델 1 : 암종 분류 데이터셋 활용 모델 – Resnet
● 본 모델의 임무는 시추 암반의 종류를 분류하기 위한 Image classification 모델로, 암반이미지의 특징 및 패턴을 학습하여 입력받은 이미지가 어떤 종류의 암반인지를 판단하여 각 클래스 별 가장 높은 확률의 클래스로 분류하는 모델임.
● Json파일 내에는 파일명에 상응하는 이미지 데이터가 어떤 종류의 암반인지를 나타내는 라벨이 포함되어 있음.ㅇ 모델 2 : 절리탐지 데이터셋 활용 모델 – Deeplab V3
● 본 모델의 임무는 시추 암반 내 절리를 찾기 위한 semantic segmentation모델로, 이미지 데이터 내 절리의 픽셀에 클래스를 할당하는 작업을 수행함. 절리에 해당하는 픽셀과 그렇지 않은 영역을 구분하여 값을 할당하며 학습이 완료된 모델은 평가데이터를 입력받았을 때 절리로 추정되는 영역을 픽셀단위로 표현할 수 있음.
● Json파일 내에는 이미지 데이터 내 절리의 위치와 모양을 나타내는 좌표가 포함되어 있음. 해당 좌표들이 연결되어 생성되는 폴리곤을 마스킹하여 이미지 데이터와 동일한 모양의 마스크 이미지를 생성하며, 이 마스크 이미지를 라벨로써 활용함.ㅇ 서비스 활용 시나리오 : AI 기반 암반 등급 평가 자동화
● 현재 시추 후 지질/암반 등급 평가에 대한 평가 기준이 기관마다 조금씩 상이하며 표준화된 데이터셋이 미비하기 때문에, 평가자마다 주관이 많이 개입된다는 문제점이 있음
● 가장 대중적인 암반분류는 RMR(Rock Mass Rating)으로, 암반의 강도, RQD(Rock Quality Designation), 절리간격, 절리상태, 지하수 등 5가지 요인으로 등급을 평가하며, 그 중 RQD와 절 리간격이 전체점수의 40%를 차지하므로 절리를 명확히 구분하고 지질(암종)을 판단하는 평가 인자로 활용됨
● 추후 암반의 강도, 절리상태, 지하수 등의 요인을 판단하는 AI 모델을 개발하는 과업이 진행되어야 하며, 최종 목적은 암반등급을 평가하는 대부분 항목을 숙련된 기술자의 작업 대신 AI 작업으로 대체하여 판정 시간을 단축하고 정확도를 향상하는 데 있음
● 향후 시추조사와 물리탐사(전기비저항탐사, 전자 탐사 등)를 종합하여 지하의 암반등급도 작성 시 기초자료로 활용
● 터널 설계 및 시공 시 암반등급도를 활용하여 객관적인 정보 제공(암반등급에 따라 지반보강패턴, 공사 기간, 공사 방법, 공사비 산정 시 활용) -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드- 데이터 구성
ㅇ 데이터 셋 종류
● 암종 분류 데이터셋 : 국내 대표 암종에(화성암/변성암/퇴적암) 대한 분류(Classification) 데이터
● 절리 탐지 데이터셋 : 절리/단층 영역 식별 및 탐지를 위한 폴리곤 세그멘테이션(Polygon Segementation) 데이터
ㅇ 원천 데이터
● 암종 분류, 절리 탐지를 위해 기반암 시추 시료로부터 화성암/변성암/퇴적암에 해당하는 시료 이미지 데이터 수집
ㅇ 라벨링 데이터
● 암종 분류를 위한 화성암/변성암/퇴적암 3 Class의 객체 분류
● 절리 탐지를 위한 절리 영역에 대한 폴리곤 세그멘테이션- 어노테이션 포맷
ㅇ 암종 분류 데이터셋 JSON 포맷암종 분류 데이터셋 JSON 포맷 구분 속성명 타입 필수
여부설명 범위 비고 1 object_id string Y 원천 데이터 파일명
현장명-시추공번(시료상자번호)-
(암종구분1)-(암종구분2)-촬영각도
(회전각도)-습윤건조조건-
촬영조도-이미지저장순서055-NTB10(1)-R02-01-
90(NA)-D-1-082 width int Y 이미지 너비 1920 3 height int Y 이미지 높이 250 4 box_no int Y 시추 상자 번호 1 5 year int Y 시추 연도 2022 6 drilling_place1 string N 채취 위치
(주소)시군구(읍면동) 7 drilling_place2 string N 채취 위치
(위경도)위도,경도 8 hole_num string Y 시추공 번호 BH01 등 9 row_num int Y 시추 열 번호 1, 2, 3... 10 ers string N 전기비저항탐사
구간 구분 명호남고속철도 2단계
(고막원-목포)제 4-5공구 등,
해당없음11 camera_type string Y 카메라 타입
(제조사-모델)Sony-a6400,
ILCE640012 camera_angle int Y 각도(°) 90 13 rotation_angle string Y 1m 내 무절리 시추코어
발견 시 회전 각도0~300 NA(*무절리코어아님) 14 shoot_height string Y 촬영 높이 1m 15 f-stop float Y 조리개값(f.) 8 16 shutter_speed string Y 셔터속도(sec) 1/80 17 ISO int Y 감도(iso) 500 18 lux int Y 조도(Lux) 4500, 8000, 13000 19 location string Y 촬영지
(한국지질자원연구원/
GSTA/광해광업)한국지질자원연구원,
GSTA 등20 humidity string Y 습윤 정도
(건조/습윤)습윤, 건조 21 rock_depth float Y 심도
(0~500m 이상)47.5, 50 등 22 rock_strength string Y 암반 강도
(S1~S5)값) S0, S1, S2, S3, S4, S5,
S0~5, S1~3, S2~4, S3~4,
S3~5 등
S0 : 판독불가, S1:매우강함,
S2:강함, S3:보통강함,
S4:약함, S5:매우약함
최소값 S0부터 최대값 S5
까지 복합적인 암반 강도를
지닌 암석에 대해서는
’S0~5’의 형식으로 표기함23 tcr string Y 코어회수율(Core Recovery)
(0~100%)0-100 % 24 rqd string Y 암질지수(Rock Quality Designation)
(0~100%)0-100 % 25 rmr num Y 암반등급(Rock Mass Rating) 1~5 26 rq string Y 품질분석(Rock Quality) 절리, 무절리, 판독불가 27 rjr string Y 거칠기 신선
완만
거침
없음
판독불가28 fm string Y 충전물(Filling Material)
(연한 충전물, 단단한 충전물, 없음)모래
모래 및 방해석피복
모래 및 산화철피복
모래 및 암편
모래 및 점토
방해서피복
산화철피복
실트
실트 및 방해석피복
실트 및 산화철피복
실트 및 암편
실트 및 점토
암편
점토
점토 및 방해석피복
점토 및 산화철피복
점토 및 암편
없음
판독불가29 rw string Y 풍화(Rock Weathering)
(매우심한풍화, 심한풍화, 보통풍화 등)값) D0, D1, D2, D3, D4, D5,
D0~5, D1~3, D2~4, D3~4,
D3~5 등
D0:판독불가 D1:신선,
D2:약간풍화, D3:보통풍화,
D4:심한풍화, D5:매우심한
풍화
최소값 D0부터 최대값 D5
까지 복합적인 풍화상태를
지닌 암석에 대해서는
’D0~5’의 형식으로 표기함30 geo_structure string Y 지질구조
(단층, 절리)공동
일부공동
단층대
단층영향대
단층파쇄대
산성맥
석영맥
염기성암맥
차별풍화대
파쇄대
해당없음31 rock_type array Y 암종구분 [{rockType1 : 화성암, 변성암,
퇴적암}. {rockType2 :
화강암, 편마암, 사암 등}, {}]32 rock_type1 string Y 암종 1
(화성암, 변성암, 퇴적암)화성암, 변성암, 퇴적암 33 rock_type2 string Y 암종 2
(화강암, 편마암, 사암 등)화강암, 섬록암, 반려암,
유문암, 안산암, 현무암,
응회암, 편마암, 편암,
천매암, 슬레이트, 규암,
대리암, 역암, 사암, 이암,
셰일, 석회암, 백운암ㅇ 절리 탐지 데이터셋 JSON 포맷
절리 탐지 데이터셋 JSON 포맷 구분 속성명 타입 필수
여부설명 범위 비고 1 object_id string Y 원천 데이터 파일명 055-NTB10(1)-R02-01-
90(NA)-D-1-082 width int Y 이미지 너비 1920 3 height int Y 이미지 높이 250 4 box_no int Y 시추 상자 번호 1 5 year int Y 시추 연도 2022 6 drilling_place1 string N 채취 위치
(주소)시군구 7 drilling_place2 string N 채취 위치
(위경도)위도,경도 8 hole_num string Y 시추공 번호 BH01 등 9 row_num int Y 시추 열 번호 1, 2, 3... 10 ers string N 전기비저항탐사
구간 구분 명호남고속철도 2단계(고막원-
목포)제 4-5공구 등,
해당없음11 camera_type string Y 카메라 타입
(제조사-모델)Sony-a6400, ILCE6400 12 camera_angle int Y 각도(°) 90 13 shoot_height string Y 촬영 높이 1m 14 f-stop float Y 조리개값(f.) 8 15 shutter_speed string Y 셔터속도(sec) 1/80 16 ISO int Y 감도(iso) 500 17 lux int Y 조도(Lux) 4500, 8000, 13000 18 location string Y 촬영지
(한국지질자원연구원/
GSTA/광해광업)한국지질자원연구원,
GSTA 등19 humidity string Y 습윤 정도
(건조/습윤)습윤, 건조 20 rock_depth float Y 심도
(0~500m 이상)47.5, 50 등 21 rock_strength string Y 암반 강도
(S1~S5)값) S0, S1, S2, S3, S4, S5, S0~5, S1~3, S2~4, S3~4, S3~5 등
S0 : 판독불가, S1:매우강함,
S2:강함,
S3:보통강함,
S4:약함, S5:매우약함
최소값 S0부터 최대값 S5까지 복합적인 암반강도를 지닌 암석에 대해서는 ’S0~5’의 형식으로 표기함22 tcr string Y 코어회수율(Core Recovery)
(0~100%)0-100 % 23 rqd string Y 암질지수
(Rock Quality Designation)
(0~100%)0-100 % 24 rmr int Y 암반등급(Rock Mass Rating) 1~5 25 rq string Y 품질분석(Rock Quality) 절리, 무절리, 판독불가 26 rjr string Y 거칠기 신선
완만
거침
없음
판독불가27 fm string Y 충전물(Filling Material)
(연한 충전물, 단단한 충전물,
없음)모래
모래 및 방해석피복
모래 및 산화철피복
모래 및 암편
모래 및 점토
방해서피복
산화철피복
실트
실트 및 방해석피복
실트 및 산화철피복
실트 및 암편
실트 및 점토
암편
점토
점토 및 방해석피복
점토 및 산화철피복
점토 및 암편
없음
판독불가28 rw string Y 풍화(Rock Weathering)
(매우심한풍화, 심한풍화,
보통풍화 등)값) D0, D1, D2, D3, D4, D5, D0~5, D1~3, D2~4, D3~4, D3~5 등
D0:판독불가
D1:신선, D2:약간풍화, D3:보통풍화, D4:심한풍화, D5:매우심한풍화
최소값 D0부터 최대값 D5까지 복합적인 풍화상태를 지닌 암석에 대해서는 ’D0~5’의 형식으로 표기함29 geo_structure string Y 지질구조
(단층, 절리)공동
일부공동
단층대
단층영향대
단층파쇄대
산성맥
석영맥
염기성암맥
차별풍화대
파쇄대
해당없음30 rock_type array Y 암종구분 [{rockType1 : 화성암, 변성암,
퇴적암}. {rockType2 : 화강암,
편마암, 사암 등}, {}]31 rock_type1 string Y 암종 1
(화성암, 변성암, 퇴적암)화성암, 변성암, 퇴적암 32 rock_type2 string Y 암종 2
(화강암, 편마암, 사암 등)화강암, 섬록암, 반려암,
유문암, 안산암, 현무암,
응회암, 편마암, 편암,
천매암, 슬레이트, 규암,
대리암, 역암, 사암, 이암,
셰일, 석회암, 백운암33 type string Y 폴리곤 타입 polygon 34 vertices array Y 폴리곤 좌표 35 x number Y x 좌표 1092.321... 36 y number Y y 좌표 340.123... ... ... number Y ... - 데이터 포맷 및 예시
ㅇ 이미지 예시이미지 예시 구 분 이미지(포맷 : JPG) 특성 암종 화성암 높은 강도와 밀도 퇴적암 상대적으로 낮은 강도와 밀도 변성암 변성과정에 따라 강도와 밀도 변형 ㅇ 라벨링 데이터 예시
-
데이터셋 구축 담당자
수행기관(주관) : 주식회사 에스티엔
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 김종식 042-861-5330 [email protected] AI 개발 수행기관(참여)
수행기관(참여) 기관명 담당업무 어니컴 주식회사 품질 검증 주식회사 에스티엔 AI 모델 학습, 실증 주식회사 지에스티에이 데이터 수집, 정제 한국지질자원연구원 데이터 정제, 검사, 홍보 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 에스티엔 김종식 대표 042-861-5330 [email protected] 에스티엔 정다운 팀장 070-8831-9984 [email protected] AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 에스티엔 김종식 대표 042-861-5330 [email protected] 에스티엔 정다운 팀장 070-8831-9984 [email protected] 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 에스티엔 김종식 대표 042-861-5330 [email protected] 에스티엔 정다운 팀장 070-8831-9984 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.