NEW 아동·청소년 상담데이터
- 분야한국어
- 유형 오디오 , 텍스트
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2024-10-30 데이터 최종 개방 1.0 2024-07-05 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-07-05 산출물 공개 Beta Version 소개
- 만7~12세 아동·청소년 3,596건의 신체적, 정신적 문제와 상황을 포괄한 7문항 18항목 이상의 상담데이터
구축목적
- 아동·청소년의 신체적, 정신적 건강 상태를 평가하고 다양한 문제를 이해하는데 도움을 주기 위한 목적으로 상담가 및 전문가들이 효과적으로 아동·청소년을 상담하고 지원하기 위함.
-
메타데이터 구조표 데이터 영역 한국어 데이터 유형 오디오 , 텍스트 데이터 형식 txt 데이터 출처 상담을 통한 음성 녹음 라벨링 유형 질의응답(자연어)/전사(음성) 라벨링 형식 json 데이터 활용 서비스 챗봇 서비스, 상담 기록 자동화, 상담 결과보고서 생성, 상담사 의사결정 지원, 학대 감지 및 위기 상황 예측 데이터 구축년도/
데이터 구축량2023년/3,596건 -
- 데이터 통계
- 데이터 구축 규모
7문항 18항목 이상 아동·청소년 상담데이터 3,596건데이터 구축 규모 성별 남 1,797 49.9% 여 1,799 50.1% 합계 3,596 100.0% 데이터 구축 규모 학년 저학년 1,788 49.7% 고학년 1,808 50.3% 합계 3,596 100.0% 데이터 구축 규모 유형 구분 일반아동 2,211 61.5% 시설거주아동 470 13.1% 저소득층 314 8.7% 다문화가정 124 3.4% 학대경험아동 477 13.3% 합계 3,596 100.0%
- 데이터 분포데이터 분포 위기
단계별
분포정상군 736 20.5% 관찰필요 701 19.5% 상담필요 705 19.6% 학대의심 717 19.9% 응급 737 20.5% 합계 3,596 100.0%
- 상담 문항 및 항목상담 문항 및 항목 1 신체적 불편감 통증 신체손상 2 기분문제 즐거움 분노/짜증 3 자율신경계 수면 4 대인관계 아버지 어머니 기타 보호자 형제/자매 친구 교사 5 기본생활 걱정 행복 미래/진로 6 학대여부 방임 정서학대 신체학대 성학대 7 응급 가정폭력 학교폭력 자해/자살 트라우마 가출 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드- 활용모델 (행동유형 분류)
- 모델 학습
사전학습 모델인 Wav2Vec2.0 과 RoBERTA를 사용하여 아동 상담 내용을 기반으로 학대 유형과 위기 단계를 분류하는 모델 개발.
아동의 음성 feature를 추출하고 음성에서 놓칠 수 있는 부분을 text feature로 보완하여 학습을 진행.모델 학습< 학습(Training) 검증(Validation) 시험(Test) 개요 - wav2vec2.0 pretrained model 사용
- RoBERTA pretrained model 사용학습 도중 모델 성과 평가 및 비교
- f1 score 측정모델학습 완료 후 모델 진행 데이터 비율(10) 8 (json 2876개) 1 (json 360개) 1 (json 360개) - 모델 파이프라인
- 서비스 활용 시나리오
행동 유형 분류 모델은 아동의 행동 패턴을 분석하여 상담사가 아동의 현재 상태를 더 정확하게 이해할 수 있게 도울 수 있는 서비스에 활용 가능
학교, 병원, 아동 보호 센터 등에서 아동의 심리 상태를 모니터링하고, 필요한 경우 전문가의 상담이나 개입을 신속하게 제공하는 시스템에 적용될 수 있음.- 활용모델 (학대유형 분류)
- 모델 학습
자연어처리에서 높은 성능을 보이는 Transformer 기반의 BERT모델을 보완하여 만든 RoBERTa를 사용하여 아동상담 내용을 기반으로 아동의 학대 유형을 분류하는 모델 개발
아동의 상담 내용이 기록되어 있는 json 파일을 사용하며, 상담 내용을 Encoding 하여 각 5개의 지정된 class 중 하나로 분류 (class : 신체학대, 성학대, 방임, 정서학대, 해당없음)모델 학습 학습(Training) 검증(Validation) 시험(Test) 개요 - wav2vec2.0 pretrained model 사용
- RoBERTA pretrained model 사용학습 도중 모델 성과 평가 및 비교
- f1 score 측정모델학습 완료 후 모델 진행 데이터 비율(10) 8 (json 2876개) 1 (json 360개) 1 (json 360개) - 모델 파이프라인
- 서비스 활용 시나리오
학대 유형 분류 모델은 상담 데이터를 통해 학대의 징후를 식별하고 확인하는 상담 서비스에 적용할 수 있음.
학교, 병원, 아동 보호 센터 등에서 아동의 심리 상태를 모니터링하고, 필요한 경우 전문가의 상담이나 개입을 신속하게 제공하는 시스템에 적용될 수 있음.- 활용모델 (위기단계 분류)
- 모델 학습
사전학습 모델인 Wav2Vec2.0 과 RoBERTA를 사용하여 아동 상담 내용을 기반으로 학대 유형과 위기 단계를 분류하는 모델 개발.
아동의 음성 feature를 추출하고 음성에서 놓칠 수 있는 부분을 text feature로 보완하여 학습을 진행.모델 학습 학습(Training) 검증(Validation) 시험(Test) 개요 - wav2vec2.0 pretrained model 사용
- RoBERTA pretrained model 사용학습 도중 모델 성과 평가 및 비교
- f1 score 측정모델학습 완료 후 모델 진행 데이터 비율(10) 8 (json 2876개) 1 (json 360개) 1 (json 360개) - 모델 파이프라인
- 서비스 활용 시나리오
위기 단계 분류 모델은 아동의 위기 수준을 평가하여 즉각적인 조치가 필요한 상황을 알리는 서비스에 적용할 수 있으며,
학교, 병원, 아동 보호 센터 등에서 아동의 심리 상태를 모니터링하고, 필요한 경우 전문가의 상담이나 개입을 신속하게 제공하는 시스템에 적용될 수 있음. -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드- 데이터 구성
데이터 구성 Key Description Type Child Type info 개인 정보 컨테이너 JSONObject ID 데이터 번호 String 성별 성별 String 나이 나이 Integer 학년 학년 String 유형구분 아동 분류 유형 String ... ... ... ... list 상담 내용 JSONArray 문항 상담 문항 String 문항합계 상담 문항의 점수 Integer 위기단계 위기 수준 평가 String list 설문조사 항목의 하위 목록 JSONArray 항목 설문조사의 구체적인 항목 String 임상가코멘트 임상가의 코멘트 JSONObject 점수 항목의 점수 Integer 문제요인 문제 요인 JSONObject ... ... ... ... audio 상담 문항별 오디오 정보 JSONArray type 질문/답변 구분 String wave 오디오 파일 이름 String text 텍스트 전사 내역 String start 발화 시작 시간 String end 발화 종료 시간 String
- 어노테이션 포맷데이터 통계 구분 속성명 타입 필수여부 설명 1 info Object 1-1 info.ID string Y 데이터셋고유번호 1-2 info.성별 string Y 데이터셋 성별 1-3 info.나이 number Y 데이터셋 나이 1-4 info.학년 string Y 데이터셋 학년 1-5 info.유형구분 string Y 내담자배경 1-6 info.가정환경 string Y 내담자가정환경 1-7 info.상담일자 datetime Y 상담일 1-8 info.평가일시 datetime Y 평가일 1-9 info.작성자(상담사) string Y 상담사 1-10 info.상호작용 특성(종합) string Y 내담자상담순응도 1-11 info.긴장 수준(종합) string Y 내담자긴장정도 1-12 info.행동 특성(종합) string Y 내담자외부적특성 1-13 info.위기단계 string Y 위기단계분류 1-14 info.합계점수 number Y 종합점수 1-15 info.학대의심 string Y 학대의심여부판단 1-16 info.행동특성 점수 number Y 외부적특성에 따른 점수 분류 1-17 info.임상가 종합소견 string Y 상담가 종합소견 2 list Object 2-1 list[].문항 string Y 상담영역 2-2 list[].문항합계 number Y 영역별점수합계 2-3 list[].위기단계 string Y 상담결과 3 list Object 3-1 list[].항목 string Y 세부상담영역 3-2 list[].임상가코멘트 string Y 임상가코멘트 3-3 list[].점수 number Y 코멘트별점수 4 audio Object 4-1 audio[].text string Y 대화내용 4-2 audio[].start string Y 발화시점 4-3 audio[].end string Y 발화종점
- 데이터 포맷데이터 포맷< ID 1234 상담일자 YYYY-MM-DD 위기단계 학대의심 정보 성별 여 평가일시 YYYY-MM-DD 합계점수 65 나이 7 작성자(상담사) 임상심리사 2급 학년 저학년 상호작용 특성 협조적 학대의심 성학대 유형구분 일반아동 긴장 수준 긴장하지 않음 행동특성 점수 1 가정환경 일반(핵가족 이상) 행동 특성 다리를 심하게 떤다 데이터 포맷 문항 항목 임상가 코멘트 점수 문항합계 위기단계 신체적 불편감 통증 통증에 관련된 특별한 문제가 없어보입니다. [0점] 0 7 상담필요 신체손상 자해 행동의 재발 가능성이 있습니다. [7점] 7 기분문제 즐거움 감정표현불능증의 가능성이 있습니다. [7점] 7 13 상담필요 분노/짜증 지속적인 스트레스 상황을 겪고 있을 수 있습니다. [5점] 5 자율신경계 수면 환경적 요인으로 충분한 수면의 어려움이 예상됩니다. [4점] 4 4 관찰필요 대인관계 아버지 혐오/무시의 감정을 경험하는 것으로 보입니다. [3점] 3 9 상담필요 어머니 혐오/무시의 감정을 경험하는 것으로 보입니다. [3점] 3 기타 보호자 - 형제/자매 형제 자매 간 불화가 잦은 것으로 보입니다. [3점] 3 친구 교우관계과 원만한 것으로 보입니다. [0점] 0 교사 담임 선생님과의 관계가 원만한 것으로 보입니다 [0점] 0 기본생활 걱정 스트레스 수준이 낮아 정신건강의 문제가 유추되지 않습니다. [0점] 0 4 관찰필요 행복 긍정심리자원(자아탄력성 등)이 충분 [0점] 0 미래/진로 도덕 규범, 윤리의식의 왜곡 상태일 수 있습니다. [4점] 4 학대여부 방임 적절한 돌봄을 받고 있는 것으로 여겨집니다. [0점] 0 5 학대의심 정서학대 정서적 학대의 징후가 유추되지 않습니다. [0점] 0 신체학대 신체적 학대의 징후가 유추되지 않습니다. [0점] 0 성학대 성적 학대의 가능성이 있는 상황이나 행위를 경험한 것으로 여겨집니다. [5점] 5 응급 가정폭력 가정폭력으로 격리조치, 또는 신고가 된 경험이 있어서 적절하고 적극적인 대처가 요구됨. [9점] 9 14 응급 학교폭력 학교 폭력을 경험하였으나 적절한 대처와 돌봄을 받고 있는 것으로 보입니다. [5점] 5 자해/자살 자해/자살의 징후가 유추되지 않습니다. [0점] 0 트라우마 유의한 외상의 징후가 유추되지 않습니다. [0점] 0 가출 유의한 가출경험 징후가 유추되지 않습니다. [0점] 0 임상가 종합소견 심각한 가정폭력으로 고통받고 있으며
- 예시본 -
조치가 필요해 보입니다.
- JSON 형식 (실제 예시)JSON 형식 (실제 예시) {
"version": 1,
"info": {
"ID": "0016",
"성별": "남",
"나이": 10,
"학년": "고학년",
"유형구분": "저소득",
"가정환경": "일반(핵가족 이상)",
"상담일자": "2023-08-14",
"평가일시": "2023-08-14",
"작성자(상담사)": "임상심리사 2급",
"상호작용 특성(종합)": "협조적",
"긴장 수준(종합)": "보통",
"행동 특성(종합)": "||",
"위기단계": "관찰필요",
"합계점수": 13,
"학대의심": "(해당 없음)",
"행동특성 점수": 0,
"임상가 종합소견": "상담을 종합해 보면 통증 및 신체적 문제와는 관련이 없으며, 긍정적인 정서와 건강한 관계를 형성하고 있는 것으로 보입니다. 지속적인 스트레스 상황과 형제 자매 간의 불화가 부모님의 태도로 인해 분노를 유발하는 것으로 나타납니다. 높은 스트레스 수준으로 사회적 지지와 개입이 필요할 수 있습니다."
},
"list": [
{
"문항": "신체적 불편감",
"문항합계": 0,
"위기단계": "정상군",
"list": [
{
"항목": "통증",
"임상가코멘트": {
"val": "① 통증에 관련된 특별한 문제가 없어보입니다. [0점]"
},
"점수": 0,
"문제요인": {
"val": "없음"
},
"audio": [
{
"type": "Q",
"text": "최근에 아픈 곳이 있었니?",
"wave": "all.wav",
"start": "00:00.000",
"end": "00:02.230"
},
{
"type": "A",
"text": "최근에 아픈 적은 없어요.",
"wave": "all.wav",
"start": "00:03.680",
"end": "00:05.780"
}
]
}, -
데이터셋 구축 담당자
수행기관(주관) : 사단법인 한국폭력학대예방협회
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 이희엽 이사장 02-598-1477 [email protected] 총괄책임 수행기관(참여)
수행기관(참여) 기관명 담당업무 경기대학교 산학협력단 데이터 설계를 위한 문항 및 항목 설계, 시나리오 설계 및 척도개발 ㈜아크릴 모델학습, 저작도구 개발 등 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 임종순 02-598-1477 [email protected] 승재우 02-598-1477 [email protected] AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 김종희 02-558-4958 [email protected] 박지원 02-558-4958 [email protected] 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 김종희 02-558-4958 [email protected] 박지원 02-558-4958 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.