AI-Hub

#상담(아동청소년) #자연어 #음성

NEW 아동·청소년 상담데이터

분야한국어
유형 오디오 , 텍스트

구축년도 : 2023 갱신년월 : 2024-10 조회수 : 5,438 다운로드 : 343 용량 :

샘플 데이터

※샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

소개 파일 목록 (API 다운로드)

※ 내국인만 데이터 신청이 가능합니다.

문의하기 목록

데이터 변경이력

데이터 변경이력
버전	일자	변경내용	비고
1.1	2024-10-30	데이터 최종 개방
1.0	2024-07-05	데이터 개방	Beta Version

데이터 히스토리

데이터 히스토리
일자	변경내용	비고
2024-07-05	산출물 공개	Beta Version

소개

- 만7~12세 아동·청소년 3,596건의 신체적, 정신적 문제와 상황을 포괄한 7문항 18항목 이상의 상담데이터

구축목적

- 아동·청소년의 신체적, 정신적 건강 상태를 평가하고 다양한 문제를 이해하는데 도움을 주기 위한 목적으로 상담가 및 전문가들이 효과적으로 아동·청소년을 상담하고 지원하기 위함.

메타데이터 구조표
데이터 영역	한국어	데이터 유형	오디오 , 텍스트
데이터 형식	txt	데이터 출처	상담을 통한 음성 녹음
라벨링 유형	질의응답(자연어)/전사(음성)	라벨링 형식	json
데이터 활용 서비스	챗봇 서비스, 상담 기록 자동화, 상담 결과보고서 생성, 상담사 의사결정 지원, 학대 감지 및 위기 상황 예측	데이터 구축년도/ 데이터 구축량	2023년/3,596건

- 데이터 통계
- 데이터 구축 규모
7문항 18항목 이상 아동·청소년 상담데이터 3,596건

데이터 구축 규모
성별	남	1,797	49.9%
성별	여	1,799	50.1%
합계		3,596	100.0%

데이터 구축 규모
학년	저학년	1,788	49.7%
학년	고학년	1,808	50.3%
합계		3,596	100.0%

데이터 구축 규모
유형 구분	일반아동	2,211	61.5%
	시설거주아동	470	13.1%
	저소득층	314	8.7%
	다문화가정	124	3.4%
	학대경험아동	477	13.3%
합계		3,596	100.0%

- 데이터 분포

데이터 분포
위기 단계별 분포	정상군	736	20.5%
	관찰필요	701	19.5%
	상담필요	705	19.6%
	학대의심	717	19.9%
	응급	737	20.5%
합계		3,596	100.0%

- 상담 문항 및 항목

상담 문항 및 항목
1	신체적 불편감	통증
		신체손상
2	기분문제	즐거움
		분노/짜증
3	자율신경계	수면
4	대인관계	아버지
		어머니
		기타 보호자
		형제/자매
		친구
		교사
5	기본생활	걱정
		행복
		미래/진로
6	학대여부	방임
		정서학대
		신체학대
		성학대
7	응급	가정폭력
		학교폭력
		자해/자살
		트라우마
		가출

저작도구 설명서 및 저작도구 다운로드
저작도구 설명서 다운로드 저작도구 다운로드

AI 모델 상세 설명서 다운로드

AI 모델 상세 설명서 다운로드 AI 모델 다운로드

- 활용모델 (행동유형 분류)

- 모델 학습
사전학습 모델인 Wav2Vec2.0 과 RoBERTA를 사용하여 아동 상담 내용을 기반으로 학대 유형과 위기 단계를 분류하는 모델 개발.
아동의 음성 feature를 추출하고 음성에서 놓칠 수 있는 부분을 text feature로 보완하여 학습을 진행.

모델 학습<
	학습(Training)	검증(Validation)	시험(Test)
개요	- wav2vec2.0 pretrained model 사용 - RoBERTA pretrained model 사용	학습 도중 모델 성과 평가 및 비교 - f1 score 측정	모델학습 완료 후 모델 진행
개요		학습 도중 모델 성과 평가 및 비교 - f1 score 측정	모델학습 완료 후 모델 진행
데이터 비율(10)	8 (json 2876개)	1 (json 360개)	1 (json 360개)

- 모델 파이프라인

- 서비스 활용 시나리오
행동 유형 분류 모델은 아동의 행동 패턴을 분석하여 상담사가 아동의 현재 상태를 더 정확하게 이해할 수 있게 도울 수 있는 서비스에 활용 가능
학교, 병원, 아동 보호 센터 등에서 아동의 심리 상태를 모니터링하고, 필요한 경우 전문가의 상담이나 개입을 신속하게 제공하는 시스템에 적용될 수 있음.

- 활용모델 (학대유형 분류)

- 모델 학습
자연어처리에서 높은 성능을 보이는 Transformer 기반의 BERT모델을 보완하여 만든 RoBERTa를 사용하여 아동상담 내용을 기반으로 아동의 학대 유형을 분류하는 모델 개발
아동의 상담 내용이 기록되어 있는 json 파일을 사용하며, 상담 내용을 Encoding 하여 각 5개의 지정된 class 중 하나로 분류 (class : 신체학대, 성학대, 방임, 정서학대, 해당없음)

모델 학습
	학습(Training)	검증(Validation)	시험(Test)
개요	- wav2vec2.0 pretrained model 사용 - RoBERTA pretrained model 사용	학습 도중 모델 성과 평가 및 비교 - f1 score 측정	모델학습 완료 후 모델 진행
개요		학습 도중 모델 성과 평가 및 비교 - f1 score 측정	모델학습 완료 후 모델 진행
데이터 비율(10)	8 (json 2876개)	1 (json 360개)	1 (json 360개)

- 모델 파이프라인
모델2. BERT 이미지

- 서비스 활용 시나리오

학대 유형 분류 모델은 상담 데이터를 통해 학대의 징후를 식별하고 확인하는 상담 서비스에 적용할 수 있음.
학교, 병원, 아동 보호 센터 등에서 아동의 심리 상태를 모니터링하고, 필요한 경우 전문가의 상담이나 개입을 신속하게 제공하는 시스템에 적용될 수 있음.

- 활용모델 (위기단계 분류)

모델 학습
	학습(Training)	검증(Validation)	시험(Test)
개요	- wav2vec2.0 pretrained model 사용 - RoBERTA pretrained model 사용	학습 도중 모델 성과 평가 및 비교 - f1 score 측정	모델학습 완료 후 모델 진행
개요		학습 도중 모델 성과 평가 및 비교 - f1 score 측정	모델학습 완료 후 모델 진행
데이터 비율(10)	8 (json 2876개)	1 (json 360개)	1 (json 360개)

- 모델 파이프라인

모델3. XGBoost 이미지

- 서비스 활용 시나리오
위기 단계 분류 모델은 아동의 위기 수준을 평가하여 즉각적인 조치가 필요한 상황을 알리는 서비스에 적용할 수 있으며,
학교, 병원, 아동 보호 센터 등에서 아동의 심리 상태를 모니터링하고, 필요한 경우 전문가의 상담이나 개입을 신속하게 제공하는 시스템에 적용될 수 있음.

설명서 및 활용가이드 다운로드

데이터 설명서 다운로드 구축활용가이드 다운로드

- 데이터 구성

데이터 구성
Key	Description	Type	Child Type
info	개인 정보 컨테이너	JSONObject
ID	데이터 번호	String
성별	성별	String
나이	나이	Integer
학년	학년	String
유형구분	아동 분류 유형	String
...	...	...	...
list	상담 내용	JSONArray
문항	상담 문항	String
문항합계	상담 문항의 점수	Integer
위기단계	위기 수준 평가	String
list	설문조사 항목의 하위 목록	JSONArray
항목	설문조사의 구체적인 항목	String
임상가코멘트	임상가의 코멘트	JSONObject
점수	항목의 점수	Integer
문제요인	문제 요인	JSONObject
...	...	...	...
audio	상담 문항별 오디오 정보	JSONArray
type	질문/답변 구분	String
wave	오디오 파일 이름	String
text	텍스트 전사 내역	String
start	발화 시작 시간	String
end	발화 종료 시간	String

- 어노테이션 포맷

데이터 통계
구분	속성명	타입	필수여부	설명
1	info	Object
1-1	info.ID	string	Y	데이터셋고유번호
1-2	info.성별	string	Y	데이터셋 성별
1-3	info.나이	number	Y	데이터셋 나이
1-4	info.학년	string	Y	데이터셋 학년
1-5	info.유형구분	string	Y	내담자배경
1-6	info.가정환경	string	Y	내담자가정환경
1-7	info.상담일자	datetime	Y	상담일
1-8	info.평가일시	datetime	Y	평가일
1-9	info.작성자(상담사)	string	Y	상담사
1-10	info.상호작용 특성(종합)	string	Y	내담자상담순응도
1-11	info.긴장 수준(종합)	string	Y	내담자긴장정도
1-12	info.행동 특성(종합)	string	Y	내담자외부적특성
1-13	info.위기단계	string	Y	위기단계분류
1-14	info.합계점수	number	Y	종합점수
1-15	info.학대의심	string	Y	학대의심여부판단
1-16	info.행동특성 점수	number	Y	외부적특성에 따른 점수 분류
1-17	info.임상가 종합소견	string	Y	상담가 종합소견
2	list	Object
2-1	list[].문항	string	Y	상담영역
2-2	list[].문항합계	number	Y	영역별점수합계
2-3	list[].위기단계	string	Y	상담결과
3	list	Object
3-1	list[].항목	string	Y	세부상담영역
3-2	list[].임상가코멘트	string	Y	임상가코멘트
3-3	list[].점수	number	Y	코멘트별점수
4	audio	Object
4-1	audio[].text	string	Y	대화내용
4-2	audio[].start	string	Y	발화시점
4-3	audio[].end	string	Y	발화종점

- 데이터 포맷

데이터 포맷<
ID	1234		상담일자	YYYY-MM-DD	위기단계	학대의심
정보	성별	여	평가일시	YYYY-MM-DD	합계점수	65
	나이	7	작성자(상담사)	임상심리사 2급	합계점수	65
	학년	저학년	상호작용 특성	협조적	학대의심	성학대
	유형구분	일반아동	긴장 수준	긴장하지 않음	행동특성 점수	1
	가정환경	일반(핵가족 이상)	행동 특성	다리를 심하게 떤다	행동특성 점수	1

데이터 포맷
문항	항목	임상가 코멘트	점수	문항합계	위기단계
신체적 불편감	통증	통증에 관련된 특별한 문제가 없어보입니다. [0점]	0	7	상담필요
신체적 불편감	신체손상	자해 행동의 재발 가능성이 있습니다. [7점]	7	7	상담필요
기분문제	즐거움	감정표현불능증의 가능성이 있습니다. [7점]	7	13	상담필요
기분문제	분노/짜증	지속적인 스트레스 상황을 겪고 있을 수 있습니다. [5점]	5	13	상담필요
자율신경계	수면	환경적 요인으로 충분한 수면의 어려움이 예상됩니다. [4점]	4	4	관찰필요
대인관계	아버지	혐오/무시의 감정을 경험하는 것으로 보입니다. [3점]	3	9	상담필요
	어머니	혐오/무시의 감정을 경험하는 것으로 보입니다. [3점]	3
	기타 보호자	-
	형제/자매	형제 자매 간 불화가 잦은 것으로 보입니다. [3점]	3
	친구	교우관계과 원만한 것으로 보입니다. [0점]	0
	교사	담임 선생님과의 관계가 원만한 것으로 보입니다 [0점]	0
기본생활	걱정	스트레스 수준이 낮아 정신건강의 문제가 유추되지 않습니다. [0점]	0	4	관찰필요
	행복	긍정심리자원(자아탄력성 등)이 충분 [0점]	0
	미래/진로	도덕 규범, 윤리의식의 왜곡 상태일 수 있습니다. [4점]	4
학대여부	방임	적절한 돌봄을 받고 있는 것으로 여겨집니다. [0점]	0	5	학대의심
	정서학대	정서적 학대의 징후가 유추되지 않습니다. [0점]	0
	신체학대	신체적 학대의 징후가 유추되지 않습니다. [0점]	0
	성학대	성적 학대의 가능성이 있는 상황이나 행위를 경험한 것으로 여겨집니다. [5점]	5
응급	가정폭력	가정폭력으로 격리조치, 또는 신고가 된 경험이 있어서 적절하고 적극적인 대처가 요구됨. [9점]	9	14	응급
	학교폭력	학교 폭력을 경험하였으나 적절한 대처와 돌봄을 받고 있는 것으로 보입니다. [5점]	5
	자해/자살	자해/자살의 징후가 유추되지 않습니다. [0점]	0
	트라우마	유의한 외상의 징후가 유추되지 않습니다. [0점]	0
	가출	유의한 가출경험 징후가 유추되지 않습니다. [0점]	0

임상가 종합소견
임상가 종합소견
심각한 가정폭력으로 고통받고 있으며 - 예시본 - 조치가 필요해 보입니다.

- JSON 형식 (실제 예시)

JSON 형식 (실제 예시)
{ "version": 1, "info": { "ID": "0016", "성별": "남", "나이": 10, "학년": "고학년", "유형구분": "저소득", "가정환경": "일반(핵가족 이상)", "상담일자": "2023-08-14", "평가일시": "2023-08-14", "작성자(상담사)": "임상심리사 2급", "상호작용 특성(종합)": "협조적", "긴장 수준(종합)": "보통", "행동 특성(종합)": "\|\|", "위기단계": "관찰필요", "합계점수": 13, "학대의심": "(해당 없음)", "행동특성 점수": 0, "임상가 종합소견": "상담을 종합해 보면 통증 및 신체적 문제와는 관련이 없으며, 긍정적인 정서와 건강한 관계를 형성하고 있는 것으로 보입니다. 지속적인 스트레스 상황과 형제 자매 간의 불화가 부모님의 태도로 인해 분노를 유발하는 것으로 나타납니다. 높은 스트레스 수준으로 사회적 지지와 개입이 필요할 수 있습니다." }, "list": [ { "문항": "신체적 불편감", "문항합계": 0, "위기단계": "정상군", "list": [ { "항목": "통증", "임상가코멘트": { "val": "① 통증에 관련된 특별한 문제가 없어보입니다. [0점]" }, "점수": 0, "문제요인": { "val": "없음" }, "audio": [ { "type": "Q", "text": "최근에 아픈 곳이 있었니?", "wave": "all.wav", "start": "00:00.000", "end": "00:02.230" }, { "type": "A", "text": "최근에 아픈 적은 없어요.", "wave": "all.wav", "start": "00:03.680", "end": "00:05.780" } ] },

데이터셋 구축 담당자

수행기관(주관) : 사단법인 한국폭력학대예방협회

수행기관(주관)
책임자명	전화번호	대표이메일	담당업무
이희엽 이사장	02-598-1477	[email protected]	총괄책임

수행기관(참여)

수행기관(참여)
기관명	담당업무
경기대학교 산학협력단	데이터 설계를 위한 문항 및 항목 설계, 시나리오 설계 및 척도개발
㈜아크릴	모델학습, 저작도구 개발 등

데이터 관련 문의처

데이터 관련 문의처
담당자명	전화번호	이메일
임종순	02-598-1477	[email protected]
승재우	02-598-1477	[email protected]

AI모델 관련 문의처

AI모델 관련 문의처
담당자명	전화번호	이메일
김종희	02-558-4958	[email protected]
박지원	02-558-4958	[email protected]

저작도구 관련 문의처

저작도구 관련 문의처
담당자명	전화번호	이메일
김종희	02-558-4958	[email protected]
박지원	02-558-4958	[email protected]

보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청

인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석
1. AI 허브 접속
  신청자
2. 안심존
  사용신청신청자신청서류 제출*
3. 심사구축기관
4. 승인구축기관
5. 데이터 분석 활용신청자
6. 분석모델반출신청자
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.

파일 목록

전체 다운로드 AI 허브 Shell 다운로드 AI 허브 오픈 API 이용안내

연관 데이터

전문분야 영-한·중-한 번역 말뭉치 (식품)

방송콘텐츠 한국어-아시아어 번역 말뭉치

외부 지식 기반 멀티모달 질의응답 데이터

일상생활 및 구어체 한-영 번역 병렬 말뭉치 데이터

AI 허브 데이터 활용을 위한 기계 번역앱 구축과 번역기 평가 및 신규 말뭉치 구축

기계독해

기계번역 품질 검증 데이터

라이브 스트리밍 영상 영어 통번역 데이터

NEW 아동·청소년 상담데이터

데이터 개요

데이터 변경이력

데이터 히스토리

소개

구축목적

메타데이터 구조표

데이터 통계

교육활용 동영상

저작도구

저작도구 설명서 및 저작도구 다운로드

활용 AI 모델 및 코드

AI 모델 상세 설명서 다운로드

어노테이션 포맷 및 데이터 구조

설명서 및 활용가이드 다운로드

구축 업체

데이터셋 구축 담당자

수행기관(주관) : 사단법인 한국폭력학대예방협회

수행기관(참여)

데이터 관련 문의처

AI모델 관련 문의처

저작도구 관련 문의처

안심존 소개

안심존 이용절차

안심존사용신청서 및 첨부서류목록

안심존 이용문의

파일 목록

연관 데이터