보유 특허 상세 정보를 불러오는 중입니다...
[특허 요약] 본 개시의 실시 예에 따른 유해 언어를 감지하기 위한 장치는 챗봇과 사용자의 대화 세션들을 이루는 복수의 문장들을 포함하는 입력 데이터를 입력 받고, 상기 복수의 문장들을 마스킹하여 복수의 마스킹된 문장들을 포함하는 마스킹 데이터를 생성하는 마스킹부, 상기 입력 데이터에 포함된 상기 복수의 문장들에 기반한 제 1 문장 임베딩, 및 상기 마스킹 데이터에 포함된 상기 복수의 마스킹된 문장들에 기반한 제 2 문장 임베딩을 생성하는 인코딩부, 및 상기 제 1 문장 임베딩 및 상기 제 2 문장 임베딩에 대해 기계 학습 알고리즘을 적용하여 상기 입력 데이터에 포함된 상기 복수의 문장들 각각이 유해 언어를 포함하는지 여부를 감지하기 위한 기계 학습 모델을 훈련시키는 훈련부를 포함한다.
| 특허 상태 | 공개 |
| 출원인 | 기초과학연구원 |
| 발명자 | 송현호, 차미영, 신민기, 진효진 |
| 출원번호 | 1020230059381 |
| 출원일 | 2023.05.08 |
| 등록번호 | 20240079134 |
| 등록일 | 2024.06.04 |
| 중요 키워드 | maskingsentencessentencesentence embeddingmachine learning |
본 개시의 실시 예에 따른 유해 언어를 감지하기 위한 장치는 챗봇과 사용자의 대화 세션들을 이루는 복수의 문장들을 포함하는 입력 데이터를 입력 받고, 상기 복수의 문장들을 마스킹하여 복수의 마스킹된 문장들을 포함하는 마스킹 데이터를 생성하는 마스킹부, 상기 입력 데이터에 포함된 상기 복수의 문장들에 기반한 제 1 문장 임베딩, 및 상기 마스킹 데이터에 포함된 상기 복수의 마스킹된 문장들에 기반한 제 2 문장 임베딩을 생성하는 인코딩부, 및 상기 제 1 문장 임베딩 및 상기 제 2 문장 임베딩에 대해 기계 학습 알고리즘을 적용하여 상기 입력 데이터에 포함된 상기 복수의 문장들 각각이 유해 언어를 포함하는지 여부를 감지하기 위한 기계 학습 모델을 훈련시키는 훈련부를 포함한다.




연관 기술이전 로딩 중...
연관 연구자 로딩 중...

수리 및 계산 과학 연구단 · 기초과학연구원