KR950015199A

KR950015199A - 음성 인식 방법 및 장치

Info

Publication number: KR950015199A
Application number: KR1019940030146A
Authority: KR
Inventors: 사루프 아탈 비시누; 하이미-코헨 라질; 비온 로 데이비드
Original assignee: 토마스 에이. 리스테이노; 에이티 앤드 티 코포레이션
Priority date: 1993-11-24
Filing date: 1994-11-17
Publication date: 1995-06-16
Also published as: EP0655732A2; KR100321011B1; US5737724A; CA2117932A1; EP0655732B1; EP0655732A3; DE69426969T2; TW323364B; CA2117932C; DE69426969D1; JPH07199985A; ES2156890T3; JP3363630B2

Abstract

본 발명은 음성인식 시스템에 관한 것이며 인식할 음성은 하나 이상의 단어를 포함한다. 인식은 제1발언과 제2발언의 분석에 기초한다. 본 발명에 따르면 제1발언은 하나 이상의 음성 모형과 비교되어 이 비교 각각에 대한 운율 유사성이 결정된다. 제1발언과 가장 잘 일치하는 음성모형은 하나 이상의 운율 유사성에 기초해서 결정된다. 가장 일치하는 음성모형에 대응하는 운율 유사성은 이 운율 유사성이 제1인식 기준을 만족하는지 결정하기 위해 분석된다. 제2발언은 가장 일치하는 모형과 관련된 하나 이상의 음성모형(여기에는 가장 일치하는 모형이 포함될 수도 있음)과 비교되어 제2발언 운율 유사성이 결정 된다. 하나 이상의 제2발언 운율 유사성은 이것이 제2인식기준을 만족하는지 결정하기 위해 분석된다. 제2발언은 제1인식기준과 제2인식기준이 만족된 경우에 가장 일치하는 음성모형에 대응하는 어구로서 인식된다 본 발명은 개별 단어 인식과 명령 감지를 포함해서 음성인식의 여러 과제들에 적용된다. 본 발명의 예시적 실시예를 셀룰러 전화기로 설명하였지만, 다른 실시예에 대한 것도 논의되어 있다.

Description

음성 인식 방법 및 장치

본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음

제1도는 본 발명에 따른 예시적 실시예로서 셀룰러 전화기의 실시예,

제2도는 제1도의 음성 인식 시스템의 수치형(digital)신호처리기의 흐름 블럭도,

제3도는 제2도의 의사 결정기(decision maker)블럭의 흐름도,

제4도는 제1도-제3도의 실시예에 의해 실시되는 인식 처리의 예시도,

제5도는 인식기 변수값들과 인식기 성능간의 관계를 나타내는 그래프.

Claims

제1발언과 제2발언에 기초해서 하나 이상의 단어를 포함하는 어구를 인식하는 방법으로서, 가. 상기 제1발언을 하나 이상의 음성모형과 비교하여 운율 유사성을 결정하는 단계, 나. 상기 운율 유사성 하나 이상에 기초해서 어떤 음성모형이 제1발언과 가장 일치하는지 결정하는 단계, 다. 상기 가장 일치하는 음성모형과 대응하는 은율 유사성이 제1인식기준을 만족하는지 결정하는 단계, 라. 상기 가장 일치하는 음성모형과 관련된 어구에 대응하는 하나 이상의 음성모형과 상기 제2발언을 비교하여 제2발언에 대한 운율 유사성을 결정하는 단계, 마. 하나 이상의 상기 제2발언 운율 유사성이 제2인식 기준을 만족하는지 결정하는 단계, 바. 상기 제1인식기준과 제2인식기준이 만족되는 경우에는 상기 제2발언을 상기 가장 일치하는 음성모형에 대응하는 어구로 인식하는 단계로 이루어진 어구 인식방법,
제1항에 있어서, 상기 제1발언의 운율 유사성을 결정하는 단계는 상기 제1발언과 음향 배경을 반영하는 모형을 비교하는 단계를 포함하는 것을 특징으로 하는 어구 인식방법
제1항에 있어서, 상기 어구는 개별 단어에 해당하는 것을 특징으로 하는 어구 인식방법.
제1항에 있어서, 상기 가장 일치하는 모형과 관련된 어구에 대응하는 음성모형과 상기 가장 일치하는 모형이 서로 동일한 것을 특징으로 하는 어구 인식방법.
제1항에 있어서, 음성모형은 하나 이상의 소정의 단어들을 반영하는 것을 특징으로 하는 어구 인식 방법.
제5항에 있어서, 상기 음성모형은 음향 배경도 반영하는 것을 특징으로 하는 어구 인식방법.
제5항에 있어서, 상기 소정의 단어는 이용장치(utilization device)에 대한 명령어를 포함하는 것을 특징으로 하는 어구 인식 방법.
제1항에 있어서, 소정의 시간 기간동안에 상기 제2발언을 받아들이는 단계가 더 추가되는 것을 특징으로 하는 어구 인식방법.
제8항에 있어서, 상기 제1발언을 받아들이는 단계가 더 추가되고, 상기 소정의 시간 기간은 상기 제1발언을 받아들이고 소정 시간뒤에 시작하는 것을 특징으로 하는 어구 인식방법.
제8항에 있어서, 상기 제2발언에 대해 독촉을 하는 단계가 더 추가되고, 상기 소정의 시간시간은 상기 독촉을 하고 나서 소정 시간뒤에 시작하는 것을 특징으로 하는 어구 인식방법.
제1항에 있어서, 상기 제1인식기준과 상기 제2인식기준이 동일한 것을 특징으로 하는 어구 인식 방법.
제1항에 있어서, 상기 제1인식기준이 만족하는지 결정하는 단계는 상기 가장 일치하는 음성모형에 대응하는 운율 유사성과 제1임계값을 비교하는 단계를 포함하는 것을 특징으로 하는 어구 인식방법.
제1항에 있어서, 상기 제2인식기준이 만족하는지 결정하는 단계는 상기 제2발언 운율 유사성을 제2임계값과 비교하는 단계를 포함하는 것을 특징으로 하는 어구 인식방법.
제1항에 있어서, 상기 제1인식기준이 만족하는지 결정하는 단계는 상기 가장 일치하는 음성모형에 대응하는 운율 유사성이 제1임계값을 만족하는지 결정하는 단계를 포함하고, 상기 제2인식 기준이 만족하는지 결정하는 단계는 상기 제2발언 운율 유사성이 제2임계값을 만족하는지 결정하는 단계를 포함하는 것을 특징으로 하는 어구 인식방법.
제14항에 있어서, 상기 제1임계값과 제2임계값이 동일한 것을 특징으로 하는 어구 인식방법
제1항에 있어서, 상기 제1인식기준은 인식될 어구에 기초하는 것을 특징으로 하는 어구 인식방법.
제1항에 있어서, 상기 제2인식기준은 인식될 어구에 기초하는 것을 특징으로 하는 어구 인식방법.
제1항에 있어서, 상기 제1인식기준은 이용장치의 상태에 기초하는 것을 특징으로 하는 어구 인식 방법
제1항에 있어서, 상기 제2인식기준은 이용장치의 상태에 기초하는 것을 특징으로 하는 어구 인식 방법.
제1항에 있어서, 상기 단계들은 전기 통신망에서 구현되어 통신망 서비스의 동작을 용이하게 하는 것을 특징으로 하는 어구.
제1항에 있어서, 상기 단계드른 컴퓨터에서 구현되어 컴퓨터의 동작을 용이하게 하는 것을 특징으로 하는 어구 인식방법.
제1발언과 제2발언에 기초해서 하나 이상의 단어들을 포함하는 어구를 인식하는 음성인식장치로서, 가.제1발언과 하나 이상의 음성모형을 비교하여 운율 유사성을 결정하는 수단, 나. 하나 이상의 운율 유사성에 기초해서 어떤 음성 모형이 상기 제1발언과 가장 일치하는지 결정하는 수단, 다. 상기 가장 일치하는 음성모형에 대응하는 운율 유사성이 제1인식기준을 만족하는지 결정하는 수단, 라. 상기 가장 일치하는 음성모형과 관련된 어구에 대응하는 하나 이상의 음성 모형을 상기 제2발언과 비교하여, 제2발언 운율 유사성을 결정하는 수단, 마. 하나 이상의 상기 제2발언 운율 유사성이 제2인식기준을 만족하는지 결정하는 수단, 바. 상기 제1인식기준과 상기 제2인식기준이 만족되는 때에는 상기 제2발언을 상기 가장 일치하는 음성 모형에 대응하는 어구로 인식하는 수단을 구비하는 음성 인식장치.
제22항에 있어서, 상기 '가' 수단은 상기 제1 발언과 음향 배경을 반영하는 모형을 비교하는 수단을 포함하는 것을 특징으로 하는 음성 인식장치.
제22항에 있어서, 상기 가장 일치하는 음성모형과 관련된 어구에 대응하는 음성모형과, 상기 가장 일치하는 음성모형이 동일한 것을 특징으로 하는 음성 인식장치.
제22항에 있어서, 음성모형은 하나 이상의 소정의 단어들을 반영하는 것을 특징으로 하는 음성 인식 장치.
제25항에 있어서, 상기 음성모형은 음향배경도 또한 반영하는 것을 특징으로 하는 음성 인식장치.
제25항에 있어서, 상기 소정의 단어는 여용장치에 대한 명령구를 포함하는 것을 특징으로 하는 음성 인식 장치.
제22항에 있어서, 소정의 시간 기간동안에 상기 제2발언을 받아들이는 수단을 더 구비하는 것을 특징으로 하는 음성 인식장치
제28항에 있어서, 상기 제1발언은 받아들이는 수단을 더 구비하고, 상기 소정의 시간기간은 상기 제1발언을 받고 소정시간 후에 시작하는 것을 특징으로 하는 음성 인식장치.
제28항에 있어서, 상기 제2발언에 대해 독촉을 하는 수단을 더 구비하고, 상기 소정의 시간기간은 상기 독촉을 하고 나서 소정 시간뒤에 시작하는 것을 특징으로 하는 음성 인식장치.
제22항에 있어서, 상기 제1인식기준과 상기 제2인식기준에 동일한 것을 특징으로 하는 음성 인식 장치.
제22항에 있어서, 상기 제1인식기준이 만족하는지 결정하는 수단은 상기 가장 일치하는 음성모형에 대응하는 운율 유사성과 제1임계값을 비교하는 수단을 포함하는 것을 특징으로 하는 음성 인식장치.
제22항에 있어서, 상기 제2인식기준이 만족하는지 결정하는 수단은 상기 제2발언 운율 유사성을 제2임계값과 비교하는 수단을 포함하는 것을 특징으로 하는 음성 인식장치.
제22항에 있어서, 상기 제1인식기준에 만족하는지 결정하는 수단은 상기 가장 일치하는 음성모형에 대응하는 운율 유사성이 제1임계값을 만족하는지 결정하는 수단을 포함하고, 상기 제2인식 기준이 만족하는지 결정하는·수단은 상기 제2발언운율 유사성이 제2임계값을 만족하는지 결정하는 수단을 포함하는 것을 특징으로 하는 음성 인식장치.
제34항에 있어서, 상기 제1임계값과 제2임계값은 동일한 것을 특징으로 하는 음성 인식장치.
제22항에 있어서, 상기 제1인식기준은 인식될 어구에 기초하는 것을 특징으로 하는 음성 인식장치.
제22항에 있어서, 상기 제2인식기준은 인식될 어구에 기초하는 것을 특징으로 하는 음성 인식장치.
제22항에 있어서, 상기 제1인식기준은 이용장치의 상태에 기초하는 것을 특징으로 하는 음성 인식 장치,
제22항에 있어서, 상기 제2인식기준은 이용장치의 상태에 기초하는 것을 특징으로 하는 음성 인식장치.
전화기에 있어서, 1) 마이크와 2) 제1발언과 제2발언에 기초해서 하나 이상의 단어들을 포함하는 어구를 인식하는 음성 인식기로서, 가. 제1발언과 하나 이상의 음성모형을 비교하여 운율 유사성을 결정하는 수단, 나. 하나 이상의 운율 유사성에 기초해서 어떤 음성 모형이 상기 제1발언과 가장 일치하는지 결정하는 수단, 다. 상기 가장 일치하는 음성모형에 대응하는 운율 유사성이 제1인식기준을 만족하는지 결정하는 수단, 라. 상기 가장 일치하는 음성모형과 관련된 어구에 대응하는 하나 이상의 음성 모형을 상기 제2발언과 비교하여, 제2발언 운율 유사성을 결정하는 수단, 마. 하나 이상의 상기 제2발언 운율 유사성이 제2인식기준을 만족하는지 결정하는 수단 바. 상기 제1인식기준과 상기 제2인식기준이 만족되는 때에는 상기 제2발언을 상기 가장 일치하는 음성 모형에 대응하는 어구로 인식하는 수단을 구비하는 음성 인식기, 3) 상기 인식된 제2발언에 응답해서 전화 동작을 제공하는 전화 회로를 구비하는 전화기.
제40항에 있어서, 무선 송수신기와, 상기 전화회로에 의해 제공되는 제어신호들에 응답해서 상기 마이크와 상기 전화회로를 상기 무선 송수신기에 접속 시키는 오디오 처리 수단을 더 구비하는 것을 특징으로 하는 전화기.
제40항에 있어서, 상기 마이크는 손잡이가 없는 마이크인 것을 특징으로 하는 전화기.
제40항에 있어서, 상기 마이크는 핸드셋 마이크인 것을 특징으로 하는 전화기.
제40항에 있어서, 상기 전화기에 결합되어 무선 전화 통신을 제공하는 무선 송수신기를 더 구비하는 것을 특징으로 하는 전화기.

※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.