KR930005223B1 - 음성 인식장치 및 이것을 이용한 전화기 - Google Patents

음성 인식장치 및 이것을 이용한 전화기 Download PDF

Info

Publication number
KR930005223B1
KR930005223B1 KR1019890020068A KR890020068A KR930005223B1 KR 930005223 B1 KR930005223 B1 KR 930005223B1 KR 1019890020068 A KR1019890020068 A KR 1019890020068A KR 890020068 A KR890020068 A KR 890020068A KR 930005223 B1 KR930005223 B1 KR 930005223B1
Authority
KR
South Korea
Prior art keywords
voice
speech
section
pattern
recording
Prior art date
Application number
KR1019890020068A
Other languages
English (en)
Other versions
KR900010649A (ko
Inventor
야스유끼 마사이
Original Assignee
가부시끼가이샤 도시바
아오이 죠이찌
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시끼가이샤 도시바, 아오이 죠이찌 filed Critical 가부시끼가이샤 도시바
Publication of KR900010649A publication Critical patent/KR900010649A/ko
Application granted granted Critical
Publication of KR930005223B1 publication Critical patent/KR930005223B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

내용 없음.

Description

음성 인식장치 및 이것을 이용한 전화기
제1도는 본 발명의 한 실시예에 관한 음성 인식 장치의 구성을 나타낸 블록도.
제2도는 제1도의 음성 인식 장치를 갖춘 전화기의 외관을 나타낸 평면도.
제3도는 본 발명에 관한 다른 실시예의 음성 인식 장치를 나타낸 블록도.
제4도는 제3도의 음성 인식 장치를 갖춘 전화기의 외관을 나타낸 평면도이다.
* 도면의 주요부분에 대한 부호의 설명
1,22 : 음성입력부 2,25 : 음향분석부
3 : 특징 패턴 기억부 4 : 음성녹음부
5,27 : 음성인식부 6: 검색 신호 입력부
7 : 음성재생부 8 : 삭제신호 입력부
9,30 : 전화기 본체 10,31 : 송수화기
13 : 검색키 14 : 삭제키
23 : 음성구간 검출부 24 : 음성기억부
26 : 특징 패턴 기억부 28 : 음성재생부
29 : 음성 특징 패턴 대응지정부
33 : 모드 선택 스위치
본 발명은 음성 인식 장치 및 이것을 이용한 전화기에 관한 것이다.
최근 전화 사용자가 발성한 호출상대의 이름을 대응하는 음성을 인식하고, 그 인식결과로 부터 미리 그 이름의 음성신호와 대응해서 등록되어 있는 상대방의 전화번호를 판단해서 그 전화번호로 전화를 거는 전화기가 자동차 전화, 가정용 전화등으로 실용화되고 있다.
그런데 이와같은 전화기에 있어서, 한번 등록한 이름 및 그 전화번호를 삭제하거나 재등록하는 경우는 그 대상으로 되는 이름을 어떤 방법으로 지정할 필요가 있다.
종래로 부터 이 이름을 지정하는 방법으로서는 이름과 대응하는 번호를 다이얼 입력해서 이름을 지정하는 방법, 이름을 그 음성의 특징 패턴과 그 이름을 나타내는 문지신호로 등록해 두고 표시기 등에 그 문자를 표시해서 희망하는 이름을 지정하는 방법등이 일반적이다.
그러나 전화번호를 다이얼 입력해서 이름을 지정하는 방법에서는 이름과 전화번호와의 대응관계를 이용자가 항상 기억해 둘 필요가 있다. 또, 이름을 음성의 특징 패턴과 문자 신호로 등록해 두는 방법에서는 문자를 표시하는 표시기가 필요하게 되므로 코스트가 높아지고 특히 문자의 등록이 번거롭다는 난점이 있었다.
이와같이 종래의 음성 인식 장치를 갖춘 전화기에서, 전자의 방법에 입각한 것에서는 이미 등록완료된 이름을 지정하기 위해 이름과 전화번호와의 대응을 항상 이용자가 기억해 둘 필요가 있고, 또, 후자의 방법에 입각한 것에서는 이름을 표시하기 위한 표시기가 필요하고 또, 이름을 등록하기 위해서 문자 입력을 행할 필요가 있는 등의 난점이 있었다.
본 발명은 이와같은 과제를 해결하기 위해서 된 것으로 사용자의 부담을 크게 경감할 수 있는 음성 인식 장치 및 이것을 이용한 전화기의 제공을 목적으로 한다.
제1의 발명은 전술한 과제를 해결하기 위해서 음성의 특징 패턴과 이것에 대응하는 정보를 미리 등록해 두고 이들 등록정보를 이용해서 음성의 인식을 행하는 음성인식 장치에 있어서, 등록된 전술의 특징 패턴에 관련하는 음성을 등록하는 음성 등록 장치와 이 음성 등록 장치로 녹음된 음성을 요구에 따라 재생하는 음성 재생 장치와 음성 재생시에 있어서 희망하는 음성이 재생된 때 이것을 지정하는 지정장치와, 지정된 음성 및 이 음성의 특징 패턴에 대한 소정의 처리를 행하는 장치를 구비하는 것이다.
또, 제2의 발명은 전화를 걸고 싶은 상대의 이름을 발성한 때의 음성의 특징 패턴과 이것에 대응하는 전화번호를 미리 등록해 두고 이들 등록정보를 이용해서 음성을 인식해서 이 음성에 대응하는 전화번호를 얻어 발신을 행하는 전화기에 있어서, 등록된 전술한 특징 패턴에 관련하는 음성을 녹음하는 음성 녹음 장치와, 이 음성 녹음 장치로 녹음된 음성을 요구에 따라 재생하는 음성 재생 장치와, 음성 재생시에 있어서 희망하는 음성이 재생된 때 이것을 지정하는 음성 지정장치와, 지정된 음성 및 이 음성의 특징 패턴에 대한 소정의 처리를 행하는 장치를 구비한 것이다.
또, 제3의 발명은 전화를 걸고 싶은 상대의 이름을 발성할 때의 음성의 특징 패턴과 이것에 대응하는 전화번호를 미리 등록해 두고 이들 등록정보를 이용해서 음성을 인식해서 이 음성에 대응하는 전화번호를 얻어 발신을 행하는 전화기에서 등록된 전술한 특징 패턴에 관련하는 음성을 녹음하는 음성 녹음 장치와 음성 녹음 장치로 녹음된 음성을 요구에 따라 재생하는 음성 재생 장치와, 음성 재생시에 희망하는 음성이 재생된 때 이것을 지정하는 음성 지정장치와, 지정된 음성 및 음성의 특징 패턴을 삭제하는 삭제장치를 구비한 것이다.
또, 제4의 발명은 복수의 이용자가 발성한 동일한 의미를 갖는 각 음성의 특징 패턴에서 표준 패턴을 생성해서 이것을 등록해 두고 어떤 이용자가 발성한 음성을 전술한 표준 패턴을 이용해서 인식하고 그 인식결과에 대응하는 확인용 음성을 출력하는 음성 인식장치에 있어서, 등록된 전술한 표준 패턴에 관련하는 음성을 인식결과에 대응해서 출력해야 할 확인용 음성으로서 녹음하는 음성 녹음 장치와, 음성 녹음 장치에 의한 확인용 음성의 녹음의 온/오프를 필요에 따라 변환하는 변환장치를 구비한 것이다.
제5의 발명은 복수의 이용자가 발성한 동일 의의를 갖는 음성의 특징 패턴에서 표준 패턴을 생성해서 이것을 등록해 두고 어떤 이용자가 발성한 음성을 전술한 표준 패턴을 이용해서 인식하고 그 인식결과에 대응하는 확인용 음성을 출력하는 음성 인식 장치에 있어서, 인식결과를 대응해서 출력되어야 할 확인용 음성을 등록된 전술한 표준 패턴과는 무관계로 녹음하는 음성 녹음 장치를 갖춘 것이다.
제1발명에서는 음성 재생 장치에 의해 음성 녹음 장치에서 녹음된 각 음성을 요구에 따라 차례로 재생시켜 희망하는 음성이 재생된 때 음성 지정장치로 이것을 지정한다. 그러면 지정된 음성 및 이 음성의 특징패턴에 대해 이 장치에 있어서 미리 정의된 소정의 처리가 행해진다.
제2의 발명은 제1의 발명의 음성 인식 장치를 전화기에 갖춘 것으로 그 작용은 전술한 발명과 같다.
또, 제3의 발명에서는 음성 재생 장치에 의해 음성 재생 장치에서 녹음된 각 음성을 요구에 따라 차례로 재생시켜 희망하는 음성이 재생된 때 음성 지정장치에 의해 이것을 지정한다. 그러면 삭제장치가 지정된 음성 및 이 음성의 특징 패턴을 자동적으로 삭제한다.
따라서, 이들 발명에 따르면 재생된 이름의 음성을 듣고 희망하는 이름이 재생된 때를 지정하는 것만으로 그 이름에 대응하는 음성 및 이 음성의 특징 패턴에 대한 삭제등의 미리 정해진 처리를 행할 수 있고 이용자의 부담을 크게 경감할 수 있다.
또한, 제4의 발명에서는 변환장치에 의해 음성 녹음 장치에 의한 확인용 음성의 녹음의 온/오프를 필요에 따라 변환할 수 있어서 인식결과에 대한 확인용 음성을 누구의 음성으로 출력할 것인가를 자유롭게 설정할 수 있다.
또, 제5의 발명에서는 음성 기록 장치가 인식결과에 대응해서 출력되어야 할 확인 음성을, 음성의 입력에 따른 표준 패턴의 생성과는 관계없이 녹음하므로 전술한 제4의 발명과 같은 효과가 얻어진다.
이하 본 발명의 실시예를 도면에 입각해서 설명한다.
제1도는 본 발명의 음성 인식 장치가 적용된 전화가 즉, 전화를 결고 싶은 상대방의 이름, 회사명등을 음성으로 입력하면 그 음성의 인식결과에 대응하는 전화번호를 자동적으로 다이얼 발신하는 전화기의 구성을 나타내고 있다.
제1도에 나타낸 것처럼 이름등록시 음성의 특징 패턴을 등록하기 위해서 이용자가 발성한 음성은, 예를 들면 마이크로폰, 앰프등의 음성입력부(1)에서 증폭된 후 음향분석부(2)로 입력된다. 음향 분석부(2)는 입력음성의 특징을 추출하기 위해서 밴드 패스필터 분석이나 겝스트럼(cepstrum) 분석등 필요에 따라 음향 분석을 행한다. 그리고, 이것에 의해 추출된 입력음성의 특징 패턴 기억부(3)로 기억된다. 또한, 이 동작과 병행해서 음성입력부(1)에 입력된 음성은 음성녹음부(4)로 녹음된다.
한편, 음성인식에 의한 자동 다이얼 발신시에는 발성된 음성은, 음성입력부(1)를 통해서 음향분석부(2)로 입력되고 이에 따라 음향 분석이 행해진다. 그래서, 분석결과인 입력음성의 특징 패턴은 음성인식부(5)로 입력된다. 여기서 음성인식부(5)은 그 입력음성의 특징 패턴과 특징 패턴 기억부(3)에 기억되어 있는 특징패턴과의 사이에서 매칭처리를 행한다. 또, 이 매칭처리의 방법으로서는 예를들면, 다이나믹프로그래밍, 부분 공간법등이 일반적으로 이용되거나 본 실시예에서는 어떤 매칭 처리방법을 채용해도 무방하다.
그래서, 음성인식부(5)에서 인식된 결과에 입각해서 특징 패턴 등록시에 이름과 대응시켜 등록해 둔 전화번호를 판단하고, 이 전화번호를 자동적으로 발신한다.
이와같이 해서 음성에 의한 이름의 등록과 음성인식의 처리가 행해진다.
그런데, 전술한 것과 같은 전화기에서는 등록되어 있는 음성의 특징 패턴을 특징 패턴 기억부(3)에서 삭제할 필요가 자주 생긴다.
이 삭제방법에 대해 다음에 설명한다.
이미 등록해 있는 특정의 이름 예를들면 「스즈끼」를 삭제하는 경우 검색신호 입력부(6)에서 검색신호를 음성재생부(7)로 출력한다. 음성재생부(7)는 검색신호를 받으면 음성녹음부(4)에 녹음되어 있는 모든 음성을 차례로 재생한다. 사용자는 음성재생부(7)에서 재생되는 이름을 듣고「스즈끼」가 재생된 때에 삭제신호 입력부(8)를 조작해서 삭제신호를 특징 패턴 기억부(3) 및 음성녹음부(4)로 입력하고 특징 패턴 및 음성을 삭제한다.
또, 전화기는 마이크로 컴퓨터등의 제어부(15)를 가지고, 이 제어부(15)가 전술한 삭제신호에 따라 특징 패턴 기억부(3) 및 음성녹음부(4)에서의 각각의 삭제처리를 제어한다.
따라서, 종래는 복수, 예를들면 2인의 이용자가, AㆍB에 의해 「스즈끼」라는 이름이 중복해서 등록되어 있는 경우에 A 이용자가 등록한 「스즈끼」를 삭제하고 싶은 경우 문자로 「스즈끼」라고 입력해도 각각 구별할 수 없는 것에 대해서, 본 실시예에 따르면 재생되는 음성을 들으면 A 이용자가 등록한 「스즈끼」와 B 이용자가 등록한 「스즈끼」를 음성의 차이에 따라 구별할 수 있고 실수로 다른쪽을 삭제하는 것을 방지할 수 있다.
다음에 본 실시예에서 대표되는 기능의 사용방법을 구체적 예를들어 설명한다.
제2도는 전술한 음성 인식 장치를 갖춘 전화기를 나타낸다.
동 도면에서 “9”는 전화기 본체, “10”은 송수화기(핸드셋), “11”은 전술한 전화기 본체(9)의 표면 패널상에 설치된 다이얼부, “12”는 각종의 전화 서비스에 이용되는 기능선택키이다.
전술한 검색신호 입력부(6) 및 삭제신호 입력부(8)는 전화기 본체(9)의 표면 패얼상의 다이얼 패드(11)의 상하에 설치한 검색키(13), 삭제키(14)에 의해 각각 실현된다.
여기서 동 전화기에서 A 이용자, B 이용자 순으로 각각 「스즈끼」「사또」의 2사람의 이름이 등록됨에 따라 4개의 등록이 되는 것으로 하고, 여기서 A의 이용자가 등록한 「사또」라는 음성의 특징 패턴을 삭제하는 것으로 하자.
먼저 검색키(13)를 누루면 송수화기(10)에서 음성녹음부(4)에 녹음되어 있는음성이 A 이용자에 의한 「스즈끼」, A 이용자에 의한 「사또」, B 이용자에 대한 「스즈끼」, B 이용자에 의한 「사또」의 순으로 재생된다. 지금 삭제하고 싶은 이름은 A 이용자에 의한 「사또」이므로, 2번째의 A 이용자에 의한 「사또」가 재생된 때에 삭제보턴을 누루면 A 이용자에 의한 「사또」에 대응하는 등록 완료 특징 및 패턴 및 녹음 음성은 특징 패턴 기억부(3) 및 음성녹음부(4)로 부터 삭제된다.
이리하여 본 실시예에 따르면 용이하게 희망하는 이름을 지정할 수 있고, 그 이름의 음성 및 이 음성의 특징 패턴을 삭제할 수 있다.
또, 전술한 실시예에서는 녹음되어 있는 모든 이름이 등록 순서대로 재생되는 경우를 설명했으나 그 밖의 방법으로서 재생되는 이름의 범위를 제한하거나 순서를 지정해도 상관없다.
이상 등록완료된 복수의 이름중에서 특정의 이름만을 지정해서 삭제하는 경우에 대해 설명했으나 본 발명은 이것에 한정된 것은 아니고, 예를들면 재등록 기능등, 어떤 특정의 이름을 지정할 필요가 있는 기능을 실현하는 경우에 있어서도 동일하게 본 발명을 이용할 수 있다.
다음에 본 발명의 다른 실시예를 설명한다.
제3도는 본 발명에 관한 다른 실시예의 음성 인식 장치의 구성을 나타낸 블록도이다.
동 도면에 있어서 “21”은 본 실시예 장치의 4종류의 모드 상태를 선택하는 스위치부를 나타내고 있다.
스위치부(21)에 있어서 “b”의 접점에 접속한 경우 입력음성의 특징 패턴 등록과 동시에 그 음성이 기억된다(모드 2). “C”의 접점에 접속한 경우 입력음성의 특징 패턴 등록만 행해지고 그 음성은 기억되지 않는다(모드 3). “a”의 접점에 접속한 경우 특징 패턴의 등록은 행해지지 않고 음성만이 기억된다 (모드 1). “d”의 접점에 접속한 경우 음성 인식이 행해진다(모드 4). 다음에 스위치부(21)에 있어서 b의 접점에 접속한 경우에 대해 상술한다.
음성입력부(22)에서 음성신호가 입력되면 그 입력 음성신호는 음성구간 검출부(23)로 주어짐과 동시에 음성기억부(24)에 기억된다.
음성구간 검출부(23)는 입력음성의 레벨에 대해 어떤 한계값을 설정하고, 이 한계값에 입각해서 음성구간을 무음구간 및 노이즈로 부터 구별해서 음성 신호의 시작과 끝을 검출하고 그 음성구간을 검출한다.
음성기억부(24)는 음성구간 검출부(23)에서 검출된 음성구간의 정보에 입각해서 해당 음성구간의 음성 신호만을 선택적으로 기억한다. 한편, 이 음성구간의 음성은 음향분석부(25)로 입력되고, 여기서 구해진 음성 특징 패턴이 특징 패턴 기억부(26)로 기억된다.
또, 음향분석부(25)는 입력음성을 필터링 처리하는 등으로 그 특징 파라메터 계열을 구하고 검출된 음성구간의 특징 파라메터 계열을 음성의 표준 특징 패턴으로 구한다.
이상과같이 해서 특징 패턴 기억부(26)로의 표준 패턴의 등록이 행해진 후 음성인식에 의한 자동 다이얼 발신시에 모드 4(d접점에 접속)를 선택하고, 음성입력부(22)에서 입력된 음성신호에 대해 음성구간 검출부(23)에서 음성구간을 검출하고 검출된 음성구간에 대해 음향분석부(25)에서 구한 음성의 특징 패턴과 특징 패턴 제어부(26)에 기억되어 있는 표준 패턴과의 사이의 유사도등을 음성인식부(27)에서 계산하고 그 유사도 값을 서로 비교하는 등으로 입력음성에 대한 인식 결과가 구해진다.
이 음성인식부(27)에 있어서의 인식 처리법은 전술한 유사도 계산외에 종래로부터 여러가지 제창되고 있는 음성인식 알로리즘을 적절히 채용해서 행해진다.
이상과같이 해서 구한 인식결과에 대응하는 음성기억부(24) 내의 음성신호가 음성재생부(28)에 부여되고, 인식 결과를 확보하기 위한 음성이 재생출력된다.
다음에 스위치부(21)에 있어서의 c의 접점에 접속한 경우에 대해 상술한다.
이 경우 음성입력부(22)에서 입력된 음성신호는 음성구간 검출부(23)에만 부여되어지고, 음성기억부(24)에는 부여되지 않는다. 따라서, 음성기억부(24)에는 음성신호가 기억되지 않는다. 음성구간 검출부(23)에 부여된 음성신호는 스위치부(21)에 있어서 b의 접점에 접속한 경우와 같이 처리된 후 그 음성의 특징 패턴이 특징 패턴 기억부(26)에 기억된다.
최후에 a의 접점을 접속한 경우에 대해서 상술한다.
이 경우는 음성입력부(22)에서 입력된 음성신호는 음성기억부(24)에만 부여되어지고 음성구간 검출부(23)에는 부여되지 않는다. 따라서, 특징 패턴 기억부(26)에는 음성의 특징 패턴이 기억되지 않는다.
음성기억부(24)는 입력된 음성의 음성구간을 검출하는 처리를 행하지 않고 음성 기억이 개시되고 부터 종료되기 까지의 사이에 음성입력부(22)를 통해서 입력된 음성(노이즈, 무음구간등을 포함) 모두를 기억한다. 음성구간 검출의 처리를 행하지 않음에 따라 문장과 같이 무음구간을 포함한 듯한 음성을 인식 결과를 확인하기 위한 응답으로서 출력할 수 있다. 또한, 여기서 음성기억부(24)에 기억된 음성이 특징 패턴 기억부(26)에 등록되는 등의 특징 패턴에 대응하는가를 음성 특징 패턴 대응 지정부(29)에서 지정된다.
이와같이 대응을 지정함으로서 인식시키고 싶은 「언어」이외의 확인용 음성을 인식결과의 응답으로서 출력할 수 있다.
제4도는 제3도에 나타낸 음성 인식 장치를 갖춘 전화기를 나타내고 있다.
제4도에 있어서, “30”은 전화기 본체, “31”은 송수화기, “32”는 전화기 본체(30)의 표면 패널상에 설치된 다이얼부이다. 또한, “33”은 제3도의 스위치부(21)를 4개의 푸시보턴 스위치로 실현한 모드 선택 스위치로, 이 4개의 보턴 스위치는 동시에 2개 이상 사용할 수 없는 구조로 되어 있다. “34”는 음성과 특징 패턴과의 대응을 지정하기 위한 키로 다이얼부(32)와 병용해서 음성과 특징 패턴과의 대응을 지정한다. 그리고, “35”는 각종의 전화 서비스에 이용되는 기능선택키이다.
다음에 이 전화기를 이용해서 2사람의 이용자(AㆍB)가 음성 인식 장치에 각각 「다나까」라는 단어의 음성패턴을 등록해서 인식결과를 A 이용자의 등록에 의한 「다나까」라는 음성으로 응답하는 경우에 대해 설명한다.
A 이용자가 음성의 특징 패턴을 등록하는 경우 모드 선택 스위치(33)를 모드 2에 설정하고, 「다나까」라고 발성해서 그 음성의 특징 패턴과 음성을 등록한다. 이어서, B 이용자가 음성의 특징 패턴을 등록하는 경우 모드 선택 스위치(33)를 모드 3에 설정하고 「다나까」라고 발성해서 그 음성의 특징 패턴을 등록한다. 이 모드 3의 때, B 이용자에 의한 「다나까」라는 음성은 등록되지 않는다. 동일하게 해서 다수의 이용자의 음성 특징 패턴을 등록할 수 있다.
이상과같이 해서 복수의 이용자에 의한 음성의 특징 패턴의 등록을 행하고, 각 이용자가 모드 4에 의한 자동다이얼 발신을 이용할 때는 확인용 음성은 항상 대표자 예를들면, A 이용자의 음성으로 출력된다.
또한, B 이용자도 모드 2에서 음성의 특징 패턴을 등록한 경우는 A 이용자의 음성상에 B 이용자의 음성이 위에 기록되게 되고 인식결과에 대한 확인용 음성은 최후에 모드 2를 이용한 이용자의 음성으로 출력된다.
AㆍB 2사람의 인식결과를 제3자(비 사용자)의 음성으로 응답시키고 싶은 경우에는 모드 1를 선택해서 이 제3자의 음성만을 등록하면 된다.
이리하여 본 실시예의 음성 인식 장치에 따르면 모드 선택 스위치(33)에 의해 음성 패턴 등록시에 발성한 음성을 등록 할까 말까를 설정할 수 있고, 인식 결과에 대한 확인용의 음성을 누구의 음성으로 출력할까를 자유롭게 결정할 수 있다. 또, 음성 패턴 등록과는 관계없이 확인용 응답음성을 녹음함으로써 인식시키고 싶은 「언어」이외의「언어」로 응답을 돌릴 수 있다.
이상 설명한 것처럼 본 발명에 따르면 재생된 이름의 음성을 듣고 희망하는 이름이 재생된 때를 지정하는 것만으로 그 이름에 대응하는 음성 및 이 음성의 특징 패턴에 대한 삭제등의 소정의 처리를 행할 수 있고 이용자의 부담을 대폭 경감할 수 있다.
또한, 인식결과에 대한 확인용의 응답음성을 누구의 음성으로 출력하는가를 자유로 설정할 수 있게 된다.

Claims (5)

  1. 음성의 특징 패턴과 이것에 대응하는 정보를 미리 등록해 두고 이들의 등록정보를 이용해서 전술한 음성의 인식을 행하는 음성 인식 장치에 있어서, 등록된 전술한 음성 패턴에 관련되는 음성을 녹음하는 음성녹음부(4)와, 이 음성녹음부(4)로 녹음된 음성을 요구에 따라 재생하는 음성재생부(7)와, 음성 재생시에 희망하는 음성이 재생된 때를 이것을 지정하는 삭제신호 입력부(8)와, 지정된 음성 및 이 음성의 특징 패턴에 대한 소정의 처리를 행하는 장치인 제어부(15)를 구비하는 것을 특징으로 하는 음성 인식 장치.
  2. 전화를 걸고 싶은 상대의 이름을 발성한 때의 음성의 특징 패턴과 이것에 대응하는 전화번호를 미리 등록해 두고 이들의 등록정보를 이용해서 전술한 음성을 인식해서 해당음성에 대응하는 전화번호를 얻어 발신을 행하는 전화기에 있어서, 등록된 전술한 특징 패턴에 관련되는 음성을 녹음하는 음성녹음부(4)와, 이 음성녹음부(4)에 의해 녹음된 음성을 요구에 따라 재생하는 음성재생부(7)와, 음성 재생시에 있어서 희망하는 음성이 재성된 때 이것을 지정하는 삭제신호 입력부(8)와, 지정된 음성 및 이 음성의 특징 패턴에 대한 소정의 처리를 행하는 장치인 제어부(15)를 구비한 것을 특징으로 하는 전화기.
  3. 제2항에 있어서, 상기 소정의 처리를 행하는 장치인 제어부(15)가 상기 삭제신호 입력부(8)에서 지정된 재생음성에 대응하는 음성 및 이 음성의 특징 패턴을 삭제하는 수단을 구비한 것을 특징으로 하는 전화기.
  4. 복수의 이용자가 발성한 동일한 의미를 갖는 각 음성의 특징 패턴으로 부터 표준 패턴을 생성해서 이것을 등록해 두고 어떤 이용자가 발성한 음성을 전술한 표준 패턴을 이용해서 인식하고 그 인식결과에 대응해서 확인용 음성을 출력하게 된 것으로서, 음성입력부(22), 음성구간 검출부(23), 음향분석부(25), 특징 패턴 기억부(26), 음성인식부(27), 음성재생부(28) 및 음성 특징 패턴 대응 지정부(29)로 구성되어 있는 음성 인식 장치에 있어서, 등록된 전술한 표준 패턴에 관련하는 음성을 전술한 인식결과에 대응해서 출력되어야 할 확인용 음성으로서 녹음하는 음성 녹음 장치인 음성기억부(24)와, 상기 음성 녹음 장치에 의한 전술한 확인용 음성을 필요에 따라 녹음시킬 수 있게 하는 변환장치인 스위치부(21)를 구비한 것을 특징으로 하는 음성 인식 장치.
  5. 복수의 이용자가 발성한 동일 의미를 갖는 각 음성의 특징 패턴에서 표준 패턴을 생성해서 이것을 등록해 두고 어떤 이용자가 발성한 음성을 전술한 표준 패턴을 이용해서 인식하고 그 인식결과에 대응하는 확인용 음성을 출력하게 된 것으로서, 음성입력부(22), 음성구간 검출부(23), 음향분석부(25), 특징 패턴 기억부(26), 음성인식부(27), 음성재생부(28) 및 음성 특징 패턴 대응 지정부(29)로 구성되어 있는 음성 인식 장치에 있어서, 전술한 인식결과에 대응해서 출력되어야 할 확인용 음성을, 등록된 전술한 표준 패턴과는 관계없이 녹음하는 음성 녹음 장치인 음성기억부(24)를 갖춘 것을 특징으로 하는 음성 인식 장치.
KR1019890020068A 1988-12-29 1989-12-29 음성 인식장치 및 이것을 이용한 전화기 KR930005223B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP63-330905 1988-12-29
JP88-330905 1988-12-29
JP63330905A JP2793213B2 (ja) 1988-12-29 1988-12-29 音声認識装置及びこれを用いた電話機

Publications (2)

Publication Number Publication Date
KR900010649A KR900010649A (ko) 1990-07-09
KR930005223B1 true KR930005223B1 (ko) 1993-06-16

Family

ID=18237804

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019890020068A KR930005223B1 (ko) 1988-12-29 1989-12-29 음성 인식장치 및 이것을 이용한 전화기

Country Status (3)

Country Link
JP (1) JP2793213B2 (ko)
KR (1) KR930005223B1 (ko)
GB (2) GB2226675B (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE9301886L (sv) * 1993-06-02 1994-12-03 Televerket Förfarande för utvärdering av talkvalitet vid talsyntes
GB2307137B (en) * 1995-11-04 2000-03-22 Motorola Ltd A communications addressing network and terminal therefor
JP2000505623A (ja) * 1996-02-29 2000-05-09 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 遠隔通信システム
US6044147A (en) * 1996-05-16 2000-03-28 British Teledommunications Public Limited Company Telecommunications system
KR100229864B1 (ko) * 1996-12-27 1999-11-15 윤종용 음성우편장치에서의 녹음자 음성확인 서비스 제공방법
GB9806401D0 (en) * 1998-03-25 1998-05-20 Domain Dynamics Ltd Improvements in voice operated mobile communications
KR100378439B1 (ko) * 2000-12-14 2003-03-29 주식회사 티엘아이 착신을 거부할 수 있는 전화기 및 이를 이용한 착신거부방법
JP4240807B2 (ja) * 2000-12-25 2009-03-18 日本電気株式会社 移動通信端末装置、音声認識方法、およびそのプログラムを記録した記録媒体

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB974850A (en) * 1963-06-12 1964-11-11 Standard Telephones Cables Ltd Speech recognition system
GB1055371A (en) * 1964-03-06 1967-01-18 Standard Telephones Cables Ltd Apparatus for the recognition of speech

Also Published As

Publication number Publication date
GB9221767D0 (en) 1992-12-02
GB2258936B (en) 1993-07-21
KR900010649A (ko) 1990-07-09
GB2226675A (en) 1990-07-04
JPH02178698A (ja) 1990-07-11
GB2258936A (en) 1993-02-24
JP2793213B2 (ja) 1998-09-03
GB2226675B (en) 1993-07-21
GB8929267D0 (en) 1990-02-28

Similar Documents

Publication Publication Date Title
US5007081A (en) Speech activated telephone
CA1294080C (en) Multiple language telephone answering machine
US5651055A (en) Digital secretary
US4945557A (en) Voice activated dialing apparatus
US5752230A (en) Method and apparatus for identifying names with a speech recognition program
RU2187902C2 (ru) Способ и устройство для управления вводами речевой регистрации устройства распознавания речи для использования в микротелефонной трубке и в комплекте громкоговорящей связи
KR930005223B1 (ko) 음성 인식장치 및 이것을 이용한 전화기
GB2188812A (en) Telephone answering device
KR19990011023A (ko) 기능모드의 음성 인식이 가능한 디지털 휴대용 전화기 및 그 인식방법
JPH04504178A (ja) 音声処理装置とそのための方法
JP3113449B2 (ja) 画像認識ダイヤル装置
KR100189252B1 (ko) 자동응답전화기에서 사서함 녹음방법
JPS63299446A (ja) 音声等の音による機械入力方式
KR950009425B1 (ko) 음성인식 전화기의 다이얼링 제어 방법
KR100640345B1 (ko) 음성인식이 가능한 전화기에서 음성 안내방법
KR930011198B1 (ko) 음성인식 및 디스플레이기능을 갖는 전화기
JP2830508B2 (ja) 電話機
JPH06205101A (ja) 留守番電話機
Lobanov et al. An intelligent telephone answering system using speech recognition.
JPH06152730A (ja) 電話装置
KR940013011A (ko) 전화기의 버튼음성발성방법
JPH0732419B2 (ja) 音声認識電話機
JPS63241597A (ja) 音声入力制御装置
JPH04167744A (ja) 留守番電話機
JPH02136898A (ja) 音声ダイヤリング装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 19971229

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee