KR100397435B1 - 음성인식시스템에서새로운등록단어처리가가능한클래식를이용한언어학적모델처리방법 - Google Patents

음성인식시스템에서새로운등록단어처리가가능한클래식를이용한언어학적모델처리방법 Download PDF

Info

Publication number
KR100397435B1
KR100397435B1 KR1019960029444A KR19960029444A KR100397435B1 KR 100397435 B1 KR100397435 B1 KR 100397435B1 KR 1019960029444 A KR1019960029444 A KR 1019960029444A KR 19960029444 A KR19960029444 A KR 19960029444A KR 100397435 B1 KR100397435 B1 KR 100397435B1
Authority
KR
South Korea
Prior art keywords
new
word
class
registration
probability
Prior art date
Application number
KR1019960029444A
Other languages
English (en)
Other versions
KR980011006A (ko
Inventor
홍준모
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1019960029444A priority Critical patent/KR100397435B1/ko
Publication of KR980011006A publication Critical patent/KR980011006A/ko
Application granted granted Critical
Publication of KR100397435B1 publication Critical patent/KR100397435B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0635Training updating or merging of old and new templates; Mean values; Weighting
    • G10L2015/0636Threshold criteria for the updating

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 음성인식 시스템에서 새로운 단어의 추가에 따라 등록클래스를 생성하여 언어학적 모델을 처리하는 방법에 관한 것이다.
이를 위하여, 본 발명은 새로운 단어가 등록될 시 새로운 등록 클래스를 설정하여 상기 등록클래스의 연결 확률 및 단어의 발생 확률을 결정하여 언어학적 모델을 처리한다.

Description

음성인식 시스템에서 새로운 등록단어 처리가 가능한 클래스를 이용한 언어학적 모델처리방법
본 발명은 음성 인식 시스템에 있어서, 새로운 단어의 추가에 따라 등록 클래스를 생성하여 언어학적 모델을 처리하는 방법에 관한 것이다.
일반적으로 음성 인식 시스템에서 음성 인식을 하기 위해서 언어학적 모델(language model)을 처리한다. 언어학적 모델(language model)이란 단어들의 시퀀스(sequence)가 있을 때 그것들이 나올 수 있는 확률을 계산하는 수식과 확률을 구하기까지의 일련의 과정으로 정의할 수 있다. 통상적으로 문장을 구성하고 있는 단어의 시퀀스가 발생될 확률을 구하는 동작을 제1도를 참조하여 설명하면, 먼저 101단계에서 키보드를 이용하여 인식할 단어의 범위와 수를 결정하고 이 단어들이 들어 있는 문장을 구성한다. 그리고 102단계에서 언어학적 모델에서 사용되는 수식과 주어진 학습문장의 정보를 이용하여 단어상호간의 연결확률을 결정한다. 그런 후 103단계에서 단어상호간의 연결확률이 결정되면 그것을 이용하여 발생할 문장확률을 계산한다. 언어학적 모델은 음향학적 지식을 통해 구해진 단어들의 여러 시퀀스 가운데서 발생 가능한 가장 합리적인 후보를 찾기 위해 사용한다. 언어학적 모델(language model)중에서 이전의 N개의 단어가 현재 나타나는 단어의 확률에 영향을 끼친다고 가정한 모델을 N-gram language model이라 한다. 즉 w1부터 wN까지의 같은 단어들이 순차적으로 나온다고 가정하면, 이것이 나올 확률은 하기 식<1>에 의해 구해진다.
N-gram model중에서도 직 전의 1단어에 의해 확률이 결정되는 bigram model과 직전의 2단어에 의한 확률이 결정되는 trigram model이 많이 사용된다. 그런데, 대상 단어의 수가 많아지면 모든 biram과 trigram을 다루기가 힘들다. 이는 학습문장이 무한개의 단어열을 가지지 못했기 때문에 존재하지 않는 bigram과 trigram이 있을 경우가 많을 뿐만 아니라 다루어야 하는 정보의 양도 너무 많아 현재의 시스템에서 효과적으로 구현하기가 어렵기 때문이다. 따라서 단어들을 몇 개씩 나눈 집합을 클래스라 하는데, 이 클래스를 이용하여 단어에 대한 발생확률을 구하기 위한기술이 나오게 되었다. 이 클래스를 이용하여 단어에 대한 발생확률을 구하는 동작을 제2도를 참조하여 설명하면, 201단계에서 키보드를 이용하여 인식할 단어의 범위와 수를 결정하고 이 단어들이 들어 있는 학습문장을 구성한다. 그리고 202단계에서 구성한 학습문장에 대한 일정수의 클래스를 정하여 클래스 상호간의 연결확률과 클래스 내에서 단어가 발생할 확률을 식<2>에 의해 결정한다. 단어가 발생할 확률을 결정하기 위해서는 식 <2>와 같이 w1이란 단어 뒤에 w2가 올 확률은 w1이 속하는 클래스 g1뒤에 w2가 속한 클래스 g2가 올 확률에다가 클래스 g2내에서 w2가 나을 확률을 곱하면 된다.
그런 후 204단계에서는 이와 같이 결정된 단어가 발생할 확률을 이용하여 발생할 문장확률을 구한다. 그런데 상기와 같은 종래의 방법은 단어가 발생될 확률이 결정되어 있는 상태에서 새로운 단어가 추가되면 이미 결정된 클래스를 가지고 새로운 단어에 대한 발생확률을 구할 수 없는 문제점이 있다.
따라서 본 발명의 목적은 음성 인식 시스템에서 새로운 단어의 추가에 따라 등록클래스를 생성하여 언어학적 모델을 처리하는 방법을 제공함에 있다.
본 발명의 다른 목적은 새로운 단어가 추가될 시 단어열의 발생확률을 계산할 수 있는 언어학적 모델 처리방법을 제공함에 있다.
상기 목적을 달성하기 위한 본 발명은 새로운 단어가 등록될 시 새로운 등록 클래스를 설정하여 등록클래스의 연결 확률 및 단어의 발생 확률을 결정하여 언어학적 모델을 처리함을 특징으로 한다.
이하 본 발명을 첨부한 도면을 참조하여 본 발명의 바람직한 일 실시 예를 상세히 설명한다.
제3도는 본 발명의 실시 예에 따른 음성 인식 시스템의 블록 구성도이다.
키보드 10는 음성인식을 위한 각종 기능키를 발생하여 CPU 12로 인가한다. 롬 14는 음성인식을 위해 등록된 클래스에 따라 단어의 발생확률을 결정하기 위한 프로그램을 저장하고 있다. 램 16은 단어의 발생확률을 결정하기 위한 각종 데이타를 일시적으로 저장한다. CPU 12는 새로이 등록되는 단어를 입력받아 새로운 클래스를 생성하여 클래스 내에 첨가된 단어의 확률을 계산할 수 있도록 제어한다. 마이크 18는 인식할 음성신호를 전기적신호로 변환한다. A/D변환기 20는 전기적신호 변환된 음성신호를 디지탈 신호로 변환하여 상기 CPU 12로 인가한다. 모니터 22는 CPU 12의 제어에 의해 각종 데이타를 디스플레이한다.
제4도는 본 발명의 실시 예에 적용되는 언어학적 모델처리 제어 흐름도이다.
상술한 제3도 및 제4도를 참조하여 본 발명의 바람직한 일 실시 예의 동작을 상세히 설명한다.
먼저 301단계에서 키보드 10을 통해 새로운 단어를 입력하면 CPU 12로 인가되어 CPU 12는 램 16에 새로운 단어를 등록시킨다. 그런 후 302단계에서 CPU 12는 첫 번째 새로운 단어가 등록되었는가 검색한다. 이때 첫 번째 단어등록이 아니면 303단계로 진행하여 CPU 12는 새로운 등록클래스를 설정할 것인가 검색한다. 새로운 등록 클래스를 설정할 것이 아니면 304단계로 진행하여 그 단어가 가지고 있는문법적 성질이 현재 존재하는 등록클래스의 성질과 동일하면 새로운 클래스를 생성하지 않아도 되므로, 기존 클래스 내에 단어를 삽입하고 306단계로 진행한다. 그리고 303단계에서 새로운 등록 클래스 설정이면 305단계로 진행하여 새로운 등록 클래스를 등록한다. 즉, 단어의 집합이 정해지고 K개의 클래스로 나누어 문장을 학습시켰다고 가정하면 현재 K개의 클래스가 존재하므로 최초의 새로운 단어가 등록되면 K+1번째의 새로운 클래스가 생성된다. 다음으로 306단계에서 등록 클래스가 새로 생성될 때마다 다른 모든 클래스들과의 상호 연결확률 및 단어의 발생확률을 결정한다. 즉, 등록 클래스 gR1이 새로 첨가되었다면 bigram의 경우 현재 존재하는 모든 클래스 i에 대해 Pr(gi/gR1)과 Pr(gR1/gi)을 구해준다. 이러한 확률을 구하는 방법은 여러 가지가 있으나 일예로 기존의 K개의 클래스 중에서 성질이 가장 비슷한 것 1개를 본뜨거나 여러 개의 평균을 구할 수 있다. 그런 후 307단계에서 클래스 내에 첨가된 단어에 대하여 그 클래스 내에서 첨가된 단어가 발생될 문장확률을 정한다.
이와 같이 본 발명은, 음성인식 시스템에서 새로운 추가 단어에 대한 단어간 연결확률을 결정할 시 새로운 단어의 추가에 따라 등록클래스를 생성하여 문장을 이용한 별도의 학습없이도 음성인식률을 향상시킬수 있는 잇점이 있다.
제1도는 일반적인 문장을 구성하고 있는 단어의 시퀀스가 발생될 확률을 구하기 위한 제어 흐름도
제2도는 일반적인 클래스를 이용하여 단어에 대한 발생확률을 구하기 위한 제어 흐름도
제3도는 본 발명의 실시 예에 따른 음성인식 시스템의 블럭구성도
제4도는 본 발명의 실시 예에 적용되는 언어학적 모델처리 제어 흐름도

Claims (2)

  1. 음성인식 시스템에서 새로운 등록단어 처리가 가능한 클래스를 이용한 언어학적 모델처리방법에 있어서,
    새로운 단어가 등록될 시 새로운 등록 클래스를 설정하여 상기 등록클래스의 연결 확률 및 단어의 발생 확률을 결정하여 언어학적 모델을 처리함을 특징으로 하는 방법.
  2. 음성인식 시스템에서 새로운 등록단어 처리가 가능한 클래스를 이용한 언어학적 모델처리방법에 있어서,
    사용자에 의해 단어가 등록될 시 최초의 새로운 단어인지 검색하는 과정과,
    상기 등록된 단어가 최초의 새로운 단어일 경우 새로운 등록 클래스를 생성하는 과정과,
    상기 등록된 단어가 최초의 새로운 단어가 아닐 경우 새로운 등록클래스를 설정할 것인지 여부를 검출하는 과정과,
    상기 새로운 등록 클래스를 설정할 경우 새로운 등록 클래스를 생성하는 과정과,
    상기 새로운 등록클래스를 생성한 후 상기 등록클래스의 연결확률 및 단어의 발생확률을 결정하는 과정으로 이루어 짐을 특징으로 하는 방법.
KR1019960029444A 1996-07-20 1996-07-20 음성인식시스템에서새로운등록단어처리가가능한클래식를이용한언어학적모델처리방법 KR100397435B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019960029444A KR100397435B1 (ko) 1996-07-20 1996-07-20 음성인식시스템에서새로운등록단어처리가가능한클래식를이용한언어학적모델처리방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019960029444A KR100397435B1 (ko) 1996-07-20 1996-07-20 음성인식시스템에서새로운등록단어처리가가능한클래식를이용한언어학적모델처리방법

Publications (2)

Publication Number Publication Date
KR980011006A KR980011006A (ko) 1998-04-30
KR100397435B1 true KR100397435B1 (ko) 2003-12-24

Family

ID=37422173

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960029444A KR100397435B1 (ko) 1996-07-20 1996-07-20 음성인식시스템에서새로운등록단어처리가가능한클래식를이용한언어학적모델처리방법

Country Status (1)

Country Link
KR (1) KR100397435B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107678309B (zh) * 2017-09-01 2021-07-06 科大讯飞股份有限公司 操控句式生成、应用操控方法及装置、存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5812974A (en) * 1993-03-26 1998-09-22 Texas Instruments Incorporated Speech recognition using middle-to-middle context hidden markov models
US5873061A (en) * 1995-05-03 1999-02-16 U.S. Philips Corporation Method for constructing a model of a new word for addition to a word model database of a speech recognition system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5812974A (en) * 1993-03-26 1998-09-22 Texas Instruments Incorporated Speech recognition using middle-to-middle context hidden markov models
US5873061A (en) * 1995-05-03 1999-02-16 U.S. Philips Corporation Method for constructing a model of a new word for addition to a word model database of a speech recognition system

Also Published As

Publication number Publication date
KR980011006A (ko) 1998-04-30

Similar Documents

Publication Publication Date Title
CN108510976B (zh) 一种多语言混合语音识别方法
CN107305768B (zh) 语音交互中的易错字校准方法
US6346894B1 (en) Method and system for intelligent text entry on a numeric keypad
JP7108675B2 (ja) 意味マッチング方法、装置、電子機器、記憶媒体及びコンピュータプログラム
RU2377664C2 (ru) Способ ввода текста
CN112149406A (zh) 一种中文文本纠错方法及***
JP4105841B2 (ja) 音声認識方法、音声認識装置、コンピュータ・システムおよび記憶媒体
KR101279676B1 (ko) 언어 모델을 생성하기 위한 방법, 가나-간지 변환 방법 및그 장치
KR20060043825A (ko) 문자 대 음성 변환을 위한 단어 분절 방법
US20030046078A1 (en) Supervised automatic text generation based on word classes for language modeling
JP4930379B2 (ja) 類似文検索方法、類似文検索システム及び類似文検索用プログラム
JP2005084681A (ja) 意味的言語モデル化および信頼性測定のための方法およびシステム
JP4570509B2 (ja) 読み生成装置、読み生成方法及びコンピュータプログラム
JP3992348B2 (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
JP2000298667A (ja) 構文情報による漢字変換装置
KR20120052591A (ko) 연속어 음성인식 시스템에서 오류수정 장치 및 방법
KR100397435B1 (ko) 음성인식시스템에서새로운등록단어처리가가능한클래식를이용한언어학적모델처리방법
JP3950957B2 (ja) 言語処理装置および方法
JP4478088B2 (ja) 記号列変換方法、音声認識方法、記号列変換装置とプログラム、記録媒体
JP2006107353A (ja) 情報処理装置および方法、記録媒体、並びにプログラム
JP2003162524A (ja) 言語処理装置
JP5120749B2 (ja) 木構造辞書を記録した記憶媒体、木構造辞書作成装置、及び木構造辞書作成プログラム
KR101777141B1 (ko) 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법
CN114327090A (zh) 日文输入方法以及相关装置、设备
JP2817406B2 (ja) 連続音声認識方式

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20070629

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee