KR980000037A

KR980000037A - 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 및 그 방법

Info

Publication number: KR980000037A
Application number: KR1019960019505A
Authority: KR
Inventors: 구명완; 장두성
Original assignee: 이준; 한국전기통신공사
Priority date: 1996-06-01
Filing date: 1996-06-01
Publication date: 1998-03-30
Also published as: KR0157026B1

Abstract

본 발명은 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어연속음성 인식시스템 및 그 방법에 관한 것으로, 한국어가 단어와 문장의 2단계가 아닌 형태소와 어절과 문장의 3단계의 구조를 가지고 있고 한국어 어절은 일정 갯수 이하로 정의할 수 있는 형태소들의 조합으로 이루어져 있음에 착안하여, 한국어의 음소 특징을 잘 반영할 수 있도록 고안된 한국어 기본음소단위군을 제안하고, 한국어의 각 형태소별로 이 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 만들어 이를 음성인식과정의 형태소인식부에서 샤용함으로써 비터비(Viterbi) 서치의 결과로 형태소 단위의 인식을 하고, 단어인식부에서 이 인식되어 지는 형태소들을 입력으로 형태소 문법을 이용하여 단어들의 리스트들 혹은 격자구조를 만들고, 문장인식부에서 이를 입력으로 올바른 인식문장을 선택하여 적어도 한 개 이상의 문장을 만들어 출력함으로써, 한국어의 음소단위를 모두 표현할 수 있고, 제한된 갯수의 형태소를 가지고도 무제한 한국어 연속음성 인식시스템을 구현할 수 있으며, 한국어에서 형태소들끼리의 연관관계 및 가능성, 어절들이 문장을 이루는 연관관계 및 가능성을 각 인식단계별로 손쉽게 사용하여 음성인식률을 높일 수 있는 효과가 있다.

Description

한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 및 그 방법

본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음

제1도는 본 발명에 따른 기본음소단위군의 분류도.

제2도는 본 발명에 따른 한국어 형태소 발음사전을 만들기 위해 사용되는 한국어기본음소위군에 대한 설명도.

제3도는 본 발명에 따른 확장된 기본음소단위군을 만드는 연음소에 대한 설명도.

제4도는 본 발명의 일실시예에 따른 한국어 연속음성 인식시스템의 구성도.

Claims

입력음성의 특징을 추출하는 특징 추출 수단(41); 음성인식의 기본단위를 모델링한 서브워드 모델(44)과 각 형태소들이 기본단위들로 구성된 한국어 형태소 발음사전(45)을 이용하여 형태소를 모델링하는 형태소 모델링 수단(43); 상기 특징 추출 수단(41)과 형태소 모델링 수단(43)의 출력을 입력받아 비터(Viterbi) 탐색을 통해 음성을 형태소 단위로 인식하는 형태소 인식 수단(42); 및 각 형태소들간의 연결 가능성을 기록한 형태소 문법 또는 형태소들이 문장을 이루는 연관관계와 그 가능성을 기록한 형태 구문 문법(47)을 사용하여 상기 형태소 인식 수단(42)에서 새로 인식된 형태소가 형태소가 형태소 문법에 적합한지를 검사하여 적합하지 않을 경우에 다른 후보 형태소를 요구하여 문장을 인식하여 적어도 하나 이상의 문장을 선택하여 출력하는 문장 인식 수단(46)을 구비하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템.
한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 적용되는 한국어 연속음성 인식 방법에 있어서, 한국어를 구성하는 각각의 형태소에 대해 그 기본형과 그 형태소가 단어를 이루게 될 때 음운의 축약, 탈락을 포함한 모든 활용 가능한 형태에 대해 발음변이형태를 생성하여 음소단위 리스트를 생성한 후에 형태소 발음사전에 등록하는 제1단계(51 내지 56); 및 매 프레임단위로 형태소 인식과 문장인식을 수행한 후에 음성의 발음이 끝난 마지막 프레임에서 하나 이상의 문장을 출력하는 제2단계(61 내지 66)를 포함하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식 방법.
제2항에 있어서, 상기 제1단계(51 내지 56)는, 하나의 형태소를 선택하여 그기본형에 대하여 발음변이형태를 생성하는 단계(51,52); 선택된 형태소가 실제 단어를 구성할 때 음운의 축약, 탈락을 포함한 활용을 하는지를 검사하여 모든 활용형에 대해 발음변이형태를 생성하는 단계(53,54); 모든 활용에 대하여 생성된 발음변이형태를 이용하여 한국어 기본음소단위군으로 이루어지는 음소단위 리스트를 생성하여 형태소 발음사전에 등록하는 단계(55,56); 및 모든 형태소에 대하여 상기 각 단계를 반복 수행하는 단계를 포함하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식 방법.
제2항 또는 제3항에 있어서, 상기 제2단계(61 내지 66)는, 입력된 음성에 대하여 초기화를 수행한 후에 마지막 프레임까지 입력음성에 대해 배 프레임 단위로 비터비(Viterbi) 계산을 수행하여 형태소를 이식한 후에 인식된 형태소에따라 문장 인식을 수행하는 단계(61 내지 65); 및 입력음성의 마지막 프레임에서 하나 이상의 문장을 출력하는 단계(66)를 포함하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식 방법.
입력음성의 특징을 추출하는 특징 추출 수단 (71); 음성인식의 기본단위를 모델링한 서브워드 모델(74)과 각 형태소들이 기본단위들로 구성된 한국어 형태소 발음 사전(75)을 이용하여 형태소를 모델링하는 형태소 모델링 수단(73); 상기 특징 추출 수단 (71)과 형태소 모델링 수단(73)의 출력을 입력받아 비터비(Viterbi) 탐색을 통해 음성을 형태소 단위로 인식하는 형태소 인식 수단 (72); 상기 형태소 인식 수단(72)의 출력을 입력받아 각 형태소들간의 연결 가능성을 기록한 형태소 문법(77)을 사용하여 문장을 인식한 후에 형태소들의 격자구조 또는 리스트를 출력하는 문장 인식 수단(76); 및 상기 문장 인식 수단(76)의 출력을 입력받아 형태소들이 문장을 이루는 연관관계와 그 가능성을 기록한 형태 구문 문법(79)을 사용하여 형태 구문 문법에 적합한 하나 이상의 문장을 출력하는 문장을 출력하는 문장 재인식 수단 (78)을 구비하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템.
한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식 시스템에 적용되는 한국어 연속음성 인식 방법에 있어서, 한국어를 구성하는 각각의 형태소에 대해 그 기본형과 그 형태소가 단어를 이루게 될때 음운의 축약, 탈락을 포함한 모든 활용 가능한 형태에 대해 발음변이형태를 생성하여 음소단위 리스트를 생성한 후에 형태소 발음사전에 등록하는 제1단계(51 내지 56); 및 매 프레임단위로 형태소 인식과 문장인식을 수행한 후에 음성의 발음이 끝난 마지막 프레임에서 매 형태소 단위로 문장을 재인식하여 하나 이상의 문장을 출력하는 제2단계(81 내지 86)를 포함하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식 방법.
제6항에 있어서, 상기 제1단계(51 내지 56)는, 하나의 형태소를 선택하여 그 기본형에 대하여 발음변이형태를 생성하는 단계(51,52); 선택된 형태소가 실제 단어를 구성할 때 음운의 축약, 탈락을 포함한 활용을 하는지를 검사하여 모든 활용형에 대해 발음변이형태를 생성하는 단계(53,54); 모든 활용에 대하여 생성된 발음변이형태를 이용하여 한국어 기본음소단위군으로 이루어지는 음소단위 리스트를 생성하여 형태소 발음사전에 등록하는 단계(55,56); 및 모든 형태소에 대하여 상기 각 단계를 반복 수행하는 단계를 포함하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식 방법.
제6항 또는 제7항에 있어서, 상기 제2단계(81 내지 86)는, 입력된 음성에 대하여 초기화를 수행한 후에 마지막 프레임까지 입력 음성에 대해 매 프레임 단위로 비터비(Viterbi) 계산을 수행하여 형태소를 인식한 후에 인식된 형태소에 따라 문장 인식을 수행하는 단계(81 내지 85); 및 입력음성의 마지막 프레임이면 매 프레임 단위로부터 매 형태소 단위로 문장 재인식을 수행하여 하나 이상의 문장을 출력하는 단계(86)를 포함하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식 방법.

※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.