KR0157026B1 - 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 및 그 방법 - Google Patents

한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 및 그 방법 Download PDF

Info

Publication number
KR0157026B1
KR0157026B1 KR1019960019505A KR19960019505A KR0157026B1 KR 0157026 B1 KR0157026 B1 KR 0157026B1 KR 1019960019505 A KR1019960019505 A KR 1019960019505A KR 19960019505 A KR19960019505 A KR 19960019505A KR 0157026 B1 KR0157026 B1 KR 0157026B1
Authority
KR
South Korea
Prior art keywords
morpheme
korean
sentence
unit
basic
Prior art date
Application number
KR1019960019505A
Other languages
English (en)
Other versions
KR980000037A (ko
Inventor
구명완
장두성
Original Assignee
이준
한국전기통신공사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이준, 한국전기통신공사 filed Critical 이준
Priority to KR1019960019505A priority Critical patent/KR0157026B1/ko
Publication of KR980000037A publication Critical patent/KR980000037A/ko
Application granted granted Critical
Publication of KR0157026B1 publication Critical patent/KR0157026B1/ko

Links

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/04Electrically-operated educational appliances with audible presentation of the material to be studied

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 및 그 방법에 관한 것으로, 한국어가 단어와 문장의 2단계가 아닌 형태소와 어절과 문장의 3단계의 구조를 가지고 있고 한국어 어절은 일정 갯수 이하로 정의할 수 있는 형태소들의 조합으로 이루어져 있음에 착안하여, 한국어의 음소 특징을 잘 반영할 수 있도록 고안된 한국어 기본음소단위군을 제안하고, 한국어의 각 형태소 별로 이 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 만들어 이를 음성인식과정의 형태소인식부에서 사용함으로써 비터비(Viterbi) 서치의 결과로 형태소 단위의 인식을 하고, 단어인식부에서 이 인식되어지는 형태소들을 입력으로 형태소 문법을 이용하여 단어들의 리스트들 혹은 격자구조를 만들고, 문장인식부에서 이를 입력으로 올바른 인식문장을 선택하여 적어도 한 개 이상의 문장을 만들어 출력함으로써, 한국어의 음소단위를 모두 표현할 수 있고, 제한된 갯수의 형태소를 가지고도 무제한 한국어 연속음성 인식시스템을 구현할 수 있으며, 한국어에서 형태소들끼리의 연관관계 및 가능성, 어절들이 문장을 이루는 연관관계 및 가능성을 각 인식단계별로 손쉽게 사용하여 음성인식률을 높일 수 있는 효과가 있다.

Description

한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 및 그 방법
제1도는 본 발명에 따른 기본 음소단위군의 분류도.
제2도는 본 발명에 따른 한국어 형태소 발음사전을 만들기 위해 사용되는 한국어 기본음소단위군에 대한 설명도.
제3도는 본 발명에 따른 확장된 기본 음소단위군을 만드는 연음소에 대한 설명도.
제4도는 본 발명의 일실시예에 따른 한국어 연속음성 인식시스템의 구성도.
제5도는 본 발명에 다른 형태소 발음사전을 구성하는 흐름도.
제6도는 본 발명의 일실시예에 따른 한국어 연속음성 인식 방법의 흐름도.
제7도는 본 발명의 다른 실시예에 따른 한국어 연속음성 인식시스템의 구성도.
제8도는 본 발명의 다른 실시예에 따른 한국어 연속음성 인식 방법의 흐름도.
* 도면의 주요부분에 대한 부호의 설명
41,71 : 특징추출부 42,72 : 형태소인식부
43,73 : 형태소모델링부 44,74 : 서브워드 모델
45,75 : 형태소 발음사전 46,76 : 문장인식부
47 : 형태소 문법 또는 형태 구문 문법
77 : 형태소 문법 78 : 문장재인식부
79 : 형태 구문 문법
본 발명은 한국어 기본 음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 및 그 방법에 관한 것이다.
종래의 한국어 음성인식시스템은 인식의 단위를 어절로 할 때 그 인식하고자 하는 문장의 종류가 많아질수록 인식해야할 단어가 급속도로 증가하여 무제한 음성인식시스템이 될 수 없거나, 이를 해소하기 위해 인식단위를 수십개의 음소(자모)로 할 때 음소단위의 인식률이 떨어지기 때문에 그 문장 인식률이 현저하게 낮아지는 문제점이 있었다.
상기 문제점을 해결하기 위하여 안출된 본 발명은 한국어가 단어와 문장의 2단계가 아닌 형태소와 어절과 문장의 3단계의 구조를 가지고 있고 한국어 어절은 일정 갯수 이하로 정의할 수 있는 형태소들의 조합으로 이루어져 있음에 착안하여, 한국어의 음소 특징을 잘 반영할 수 있도록 고안된 한국어 기본음소단위군을 제안하고, 한국어의 각 형태소 별로 이 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 만들어 이를 음성인식과정의 형태소인식부에서 사용함으로써 비터비(Viterbi) 탐색의 결과로 형태소 단위의 인식을 하고, 문장인식부에서 이를 입력으로 형태소들간의 연결가능성을 포함한 형태소 문법 또는 형태소들이 문장을 이루는 연결관계와 그 가능성을 나타내는 형태 구문 문법을 사용하여 올바른 인식문장을 선택하여 적어도 한 개 이상의 출력문장을 만드는 성능이 향상된 새로운 한국어 연속음성 인식 시스템 및 그 방법을 제공하는 데 그 목적이 있다.
상기 목적을 달성하기 위한 본 발명의 장치는 입력음성의 특징을 추출하는 특징 추출 수단; 음성인식의 기본단위를 모델링한 서브워드 모델과 각 형태소들이 기본단위들로 구성된 한국어 발음사전을 이용하여 형태소를 모델링하는 형태소 모델링 수단; 상기 특징 추출 수단과 형태소 모델링 수단의 출력을 입력받아 비터비(Viterbi) 탐색을 통해 음성을 형태소 단위로 인식하는 형태소 인식 수단; 및 각 형태소들간의 연결 가능성을 기록한 형태소 문법 또는 형태소들이 문장을 이루는 연관관계와 그 가능성을 기록한 형태 구문 문법을 사용하여 상기 형태소 인식수단에서 새로 인식된 형태소가 형태소 문법에 적합한지를 검사하여 적합하지 않을 경우에 다른 후보 형태소를 요구하여 문장을 인식하여 적어도 하나 이상의 문장을 선택하여 출력하는 문장 인식 수단을 구비하는 것을 특징으로 한다.
또한, 상기 목적을 달성하기 위한 본 발명의 방법은, 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성인식시스템에 적용되는 한국어 연속음성 인식 방법에 있어서, 한국어를 구성하는 각각의 형태소에 대해 그 기본형과 그 형태소가 단어를 이루게될 때 음운의 축약, 탈락을 포함한 모든 활용 가능한 형태에 대해 발음변이형태를 생성하여 음소단위 리스트를 생성한 후에 형태소 발음사전에 등록하는 제1단계; 및 매 프레임단위로 형태소인식과 문장인식을 수행한 후에 음성의 발음이 끝난 마지막 프레임에서 하나 이상의 문장을 출력하는 제2단계를 포함하는 것을 특징으로 한다.
상기 목적을 달성하기 위한 본 발명의 다른 장치는 입력음성의 특징을 추출하는 특징 추출 수단; 음성인식의 기본단위를 모델링한 서브워드 모델과 각 형태소들이 기본단위들로 구성된 한국어 형태소 발음사전을 이용하여 형태소를 모델링하는 형태소 모델링 수단; 상기 특징 추출 수단과 형태소 모델링 수단의 출력을 입력받아 비터비(Viterbi) 탐색을 통해 음성을 형태소 단위로 인식하는 형태소 인식 수단; 상기 형태소 인식 수단의 출력을 입력받아 각 형태소들간의 연결 가능성을 기록한 형태소 문법을 사용하여 문장을 인식한 후에 형태소들의 격자구조 또는 리스트를 출력하는 문장 인식 수단; 및 상기 문장 인식 수단의 출력을 입력받아 형태소들이 문장을 이루는 연관관계와 그 가능성을 기록한 형태 구문문법을 사용하여 형태 구문 문법에 적합한 하나 이상의 문장을 출력하는 문장 재인식 수단을 구비하는 것을 특징으로 한다.
상기 목적을 달성하기 위한 본 발명의 다른 방법은 한국어를 구성하는 각각의 형태소에 대해 그 기본형과 그 형태소가 단어를 이루게 될 때 음운의 축약, 탈락을 포함한 모든 활용 가능한 형태에 대해 발음변이형태를 생성하여 음소단위 리스트를 생성한 후에 형태소 발음사전에 등록하는 제1단계; 및 매 프레임단위로 형태소인식과 문장인식을 수행한 후에 음성의 발음이 끝난 마지막 프레임에서 매 형태소 단위로 문장을 재인식하여 하나 이상의 문장을 출력하는 제2단계를 포함하는 것을 특징으로 한다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 실시예를 상세히 설명한다.
제1도는 본 발명에 따른 기본음소단위군의 분류도이다.
이러한 분류 방법은 기본음소단위군을 자음군, 모음군 및 묶음군으로 나누고, 자음군을 초성에 나올 수 있는 기본음소군, 유성음화된 기본음소군, 종성에 나오는 기본음소군, 구개음화된 기본음소군, 연구개화된 기본음소군, 마찰음화된 기본음소군, 접근음화된 기본음소군 및 외국어 발음시 나올 수 있는 기본음소군 등 8개의 하위 음소군으로 나누었으며, 모음군은 유성음 그대로의 기본음소군, 무성음화된 기본음소군, 반모음군 및 무성음화된 반모음군 등 4개의 하위 음소군으로 나누었다. 이 분류 방법에서는 이중모음을 독립된 하나의 음소로 분류하지 않고 반모음과 단모음의 결합으로 이중모음을 표기하였다.
제2도는 본 발명에 따른 한국어 형태소 발음사전을 만들기 위해 사용되는 한국어 기본음소단위군에 대한 설명도이다.
기본음소단위군은 4가지의 변형이 가능한 데, 그 첫 번째는 제2도에 나타난 71개의 기본음소단위군이며, 그 두 번째는 제2도의 기본음소단위군에서 특수표시(*)된 10개의 생략 가능한 음소를 뺀 61개의 최소 기본음소단위군이며, 그 세 번째는 기본음소단위군에 후술되는 제3도에 나타난 11개의 연음소를 더한 확장된 기본음소단위군이며, 그 네 번째는 61개의 최소 기본음소단위군에 11개의 연음소를 더한 확장된 최소 기본음소단위군이다.
제2도의 기본음소단위군은 한국어의 모든 형태소가 한국어에 존재하는 모든 가능한 음소규칙 및 변이음 규칙을 거친 후에 생기는 변이음들을 기호화하여 정의한 것으로서, 이 71개의 기본음소단위들을 조합하여 한국어의 발음된 모든 단어 및 문장을 표현할 수 있다. 또한, 이 한국어 기본음소단위군은 한국어 단어인식 및 연속음성인식의 기본단위로 사용되 수가 있다.
이들 기본음소단위군은 대부분 그 발화되는 환경이 일정한 규칙으로 기술하는 데 무리가 없을 정도로 일반적이다. 그러나, 발화되는 환경이 특정한 단어나 발화자에 의존적이어서 일정한 규칙으로 기술하기 어려운 제2도의 특수표시(*)된 10개의 생략 가능한 음소를 뺀 61개을 한국어 최소 기본음소단위군을 정의하였으며, 이 또한 한국어 단어인식 및 연속음성인식의 기본단위로 사용될 수 있다.
제3도는 본 발명에 따른 확장된 기본음소단위군을 만드는 연음소에 대한 설명도이다.
이 11개의 연음소는 71개의 기본음소단위군에서 일부 음소가 연이어 발음될 때 이를 하나의 기본음소로 취급한 것이며, 71개의 기본음소단위군에 이 11개의 연음소를 포함하여 82개의 확장된 기본음소단위군을 정의하였고, 61개의 최소 기본음소단위군에 이 11개의 연음소를 포함하여 72개의 확장된 최소 기본음소단위군을 정의하였다. 이들 또한 한국어 단어인식 및 연속음성인식의 기본단위로 사용될 수 있다.
제4도는 본 발명에 따른 한국어 연속음성 인식시스템의 구성도로서, 도면에서 41은 특징추출부, 42는 형태소인식부, 43은 형태소모델링부, 44는 서브워드 모델, 45는 형태소 발음사전, 46은 문장인식부, 47은 형태소 문법 또는 형태 구문 문법을 각각 나타낸다.
본 발명에 따른 한국어 연속음성 인식시스템은 음성인식의 단위를 형태소로 하고, 한국어의 음소특징을 잘 나타낼 수 있는 한국어 기본음소단위군으로 구성된 형태소 발음사전을 사용하며, 입력음성의 특징을 추출하는 특징추출부(41), 음성인식의 기본단위를 모델링한 서브워드 모델(44)과 각 형태소들이 이 기본단위들로 구성된 한국어 형태소 발음사전(45)을 이용하여 형태소를 모델링하는 형태소모델링부(43), 상기 특징추출부(41)와 형태소모델링부(43)의 출력을 입력받아 음성을 비터비(Viterbi) 탐색을 통해 형태소 단위로 인식하는 형태소인식부(42), 각 형태소들간의 연결 가능성을 기록한 형태소 문법 또는 형태소들이 문장을 이루는 연관관계와 그 가능성을 기록한 형태 구문 문법(47)을 사용하여 상기 형태소인식부(42)에서 새로 인식된 형태소가 형태소 문법에 적합한지를 검사하여 적합하지 않을 경우에 다른 후브 형태소를 요구하여 문장을 인식하여 적어도 하나 이상의 문장을 선택하여 출력하는 문장인식부(46)를 구비한다.
그 구체적인 동작을 살펴보면, 형태소모델링부(43)는 음성인식의 기본단위인 제2도의 기본음소단위군을 모델링한 서브워드 모델(44)과 형태소들을 기본음소단위군으로 구성한 형태소 발음사전(45)을 사용하여 형태소를 모델링한다. 형태소인식부(42)는 특징추출부(41)에서 추출된 입력음성의 특징과 형태소모델링부(43)를 이용하여 형태소 단위의 인식을 하며, 인식된 형태소는 문장인식부(46)에서 형태소 문법 또는 형태 구문 문법(47)을 이용하여 올바른 문장을 이룰 수 있는 형태소인지를 검증받는다. 이때, 만일 올바른 단어를 이룰 수 없는 형태소라면 문장인식부(46)는 다시 형태소인식부(42)로 또다른 형태소를 요구한다. 이러한 과정을 거쳐 문장을 인식하게 되며, 인식을 결과로 문법에 맞는 하나 이상의 문장을 출력하게 된다. 여기에서 형태소 문법은 형태소들간의 연결 가능성을, 형태 구문 문법은 형태소가 문장을 이루는 연관관계와 그 가능성을 포함하며, 연결관계와 연관관계는 언어적 지식을 표현하며, 그 가능성은 통계적 지식을 표현한다.
제5도는 본 발명에 따른 형태소 발음사전을 구성하는 흐름도로서, 한국어를 구성하는 각각의 형태소에 대해 그 기본형과 그 형태소가 단어를 이루게 될 때 음운의 축약, 탈락을 포함한 모든 활용 가능한 형태에 대해 발음변이형태를 생성하여 이들에 대한 음소단위 리스트를 만들어 그 형태소의 발음사전으로 등록한다. 여기에서 발음변이형태란 단어나 형태소가 발음되는 그대로를 받아 적은 형태이며, 음소단위 리스트는 제2도에서 설명한 한국어 기본음소단위군의 음소단위들로 구성된다. 예를 들면 국민이라는 단어에 대해 실제 발음될 때는 궁민으로 발음되게 되며, 이는 국민이라는 단어의 발음변이형태이다. 또한 궁민을 음소단위 리스트로 표현하게 되면 gl uu ng mm ii nn이 된다.
그 구체적인 동작을 살펴보면, 먼저 하나의 형태소를 선택하여(51) 그 기본형에 대하여 발음변이형태를 생성한다(52). 이후, 이 형태소가 실제 단어를 구성할 때 음운의 축약, 탈락을 포함한 활용을 하는지를 검사하여(53) 활용이 가능할 경우에 하나의 활용형을 선택하여 그 활용형에 대해 발음변이형태를 생성한다(54). 모든 활용에 대하여 발음변이형태를 생성한 후에 이를 이용하여 제2도에서 보였던 한국어 기본음소단위군으로 이루어지는 음소단위 리스트를 생성하여 형태소 발음사전에 등록한다(55). 이후, 음소단위 리스트를 만들어야 할 또 다른 형태소가 존재하는지를 검사하여(56) 있는 경우 또다른 형태소를 선택하여 더 이상 없으면 종료한다.
제6도는 본 발명에 따른 한국어 연속음성 인식 방법의 흐름도로서, 매 프레임단위로 형태소인식을 수행한 후에 문장 인식을 반복하고 음성의 발음이 끝난 마지막 프레임에서 하나 이상의 문장을 출력한 후에 종료한다.
그 구체적인 동작을 살펴보면, 입력된 음성에 대하여 초기화를 수행한 후에(61) 입력음성의 마지막 프레임인지를 판단한다(62). 마지막 프레임이 아니면 입력음성에 대해 매 프레임 단위로 비터비(Viterbi)계산을 수행한 후에(63) 계산 결과를 바탕으로 형태소를 인식한다(64). 인식된 형태소는 문장인식과정을 거쳐 마지막 프레임인지를 확인하는 과정을 반복한다(65). 입력음성의 마지막 프레임이면 하나 이상의 문장을 문장인식의 결과로 출력한 후에 종료한다(66).
제7도는 본 발명의 다른 실시예에 따른 한국어 연속음성 인식시스템의 구성도로서, 도면에서 71은 특징추출부, 72는 형태소인식부, 73은 형태소모델링부, 74는 서브워드 모델, 75는 형태소 발음사전, 76은 문장인식부, 77은 형태소 문법, 78은 문장재인식부, 79는 형태 구문 문법을 각각 나타낸다.
본 발명의 다른 실시예에 따른 한국어 연속음성 인식시스템은 입력음성의 특징을 추출하는 특징추출부(71), 음성인식의 기본단위를 모델링한 서브워드 모델(74)과 각 형태소들이 이 기본단위들로 구성된 한국어 형태소 발음사전(75)을 이용하여 형태소를 모델링하는 형태소모델링부(73), 상기 특징추출부(71)와 형태소모델링부(73)의 출력을 입력받아 음성을 비터비(Viterbi) 탐색을 통해 형태소 단위로 인식하는 형태소인식부(72), 상기 형태소인식부(72)의 출력을 입력받아 각 형태소들간의 연결 가능성을 기록한 형태소 문법(77)을 사용하여 문장을 인식한 후에 형태소들의 격자구조 또는 리스트를 출력하는 문장인식부(76), 및 상기 문장인식부(76)의 출력을 입력받아 형태소들이 문장을 이루는 연관관계와 그 가능성을 기록한 형태 구문 문법(79)을 사용하여 형태 구문 문법에 적합한 하나 이상의 문장을 출력하는 문장 재인식부(78)를 구비한다.
이러한 한국어 연속음성 인식시스템은 형태소 문법 또는 형태 구문 문법중의 하나만을 사용하는 한국어 연속음성 인식시스템과는 달리 두개의 문법을 동시에 사용하므로써 인식률을 증대시킬 수 있다.
제8도는 본 발명의 다른 실시예에 따른 한국어 연속음성 인식 방법의 흐름도이다.
먼저, 입력된 음성에 대하여 초기화를 수행한 후에(81) 입력음성의 마지막 프레임인지를 판단한다(82). 마지막 프레임이 아니면 입력음성에 대해 매 프레임 단위로 비터비(Viterbi) 계산을 수행한 후에(83) 계산 결과를 바탕으로 형태소를 인식한다(64). 인식된 형태소는 문장인식과정을 거쳐 마지막 프레임인지를 확인하는 과정을 반복한다(85). 입력음성의 마지막 프레임이면 매 프레임 단위로부터 매 형태소 단위로 문장 재인식을 수행하여 하나 이상의 문장을 출력한 후에 종료한다(86).
상기와 같은 본 발명은 한국어에서 음소 규칙 및 변이음 규칙을 거쳐 발음되는 모든 변이음들을 기호화하여 정의하여 한국어 기본음소단위군을 만들어 사용함으로써 한국어의 음소단위를 모두 표현할 수 있고, 이 정의된 음소단위들을 실제 음성인식에 사용할 때 형태소 발음사전을 구현하여 형태소 단위의 모델링을 함으로써 제한된 갯수의 형태소를 가지고도 무제한 한국어 연속음성 인식시스템을 구현할 수 있으며, 또한 한국어의 형태소와 어절과 문장의 3단계의 구조에 대응하는 형태소인식과 단어인식과 문장인식의 3단계를 거치므로 한국어에서 형태소들끼리의 연관관계 및 가능성, 어절들이 문장을 이루는 연관관계 및 가능성을 각 인식단계별로 손쉽게 사용하여 음성 인식률을 높일 수 있는 효과가 있다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로, 전술한 실시예 및 첨부된 도면에 한정되는 것이 아니다.

Claims (8)

  1. 입력음성의 특징을 추출하는 특징 추출 수단(41); 음성인식의 기본단위를 모델링한 서브워드 모델(44)과 각 형태소들이 기본단위들로 구성된 한국어 형태소 발음사전(45)을 이용하여 형태소를 모델링하는 형태소 모델링 수단(43); 상기 특징 추출 수단(41)과 형태소 모델링 수단(43)의 출력을 입력받아 비터비(Viterbi) 탐색을 통해 음성을 형태소 단위로 인식하는 형태소 인식 수단(42); 및 각 형태소들간의 연결 가능성을 기록한 형태소 문법 또는 형태소들이 문장을 이루는 연관관계와 그 가능성을 기록한 형태 구문 문법(47)을 사용하여 상기 형태소 인식수단(42)에서 새로 인식된 형태소가 형태소 문법에 적합한지를 검사하여 적합하지 않을 경우에 다른 후보 형태소를 요구하여 문장을 인식하여 적어도 하나 이상의 문장을 선택하여 출력하는 문장 인식 수단(46)을 구비하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템.
  2. 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템에 적용되는 한국어 연속음성 인식 방법에 있어서, 한국어를 구성하는 각각의 형태소에 대해 그 기본형과 그 형태소가 단어를 이루게 될 때 음운의 축약, 탈락을 포함한 모든 활용 가능한 형태에 대해 발음변이형태를 생성하여 음소단위 리스트를 생성한 후에 형태소 발음사전에 등록하는 제1단계(51 내지 56); 및 매 프레임단위로 형태소인식과 문장인식을 수행한 후에 음성의 발음이 끝난 마지막 프레임에서 하나 이상의 문장을 출력하는 제2단계(61 내지 66)를 포함하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식 방법.
  3. 제2항에 있어서, 상기 제1단계(51 내지 56)는, 하나의 형태소를 선택하여 그 기본형에 대하여 발음변이형태를 생성하는 단계(51,52); 선택된 형태소가 실제 단어를 구성할 때 음운의 축약, 탈락을 포함한 활용을 하는지를 검사하여 모든 활용형에 대해 발음변이형태를 생성하는 단계(53,54); 모든 활용에 대하여 생성된 발음변이형태를 이용하여 한국어 기본음소단위군으로 이루어지는 음소단위 리스트를 생성하여 형태소 발음사전에 등록하는 단계(55,56); 및 모든 형태소에 대하여 상기 각 단계를 반복 수행하는 단계를 포함하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식 방법.
  4. 제2항 또는 제3항에 있어서, 상기 제2단계(61 내지 66)는, 입력된 음성에 대하여 초기화를 수행한 후에 마지막 프레임까지 입력음성에 대해 매 프레임 단위로 비터비(Viterbi) 계산을 수행하여 형태소를 인식한 후에 인식된 형태소에 따라 문장 인식을 수행하는 단계(61 내지 65); 및 입력음성의 마지막 프레임에서 하나 이상의 문장을 출력하는 단계(66)를 포함하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식 방법.
  5. 입력음성의 특징을 추출하는 특징 추출 수단(71); 음성인식의 기본단위를 모델링한 서브워드 모델(74)과 각 형태소들이 기본단위들로 구성된 한국어 형태소 발음사전(75)을 이용하여 형태소를 모델링하는 형태소 모델링 수단(73); 상기 특징 추출 수단(71)과 형태소 모델링 수단(73)의 출력을 입력받아 비터비(Viterbi) 탐색을 통해 음성을 형태소 단위로 인식하는 형태소 인식 수단(72); 상기 형태소 인식 수단(72)의 출력을 입력받아 각 형태소들간의 연결 가능성을 기록한 형태소 문법(77)을 사용하여 문장을 인식한 후에 형태소들의 격자구조 또는 리스트를 출력하는 문장 인식 수단(76); 및 상기 문장 인식 수단(76)의 출력을 입력받아 형태소들이 문장을 이루는 연관관계와 그 가능성을 기록한 형태 구문 문법(79)을 사용하여 형태 구문 문법에 적합한 하나 이상의 문장을 출력하는 문장 재인식 수단(78)을 구비하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템.
  6. 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템에 적용되는 한국어 연속음성 인식 방법에 있어서, 한국어를 구성하는 각각의 형태소에 대해 그 기본형과 그 형태소가 단어를 이루게 될 때 음운의 축약, 탈락을 포함한 모든 활용 가능한 형태에 대해 발음변이형태를 생성하여 음소단위 리스트를 생성한 후에 형태소 발음사전에 등록하는 제1단계(51 내지 56); 및 매 프레임단위로 형태소인식과 문장인식을 수행한 후에 음성의 발음이 끝난 마지막 프레임에서 매 형태소 단위로 문장을 재인식하여 하나 이상의 문장을 출력하는 제2단계(81 내지 86)를 포함하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식 방법.
  7. 제6항에 있어서, 상기 제1단계(51 내지 56)는, 하나의 형태소를 선택하여 그 기본형에 대하여 발음변이형태를 생성하는 단계(51,52); 선택된 형태소가 실제 단어를 구성할 때 음운의 축약, 탈락을 포함한 활용을 하는지를 검사하여 모든 활용형에 대해 발음변이형태를 생성하는 단계(53,54); 모든 활용에 대하여 생성된 발음변이형태를 이용하여 한국어 기본음소단위군으로 이루어지는 음소단위 리스트를 생성하여 형태소 발음사전에 등록하는 단계(55,56); 및 모든 형태소에 대하여 상기 각 단게를 반복 수행하는 단계를 포함하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식 방법.
  8. 제6항 또는 제7항에 있어서, 상기 제2단계(81 내지 86)는, 입력된 음성에 대하여 초기화를 수행한 후에 마지막 프레임까지 입력음성에 대해 매 프레임 단위로 비터비(Viterbi) 계산을 수행하여 형태소를 인식한 후에 인식된 형태소에 따라 문장 인식을 수행하는 단계(81 내지 85); 및 입력음성의 마지막 프레임이면 매 프레임 단위로부터 매 형태소 단위로 문장 재인식을 수행하여 하나 이상의 문장을 출력하는 단계(86)를 포함하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식 방법.
KR1019960019505A 1996-06-01 1996-06-01 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 및 그 방법 KR0157026B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019960019505A KR0157026B1 (ko) 1996-06-01 1996-06-01 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019960019505A KR0157026B1 (ko) 1996-06-01 1996-06-01 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 및 그 방법

Publications (2)

Publication Number Publication Date
KR980000037A KR980000037A (ko) 1998-03-30
KR0157026B1 true KR0157026B1 (ko) 1999-02-18

Family

ID=19460596

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960019505A KR0157026B1 (ko) 1996-06-01 1996-06-01 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 및 그 방법

Country Status (1)

Country Link
KR (1) KR0157026B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100931786B1 (ko) * 2002-06-20 2009-12-14 주식회사 케이티 한국어 철자 발화에 따른 음성인식 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100735820B1 (ko) 2006-03-02 2007-07-06 삼성전자주식회사 휴대 단말기에서 음성 인식에 의한 멀티미디어 데이터 검색방법 및 그 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100931786B1 (ko) * 2002-06-20 2009-12-14 주식회사 케이티 한국어 철자 발화에 따른 음성인식 방법

Also Published As

Publication number Publication date
KR980000037A (ko) 1998-03-30

Similar Documents

Publication Publication Date Title
JP5014785B2 (ja) 表音ベース音声認識システム及び方法
JP5327054B2 (ja) 発音変動規則抽出装置、発音変動規則抽出方法、および発音変動規則抽出用プログラム
US7299178B2 (en) Continuous speech recognition method and system using inter-word phonetic information
Wang et al. Complete recognition of continuous Mandarin speech for Chinese language with very large vocabulary using limited training data
Kumar et al. Development of Indian language speech databases for large vocabulary speech recognition systems
JPH0772840B2 (ja) 音声モデルの構成方法、音声認識方法、音声認識装置及び音声モデルの訓練方法
Qian et al. A cross-language state sharing and mapping approach to bilingual (Mandarin–English) TTS
JPH08278794A (ja) 音声認識装置および音声認識方法並びに音声翻訳装置
KR102094935B1 (ko) 음성 인식 시스템 및 방법
KR101424193B1 (ko) 타 언어권 화자음성에 대한 음성인식 시스템의 성능 향상을위한 비직접적 데이터 기반 발음변이 모델링 시스템 및방법
Kayte et al. Implementation of Marathi Language Speech Databases for Large Dictionary
KR0157026B1 (ko) 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 및 그 방법
Liang et al. An hmm-based bilingual (mandarin-english) tts
JP3378547B2 (ja) 音声認識方法及び装置
Charoenrattana et al. Pali speech synthesis using HMM
Iyanda et al. Development of a Yorúbà Textto-Speech System Using Festival
Sun Using End-to-end Multitask Model for Simultaneous Language Identification and Phoneme Recognition
KR20030001668A (ko) 연속 음성인식기의 성능 개선 방법
Khusainov et al. Speech analysis and synthesis systems for the tatar language
Fegyó et al. Pronunciation Modeling in Hungarian Number Recognition
Sakib et al. A Sophisticated HCI Perspective: Advanced Bengali Phonetics Communication System for Disabled (Deaf and Dumb) Persons
Sher et al. Development of a Taiwanese Speech Synthesis System Using Hidden Markov Models and a Robust Tonal Phoneme Corpus
IMRAN ADMAS UNIVERSITY SCHOOL OF POST GRADUATE STUDIES DEPARTMENT OF COMPUTER SCIENCE
Tian et al. Modular design for Mandarin text-to-speech synthesis
Mariani The AESOP continuous speech understanding system

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120706

Year of fee payment: 15

FPAY Annual fee payment

Payment date: 20130705

Year of fee payment: 16

LAPS Lapse due to unpaid annual fee