KR980000037A - 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 및 그 방법 - Google Patents

한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 및 그 방법 Download PDF

Info

Publication number
KR980000037A
KR980000037A KR1019960019505A KR19960019505A KR980000037A KR 980000037 A KR980000037 A KR 980000037A KR 1019960019505 A KR1019960019505 A KR 1019960019505A KR 19960019505 A KR19960019505 A KR 19960019505A KR 980000037 A KR980000037 A KR 980000037A
Authority
KR
South Korea
Prior art keywords
korean
morpheme
phoneme
sentence
speech recognition
Prior art date
Application number
KR1019960019505A
Other languages
English (en)
Other versions
KR0157026B1 (ko
Inventor
구명완
장두성
Original Assignee
이준
한국전기통신공사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이준, 한국전기통신공사 filed Critical 이준
Priority to KR1019960019505A priority Critical patent/KR0157026B1/ko
Publication of KR980000037A publication Critical patent/KR980000037A/ko
Application granted granted Critical
Publication of KR0157026B1 publication Critical patent/KR0157026B1/ko

Links

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/04Electrically-operated educational appliances with audible presentation of the material to be studied

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어연속음성 인식시스템 및 그 방법에 관한 것으로, 한국어가 단어와 문장의 2단계가 아닌 형태소와 어절과 문장의 3단계의 구조를 가지고 있고 한국어 어절은 일정 갯수 이하로 정의할 수 있는 형태소들의 조합으로 이루어져 있음에 착안하여, 한국어의 음소 특징을 잘 반영할 수 있도록 고안된 한국어 기본음소단위군을 제안하고, 한국어의 각 형태소별로 이 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 만들어 이를 음성인식과정의 형태소인식부에서 샤용함으로써 비터비(Viterbi) 서치의 결과로 형태소 단위의 인식을 하고, 단어인식부에서 이 인식되어 지는 형태소들을 입력으로 형태소 문법을 이용하여 단어들의 리스트들 혹은 격자구조를 만들고, 문장인식부에서 이를 입력으로 올바른 인식문장을 선택하여 적어도 한 개 이상의 문장을 만들어 출력함으로써, 한국어의 음소단위를 모두 표현할 수 있고, 제한된 갯수의 형태소를 가지고도 무제한 한국어 연속음성 인식시스템을 구현할 수 있으며, 한국어에서 형태소들끼리의 연관관계 및 가능성, 어절들이 문장을 이루는 연관관계 및 가능성을 각 인식단계별로 손쉽게 사용하여 음성인식률을 높일 수 있는 효과가 있다.

Description

한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 및 그 방법
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명에 따른 기본음소단위군의 분류도.
제2도는 본 발명에 따른 한국어 형태소 발음사전을 만들기 위해 사용되는 한국어기본음소위군에 대한 설명도.
제3도는 본 발명에 따른 확장된 기본음소단위군을 만드는 연음소에 대한 설명도.
제4도는 본 발명의 일실시예에 따른 한국어 연속음성 인식시스템의 구성도.

Claims (8)

  1. 입력음성의 특징을 추출하는 특징 추출 수단(41); 음성인식의 기본단위를 모델링한 서브워드 모델(44)과 각 형태소들이 기본단위들로 구성된 한국어 형태소 발음사전(45)을 이용하여 형태소를 모델링하는 형태소 모델링 수단(43); 상기 특징 추출 수단(41)과 형태소 모델링 수단(43)의 출력을 입력받아 비터(Viterbi) 탐색을 통해 음성을 형태소 단위로 인식하는 형태소 인식 수단(42); 및 각 형태소들간의 연결 가능성을 기록한 형태소 문법 또는 형태소들이 문장을 이루는 연관관계와 그 가능성을 기록한 형태 구문 문법(47)을 사용하여 상기 형태소 인식 수단(42)에서 새로 인식된 형태소가 형태소가 형태소 문법에 적합한지를 검사하여 적합하지 않을 경우에 다른 후보 형태소를 요구하여 문장을 인식하여 적어도 하나 이상의 문장을 선택하여 출력하는 문장 인식 수단(46)을 구비하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템.
  2. 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 적용되는 한국어 연속음성 인식 방법에 있어서, 한국어를 구성하는 각각의 형태소에 대해 그 기본형과 그 형태소가 단어를 이루게 될 때 음운의 축약, 탈락을 포함한 모든 활용 가능한 형태에 대해 발음변이형태를 생성하여 음소단위 리스트를 생성한 후에 형태소 발음사전에 등록하는 제1단계(51 내지 56); 및 매 프레임단위로 형태소 인식과 문장인식을 수행한 후에 음성의 발음이 끝난 마지막 프레임에서 하나 이상의 문장을 출력하는 제2단계(61 내지 66)를 포함하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식 방법.
  3. 제2항에 있어서, 상기 제1단계(51 내지 56)는, 하나의 형태소를 선택하여 그기본형에 대하여 발음변이형태를 생성하는 단계(51,52); 선택된 형태소가 실제 단어를 구성할 때 음운의 축약, 탈락을 포함한 활용을 하는지를 검사하여 모든 활용형에 대해 발음변이형태를 생성하는 단계(53,54); 모든 활용에 대하여 생성된 발음변이형태를 이용하여 한국어 기본음소단위군으로 이루어지는 음소단위 리스트를 생성하여 형태소 발음사전에 등록하는 단계(55,56); 및 모든 형태소에 대하여 상기 각 단계를 반복 수행하는 단계를 포함하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식 방법.
  4. 제2항 또는 제3항에 있어서, 상기 제2단계(61 내지 66)는, 입력된 음성에 대하여 초기화를 수행한 후에 마지막 프레임까지 입력음성에 대해 배 프레임 단위로 비터비(Viterbi) 계산을 수행하여 형태소를 이식한 후에 인식된 형태소에따라 문장 인식을 수행하는 단계(61 내지 65); 및 입력음성의 마지막 프레임에서 하나 이상의 문장을 출력하는 단계(66)를 포함하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식 방법.
  5. 입력음성의 특징을 추출하는 특징 추출 수단 (71); 음성인식의 기본단위를 모델링한 서브워드 모델(74)과 각 형태소들이 기본단위들로 구성된 한국어 형태소 발음 사전(75)을 이용하여 형태소를 모델링하는 형태소 모델링 수단(73); 상기 특징 추출 수단 (71)과 형태소 모델링 수단(73)의 출력을 입력받아 비터비(Viterbi) 탐색을 통해 음성을 형태소 단위로 인식하는 형태소 인식 수단 (72); 상기 형태소 인식 수단(72)의 출력을 입력받아 각 형태소들간의 연결 가능성을 기록한 형태소 문법(77)을 사용하여 문장을 인식한 후에 형태소들의 격자구조 또는 리스트를 출력하는 문장 인식 수단(76); 및 상기 문장 인식 수단(76)의 출력을 입력받아 형태소들이 문장을 이루는 연관관계와 그 가능성을 기록한 형태 구문 문법(79)을 사용하여 형태 구문 문법에 적합한 하나 이상의 문장을 출력하는 문장을 출력하는 문장 재인식 수단 (78)을 구비하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템.
  6. 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식 시스템에 적용되는 한국어 연속음성 인식 방법에 있어서, 한국어를 구성하는 각각의 형태소에 대해 그 기본형과 그 형태소가 단어를 이루게 될때 음운의 축약, 탈락을 포함한 모든 활용 가능한 형태에 대해 발음변이형태를 생성하여 음소단위 리스트를 생성한 후에 형태소 발음사전에 등록하는 제1단계(51 내지 56); 및 매 프레임단위로 형태소 인식과 문장인식을 수행한 후에 음성의 발음이 끝난 마지막 프레임에서 매 형태소 단위로 문장을 재인식하여 하나 이상의 문장을 출력하는 제2단계(81 내지 86)를 포함하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식 방법.
  7. 제6항에 있어서, 상기 제1단계(51 내지 56)는, 하나의 형태소를 선택하여 그 기본형에 대하여 발음변이형태를 생성하는 단계(51,52); 선택된 형태소가 실제 단어를 구성할 때 음운의 축약, 탈락을 포함한 활용을 하는지를 검사하여 모든 활용형에 대해 발음변이형태를 생성하는 단계(53,54); 모든 활용에 대하여 생성된 발음변이형태를 이용하여 한국어 기본음소단위군으로 이루어지는 음소단위 리스트를 생성하여 형태소 발음사전에 등록하는 단계(55,56); 및 모든 형태소에 대하여 상기 각 단계를 반복 수행하는 단계를 포함하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식 방법.
  8. 제6항 또는 제7항에 있어서, 상기 제2단계(81 내지 86)는, 입력된 음성에 대하여 초기화를 수행한 후에 마지막 프레임까지 입력 음성에 대해 매 프레임 단위로 비터비(Viterbi) 계산을 수행하여 형태소를 인식한 후에 인식된 형태소에 따라 문장 인식을 수행하는 단계(81 내지 85); 및 입력음성의 마지막 프레임이면 매 프레임 단위로부터 매 형태소 단위로 문장 재인식을 수행하여 하나 이상의 문장을 출력하는 단계(86)를 포함하는 것을 특징으로 하는 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식 방법.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019960019505A 1996-06-01 1996-06-01 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 및 그 방법 KR0157026B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019960019505A KR0157026B1 (ko) 1996-06-01 1996-06-01 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019960019505A KR0157026B1 (ko) 1996-06-01 1996-06-01 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 및 그 방법

Publications (2)

Publication Number Publication Date
KR980000037A true KR980000037A (ko) 1998-03-30
KR0157026B1 KR0157026B1 (ko) 1999-02-18

Family

ID=19460596

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960019505A KR0157026B1 (ko) 1996-06-01 1996-06-01 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 및 그 방법

Country Status (1)

Country Link
KR (1) KR0157026B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100735820B1 (ko) * 2006-03-02 2007-07-06 삼성전자주식회사 휴대 단말기에서 음성 인식에 의한 멀티미디어 데이터 검색방법 및 그 장치

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100931786B1 (ko) * 2002-06-20 2009-12-14 주식회사 케이티 한국어 철자 발화에 따른 음성인식 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100735820B1 (ko) * 2006-03-02 2007-07-06 삼성전자주식회사 휴대 단말기에서 음성 인식에 의한 멀티미디어 데이터 검색방법 및 그 장치
US8200490B2 (en) 2006-03-02 2012-06-12 Samsung Electronics Co., Ltd. Method and apparatus for searching multimedia data using speech recognition in mobile device

Also Published As

Publication number Publication date
KR0157026B1 (ko) 1999-02-18

Similar Documents

Publication Publication Date Title
Hirsimaki et al. Importance of high-order n-gram models in morph-based speech recognition
JP5322655B2 (ja) 莫大な語彙を有する音声認識システム
US6067520A (en) System and method of recognizing continuous mandarin speech utilizing chinese hidden markou models
US5875426A (en) Recognizing speech having word liaisons by adding a phoneme to reference word models
KR101424193B1 (ko) 타 언어권 화자음성에 대한 음성인식 시스템의 성능 향상을위한 비직접적 데이터 기반 발음변이 모델링 시스템 및방법
Masmoudi et al. Phonetic tool for the Tunisian Arabic
KR100726875B1 (ko) 구두 대화에서의 전형적인 실수에 대한 보완적인 언어모델을 갖는 음성 인식 디바이스
KR100573870B1 (ko) 대화체 연속음성인식을 위한 의사형태소 기반다중발음사전 구축 방법 및 그 시스템과 이를 이용한대화체 음성인식 방법
Chung et al. Automatic acquisition of names using speak and spell mode in spoken dialogue systems
Ronzhin et al. Implementation of morphemic analysis for Russian speech recognition
KR980000037A (ko) 한국어 기본음소단위군으로 구성한 한국어 형태소 발음사전을 사용한 한국어 연속음성 인식시스템 및 그 방법
KR100736496B1 (ko) 연속 음성인식기의 성능 개선 방법
Nursetyo LatAksLate: Javanese script translator based on Indonesian speech recognition using sphinx-4 and *** API
Sazhok et al. Punctuation Restoration for Ukrainian Broadcast Speech Recognition System based on Bidirectional Recurrent Neural Network and Word Embeddings.
Win et al. Review and perspectives of natural language processing for speech recognition
KR100511247B1 (ko) 음성 인식 시스템의 언어 모델링 방법
KR960030079A (ko) 의존문법을 후향 언어모델로 사용하는 한국어 연속음성 인식장치 및 방법과 그를 이용한 자동통역시스템
KR100554950B1 (ko) 한국어 대화체 음성합성시스템의 특정 형태에 대한 선택적운율 구현 방법
JP2001188556A (ja) 音声認識方法及び装置
JP6023543B2 (ja) 記号列変換方法とそれを用いた音声認識方法と、それらの装置とプログラムとその記録媒体
Phull et al. Ameliorated language modelling for lecture speech recognition of Indian English
KR100614933B1 (ko) 대화체 및 낭독체 대어휘 연속음성인식시스템의 고빈도어휘열 인식단위 생성장치 및 그 방법
Huerta et al. The development of the 1997 CMU Spanish broadcast news transcription system
Jose et al. Initial experiments with Tamil LVCSR
Fegyó et al. Pronunciation Modeling in Hungarian Number Recognition

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120706

Year of fee payment: 15

FPAY Annual fee payment

Payment date: 20130705

Year of fee payment: 16

LAPS Lapse due to unpaid annual fee