KR20050123007A - A system for generating technique for generating korean phonetic alphabet - Google Patents

A system for generating technique for generating korean phonetic alphabet Download PDF

Info

Publication number
KR20050123007A
KR20050123007A KR1020040048709A KR20040048709A KR20050123007A KR 20050123007 A KR20050123007 A KR 20050123007A KR 1020040048709 A KR1020040048709 A KR 1020040048709A KR 20040048709 A KR20040048709 A KR 20040048709A KR 20050123007 A KR20050123007 A KR 20050123007A
Authority
KR
South Korea
Prior art keywords
tagging
phonetic symbol
symbol string
korean
information
Prior art date
Application number
KR1020040048709A
Other languages
Korean (ko)
Other versions
KR100650393B1 (en
Inventor
윤애선
강미영
정영임
홍성민
Original Assignee
부산대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 부산대학교 산학협력단 filed Critical 부산대학교 산학협력단
Priority to KR1020040048709A priority Critical patent/KR100650393B1/en
Publication of KR20050123007A publication Critical patent/KR20050123007A/en
Application granted granted Critical
Publication of KR100650393B1 publication Critical patent/KR100650393B1/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 입력된 한국어 문서에 대한 실감형 음성합성을 위한 한국어 발음 기호열 생성시스템 및 그 방법 및 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것으로서, 보다 상세하게는 텍스트 기반의 한국어 문자 데이터를 수신하여, 수신된 텍스트 기반의 문자 데이터를 분석한 후에 한글 이외의 다양한 기호 및 숫자, 영문자, 한자 등을 자동으로 문자화하고, 형태소 및 구문을 분석, 공기 관계 규칙 지식베이스를 이용한 부분문장 분석을 하여 수신된 텍스트를 정제한 후 발음 기호열로 변환하여 TTS 시스템과 연동되어 실감형 발음이 날 수 있도록 하는 것을 특징으로 하는 것으로서, 이를 통하여, 입력 문서로부터 철자 및 문법 오류를 제거하고, 정확한 형태소 분석과 태깅을 하여 부분문장 분석을 함으로써 정확한 발음 기호열을 생성함으로써 일반 문자 텍스트와 함께 음성 라이브러리를 결합하여 바로 음성합성이 가능하도록 하는 효과가 있다.The present invention relates to a system for generating a Korean phonetic symbol string for realistic speech synthesis of an input Korean document, and a method and a computer readable recording medium recording a program for realizing the method. Receives Korean-based text data, analyzes the text-based text data received, automatically characterizes various symbols, numbers, alphabets, and Chinese characters other than Korean, analyzes morphemes and syntax, and builds an air relation rule knowledge base. It analyzes the partial sentence used to refine the received text and converts it into a phonetic symbol string so that it can be linked with the TTS system to produce realistic pronunciation, thereby eliminating spelling and grammatical errors from the input document. And by analyzing the morphemes and tagging accurately, By generating the correct pronunciation symbol string by combining voice library with normal text characters it has the effect of directly available to the speech synthesis.

Description

한국어 발음 기호열 생성 시스템 및 그 방법 및 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체{A system for generating technique for generating korean phonetic alphabet}Korean phonetic symbol string generation system and method thereof and a computer-readable recording medium recording a program for realizing the method.

현대 사회에서 인터넷상의 웹문서는 빠르고 정확한 정보를 가능한 많은 대중에게 전달하는 역할을 훌륭하게 담당하고 있다. In today's society, web documents on the Internet have a wonderful role in delivering fast and accurate information to as many people as possible.

그러나, 인간 사회에서 가장 자연스러운 정보교환 형태가 음성이라는 사실에 착안하여 최근 음성을 통한 인간과 기계와의 직접적인 의사소통을 위한 자연어처리 연구에 대한 중요성이 강조되고 있다. However, focusing on the fact that voice is the most natural form of information exchange in human society, the importance of natural language processing research for direct communication between humans and machines through voice has been emphasized recently.

그 대표적인 노력중 하나인 음성합성(Text-to-Speech Synthesis)은 국내에서도 상당히 진보하여 여러 기업들과 연구소에서 음성합성기를 개발하여 상용 제품으로까지 나와 있으며 정확도와 자연성이 어느 정도는 보장되는 음성합성 결과를 제시하고 있다.Text-to-Speech Synthesis, one of its representative efforts, has made great progress in Korea, and has been developed as a commercial product by various companies and research institutes. The results are presented.

일반적으로 음성 합성 시스템은, 언어학적 부분, 음성학적 부분, 음향학적 부분의 세 부분으로 나눌 수 있다.In general, a speech synthesis system can be divided into three parts: linguistic part, phonetic part, and acoustic part.

우선 텍스트가 이 시스템에 입력되면, 언어학적 모듈이 텍스트를 발음 표기로 전환하며, 발음으로 표현된 텍스트를 가지고 음성학적 모듈이 음성 매개 변수를 계산한다.First, when text is entered into the system, the linguistic module converts the text into phonetic notation, and the phonetic module calculates the phonetic parameters with the phonetic text.

마지막으로 음향 모듈이 매개 변수를 사용하여 합성 음성 신호를 만들어 낸다. Finally, the acoustic module uses the parameters to produce a synthesized speech signal.

이러한 기존의 텍스트/음성변환기(text-to-speech conversion system; 이하 TTS 시스템이라 칭함)는 도 1에 도시된 바와 같이 입력된 텍스트로부터 합성음을 생성하기까지 일반적으로 3 단계의 과정을 거치게 된다.The conventional text-to-speech conversion system (hereinafter, referred to as a TTS system) generally undergoes a three step process to generate a synthesized sound from input text as shown in FIG. 1.

제 1 단계인 언어 처리부(1)에서는 텍스트를 음소열로 변환하고, 운율 정보를 추정하여 이를 심볼화 한다. In the first step, the language processor 1 converts the text into a phoneme string, estimates rhyme information, and symbolizes it.

운율 정보의 심볼은 구문구조 분석결과를 이용한 구·절 경계, 단어내 엑센트 위치, 문형 등으로부터 추정된다.The symbol of the rhyme information is estimated from the phrase / clause boundary, the accent position in the word, the sentence pattern, etc. using the syntax structure analysis result.

제 2 단계인 운율 처리부(2)는 심볼화된 운율 정보로부터 규칙 및 테이블을 이용하여 운율 제어 파라미터의 값을 계산한다. In the second step, the prosody processing unit 2 calculates the value of the prosody control parameter by using a rule and a table from the symbolized prosody information.

운율 제어 파라미터로는 음소의 지속시간, 피치 형태(contour), 에너지 형태(contour), 쉼 구간 정보가 있다.Rhyme control parameters include phoneme duration, pitch contour, energy contour, and rest interval information.

제 3 단계인 신호처리부(3)는 합성 단위 데이터 베이스(4)와 운율 제어 파라미터를 이용하여 합성음을 생성한다. In the third step, the signal processing unit 3 generates the synthesized sound using the synthesis unit database 4 and the rhythm control parameter.

즉 기존의 합성기는 언어 처리부(1)와 운율 처리부(2)에서 자연성, 발성 속도와 관련된 정보를 단지 입력 텍스트 만으로 추정을 해야 함을 의미한다.In other words, the existing synthesizer means that the language processor 1 and the rhyme processor 2 should estimate the information related to the naturalness and the voice speed only with the input text.

그러나, 각 시스템별로 정도를 달리 하긴 하지만 어절 내 발음 변동이나, 어절 경계에서의 발음 변동, 그리고 어절 내 끊어 읽기, 기호나 숫자 읽기 등의 정확도가 많이 떨어지는 문제점이 있었다. However, although the degree is different for each system, there is a problem that the accuracy of pronunciation fluctuations in the word, pronunciation fluctuations at the word boundary, broken readings in the word, and reading the symbols or numbers are much lower.

또한, 어절 간 띄어쓰기 오류와 어절 내 띄어쓰기 오류를 교정하지 않으면 어절 내에 적용되는 발음규칙과 어절 간에 적용되는 발음규칙을 일관성있게 처리할 수 없어 정확한 발음 기호열을 생성할 수 없기 때문에 입력된 한국어 문서에 철자나 띄어쓰기 오류가 없어야 하는 조건이 필요하다.Also, if you do not correct the spacing between words and the spacing between words, you will not be able to consistently process the pronunciation rules applied within the word and the pronunciation rules applied between words. You need a condition that requires no spelling or spacing errors.

또한, 인터넷 문서에 빈번하게 나타나는 아라비안 숫자, 기호, 영문자, 수식 등의 비한글기호는 중의성이 높아 하나의 기호가 5-6가지 방식으로 읽히고 문맥에 따라 숫자가 20가지 다른 방식으로 읽히는데, 상기 발명된 숫자 합성음 처리 기법(특1998-0011003)에서는 아라비안 숫자와 그 숫자의 한자어 수사 발음 한글열을 테이블로 구성하여 단순 매핑하였기 때문에 잘못된 매칭 작업으로 그 의미가 왜곡되는 문제점이 있었다.In addition, non-Hangul symbols such as Arabian numbers, symbols, alphabets, and formulas, which are frequently found in Internet documents, have high importance, and one symbol is read in 5-6 ways and 20 different ways depending on the context. In the numerical synthesis sound processing technique of the invention (Special 1998-0011003), since the Arabic numerals and the Hanja rhetorical pronunciation Hangul strings of the numbers are simply mapped by a table, there is a problem that their meaning is distorted due to incorrect matching.

본 발명은 상기한 바와 같은 문제점을 해결하기 위하여 제안된 것으로서, 입력 텍스트를 정제를 하기 위해 사용자가 텍스트를 입력할 때 범할 수도 있는 오류를 교정을 할 수 있도록 유도하거나 자동으로 교정하며, 다양한 분야에서의 숫자, 기호의 읽기 방식·읽기 규칙을 세분화하고 정형화된 표현 및 고유명사 사전의 구축하여, 좌·우문맥 정보의 의미 분석과 통계적 접근 방식을 이용한 중의성 해결 방안으로 숫자, 기호 읽기를 기존 TTS 시스템보다 정확하게 전처리하고 일반 문자 텍스트와 함께 음성 라이브러리를 결합하여 바로 음성합성이 가능하도록 하는 한국어 발음 기호열 생성 시스템 및 그 방법 및 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다. The present invention has been proposed in order to solve the above problems, in order to refine the input text to induce or automatically correct errors that may occur when the user enters the text to correct the text, in various fields By subdividing the reading method and reading rules of numbers and symbols in Korean, constructing formal expressions and proper noun dictionaries, the existing TTS can be read as a neutrality solution using semantic analysis and statistical approach of left / right context information. Provided is a Korean phonetic symbol string generation system for pre-processing more accurately and combining voice libraries with general texts to enable voice synthesis, and a method and a computer-readable recording medium recording a program for realizing the method. Its purpose is to.

이와 같은 목적을 달성하기 위하여 본 발명에 따른 한국어 발음 기호열 생성 시스템은 문서를 음성으로 합성 구현하는 시스템에 있어서, 입력되는 텍스트를 형태소에 따라 분석하고 문장 단위로 태깅하여 비한글 기호를 발음 기호열로 변환시키고, 문법 및 철자, 띄어쓰기 오류 등을 교정하는 입력 전처리 수단과; 상기 입력 전처리 수단에 의해 생성된 발음 기호열을 이용하여 형태소 단위로 형태소 경계를 분석하고, 품사 태깅을 통해 적절한 단위의 구문 경계를 분석하는 형태소 및 구문 처리 수단과; 추출된 단어를 부분문장 분석에 기반한 태깅으로 중의성을 제거하고 동철이음어에 대한 여러 후보 발음 중에서 정확한 음소열을 하나 태깅하는 중의성 제거 및 동철이음어 처리 수단; 및 상기 단계에 의해 추출된 형태소 분석 정보 및 태깅 정보에 기반하여 어절 내 끊어읽기 위치를 추출하고 기존의 텍스트/음성변환기의 합성방식으로 합성음을 생성하는 끊어읽기 처리 수단;을 포함하여 이루어진 것을 특징으로 한다.In order to achieve the above object, the Korean phonetic symbol string generation system according to the present invention is a system for synthesizing a document into a voice, and analyzes the input text according to morphemes and tags non-Hangul symbols by sentence units. An input preprocessing means for converting the information into a grammar and correcting grammar, spelling, spacing, and the like; Morpheme and syntax processing means for analyzing morpheme boundaries in morpheme units using the phonetic symbol strings generated by the input preprocessing means, and analyzing syntax boundaries in appropriate units through part-of-speech tagging; Neutrality removal and copper splice processing means for removing neutrality with tagging based on partial sentence analysis and tagging a correct phoneme string among several candidate pronunciations for copper splice; And a truncation processing means for extracting a truncated reading position within a word based on the morphological analysis information and the tagging information extracted by the step and generating a synthetic sound by a synthesis method of an existing text / speech converter. do.

이하, 첨부된 도면을 참조하여 본 발명의 실시예를 상세히 설명하면 다음과 같다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 2는 본 발명에 따른 한국어 발음 기호열 생성 시스템을 위한 발음 기호열 생성시스템의 구성 블록도이며, 도 3은 본 발명에서의 비한글기호 처리 순서도이며, 도 4는 본 발명에서 입력 문장 전처리를 위한 태거 순서도이며, 도 5는 본 발명에서의 문법 및 철자 검사를 위한 순서도이며, 도 6은 본 발명에서의 동철이음어 발음 기호열 태깅 순서도이며, 도 7은 본 발명에서의 복합명사 처리를 위한 지식데이터베이스의 구성도이며, 도 8은 본 발명에서의 복합 명사 처리 순서도를 각각 나타낸 것이다.FIG. 2 is a block diagram of a phonetic symbol string generation system for a Korean phonetic symbol string generation system according to the present invention. FIG. 3 is a flowchart for processing a non-Hangul symbol in the present invention. FIG. Figure 5 is a flowchart for the grammar and spelling check in the present invention, Figure 6 is a spelling tag tag flow chart of the copper splice in the present invention, Figure 7 is a complex noun processing for the present invention 8 is a configuration diagram of a knowledge database, and FIG. 8 shows a compound noun processing flowchart in the present invention, respectively.

도 2에서 알 수 있는 바와 같이 본 발명에 따른 한국어 발음 기호열 생성 시스템은 입력 전처리 수단(10)과, 발음 기호열 생성 수단(20)과, 중의성 제거 및 동철이음어 처리 수단(30)과, 끊어읽기 처리 수단(40)을 포함하여 이루어진다.As can be seen in FIG. 2, the Korean phonetic symbol string generation system according to the present invention includes an input preprocessing means 10, a phonetic symbol string generation means 20, neutrality removal and copper splice processing means 30. , The read processing means 40 is included.

상기 입력 전처리 수단(10)은 일반 문서에 다양한 기호 및 숫자, 영문자, 한자가 사용되므로 이를 자동으로 한글 문자화하는 것이며, 입력된 문서에 나타나는 각종 띄어쓰기 오류 및 맞춤법 오류를 형태소 분석 및 품사 태깅, 구문 분석을 통해 교정하는 것이다.Since the input preprocessing means 10 uses various symbols, numbers, alphabets, and Chinese characters in a general document, it automatically translates them into Korean characters, and stems, tags, and parses various spacing and spelling errors that appear in the input document. Will be corrected through.

이러한, 상기 입력문서 전처리부(10)는 비한글 입력 전처리부(110)와, 형태소 분석 및 태깅부(120)와, 입력 문서 정제부(130)로 구성된다.The input document preprocessor 10 includes a non-Hangul input preprocessor 110, a morphological analysis and tagging unit 120, and an input document refiner 130.

도 3을 참조하면, 상기 비한글 입력 전처리부(110)는 입력 문서에는 한글뿐만 아니라 숫자, 로마자, 특수 구문(전화번호, 전자우편 주소, 주소 등), 특수기호(이음표, 도량단위 기호 등), 영문 및 두문자어(acronym)와 약자가 등이 포함되어 있을 수 있는데, 이러한 입력 문서에 포함된 숫자, 기호, 영문자를 전처리하여 일반 한글 텍스트로 변환시킨다.Referring to FIG. 3, the non-Hangul input preprocessing unit 110 includes not only Korean characters but also numbers, Roman letters, special phrases (phone numbers, e-mail addresses, addresses, etc.), special symbols (joints, metrology symbols, etc.) in an input document. , English and acronyms and abbreviations may be included. The numbers, symbols, and alphabets included in these input documents are preprocessed and converted into general Korean text.

또한, 상기 비한글 입력 전처리부(110)는 다양한 분야에서의 아라비안 숫자와 문장 기호의 읽기 방식·읽기 규칙을 세분화하고, 영문자로 표기한 도량형 기호 단위와 그 발음열의 목록화하여 숫자 및 기호의 읽기를 위한 텍스트 전처리 및 아라비안 숫자와 문장 기호의 문자화할 수 있도록 구성된다.In addition, the non-Hangul input pre-processing unit 110 subdivides the reading method and reading rules of Arabian numbers and sentence symbols in various fields, and reads numbers and symbols by listing the metrological symbol units and their pronunciation strings written in English letters. It is configured to allow text preprocessing and characterization of Arabian numbers and punctuation symbols.

우선, 상기 비한글 입력 전처리부(110)는 입력된 텍스트의 숫자표현을 검색하는 단계가 있으며, 고유명사, 전문용어 문자화 데이터베이스와, 패턴화된 표현 문자화 데이터베이스 및 연접어 데이터베이스 및 구성요소 데이터베이스로 이루어진 사전 및 지식 데이터베이스를 구비한다.First, the non-Hangul input preprocessing unit 110 includes searching for a numeric expression of input text, and includes a proper noun, a terminology characterization database, a patterned expression characterization database, a concatenated database, and a component database. A dictionary and knowledge database is provided.

상기 고유명사 및 전문용어 문자화 데이터베이스는 고유명사를 판단하여 고유명사에 포함된 숫자·기호 문자를 찾아내어 수사의 품사·형태·언어 계통 및 기·서수에 따라 20가지로 분류하여 저장하고, 아라비안 숫자의 좌·우문맥, 휴리스틱스, 확률적 선호도를 결합한 통합적 방식으로 처리한다.The proper nouns and terminology characterization database determines the proper nouns, finds the numbers and symbol characters included in the proper nouns, stores them in 20 kinds according to the parts of speech, form, language system, and ordinal numbers of the proper nouns, and stores the Arabian numbers. The left and right contexts, heuristics, and stochastic preferences are combined in an integrated way.

상기 패턴화된 표현 문자화 데이터베이스는 주민등록번호, 웹 주소, 전화번호, 시간·주소 등의 정형화된 구조와 고유명사를 분류하여 저장한다.The patterned representation characterization database classifies and stores a formal structure and proper noun such as social security number, web address, telephone number, time and address.

또한, 상기 패턴화된 표현 문자화 테이터베이스는 실제 말뭉치에서 나타난 121개 영문자로 표기한 도량형 기호 단위와 그 발음열의 목록화하여 저장한다.In addition, the patterned representation characterization database stores a list of metrological symbol units represented by 121 alphabetic characters and their pronunciation strings displayed in actual corpus.

여기서, 상기 말뭉치는 10개 신문 2년 치 기사(2000년 1월 1일~2001년 12월 31일)에 나타난 아라비안 숫자와 문장 기호가 포함된 어절 중 90,000어절을 임의 추출하여 학습말뭉치 구성하였다. Here, the corpus constituted a learning corpus by randomly extracting 90,000 phrases among the phrases containing Arabic numerals and punctuation marks appearing in a 10-year newspaper two-year article (January 1, 2000 to December 31, 2001).

한편, 상기와 같은 검색에 표현되지 못한 숫자 표현은 구성요소 분석을 행하게 된다.On the other hand, the numerical representation not represented in such a search is subjected to component analysis.

즉, 아라비안 숫자와 기호의 좌·우 문맥, 휴리스틱스 정보 및 숫자와 기호의 결합 정보를 학습 자질의 3가지 유형으로 추출하고 각 유형을 9개로 하위분류하여 구성요소 데이터베이스에 저장하고, 아라비안 숫자와 문장 기호를 분석한다.In other words, the left and right contexts of Arabic numerals and symbols, heuristic information, and combinations of numbers and symbols are extracted into three types of learning quality, subclassed into nine types, and stored in the component database. Analyze sentence symbols.

따라서, 상기와 같이 아라비안 숫자 및 문장 기호 문자화 데이터베이스에 구성되지 않은 새로운 숫자와 기호는 각 데이터베이스별로 새로이 저장된다. Therefore, new numbers and symbols not configured in the Arabian number and punctuation characterization database as described above are newly stored for each database.

도 4를 참조하면, 상기 형태소 분석 및 태깅부(120)는 문서가 입력되면 형태소 분석을 하고 문장 단위로 태깅을 하는 것으로서, 태거, 맞춤법/문법 검사기, 문자인식 후처리 등 다양한 곳에 적용할 수 있는 다용도 고성능 형태소 분석을 행한다.Referring to FIG. 4, the morphological analysis and tagging unit 120 performs morphological analysis and tagging in sentence units when a document is input, and can be applied to various places such as tagger, spelling / grammar checker, and character recognition post-processing. Versatile high performance morphological analysis is performed.

상기 형태소 분석 및 태깅부는 상기 사전 및 지식데이터베이스에 저장되어 있는 총 9,516개의 명사를 분류하고 관계 제약을 하여 복합명사 형태소를 분석한다.The morpheme analysis and tagging unit classifies a total of 9,516 nouns stored in the dictionary and the knowledge database and analyzes the compound noun morphemes with relational constraints.

이 때 형태소 분석 및 태깅부(120)에서 유일한 형태소 분석 결과가 이루어진 경우에는 규칙기반 태깅단계로 넘어가고, 형태소 분석에 실패한 경우에는 미등록어 추정단계로 넘어가게 된다.In this case, if the morphological analysis and tagging unit 120 has a unique morphological analysis result, the process proceeds to the rule-based tagging step, and if the morphological analysis fails, the process proceeds to the non-registered word estimation step.

한편, 상기 형태소 분석 및 태깅부(120)에서 유일한 형태소분석 결과를 제시하지 못하고 다수의 후보 어절을 제시하는 경우가 많다. On the other hand, the morpheme analysis and tagging unit 120 does not present a unique morphological analysis results, but often presents a number of candidate words.

즉, 형태소를 분석할 때 형태소의 원형을 분리하고 복원하는 과정에서 정확한 한 개의 원형을 분리해 내지 못하고 여러 개의 후보 어절을 제시하여 어휘적 중의성과 하나의 형태소가 여러 가지의 품사로 사용되어 발생하는 품사의 중의성이 발생하게 되는데, 이러한 중의성을 해소하기 위하여 다음과 같이 태거의 성능을 개선하여 입력문서 정제부(130)에서 철자/문법 검사를 행한다. In other words, when analyzing the morphemes, in the process of separating and restoring the prototypes of morphemes, it is not possible to separate the exact prototypes, but instead presents several candidate words, resulting in the use of lexical significance and one morpheme as various parts of speech. Partiality of speech is generated, and in order to solve the neutrality, the performance of the tagger is improved as follows, and the input document refining unit 130 performs a spelling / grammar check.

도 5를 참조하면, 상기 입력 문서 정제부(130)는 입력된 문서에 대해 문법 및 철자를 검사하여 오류를 교정하는 것으로서, 다양한 문서를 분석하여 자주 틀리는 오류를 찾아내어 62,085개의 오용어-추천어 쌍으로 분류하여 오류코드 데이터베이스에 저장한다.Referring to FIG. 5, the input document refining unit 130 corrects an error by checking grammar and spelling of an input document, and analyzes various documents to find frequently wrong errors to find 62,085 misuse-suggested words. It is classified as a pair and stored in the error code database.

또한, 상기 오류코드 데이터베이스는 중의성이 자주 발생하는 어휘의 형태를 조사하여, 개별 어휘를 처리할 수 있는 규칙을 분류하여 저장한다. In addition, the error code database classifies and stores rules that can process individual vocabulary by examining types of vocabulary in which neutrality frequently occurs.

다음 [표 1]은 이 규칙에 해당하는 예를 나타낸 것이다.[Table 1] shows an example of this rule.

-가/이/도(조사) + 있다/없다/아니다(용언) 예) 마을이 있다“있다/없다/아니다” 앞에서는 체언 + “-가/이/도” 조사가 와야 하며 용언은 형용사로 분석한다. Yes, there's a village. There is a village, there must be a statement + “-ga / do / do” and the word is an adjective. Analyze (관형어) + 수(의존 명사) + 있다/없다(용언) 예) 할 수 있다“수” 앞에는 관형어가 와야 하며 이 경우 “수”는 의존명사 “있다/없다”는 형용사로 분석한다. (Tub) + number (dependent noun) + yes / no (verb) Example) can be preceded by a "word", in which case "number" is interpreted as an adjective with "no / no" dependent noun.

상기 오류코드 데이터베이스는 단순히 맞춤법 오류나 표준어 오류뿐만 아니라 순화용어, 외래어표기 오류 등도 포함되어 있다.The error code database includes not only a spelling error or a standard word error, but also a pure term and a foreign word error.

상기 발음 기호열 생성수단(20)은 실감형 음성 합성을 위한 것으로서 정확한 발음기호열 생성을 위해서 입력된 문서로부터 철자 및 문법 오류를 제거하고, 또한 언어학적 여러 단계(형태음운론, 통사-의미론)에 대한 이해를 바탕으로 형태소 내적 발음 규칙, 형태소 간의 발음 규칙, 음운구 단위의 발음 규칙을 반영한 발음기호열을 생성하는 것이다.The phonetic symbol string generation means 20 is for immersive speech synthesis and removes spelling and grammatical errors from an input document for accurate phonetic symbol generation, and further includes linguistic steps (morphological phonology, syntactic-sense). Based on the understanding, the phonetic symbol string reflecting the pronunciation rules of morphemes, pronunciation rules between morphemes, and phoneme phrases are generated.

또한, 한국어의 일반 발음 제약 규칙을 따르거나 형태·통사론적 제약 규칙으로 발음이 구분이 안 되는 단어들을 발음 기호열 데이터베이스에 등재하여 발음 기호열 생성에 이용한다. In addition, words that are not pronounced according to the general pronunciation constraints of Korean or morphological and syntactic constraints are registered in the phonetic symbol string database and used to generate phonetic symbol strings.

예외적으로 발음되는 단어들을 직접 찾아서 예외 사전을 구축한다는 것은 많은 시간과 작업량이 요구되므로, 본 발명에서는 국어사전이 일반적인 음운규칙을 따르지 않는 단어들에 대해서 발음 기호열을 따로 표기한다는 사실에 착안해서, 기 개발된 예외 발음 사전을 사용한다. Building an exception dictionary by directly searching for an exceptionally pronounced word requires a lot of time and work, and the present invention focuses on the fact that the Korean dictionary separately represents a phonetic symbol string for words that do not follow general phonological rules. Exception pronunciation dictionaries are developed.

상기 중의성 제거 및 동철이음어(同綴異音語)처리수단(30)은 단어에 여러 의미를 가지거나 글자모양은 같으나 문법적 의미나 어휘적 의미의 차이에 따라서 다른 소리로 발음되는 단어를 처리하는 수단이다.The neutrality elimination and copper splice processing means 30 processes words that have multiple meanings in the word or have the same letter shape but different sounds depending on grammatical or lexical meaning differences. It is a means to.

본 발명에 있어서는 중의성 제거 및 동철이음어 처리수단(30)은 형태·음운론적 특성에 기반을 두어 단어의 의미 분류를 세분화하고 형태·의미론적 공기 관계 규칙 지식베이스를 구축하였다.In the present invention, the neutrality elimination and copper splice processing means 30 subdivided the semantic classification of words on the basis of morphological and phonological characteristics and constructed a knowledge base of morphological and semantic air relation rules.

또한, 상기 공기 관계 규칙 지식 데이터베이스에 격틀 정보에 따라서 용언(자동사 2,458개, 타동사 1,325개, 자타동사 180개, 형용사 3,194개, 하다 결합 명사 11,080개)을 하위 범주화하고, 사용 빈도가 높은 9,516여개의 명사를 분류하고 명사간의 제약 관계를 설정하였다.In addition, sub-categories of verbs (2,458 intransitive verbs, 1,325 transitive verbs, 180 adjective verbs, 3,194 adjectives, and 11,080 adjective nouns) are subcategorized in the air relation rule knowledge database according to pertinent information. Classify nouns and establish constraints between nouns.

상기 중복된 음소열 제거 단계를 거친 후 Nr > 1이면, 태깅이 필요한데 동철이음어를 태깅하기 위해서는 의미에 기반한 문장 분석이 필요하다.After the duplicate phoneme removal step, if Nr> 1, tagging is required, but in order to tag the copper splice, sentence analysis based on meaning is required.

예를 들어 ‘신고’와 같은 형태는 아래 [표 2]와 같은 형태소 분석 결과를 보인다.For example, a form such as 'report' shows a morphological analysis as shown in [Table 2] below.

입력input 형태소 분석Stemming 발음기호열Phonetic symbols 신고 Declaration 한자어 + 명사(1)Chinese character + noun (1) [신고][Declaration] 규칙 동사 + 어미(2)Rule Verbs + Mother (2) [신꼬][Shinko] 규칙 형용사 + 어미(3)Rule Adjective + Mother (3) [신꼬][Shinko]

[표 2]와 같이 중복된 음소열을 제거하면 [신고]로 발음나는 경우와 [신꼬]로 나는 경우로 축약된다.As shown in [Table 2], when the phoneme sequence is duplicated, it is reduced to the case where it is pronounced as [report] and the case where it is pronounced as [shinko].

즉, 문제의 입력단어가 다음과 같이 문장 속에서 나타나는 경우는 부분문장 분석에 기반한 태깅으로 정확한 음소열을 하나 태깅한다.In other words, if the input word in question appears in a sentence as follows, tag the correct phoneme string by tagging based on partial sentence analysis.

(1) 출생 신고를 하러가자. <---[신고](1) Let's go to report birth. <--- [report]

(2) 신발을 신고 기다렸다. <---[신꼬](2) I waited on my shoes. <--- [Shinko]

(3) 과일이 신고 ? <--[신고](3) Is the fruit reported? <-[Report]

위와 같이 발음 기호열 생성 동안 동철이음어의 발음 기호열 중복 쌍을 제거한 후 한국어의 일반 발음제약규칙이나 형태·통사론적 제약규칙 또는 발음 사전 검색으로도 해결되지 않는 동철이음어가 남아 있을 때 부분 문장 분석으로 해당 동철이음어와 공기관계(共起關係)에 있을 수 있는 단어 의미 정보를 가진 단어가 문장 속에 존재하는지를 검색한다. As described above, after removing duplicate pairs of phonetic pronunciation strings during phonetic symbol string generation, partial sentence analysis is performed when there are remaining phonetic joints that are not solved by general pronunciation constraints, morphological and syntactic constraints, or pronunciation dictionary search in Korean. As a result, it is searched whether a word with information of word semantic information which may be in an air relationship (해당) with a corresponding copper iron joint word exists in a sentence.

도 6에 도시된 바와 같이 동철이음어의 발음 기호열 태깅방법은 다음과 같다.As shown in FIG. 6, the phonetic symbol string tagging method of the copper iron joint is as follows.

문서내 동철이음어가 검색되면, 앞 공기 규칙 테이블에 기초하여 동철이음어와 공기 관계 정보가 있는 앞 단어를 검사하여 공기 관계어가 존재하면 발음 기호열을 태깅하여 발음 기호열을 제시하고, 만약 동철이음어와 공기 관계 정보가 없는 경우에는 뒤 공기 규칙 테이블에 의해 동철이음어와 공기 관계 정보가 있는 뒤 단어를 검사하게 된다.When a copper splice is searched for in the document, based on the previous air rule table, the front splice with the copper splice and the air relation information is examined. If there is no air relation information, the back air rule table is used to check the words after the copper fitting and the air relation information.

이때에도 공기 관계어가 존재하면 발음 기호열을 태깅하여 발음 기호열을 제시하게 되고, 만약 공기 관계어가 존재하지 않으면 발음 기호열을 제시하게 된다.In this case, if an air related word exists, the phonetic symbol string is presented by tagging the phonetic symbol string. If the air related word does not exist, the phonetic symbol string is presented.

본 발명에 따른 중의성 제거 및 동철이음어(同綴異音語) 처리수단(30)은 통계적 실험에 따라 노년층과 장년층에서는 장단의 구별이 이루어지고 있고, 청년층에서는 장단의 구별이 거의 이루어지지 않고 있으므로 장음과 단음 구분을 가지는 동철이음어를 제외한다.Neutral removal and copper splice processing means 30 according to the present invention is distinguished between the old and old in the elderly and the elderly according to the statistical experiment, the young and the young are hardly distinguished between the short and long Therefore, copper iron joints with long and short divisions are excluded.

상기 끊어읽기 처리수단(40)은 어절 간 경계에서 발음변동 처리를 하려면 정확한 구 경계를 정의할 수 있어야 하므로, 이를 위해 형태소 및 구문 분석단계를 행한다. The read-measure processing means 40 needs to be able to define the exact phrase boundary in order to process the pronunciation fluctuation at the word-to-word boundary.

즉, 상기 끊어읽기 처리수단(40)은 상기 중의성 제거 및 동철 이음어 처리수단(30)에 의해 추출된 형태소 분석 정보 및 태깅 정보에 기반하여 어절 내 끊어읽기 위치를 추출하고 문법 형태소(조사, 어미) 및 부사어를 범주화한 단서를 및 구 패턴 및 경계 위치 확률 정보를 적용하여 통사적 구경계를 추출한다.That is, the cut-out processing means 40 extracts the cut-out position in the word based on the morphological analysis information and the tagging information extracted by the neutrality elimination and copper-clad joint processing means 30, and the grammar morpheme (search, A syntactic caliber is extracted by applying the clues that categorize the mother and the adverbs, and the sphere pattern and the boundary position probability information.

상기 끊어읽기 처리 수단(40)은 형태소 경계 추출부(410)와, 음운 구 경계 추출부(420)로 구성된다.The reading processing means 40 includes a morpheme boundary extractor 410 and a phonological phrase boundary extractor 420.

상기 형태소 경계 추출부(410)는 형태소 분석에 기초한 합성어 내에서의 형태소 경계를 추출하는 것으로서, 형태소 분석 결과와 단어 분류 정보(접두사, 접미사, 명사 등)에 기초하여 끊어 읽기 정보를 부여한다.The morpheme boundary extractor 410 extracts the morpheme boundary in the compound word based on the morphological analysis, and provides reading information based on the morphological analysis result and word classification information (prefix, suffix, noun, etc.).

또한, 아래 [표 3]에 나타낸 바와 같이 사전에는 접사로 등재되어 있지 않으나 각 분야의 전문용어 파생에 자주 사용되는 형태소를 준접사 데이터베이스(412)로 구축(약 110개)하여 형태소 경계 추출에 사용한다. In addition, as shown in [Table 3] below, the morphemes that are not listed as affixes in advance, but frequently used for derivation of terminology in each field, are constructed by the semi-adjunct database 412 (about 110) and used for extracting the morpheme boundary. do.

즉, [표 3]은 본 발명에 따라 어절 내의 형태소 경계를 {준접사} * 명사 와 {접사}*명사로 구별하는 실시예를 나타낸 것이다.That is, Table 3 shows an example of distinguishing a morpheme boundary within a word by {adjective} * noun and {adjective} * noun according to the present invention.

(접사) 및 {준접사} 구분 목록(Close-up) and {near-side} distinct lists 어절 내 형태소 경계 (*)Stem boundary in word (*) (가, 假)(A, bang) 가*건물, 가*계약A * Building, A * Contract {가, 加}{A, 加} 가*속도, 가*압력Acceleration * speed, acceleration * pressure (분, 分)(Minutes, minutes) 영양*분, 지방*분Nutrition * minutes, fat * minutes {분, 糞}{Minutes, times} 분*에너지Min * energy {살, 殺}{Year, bang} 살*진균*성Kill * Fungus * Sex (성, 性)(Sex, sex) 순수*성, 신축*성Purity * Castle, New Construction * Castle {소, 素}{Small, 素} 항체*소, 발광*소Antibodies * Bovine, Luminescent * Bovine

또한, 상기 형태소 경계 추출부(410)는 복합명사를 구성하는 각 명사 경계 인식한다. In addition, the morpheme boundary extractor 410 recognizes each noun boundary forming a compound noun.

여기서는, 8,910개의 복합명사 좌우 연어 관계 규칙이 분류되어 있는 복합명사 데이터베이스에 복합명사를 저장하고 하위 범주화하여 복합명사 경계를 인식한다. In this example, a compound noun is stored in a compound noun database in which 8,910 compound nouns left and right salmon relation rules are classified and subcategorized to recognize a compound noun boundary.

아래 [표 4]는 본 발명에서 붙여쓰기된 복합명사 내의 형태소 경계를 추출하는 실시예를 나타낸 것이다.Table 4 below shows an embodiment of extracting the morpheme boundary in the compound noun pasted in the present invention.

붙여쓰기된 복합명사Pasted compound nouns 어절내 형태소 경계(*)Stem boundary in word (*) 규칙기반Rule based 규칙*기반Rule * based 레이저용접Laser welding 레이저*용접Laser * welding 등온변태곡선Isothermal transformation curve 등온*변태*곡선Isothermal * transformation * curve 금강산개발사업Geumgangsan Development Project 금강산*개발*사업Kumgang * Development * Project

또한, 상기 복합명사 데이터베이스에는 아래 [표 8]에 나타낸 것과 같이 말뭉치(10개 신문사: 조선, 중앙, 매일경제, 한국, 한겨레, 동아, 서울, 문화, 경향 등) 6년간(1997년~2002년) 기사 4억 어절을 본 연구실의 철자/문법 검사단계에서 처리한 후 반환한 미등록어 800만 어절)를 분석한 후 추출한 복합명사(2,507,522개)를 음절 수에 따라 분류하여 저장된다. In addition, the compound noun database includes a corpus (10 newspapers: Chosun, Central, Maeil Economy, Korea, Hankyoreh, Dong-A, Seoul, Culture, Trends, etc.) as shown in Table 8 below (1997-2002). ) After analyzing the 400 million words of articles in the spelling / grammar inspection stage of this laboratory, the uncommitted 8 million words returned) are analyzed and the compound nouns (2,507,522) extracted are classified and stored according to the number of syllables.

즉, [표 5]는 상기 복합명사 데이터베이스에 저장되어 있는 복합명사의 개수를 간략하게 분류해 놓은 것이다.That is, Table 5 summarizes the number of compound nouns stored in the compound noun database.

복합명사 개수Compound nouns 4음절 복합명사4-syllable compound nouns 306,109306,109 5음절 복합명사A five-syllable compound noun 871,896871,896 6음절 복합명사6 syllable compound nouns 610,562610,562 7음절 복합명사7 syllable compound nouns 398,530398,530 8음절 복합명사8 syllable compound nouns 163,047163,047 9음절 복합명사9 syllable compound nouns 72,54772,547 10음절 복합명사10 syllable compound nouns 30,04830,048 11음절 복합명사11 syllable compound nouns 54,78354,783 총 개수Total 2,507,5222,507,522

상기와 같이 분류되어 있는 복합명사는 도 7 및 도 8과 같이 처리된다.Compound nouns classified as described above are processed as shown in FIGS. 7 and 8.

도 7 및 도 8을 참조하면, 우선 추출된 말뭉치에서 단어중 명사인지의 여부를 판단하고, 명사이면 공기관계가 있는지의 여부를 규칙 지식 데이터베이스와 비교하여 공기 관계가 있으면 음운 구 경계 내 발음 규칙을 적용하여 발음 기호열을 생성한다.Referring to FIG. 7 and FIG. 8, first, the extracted corpus determines whether a word is a noun, and if it is a noun, compares whether there is an air relationship with a rule knowledge database, and if there is an air relationship, determines a pronunciation rule within a phonological phrase boundary. To generate a phonetic symbol string.

만약, 공기 관계가 없으면 바로 발음 기호열을 생성하게 된다.If there is no air relationship, a phonetic symbol string is generated immediately.

상기 구경계 추출부는 형태소(조사, 어미) 및 부사어를 범주화하여 분석의 단서로 이용하며, 관용적 통사 패턴과 통계적 기법으로 추출한 구 패턴 및 어절 간 띄어 쓸 확률 정보를 이용하여 통사적 구 경계를 정의하는 것이다.The caliber extraction unit categorizes morphemes (surveys, mothers) and adverbs and uses them as clues for analysis, and defines syntactic phrase boundaries by using idiomatic syntactic patterns and phrase patterns extracted by statistical techniques and probability information between words. will be.

또한, 상기 구경계 추출부는 통사 분석 시스템의 정확도를 높이기 위한 전처리 단계로 통계기반 띄어쓰기 모듈이 구축되어 있다. In addition, the caliber extraction unit has a statistics-based spacing module as a pre-processing step to increase the accuracy of the syntax analysis system.

또한, 상기 구경계 추출부는 부분문장분석기법을 개선하기 위하여 동사의 격틀 정보 및 명사와 동사의 연어 관계 정보를 데이터베이스로부터 자동 추출한 지배어와 피지배어가 설정(지배어 2,363단어 대상)되어 있다. In order to improve the partial sentence analysis technique, the caliber extracting unit is configured with dominant words and sebum words automatically extracted from a database of verbal information, nouns, and salmon relation information of verbs (targeted words 2,363 words).

여기서, 본 발명에 사용하는 부분문장분석기법은, 의존도가 있는 단어 쌍을 중심으로 제한된 범주 내에서 문장분석을 시도한다. Here, the partial sentence analysis technique used in the present invention attempts to analyze the sentence within a limited category based on the word pair with the dependency.

즉, 중심이 되는 형태소를 중심으로 규칙이 제시한 대로 의존 관계에 있는 형태소를 검증하는 과정에서 제한된 형태의 문장 분석을 하고, 어절 사이의 오류를 검증하기 위해서 중심이 되는 형태소에서 좌, 우측으로 제한된 어절 수만큼 각 어절에 부여된 언어적, 경험적 제약조건을 기반으로 검증을 하는 것으로서, 각 문형 사이에서 중심이 되는 형태소와 의존 관계에 있는 형태소가 서로 떨어져 있을 수 있는 거리를 언어학적이고 경험적인 분석으로 미리 한정해 놓음으로써 부분 문장 분석 시에 사용할 최대 어절 수가 제한되므로 분석 시간이 줄어들게 된다.In other words, in the process of verifying the morphemes that depend on the central morphemes as the rule suggests, the sentence is analyzed in a limited form, and in order to verify errors between words, the morphemes of the central morphemes are restricted from left to right. Verification is based on the linguistic and empirical constraints imposed on each word by the number of words, and the linguistic and empirical analysis of the distance between the morphemes and the dependent morphemes can be separated from each sentence. By limiting in advance, the maximum number of words to be used in partial sentence analysis is limited, thereby reducing analysis time.

아래 [표 6]은 부분문장분석에 사용되는 문장 성분에 대한 제약 조건을 나타낸 것으로서, '무시하는 정보’는 주로 문장의 부속 성분으로서 중심이 되는 형태소와 의존 관계에 있는 형태소 사이에 위치할 수 있는 어절을 말한다.[Table 6] below shows the constraints on sentence components used in partial sentence analysis. 'Neglected information' is mainly located as a subcomponent of a sentence and can be located between the morphemes that are dependent on the morphemes that are dependent. Say a word.

중심이 되는 형태소Central morphemes 의존 관계에 있는 형태소Morphemes in dependence 분석할 범주Category to analyze 무시하는 정보Ignore information V + PEV + PE O, S, CO, S, C 좌측 3어절3 words left ADJ, ADADJ, AD V + GEV + GE O, S, CO, S, C 우측 2어절Right two words GG N + JN + J V + GEV + GE 좌측 2어절Two words left GG N + JN + J V + PEV + PE 우측 3어절Right three words ADJ, ADADJ, AD N + JN + J N + GJN + GJ 좌측 1어절1 word left nonenone N + JN + J N + JN + J 좌측 1어절우측 1어절Left 1 word Right Right 1 word nonenone V + EV + E ADJADJ 좌측 2어절Two words left ADJADJ V + E, N + JV + E, N + J E, JE, J 규칙과 정보에 따라 달라짐Depends on rules and information 규칙과 정보에 따라 달라짐Depends on rules and information

여기서 V는 동사, 형용사, PE는 평서형 어미, GE는 관형형 어미, E는 어미, O는 목적어, S는 주어, C는 보어, J는 조사 , N은 명사, ADJ는 부사, AD는 부사어, GJ는 관형격 조사를 각각 표시하고 있다.Where V is a verb, adjective, PE is a flat ending, GE is a tubular ending, E is a ending, O is an object, S is given, C is a bore, J is a survey, N is a noun, ADJ is an adverb, AD is an adverb, GJ Indicates tubular screening respectively.

본 발명에 있어서의 부분문장분석에서 사용하는 제약 조건의 요소들(지배소, 의존소 <표 6>)은 일반적으로 문장에서 자주 나타나는 경우이며, 대용량 말뭉치에서 추출한 오류를 분석하거나 경험적으로 추출한 것으로 오류를 유발할 가능성이 높은 어절이나 구 또는 패턴에 해당하며 그 외의 특수한 경우에는 중심이 되는 형태소와 의존 관계에 있는 형태소의 중의성 제거 규칙과 정보에 따라 범주를 정하였다.Constraints used in the partial sentence analysis in the present invention (details, dependencies <Table 6>) are commonly used in sentences, and are analyzed or empirically extracted from errors extracted from large corpus. The word is a word, phrase, or pattern that is more likely to cause anomalies, and in other special cases, the categories are categorized according to the rules and information on the elimination of neutrality of the morphemes that depend on the central morphemes.

또한, 상기 구경계 추출부는는 한국어가 어순이 자유로운 언어이고 화자에 따라 끊어읽기가 주관적이므로 규칙 기반 방법으로 구경계 추출한다.In addition, the caliber extractor extracts the caliber using a rule-based method because Korean is a language free of word order and subjective reading is subject to speech.

예를 들면, "내가 부산에서 만난 아름다운 그녀 (=통사적 명사구 1개)" 는 [표 7]과 같이 여러가지 분석이 가능하다.For example, "A beautiful woman I met in Busan (= 1 syntactic noun phrase)" can be analyzed as shown in [Table 7].

내가 / 부산에 있는 / 백화점에서 / 만난 / 아름다운 / 그녀 [너무 많이 끊어 읽음]I / in Busan / at a department store / met / beautiful / she [read too much] 내가 / 부산에 있는 / 백화점에서 만난 / 아름다운 그녀 [많이 끊어 읽음]I / in Busan / met at a department store / beautiful woman [Read a lot] 내가 부산에 있는 백화점에서 만난 / 아름다운 그녀 [구가 긺]I met at a department store in Busan / Beautiful Her 내가 / 부산에 있는 백화점에서 만난 / 아름다운 그녀 [적당함]I / I met at a department store in Busan / Beautiful She [suitable]

따라서, 한국어와 같이 어순이 자유로운 언어에서는 규칙 기반 방법은 구경계 추출을 위해 매우 유용하므로 본 발명에 있어서 끊어읽기 수단(40)은 패턴의 통계학적인 정보와 언어학적인 정보를 기초로 하여 다음과 같은 세가지의 끊어읽기 규칙을 구축하였다.Therefore, in a language free of word order, such as Korean, the rule-based method is very useful for extracting a caliber. Therefore, in the present invention, the reading means 40 is based on the statistical information of the pattern and the linguistic information. We built up a read rule.

첫번째 끊어읽기(//)는 절에서 원칙적으로 끊어 읽으며, 쉼표를 포함한 여러 구분자(delimiter)로 분리된 하위 통사구를 끊어 읽는다.The first break (//) is broken in principle in the clause, and breaks down the lower syntactic phrase, separated by multiple delimiters, including commas.

또한, 관형절이나 명사구 연속이 포함하는 어절 수가 많을 때(3어절 이상<휴리스틱 수치>) 끊어 읽는다.Also, when there are a large number of words (three or more words <heuristic number>) included in the continuation clause or noun phrase continuation, they are read.

또한, 강조를 위한 통사적 자리 이동으로 주제화(topicalization)를 노리는 문장에서 주제화된 대상 뒤에서 끊어 읽는다.It also reads behind the subject in a sentence aimed at topicalization with a syntactic shift of position for emphasis.

예를 들면, "토끼를 // 나는 매우 좋아한다."에서 주어+보어+동사의 통사순서를 기준으로 끊어 읽기를 한다.For example, in "I like the rabbit // I like it very much", read it based on the syntactic order of + bohr + verb.

두번째 끊어읽기(|)는 아래의 세번째를 제외한 다음과 같은 경우에 원칙적으로 (|)로 끊어 읽는다.The second break read (|) is read as a break (|) in the following cases except the third below.

즉, 통사적 구경계(명사구, 동사구, 부사구)와 띄어쓰기된 복합명사를 포함하는 명사구 내의 어절 경계에서 끊어 읽는다.That is, it reads at word boundaries within noun phrases including syntactic calibers (noun phrases, verb phrases, adverb phrases) and spacing compound nouns.

세번째 끊어읽기(*)는 관형절과 명사 결합구 내 어절 간 경계(아름다운*여자)에 끊어 읽는다.The third cut (*) is broken at the boundary between the phrase and the word in the noun joint (a beautiful woman).

또한, 어절 내에 위치한 접사(접두사, 접미사, 보조용언) 경계, 수사와 단위 결합구 내에 위치하는 형태소 경계, 복합명사 내의 각 명사 경계에서 끊어 읽는다.It also reads at the boundary of affixes (prefixes, suffixes, auxiliary verbs) located within a word, morpheme boundaries located within rhetoric and unit combinations, and at the boundaries of each noun in compound nouns.

이러한 끊어 읽기는 문법 형태소(조사, 어미) 및 부사어를 범주화하여 분석의 단서로 이용한다.This reading is categorized into grammatical morphemes (surveys, mothers) and adverbs and used as clues for analysis.

또한, 관용적 통사 패턴과 통계적 기법으로 추출한 구 패턴 및 어절간 띄어 쓸 확률 정보를 이용한다.In addition, we use idiomatic syntactic patterns, phrase patterns extracted by statistical techniques, and probability information spacing between words.

상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다.The method of the present invention as described above may be implemented as a program and stored in a computer-readable medium (CD-ROM, RAM, ROM, floppy disk, hard disk, magneto-optical disk, etc.).

이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변환 및 변경이 가능하다는 것이 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.The present invention described above is not limited to the above-described embodiment and the accompanying drawings, and various substitutions, conversions, and changes are possible in the technical field of the present invention without departing from the technical spirit of the present invention. It will be clear to those of ordinary knowledge.

상기한 바와 같은 본 발명은, 입력 문서로부터 철자 및 문법 오류를 제거하고, 정확한 형태소 분석과 태깅을 하여 부분문장 분석을 함으로써 정확한 발음 기호열을 생성하는 효과가 있다.As described above, the present invention has the effect of generating accurate phonetic symbol strings by removing spelling and grammatical errors from an input document and performing partial sentence analysis by performing accurate morphological analysis and tagging.

또한, 형태소 경계와 구 경계에서의 발음변동을 정확하게 표현하고, 정확한 품사태깅 결과와 의미에 대한 지식데이터 베이스 구축을 기반으로 동철이음어를 태깅하고, 띄어쓰기와 붙여쓰기가 모두 가능한 복합명사에 대해 정확한 발음 기호열을 생성하고 비한글기호가 포함된 문서를 전처리하여 발음 기호열로 생성함으로써 일반 문자 텍스트와 함께 음성 라이브러리를 결합하여 바로 음성합성이 가능하도록 하는 효과가 있다.In addition, it accurately expresses pronunciation fluctuations at morphological and sphere boundaries, and accurately tags complex iron nouns based on accurate knowledge of the results of wording and constructing knowledge databases. By generating a phonetic symbol string and preprocessing a document containing a non-Hangul symbol as a phonetic symbol string, a voice library is combined with general text text to enable voice synthesis.

도 1은 종래 방식의 텍스트를 음성으로 변환하는 구성 블록도1 is a block diagram of a conventional text to speech conversion

도 2는 본 발명에 따른 한국어 발음 기호열 생성 시스템을 위한 발음 기호열 생성시스템의 구성 블록도2 is a block diagram of a phonetic symbol string generation system for a Korean phonetic symbol string generation system according to the present invention.

도 3은 본 발명에서의 비한글기호 처리 순서도3 is a non-Hangul symbol processing flow chart in the present invention

도 4는 본 발명에서 입력 문장 전처리를 위한 태거 순서도4 is a tag flow chart for input sentence preprocessing in the present invention.

도 5는 본 발명에서의 문법 및 철자 검사를 위한 순서도5 is a flowchart for checking grammar and spelling in the present invention.

도 6은 본 발명에서의 동철이음어 발음 기호열 태깅 순서도FIG. 6 is a flowchart illustrating tagging of a categorical phonetic phonetic pronunciation string in the present invention

도 7은 본 발명에서의 복합명사 처리를 위한 지식데이터베이스의 구축 순서도 7 is a flowchart illustrating a knowledge database for complex noun processing according to the present invention.

도 8은 본 발명에서의 복합 명사 처리 순서도8 is a compound noun processing flowchart in the present invention

*도면의 주요부분에 대한 부호의 설명** Description of the symbols for the main parts of the drawings *

10. 입력 전처리 수단 20. 발음 기호열 생성 처리 수단10. Input preprocessing means 20. Phonetic symbol string generation processing means

30. 중의성 제거 및 동철이음어 처리수단 40. 끊어읽기 처리 수단30. Neutral removal and copper splice treatment means 40. Cutting off processing means

110. 비한글 입력 전처리부 120. 형태소 분석 및 태깅부110. Non-Hangul input preprocessor 120. Morphological analysis and tagging

130. 입력 문서 정제부130. Input document refiner

Claims (11)

문서를 음성으로 합성 구현하는 시스템에 있어서,In a system for synthesizing a document by speech, 입력되는 텍스트를 형태소에 따라 분석하고 문장 단위로 태깅하여 비한글 기호를 발음 기호열로 변환시키고, 문법 및 철자, 띄어쓰기 오류 등을 교정하는 입력 전처리 수단;Input preprocessing means for analyzing input text according to morphemes, tagging in sentence units, converting non-Hangul symbols into phonetic symbol strings, and correcting grammar, spelling, and spacing errors; 상기 입력 전처리 수단에 의해 생성된 발음 기호열을 이용하여 형태소 단위로 형태소 경계를 분석하고, 품사 태깅을 통해 적절한 단위의 구문 경계를 분석하는 형태소 및 구문 처리 수단;Morpheme and syntax processing means for analyzing the morpheme boundary in morpheme units using the phonetic symbol string generated by the input preprocessing means, and analyzing the syntax boundary of an appropriate unit through part-of-speech tagging; 추출된 단어를 부분문장 분석에 기반한 태깅으로 중의성을 제거하고 동철이음어에 대한 여러 후보 발음 중에서 정확한 음소열을 하나 태깅하는 중의성 제거 및 동철이음어 처리 수단;Neutrality removal and copper splice processing means for removing neutrality with tagging based on partial sentence analysis and tagging a correct phoneme string among several candidate pronunciations for copper splice; 상기 단계에 의해 추출된 형태소 분석 정보 및 태깅 정보에 기반하여 어절 내 끊어읽기 위치를 추출하고 기존의 텍스트/음성변환기의 합성방식으로 합성음을 생성하는 끊어읽기 처리 수단;을 포함하여 이루어진 것을 특징으로 하는 한국어 발음 기호열 생성시스템.And a truncation processing means for extracting a truncated reading position in a word based on the morphological analysis information and the tagging information extracted by the above step and generating a synthesized sound by a synthesis method of an existing text / speech converter. Korean phonetic symbol string generation system. 제1항에 있어서, 상기 입력 전처리 수단은The method of claim 1, wherein the input preprocessing means 비한글 기호들에 대하여 숫자, 로마자, 특수구문, 특수기호, 영문 및 두문자어(acronym), 약자 등으로 구분하여 이들을 다음에 오는 한글문자를 고려하여 한글화시키는 비한글 입력 처리부;A non-Hangul input processing unit for dividing the non-Hangul symbols into numbers, Roman letters, special phrases, special symbols, English and acronyms, abbreviations, and the like by considering them following Korean characters; 문서가 입력되면 태거, 맞춤법/문법 검사, 문자인식 후처리 등 형태소 분석을 하고 문장 단위로 태깅을 하는 형태소 분석 및 태깅부; 및A morphological analysis and tagging unit for performing morphological analysis such as tagging, spelling / grammar checking, and post-recognition post-processing, and tagging by sentence unit when a document is input; And 입력된 문서에 대해 문법 및 철자를 검사하여 오류를 교정하는 입력 문서 정제부;를 포함하여 이루어진 것을 특징으로 하는 한국어 발음 기호열 생성시스템.And an input document refiner for correcting errors by checking grammar and spelling of an input document. 제1항에 있어서, 상기 입력 전처리 수단은 The method of claim 1, wherein the input preprocessing means 수사의 품사, 형태, 언어 계통 및 기·서수에 따른 20가지로 분류한 수사코드와, 아라비안 숫자의 좌·우 문맥, 휴리스틱스, 숫자와 기호의 결합 정보를 확률적 선호도에 대한 규칙을 코드화한 아라비안숫자코드와, 주민등록번호, 웹 주소, 전화번호, 시간, 주소 등의 정형화된 구조와 고유명사를 분류한 정형화된 숫자코드 및 영문자로 표기한 도량형 기호 단위와 그 발음열을 분류한 숫자 데이터베이스;를 더 포함하여 이루어진 것을 특징으로 하는 한국어 발음 기호열 생성 시스템.Code of rules for probabilistic preferences is classified into 20 kinds of rhetorical codes based on parts of speech, form, language system, and ordinal numbers, and the combination of Arabic right and left contexts, heuristics, numbers and symbols. A numeric database categorizing the Arabian number code, a structured structure such as social security number, web address, phone number, time, address, etc. Korean phonetic symbol string generation system, characterized in that further comprises. 제1항에 있어서, 상기 입력 전처리 수단은The method of claim 1, wherein the input preprocessing means 형태소 분석에 기초한 합성어 내에서의 형태소 경계를 추출하고, 형태소 분석 결과와 단어 분류 정보를 코드화한 형태소 경계 추출 데이터베이스; A morphological boundary extraction database extracting morphological boundaries in the compound word based on morphological analysis and encoding morphological analysis results and word classification information; 복합명사를 구성하는 각 명사 경계를 분류한 복합명사코드 데이터베이스;A compound noun code database that classifies each noun boundary forming a compound noun; 동사의 격틀 정보 및 명사와 동사의 연어 관계를 추출하여 지배어와 피지배어를 분류한 동사 데이터베이스; A verb database that classifies dominant words and sebaceous words by extracting verb information and verb relationships between verbs and salmon; 한국어 맞춤법 및 문법 규칙에 정의된 품사 간 결합에 대한 제약규칙이나 순서에 대한 규칙을 코드화한 문법 데이터베이스;A grammar database encoding rules for ordering constraints or ordering on parts of speech defined in Korean spelling and grammar rules; 형태·음운론적 특성에 기반하여 단어의 의미분류를 세분화하고 형태·의미론적 공기 관계 규칙을 코드화한 공기 관계 데이터베이스; 및An air relations database that subdivides the semantic classification of words based on morphological and phonological characteristics and codes morphological and semantic air relation rules; And 사용 빈도가 높은 명사를 분류하고 명사간의 제약관계를 설정하여 코드화한 빈도명사 데이터베이스;를 더 포함하여 이루어진 것을 특징으로 하는 한국어 발음 기호열 생성 시스템.And a frequency noun database coded by classifying nouns with a high frequency of use and setting constraint relations between the nouns. 제1항에 있어서, 상기 발음 기호열 생성 수단은The method of claim 1, wherein the phonetic symbol string generation means 형태소의 내적 발음 규칙, 형태소 간의 발음 규칙, 음운 구 단위의 발음 규칙을 저장하는 형태소 데이터베이스를 포함하여 이루어진 것을 특징으로 하는 한국어 발음 기호열 생성 시스템.Korean phonetic symbol string generation system comprising a morpheme database for storing the pronunciation rules of the morphemes, pronunciation rules between morphemes, phonological phrase units. 제1항에 있어서, 상기 중의성 제거 및 동철이음어 처리 수단은The method of claim 1, wherein the neutral removal and copper splice treatment means 문서내 동철이음어가 검색되면, 앞 공기 규칙 테이블에 기초하여 동철이음어와 공기 관계 정보가 있는 앞 단어를 검사하여 공기 관계어가 존재하면 발음 기호열을 태깅하여 발음 기호열을 제시하고, 만약 동철이음어와 공기 관계 정보가 없는 경우에는 뒤 공기 규칙 테이블에 의해 동철이음어와 공기 관계 정보가 있는 뒤 단어를 검사한 후 공기 관계어가 존재 유무에 따라 발음 기호열을 태깅하여 발음 기호열을 제시하는 것을 특징으로 하는 한국어 발음 기호열 생성 시스템.When a copper splice is searched for in the document, based on the previous air rule table, the front splice with the copper splice and the air relation information is examined. If there is no air-related information, after checking the words after the copper joint and the air-related information by the air rule table, the phonetic symbol string is presented by tagging the phonetic symbol string according to the presence or absence of air-related words. Korean phonetic symbol string generation system. 제1항에 있어서, 상기 중의성 제거 및 동철이음어 처리 수단은The method of claim 1, wherein the neutral removal and copper splice treatment means 중의성 어휘의 형태를 조사하여 개별 어휘를 처리할 수 있는 규칙을 코드화한 중의성 어휘 데이터베이스; 및A neutral vocabulary database in which rules for processing individual vocabularies are coded by examining forms of the neutral vocabulary; And 동철이음어의 문법적 의미와 어휘적 의미의 차이에 따라 달라지는 발음기호열을 분류한 동철이음어 데이터베이스;를 포함하여 이루어진 것을 특징으로 하는 한국어 발음 기호열 생성 시스템.Korean phonetic symbol string generation system comprising a; a categorical phonetic alphabet database classifying phonetic symbol strings that vary according to differences in grammatical meaning and lexical meaning of copper iron joints. 제1항에 있어서, 상기 끊어 읽기 처리 수단은The method of claim 1, wherein the interrupt read processing means 상기 입력 전처리수단에서 추출한 형태소 분석 정보 및 태깅 정보에 기반하여 어절 내 끊어읽기 위치를 추출하는 형태소 경계 추출부; 및A morpheme boundary extracting unit for extracting a broken reading position in a word based on morpheme analysis information and tagging information extracted by the input preprocessing means; And 형태소(조사, 어미) 및 부사어를 범주화하여 분석의 단서로 이용하며, 관용적 통사 패턴과 통계적 기법으로 추출한 구 패턴 및 어절 간 띄어 쓸 확률 정보를 이용하여 통사적 구 경계를 추출하는 구 경계 추출부;를 포함하여 이루어진 것을 특징으로 하는 한국어 발음 기호열 생성 시스템. A sphere boundary extractor which categorizes morphemes (surveys, mothers) and adverbs and uses them as clues for analysis, and extracts syntactic phrase boundaries by using idiomatic syntactic patterns, phrase patterns extracted by statistical techniques, and probability information between words; Korean phonetic symbol string generation system comprising a. 제1항에 있어서, 상기 끊어 읽기 처리 수단은The method of claim 1, wherein the interrupt read processing means 관용적 통사 패턴과 통계적 기법으로 추출한 구 패펀 및 어절간 띄어 쓸 확률 정보를 분류한 끊어읽기 데이터베이스;를 포함하여 이루어진 것을 특징으로 하는 한국어 발음 기호열 생성 시스템.Korean phonetic symbol string generation system comprising a; a punctuation and extracted punctuation information between words and phrases extracted by idiomatic syntactic patterns and statistical techniques. 문서를 음성으로 합성 구현하는 방법에 있어서,In the method of synthesizing a document by voice, 입력되는 텍스트를 형태소에 따라 분석하고 문장 단위로 태깅하여 비한글 기호를 발음 기호열로 변환시키고, 문법 및 철자, 띄어쓰기 오류 등을 교정하는 제 1 단계;A first step of analyzing input text according to morphemes and tagging in sentence units to convert non-Hangul symbols into phonetic symbol strings, and correct grammar, spelling, and spacing errors; 상기 단계에 의해 생성된 발음 기호열을 이용하여 형태소 단위로 형태소 경계를 분석하고, 품사 태깅을 통해 적절한 단위의 구문 경계를 분석하는 제 2 단계;A second step of analyzing a morpheme boundary in units of morphemes using the phonetic symbol string generated by the step, and analyzing a syntax boundary of an appropriate unit through part-of-speech tagging; 상기 단계에 의해 분석된 단어를 부분문장 분석에 기반한 태깅으로 중의성을 제거하고 동철이음어에 대한 여러 후보 발음 중에서 정확한 음소열을 하나 태깅하는 제 3 단계;A third step of removing neutrality by tagging the word analyzed by the above step based on partial sentence analysis and tagging a correct phoneme string among various candidate pronunciations for the copper iron joint; 상기 단계에 의해 추출된 형태소 분석 정보 및 태깅 정보에 기반하여 어절 내 끊어읽기 위치를 추출하고 기존의 텍스트/음성변환기의 합성방식으로 합성음을 생성하는 제 4 단계;를 포함하여 이루어진 것을 특징으로 하는 한국어 발음 기호열 생성방법.A fourth step of extracting a reading position in a word based on the morphological analysis information and the tagging information extracted by the above step and generating a synthesized sound by a synthesis method of an existing text / speech converter; How to create phonetic symbols. 문서를 음성으로 합성 구현하기 위하여, 프로세서를 구비한 문서음성 변환 시스템에,In the document speech conversion system having a processor for synthesizing a document into speech, 입력되는 텍스트를 형태소에 따라 분석하고 문장 단위로 태깅하여 비한글 기호를 발음 기호열로 변환시키고, 문법 및 철자, 띄어쓰기 오류 등을 교정하는 제 1 기능;A first function of analyzing input text according to morphemes and tagging in sentence units to convert non-Hangul symbols into phonetic symbol strings, and correct grammar, spelling, and spacing errors; 상기 단계에 의해 생성된 발음 기호열을 이용하여 형태소 단위로 형태소 경계를 분석하고, 품사 태깅을 통해 적절한 단위의 구문 경계를 분석하는 제 2 기능;A second function of analyzing a morpheme boundary in units of morphemes using the phonetic symbol string generated by the step, and analyzing a syntax boundary of an appropriate unit through part-of-speech tagging; 상기 단계에 의해 분석된 단어를 부분문장 분석에 기반한 태깅으로 중의성을 제거하고 동철이음어에 대한 여러 후보 발음 중에서 정확한 음소열을 하나 태깅하는 제 3 기능;A third function of removing neutrality by tagging the word analyzed by the above step based on partial sentence analysis and tagging a correct phoneme string among a plurality of candidate pronunciations for copper iron joints; 상기 단계에 의해 추출된 형태소 분석 정보 및 태깅 정보에 기반하여 어절 내 끊어읽기 위치를 추출하고 기존의 텍스트/음성변환기의 합성방식으로 합성음을 생성하는 제 4 기능;을 실현시키기 우한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.A fourth function of extracting a reading position in a word based on the morphological analysis information and the tagging information extracted by the above step and generating a synthesized sound by a synthesis method of an existing text / speech converter; Readable record carrier.
KR1020040048709A 2004-06-26 2004-06-26 A system for generating technique for generating korean phonetic alphabet KR100650393B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020040048709A KR100650393B1 (en) 2004-06-26 2004-06-26 A system for generating technique for generating korean phonetic alphabet

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040048709A KR100650393B1 (en) 2004-06-26 2004-06-26 A system for generating technique for generating korean phonetic alphabet

Publications (2)

Publication Number Publication Date
KR20050123007A true KR20050123007A (en) 2005-12-29
KR100650393B1 KR100650393B1 (en) 2006-11-27

Family

ID=37294751

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040048709A KR100650393B1 (en) 2004-06-26 2004-06-26 A system for generating technique for generating korean phonetic alphabet

Country Status (1)

Country Link
KR (1) KR100650393B1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008038994A1 (en) * 2006-09-29 2008-04-03 Electronics And Telecommunications Research Institute Method for converting pronunciation using boundary pause intensity and text-to-speech synthesis system based on the same
CN112634858A (en) * 2020-12-16 2021-04-09 平安科技(深圳)有限公司 Speech synthesis method, speech synthesis device, computer equipment and storage medium
KR20210051524A (en) * 2019-10-30 2021-05-10 주식회사 솔트룩스 Speech synthesis system and method thereof
KR20220065483A (en) 2020-11-13 2022-05-20 주식회사 에스알유니버스 Artificial neural-network based multilingual text-to-speech synthesis using a single set of phonetic symbols

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102152900B1 (en) * 2020-02-24 2020-09-07 주식회사 엘솔루 Method and apparatus for processing data whth ambiguous syllabl

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100202292B1 (en) * 1996-12-14 1999-06-15 윤덕용 Text analyzer
KR100499116B1 (en) * 1999-02-09 2005-07-04 삼성전자주식회사 Method and apparatus for prosodic phrasing for speech synthesis

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008038994A1 (en) * 2006-09-29 2008-04-03 Electronics And Telecommunications Research Institute Method for converting pronunciation using boundary pause intensity and text-to-speech synthesis system based on the same
KR20210051524A (en) * 2019-10-30 2021-05-10 주식회사 솔트룩스 Speech synthesis system and method thereof
KR20220065483A (en) 2020-11-13 2022-05-20 주식회사 에스알유니버스 Artificial neural-network based multilingual text-to-speech synthesis using a single set of phonetic symbols
CN112634858A (en) * 2020-12-16 2021-04-09 平安科技(深圳)有限公司 Speech synthesis method, speech synthesis device, computer equipment and storage medium
CN112634858B (en) * 2020-12-16 2024-01-23 平安科技(深圳)有限公司 Speech synthesis method, device, computer equipment and storage medium

Also Published As

Publication number Publication date
KR100650393B1 (en) 2006-11-27

Similar Documents

Publication Publication Date Title
Khoja APT: Arabic part-of-speech tagger
US6278968B1 (en) Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
US6223150B1 (en) Method and apparatus for parsing in a spoken language translation system
Palmer Tokenisation and sentence segmentation
US6442524B1 (en) Analyzing inflectional morphology in a spoken language translation system
US6243669B1 (en) Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US6356865B1 (en) Method and apparatus for performing spoken language translation
US20100332217A1 (en) Method for text improvement via linguistic abstractions
Al Shamsi et al. A hidden Markov model-based POS tagger for Arabic
US20080221863A1 (en) Search-based word segmentation method and device for language without word boundary tag
Alghamdi et al. Automatic restoration of arabic diacritics: a simple, purely statistical approach
US20070179779A1 (en) Language information translating device and method
Tufiş et al. DIAC+: A professional diacritics recovering system
de Silva et al. Singlish to sinhala transliteration using rule-based approach
Okhovvat et al. A hidden Markov model for Persian part-of-speech tagging
Vasiu et al. Enhancing tokenization by embedding romanian language specific morphology
KR100650393B1 (en) A system for generating technique for generating korean phonetic alphabet
Al Daimi et al. The syntactic analysis of Arabic by machine
Hirpassa Information extraction system for Amharic text
Nowakowski et al. Applying support vector machines to POS tagging of the Ainu language
Kavros et al. SoundexGR: An algorithm for phonetic matching for the Greek language
Pretorius et al. Setswana tokenisation and computational verb morphology: Facing the challenge of a disjunctive orthography
Kanaan et al. Full automatic Arabic text tagging system
Rahate et al. An experimental technique on text normalization and its role in speech synthesis
Okhovvat et al. An Accurate Persian Part-of-Speech Tagger.

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120522

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee