KR20040055288A - 한국어 음성합성기의 운율모듈을 위한 어절의 태깅 방법 - Google Patents

한국어 음성합성기의 운율모듈을 위한 어절의 태깅 방법 Download PDF

Info

Publication number
KR20040055288A
KR20040055288A KR1020020081927A KR20020081927A KR20040055288A KR 20040055288 A KR20040055288 A KR 20040055288A KR 1020020081927 A KR1020020081927 A KR 1020020081927A KR 20020081927 A KR20020081927 A KR 20020081927A KR 20040055288 A KR20040055288 A KR 20040055288A
Authority
KR
South Korea
Prior art keywords
word
speech
tag
tagging
sentence
Prior art date
Application number
KR1020020081927A
Other languages
English (en)
Inventor
오승신
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020020081927A priority Critical patent/KR20040055288A/ko
Publication of KR20040055288A publication Critical patent/KR20040055288A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

본 발명에 의한 한국어 음성합성기에서 운율 모듈을 위한 어절의 태깅 방법은 형태소별로 태깅된 품사열을 입력 받는 단계; 상기 품사열에 대하여 어절별로 형태적 특성 및 구문적 특성을 나타내는 어절 태그를 표시하는 단계; 및 운율구 형성에 기여하는 품사별로 적어도 하나 이상의 상기 어절 태그로 어절태그셋을 구성하는 단계;를 특징으로 하며, 운율구의 경계 예측을 보다 정확하게 할 수 있어 끊어읽기의 규칙 작성에 있어 곤란성을 줄이는 등 운율 모듈을 효율적으로 개발하고 구현할 수 있다.

Description

한국어 음성합성기의 운율모듈을 위한 어절의 태깅 방법{Method for tagging for prosodic module of speech synthesizer in Korean}
본 발명은 한국어 음성합성기의 운율 모듈을 효율적으로 개발하고 구현할 수 있도록 운율 모듈을 위해 필요한 어절 태그셋을 설정하여 형태소 품사 태깅 결과를 가지고 어절 태그로 매핑하는 방법에 관한 것이다.
운율 모듈을 위한 어절 태깅 방법에 대한 종래의 기술은 다음과 같이 두가지로 분류해볼 수 있다.
종래의 첫번째 방법으로서, 어절의 형태소 태깅 결과에서 마지막 형태소의 품사태그를 이용하여 그 바이그램(bigram)과 트라이그램(trigram)을 이용한다. 마지막 형태소의 품사태그를 그대로 이용하기 때문에 품사태그셋의 수에 따라서 운율구의 경계 예측에 잉여적인 품사 분류가 될 수 있으며 규칙 수가 많아지는 문제점이 있다. 또한 마지막 형태소의 품사 정보 외에는 어절에 대한 정보를 주지 못하는 문제점도 가지고 있다.
종래의 두번째 방법으로서, 헝태소해석기를 이용하여 기존의 태그셋을 구성성분셋으로 축소하여 어절을 태깅한다. 어절이 문장에서 어떤 구성성분을 이루는가 하는 관점에서 태그셋을 재분류하여 구성성분셋으로 축소하여 어절을 태깅하는 방법인데 기존의 품사셋보다 간략하다는 장점이 있으나, 마지막 형태소의 품사에 의존하기 때문에 발생하는 문제점은 첫번째 방법과 동일하다.
본 발명이 이루고자 하는 기술적 과제는 형태소 태거에서 생성된 품사열 정보를 바탕으로 운율구 경계 예측에 관계되는 어절의 통사, 형태적 정보를 나타내는 어절을 태깅하는 방법을 제공하기 위한 것이다
도 1은 본 발명에 의한 어절 태깅 방법의 흐름을 보여주는 흐름도이다.
도 2는 본 발명에 의한 어절 태그의 종류와 그 구성 성분의 일 예를 보여주는 도면이다.
도 3은 본 발명에 의한 예외적인 단어의 태그 목록의 일 예를 보여주는 도면이다.
상기의 기술적 과제를 이루기 위하여 본 발명에 의한 한국어 음성합성기에서 운율 모듈을 위한 어절의 태깅 방법은 형태소별로 태깅된 품사열을 입력 받는 단계; 상기 품사열에 대하여 어절별로 형태적 특성 및 구문적 특성을 나타내는 어절 태그를 표시하는 단계; 및 운율구 형성에 기여하는 품사별로 적어도 하나 이상의 상기 어절 태그로 어절태그셋을 구성하는 단계;를 포함하는 것을 특징으로 한다.
본 발명의 바람직한 일 실시예를 설명하기에 앞서 먼저 본 발명의 전제가 되는 설명을 간략하게 한다. 음성합성에는 입력된 텍스트에 대해 끊어읽기 강도 할당 등을 수행하는 운율 모듈이 존재하는데, 이 운율 모듈은 구문 분석기가 없는 경우에는 어절의 형태소 품사 태깅 결과에 의존하여 만들어지게 된다. 이 때 일반적인 형태소 품사 태깅의 결과라는 것은 한 어절당 대개 두 개 이상의 품사열이 되기 때문에, 이 품사열을 가지고 바이그램(bigram)이나 트라이그램(trigram)을 이용한 통계적 방법으로 운율구 경계를 결정하는 규칙을 만든다고 하면 그 규칙의 수가 지나치게 많아진다. 따라서 이 품사 정보를 간략화하는 방법이 필요하다. 보통은 어절의 마지막 형태소의 품사 태그만을 이용하거나 이것을 간략화한 태그셋을 이용하기도 하는데, 이렇게 되면 문장의 운율구에 대한 예측은 오로지 어절의 마지막 형태소의 품사 태그에만 의존하게 된다. 한 어절에 선행하는 구문의 구조는 어간 정보에 의해 예측이 가능한 경우가 있기 때문에 어간의 품사 정보와 어미, 조사의 품사 정보를 동시에 보여주는 어절 태그가 필요하다. 또한 품사 분류도 형태소 분석에 필요한 품사 분류와 운율구 예측에 필요한 품사 분류는 달라질 수 있다. 이렇게 운율구와 유관한 정보를 고려하여 어절 태그셋을 재설정함으로써 통계적 방법으로 끊어읽기 규칙을 만들 때의 곤란성(perplexity)을 줄일 수 있다.
이러한 관점에서 본 발명에 의한 어절 태깅 방법의 바람직한 일 실시예를 첨부된 도면을 참조하면서 자세하게 설명하도록 한다. 도 1은 본 발명에 의한 어절 태깅 방법의 흐름을 보여주는 흐름도이고, 도 2는 본 발명에 의한 어절 태그의 종류와 그 구성 성분의 일 예를 보여주는 도면이다. 또한 도 3은 본 발명에 의한 예외적인 단어의 태그 목록의 일 예를 보여주는 도면이다.
먼저 어절 태깅이라 함은 기존의 형태소 품사 태거를 사용하여 그 태깅 결과인 품사열을 입력으로 하여, 최종 결과로써 어절 태그셋으로 매핑하여 태그를 생성하는 과정이다. 이를 위하여 형태소 태깅 결과를 입력으로 받아(101) 본 발명에서 규정하는 예외 단어에 속하는 지를 판단한다(102). 여기서 예외 단어라 함은 그 단어의 품사와 문장 속에서 실제로 작용하는 기능이 일치하지 않는 경우를 말하며, 본 발명에 의한 어절 태깅 방법에서는 이러한 단어들을 특별히 취급하여 도 3에서 보이는 예와 같이 예외 단어 태그 목록을 작성한다(103). 만약에 102단계의 판단결과 그러한 단어가 발견이 되면 예외 단어 태그 목록에 의거하여 예외 단어 태그를 적용한 후(104) 출력한다. 상기의 예외 단어와 관련된 설명은 아래에서 보다 자세하게 하도록 하겠다.
예외단어에 속하지 아니하면 형태소별로 품사를 분리한 후 품사 태그와 어절태그 단일 코드의 매핑테이블(105)를 기준으로 품사별로 어절 태그 매핑을 수행한다(106). 품사 태그와 어절 태그 단일 코드의 매핑테이블의 몇 가지 예를 105에 보였다. 형태소 태깅 결과가 '일반명사(ncn)'이면 105에 의하여 하나의 코드 즉 단일 코드인 'N'으로 매핑이 된다.
상기와 같이 매핑을 수행한 후 어절이 끝이 났는 지를 판단(109)하여, 어절의 끝이 아니면 즉 형태소가 더 존재하면 106단계로 되돌아 가서 위의 과정을 수행하고, 어절의 끝이라고 판단되면 어절 코드로의 매핑 테이블(108)에 근거하여 어절 태깅을 수행한다(109). 어절 코드로의 매핑 테이블의 예를 들어보면 105에서 단일 코드인 N으로 매핑된 단어에 '~을', '~를' 과 같은 목적격 조사가 붙었을 때에는'No'로 매핑이 된다. 그리고 어절 태깅 결과를 출력함으로써 어절 태깅 과정이 완료된다(110).
이제 어절 태그 셋 즉 도 2와 도 3의 매핑 테이블을 구성하는 방법을 자세히 알아 보기로 한다. 매핑에 사용되는 기본적인 어절 태그셋은 다음의 기준으로 설정된다. 각각의 어절 태그는 기본적으로 어절의 주요 구성성분의 품사정보를 나타내면서 동시에 어절의 구조와 문장 성분으로서의 기능을 나타낸다. 어절 태그셋은 기존의 형태소 품사 분류를 운율구의 경계를 예측하는 데에 필요한 품사셋으로 재분류를 하여 설정된다. 운율구 형성에 유사한 양상을 보이는 품사들은 같은 품사로 묶고, 같은 품사의 단어 중에서 운율구의 형성에 다른 양상을 보이는 단어들은 구분한다. 도 2는 어절 태그의 종류와 그 주요 구성성분을 나타낸 것이다. 어절 태그의 기본 구조는 기본적으로 두 부분으로 되어 있다. 어간이나 체언의 종류를 나타내는 부분과 어미, 조사의 종류와 관계된, 즉 문장 성분을 표시하는 부분이다. 어절의 구조를 몇가지 부류로 나누어 그 태그 설정 방법을 살펴본다.
1. 체언과 조사로 구성된 어절
예를 들면 '학생이'라는 어절에서 형태소 태깅 결과가 '일반명사(ncn)+주격조사(jcs)'라는 품사열이 된다고 하면 어절 태거에서는 이것이 하나의 코드인 'Ns'로 태깅이 된다. '학생'에 해당하는 코드가 'N'이고, '이'라는 주격 조사에 해당하는 코드가 's'가 된다. 즉, 'Ns'는 어간이 체언이면서 문장의 구성성분으로는 주어의 기능을 한다는 것을 나타낸다. 어절 태그에서는 의존명사(단위성, 비단위성)를 제외하고는 모든 체언류를 'N'으로 본다. 체언의 내용적 분류가 운율구의 형성과 관계가 없다고 보기 때문이다. 반면, 의존명사는 앞 어절에 붙어 앞 어절과 같은 운율구를 형성하는 경우가 많기 때문에 따로 'DN(dependent noun)'이라는 코드로 일반 체언과 구분한다.
조사 부분은 문장에서 어떤 성분으로 기능하느냐에 따라 재분류한다. 주격이나 목적격 조사, 부사격, 호격 조사 등은 품사 분류가 그대로 문장 성분의 분류와 일치하므로 품사 분류를 그대로 따른다. '접속격'과 '공동격', '주격'과 '보격' 조사와 같이 형태만으로 구분이 안 되는 조사는 구분하지 않고 하나의 코드로 묶는다. 보조사의 경우, '은/는'과 같이 문장의 주제어를 형성하여 운율구 경계를 이룰 가능성이 높은 보조사는 다른 보조사와 분리하여 독립된 코드가 주어진다. 그 외의 보조사들은 부사격 조사에 포함을 시키는데, 그것은 어차피 보조사만으로는 그 문장에서의 성분을 예측할 수 없으므로 하나의 격조사에 포함시킨다. 조사 부분에서 '~에서만', '으로부터'와 같이 여러 개의 조사가 복합된 경우, 그 중의 격조사에 의거하여 품사가 설정된다.
2. 어간과 어미로 구성된 어절
용언의 어간은 동사, 형용사를 구분하지 않고 'V'라는 코드가 주어지나, '하고 있다', '보고 싶다'에서의 '있다', '싶다'와 같은 보조용언에 대해서는 선행 어절과 함께 같은 운율구를 형성할 가능성이 높으므로, 본용언과 구분하여 'AV'라는 코드로 구분한다.
어미의 구분은 관형형 어미, 연결어미, 종결어미, 보조적 연결어미, 그리고 인용형 어미(다고, 라고, 냐고, 자고)로 제한한다. 연결어미는 보통 종속적 연결어미와 대등적 연결어미로 구분되는데 본 발명에서는 운율구 형성에 크게 관여하지 않는 것으로 보아 구분하지 않는다. 따라서 본용언이냐, 보조용언이냐에 따라 'V' 또는 'AV'로 구분하고 여기에 어미를 나타내는 'm', 'c', 'f', 'x', 'q'라는 코드를 조합하여 태그가 부여된다.
3. 복합 구성의 어절
어절의 형태 가운데에는 용언의 어간에 명사형 어미가 붙고 여기에 다시 조사가 붙은 형태가 있다. 예를 들면, '그는 고향으로 가기를 원한다'와 같은 문장의 '가기를'이라는 어절이 그러한 형태이다. 이 같은 어절은 그 마지막 형태소만 고려한다면 '명사 + 조사'의 구성과 같다고 할 수 있으나 앞의 어절들과 함께 내포문을 구성하여 '그는 고향으로 선물을 보냈다'와 같은 단문과는 다른 복문이 되며, 운율구도 다르게 형성이 될 수 있다. 따라서 이러한 어절에 대해서는 동사가 명사형이 되어 있음을 나타내도록 'VN'으로 표시하고 여기에다가 조사에 해당하는 태그를 붙인다.
4. 수식어, 접속어를 구성하는 어절
부사나 관형사, 접속사 등이 주성분을 이루는 어절들은 그 자체로 부사어, 관형어, 접속어를 이룬다. 이들에 대해서는 'Aa', 'Dm', 'Ci'로 각각 태그를 설정하며, 이때 보조사가 첨가된 형태라 하더라도 그 기능에는 변함이 없으므로 같은 태그를 설정한다.
5. 예외 규칙의 적용
국어의 품사 분류를 보면 품사와 문장 상에서의 기능이 항상 일치하지 않는경우가 있다. 예를 들면 '빠르게, 굳게, 이렇게'와 같은 어절들은 형용사와 연결 어미 '게'가 결합된 형태인데, 이들은 위의 원칙대로 한다면 용언과 연결어미의 결합형 어절 태그인 'Vc'로 태깅이 되어야 하나, 같은 태그가 부여되는 '먹고, 입어서, 가지만'과 같은 어절들과는 달리 주로 부사어로서 기능을 하며, 운율구 형성에서도 용언의 연결형과는 다른 양상을 보일 때가 많다. 이렇게 같은 품사지만 다른 기능을 하는 경우에 대해서는 예외 규칙을 적용하여 부사어인 'Aa'로 태깅한다.
6. 예외 단어의 태깅
단어들 중에는 같은 품사라 하더라도 운율구 경계 형성에 역할을 하는 단어들이 있어서 이들을 구분해줄 필요가 있다. 예를 들면 의존명사 중에 '뿐', '만큼', '동안', '채', '듯'과 같은 단어나 일반명사 중에서 '후', '경우', '때' 등과 같은 단어는 용언의 관형형이 앞에 올 경우 하나의 절을 형성하여, 운율구의 경계를 이룰 가능성이 높은 단어들이다. 이렇게 일반 텍스트에서 빈번하게 나타나면서 특수한 쓰임새를 보이는 단어들에 대해서는 다른 의존명사나 명사와 구분하여 독립된 태그를 부여한다. 예외 단어 태그는 합성기의 주제영역에 따라, 즉 입력텍스트의 성격에 따라 추가하거나 줄일 수 있다. 도 3은 예외단어의 태그 목록의 예를 보인 것이다.
예외단어들의 태그는 임의적인 것으로 다른 태그와 구별할 수 있는 한 어떤 코드를 사용하든 상관이 없다. 단지 각각 다른 태그의 단어들은 운율구의 형성과 관련하여 다른 양상을 보이는 부류라고 할 수 있다.
본 발명에 의한 어절 태깅 방법은 또한 컴퓨터로 읽을 수 있는 기록매체에컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 하드 디스크, 플로피 디스크, 플래쉬 메모리, 광 데이타 저장장치등이 있으며, 또한 캐리어 웨이브(예를들면 인터넷을 통한 전송)의 형태로 구현되는 것도 포함된다. 또한 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 통신망으로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 읽을 수 있는 코드로서 저장되고 실행될 수 있다. 또한 본 발명에 의한 폰트 롬 데이터구조도 컴퓨터로 읽을 수 있는 ROM, RAM, CD-ROM, 자기 테이프, 하드 디스크, 플로피 디스크, 플래쉬 메모리, 광 데이타 저장장치등과 같은 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다.
이상에서 설명한 바와 같이 본 발명에 따른 어절 태깅 방법은 운율구의 경계 예측을 보다 정확하게 할 수 있어 끊어읽기의 규칙 작성에 있어 곤란성을 줄이는 등 운율 모듈을 효율적으로 개발하고 구현할 수 있다.

Claims (9)

  1. 한국어 음성합성기에서 운율 모듈을 위한 어절의 태깅 방법에 있어서,
    (a) 형태소별로 태깅된 품사열을 입력 받는 단계;
    (b) 상기 품사열에 대하여 어절별로 형태적 특성 및 구문적 특성을 나타내는어절 태그를 표시하는 단계; 및
    (c) 운율구 형성에 기여하는 품사별로 적어도 하나 이상의 상기 어절 태그로 어절태그셋을 구성하는 단계;를 특징으로 하는 어절 태깅 방법.
  2. 제1항에 있어서, 상기 (b)단계는
    (b1) 상기 어절 태그를 어간 혹은 체언의 종류를 나타내는 제1부분과 문장 성분을 나타내는 제2부분으로 분리하여 표시하는 단계;를 포함하는 것을 특징으로 하는 어절 태깅 방법.
  3. 제2항에 있어서, 상기 (b1)단계는
    상기 어절을 상기 제1내지 제2부분의 성분을 기초로 체언과 조사로 구성된 제1어절, 어간과 어미로 구성된 제2어절, 복합 구성의 제3어절, 수식어와 접속어를 구성하는 제4어절, 품사와 문장내에서의 기능이 일치하지 않는 경우인 제5어절로 분리하는 단계;를 포함하는 것을 특징으로 하는 어절 태깅 방법.
  4. 제3항에 있어서, 상기 제1어절은
    상기 제1부분은 의존명사와 일반 체언에 따라 구분하고, 상기 제2부분은 문장내에서 기능하는 성분을 기초로 구분하는 것을 특징으로 하는 어절 태깅 방법.
  5. 제3항에 있어서, 상기 제2어절은
    상기 제1부분은 본용언과 보조용언으로 구분하고, 상기 제2부분은 관형형 어미, 연결 어미, 보조적 연결 어미, 그리고 인용형 어미로 구분하는 것을 특징으로 하는 어절 태깅 방법.
  6. 제3항에 있어서, 상기 제3어절은
    상기 제1부분이 용언의 명사형이고 상기 제2부분이 조사인 경우에 상기 제1부분이 명사형으로 된 용언임을 표시하는 것을 특징으로 하는 어절 태깅 방법.
  7. 제3항에 있어서, 상기 제4어절은
    상기 제4어절의 주성분이 부사, 관형사, 접속사이면 각각 부사어, 관형어, 접속어를 나타내도록 표시하고, 상기 부사, 관형사, 접속사에 각각 보조사가 첨부되는 경우에도 동일한 태그를 설정하는 것을 특징으로 하는 어절 태깅 방법.
  8. 제3항에 있어서, 상기 제5어절은
    동일한 품사를 가지지만 운율구 형성에 기여하는 단어는 상기 단어가 가지고 있는 원래의 품사와 상이하게 태그를 설정하는 것을 특징으로 하는 어절 태깅 방법.
  9. 제1항의 단계를 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020020081927A 2002-12-20 2002-12-20 한국어 음성합성기의 운율모듈을 위한 어절의 태깅 방법 KR20040055288A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020020081927A KR20040055288A (ko) 2002-12-20 2002-12-20 한국어 음성합성기의 운율모듈을 위한 어절의 태깅 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020020081927A KR20040055288A (ko) 2002-12-20 2002-12-20 한국어 음성합성기의 운율모듈을 위한 어절의 태깅 방법

Publications (1)

Publication Number Publication Date
KR20040055288A true KR20040055288A (ko) 2004-06-26

Family

ID=37347989

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020020081927A KR20040055288A (ko) 2002-12-20 2002-12-20 한국어 음성합성기의 운율모듈을 위한 어절의 태깅 방법

Country Status (1)

Country Link
KR (1) KR20040055288A (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100720175B1 (ko) * 2005-11-09 2007-05-18 한국전자통신연구원 음성합성을 위한 끊어읽기 장치 및 방법
KR101025814B1 (ko) * 2008-12-16 2011-04-04 한국전자통신연구원 운율 모델을 이용한 형태소 품사 태깅 방법 및 그 장치
KR102090240B1 (ko) 2018-11-29 2020-03-17 부산대학교 산학협력단 심층학습을 이용한 한국어 운율구 경계 예측 장치 및 방법
KR20210075815A (ko) 2019-12-13 2021-06-23 주식회사 소리자바 음성 인식 힌트 적용 장치 및 방법
KR20230050932A (ko) 2021-10-08 2023-04-17 주식회사 케이티 음성합성 서비스를 제공하는 장치, 방법 및 컴퓨터 프로그램
KR20240036908A (ko) 2022-09-14 2024-03-21 주식회사 케이티 음성합성 서비스를 제공하는 장치, 방법 및 컴퓨터 프로그램

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100720175B1 (ko) * 2005-11-09 2007-05-18 한국전자통신연구원 음성합성을 위한 끊어읽기 장치 및 방법
KR101025814B1 (ko) * 2008-12-16 2011-04-04 한국전자통신연구원 운율 모델을 이용한 형태소 품사 태깅 방법 및 그 장치
KR102090240B1 (ko) 2018-11-29 2020-03-17 부산대학교 산학협력단 심층학습을 이용한 한국어 운율구 경계 예측 장치 및 방법
KR20210075815A (ko) 2019-12-13 2021-06-23 주식회사 소리자바 음성 인식 힌트 적용 장치 및 방법
KR20230050932A (ko) 2021-10-08 2023-04-17 주식회사 케이티 음성합성 서비스를 제공하는 장치, 방법 및 컴퓨터 프로그램
KR20240036908A (ko) 2022-09-14 2024-03-21 주식회사 케이티 음성합성 서비스를 제공하는 장치, 방법 및 컴퓨터 프로그램

Similar Documents

Publication Publication Date Title
Cheng et al. Phasal syntax= cyclic phonology?
Roark et al. Computational approaches to morphology and syntax
Habash et al. MAGEAD: A morphological analyzer and generator for the Arabic dialects
JP2003085193A (ja) テキストサマリ生成システム及び方法
JP3372532B2 (ja) 感情情報抽出方法および感情情報抽出プログラムの計算機読み取り可能な記録媒体
Tedla et al. Tigrinya part-of-speech tagging with morphological patterns and the new nagaoka tigrinya corpus
Neeleman et al. On syntactic and phonological representations
Bjarnadóttir Phrasal compounds in Modern Icelandic with reference to Icelandic word formation in general
Wang et al. MUXING: a telephone-access Mandarin conversational system.
Rizki et al. Word formation process in novel alice’s adventures in wonderland by Lewis Carroll and movie alice in wonderland by Walt Disney
KR20040055288A (ko) 한국어 음성합성기의 운율모듈을 위한 어절의 태깅 방법
Ewen et al. Phonology Yearbook
Wu et al. Parsing-based Chinese word segmentation integrating morphological and syntactic information
Hartrumpf Hybrid disambiguation of prepositional phrase attachment and interpretation
KR100202292B1 (ko) 한문어 문서 음성 변환 시스템을 위한 문서 분석기
KR950013129B1 (ko) 기계번역장치 및 방법
Rozovskaya et al. Challenges in processing colloquial Arabic
Ghayoomi et al. A POS-based word prediction system for the Persian language
Carruthers Annotating an oral corpus using the Text Encoding Initiative. Methodology, problems, solutions1
Mohsin Blending, from English to Arabic
Sarveswaran Morphology and Syntax of the Tamil Language
Pretorius et al. Tswana finite state tokenisation
Fernández Lemmatising Old English on a relational database
Kountz et al. A LAF/GrAF based Encoding Scheme for underspecified Representations of syntactic Annotations.
JP3892227B2 (ja) 機械翻訳システム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application