KR100238189B1 - 다중 언어 tts장치 및 다중 언어 tts 처리 방법 - Google Patents
다중 언어 tts장치 및 다중 언어 tts 처리 방법 Download PDFInfo
- Publication number
- KR100238189B1 KR100238189B1 KR1019970053020A KR19970053020A KR100238189B1 KR 100238189 B1 KR100238189 B1 KR 100238189B1 KR 1019970053020 A KR1019970053020 A KR 1019970053020A KR 19970053020 A KR19970053020 A KR 19970053020A KR 100238189 B1 KR100238189 B1 KR 100238189B1
- Authority
- KR
- South Korea
- Prior art keywords
- language
- tts
- sentence
- converting
- input
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 10
- 238000003672 processing method Methods 0.000 claims abstract description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
본 발명은 여러나라의 언어로 구성된 문장를 처리할 수 있는 다중언어 TTS 장치 및 다중언어 TTS 처리 방법에 관한 것으로서, 상기 다중언어 TTS 장치는 다중언어의 문장을 입력받고, 상기 입력된 문장을 각각의 언어별로 분할하는 다중언어 처리부; 상기 다중언어 처리부에서 분할된 문장을 각각 오디오 웨이브 데이터로 변환하는 각종 언어별 TTS 엔진들을 구비한 TTS 엔진부; 상기 TTS 엔진부에서 변환된 오디오 웨이브 데이터를 아날로그 음성 신호로 변환하는 오디오 처리부; 및 상기 오디오 처리부에서 변환된 아날로그 음성 신호를 음성으로 변환하여 출력하는 스피커를 포함하는 것을 특징으로 한다.
본 발명에 의하면, 사전 또는 인터넷 등과 같이 다중언어로 구성된 문장이 사용되는 분야에서도 문장을 음성으로 적절히 변환할 수 있다.
Description
본 발명은 TTS(Text to Speach) 장치에 관한 것으로서, 특히 여러나라의 언어로 구성된 문장를 처리할 수 있는 다중언어 TTS 장치 및 다중언어 TTS 처리 방법에 관한 것이다.
도 1은 종래의 방식에 의해 TTS 처리를 하는 장치의 구성도이다. 소정의 언어로 입력된 문장은 TTS 엔진(100)에 의해 오디오 웨이브 데이터(Audio Wave Data)로 변환되고, 상기 TTS 엔진(100)에 의해 변환된 오디오 웨이브 데이터는 오디오 처리부(110)에 의해 아날로그 음성 신호로 변환되고, 상기 오디오 처리부(110)에 의해 변환된 아날로그 음성 신호는 스피커(120)를 통해 음성으로 내보내진다.
그런데, 종래의 기술에 의한 TTS 장치는 한 가지 종류의 언어(즉, 한국어 또는 영어 또는 일본어 등)로만 이루어진 문장에 대해서는 적절한 음성을 생성할 수 있으나, 여러 종류의 언어가 혼합되어 있는 문장, 즉 다중언어의 문장에 대해서는 적절한 음성을 생성하지 못하는 단점을 지닌다.
본 발명은 상기의 문제점을 해결하기 위하여 창작된 것으로서, 사전 또는 인터넷 등에서 사용되는 다중언어 문장에 대해서도 적절한 음성을 생성할 수 있는 다중언어 TTS 장치 및 다중언어 TTS 처리 방법를 제공함을 그 목적으로 한다.
도 1은 종래의 방식에 의해 TTS 처리를 하는 장치의 구성도이다.
도 2는 본 발명의 일실시예로서, 한글/영어 혼합문장을 TTS 처리하는 장치의 구성도이다.
도 3은 상기 도 2에 도시된 다중언어 처리부의 동작 상태를 설명하기 위한 상태도이다.
상기의 목적을 달성하기 위하여, 본 발명에 의한 다중언어 TTS 장치는 다중언어의 문장을 입력받고, 상기 입력된 문장을 각각의 언어별로 분할하는 다중언어 처리부; 상기 다중언어 처리부에서 분할된 문장을 각각 오디오 웨이브 데이터로 변환하는 각종 언어별 TTS 엔진들을 구비한 TTS 엔진부; 상기 TTS 엔진부에서 변환된 오디오 웨이브 데이터를 아날로그 음성 신호로 변환하는 오디오 처리부; 및 상기 오디오 처리부에서 변환된 아날로그 음성 신호를 음성으로 변환하여 출력하는 스피커를 포함하는 것을 특징으로 한다.
상기의 다른 목적을 달성하기 위하여, 본 발명에 의한 다중언어로 구성된 입력 문장을 음성으로 변환하는 방법은 현재 처리하고 있는 언어와 다른 언어를 발견할 때까지, 상기 입력 문장에 포함된 문자를 하나씩 확인하는 제1 단계; 상기 제1 단계에서 확인된 문자들의 리스트를 상기 현재 처리하고 있는 언어에 적합한 오디오 웨이브 데이터로 변환하는 제2 단계; 상기 제2 단계에서 변환된 오디오 웨이브 데이터를 음성으로 변환하여 출력하는 제3 단계; 및 상기 입력 문장 중에 변환할 문자가 더 남아 있는 경우에는 상기 제1 단계에서 발견한 현재 처리하고 있는 언어와 다른 언어를 현재 처리하고 있는 언어로 변경하여 상기 제1 단계 내지 상기 제3 단계를 반복하는 제4 단계를 포함함을 특징으로 한다.
이하에서 첨부된 도면을 참조하여 본 발명을 상세히 설명한다.
도 2에 의하면, 본 발명의 일실시예로서, 한글/영어 혼합문장을 TTS 처리하는 장치는 다중언어 처리부(200), TTS 엔진부(210), 오디오 처리부(220) 및 스피커(230)를 포함하여 구성된다.
상기 다중언어 처리부(200)는 상기 한글/영어 혼합문장을 입력받고, 상기 입력된 혼합문장을 한글 또는 영어로 분할한다.
도 3에 의하면, 본 발명의 일실시예로서, 한글/영어 혼합문장을 TTS 처리하는 장치에 포함된 다중언어 처리부(200)는 2개의 언어처리부들, 즉 한글처리부(300) 및 영어처리부(310)를 구비한다.
상기 언어처리부들(300, 310)은 각각 자신이 처리하는 언어와 다른 언어를 발견할 때까지 상기 한글/영어 혼합문장을 문자 단위로 입력받아 상기 TTS 엔진부(210)에 포함된 해당 TTS 엔진에 전달하고, 상기 발견한 다른 언어를 처리하는 언어처리부로 제어를 넘겨준다. 상기 다중언어 처리부(200)는 본 발명의 실시예에서 지원하고자 하는 언어의 종류가 추가됨에 따라 얼마든지 지원하고자 하는 언어에 대한 언어처리부를 추가할 수 있다.
상기 TTS 엔진부(210)는 상기 다중언어 처리부(200)에서 분할된 한글 문자 리스트와 영어 문자 리스트를 각각 오디오 웨이브 데이터로 변환하는 한글 TTS 엔진(214)과 영문 TTS 엔진(212)을 구비한다. 상기 TTS 엔진들(212, 214)은 각각 어휘 분석(Lexical Analysis) 단계, 어근 분석 단계, 파싱(Parsing) 단계, 웨이브 매칭(Wave Matching) 단계 및 억양 수정 단계에 의해 소정의 언어로 입력된 문장을 오디오 웨이브 데이터로 변환한다. 상기 TTS 엔진부(210)도 상기 다중언어 처리부(200)와 같이 본 발명의 실시예에서 지원하고자 하는 언어의 종류가 추가됨에 따라 얼마든지 지원하고자 하는 언어에 대한 TTS 엔진을 추가할 수 있다.
상기 오디오 처리부(220)는 상기 TTS 엔진부(210)에서 변환된 오디오 웨이브 데이터를 아날로그 음성 신호로 변환한다. 상기 오디오 처리부(220)는 도 1에 도시된 종래 기술에 의한 TTS 장치에 포함된 오디오 처리부(110)과 동일한 것으로서, 일반적으로 소프트웨어 모듈로서 오디오 드라이버와 하드웨어 블락으로서 오디오 카드를 포함하여 구성된다.
상기 스피커(230)는 상기 오디오 처리부(220)에서 변환된 아날로그 음성 신호를 음성으로 변환하여 출력한다.
도 3에 의하면, 본 발명의 일실시예로서, 한글/영문 혼합문장을 TTS 처리 과정은 하나의 FSM(Finite State Machine)을 이룬다. 상기 FSM은 1, 2, 3, 4 및 5의 다섯 가지 상태를 지닌다. 도 3에서 원 내부에 있는 숫자는 상기 다섯가지 상태 중 하나의 상태를 표시한다.
먼저, 한글/영어 혼합문장이 입력되면, 상태 1이 제어를 갖는다.
상태 1에서는 상기 입력된 혼합문장에서 다음에 처리할 문자를 읽어, 그 문자 코드가 한글 영역에 속하는지 여부를 확인한다. 상기 문자 코드가 한글 영역에 속하는 경우에는 계속 상태 1을 유지하고, 한글 영역에 속하지 않은 경우에는 음성 변환 및 출력을 위해 상태 4로 이동한다. 상태 4에서 출력이 끝난 후, 상기 문자 코드가 영문 영역에 속하는 경우에는 상태 2로 이동한다. 상기 혼합문장의 끝이 확인되면 상태 5로 이동한다.
상태 2에서는 상기 입력된 혼합문장에서 다음에 처리할 문자를 읽어, 그 문자가 영문 영역에 속하는지 여부를 확인한다. 상기 문자 코드가 영문 영역에 속하는 경우에는 계속 상태 2를 유지하고, 영문 영역에 속하지 않는 경우에는 음성 변환 및 출력을 위해 상태 3으로 이동한다. 상태 3에서 출력이 끝난 후, 상기 문자 코드가 한글 영역에 속하는 경우에는 상태 1로 이동한다. 상기 혼합문장의 끝이 확인되면 상태 5로 이동한다.
이 때, 상태 1과 상태 2에서 읽은 문자 코드가 한글 영역에 속하는 지 또는 영문 영역에 속하는 지는 한글 코드가 지니는 2바이트 코드의 특성을 이용하여 판별할 수 있다.
상태 3에서는 상기 영문 TTS 엔진(212)을 불러 현재까지의 영문 문자 리스트를 오디오 웨이브 데이터로 변환하여 상기 오디오 처리부(220) 및 상기 스피커(230)를 통해 영어 음성을 출력한다. 다음, 상태 2로 돌아간다.
상태 4에서는 상기 한글 TTS 엔진(214)을 불러 현재까지의 한글 문자 리스트를 오디오 웨이브 데이터로 변환하여 상기 오디오 처리부(220) 및 상기 스피커(230)를 통해 한글 음성을 출력한다. 다음, 상태 1로 돌아간다.
상태 5에서는 상기 혼합문장에 대한 TTS 처리가 완료되어 작업을 종료한다.
예를들어, "나는boy이다"라는 혼합문장이 입력되는 경우에는 다음과 같이 처리된다.
먼저, 초기 상태, 즉, 상태 1에서 입력되는 문자가 한글인지 영문인지를 확인한다. 상태 1에서 문자 '나'가 입력되면, 입력 문자가 한글이므로 상태 변화는 없다. 다음, 상태 1에서 문자 '는'이 입력되더라도, 입력 문자가 한글이므로 상태 변화는 없다. 상태 1에서 문자 'b'가 입력되면, 상태 4로 이동하여 지금까지 버퍼에 저장된 "나는"이란 문자 리스트를 음성으로 출력하고, 다시 상태 1로 돌아온다. 상태 1에서는 입력된 영문 문자 'b'와 함께 제어를 상태 2로 넘겨준다.
상태 2에서는 상태 1에서 넘겨받은 'b'를 소정의 버퍼에 임시 저장한다. 상태 2에서는 계속하여 'o'와 'y'를 입력받아, 상기 버퍼에 임시 저장한다. 다음, 상태 2에서 문자 '이'가 입력되면, 상태 3으로 이동하여 지금까지 상기 버퍼에 저장된 "boy"이란 문자 리스트를 음성으로 출력하고, 다시 상태 2로 돌아온다. 상태 2에서는 입력된 한글 문자 '이'와 함께 제어를 상태 1로 넘겨준다.
상태 1에서는 상태 2에서 넘겨받은 '이'를 소정의 버퍼에 임시 저장한다. 상태 2에서는 계속하여 '다'를 입력받아, 상기 버퍼에 임시 저장한다. 다음, 상태 2에서 입력 문장의 끝을 만나게 되면, 상태 4로 이동하여 지금까지 상기 버퍼에 저장된 "이다"이란 문자 리스트를 음성으로 출력하고, 다시 상태 1로 돌아온다. 입력 문장에 더 이상 처리할 문자가 없으므로, 제어는 상태 5로 넘어가 작업이 종료된다.
본 발명은 다중 언어를 구성하는 언어 종류의 수가 추가(예를들어, 일본어, 라틴어, 그리스어 등)됨에 따라 상기 FSM이 포함하는 상태의 수는 추가될 수 있다.
또한, 상기 다중 언어로 구성되는 문장은 향후 유니코드(Unicode) 체계가 확립되면 각각의 언어로 쉽게 판별될 수 있다.
본 발명에 의하면, 사전 또는 인터넷 등과 같이 다중언어로 구성된 문장이 사용되는 분야에서도 문장을 음성으로 적절히 변환할 수 있다.
Claims (4)
- 다중언어의 문장을 입력받고, 상기 입력된 문장을 각각의 언어별로 분할하는 다중언어 처리부;상기 다중언어 처리부에서 분할된 문장을 각각 오디오 웨이브 데이터로 변환하는 각종 언어별 TTS 엔진들을 구비한 TTS 엔진부;상기 TTS 엔진부에서 변환된 오디오 웨이브 데이터를 아날로그 음성 신호로 변환하는 오디오 처리부; 및상기 오디오 처리부에서 변환된 아날로그 음성 신호를 음성으로 변환하여 출력하는 스피커를 포함하는 것을 특징으로 하는 다중언어 TTS 장치.
- 제1항에 있어서, 상기 다중언어 처리부는각종 언어별 언어 처리를 위한 복수의 언어처리부들을 구비하고,상기 복수의 언어처리부들은 각각 자신이 처리하는 언어와 다른 언어를 발견할 때까지 상기 다중언어의 문장을 문자 단위로 입력받아 상기 TTS 엔진부에 포함된 해당 TTS 엔진에 전달하고, 상기 발견한 다른 언어를 처리하는 언어처리부로 제어를 넘겨주는 것을 특징으로 하는 다중언어 TTS 장치.
- 다중언어로 구성된 입력 문장을 음성으로 변환하는 방법에 있어서,현재 처리하고 있는 언어와 다른 언어를 발견할 때까지, 상기 입력 문장에 포함된 문자를 하나씩 확인하는 제1 단계;상기 제1 단계에서 확인된 문자들의 리스트를 상기 현재 처리하고 있는 언어에 적합한 오디오 웨이브 데이터로 변환하는 제2 단계;상기 제2 단계에서 변환된 오디오 웨이브 데이터를 음성으로 변환하여 출력하는 제3 단계; 및상기 입력 문장 중에 변환할 문자가 더 남아 있는 경우에는 상기 제1 단계에서 발견한 현재 처리하고 있는 언어와 다른 언어를 현재 처리하고 있는 언어로 변경하여 상기 제1 단계 내지 상기 제3 단계를 반복하는 제4 단계를 포함함을 특징으로 하는 다중언어 TTS 처리 방법.
- 제1언어TTS엔진과 제2언어TTS엔진을 이용하여, 다중언어로 구성된 입력 문장을 음성으로 변환하는 방법에 있어서,입력되는 문장의 첫 문자가 제1언어일 때, 제2언어가 입력될 때까지 상기 입력된 제1언어의 문자들을 소정의 버퍼에 임시 저장하는 제1단계;상기 제1단계의 버퍼에 임시 저장된 제1언어의 문자들을 상기 제1언어TTS엔진을 이용하여 음성으로 변환하는 제2단계;상기 제1언어가 입력될 때까지 상기 입력된 제2언어의 문자들을 소정의 버퍼에 임시 저장하는 제3단계;상기 제3단계의 버퍼에 임시 저장된 제2언어의 문자들을 상기 제2언어TTS엔진을 이용하여 음성으로 변환하는 제4단계를 포함하고,상기 입력 문장에 더 이상 처리할 문자가 없을 때까지 상기 제1단계 내지 상기 제4단계를 반복하는 것을 특징으로 하는 다중언어 TTS 처리 방법.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019970053020A KR100238189B1 (ko) | 1997-10-16 | 1997-10-16 | 다중 언어 tts장치 및 다중 언어 tts 처리 방법 |
US09/173,552 US6141642A (en) | 1997-10-16 | 1998-10-16 | Text-to-speech apparatus and method for processing multiple languages |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019970053020A KR100238189B1 (ko) | 1997-10-16 | 1997-10-16 | 다중 언어 tts장치 및 다중 언어 tts 처리 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR19990032088A KR19990032088A (ko) | 1999-05-06 |
KR100238189B1 true KR100238189B1 (ko) | 2000-01-15 |
Family
ID=19522853
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019970053020A KR100238189B1 (ko) | 1997-10-16 | 1997-10-16 | 다중 언어 tts장치 및 다중 언어 tts 처리 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6141642A (ko) |
KR (1) | KR100238189B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101301536B1 (ko) | 2009-12-11 | 2013-09-04 | 한국전자통신연구원 | 외국어 작문 서비스 방법 및 시스템 |
Families Citing this family (156)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2242065C (en) * | 1997-07-03 | 2004-12-14 | Henry C.A. Hyde-Thomson | Unified messaging system with automatic language identification for text-to-speech conversion |
US20030158734A1 (en) * | 1999-12-16 | 2003-08-21 | Brian Cruickshank | Text to speech conversion using word concatenation |
GB0004097D0 (en) * | 2000-02-22 | 2000-04-12 | Ibm | Management of speech technology modules in an interactive voice response system |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US7454346B1 (en) * | 2000-10-04 | 2008-11-18 | Cisco Technology, Inc. | Apparatus and methods for converting textual information to audio-based output |
US6983250B2 (en) * | 2000-10-25 | 2006-01-03 | Nms Communications Corporation | Method and system for enabling a user to obtain information from a text-based web site in audio form |
US6978239B2 (en) * | 2000-12-04 | 2005-12-20 | Microsoft Corporation | Method and apparatus for speech synthesis without prosody modification |
US6678354B1 (en) * | 2000-12-14 | 2004-01-13 | Unisys Corporation | System and method for determining number of voice processing engines capable of support on a data processing system |
FI20010792A (fi) * | 2001-04-17 | 2002-10-18 | Nokia Corp | Käyttäjäriippumattoman puheentunnistuksen järjestäminen |
GB2376394B (en) * | 2001-06-04 | 2005-10-26 | Hewlett Packard Co | Speech synthesis apparatus and selection method |
US20030014254A1 (en) * | 2001-07-11 | 2003-01-16 | You Zhang | Load-shared distribution of a speech system |
US7483834B2 (en) * | 2001-07-18 | 2009-01-27 | Panasonic Corporation | Method and apparatus for audio navigation of an information appliance |
US20030028379A1 (en) * | 2001-08-03 | 2003-02-06 | Wendt David M. | System for converting electronic content to a transmittable signal and transmitting the resulting signal |
US7043432B2 (en) * | 2001-08-29 | 2006-05-09 | International Business Machines Corporation | Method and system for text-to-speech caching |
KR100466520B1 (ko) * | 2002-01-19 | 2005-01-15 | (주)자람테크놀로지 | 텍스트 데이터의 편집 및 재생 시스템 |
KR20020048357A (ko) * | 2002-05-29 | 2002-06-22 | 양덕준 | 오디오 플레이어에서의 텍스트/음성 변환 및 자동 음성인식 구현 방법 및 장치 |
US7496498B2 (en) * | 2003-03-24 | 2009-02-24 | Microsoft Corporation | Front-end architecture for a multi-lingual text-to-speech system |
US6988068B2 (en) * | 2003-03-25 | 2006-01-17 | International Business Machines Corporation | Compensating for ambient noise levels in text-to-speech applications |
US7487092B2 (en) * | 2003-10-17 | 2009-02-03 | International Business Machines Corporation | Interactive debugging and tuning method for CTTS voice building |
DE60322985D1 (de) | 2003-12-16 | 2008-09-25 | Loquendo Societa Per Azioni | Text-zu-sprache-system und verfahren, computerprogramm dafür |
TWI281145B (en) * | 2004-12-10 | 2007-05-11 | Delta Electronics Inc | System and method for transforming text to speech |
US7599830B2 (en) | 2005-03-16 | 2009-10-06 | Research In Motion Limited | Handheld electronic device with reduced keyboard and associated method of providing quick text entry in a message |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9685190B1 (en) * | 2006-06-15 | 2017-06-20 | Google Inc. | Content sharing |
US20100174544A1 (en) * | 2006-08-28 | 2010-07-08 | Mark Heifets | System, method and end-user device for vocal delivery of textual data |
US8510112B1 (en) * | 2006-08-31 | 2013-08-13 | At&T Intellectual Property Ii, L.P. | Method and system for enhancing a speech database |
US8510113B1 (en) | 2006-08-31 | 2013-08-13 | At&T Intellectual Property Ii, L.P. | Method and system for enhancing a speech database |
US7912718B1 (en) | 2006-08-31 | 2011-03-22 | At&T Intellectual Property Ii, L.P. | Method and system for enhancing a speech database |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8140137B2 (en) * | 2006-09-11 | 2012-03-20 | Qualcomm Incorporated | Compact display unit |
US7702510B2 (en) * | 2007-01-12 | 2010-04-20 | Nuance Communications, Inc. | System and method for dynamically selecting among TTS systems |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
US8380507B2 (en) * | 2009-03-09 | 2013-02-19 | Apple Inc. | Systems and methods for determining the language to use for speech generated by a text to speech engine |
US8473555B2 (en) * | 2009-05-12 | 2013-06-25 | International Business Machines Corporation | Multilingual support for an improved messaging system |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
DE202011111062U1 (de) | 2010-01-25 | 2019-02-19 | Newvaluexchange Ltd. | Vorrichtung und System für eine Digitalkonversationsmanagementplattform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US9798653B1 (en) * | 2010-05-05 | 2017-10-24 | Nuance Communications, Inc. | Methods, apparatus and data structure for cross-language speech adaptation |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
TWI413105B (zh) | 2010-12-30 | 2013-10-21 | Ind Tech Res Inst | 多語言之文字轉語音合成系統與方法 |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8566100B2 (en) * | 2011-06-21 | 2013-10-22 | Verna Ip Holdings, Llc | Automated method and system for obtaining user-selected real-time information on a mobile communication device |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
EP4138075A1 (en) | 2013-02-07 | 2023-02-22 | Apple Inc. | Voice trigger for a digital assistant |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
KR101759009B1 (ko) | 2013-03-15 | 2017-07-17 | 애플 인크. | 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것 |
KR20140121580A (ko) * | 2013-04-08 | 2014-10-16 | 한국전자통신연구원 | 자동 번역 및 통역 장치 및 그 방법 |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
CN110442699A (zh) | 2013-06-09 | 2019-11-12 | 苹果公司 | 操作数字助理的方法、计算机可读介质、电子设备和*** |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
CN105265005B (zh) | 2013-06-13 | 2019-09-17 | 苹果公司 | 用于由语音命令发起的紧急呼叫的***和方法 |
US10791216B2 (en) | 2013-08-06 | 2020-09-29 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
US9640173B2 (en) | 2013-09-10 | 2017-05-02 | At&T Intellectual Property I, L.P. | System and method for intelligent language switching in automated text-to-speech systems |
US9195656B2 (en) | 2013-12-30 | 2015-11-24 | Google Inc. | Multilingual prosody generation |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9966065B2 (en) | 2014-05-30 | 2018-05-08 | Apple Inc. | Multi-command single utterance input method |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9606986B2 (en) | 2014-09-29 | 2017-03-28 | Apple Inc. | Integrated word N-gram and class M-gram language models |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
CN105989833B (zh) * | 2015-02-28 | 2019-11-15 | 讯飞智元信息科技有限公司 | 多语种混语文本字音转换方法及*** |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
US20180018973A1 (en) | 2016-07-15 | 2018-01-18 | Google Inc. | Speaker verification |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10565982B2 (en) | 2017-11-09 | 2020-02-18 | International Business Machines Corporation | Training data optimization in a service computing system for voice enablement of applications |
US10553203B2 (en) | 2017-11-09 | 2020-02-04 | International Business Machines Corporation | Training data optimization for voice enablement of applications |
KR20210081103A (ko) * | 2019-12-23 | 2021-07-01 | 엘지전자 주식회사 | 복수의 언어를 포함하는 음성을 인식하는 인공 지능 장치 및 그 방법 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4631748A (en) * | 1978-04-28 | 1986-12-23 | Texas Instruments Incorporated | Electronic handheld translator having miniature electronic speech synthesis chip |
US5765131A (en) * | 1986-10-03 | 1998-06-09 | British Telecommunications Public Limited Company | Language translation system and method |
JP3070127B2 (ja) * | 1991-05-07 | 2000-07-24 | 株式会社明電舎 | 音声合成装置のアクセント成分制御方式 |
US5477451A (en) * | 1991-07-25 | 1995-12-19 | International Business Machines Corp. | Method and system for natural language translation |
DE69232112T2 (de) * | 1991-11-12 | 2002-03-14 | Fujitsu Ltd | Vorrichtung zur Sprachsynthese |
CA2119397C (en) * | 1993-03-19 | 2007-10-02 | Kim E.A. Silverman | Improved automated voice synthesis employing enhanced prosodic treatment of text, spelling of text and rate of annunciation |
US5548507A (en) * | 1994-03-14 | 1996-08-20 | International Business Machines Corporation | Language identification process using coded language words |
EP0710378A4 (en) * | 1994-04-28 | 1998-04-01 | Motorola Inc | METHOD AND APPARATUS FOR CONVERTING TEXT INTO SOUND SIGNALS USING A NEURONAL NETWORK |
JPH10500500A (ja) * | 1994-05-23 | 1998-01-13 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | 言語エンジン |
US5493606A (en) * | 1994-05-31 | 1996-02-20 | Unisys Corporation | Multi-lingual prompt management system for a network applications platform |
JPH086591A (ja) * | 1994-06-15 | 1996-01-12 | Sony Corp | 音声出力装置 |
GB2291571A (en) * | 1994-07-19 | 1996-01-24 | Ibm | Text to speech system; acoustic processor requests linguistic processor output |
NZ294296A (en) * | 1994-10-25 | 1999-04-29 | British Telecomm | Speech recognition for voice operated telephone services includes comparison against stored lists of expected words |
US5900908A (en) * | 1995-03-02 | 1999-05-04 | National Captioning Insitute, Inc. | System and method for providing described television services |
US5802539A (en) * | 1995-05-05 | 1998-09-01 | Apple Computer, Inc. | Method and apparatus for managing text objects for providing text to be interpreted across computer operating systems using different human languages |
SE514684C2 (sv) * | 1995-06-16 | 2001-04-02 | Telia Ab | Metod vid tal-till-textomvandling |
US5878386A (en) * | 1996-06-28 | 1999-03-02 | Microsoft Corporation | Natural language parser with dictionary-based part-of-speech probabilities |
US6002998A (en) * | 1996-09-30 | 1999-12-14 | International Business Machines Corporation | Fast, efficient hardware mechanism for natural language determination |
US5937422A (en) * | 1997-04-15 | 1999-08-10 | The United States Of America As Represented By The National Security Agency | Automatically generating a topic description for text and searching and sorting text by topic using the same |
-
1997
- 1997-10-16 KR KR1019970053020A patent/KR100238189B1/ko not_active IP Right Cessation
-
1998
- 1998-10-16 US US09/173,552 patent/US6141642A/en not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101301536B1 (ko) | 2009-12-11 | 2013-09-04 | 한국전자통신연구원 | 외국어 작문 서비스 방법 및 시스템 |
US8635060B2 (en) | 2009-12-11 | 2014-01-21 | Electronics And Telecommunications Research Institute | Foreign language writing service method and system |
Also Published As
Publication number | Publication date |
---|---|
US6141642A (en) | 2000-10-31 |
KR19990032088A (ko) | 1999-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100238189B1 (ko) | 다중 언어 tts장치 및 다중 언어 tts 처리 방법 | |
JPH0689302A (ja) | 辞書メモリ | |
JPH02165378A (ja) | 機械翻訳システム | |
KR900006671B1 (ko) | 언어생성장치 | |
EP0403057B1 (en) | Method of translating sentence including adverb phrase by using translating apparatus | |
US5065318A (en) | Method of translating a sentence including a compound word formed by hyphenation using a translating apparatus | |
JPH05266069A (ja) | 中国語と日本語との間の双方向機械翻訳方式 | |
KR101982490B1 (ko) | 문자 데이터 변환에 기초한 키워드 검색 방법 및 그 장치 | |
KR940022311A (ko) | 기계번역장치 및 방법 | |
KR100204068B1 (ko) | 개념기반 다국어 번역시스템의 문법 자동수정 방법 | |
KR970066941A (ko) | 토큰 분리기를 이용한 다국어 번역 시스템 | |
KR19990015131A (ko) | 영한 자동번역 시스템의 숙어 번역 방법 | |
CN113345408B (zh) | 中英文语音混合合成方法、装置、电子设备和存储介质 | |
Heintz et al. | Turcic Morphology as Regular Language | |
KR19990079824A (ko) | 하이픈으로 연결된 복합어 처리에 적합한 형태소 해석장치와 방법 및 그 장치를 구비한 언어 번역장치 | |
KR20210055533A (ko) | 신경망 기반 자동 통역 장치 | |
JPH07234872A (ja) | 言語データベースの形態素列変換装置 | |
JP3378059B2 (ja) | 文生成装置 | |
JPH09281993A (ja) | 発音記号生成装置 | |
JPH09185623A (ja) | 言語処理装置及び方法 | |
JPH04313158A (ja) | 機械翻訳装置 | |
JPS63175971A (ja) | 自然言語処理方式 | |
KR980011719A (ko) | 문장 텍스트 데이터 베이스 발생방법 | |
JPS62210578A (ja) | 中国語から日本語への翻訳方式 | |
JPH08202720A (ja) | 機械翻訳装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20080604 Year of fee payment: 10 |
|
LAPS | Lapse due to unpaid annual fee |