KR100238189B1 - 다중 언어 tts장치 및 다중 언어 tts 처리 방법 - Google Patents

다중 언어 tts장치 및 다중 언어 tts 처리 방법 Download PDF

Info

Publication number
KR100238189B1
KR100238189B1 KR1019970053020A KR19970053020A KR100238189B1 KR 100238189 B1 KR100238189 B1 KR 100238189B1 KR 1019970053020 A KR1019970053020 A KR 1019970053020A KR 19970053020 A KR19970053020 A KR 19970053020A KR 100238189 B1 KR100238189 B1 KR 100238189B1
Authority
KR
South Korea
Prior art keywords
language
tts
sentence
converting
input
Prior art date
Application number
KR1019970053020A
Other languages
English (en)
Other versions
KR19990032088A (ko
Inventor
오창환
Original Assignee
윤종용
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 윤종용, 삼성전자주식회사 filed Critical 윤종용
Priority to KR1019970053020A priority Critical patent/KR100238189B1/ko
Priority to US09/173,552 priority patent/US6141642A/en
Publication of KR19990032088A publication Critical patent/KR19990032088A/ko
Application granted granted Critical
Publication of KR100238189B1 publication Critical patent/KR100238189B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 여러나라의 언어로 구성된 문장를 처리할 수 있는 다중언어 TTS 장치 및 다중언어 TTS 처리 방법에 관한 것으로서, 상기 다중언어 TTS 장치는 다중언어의 문장을 입력받고, 상기 입력된 문장을 각각의 언어별로 분할하는 다중언어 처리부; 상기 다중언어 처리부에서 분할된 문장을 각각 오디오 웨이브 데이터로 변환하는 각종 언어별 TTS 엔진들을 구비한 TTS 엔진부; 상기 TTS 엔진부에서 변환된 오디오 웨이브 데이터를 아날로그 음성 신호로 변환하는 오디오 처리부; 및 상기 오디오 처리부에서 변환된 아날로그 음성 신호를 음성으로 변환하여 출력하는 스피커를 포함하는 것을 특징으로 한다.
본 발명에 의하면, 사전 또는 인터넷 등과 같이 다중언어로 구성된 문장이 사용되는 분야에서도 문장을 음성으로 적절히 변환할 수 있다.

Description

다중 언어 TTS 장치 및 다중언어 TTS 처리 방법
본 발명은 TTS(Text to Speach) 장치에 관한 것으로서, 특히 여러나라의 언어로 구성된 문장를 처리할 수 있는 다중언어 TTS 장치 및 다중언어 TTS 처리 방법에 관한 것이다.
도 1은 종래의 방식에 의해 TTS 처리를 하는 장치의 구성도이다. 소정의 언어로 입력된 문장은 TTS 엔진(100)에 의해 오디오 웨이브 데이터(Audio Wave Data)로 변환되고, 상기 TTS 엔진(100)에 의해 변환된 오디오 웨이브 데이터는 오디오 처리부(110)에 의해 아날로그 음성 신호로 변환되고, 상기 오디오 처리부(110)에 의해 변환된 아날로그 음성 신호는 스피커(120)를 통해 음성으로 내보내진다.
그런데, 종래의 기술에 의한 TTS 장치는 한 가지 종류의 언어(즉, 한국어 또는 영어 또는 일본어 등)로만 이루어진 문장에 대해서는 적절한 음성을 생성할 수 있으나, 여러 종류의 언어가 혼합되어 있는 문장, 즉 다중언어의 문장에 대해서는 적절한 음성을 생성하지 못하는 단점을 지닌다.
본 발명은 상기의 문제점을 해결하기 위하여 창작된 것으로서, 사전 또는 인터넷 등에서 사용되는 다중언어 문장에 대해서도 적절한 음성을 생성할 수 있는 다중언어 TTS 장치 및 다중언어 TTS 처리 방법를 제공함을 그 목적으로 한다.
도 1은 종래의 방식에 의해 TTS 처리를 하는 장치의 구성도이다.
도 2는 본 발명의 일실시예로서, 한글/영어 혼합문장을 TTS 처리하는 장치의 구성도이다.
도 3은 상기 도 2에 도시된 다중언어 처리부의 동작 상태를 설명하기 위한 상태도이다.
상기의 목적을 달성하기 위하여, 본 발명에 의한 다중언어 TTS 장치는 다중언어의 문장을 입력받고, 상기 입력된 문장을 각각의 언어별로 분할하는 다중언어 처리부; 상기 다중언어 처리부에서 분할된 문장을 각각 오디오 웨이브 데이터로 변환하는 각종 언어별 TTS 엔진들을 구비한 TTS 엔진부; 상기 TTS 엔진부에서 변환된 오디오 웨이브 데이터를 아날로그 음성 신호로 변환하는 오디오 처리부; 및 상기 오디오 처리부에서 변환된 아날로그 음성 신호를 음성으로 변환하여 출력하는 스피커를 포함하는 것을 특징으로 한다.
상기의 다른 목적을 달성하기 위하여, 본 발명에 의한 다중언어로 구성된 입력 문장을 음성으로 변환하는 방법은 현재 처리하고 있는 언어와 다른 언어를 발견할 때까지, 상기 입력 문장에 포함된 문자를 하나씩 확인하는 제1 단계; 상기 제1 단계에서 확인된 문자들의 리스트를 상기 현재 처리하고 있는 언어에 적합한 오디오 웨이브 데이터로 변환하는 제2 단계; 상기 제2 단계에서 변환된 오디오 웨이브 데이터를 음성으로 변환하여 출력하는 제3 단계; 및 상기 입력 문장 중에 변환할 문자가 더 남아 있는 경우에는 상기 제1 단계에서 발견한 현재 처리하고 있는 언어와 다른 언어를 현재 처리하고 있는 언어로 변경하여 상기 제1 단계 내지 상기 제3 단계를 반복하는 제4 단계를 포함함을 특징으로 한다.
이하에서 첨부된 도면을 참조하여 본 발명을 상세히 설명한다.
도 2에 의하면, 본 발명의 일실시예로서, 한글/영어 혼합문장을 TTS 처리하는 장치는 다중언어 처리부(200), TTS 엔진부(210), 오디오 처리부(220) 및 스피커(230)를 포함하여 구성된다.
상기 다중언어 처리부(200)는 상기 한글/영어 혼합문장을 입력받고, 상기 입력된 혼합문장을 한글 또는 영어로 분할한다.
도 3에 의하면, 본 발명의 일실시예로서, 한글/영어 혼합문장을 TTS 처리하는 장치에 포함된 다중언어 처리부(200)는 2개의 언어처리부들, 즉 한글처리부(300) 및 영어처리부(310)를 구비한다.
상기 언어처리부들(300, 310)은 각각 자신이 처리하는 언어와 다른 언어를 발견할 때까지 상기 한글/영어 혼합문장을 문자 단위로 입력받아 상기 TTS 엔진부(210)에 포함된 해당 TTS 엔진에 전달하고, 상기 발견한 다른 언어를 처리하는 언어처리부로 제어를 넘겨준다. 상기 다중언어 처리부(200)는 본 발명의 실시예에서 지원하고자 하는 언어의 종류가 추가됨에 따라 얼마든지 지원하고자 하는 언어에 대한 언어처리부를 추가할 수 있다.
상기 TTS 엔진부(210)는 상기 다중언어 처리부(200)에서 분할된 한글 문자 리스트와 영어 문자 리스트를 각각 오디오 웨이브 데이터로 변환하는 한글 TTS 엔진(214)과 영문 TTS 엔진(212)을 구비한다. 상기 TTS 엔진들(212, 214)은 각각 어휘 분석(Lexical Analysis) 단계, 어근 분석 단계, 파싱(Parsing) 단계, 웨이브 매칭(Wave Matching) 단계 및 억양 수정 단계에 의해 소정의 언어로 입력된 문장을 오디오 웨이브 데이터로 변환한다. 상기 TTS 엔진부(210)도 상기 다중언어 처리부(200)와 같이 본 발명의 실시예에서 지원하고자 하는 언어의 종류가 추가됨에 따라 얼마든지 지원하고자 하는 언어에 대한 TTS 엔진을 추가할 수 있다.
상기 오디오 처리부(220)는 상기 TTS 엔진부(210)에서 변환된 오디오 웨이브 데이터를 아날로그 음성 신호로 변환한다. 상기 오디오 처리부(220)는 도 1에 도시된 종래 기술에 의한 TTS 장치에 포함된 오디오 처리부(110)과 동일한 것으로서, 일반적으로 소프트웨어 모듈로서 오디오 드라이버와 하드웨어 블락으로서 오디오 카드를 포함하여 구성된다.
상기 스피커(230)는 상기 오디오 처리부(220)에서 변환된 아날로그 음성 신호를 음성으로 변환하여 출력한다.
도 3에 의하면, 본 발명의 일실시예로서, 한글/영문 혼합문장을 TTS 처리 과정은 하나의 FSM(Finite State Machine)을 이룬다. 상기 FSM은 1, 2, 3, 4 및 5의 다섯 가지 상태를 지닌다. 도 3에서 원 내부에 있는 숫자는 상기 다섯가지 상태 중 하나의 상태를 표시한다.
먼저, 한글/영어 혼합문장이 입력되면, 상태 1이 제어를 갖는다.
상태 1에서는 상기 입력된 혼합문장에서 다음에 처리할 문자를 읽어, 그 문자 코드가 한글 영역에 속하는지 여부를 확인한다. 상기 문자 코드가 한글 영역에 속하는 경우에는 계속 상태 1을 유지하고, 한글 영역에 속하지 않은 경우에는 음성 변환 및 출력을 위해 상태 4로 이동한다. 상태 4에서 출력이 끝난 후, 상기 문자 코드가 영문 영역에 속하는 경우에는 상태 2로 이동한다. 상기 혼합문장의 끝이 확인되면 상태 5로 이동한다.
상태 2에서는 상기 입력된 혼합문장에서 다음에 처리할 문자를 읽어, 그 문자가 영문 영역에 속하는지 여부를 확인한다. 상기 문자 코드가 영문 영역에 속하는 경우에는 계속 상태 2를 유지하고, 영문 영역에 속하지 않는 경우에는 음성 변환 및 출력을 위해 상태 3으로 이동한다. 상태 3에서 출력이 끝난 후, 상기 문자 코드가 한글 영역에 속하는 경우에는 상태 1로 이동한다. 상기 혼합문장의 끝이 확인되면 상태 5로 이동한다.
이 때, 상태 1과 상태 2에서 읽은 문자 코드가 한글 영역에 속하는 지 또는 영문 영역에 속하는 지는 한글 코드가 지니는 2바이트 코드의 특성을 이용하여 판별할 수 있다.
상태 3에서는 상기 영문 TTS 엔진(212)을 불러 현재까지의 영문 문자 리스트를 오디오 웨이브 데이터로 변환하여 상기 오디오 처리부(220) 및 상기 스피커(230)를 통해 영어 음성을 출력한다. 다음, 상태 2로 돌아간다.
상태 4에서는 상기 한글 TTS 엔진(214)을 불러 현재까지의 한글 문자 리스트를 오디오 웨이브 데이터로 변환하여 상기 오디오 처리부(220) 및 상기 스피커(230)를 통해 한글 음성을 출력한다. 다음, 상태 1로 돌아간다.
상태 5에서는 상기 혼합문장에 대한 TTS 처리가 완료되어 작업을 종료한다.
예를들어, "나는boy이다"라는 혼합문장이 입력되는 경우에는 다음과 같이 처리된다.
먼저, 초기 상태, 즉, 상태 1에서 입력되는 문자가 한글인지 영문인지를 확인한다. 상태 1에서 문자 '나'가 입력되면, 입력 문자가 한글이므로 상태 변화는 없다. 다음, 상태 1에서 문자 '는'이 입력되더라도, 입력 문자가 한글이므로 상태 변화는 없다. 상태 1에서 문자 'b'가 입력되면, 상태 4로 이동하여 지금까지 버퍼에 저장된 "나는"이란 문자 리스트를 음성으로 출력하고, 다시 상태 1로 돌아온다. 상태 1에서는 입력된 영문 문자 'b'와 함께 제어를 상태 2로 넘겨준다.
상태 2에서는 상태 1에서 넘겨받은 'b'를 소정의 버퍼에 임시 저장한다. 상태 2에서는 계속하여 'o'와 'y'를 입력받아, 상기 버퍼에 임시 저장한다. 다음, 상태 2에서 문자 '이'가 입력되면, 상태 3으로 이동하여 지금까지 상기 버퍼에 저장된 "boy"이란 문자 리스트를 음성으로 출력하고, 다시 상태 2로 돌아온다. 상태 2에서는 입력된 한글 문자 '이'와 함께 제어를 상태 1로 넘겨준다.
상태 1에서는 상태 2에서 넘겨받은 '이'를 소정의 버퍼에 임시 저장한다. 상태 2에서는 계속하여 '다'를 입력받아, 상기 버퍼에 임시 저장한다. 다음, 상태 2에서 입력 문장의 끝을 만나게 되면, 상태 4로 이동하여 지금까지 상기 버퍼에 저장된 "이다"이란 문자 리스트를 음성으로 출력하고, 다시 상태 1로 돌아온다. 입력 문장에 더 이상 처리할 문자가 없으므로, 제어는 상태 5로 넘어가 작업이 종료된다.
본 발명은 다중 언어를 구성하는 언어 종류의 수가 추가(예를들어, 일본어, 라틴어, 그리스어 등)됨에 따라 상기 FSM이 포함하는 상태의 수는 추가될 수 있다.
또한, 상기 다중 언어로 구성되는 문장은 향후 유니코드(Unicode) 체계가 확립되면 각각의 언어로 쉽게 판별될 수 있다.
본 발명에 의하면, 사전 또는 인터넷 등과 같이 다중언어로 구성된 문장이 사용되는 분야에서도 문장을 음성으로 적절히 변환할 수 있다.

Claims (4)

  1. 다중언어의 문장을 입력받고, 상기 입력된 문장을 각각의 언어별로 분할하는 다중언어 처리부;
    상기 다중언어 처리부에서 분할된 문장을 각각 오디오 웨이브 데이터로 변환하는 각종 언어별 TTS 엔진들을 구비한 TTS 엔진부;
    상기 TTS 엔진부에서 변환된 오디오 웨이브 데이터를 아날로그 음성 신호로 변환하는 오디오 처리부; 및
    상기 오디오 처리부에서 변환된 아날로그 음성 신호를 음성으로 변환하여 출력하는 스피커를 포함하는 것을 특징으로 하는 다중언어 TTS 장치.
  2. 제1항에 있어서, 상기 다중언어 처리부는
    각종 언어별 언어 처리를 위한 복수의 언어처리부들을 구비하고,
    상기 복수의 언어처리부들은 각각 자신이 처리하는 언어와 다른 언어를 발견할 때까지 상기 다중언어의 문장을 문자 단위로 입력받아 상기 TTS 엔진부에 포함된 해당 TTS 엔진에 전달하고, 상기 발견한 다른 언어를 처리하는 언어처리부로 제어를 넘겨주는 것을 특징으로 하는 다중언어 TTS 장치.
  3. 다중언어로 구성된 입력 문장을 음성으로 변환하는 방법에 있어서,
    현재 처리하고 있는 언어와 다른 언어를 발견할 때까지, 상기 입력 문장에 포함된 문자를 하나씩 확인하는 제1 단계;
    상기 제1 단계에서 확인된 문자들의 리스트를 상기 현재 처리하고 있는 언어에 적합한 오디오 웨이브 데이터로 변환하는 제2 단계;
    상기 제2 단계에서 변환된 오디오 웨이브 데이터를 음성으로 변환하여 출력하는 제3 단계; 및
    상기 입력 문장 중에 변환할 문자가 더 남아 있는 경우에는 상기 제1 단계에서 발견한 현재 처리하고 있는 언어와 다른 언어를 현재 처리하고 있는 언어로 변경하여 상기 제1 단계 내지 상기 제3 단계를 반복하는 제4 단계를 포함함을 특징으로 하는 다중언어 TTS 처리 방법.
  4. 제1언어TTS엔진과 제2언어TTS엔진을 이용하여, 다중언어로 구성된 입력 문장을 음성으로 변환하는 방법에 있어서,
    입력되는 문장의 첫 문자가 제1언어일 때, 제2언어가 입력될 때까지 상기 입력된 제1언어의 문자들을 소정의 버퍼에 임시 저장하는 제1단계;
    상기 제1단계의 버퍼에 임시 저장된 제1언어의 문자들을 상기 제1언어TTS엔진을 이용하여 음성으로 변환하는 제2단계;
    상기 제1언어가 입력될 때까지 상기 입력된 제2언어의 문자들을 소정의 버퍼에 임시 저장하는 제3단계;
    상기 제3단계의 버퍼에 임시 저장된 제2언어의 문자들을 상기 제2언어TTS엔진을 이용하여 음성으로 변환하는 제4단계를 포함하고,
    상기 입력 문장에 더 이상 처리할 문자가 없을 때까지 상기 제1단계 내지 상기 제4단계를 반복하는 것을 특징으로 하는 다중언어 TTS 처리 방법.
KR1019970053020A 1997-10-16 1997-10-16 다중 언어 tts장치 및 다중 언어 tts 처리 방법 KR100238189B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1019970053020A KR100238189B1 (ko) 1997-10-16 1997-10-16 다중 언어 tts장치 및 다중 언어 tts 처리 방법
US09/173,552 US6141642A (en) 1997-10-16 1998-10-16 Text-to-speech apparatus and method for processing multiple languages

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019970053020A KR100238189B1 (ko) 1997-10-16 1997-10-16 다중 언어 tts장치 및 다중 언어 tts 처리 방법

Publications (2)

Publication Number Publication Date
KR19990032088A KR19990032088A (ko) 1999-05-06
KR100238189B1 true KR100238189B1 (ko) 2000-01-15

Family

ID=19522853

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970053020A KR100238189B1 (ko) 1997-10-16 1997-10-16 다중 언어 tts장치 및 다중 언어 tts 처리 방법

Country Status (2)

Country Link
US (1) US6141642A (ko)
KR (1) KR100238189B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101301536B1 (ko) 2009-12-11 2013-09-04 한국전자통신연구원 외국어 작문 서비스 방법 및 시스템

Families Citing this family (156)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2242065C (en) * 1997-07-03 2004-12-14 Henry C.A. Hyde-Thomson Unified messaging system with automatic language identification for text-to-speech conversion
US20030158734A1 (en) * 1999-12-16 2003-08-21 Brian Cruickshank Text to speech conversion using word concatenation
GB0004097D0 (en) * 2000-02-22 2000-04-12 Ibm Management of speech technology modules in an interactive voice response system
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US7454346B1 (en) * 2000-10-04 2008-11-18 Cisco Technology, Inc. Apparatus and methods for converting textual information to audio-based output
US6983250B2 (en) * 2000-10-25 2006-01-03 Nms Communications Corporation Method and system for enabling a user to obtain information from a text-based web site in audio form
US6978239B2 (en) * 2000-12-04 2005-12-20 Microsoft Corporation Method and apparatus for speech synthesis without prosody modification
US6678354B1 (en) * 2000-12-14 2004-01-13 Unisys Corporation System and method for determining number of voice processing engines capable of support on a data processing system
FI20010792A (fi) * 2001-04-17 2002-10-18 Nokia Corp Käyttäjäriippumattoman puheentunnistuksen järjestäminen
GB2376394B (en) * 2001-06-04 2005-10-26 Hewlett Packard Co Speech synthesis apparatus and selection method
US20030014254A1 (en) * 2001-07-11 2003-01-16 You Zhang Load-shared distribution of a speech system
US7483834B2 (en) * 2001-07-18 2009-01-27 Panasonic Corporation Method and apparatus for audio navigation of an information appliance
US20030028379A1 (en) * 2001-08-03 2003-02-06 Wendt David M. System for converting electronic content to a transmittable signal and transmitting the resulting signal
US7043432B2 (en) * 2001-08-29 2006-05-09 International Business Machines Corporation Method and system for text-to-speech caching
KR100466520B1 (ko) * 2002-01-19 2005-01-15 (주)자람테크놀로지 텍스트 데이터의 편집 및 재생 시스템
KR20020048357A (ko) * 2002-05-29 2002-06-22 양덕준 오디오 플레이어에서의 텍스트/음성 변환 및 자동 음성인식 구현 방법 및 장치
US7496498B2 (en) * 2003-03-24 2009-02-24 Microsoft Corporation Front-end architecture for a multi-lingual text-to-speech system
US6988068B2 (en) * 2003-03-25 2006-01-17 International Business Machines Corporation Compensating for ambient noise levels in text-to-speech applications
US7487092B2 (en) * 2003-10-17 2009-02-03 International Business Machines Corporation Interactive debugging and tuning method for CTTS voice building
DE60322985D1 (de) 2003-12-16 2008-09-25 Loquendo Societa Per Azioni Text-zu-sprache-system und verfahren, computerprogramm dafür
TWI281145B (en) * 2004-12-10 2007-05-11 Delta Electronics Inc System and method for transforming text to speech
US7599830B2 (en) 2005-03-16 2009-10-06 Research In Motion Limited Handheld electronic device with reduced keyboard and associated method of providing quick text entry in a message
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9685190B1 (en) * 2006-06-15 2017-06-20 Google Inc. Content sharing
US20100174544A1 (en) * 2006-08-28 2010-07-08 Mark Heifets System, method and end-user device for vocal delivery of textual data
US8510112B1 (en) * 2006-08-31 2013-08-13 At&T Intellectual Property Ii, L.P. Method and system for enhancing a speech database
US8510113B1 (en) 2006-08-31 2013-08-13 At&T Intellectual Property Ii, L.P. Method and system for enhancing a speech database
US7912718B1 (en) 2006-08-31 2011-03-22 At&T Intellectual Property Ii, L.P. Method and system for enhancing a speech database
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8140137B2 (en) * 2006-09-11 2012-03-20 Qualcomm Incorporated Compact display unit
US7702510B2 (en) * 2007-01-12 2010-04-20 Nuance Communications, Inc. System and method for dynamically selecting among TTS systems
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US8380507B2 (en) * 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
US8473555B2 (en) * 2009-05-12 2013-06-25 International Business Machines Corporation Multilingual support for an improved messaging system
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10255566B2 (en) 2011-06-03 2019-04-09 Apple Inc. Generating and processing task items that represent tasks to perform
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
DE202011111062U1 (de) 2010-01-25 2019-02-19 Newvaluexchange Ltd. Vorrichtung und System für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9798653B1 (en) * 2010-05-05 2017-10-24 Nuance Communications, Inc. Methods, apparatus and data structure for cross-language speech adaptation
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
TWI413105B (zh) 2010-12-30 2013-10-21 Ind Tech Res Inst 多語言之文字轉語音合成系統與方法
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8566100B2 (en) * 2011-06-21 2013-10-22 Verna Ip Holdings, Llc Automated method and system for obtaining user-selected real-time information on a mobile communication device
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
EP4138075A1 (en) 2013-02-07 2023-02-22 Apple Inc. Voice trigger for a digital assistant
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
KR101759009B1 (ko) 2013-03-15 2017-07-17 애플 인크. 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것
KR20140121580A (ko) * 2013-04-08 2014-10-16 한국전자통신연구원 자동 번역 및 통역 장치 및 그 방법
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
CN110442699A (zh) 2013-06-09 2019-11-12 苹果公司 操作数字助理的方法、计算机可读介质、电子设备和***
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN105265005B (zh) 2013-06-13 2019-09-17 苹果公司 用于由语音命令发起的紧急呼叫的***和方法
US10791216B2 (en) 2013-08-06 2020-09-29 Apple Inc. Auto-activating smart responses based on activities from remote devices
US9640173B2 (en) 2013-09-10 2017-05-02 At&T Intellectual Property I, L.P. System and method for intelligent language switching in automated text-to-speech systems
US9195656B2 (en) 2013-12-30 2015-11-24 Google Inc. Multilingual prosody generation
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9606986B2 (en) 2014-09-29 2017-03-28 Apple Inc. Integrated word N-gram and class M-gram language models
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
CN105989833B (zh) * 2015-02-28 2019-11-15 讯飞智元信息科技有限公司 多语种混语文本字音转换方法及***
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US20180018973A1 (en) 2016-07-15 2018-01-18 Google Inc. Speaker verification
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10565982B2 (en) 2017-11-09 2020-02-18 International Business Machines Corporation Training data optimization in a service computing system for voice enablement of applications
US10553203B2 (en) 2017-11-09 2020-02-04 International Business Machines Corporation Training data optimization for voice enablement of applications
KR20210081103A (ko) * 2019-12-23 2021-07-01 엘지전자 주식회사 복수의 언어를 포함하는 음성을 인식하는 인공 지능 장치 및 그 방법

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4631748A (en) * 1978-04-28 1986-12-23 Texas Instruments Incorporated Electronic handheld translator having miniature electronic speech synthesis chip
US5765131A (en) * 1986-10-03 1998-06-09 British Telecommunications Public Limited Company Language translation system and method
JP3070127B2 (ja) * 1991-05-07 2000-07-24 株式会社明電舎 音声合成装置のアクセント成分制御方式
US5477451A (en) * 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
DE69232112T2 (de) * 1991-11-12 2002-03-14 Fujitsu Ltd Vorrichtung zur Sprachsynthese
CA2119397C (en) * 1993-03-19 2007-10-02 Kim E.A. Silverman Improved automated voice synthesis employing enhanced prosodic treatment of text, spelling of text and rate of annunciation
US5548507A (en) * 1994-03-14 1996-08-20 International Business Machines Corporation Language identification process using coded language words
EP0710378A4 (en) * 1994-04-28 1998-04-01 Motorola Inc METHOD AND APPARATUS FOR CONVERTING TEXT INTO SOUND SIGNALS USING A NEURONAL NETWORK
JPH10500500A (ja) * 1994-05-23 1998-01-13 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 言語エンジン
US5493606A (en) * 1994-05-31 1996-02-20 Unisys Corporation Multi-lingual prompt management system for a network applications platform
JPH086591A (ja) * 1994-06-15 1996-01-12 Sony Corp 音声出力装置
GB2291571A (en) * 1994-07-19 1996-01-24 Ibm Text to speech system; acoustic processor requests linguistic processor output
NZ294296A (en) * 1994-10-25 1999-04-29 British Telecomm Speech recognition for voice operated telephone services includes comparison against stored lists of expected words
US5900908A (en) * 1995-03-02 1999-05-04 National Captioning Insitute, Inc. System and method for providing described television services
US5802539A (en) * 1995-05-05 1998-09-01 Apple Computer, Inc. Method and apparatus for managing text objects for providing text to be interpreted across computer operating systems using different human languages
SE514684C2 (sv) * 1995-06-16 2001-04-02 Telia Ab Metod vid tal-till-textomvandling
US5878386A (en) * 1996-06-28 1999-03-02 Microsoft Corporation Natural language parser with dictionary-based part-of-speech probabilities
US6002998A (en) * 1996-09-30 1999-12-14 International Business Machines Corporation Fast, efficient hardware mechanism for natural language determination
US5937422A (en) * 1997-04-15 1999-08-10 The United States Of America As Represented By The National Security Agency Automatically generating a topic description for text and searching and sorting text by topic using the same

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101301536B1 (ko) 2009-12-11 2013-09-04 한국전자통신연구원 외국어 작문 서비스 방법 및 시스템
US8635060B2 (en) 2009-12-11 2014-01-21 Electronics And Telecommunications Research Institute Foreign language writing service method and system

Also Published As

Publication number Publication date
US6141642A (en) 2000-10-31
KR19990032088A (ko) 1999-05-06

Similar Documents

Publication Publication Date Title
KR100238189B1 (ko) 다중 언어 tts장치 및 다중 언어 tts 처리 방법
JPH0689302A (ja) 辞書メモリ
JPH02165378A (ja) 機械翻訳システム
KR900006671B1 (ko) 언어생성장치
EP0403057B1 (en) Method of translating sentence including adverb phrase by using translating apparatus
US5065318A (en) Method of translating a sentence including a compound word formed by hyphenation using a translating apparatus
JPH05266069A (ja) 中国語と日本語との間の双方向機械翻訳方式
KR101982490B1 (ko) 문자 데이터 변환에 기초한 키워드 검색 방법 및 그 장치
KR940022311A (ko) 기계번역장치 및 방법
KR100204068B1 (ko) 개념기반 다국어 번역시스템의 문법 자동수정 방법
KR970066941A (ko) 토큰 분리기를 이용한 다국어 번역 시스템
KR19990015131A (ko) 영한 자동번역 시스템의 숙어 번역 방법
CN113345408B (zh) 中英文语音混合合成方法、装置、电子设备和存储介质
Heintz et al. Turcic Morphology as Regular Language
KR19990079824A (ko) 하이픈으로 연결된 복합어 처리에 적합한 형태소 해석장치와 방법 및 그 장치를 구비한 언어 번역장치
KR20210055533A (ko) 신경망 기반 자동 통역 장치
JPH07234872A (ja) 言語データベースの形態素列変換装置
JP3378059B2 (ja) 文生成装置
JPH09281993A (ja) 発音記号生成装置
JPH09185623A (ja) 言語処理装置及び方法
JPH04313158A (ja) 機械翻訳装置
JPS63175971A (ja) 自然言語処理方式
KR980011719A (ko) 문장 텍스트 데이터 베이스 발생방법
JPS62210578A (ja) 中国語から日本語への翻訳方式
JPH08202720A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080604

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee