CN1742273A - 多模态语音-语音语言翻译和显示 - Google Patents
多模态语音-语音语言翻译和显示 Download PDFInfo
- Publication number
- CN1742273A CN1742273A CNA038259265A CN03825926A CN1742273A CN 1742273 A CN1742273 A CN 1742273A CN A038259265 A CNA038259265 A CN A038259265A CN 03825926 A CN03825926 A CN 03825926A CN 1742273 A CN1742273 A CN 1742273A
- Authority
- CN
- China
- Prior art keywords
- language
- statement
- text
- natural
- symbol
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
提供一种把源语言的自然语句翻译成符号表现和/或目标语言的多模态语音-语音语言翻译***和方法。***(100)包括把源语言的自然语句(402)输入***(100)的输入装置(102);接收呈机器可读形式的自然语句(402),并把自然语句(402)翻译成符号表现(404)和/或目标语言(406)的翻译器(104);和显示自然语句的符号表现(404)的图像显示器(106)。另上,图像显示器(106)指示目标语言(406)的文本,符号表现(404)和源语言(402)的文本之间的相关性(408)。
Description
美国政府对此发明具有已付费的许可,和在有限的情况下根据如与海军空间和海军作战***中心签定的合同No.N66001-99-2-8916的条款的合理的条款要求专利所有人许可其它人的权利。
技术领域
本发明涉及语言翻译***,更具体地说,涉及一种多模态语音-语音语言翻译***和方法,其中源语言被输入***中,被翻译成目标语言,并由各种模态(modality),例如显示器、语音合成器等输出。
背景技术
可见图像用于人类交流非常古老和基本。从洞穴壁画到今天的儿童图画,图画、符号和图象表示在人类表达中一直起着重要的作用。图像和空间形体不仅被用于表现场景和物理对象,而且还被用于表现过程和更抽象的概念。随着时间的过去,象形文字体系,即可视语言已进化成更多地依赖于约定俗成,而不是依赖于它们的表现力的相似性的字母表和符号体系。
可视语言在有限的领域中被广泛使用。例如,在世界的多数地方,交通符号和公共场所中的国际性设施图标,例如电话,公共厕所,饭店,紧急出口等得到广泛接受和理解。
在过去的二三十年内,人们一直对用于人/机交互作用的可视语言,例如图形界面,图形编程语言等兴趣强烈。例如,微软的WindowsTM界面使用带有文件夹,文件柜,垃圾桶,绘图工具和已成为个人计算机的标准的其它惯用对象的桌面隐喻,因为它们使计算机更易于使用和更易于学习。但是,随着由于旅行的便利,通信媒体,例如因特网的速度的提高,和市场的全球化的结果,全球社会变得越来越小,可视语言将在语言不同的人们之间的交流中起日益重要的作用。另外,可视语言能够方便根本不能说话的人(例如聋人),或者文盲间的交流。
由于可视语言的下述特征:(1)国际性-可视语言不依赖于特定的口头语言或书面语言;(2)由可视表示法的使用而产生的易学性;(3)便于绘图能力受损者使用的计算机辅助创作和显示;(4)自适应性(例如对于视力受损者的更大显示,对于色盲者的重新着色,对于初学者的消息的更明确表达),和(5)高级的可视化技术,例如动画的应用(参见Tanimoto,StevenL.,“Representation and Learnability in Visual Languages for Web-basedInterpersonal Communication”,IEEE Proceedings of VL 1997,1997年9月23-26),可视语言用于人类间的交流的潜力巨大。
发明内容
提供一种把源语言的自然语句翻译成符号表现和/或目标语言的多模态语音-语音语言翻译***和方法。本发明使用自然语言理解技术对口语句子中的概念和语义分类,把句子翻译成目标语言,并使用可视显示(例如图画,图像,图标或任何视频片段)向双方,例如讲话者和听者表示句子中的主要概念和语义,以帮助用户相互理解,并帮助源语言用户核实翻译的正确性。
旅行者熟悉可视描述(例如在关于行李和出租车的机场标记中使用的那些可视描述)的有效性。本发明通过连同口语输出一起,把这些及其它这样的图像包含到要显示的符号表现中,把同样的特征引入到交互式谈话模型中。符号表现甚至可包含动画,以静态显示所不能的方式指示主语/宾语和动作关系。
根据本发明的一个方面,语言翻译***包括把源语言的自然语句输入***的输入装置;接收呈机器可读形式的自然语句,并把自然语句翻译成符号表现的翻译器;和显示自然语句的符号表现的图像显示器。***还包括以可听见的方式产生目标语言的自然语句的文本-语音合成器。
翻译器包括对自然语句的元素分类,并依据类别标记元素的自然语言理解统计分类器;和从分类句子分析结构信息,并输出分类句子的语义分析树表示的自然语言理解分析器。翻译器还包括抽取自然语句的独立于语言的表现的国际语信息抽取器,和通过使独立于语言的表现的元素与可视描述相联系,产生自然语句的符号表现的符号图像生成器。
根据本发明的另一方面,翻译器把自然语句翻译成目标语言的文本,图像显示器显示目标语言的文本,符号表现和源语言的文本,其中图像显示器指示目标语言的文本,符号表现和源语言的文本之间的相关性。
根据本发明的另一方面,提供一种翻译语言的方法。所述方法包括下述步骤:接收源语言的自然语句;把自然语句翻译成符号表现,并显示自然语句的符号表现。
接收步骤包括下述步骤:以声学信号的形式接收口语自然语句;和把口语自然语句转换成机器可识别的文本。
在本发明的另一方面,所述方法还包括下述步骤:对自然语句的元素分类,并依据类别标记元素;从分类句子分析结构信息,并输出分类句子的语义分析树表示;和从语义分析树抽取自然语句的独立于语言的表现。
此外,所述方法还包括通过使独立于语言的表现的元素与可视描述相联系,产生自然语句的符号表现的步骤。
在另一方面,所述方法还包括下述步骤:使目标语言的文本,符号表现和源语言的文本相关联,并显示目标语言的文本,符号表现和源语言的文本之间的相关性。
根据本发明的另一方面,提供一种机器可读的确实包含可由机器执行的,从而实现翻译语言的方法步骤的指令程序的程序存储装置,所述方法步骤包括接收源语言的自然语句;把自然语句翻译成符号表现;和显示自然语句的符号表现。
附图说明
结合附图,根据下面的详细说明,本发明的上述及其它方面、特征和优点将变得更明显,其中:
图1是根据本发明的一个实施例的多模态语音-语音语言翻译***的方框图;
图2是图解说明根据本发明的一个实施例的把源语言的自然语句翻译成符号表现的方法的流程图;
图3是图解说明源语言的自然语句的符号表现的多模态语音-语音语言翻译的例证显示;
图4是用源语言和目标语言如何与符号表现相关联的指示符,图解说明源语言的自然语句,该句子的符号表现和翻译成目标语言的句子的多模态语音-语音语言翻译***的例证显示。
具体实施方式
下面将参考附图说明本发明的优选实施例。在下面的说明中,未详细描述公知的功能或构造,以避免使本发明掩蔽在不必要的细节中。
提供一种把源语言的自然语句翻译成符号表现和/或目标语言的多模态语音-语音语言翻译***和方法。本发明通过增加设备显示的输入句子的图形或符号表现的附加翻译,延伸了语音识别技术,自然语言理解技术,语义翻译技术,自然语言产生技术和语音合成技术。通过包括可视描述(例如,图画,图像,图标或视频片段),翻译***向(源语言的)说话者指示语音被适当地识别和理解。另外,可视表现向双方指出由于翻译多义性的缘故,可能不正确的语义表现的多个方面。
任意语言的可视描述本身是一个挑战-尤其是对于抽象对话来说。但是,由于用于创建“国际语”(interlingua)表示法,即与语言无关的表示法的自然语言理解处理的缘故,在翻译过程中,可获得匹配适当图像的额外机会。在这种意义上,可视语言可被看作语言产生***以其为目标的另一目标语言。
要明白可用各种形式的硬件、软件、固件、专用处理器,或者它们的组合物来实现本发明。在一个实施例中,本发明可用软件实现成确实包含在程序存储装置上的应用程序。所述应用程序可被上传到包含任何适当体系结构的机器上并由所述机器执行。最好,在具有硬件,例如一个或多个中央处理器(CPU),随机存取存储器(RAM),只读存储器(ROM)和输入/输出(I/O)接口,比如键盘、光标控制装置(例如鼠标)和显示装置的计算机平台上实现所述机器。所述计算机平台还包括操作***和微指令代码。这里描述的各种进程和函数或者是微指令代码的一部分,或者是通过操作***执行的应用程序(或者它们的组合)的一部分。另外,各种其它***设备可与计算机平台连接,例如附加的数据存储装置和打印装置。
还要明白,由于可用软件实现在附图中描述的一些***组件和方法步骤,因此根据对本发明进行程序设计的方式,***组件(或者进程步骤)之间的实际连接可能不同。根据这里提供的本发明的教导,本领域的普通技术人员能够设想本发明的这些及类似的实现或构造。
图1是根据本发明的一个实施例的多模态语音-语音语言翻译***100的方框图,图2是图解说明把源语言的自然语句翻译成符号表现(representation)的方法的流程图。下面将参考图1和2详细说明所述***和方法。
参见图1和2,语言翻译***100包括把自然语句输入***100(步骤202)的输入设备102,接收呈机器可读形式的自然语句并把该自然语句翻译成符号表现的翻译器104,和显示自然语句的符号表现的图像显示器106。可选的是,***100将包括以可听见的方式产生目标语言的自然语句的文本-语音合成器108。
最好,输入装置102是与用于把口语单词转换成计算机或机器能够识别的文本单词(步骤204)的自动语音识别器(ASR)耦接的麦克风。ASR接收声音信号,比较该信号和输入源语言的声学模型110和语言模型112,从而把口语单词转换成文本。
可选的是,输入装置是直接输入文本单词的键盘或者把手写文本转换成计算机能够识别的文本单词(步骤204)的数字写字板或者扫描仪。
一旦自然语句呈计算机/机器可识别的形式,翻译器104就处理所述文本。翻译器104包括自然语言理解(NLU)统计分类器114,NLU统计分析器(parser)116,国际语信息抽取器120,翻译和统计自然语言生成器124和符号图像生成器130。
NLU统计分类器114从ASR102接收计算机可识别文本,查找句子中一般类别的位置,并标记某些元素(步骤206)。例如,ASR102可输入句子“I want to book a one way ticket to Houston,Texas for tomorrowmorning”。NLU分类器114将把Houston,Texas分类为地点“LOC”,并把它替换到输入句子中。此外,one way将被解释成票的类型,例如往返或单程(RT-OW),tomorrow将被“DATE”替换,morning将被“TIME”替换,从而得到句子“I want to book a RT-OW ticket to LOC for DATETIME”。
分类后的句子随后被发送给NLU统计分析器116,抽取结构信息,例如主语/动词(步骤208)。分析器116与分析器模型118交互作用,从而确定输入句子的语法结构,和输出语义分析树。可关于特定的领域,例如运输、医疗等构成分析器模型118。
随后国际语信息抽取器120处理语义分析树,确定输入源句子的独立于语言的含义,也称为树形结构国际语(步骤210)。国际语信息抽取器120与规范器(canonicalizer)122耦接,规范器122把由文本表示的数目转换成由周围上下文确定的恰当格式化的数字。例如,如果输入文本“flight number two eighteen”,那么将输出数字“218”。此外,如果输入“time two eighteen”,那么将输出时间格式的“2:18”。
一旦确定了树形结构国际语,那么初始的输入源自然语句可被翻译成任何目标语言,例如一种不同的口语,或者翻译成符号表示法。对于口语来说,国际语被发送给翻译&统计自然语言生成器124,从而把国际语转换成目标语言(步骤212)。生成器124访问多语言字典126,以便把国际语翻译成目标语言的文本。随后用语义相关字典128处理目标语言的文本,明确表达要输出的文本的恰当含义。最后,用自然语言发生模型129处理该文本,用按照目标语言的可理解句子构成所述文本。目标语句随后被发送给文本-语音合成器108,以便以可听见的方式产生目标语言的自然语句。
国际语还被发送给符号图像生成器130,以便产生将在图像显示器106上显示的可视描述的符号表现(步骤214)。符号图像生成器130可访问图像符号模型,例如Blissymbolics或Minspeak,以产生符号表现。这里,生成器130将抽取恰当的符号来创建代表初始源句子的不同元素的“单词”,并把“单词”聚集在一起,从而传达初始源句子的预定含义。另一方面,生成器130将访问图像目录134,选择复合图像来表示国际语的元素。一旦构成了符号表现,它将被显示在图像显示装置106上。图3图解说明源语言的初始输入的自然语句的符号表现(步骤216)。
除了本发明的翻译***的功能优点之外,共用图形显示的存在极大地增加了说话者和听者的用户体验。不共用任何语言的人们之间的交流既困难又紧张。可视描述促进了共同体验的感觉,并向共同领域提供恰当的图像,从而通过手势或者通过连续的一系列交互作用简化交流。
在本发明的翻译***的另一实施例中,显示的符号表现将指示口语对话的哪一部分对应于显示的图像。图4中图解说明了本实施例的例证屏幕。
图4图解说明说话者说出的源语言的自然语句402,源句子的符号表现404,和源句子406到目标语言(这里为中文)的翻译。线条408指示图像对应的每种语言中的言语部分,因为流畅的语言翻译通常要求词序的改变。通过连接单词和短语的可视描述,并指示在每种语言中,它们出现在口头短语中的何处,听者能够更好地利用说话者提供的韵律提示,当前的语音识别***通常未记录的提示。
可选的是,当文本-语音合成器可听地产生其对应的单词或概念时,呈现在图像显示器上的每个图像被突出。
在另一实施例中,***将检测讲话者的情感,并把“情感”,例如“:-)”包含到目标语言的文本中。通过关于音调和音色分析接收的声音信号,可检测讲话者的情感。另一方面,本领域中已知,通过经神经网络分析捕捉的讲话者的图像,照相机将捕捉讲话者的情感。随后使讲话者的情感与机器可识别的文本相联系,供稍后翻译之用。
虽然参考本发明的一些优选实施例表示和说明了本发明,不过在不脱离由附加权利要求限定的本发明的精神和范围的情况下,可在细节和形式方面做出各种变化。
Claims (23)
1、一种语言翻译***,包括:
把源语言的自然语句输入***的输入装置;
接收呈机器可读形式的自然语句,并把自然语句翻译成符号表现的翻译器;和
显示自然语句的符号表现的图像显示器。
2、按照权利要求1所述的***,还包括以可听见的方式产生目标语言的自然语句的文本-语音合成器。
3、按照权利要求1所述的***,其中输入装置是把口语单词转换成机器可识别文本的自动语音识别器。
4、按照权利要求1所述的***,其中翻译器还包括:
从自然语句分析结构信息,并输出自然语句的语义分析树表示的自然语言理解分析器。
5、按照权利要求1所述的***,其中翻译器还包括:
对自然语句的元素分类,并依据类别标记元素的自然语言理解统计分类器;和
从分类句子分析结构信息,并输出分类句子的语义分析树表示的自然语言理解分析器。
6、按照权利要求5所述的***,其中翻译器还包括抽取自然语句的独立于语言的表现的国际语信息抽取器。
7、按照权利要求6所述的***,其中翻译器还包括通过使独立于语言的表现的元素与可视描述相联系,产生自然语句的符号表现的符号图像生成器。
8、按照权利要求6所述的***,其中翻译器还包括把独立于语言的表现转换成目标语言的自然语言生成器。
9、按照权利要求1所述的***,其中翻译器把自然语句翻译成目标语言的文本,图像显示器显示目标语言的文本以及符号表现。
10、按照权利要求3所述的***,其中翻译器把自然语句翻译成目标语言的文本,图像显示器显示目标语言的文本,符号表现和源语言的文本。
11、按照权利要求10所述的***,其中图像显示器指示目标语言的文本,符号表现和源语言的文本之间的相关性。
12、一种翻译语言的方法,所述方法包括下述步骤:
接收源语言的自然语句;
把自然语句翻译成符号表现;和
显示自然语句的符号表现。
13、按照权利要求12所述的方法,其中接收步骤包括下述步骤:
接收口语自然语句作为声学信号;和
把口语自然语句转换成机器可识别的文本。
14、按照权利要求13所述的方法,还包括下述步骤:
从自然语句分析结构信息,并输出自然语句的语义分析树表示。
15、按照权利要求14所述的方法,还包括从语义分析树,抽取自然语句的独立于语言的表现的步骤。
16、按照权利要求13所述的方法,还包括下述步骤:
对自然语句的元素分类,并依据类别标记元素;和
从分类句子分析结构信息,并输出分类句子的语义分析树表示。
17、按照权利要求16所述的方法,还包括从语义分析树抽取自然语句的独立于语言的表现的步骤。
18、按照权利要求17所述的方法,还包括通过使独立于语言的表现的元素与可视描述相联系,产生自然语句的符号表现的步骤。
19、按照权利要求18所述的方法,还包括下述步骤:把独立于语言的表现转换成目标语言的文本,并显示目标语言的文本以及符号表现。
20、按照权利要求19所述的方法,还包括以可听见的方式产生目标语言的文本的步骤。
21、按照权利要求20所述的方法,还包括突出所显示符号表现的和目标语言的可听文本对应的元素的步骤。
22、按照权利要求19所述的方法,还包括下述步骤:使目标语言的文本,符号表现和源语言的文本相关联,和显示目标语言的文本,符号表现和源语言的文本之间的相关性。
23、一种机器可读的确实包含可由机器执行,从而实现翻译语言的方法步骤的指令程序的程序存储装置,所述方法步骤包括:
接收源语言的自然语句;
把自然语句翻译成符号表现;和
显示自然语句的符号表现。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/315,732 US20040111272A1 (en) | 2002-12-10 | 2002-12-10 | Multimodal speech-to-speech language translation and display |
US10/315,732 | 2002-12-10 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1742273A true CN1742273A (zh) | 2006-03-01 |
Family
ID=32468784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA038259265A Pending CN1742273A (zh) | 2002-12-10 | 2003-04-23 | 多模态语音-语音语言翻译和显示 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20040111272A1 (zh) |
EP (1) | EP1604300A1 (zh) |
JP (1) | JP4448450B2 (zh) |
KR (1) | KR20050086478A (zh) |
CN (1) | CN1742273A (zh) |
AU (1) | AU2003223701A1 (zh) |
TW (1) | TWI313418B (zh) |
WO (1) | WO2004053725A1 (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013086666A1 (en) * | 2011-12-12 | 2013-06-20 | Google Inc. | Techniques for assisting a human translator in translating a document including at least one tag |
CN104462069A (zh) * | 2013-09-18 | 2015-03-25 | 株式会社东芝 | 语音翻译装置和语音翻译方法 |
CN106462573A (zh) * | 2014-05-27 | 2017-02-22 | 微软技术许可有限责任公司 | 通话中翻译 |
CN108563641A (zh) * | 2018-01-09 | 2018-09-21 | 姜岚 | 一种方言转换方法及装置 |
CN111738023A (zh) * | 2020-06-24 | 2020-10-02 | 宋万利 | 一种图文音频自动翻译方法及其*** |
CN111931523A (zh) * | 2020-04-26 | 2020-11-13 | 永康龙飘传感科技有限公司 | 在新闻播报实时翻译文字和手语的方法和*** |
US10841755B2 (en) | 2017-07-01 | 2020-11-17 | Phoneic, Inc. | Call routing using call forwarding options in telephony networks |
TWI742232B (zh) * | 2017-01-25 | 2021-10-11 | 劉可泰 | 語言學習之方法 |
Families Citing this family (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7536294B1 (en) * | 2002-01-08 | 2009-05-19 | Oracle International Corporation | Method and apparatus for translating computer programs |
JP2004280352A (ja) * | 2003-03-14 | 2004-10-07 | Ricoh Co Ltd | 文書データ翻訳方法及び文書データ翻訳プログラム |
US7607097B2 (en) * | 2003-09-25 | 2009-10-20 | International Business Machines Corporation | Translating emotion to braille, emoticons and other special symbols |
US7272562B2 (en) * | 2004-03-30 | 2007-09-18 | Sony Corporation | System and method for utilizing speech recognition to efficiently perform data indexing procedures |
US7502632B2 (en) * | 2004-06-25 | 2009-03-10 | Nokia Corporation | Text messaging device |
JP2006155035A (ja) * | 2004-11-26 | 2006-06-15 | Canon Inc | ユーザインタフェースの構築方法 |
US20060136870A1 (en) * | 2004-12-22 | 2006-06-22 | International Business Machines Corporation | Visual user interface for creating multimodal applications |
US20080249776A1 (en) * | 2005-03-07 | 2008-10-09 | Linguatec Sprachtechnologien Gmbh | Methods and Arrangements for Enhancing Machine Processable Text Information |
US20060229882A1 (en) * | 2005-03-29 | 2006-10-12 | Pitney Bowes Incorporated | Method and system for modifying printed text to indicate the author's state of mind |
JP4050755B2 (ja) * | 2005-03-30 | 2008-02-20 | 株式会社東芝 | コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム |
JP4087400B2 (ja) * | 2005-09-15 | 2008-05-21 | 株式会社東芝 | 音声対話翻訳装置、音声対話翻訳方法および音声対話翻訳プログラム |
US7983910B2 (en) * | 2006-03-03 | 2011-07-19 | International Business Machines Corporation | Communicating across voice and text channels with emotion preservation |
US7860705B2 (en) * | 2006-09-01 | 2010-12-28 | International Business Machines Corporation | Methods and apparatus for context adaptation of speech-to-speech translation systems |
US8335988B2 (en) * | 2007-10-02 | 2012-12-18 | Honeywell International Inc. | Method of producing graphically enhanced data communications |
GB0800578D0 (en) * | 2008-01-14 | 2008-02-20 | Real World Holdings Ltd | Enhanced message display system |
US20100121630A1 (en) * | 2008-11-07 | 2010-05-13 | Lingupedia Investments S. A R. L. | Language processing systems and methods |
US9401099B2 (en) * | 2010-05-11 | 2016-07-26 | AI Squared | Dedicated on-screen closed caption display |
US8856682B2 (en) | 2010-05-11 | 2014-10-07 | AI Squared | Displaying a user interface in a dedicated display area |
US8798985B2 (en) * | 2010-06-03 | 2014-08-05 | Electronics And Telecommunications Research Institute | Interpretation terminals and method for interpretation through communication between interpretation terminals |
US9053077B2 (en) * | 2010-06-25 | 2015-06-09 | Rakuten, Inc. | Machine translation of a web page having an image containing characters |
JP5066242B2 (ja) * | 2010-09-29 | 2012-11-07 | 株式会社東芝 | 音声翻訳装置、方法、及びプログラム |
US11062615B1 (en) | 2011-03-01 | 2021-07-13 | Intelligibility Training LLC | Methods and systems for remote language learning in a pandemic-aware world |
US10019995B1 (en) | 2011-03-01 | 2018-07-10 | Alice J. Stiebel | Methods and systems for language learning based on a series of pitch patterns |
US8862462B2 (en) * | 2011-12-09 | 2014-10-14 | Chrysler Group Llc | Dynamic method for emoticon translation |
US9740691B2 (en) * | 2012-03-19 | 2017-08-22 | John Archibald McCann | Interspecies language with enabling technology and training protocols |
US8452603B1 (en) | 2012-09-14 | 2013-05-28 | Google Inc. | Methods and systems for enhancement of device accessibility by language-translated voice output of user-interface items |
KR20140119841A (ko) * | 2013-03-27 | 2014-10-13 | 한국전자통신연구원 | 애니메이션을 이용한 번역 검증 방법 및 그 장치 |
KR102130796B1 (ko) * | 2013-05-20 | 2020-07-03 | 엘지전자 주식회사 | 이동 단말기 및 이의 제어방법 |
US9754591B1 (en) * | 2013-11-18 | 2017-09-05 | Amazon Technologies, Inc. | Dialog management context sharing |
US9195656B2 (en) | 2013-12-30 | 2015-11-24 | Google Inc. | Multilingual prosody generation |
US9740689B1 (en) * | 2014-06-03 | 2017-08-22 | Hrl Laboratories, Llc | System and method for Farsi language temporal tagger |
JP6503879B2 (ja) * | 2015-05-18 | 2019-04-24 | 沖電気工業株式会社 | 取引装置 |
KR101635144B1 (ko) * | 2015-10-05 | 2016-06-30 | 주식회사 이르테크 | 텍스트 시각화와 학습자 말뭉치를 이용한 언어학습 시스템 |
WO2017072915A1 (ja) * | 2015-10-29 | 2017-05-04 | 株式会社日立製作所 | 視覚情報と聴覚情報の同期方法および情報処理装置 |
KR101780809B1 (ko) * | 2016-05-09 | 2017-09-22 | 네이버 주식회사 | 이모티콘이 함께 제공되는 번역문 제공 방법, 사용자 단말, 서버 및 컴퓨터 프로그램 |
US20180018973A1 (en) | 2016-07-15 | 2018-01-18 | Google Inc. | Speaker verification |
US9747282B1 (en) * | 2016-09-27 | 2017-08-29 | Doppler Labs, Inc. | Translation with conversational overlap |
US11144810B2 (en) * | 2017-06-27 | 2021-10-12 | International Business Machines Corporation | Enhanced visual dialog system for intelligent tutors |
CN108090053A (zh) * | 2018-01-09 | 2018-05-29 | 亢世勇 | 一种语言转换输出装置及方法 |
US10423727B1 (en) | 2018-01-11 | 2019-09-24 | Wells Fargo Bank, N.A. | Systems and methods for processing nuances in natural language |
US11836454B2 (en) | 2018-05-02 | 2023-12-05 | Language Scientific, Inc. | Systems and methods for producing reliable translation in near real-time |
US11763821B1 (en) * | 2018-06-27 | 2023-09-19 | Cerner Innovation, Inc. | Tool for assisting people with speech disorder |
US10740545B2 (en) * | 2018-09-28 | 2020-08-11 | International Business Machines Corporation | Information extraction from open-ended schema-less tables |
US10902219B2 (en) * | 2018-11-21 | 2021-01-26 | Accenture Global Solutions Limited | Natural language processing based sign language generation |
US11250842B2 (en) * | 2019-01-27 | 2022-02-15 | Min Ku Kim | Multi-dimensional parsing method and system for natural language processing |
KR101986345B1 (ko) * | 2019-02-08 | 2019-06-10 | 주식회사 스위트케이 | 기계독해 성능향상을 위해 표·이미지에 메타 문장을 생성하는 장치 |
US11620328B2 (en) | 2020-06-22 | 2023-04-04 | International Business Machines Corporation | Speech to media translation |
CN112184858B (zh) * | 2020-09-01 | 2021-12-07 | 魔珐(上海)信息科技有限公司 | 基于文本的虚拟对象动画生成方法及装置、存储介质、终端 |
WO2022160044A1 (en) * | 2021-01-27 | 2022-08-04 | Baüne Ecosystem Inc. | Systems and methods for targeted advertising using a customer mobile computer device or a kiosk |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02121055A (ja) * | 1988-10-31 | 1990-05-08 | Nec Corp | 点字ワードプロセッサ装置 |
US5510981A (en) * | 1993-10-28 | 1996-04-23 | International Business Machines Corporation | Language translation apparatus and method using context-based translation models |
US6022222A (en) * | 1994-01-03 | 2000-02-08 | Mary Beth Guinan | Icon language teaching system |
AUPP960499A0 (en) * | 1999-04-05 | 1999-04-29 | O'Connor, Mark Kevin | Text processing and displaying methods and systems |
JP2001142621A (ja) * | 1999-11-16 | 2001-05-25 | Jun Sato | エジプト象形文字を用いた文字通信 |
US7120585B2 (en) * | 2000-03-24 | 2006-10-10 | Eliza Corporation | Remote server object architecture for speech recognition |
-
2002
- 2002-12-10 US US10/315,732 patent/US20040111272A1/en not_active Abandoned
-
2003
- 2003-04-23 KR KR1020057008295A patent/KR20050086478A/ko not_active Application Discontinuation
- 2003-04-23 WO PCT/US2003/012514 patent/WO2004053725A1/en active Application Filing
- 2003-04-23 EP EP03719900A patent/EP1604300A1/en not_active Withdrawn
- 2003-04-23 CN CNA038259265A patent/CN1742273A/zh active Pending
- 2003-04-23 AU AU2003223701A patent/AU2003223701A1/en not_active Abandoned
- 2003-04-23 JP JP2004559022A patent/JP4448450B2/ja not_active Expired - Fee Related
- 2003-10-30 TW TW092130319A patent/TWI313418B/zh not_active IP Right Cessation
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013086666A1 (en) * | 2011-12-12 | 2013-06-20 | Google Inc. | Techniques for assisting a human translator in translating a document including at least one tag |
CN104462069A (zh) * | 2013-09-18 | 2015-03-25 | 株式会社东芝 | 语音翻译装置和语音翻译方法 |
CN106462573A (zh) * | 2014-05-27 | 2017-02-22 | 微软技术许可有限责任公司 | 通话中翻译 |
CN106462573B (zh) * | 2014-05-27 | 2019-09-24 | 微软技术许可有限责任公司 | 通话中翻译 |
TWI742232B (zh) * | 2017-01-25 | 2021-10-11 | 劉可泰 | 語言學習之方法 |
US10841755B2 (en) | 2017-07-01 | 2020-11-17 | Phoneic, Inc. | Call routing using call forwarding options in telephony networks |
US11546741B2 (en) | 2017-07-01 | 2023-01-03 | Phoneic, Inc. | Call routing using call forwarding options in telephony networks |
CN108563641A (zh) * | 2018-01-09 | 2018-09-21 | 姜岚 | 一种方言转换方法及装置 |
CN111931523A (zh) * | 2020-04-26 | 2020-11-13 | 永康龙飘传感科技有限公司 | 在新闻播报实时翻译文字和手语的方法和*** |
CN111738023A (zh) * | 2020-06-24 | 2020-10-02 | 宋万利 | 一种图文音频自动翻译方法及其*** |
Also Published As
Publication number | Publication date |
---|---|
EP1604300A1 (en) | 2005-12-14 |
AU2003223701A1 (en) | 2004-06-30 |
KR20050086478A (ko) | 2005-08-30 |
JP4448450B2 (ja) | 2010-04-07 |
TWI313418B (en) | 2009-08-11 |
TW200416567A (en) | 2004-09-01 |
JP2006510095A (ja) | 2006-03-23 |
WO2004053725A1 (en) | 2004-06-24 |
US20040111272A1 (en) | 2004-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1742273A (zh) | 多模态语音-语音语言翻译和显示 | |
CN1290076C (zh) | 基于语音的不受语言限制的搜索***和方法 | |
US9805718B2 (en) | Clarifying natural language input using targeted questions | |
Reshamwala et al. | Review on natural language processing | |
EP1217533A2 (en) | Method and computer system for part-of-speech tagging of incomplete sentences | |
JP2001502828A (ja) | 言語間の翻訳のための方法および装置 | |
US10930274B2 (en) | Personalized pronunciation hints based on user speech | |
CN109256133A (zh) | 一种语音交互方法、装置、设备及存储介质 | |
Karim | Technical challenges and design issues in bangla language processing | |
Fellbaum et al. | Principles of electronic speech processing with applications for people with disabilities | |
Sonawane et al. | Speech to Indian sign language (ISL) translation system | |
Ablimit et al. | A multilingual language processing tool for Uyghur, Kazak and Kirghiz | |
JP7117629B2 (ja) | 翻訳装置 | |
CN115132182A (zh) | 一种数据识别方法、装置、设备及可读存储介质 | |
Monga et al. | Speech to Indian Sign Language Translator | |
Reddy et al. | Indian sign language generation from live audio or text for tamil | |
Singh et al. | An integrated model for text to text, image to text and audio to text linguistic conversion using machine learning approach | |
JP2004295578A (ja) | 翻訳装置 | |
CN105702130A (zh) | 手语翻译器 | |
Reddy et al. | Creation of GIF dataset and implementation of a speech-to-sign language translator in Telugu | |
KR101777141B1 (ko) | 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법 | |
EP1729284A1 (en) | Method and systems for a accessing data by spelling discrimination letters of link names | |
Kumar et al. | Development of a speech to Indian sign language translator | |
Chypak et al. | AUDIO READING ASSISTANT FOR VISUALLY IMPAIRED PEOPLE | |
WO2022118720A1 (ja) | 画像と文字との混在文章を生成する装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20060301 |
|
C20 | Patent right or utility model deemed to be abandoned or is abandoned |