CN1369834B - 语音转换设备 - Google Patents

语音转换设备 Download PDF

Info

Publication number
CN1369834B
CN1369834B CN021068380A CN02106838A CN1369834B CN 1369834 B CN1369834 B CN 1369834B CN 021068380 A CN021068380 A CN 021068380A CN 02106838 A CN02106838 A CN 02106838A CN 1369834 B CN1369834 B CN 1369834B
Authority
CN
China
Prior art keywords
word
words
speech
language
medicine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN021068380A
Other languages
English (en)
Other versions
CN1369834A (zh
Inventor
水谷研治
广濑良文
前川英嗣
胁田由实
芳泽伸一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN1369834A publication Critical patent/CN1369834A/zh
Application granted granted Critical
Publication of CN1369834B publication Critical patent/CN1369834B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

一种语音翻译设备,其便于携带与操作,由以下构成:语音输入/输出装置102;图像输出装置103;一个或多个按键106;图像指令装置105;计算控制装置101,其在语音和语言上对使用者输入的源语言数据进行转换,且将转换过的数据提供给语音输入/输出装置102和图像输出装置103;外部的大型非易失性存储器装置104,其保存着指示计算控制装置101处理过程的程序以及数据;外部数据输入/输出终端107,计算控制装置101通过它与外部设备之间交换程序与数据;以及电源装置108,其提供必要的电源。

Description

语音转换设备
技术领域
本发明涉及一种语音转换设备,其将语音形式输入的源语言输入语音转换为目标语言语音且输出转换得到的语音,而且还涉及一种语音转换方法、程序以及媒介。
背景技术
语音翻译技术已经发展为用于高性能工作站或个人计算机上的软件。如果转换范围限定于旅游会话之类,则该技术性能已经达到了应用水平。但是,为了将该技术实现为在任何情况下都可以为普通使用者使用的语音翻译设备,就需要设计硬件的尺寸使其能够在海外旅游之类的情况下方便携带,且其用户界面操作简单,且需要将具有类似功能的软件传送给该硬件。
传统地,将语音翻译软件传送到大约B5大小的笔记本个人计算机的产品已经有了。
但是,约B5大小的笔记本个人计算机的尺寸不便于使用者携带用于各种地点场合。由于这样的笔记本个人计算机是通过通用键盘或鼠标操作,其操作使用界面不简便。而且,语音识别所需要的计算资源的总量诸如CPU以及工作存储器的性能通常与识别词汇量的大小成正比。
在小尺寸的硬件中,计算资源是有限的,且因此其难于装入用于语音翻译设备作为识别词汇量的必要与足够数量的单词,因此进一步导致一个问题是,降低了作为语音翻译设备的效用值。
发明内容
考虑到传统语音翻译设备的问题,本发明的一个目的是提供一种语音转换设备、一种语音转换方法、程序以及媒介,该语音转换设备与传统设备相比可以使其小型化,且其便于操作。
本发明的第一个发明是一种语音转换设备,其包括:
语音输入装置,其用于输入第一语言;
语音识别装置,其用于识别所述输入的语音;
第一析取/显示装置,其用于析取和显示所述第一语言的一个或多个范例,所述范例对应于所述语音识别的结果;
转换目标选择装置,从所述显示的范例中,选择所要的范例作为转换为第二语言的目标;
第二析取/显示装置,当指定整个或部分所述选择的范例时,相应于所述指定的整个或部分所述选择的范例的内容析取和显示词语候选项;
候选选择装置,从所显示的候选中选择一个;以及
转换装置,根据所述选择的范例和所述选择的候选,确定转换为所述第二语言的所述目标,且将所述确定的转换目标转换为所述第二语言的语音信号。
本发明的第二个发明是依照第一个发明的一种语音转换设备,其中所述第一析取/显示装置具有一个包括显示屏的显示部分,该显示屏在各自预先确定的区域显示作为所述选择目标的所述多个范例以及所述选择的字词,以及
所述第二析取/显示装置在所述显示屏的部分区域内以视窗形式交叠显示所述词语候选项。
本发明的第三个发明是依照第二个发明的一种语音转换设备,其中,当所述选择的范例显示在所述显示屏上时,所述第一析取/显示装置另外还显示信息,提示可显示与部分所述范例有关的相应词语候选项。
本发明的第四个发明是依照第三个发明的一种语音转换设备,其中所述语音转换设备还包括屏显示指定装置,在所述显示屏上指定所述的部分所述范例,显示的所述附加信息与所述部分所述范例相关。
本发明的第五个发明是依照第一个发明的一种语音转换设备,其中所述转换装置将所述范例的所述指定部分用所述选择的候选项替换的结果确定作为所述转换目标。
依照该构造,例如,本发明可提供小型硬件,其便于使用者用一只手掌控通过按键或触板操作。例如,包含在需进行语音翻译的范例句子中的字词可以分类保存,且只有很少数目的字词各自代表分类保存在语音识别部分作为识别词汇表。当说出的句子包含代表分类的字词的时候,可检索包含该字词的范例且展示给使用者。通常,使用者选择期望的一个范例以输出翻译语音。如果需要,使用者可以用另一个同类的字词替换该字词以输出翻译语音。例如,当用日语输入“アスピリンはありますか(Asupirin wa arimasuka(注意:这部分是用罗马字母表示这个句子或字词的发音):Is there Aspirin?(注意:这部分表示这个句子或字词的含义))”的时候,用代表字词“アスピリン(asupirin:aspirin)”所属类的字词“薬(kusuri:medicine)”替换字词“アスピリン(asupirin:aspirin)”,然后说出“薬はありますか(Kusuri wa arimasuka:Is there Medicine?)”。然后,用字词“アスピリン(asupirin:aspirin)”替换字词“薬(kusuri:medicine)”。作为这样一个分步操作的结果,语音翻译设备的实用价值在于不必安装大规模识别词汇表。
附图说明
图1是显示本发明实施例的语音翻译设备硬件结构的方框图。
图2是在使用PC/AT兼容主板情况下的详尽方框图。
图3是图像输出装置204的详尽方框图。
图4是图像指令装置205以及按键206的详尽方框图。
图5是语音输入/输出装置203的详尽方框图。
图6是语音翻译设备在不使用情况下的全景图。
图7(a)是详细显示图6所示的语音翻译设备构造的正视图。
图7(b)是详细显示图6所示的语音翻译设备构造的侧视图。
图7(c)是详细显示图6所示的语音翻译设备构造的俯视图。
图8是语音翻译设备在使用情况下的全景图。
图9(a)是详细显示图8所示的语音翻译设备构造的正视图。
图9(b)是详细显示图8所示的语音翻译设备构造的侧视图。
图9(c)是详细显示图8所示的语音翻译设备构造的俯视图。
图10(a)是显示图2所示部件在主框架801上的安装方式的正视图。
图10(b)是显示图2所示部件在主框架801上的安装方式的侧视图。
图10(c)是显示图2所示部件在主框架801上的安装方式的俯视图。
图11(a)是显示图2所示部件在辅助框架802上的安装方式的正视图。
图11(b)是显示图2所示部件在辅助框架802上的安装方式的侧视图。
图11(c)是显示图2所示部件在辅助框架802上的安装方式的俯视图。
图12是显示本发明实施例的语音翻译设备软件结构的方框图。
图13是显示软件工作流程的流程图。
图14是显示范例数据库1205内容的范例视图。
图15是显示字类词典1206内容的范例视图。
图16是显示GUI(图形用户界面)部分1202显示内容的视图。
图17是显示在步骤1301至1303时GUI部分1202显示内容的视图。
图18是显示在步骤1304时GUI部分1202显示内容的视图。
图19是显示在步骤1305时GUI部分1202显示内容的视图。
图20是显示在步骤1310与1311时GUI部分1202显示内容的视图。
图21是显示在步骤1306时GUI部分1202显示内容的视图。
图22是显示在步骤1307时GUI部分1202显示内容的视图。
图23是显示在步骤1308时GUI部分1202显示内容的视图。
图24是显示在步骤1309时GUI部分1202显示内容的视图。
图25是显示在步骤1310与1311时GUI部分1202显示内容的视图。
具体实施方式
在下文,将结合附图说明语音翻译设备的构造与操作,语音翻译设备是本发明语音转换装置的实施例,并且还将说明本发明语音转换方法的实施。
图1是显示该实施例语音翻译设备的硬件构造的方框图。
语音输入/输出装置102接收使用者讲的源语言,且输出已翻译为目标语言的语音。图像输出装置103显示该翻译设备要翻译的范例。图像指令装置105与按键106用于使使用者能够选择一个显示在图像输出装置103上的范例。计算控制装置101对经由语音输入/输出装置102、图像指令装置105与按键106输入的源语言数据进行语音与语言转换,转换为目标语言的,且将转换结果送到语音输入/输出装置102与图像输出装置103。外部的大型非易失性存储器装置104保存着指示计算控制装置101处理过程的程序以及数据。外部数据输入/输出终端107用于在计算控制装置101与外部设备之间交换程序与数据。电源装置108提供驱动计算控制装置101工作的电源。
本发明语音输入装置相应于语音输入/输出装置102,而本发明第一与第二析取/显示装置相应于包括图像输出装置103、计算控制装置101等等在内的构造。本发明屏幕显示指定装置相应于图像指令装置105与按键106。本发明第一语言相应于该实施例中的源语言,而本发明第二语言相应于该实施例中的目标语言。
图2显示一个详细准确的构造例子,其中在计算控制装置101中使用PC/AT兼容主板。语音输入/输出装置203利用该主板的USB连接器连接到主板201。图像输出装置204利用该主板的RGB接口端点连接到主板201。将2.5英寸硬磁盘机202用作外部的大型非易失性存储器装置104,且通过IDE接口将其连接到主板201。可以用瞬时存储磁盘替代硬磁盘机。将锂离子二次电池208用作电源装置108,以提供+5V与+12V的电压给主板201。在主板201的输入/输出终端中,模拟显示输出终端、局域网终端、与键盘终端引出构成外部数据输入/输出终端207。
图3显示图像输出装置204的详细构造。VGA分辨率的LCD部件301具有4英寸显示区。在LCD部件的背面装有一个冷阴极射线管发出背面光。主板302的18位的RGB接口用于连接该LCD部件。视频同步信号与背面光控制信号也连接到主板。
图4显示了图像指令装置205以及按键206的详尽构造。将3.8英寸压敏触板402连接到触板控制器401,以便将触压点的X坐标与Y坐标转换成符合RS232标准的串行数据,将触板控制器401连接到主板405的串行口COM1。将按键403与404连接到触板控制器401,以便将按键ON或OFF的指示信息添加给触压点信息。通过安装在主板405上的触板控制器401设备驱动程序软件对接收到的串行数据进行译码。在鼠标连接到主板的情况下,点击按键403相当于点击鼠标左键,点击按键404相当于点击鼠标右键。
图5显示了语音输入/输出装置203的详尽构造。USB声频接口504将输入的模拟语音转换成数字数据,以将该数字数据传送到主板505(相当于图2中的201),且将主板505发送的数字数据转换成模拟语音。USB声频接口用于发送与接收数字数据。麦克风503用于收集模拟信号。USB声频接口504的输出通过声频放大器502放大,然后通过扩音器501输出。安装在主板505上的声频接口可以替代USB声频接口504。
图6是一个实施例的透视图,其中安装有图2的结构,使用者可以用一只手掌控,而图7(a)至7(c)是该实施例的三视图。图像指令装置205、图像输出装置204、和按键206安装在主框架601上。附图标记603和604分别相当于按键403与404。语音输入/输出装置203安装在辅助框架602上。当不使用该翻译设备的时候,辅助框架602覆盖在图像输出装置204的显示屏上以保护该屏幕。
当使用该翻译设备的时候,如图8所示,将辅助框架802移动到预设位置,在该位置处语音输入/输出装置203(麦克风803)的位置定向正好面对使用者。图9(a)至9(c)是说明这种位置情况的三视图。特别地,抬升起安装在辅助框架802上的扩音器804以便方向朝向使用者,而且麦克风803也类似地抬升起来。在这种情况下,可以使用触板/LCD805。
图10(a)至10(c)显示部件在主框架601上的安装方式。4英寸VGA LCD部件301和触板402相互交搭安装作为触板/LCD1005。图11(a)至11(c)显示在辅助框架602上安装部件的方式。
图12显示作为本发明程序和数据具体体现的软件结构。在图12中,1201标示控制部分,其指令各部件且控制来自各部件的数据流,1202标示GUI(图形用户界面)部分,其显示由控制部分1201发送来的信息且将使用者输入发送到控制部分1201,1203标示语音输入部分,其响应来自控制部分1201的指令收集使用者的语音,1204标示语音识别部分,其连续不断地识别发送自语音输入部分的使用者语音,1205标示范例数据库,其在源语言和目标语言的范例之间保持对应,1206标示字类词典,其将分类的字保存进范例数据库1205,1207标示范例选择部分,其指范例数据库1205在发送自控制部分1201的语音识别结果的基础上选择一个范例,1208标示字选择部分,其根据来自控制部分1201的指令,从范例选择部分1207选择的范例中选择分类的字,1209标示选项字选择部分,其指字类词典1206选择选项字,该字可用由控制部分1201指定的分类的字替代,1210标示语言转换部分,其指范例数据库1205和字类词典1206将由控制部分1201指定的范例转换成目标语言的句子,而1211标示语音合成部分,其对目标语言的且由控制部分指定的范例句子进行语音合成。
在本发明中语音识别装置相应于语音识别部分1204,而在本发明中转换目标选择装置相应于范例选择部分1207及其他。在本发明中屏幕显示规定装置相应于字选择部分1208及其他,而在本发明中候选择装置相应于选项字选择部分1209及其他。在本发明中转换装置相应于包括语言转换部分1210、语音合成部分1211在内的构造及其他。
图14显示范例数据库1205的一个特定范例。每个范例相应于一个句子转换,且在源语言和语言之间存有对应关系和预先确定的信息(源语言的组元,以及组元之间的依赖关系)。源语言括在
Figure G021068380D00061
中的字是分类的字。每个分类的字都可以用同类的字替换。
图15显示字类词典1206的一个特定范例。术语“类”指诸如“果物(kudamono:fruit)”这样的高度概括的字词。属于类的字词是该类的专题的表示,诸如“りんご(ringo:apple)”和“みかん(mikan:orange)”。分类概括可根据语音识别部分1204的运行而改变,以便有效地执行范例选择。可配置字类词典1206按等级排列类。
图16详细表示了在触板/LCD805上显示的GUI部分1202。附图标记1601标示翻译方向指明区域,在其中指定翻译方向,1603标示语音识别结果显示区域,其中显示语音识别部分1204的语音识别结果,1604标示范例候选显示区域,其中显示范例选择部分1207的范例句子,1605标示范例选择结果显示区域,其中显示使用者指定的范例,而1606标示翻译结果显示区域,其中显示已由语言转换部分翻译成目标语言的范例。附图标记1607和1608分别相应于按键806和807,其使使用者能够执行输入操作。使用者可在触板/LCD805上执行点输入。
图13是本发明的软件工作流程图。附图标记1301标示选择翻译方向的步骤,1302标示通过麦克风803输入语音和执行语音识别的步骤,1303标示根据语音识别结果从范例数据库1205中检索范例的步骤,1304标示由使用者从检索得到范例中选择范例的步骤,1305标示判断在1304步骤中选择的范例是否要进行修正或翻译的步骤,1306标示在1304步骤中选择的范例中的要被修正的字词的选择步骤,1307标示输出一个字词列表的步骤,该字词可替换在步骤1306中选定的要被修正的字词,1308标示由使用者从步骤1307字词列表中选定一个需要的字词的步骤,而1309标示改动范例以用步骤1308中选定的字词替换要修正的字词的步骤。附图标记1310标示将在步骤1305中确定的范例句子转换为目标语言的步骤,而1311标示对在步骤1309中转换为目标语言的范例进行语音合成且通过扩音器804输出合成的范例的步骤。
在下文中,将参照图13的流程图和显示在触板/LCD805上的GUI部分1202(表示在图17-25中)的显示内容来描述本发明的软件操作。将描述一个例子,其中使用者希望翻译句子“アスピリンはありますか(Asupirin wa arimasuka:Is there Aspirin?)”。特别地使用者首先输入“薬はありますか(Kusuri wa arimasuka:Is there Medicine?)”,然后执行用“アスピリン(asupirin:aspirin)”替换“薬(kusuri:medicine)”的操作。在本发明中,可使用触板和按键两种输入操作。在下文中,将按照次序描述触板输入和按键输入。
图17表示在触板输入的情况下GUI部分1202从步骤1301至1303的显示内容。在步骤1301,使用者借助于触板输入点触翻译方向指明区域1701指定为日文译作英文。同时,GUI部分1202将翻译方向传送给控制部分1201,且控制部分1201指令语音输入部分1203执行语音输入。使用者利用麦克风803发音“何か薬はありますか(Nanika kusuri wa arimasuka:Any medicine?)”。语音输入部分1203将输入的语音传送到语音识别部分1204。在步骤1302,语音识别部分1204相应于指定翻译方向执行语音识别。假设传送到控制部分1201的识别结果“七日薬はありますか(Nanoka kusuri wa arimasuka:Seventh day,medicine?)”包含错误识别。控制部分1201将语音识别结果传送到GUI部分1202和范例选择部分1207。GUI部分1202在语音识别结果显示区域1702显示传送过来的语音识别结果。相反,在步骤1303,范例选择部分1207利用上文描述过的方法根据语音识别结果来检索范例,且将检索得到的范例传送到控制部分1201。范例选择部分1207由语音识别结果“七日薬はありますか(Nanoka kusuri wa arimasuka:Seventh day,medicine?)”析取一组关键字“七日(Nanoka:Seventh day)”、“薬(kusuri:medicine)”、以及“あり(ari:there is)”,这些关键字在范例数据库1205中有定义。“七日(Nanoka:Seventh day)”属于分类的字<日数(nissu:number of days)>,而“薬(kusuri:medicine)”属于分类的字<薬(kusuri:medicine)>,“あり(ari:there is)”不属于任何分类的字。
范例选择部分1207顺序地检查图14中所示的组元的依赖关系,而且,从建立了一个或多个依赖关系的范例中,按依赖关系建立的数目由大到小的次序选择范例。例如,参照范例编号1的范例,“かかり(kakari:it takes)”不存在于关键词组中。因此,建立的依赖关系的数目为0。参照范例编号2的范例,“何か(nanika;any)”不存在于关键词组中,且因此,不能建立(①→②)组元的依赖关系,但建立了(②→③)组元的依赖关系。因此,建立的依赖关系的数目为1。
当范例选择部分1207设计为能够从范例数据库1205中选择建立依赖关系数目为1或更大的范例时,不选择图14中范例编号1的范例,而选择图14中范例编号2的范例。“何か(nanika;any)”不存在于关键词组中。因此,参照选定的范例编号2的范例,输出显示“薬はありますか(Kusuri wa arimasuka:Is thereMedicine?)”。在下面的描述中,假设在范例数据库1205中以上述同样的方式选定其他的范例“薬ですか(Kusuri desuka:Do you need medicine?)”和“薬です(Kusuri desu:Yes,medicine)”。控制部分1201将发自范例选择部分1207的范例句子传送到GUI部分1202。GUI部分1202在范例候选显示区域1703显示选定的范例句子。
图18表示在步骤1304时GUI部分1202的显示内容。在步骤1304,从在范例候选显示区域1703显示的范例候选中,通过借助于触板点击区带1801输入,使用者选择与使用者说出的句子含义一样的范例“薬はありますか(Kusuri wa arimasuka:Is there Medicine?)”。同时,GUI部分1202将选定的范例句子传送到控制部分1201。
图19表示在步骤1305时GUI部分1202的显示内容。在步骤1305,GUI部分1202在范例选择结果显示区域1901显示选定的范例句子,且清除范例候选显示区域1902。此后,选择是决定对范例进行翻译,还是修正范例用可替换的字词替换分类的字。此时,使用者可以通过在触板上点击范例选择结果显示区域1901来决定范例。将决定了的范例传送到控制部分1201。当使用者在触板上双击范例选择结果显示区域1901时,控制转切到替换范例中字词的模式。
图20表示在步骤1305中决定范例的情况下GUI部分1202显示的内容。在步骤1310,控制部分1201将由使用者决定的范例“薬はありますか(Kusuri wa arimasuka:Is there Medicine?)”传送到语言转换部分1210。语言转换部分1210利用范例数据库1205将传送来的范例转换为目标语言的“Any medicine”,且将转换结果传送到控制部分1201。控制部分1201将转换结果传送到GUI部分1202和语音合成部分1211。在步骤1311,GUI部分1202在翻译结果显示区域2001显示转换结果。另一方面,语音合成部分1211对转换结果进行语音合成然后通过扩音器804输出合成的语音。
图21表示在步骤1306时GUI部分1202显示的内容。在步骤1306,使用者在步骤1305中选择字词选择模式的情况下选择要改动的字词。此时,控制部分1201指令字选择部分1208执行选择字词的操作。字选择部分1208从范例中析取分类的字“薬(kusuri:medicine)”,然后将析取得到的字词传送到控制部分1201。控制部分1201将该字词传送到GUI部分1202。GUI部分1202对“薬(kusuri:medicine)”划下划线,其显示在范例选择结果显示区域2101以提示使用者该字词是可替换的字词。然后使用者借助于触板输入点击要修改的字词“薬(kusuri:medicine)”。GUI部分1202将选定的字词传送到控制部分1201。
图22表示在步骤1307时GUI部分1202显示的内容。在步骤1307,显示使用者在步骤1306指定的字词“薬(kusuri:medicine)”的可选择的字词列表。控制部分1201将使用者指定的字词“薬(kusuri:medicine)”传送到选项字选择部分1209。选项字选择部分1209指图15所示的字类词典1206选取同类的字词作为使用者指定的字词“薬(kusuri:medicine)”:
“アスピリン(asupirin:aspirin)”
“かぜ薬(kazegusuri:cold medicine)”
“トロ一チ(torochi:troche)”
“胃腸薬(ichoyaku:medicine for the digestion)”
并且将选取的字词传送到控制部分1201。控制部分1201将可选择的字词列表传送到GUI部分1202。GUI部分1202在列表窗口2201显示可选择的字词列表
图23表示在步骤1308时GUI部分1202显示的内容。在步骤1308,从显示在列表窗口2201的可选择的字词列表中选择所需要的字词。使用者执行触板输入,点击使用者所需要的可选择的字词2301,因此使GUI部分1202获得了选项字词“アスピリン(asupirin:aspirin)”。GUI部分1202将该选项字词传送到控制部分1201。
图24表示在步骤1309时GUI部分1202显示的内容。在步骤1309,通过指定选项字词“アスピリン(asupirin:aspirin)”将范例改为“アスピリンはありますか(Asupirin wa arimasuka:Is there Aspirin?)”。然后,GUI部分1202将显示在范例选择结果显示区域2401的范例改变为“アスピリンはありますか(Asupirin wa arimasuka:Is there Aspirin?)”,并且显示改动后的范例。然后控制返回步骤1305。
图25表示在重复步骤1305至1308的情况下GUI部分1202显示的内容,使用者选择在步骤1305中决定的范例,将“アスピリンはありますか(Asupirin waarimasuka:Is there Aspirin?)”转换成目标语言“Any pirin”,且输出合成语音。
下面,将描述按键输入的情况。在下文的描述中,SW1和SW2分别实物对应于按键806和807。
图17表示GUI部分1202在步骤1301至1303的显示内容。在步骤1301,通过点击SW1指定翻译方向为日文译作英文,而通过点击SW2指定翻译方向为英文译作日文。在这个例子中,通过点击SW1指定翻译方向为日文译作英文。同时,GUI部分1202将翻译方向传送给控制部分1201,且控制部分1201指令语音输入部分1203执行语音输入。使用者利用麦克风803发音“何か薬はありますか(Nanika kusuri wa arimasuka:Any medicine?)”。语音输入部分1203将输入的语音传送到语音识别部分1204。在步骤1302,语音识别部分1204根据指定翻译方向执行语音识别。假设传送到控制部分1201的识别结果“七日薬はありますか(Nanoka kusuri wa arimasuka:Seventh day,medicine?)”包含错误识别。控制部分1201将语音识别结果传送到GUI部分1202和范例选择部分1207。GUI部分1202在语音识别结果显示区域1702显示传送过来的语音识别结果。相反,在步骤1303,范例选择部分1207利用上文描述过的方法根据语音识别结果来检索范例,且将检索得到的范例传送到控制部分1201。范例选择部分1207由语音识别结果“七日薬はありますか(Nanoka kusuri wa arimasuka:Seventh day,medicine?)”析取一组关键字“七日(Nanoka:Seventh day)”、“薬(kusuri:medicine)”、以及“あり(ari:there is)”,这些关键字在范例数据库1205中有定义。“七日(Nanoka:Seventh day)”属于分类的字<日数(nissu:number of days)>,而“薬(kusuri:medicine)”属于分类的字<薬(kusuri:medicine)>,“あり(ari:there is)”不属于任何分类的字。
范例选择部分1207顺序地检查图14中所示的组元的依赖关系,而且,从建立了一个或多个依赖关系的范例中,按依赖关系建立的数目由大到小的次序选择范例。例如,参照范例编号1的范例,“かかり(kakari:it takes)”不存在于关键词组中。因此,建立的依赖关系的数目为0。参照范例编号2的范例,“何か(nanika;any)”不存在于关键词组中,且因此,不能建立(①→②)组元的依赖关系,但建立了(②→③)组元的赖关系。因此,建立的依赖关的数目为1。
当范例选择部分1207设计为能够从范例数据库1205中选择建立依赖关系数目为1或更大的范例时,不选择图14中范例编号1的范例,而选择图14中范例编号2的范例。“何か(nanika;any)”不存在于关键词组中。因此,参照选定的范例编号2的范例,输出显示“薬はありますか(Kusuri wa arimasuka:Is thereMedicine?)”。在下面的描述中,假设在范例数据库1205中以上述同样的方式选定其他的范例“薬ごすか(Kusuri desuka:Do you need medicine?)”和“薬ごす(Kusuri desu:Yes,medicine)”。控制部分1201将发自范例选择部分1207的范例句子传送到GUI部分1202。GUI部分1202在范例候选显示区域1703显示选定的范例句子。
图18表示在步骤1304时GUI部分1202的显示内容。在步骤1304,从在范例候选显示区域1604显示的范例候选中,借助于按键输入,使用者选择与使用者说出的句子含义一样的范例“薬はありますか(Kusuri wa arimasuka:Is thereMedcme?)”。在该选择方法中,通过点击SW1将指定行向上移动一行,而通过点击SW2将指定行向下移动一行。同时,GUI部分1202将选定的范例句子传送到控制部分1201。
图19表示在步骤1305时GUI部分1202的显示内容。在步骤1305,GUI部分1202在范例选择结果显示区域1901显示选定的范例句子,且清除范例候选显示区域1902。此后,选择是决定对范例进行翻译,还是修正范例用可替换的字词替换分类的字。此时,使用者可以通过点击SW2来决定范例。将决定了的范例传送到控制部分1201。当借助于按键输入点击SW1时,控制转切到替换范例中字词的模式。点击SW1引发的一个信号传送到控制部分1201。
图20表示在步骤1305中决定范例的情况下GUI部分1202显示的内容。在步骤1310,控制部分1201将由使用者决定的范例“薬はありますか(Kusuri wa arimasuka:Is there Medicine?)”传送到语言转换部分1210。语言转换部分1210利用范例数据库1205将传送来的范例转换为目标语言的“Any medicine”,且将转换结果传送到控制部分1201。控制部分1201将转换结果传送到GUI部分1202和语音合成部分1211。在步骤1311,GUI部分1202在翻译结果显示区域2001显示转换结果。另一方面,语音合成部分1211对转换结果进行语音合成然后通过扩音器804输出合成的语音。
图21表示在步骤1306时GUI部分1202显示的内容。在步骤1306,使用者在步骤1305中选择字词选择模式的情况下选择要改动的字词。此时,控制部分1201指令字选择部分1208执行选择字词的操作。字选择部分1208从范例中析取分类的字“薬(kusuri:medicine)”,然后将析取得到的字词传送到控制部分1201。控制部分1201将该字词传送到GUI部分1202。GUI部分1202对“薬(kusuri:medicine)”划下划线,其显示在范例选择结果显示区域2101以提示使用者该字词是可替换的字词。使用者借助于按键输入选择要修改的字词“薬(kusuri:medicine)”。明确的讲,通过点击SW1将光标左移一个字词,且通过点击SW2将光标右移一个字词。可通过双击SW1选定要修改的字词。GUI部分1202将选定的字词传送到控制部分1201。
图22表示在步骤1307时GUI部分1202显示的内容。在步骤1307,显示使用者在步骤1306指定的字词“薬(kusuri:medicine)”的选项字词列表。控制部分1201将使用者指定的字词“薬(kusuri:medicine)”传送到选项字选择部分1209。选项字选择部分1209指图15所示的字类词典1206选取同类的字词作为使用者指定的字词“薬(kusuri:medicine)”:
“アスピリン(asupirin:aspirin)”
“かぜ薬(kazegusuri:cold medicine)”
“トロ一チ(torochi:troche)”
“胃腸薬(ichoyaku:medicine for the digestion)”
并且将选取的字词传送到控制部分1201。控制部分1201将选项字词列表传送到GUI部分1202。GUI部分1202在列表窗口2201显示选项字词列表。
图23表示在步骤1308时GUI部分1202显示的内容。在步骤1308,从显示在列表窗口2201的选项字词列表中选择所需要的字词。此时,作为使用者按键输入的结果,GUI部分1202获得了选项字词“アスピリン(asupirin:aspirin)”,且将该选定的字词传送到控制部分1201。以下述方式执行输入。通过点击SW1将光标移到当前字词的上一个字词,而通过点击SW2将光标移到当前字词的下一个字词。当光标所在字词是要选择的字词时,通过双击SW1可选定。
图24表示在步骤1309时GUI部分1202显示的内容。在步骤1309,通过指定选项字词“アスピリン(asupirin:aspirin)”将范例改为“アスピリンはありますか(Asupirin wa arimasuka:Is there Aspirin?)”。然后,GUI部分1202将显示在范例选择结果显示区域2401的范例改变为“アスピリンはありますか(Asupirin wa arimasuka:Is there Aspirin?)”,并且显示改动后的范例。然后控制返回步骤1305。
图25表示在重复步骤1305至1308的情况下GUI部分1202显示的内容,使用者选择在步骤1305中决定的范例,将“アスピリンはありますか(Asupirin waarimasuka:Is there Aspirin?)”转换成目标语言“Any aspirin”,且输出合成语音。
在上面的描述中,使用者对GUI部分1202执行输入操作的方式限定于触板输入和按键输入。作为选择,字词和范例的选择和决定可以借助于语音利用语音识别过程来实现。可以联合使用各种不同的输入形式触板、按键以及语音来操作该设备。在上文中,已经示例描述了日文和英文的翻译。本发明同样还可应用于其他语言诸如中文,且本发明不依赖于语言。
在实施例中,本发明中的每个字串都典型表述为由多个字词构成的句子。本发明不局限于此。例如,每个字串都可以由一个字词构成,例如“こんにちは(konnichiwa:Hello)”。
在实施例中,已经描述了通过单个显示装置实现本发明的第一和第二析取/显示装置的情况。本发明不局限于此。例如,可以通过各自独立的显示装置实现本发明的第一和第二析取/显示装置。
如上所述,本发明实施例的语音翻译设备是选择一个范例且根据语音输入进行翻译,其中语音翻译设备的硬件构成包括:计算控制装置,其包括作为语音模态的语音输入/输出装置、作为图像模态的图像输出装置、以及作为联系模态的一个或多个按键和图像指令装置,且其将由使用者通过语音输入/输出装置、图像指令装置以及按键输入的源语言数据进行语音和语言转换为目标语言的数据,且其将转换得到的数据供给语音输入/输出装置和图像输出装置;外部的大型非易失性存储器装置,其保存着指示计算控制装置处理过程的程序以及数据;外部数据输入/输出终端,其用于在计算控制装置与外部设备之间交换程序与数据;以及电源装置,其提供驱动计算控制装置工作的电源。
在另一个实施例中,语音翻译设备的特征在于在计算控制装置中使用PC/AT兼容主板。
在另一个实施例中,语音翻译设备的特征在于将2.5英寸或更小的硬磁盘机用作外部的大型非易失性存储器装置。
在另一个实施例中,语音翻译设备的特征在于将瞬时存储磁盘用作外部的大型非易失性存储器装置。
在另一个实施例中,语音翻译设备的特征在于将具有240点或更多点垂直分辨率和240点或更多点横向分辨率的液晶显示装置用作图像输出装置。
在另一个实施例中,语音翻译设备的特征在于两个机械按键用作按键,且其功能分别对应于将一个鼠标连接到主板情况下的鼠标按键。
在另一个实施例中,语音翻译设备的特征在于触板的大小等于液晶显示装置显示屏,或者包含显示屏用作图像指令装置。
在另一个实施例中,语音翻译设备的特征在于,在主板的输入/输出终端中,模拟显示输出终端、局域网终端、与键盘终端用作外部数据输入/输出终端。
在另一个实施例中,语音翻译设备的特征在于语音输入/输出装置包括:USB声频接口,其通过主板的USB接口接受且提供模拟语音数据和数字语音数据;麦克风,其用于收集使用者的语音且将语音提供给USB声频接口;声频放大器,其放大USB声频接口的输出;以及扩音器,其连接到声频放大器。
在另一个实施例中,语音翻译设备的特征在于语音输入/输出装置包括:主板的声频接口;麦克风,其用于收集使用者的语音且将语音提供给USB声频接口;声频放大器,其放大USB声频接口的输出;以及扩音器,其连接到声频放大器。
在另一个实施例中,语音翻译设备的特征在于电源装置由锂离子二次电池配置而成。
在另一个实施例中,语音翻译设备的特征在于该设备的设计结构使得使用者能够用一只手掌控该设备,一只手的拇指能够方便地操控按键,图像指令装置便于用另一只手操作,且图像显示装置显示屏的常态方向和语音输入/输出装置定向的常态方向都易于朝向使用者。
在另一个实施例中,语音翻译设备的特征在于该设备由主框架和辅助框架构成,按键、图像指令装置和图像显示装置安装在主框架上,语音输入/输出装置安装在辅助框架上,当不使用该语音翻译设备的时候辅助框架覆盖在图像显示装置的显示屏上以保护该屏幕,且在将辅助框架移动到预设位置之后使用该语音翻译设备,在该位置语音输入/输出装置的位置定向正好面对使用者。
本发明的一个实施例是语音翻译设备,其中根据语音输入选择一个范例然后进行翻译,其中语音翻译设备的软件构成包括:GUI部分,其实现有关使用者的输入和输出操作;源语言输入部分,其收集语音且对语音进行语音识别;翻译部分,其将输入到源语言输入部分的源语言翻译为目标语言;语音合成部分,其对翻译部分翻译得到的目标语言进行语音合成,且输出合成语音;以及控制部分,其控制源语言输入部分、GUI部分、翻译部分和语音合成部分。
在另一个实施例中,语音翻译设备的特征在于一个会话语句用作范例单元。
在另一个实施例中,语音翻译设备的特征在于将频繁用于旅游会话中的语句型式作为范例。
在另一个实施例中,语音翻译设备的特征在于范例中的字词与可替换的相关字词归为一类。
在另一个实施例中,语音翻译设备的特征在于源语言输入部分构成包括:语音输入部分,其根据控制部分的指令执行语音输入;以及语音识别部分,其对通过语音输入部分输入的语音执行连续语音识别,以将语音转换为字串。
在另一个实施例中,语音翻译设备的特征在于翻译部分构成包括:范例数据库,其在源语言和目标语言范例之间建立对应关系;字类词典,其将字的分类信息保存进范例数据库;范例选择部分,其根据通过源语言输入部分的输入从范例数据库选择一个相应范例;字选择部分,其从范例选择部分选定的范例中选择要修改的字词;选项字选择部分,其从字类词典中选择可替换字选择部分选定的字词的选项字词;以及语言转换部分,其通过范例数据库根据决定的范例执行转换转换为目标语言。
在另一个实施例中,语音翻译设备的特征在于GUI部分在显示屏部分配置为:翻译方向指明区域,在其中指定翻译方向;语音识别结果显示区域,其中显示由源语言输入部分提供的语音识别部分的语音识别结果;范例候选显示区域,其中显示通过范例选择部分从范例数据库中选定的范例句子;范例选择结果显示区域,其中显示使用者指定的范例;翻译结果显示区域,其中输出由语言转换部分提供的目标语言的范例。
在另一个实施例中,语音翻译设备的特征在于,在GUI部分,当使用者从显示在范例候选显示区域的范例中选择一个范例时,使用者通过触板操作或按键操作选定范例。
在另一个实施例中,语音翻译设备的特征在于,当展现给使用者一个或多个可修改的字词时,字选择部分在GUI部分的范例候选显示区域标记可修改的字词。
在另一个实施例中,语音翻译设备的特征在于用下划线字词、高亮显示字词、用粗体字显示字词或闪烁字词来标记可修改的字词。
在另一个实施例中,语音翻译设备的特征在于,在字选择部分,使用者通过对GUI部分执行触板操作或按键操作或者通过基于语音识别的语音操作选择要修改的字词。
在另一个实施例中,语音翻译设备的特征在于,当选择选项字词时,选项字词选择部分通过使用字类词典获得选项候选列表,且GUI部分以类似列表的形式显示候选列表。
在另一个实施例中,语音翻译设备的特征在于通过对GU部分执行触板操作或按键操作或者通过基于语音识别的语音操作从选项候选列表中选择选项候选。
在另一个实施例中,语音翻译设备的特征在于,当使用者认为需要改动范例时,使用者通过对GUI部分执行触板操作或按键操作确定范例,语言转换部分将确定的范例转换为目标语言,且通过语音合成部分合成输出的范例语音。
由上述描述清楚可知,小型硬件用作语音翻译设备便于国外旅游携带。由于用户界面可用一只手简单地操作,该设备可方便地应用于各种不同的场合诸如商店和饭店。当通过用字词代表类来输入语音且决定范例之后,而且,该字词可用同一类的相关字词替换。因此,语音翻译设备的功用即使在使用小量识别词汇量的情况下也不会降低。
本发明提供了一种程序,其使计算机执行全部或部分的上述本发明语音转换设备的装置(或部件、电路、部分等)的功能,并且该程序和计算机协作运行。
本发明还提供了一种程序,其使计算机在全部或部分的上述本发明语音转换方法的步骤(或过程、操作、作用等)中执行操作,且该程序和计算机协作运行。
本发明还提供了一种媒介,其上记录有程序,该程序用于使计算机执行全部或某些上述本发明语音转换设备的装置的全部或某些功能,其中该程序可用计算机读出且和计算机协作执行功能。
本发明还提供了一种媒介,其上记录有程序,该程序用于使计算机在全部或某些上述本发明语音转换方法的步骤中执行全部或某些操作,其中该程序可用计算机读出且和计算机协作执行功能。
这里,本发明的部分装置(或设备、部件、电路、部分等)和本发明的部分步骤(或过程、操作、作用等)指多个装置或步骤中的若干,或者指在一个装置或步骤中的若干功能或操作。
而且,本发明的若干设备(或部件、电路、部分等)指多个设备中的若干,或者指在一个设备中的若干装置(或设备、部件、电路、部分等),或者指在一个装置中的若干功能。
在本发明程序的一个应用模式中,程序记录在记录媒介上,可用计算机读出,且和计算机协作运行。
在本发明程序的另一个应用模式中,程序通过传输介质传送,用计算机读出,且和计算机协作运行。
记录媒介包括ROM或类似物体,而传送介质包括诸如Internat、光波、无线电波或声波这样的传送介质。
上述本发明计算机不局限于诸如CPU这样的单纯硬件,而可以包括固件、操作***、乃至***设备。
本发明的配置构成可用软件或硬件实现。
由上述描述清楚可知,本发明具有优点在于该设备与传统设备相比可进一步小型化,且该设备操作简便。
附图参考标记说明
101  计算控制装置
102  语音输入/输出装置
103  图像输出装置
104  外部的大型非易失性存储器装置
105  图像指令装置
106  按键
107  外部数据输入/输出终端
108  电源装置
201  主板
202  2.5英寸硬磁盘机
203  语音输入/输出装置
204  图像输出装置
205  图像指令装置
206  按键
207  外部数据输入/输出终端
208  锂离子二次电池
301  具有背面光的4英寸VGA LCD部件
302  主板
401  触板控制器
402  3.8英寸压敏触板
403  按键
404  按键
405  主板
501  扩音器
502  声频放大器
503  麦克风
504  USB声频接口
505  主板
601  主框架
602  辅助框架
603  按键
604  按键
701  正视图
702  右侧视图
703  俯视图
801  主框架
802  辅助框架
803  麦克风
804  扩音器
805  触板/LCD
901  正视图
902  右侧视图
903  俯视图
1001 正视图
1002 右侧视图
1003 俯视图
1004 主板
1005 触板/LCD
1006 2.5英寸硬磁盘机
1007 按键
1008 按键
1101 正视图
1102 右侧视图
1103 俯视图
1104 麦克风
1105 扩音器
1106 USB声频接口
1107 声频放大器
1201 控制部分
1202  GUI(图形用户界面)部分
1203  语音输入部分
1204  语音识别部分
1205  范例数据库
1206  字类词典
1207  范例选择部分
1208  字选择部分
1209  选项字选择部分
1210  语言转换部分
1211  语音合成部分
1301  确定翻译方向的步骤
1302  进行语音识别的步骤
1303  从范例数据库中检索范例的步骤
1304  选择范例的步骤
1305  判定范例是否经过校正或进行校正的步骤
1306  确定要校正的字的步骤
1307  得到可供选择的字的列表的步骤
1308  确定可供选择的字的步骤
1309  校正范例的步骤
1310  执行语言转换的步骤
1311  执行语音合成的步骤
1601  翻译方向指明区域
1602  翻译方向指明区域
1603  识别结果显示区域
1604  范例候选显示区域
1605  范例选择结果显示区域
1606  翻译结果显示区域
1607  按键SW1
1608  按键SW2
1701  翻译方向指明区域
1702  识别结果显示区域
1703  范例候选显示区域
1801  选择的范例
1901  范例选择结果显示区域
1902  范例候选显示区域
2001  翻译结果显示区域
2101  范例选择结果显示区域
2201  列表窗口
2301  选定的可供选择的字
2401  范例选择结果显示区域

Claims (5)

1.一种语音转换设备包括:
语音输入装置,其用于输入第一语言的语音;
语音识别装置,其用于识别所述输入的语音;
范例数据库,预先收藏所述第一语言的范例,以及构成所述范例的单词内规定单词的依赖关系;
第一析取/显示装置,在所述语音识别结果中包含所述规定单词时,利用被包含的规定单词的所述依赖关系,从所述范例数据库中收藏的所述第一语言的范例中,析取对应于所述语音的范例,显示构成所述范例的一个或多个字词;
转换目标选择装置,其从所述显示的构成所述第一语言的范例的字词中,选择期望成为转换为第二语言的目标的字词;
字类词典,将所述范例包含的单词预先进行分类,然后预先收藏能够与所述进行分类的单词替换的单词;
第二析取/显示装置,在所述选择的字词中所述进行分类的单词被指定时,从所述字类词典中析取与被指定的所述进行分类的单词相同分类的单词,作为所述替换的候选项;
候选选择装置,其从所述显示的所述同一分类的单词候选中选择一个;以及
转换装置,其根据所述选择的构成所述第一语言的范例的字词和所述选择的所述同一分类的单词候选来确定转换为所述第二语言的所述目标,且其将所述确定的转换目标转换为所述第二语言的语音语言。
2.依照权利要求1的一种语音转换设备,其中所述第一析取/显示装置具有包括显示屏的显示部分,该显示屏在各自预先确定的区域显示作为所述选择目标的所述多个范例以及所述选择的字词,且
所述第二析取/显示装置在所述显示屏的部分区域以窗口的形式重叠显示所述候选项。
3.依照权利要求2的一种语音转换设备,其中,当所述选择的范例显示在所述显示屏上的时候,所述第一析取/显示装置还显示附加信息指出,可显示与部分所述范例相关的相应候选项。
4.依照权利要求3的一种语音转换设备,其中所述语音转换设备还包括屏显示指定装置,其在所述显示屏上指定所述部分所述范例,显示的所述附加信息与所述部分所述范例相关。
5.依照权利要求1的一种语音转换设备,其中所述转换装置将所述范例的所述指定部分用所述选择的候选项替换的结果确定作为所述转换目标。
CN021068380A 2001-01-24 2002-01-24 语音转换设备 Expired - Lifetime CN1369834B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2001015383 2001-01-24
JP015383/01 2001-01-24

Publications (2)

Publication Number Publication Date
CN1369834A CN1369834A (zh) 2002-09-18
CN1369834B true CN1369834B (zh) 2010-04-28

Family

ID=18881941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN021068380A Expired - Lifetime CN1369834B (zh) 2001-01-24 2002-01-24 语音转换设备

Country Status (2)

Country Link
US (1) US7050979B2 (zh)
CN (1) CN1369834B (zh)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3933449B2 (ja) * 2001-11-22 2007-06-20 株式会社東芝 コミュニケーション支援装置
DK1353280T3 (da) * 2002-04-12 2006-10-16 Targit As Fremgangsmåde til behandling af flersproglige forespörgsler
US7536293B2 (en) * 2003-02-24 2009-05-19 Microsoft Corporation Methods and systems for language translation
JP4085204B2 (ja) * 2003-09-05 2008-05-14 株式会社オーク製作所 描画用ベクタデータの処理方法及び描画装置
CA2545142A1 (en) * 2003-11-14 2005-06-02 Speechgear, Inc. Phrase constructor for translator
US20050111651A1 (en) * 2003-11-21 2005-05-26 Armando Chavez Script translation
JP3962763B2 (ja) * 2004-04-12 2007-08-22 松下電器産業株式会社 対話支援装置
US20060085414A1 (en) * 2004-09-30 2006-04-20 International Business Machines Corporation System and methods for reference resolution
CN1842788B (zh) * 2004-10-08 2012-04-04 松下电器产业株式会社 对话支援装置、***及方法
WO2006040971A1 (ja) * 2004-10-08 2006-04-20 Matsushita Electric Industrial Co., Ltd. 対話支援装置
JP4263181B2 (ja) * 2005-03-28 2009-05-13 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP4050755B2 (ja) * 2005-03-30 2008-02-20 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP4064413B2 (ja) * 2005-06-27 2008-03-19 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP3984642B2 (ja) * 2005-07-06 2007-10-03 松下電器産業株式会社 対話支援装置
CN101052965A (zh) * 2005-07-13 2007-10-10 松下电器产业株式会社 对话支援装置
CN101351841B (zh) * 2005-12-02 2011-11-16 旭化成株式会社 音质转换***
KR100707970B1 (ko) * 2006-03-10 2007-04-16 (주)인피니티 텔레콤 이동통신단말기를 이용한 통역 서비스 방법
JP4398966B2 (ja) * 2006-09-26 2010-01-13 株式会社東芝 機械翻訳を行う装置、システム、方法およびプログラム
JP5121252B2 (ja) * 2007-02-26 2013-01-16 株式会社東芝 原言語による音声を目的言語に翻訳する装置、方法およびプログラム
JP4791984B2 (ja) * 2007-02-27 2011-10-12 株式会社東芝 入力された音声を処理する装置、方法およびプログラム
TW200846936A (en) * 2007-05-30 2008-12-01 Chung-Hung Shih Speech communication system for patients having difficulty in speaking or writing
US20090162818A1 (en) * 2007-12-21 2009-06-25 Martin Kosakowski Method for the determination of supplementary content in an electronic device
JP2009205579A (ja) * 2008-02-29 2009-09-10 Toshiba Corp 音声翻訳装置およびプログラム
US8498857B2 (en) * 2009-05-19 2013-07-30 Tata Consultancy Services Limited System and method for rapid prototyping of existing speech recognition solutions in different languages
US20100049497A1 (en) * 2009-09-19 2010-02-25 Manuel-Devadoss Smith Johnson Phonetic natural language translation system
KR101454523B1 (ko) * 2009-12-30 2014-11-12 모토로라 모빌리티 엘엘씨 문자 입력 방법 및 장치
US20110313762A1 (en) * 2010-06-20 2011-12-22 International Business Machines Corporation Speech output with confidence indication
JP5464078B2 (ja) * 2010-06-30 2014-04-09 株式会社デンソー 音声認識端末
CN102339603A (zh) * 2010-07-23 2012-02-01 张文 通用数字语音直接交流机
US8775156B2 (en) 2010-08-05 2014-07-08 Google Inc. Translating languages in response to device motion
CN102467362B (zh) * 2010-11-18 2015-04-29 联想(北京)有限公司 一种语音输入方法及输入装置
JP5242726B2 (ja) * 2011-03-28 2013-07-24 株式会社東芝 外国語接客支援装置、外国語接客方法及びプログラム
JP5148026B1 (ja) * 2011-08-01 2013-02-20 パナソニック株式会社 音声合成装置および音声合成方法
US8712761B2 (en) * 2011-11-22 2014-04-29 Google Inc. Techniques for performing translation of messages
JP5750380B2 (ja) * 2012-02-10 2015-07-22 株式会社東芝 音声翻訳装置、音声翻訳方法および音声翻訳プログラム
US8452603B1 (en) * 2012-09-14 2013-05-28 Google Inc. Methods and systems for enhancement of device accessibility by language-translated voice output of user-interface items
JP2015014665A (ja) * 2013-07-04 2015-01-22 セイコーエプソン株式会社 音声認識装置及び方法、並びに、半導体集積回路装置
WO2016068455A1 (ko) * 2014-10-30 2016-05-06 주식회사 플런티코리아 적응적인 키보드 인터페이스를 제공하기 위한 방법 및 시스템, 대화 내용과 연동되는 적응적 키보드를 이용한 답변 입력 방법
DE112014007207B4 (de) * 2014-11-25 2019-12-24 Mitsubishi Electric Corporation Informations-Präsentationssystem
USD741283S1 (en) 2015-03-12 2015-10-20 Maria C. Semana Universal language translator
US11361168B2 (en) 2018-10-16 2022-06-14 Rovi Guides, Inc. Systems and methods for replaying content dialogue in an alternate language
US11188720B2 (en) * 2019-07-18 2021-11-30 International Business Machines Corporation Computing system including virtual agent bot providing semantic topic model-based response
CN110809224A (zh) * 2019-10-12 2020-02-18 深圳情景智能有限公司 一种导游用翻译扩音器、导游语音翻译方法和翻译***
US11514899B2 (en) * 2020-01-21 2022-11-29 Motorola Solutions, Inc. Using multiple languages during speech to text input

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4774666A (en) * 1985-05-14 1988-09-27 Sharp Kabushiki Kaisha Translating apparatus
JP2000200275A (ja) * 1999-01-07 2000-07-18 Hitachi Ltd 翻訳装置、記録媒体
WO2000045376A1 (en) * 1999-01-29 2000-08-03 Sony Electronics, Inc. A method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61217871A (ja) * 1985-03-25 1986-09-27 Toshiba Corp 翻訳処理装置
US5005127A (en) * 1987-10-26 1991-04-02 Sharp Kabushiki Kaisha System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules
JP2758952B2 (ja) * 1989-12-28 1998-05-28 富士通株式会社 日本語文書読取翻訳システムの修正時における表示方式
US5822720A (en) * 1994-02-16 1998-10-13 Sentius Corporation System amd method for linking streams of multimedia data for reference material for display
JP3385146B2 (ja) * 1995-06-13 2003-03-10 シャープ株式会社 会話文翻訳装置
WO1999063456A1 (fr) 1998-06-04 1999-12-09 Matsushita Electric Industrial Co., Ltd. Dispositif de preparation de regles de conversion du langage, dispositif de conversion du langage et support d'enregistrement de programme
JP2000066494A (ja) 1998-08-19 2000-03-03 Konica Corp 現像装置及び画像形成装置
JP3959180B2 (ja) * 1998-08-24 2007-08-15 東芝ソリューション株式会社 通信翻訳装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4774666A (en) * 1985-05-14 1988-09-27 Sharp Kabushiki Kaisha Translating apparatus
JP2000200275A (ja) * 1999-01-07 2000-07-18 Hitachi Ltd 翻訳装置、記録媒体
WO2000045376A1 (en) * 1999-01-29 2000-08-03 Sony Electronics, Inc. A method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection

Also Published As

Publication number Publication date
US7050979B2 (en) 2006-05-23
US20020120436A1 (en) 2002-08-29
CN1369834A (zh) 2002-09-18

Similar Documents

Publication Publication Date Title
CN1369834B (zh) 语音转换设备
CN102272827B (zh) 利用语音输入解决模糊的手工输入文本输入的方法和装置
CN102165437A (zh) 信息处理装置及信息处理方法
JPH0256703B2 (zh)
MXPA05002951A (es) Tablas de conversion con ordenes en lenguaje natural.
CN104239289B (zh) 音节划分方法和音节划分设备
JPH0332107B2 (zh)
CN102165438A (zh) 信息处理装置及信息处理方法
CN102193902A (zh) 辞典信息显示装置
CN101187915A (zh) 汉字学习***及其方法
CN101102351A (zh) 可视终端拼音首字母关键字查询方法
CN113901186A (zh) 电话录音标注方法、装置、设备及存储介质
JP2001100878A (ja) マルチモーダル入出力装置
US4736447A (en) Video computer
JP5628691B2 (ja) 手話キーボードおよびそれを用いた手話検索装置
WO2022143523A1 (zh) 词汇显示方法、装置和电子设备
CN108388551A (zh) 化学式及方程式的编辑方法、***、存储介质、电子设备
CN102043773A (zh) 模式化双语句对形成方法及其形成装置
CN114881000B (zh) 应用于电力行业的巡视数据采集方法
Sinha Computer Processing of Indian Languages and Scripts—Potentialities & Problems
Imoto et al. A multi modal supporting tool for multi lingual communication by inducing partner's reply
JP2013175136A (ja) トレース支援装置、トレース支援システム、トレース支援方法、およびトレース支援プログラム
JP3877975B2 (ja) キーボードレス入力装置とその方法及びこの方法の実行プログラムとその記録媒体
CN113867547A (zh) 文本处理方法、装置及电子设备
CN1361469A (zh) 单手操作键盘及其操作法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1047640

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MATSUSHITA ELECTRIC (AMERICA) INTELLECTUAL PROPERT

Free format text: FORMER OWNER: MATSUSHITA ELECTRIC INDUSTRIAL CO, LTD.

Effective date: 20140721

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20140721

Address after: California, USA

Patentee after: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

Address before: Japan Osaka

Patentee before: Matsushita Electric Industrial Co.,Ltd.

CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20100428