CN101770463A - 利用语音输入进行查询与翻译的电子装置及方法 - Google Patents
利用语音输入进行查询与翻译的电子装置及方法 Download PDFInfo
- Publication number
- CN101770463A CN101770463A CN200810188890A CN200810188890A CN101770463A CN 101770463 A CN101770463 A CN 101770463A CN 200810188890 A CN200810188890 A CN 200810188890A CN 200810188890 A CN200810188890 A CN 200810188890A CN 101770463 A CN101770463 A CN 101770463A
- Authority
- CN
- China
- Prior art keywords
- vocabulary
- pairing
- database
- voice
- electronic installation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
本发明公开了一种利用语音输入进行查询与翻译的电子装置及方法,依使用者输入的语音信号进行文字翻译与查询,并显示结果;电子装置包括语音处理模块、语音数据库、关联数据库、查询模块、显示单元。语音处理模块接收语音信号,并转换为音频信号;语音数据库储存词汇及其对应语音信号、音频信号与翻译数据;关联数据库储存词汇及其对应关联词汇,并依词汇的音标为索引;查询模块将音频信号于语音数据库中查询得目标音频信号、及其对应的目标词汇,并依目标词汇于关联数据库中查询对应的关联词汇;显示单元显示关联词汇及其于语音数据库对应的翻译数据。
Description
技术领域
本发明关于一种具有查询与翻译的电子装置,特别是一种利用语音输入进行查询与翻译的电子装置。
背景技术
具有翻译功能的电子装置是一种愈来愈受欢迎的电子产品。当使用者遇到不了解的单字时,利用电子装置的翻译功能,使用者可以迅速地了解此单字的发音、意义、时态、词组、反义字、例句等等。使用者在计算机中执行翻译软件来进行查找释义的动作,或者另外一种方式便是利用具有语言辞典的可携式电子装置(例如电子辞典或语言翻译机),来进行查找。其中,目前查询的作法都是以使用者输入的字母为依据,然后于列出以此些字母为首的串行。使用者可于串行选择欲查询的单字。以creation为例,当使用者依序输入creat时,此时会出现creat为首的串行,如create、creatin、creatine、creatinine、creation…等等,此时使用者可以选择creation继续查询。若使用者不清楚creation的完整拼字且于其中一字母输入错误,如crate时,此时出现crate为首的串行中就不会出现creation的单字。此时使用者需要经过多次的检查与尝试,才可以查询到正确的单字,而造成使用者于操作上面诸多不便。
发明内容
鉴于以上的问题,本发明提供一种利用语音输入进行查询与翻译的电子装置,以根据使用者所输入的语音信号进行文字翻译与查询,并将结果显示于电子装置。
因此,本发明所公开的一种利用语音输入进行查询与翻译的电子装置,包括有语音处理模块、语音数据库、关联数据库、查询模块与显示单元。语音处理模块,用以接收语音信号,并将语音信号转换为音频信号;语音数据库,用以储存数笔词汇及数笔词汇所对应的语音信号、音频信号、翻译数据;关联数据库,用以储存数笔词汇及数笔词汇所对应的关联词汇,其中关联数据库依据数笔词汇的音标为关联索引;查询模块,连结于语音处理模块、语音数据库、与关联数据库,查询模块用以将音频信号语音数据库中查询以得目标音频信号、与目标音频信号所对应的目标词汇,并依查询得的目标词汇于关联数据库中查询对应的关联词汇;显示单元,连结于查询模块,用以显示关联词汇及关联词汇于语音数据库所对应的翻译数据。
其中,电子装置更可包括:信号接收单元与发声单元。信号接收单元连结于显示单元,用以接收于显示单元中的关联词汇其中的一被外部选择的选择词汇;发声单元连结于信号接收单元,用以播放选择词汇于语音数据库中所对应的语音信号。
另外,上述所述的词汇的音标为其所对应的音节的元音。
此外,上述所述的词汇的音标为其所对应的音节的子音。
本发明还公开了一种利用语音输入进行查询与翻译的方法,应用于电子装置,并依使用者所输入的语音信号进行文字翻译与查询,并将结果显示于电子装置。
为达上述目的,本发明所公开的一种利用语音输入进行查询与翻译的方法,包括以下步骤:接收由外部输入的语音信号;转换接收的语音信号为音频信号;于语音数据库中查询音频信号所对应的目标音频信号,及目标音频信号所对应的目标词汇;于关联数据库中查询目标词汇所对应的关联词汇,其中目标词汇与关联词汇的对应关系是依据目标词汇的音标为关联索引;以及于电子装置的显示单元显示目标词汇、关联词汇、及关联词汇在语音数据库中所对应的翻译数据。
其中,于电子装置的显示单元显示的步骤后,更可包括:于显示单元中接收关联词汇其中的一被外部选择的选择词汇;以及播放选择词汇于语音数据库中所对应的语音信号。
另外,上述所述的目标词汇的音标为其所对应的音节的元音。
此外,上述所述的目标词汇的音标为其所对应的音节的子音。
根据本发明所提供的的利用语音输入进行查询与翻译的电子装置,可根据使用者所输入的语音信号进行文字翻译与查询,并将结果显示于电子装置。让使用者可以根据语音输入的方式进行查询,并列出与输入语音信号的音标相关联的关联词汇让使用者选择。并可依据选择的关联词汇进行语音相似度比对与发音练习。
附图说明
图1为依据本发明的一实施例的结构示意图;
图2为依据本发明的一实施例的以元音作为关联索引的流程图;
图3为依据本发明的一实施例的播放语音的流程图;
图4为依据本发明的一实施例的语音相似度辨识的流程图;
图5为依据本发明的另一实施例的以子音作为关联索引的流程图;
图6为依据本发明的另一实施例的播放语音的流程图;
图7为依据本发明的另一实施例的语音相似度辨识的流程图。
其中,附图标记:
100 电子装置 110 语音处理模块
120 语音数据库 130 关联数据库
140 查询模块 150 显示单元
160 信号接收单元 170 发声单元
具体实施方式
根据本发明所公开的利用语音输入进行查询与翻译的电子装置。其中所述的电子装置包括但不局限于具语音输入的平板计算机、具语音输入的笔记型计算机、具语音输入的掌上型计算机、具语音输入的行动电话、或具语音输入的电子翻译机等电子装置,但本领域的技术人员应可应用于其它电子装置中。
请参考图1所示,为依据本发明的一实施例的结构示意图。本发明所公开的一种利用语音输入进行查询与翻译的电子装置100。电子装置100根据使用者所输入的语音信号进行文字翻译与查询,并将结果显示于电子装置100。电子装置100包括有:语音处理模块110、语音数据库120、关联数据库130、查询模块140与显示单元150。
其中,语音处理模块110接收语音信号,并将语音信号转换为音频信号。语音数据库120储存数笔词汇及数笔词汇所对应的语音信号、音频信号、翻译数据。关联数据库130储存数笔词汇及数笔词汇所对应的关联词汇,其中关联数据库130系依据数笔词汇的音标为关联索引。查询模块140连结于语音处理模块110、语音数据库120、与关联数据库130。查询模块140用以将音频信号于语音数据库120中查询以得目标音频信号、与目标音频信号所对应的目标词汇,并依查询得的目标词汇于关联数据库130中查询对应的关联词汇。以及显示单元150连结于查询模块140,用以显示关联词汇及关联词汇于语音数据库120所对应的翻译数据。
另外,电子装置100更可包括有:信号接收单元160与发声单元170。信号接收单元160连结于显示单元150,用以接收于显示单元150中关联词汇其中的一被外部选择的选择词汇。以及发声单元170连结于信号接收单元160与语音数据库120,用以播放选择词汇于语音数据库120中所对应的语音信号。
此外,上述所述的词汇的音标为其所对应的音节的元音。一般而言以较常发错音的元音作为关联索引的依据,例如,长音的a(/e/)、短音的a(/a/)与短音的a(/ε/)。
最后,上述所述的词汇的音标为其所对应的音节的子音。一般而言以较常发错音的子音作为关联索引的依据,例如,有声子音的b(/b/)、无声子音的p(/p/)。
请参考图2所示,为依据本发明的一实施例的以元音作为关联索引的流程图。在此,为方便说明在此以英文tape(/tep/)作为说明。
首先,电子装置接收由外部输入的语音信号tape(/tep/)(步骤S210)。然后,转换接收的语音信号为音频信号(步骤S220)。于语音数据库中查询音频信号所对应的目标音频信号,及目标音频信号所对应的目标词汇tape(步骤S230)。于关联数据库中查询目标词汇tape所对应的关联词汇(步骤S240),其中依据目标词汇tape(/tep/)的音标的元音a(/e/)的为索引,其对应关联词汇有tape(/tep/)、top(/tap/)。于电子装置的显示单元显示目标词汇、关联词汇、及关联词汇在语音数据库中所对应的翻译数据(步骤S250)。其中目标词汇为tape,关联词汇为tap、tape与top,关联词汇所对应的翻译数据为tap-轻拍、tape-带子与top-上方。
其中,于步骤S250之后,可包括以下实施步骤。
请参考图3所示,为依据本发明的一实施例的播放语音的流程图。首先,接收关联词汇其中之一被外部选择的选择词汇(步骤S252),在此,为方便说明在此假设top为被外部选择的选择词汇。然后,播放选择词汇于语音数据库中所对应的语音信号top(/tap/)(步骤S254)。
另外,依据本发明的一实施例的以元音作为关联索引更可应用于音频相似度辨识,进而让使用者进行发音练习。
请参考图4所示,为依据本发明的一实施例的语音相似度辨识的流程图。在此,为方便说明在此以英文tape作为输入语音信号,top作为预选音频信号,其音频相似度80%。
首先,电子装置接收由外部输入的输入语音信号(步骤S310)。转换接收的输入语音信号为输入音频信号(步骤S320)。比较输入音频信号tape(/tep/)与预选音频信号top(/tap/)的音频相似度(步骤S330)。显示音频相似度80%于显示单元(步骤S340)。播放在语音数据库中预选音频信号所对应的语音信号(步骤S350)。其中,使用者可反复执行上述步骤S310至步骤S350,进而可达到发音练习的目的。另外,若使用者发出的输入音频信号为top时,则输入音频信号top(/tap/)与预选音频信号top(/tap/)的音频相似度即为100%。
另外,请参考图5所示,为依据本发明的另一实施例的以子音作为关联索引的流程图。在此,为方便说明在此以英文cop(/kap/)作为说明。
首先,电子装置接收由外部输入的语音信号cop(/kap/)(步骤S410)。然后,转换接收的语音信号为音频信号(步骤S420)。于语音数据库中查询音频信号所对应的目标音频信号,及目标音频信号所对应的目标词汇cop(步骤S430)。于关联数据库中查询目标词汇cop所对应的关联词汇(步骤S440),其中依据目标词汇cop(/kap/)的音标的子音p(/p/)的为索引,其对应关联词汇有cob(/kab/)、cop(/kap/)。于电子装置的显示单元显示目标词汇、关联词汇、及关联词汇在语音数据库中所对应的翻译数据(步骤S450)。其中目标词汇为cop,关联词汇为cob与cop,关联词汇所对应的翻译资料为cob-玉米穗轴与cop-警察。
其中,于步骤S450之后,可包括以下实施步骤。
请参考图6所示,为依据本发明的另一实施例的播放语音的流程图。首先,接收关联词汇其中的一被外部选择的选择词汇(步骤S452),在此,为方便说明在此假设cob为被外部选择的选择词汇。然后,播放选择词汇于语音数据库中所对应的语音信号cob(/kab/)(步骤S454)。
另外,依据本发明的一实施例的以元音作为关联索引更可应用于音频相似度辨识,进而让使用者进行发音练习。
请参考图7所示,为依据本发明的另一实施例的语音相似度辨识的流程图。在此,为方便说明在此以英文cop作为输入语音信号,cob作为预选音频信号,其音频相似度90%。
首先,电子装置接收由外部输入的输入语音信号(步骤S510)。转换接收的输入语音信号为输入音频信号(步骤S520)。比较输入音频信号cop(/kap/)与预选音频信号cob(/kab/)的音频相似度(步骤S530)。显示音频相似度90%于显示单元(步骤S540)。播放在语音数据库中预选音频信号所对应的语音信号(步骤S550)。其中,使用者可反复执行上述步骤S510至步骤S550,进而可达到发音练习的目的。另外,若使用者发出的输入音频信号为cob时,则输入音频信号cob(/kab/)与预选音频信号cob(/kab/)的音频相似度即为100%。
此外,以下列表一作为本发明一实施例与另一实施例中的关联数据库。其中关联词汇1、关联词汇2与关联词汇3为与目标的元音与子音作为关联索引,其中所列举的项次与字段可以是但并不局限于此些项次与字段。
表一
于本第一实施例与第二实施例中,虽分别以输入语音的音标音节的元音与子音作为说明。但在实际应用于语音输入进行查询与翻译的电子装置与方法中,可以依据不同的发音音节、单元音、双元音、有声子音、无声子音或多发音音节等等作为关系数据库中的关联索引。
根据本发明所提供的的利用语音输入进行查询与翻译的电子装置,可根据使用者所输入的语音信号进行文字翻译与查询,并将结果显示于电子装置。让使用者可以根据语音输入的方式进行查询,并列出与输入语音信号的音标相关联的关联词汇让使用者选择。并可依据选择的关联词汇进行语音相似度比对与发音练习。
Claims (8)
1.一种利用语音输入进行查询与翻译的电子装置,根据使用者所输入的一语音信号进行文字翻译与查询,并将结果显示于该电子装置,其特征在于,该电子装置包括:
一语音处理模块,用以接收该语音信号,并将该语音信号转换为一音频信号;
一语音数据库,用以储存多笔词汇及该些词汇所对应的语音信号、音频信号与翻译数据;
一关联数据库,用以储存多笔词汇及该些词汇所对应的关联词汇,其中该关联数据库依据该些词汇的音标为关联索引;
一查询模块,连结于该语音处理模块、该语音数据库、与该关联数据库,该查询模块用以将该音频信号于该语音数据库中查询以得一目标音频信号、一与该目标音频信号所对应的目标词汇,并依查询得的该目标词汇于该关联数据库中查询对应的至少一关联词汇;以及
一显示单元,连结于该查询模块,用以显示该至少一关联词汇及该至少一关联词汇于该语音数据库所对应的翻译数据。
2.如权利要求1所述的利用语音输入进行查询与翻译的电子装置,其特征在于,该电子装置还包括:
一信号接收单元,连结于该显示单元,用以接收于该显示单元中该至少一关联词汇中的被外部选择的一选择词汇;以及
一发声单元,连结于该信号接收单元与该语音数据库,用以播放该选择词汇于该语音数据库中所对应的语音信号。
3.如权利要求1所述的利用语音输入进行查询与翻译的电子装置,其特征在于,所述的该些词汇的音标为其所对应的音节的元音。
4.如权利要求1所述的利用语音输入进行查询与翻译的电子装置,其特征在于,所述的该些词汇的音标为其所对应的音节的子音。
5.一种利用语音输入进行查询与翻译的方法,应用于一电子装置,并依使用者所输入的一语音信号进行文字翻译与查询,并将结果显示于该电子装置,其特征在于,该方法包括:
接收由外部输入的一语音信号;
转换接收的该语音信号为一音频信号;
于一语音数据库中查询该音频信号所对应的一目标音频信号,及该目标音频信号所对应的一目标词汇;
于一关联数据库中查询该目标词汇所对应的至少一关联词汇,其中该目标词汇与该至少一关联词汇的对应关系是依据该目标词汇的音标为关联索引;以及
于该电子装置的一显示单元显示该目标词汇、该至少一关联词汇、及该至少一关联词汇在该语音数据库中所对应的翻译数据。
6.如权利要求5所述的利用语音输入进行查询与翻译的方法,其特征在于,于该电子装置的该显示单元显示的步骤后,还包括:
于该显示单元中接收该至少一关联词汇中的被外部选择的一选择词汇;以及
播放该选择词汇于该语音数据库中所对应的语音信号。
7.如权利要求5所述的利用语音输入进行查询与翻译的方法,其特征在于,所述的该目标词汇的音标为其所对应的音节的元音。
8.如权利要求5所述的利用语音输入进行查询与翻译的方法,其特征在于,所述的该目标词汇的音标为其所对应的音节的子音。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810188890A CN101770463A (zh) | 2008-12-30 | 2008-12-30 | 利用语音输入进行查询与翻译的电子装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810188890A CN101770463A (zh) | 2008-12-30 | 2008-12-30 | 利用语音输入进行查询与翻译的电子装置及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101770463A true CN101770463A (zh) | 2010-07-07 |
Family
ID=42503329
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200810188890A Pending CN101770463A (zh) | 2008-12-30 | 2008-12-30 | 利用语音输入进行查询与翻译的电子装置及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101770463A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102541505A (zh) * | 2011-01-04 | 2012-07-04 | ***通信集团公司 | 语音输入方法及其*** |
CN107193389A (zh) * | 2016-03-14 | 2017-09-22 | 中兴通讯股份有限公司 | 一种实现输入的方法和装置 |
CN110472254A (zh) * | 2019-08-16 | 2019-11-19 | 深圳传音控股股份有限公司 | 语音翻译方法、通信终端、及计算机可读存储介质 |
-
2008
- 2008-12-30 CN CN200810188890A patent/CN101770463A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102541505A (zh) * | 2011-01-04 | 2012-07-04 | ***通信集团公司 | 语音输入方法及其*** |
CN107193389A (zh) * | 2016-03-14 | 2017-09-22 | 中兴通讯股份有限公司 | 一种实现输入的方法和装置 |
CN110472254A (zh) * | 2019-08-16 | 2019-11-19 | 深圳传音控股股份有限公司 | 语音翻译方法、通信终端、及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7720682B2 (en) | Method and apparatus utilizing voice input to resolve ambiguous manually entered text input | |
CN111710333B (zh) | 用于生成语音转录的方法和*** | |
Arisoy et al. | Turkish broadcast news transcription and retrieval | |
CN103578467B (zh) | 声学模型的建立方法、语音辨识方法及其电子装置 | |
KR101581816B1 (ko) | 기계학습을 이용한 음성인식방법 | |
CN111415656B (zh) | 语音语义识别方法、装置及车辆 | |
US20120179694A1 (en) | Method and system for enhancing a search request | |
US20080130699A1 (en) | Content selection using speech recognition | |
CN109637537B (zh) | 一种自动获取标注数据优化自定义唤醒模型的方法 | |
KR20050014738A (ko) | 표음 입력 모호성 제거 시스템 및 방법 | |
EP3736807A1 (en) | Apparatus for media entity pronunciation using deep learning | |
CN103578464A (zh) | 语言模型的建立方法、语音辨识方法及电子装置 | |
CN101309327A (zh) | 语音聊天***、信息处理装置、话语识别和关键字检测 | |
US8583417B2 (en) | Translation device and computer program product | |
JP2011505027A (ja) | データベース内の文書をインデックス付け及び検索するための、コンピュータで実施される方法、及び情報検索システム | |
CN101415259A (zh) | 嵌入式设备上基于双语语音查询的信息检索***及方法 | |
US20070288240A1 (en) | User interface for text-to-phone conversion and method for correcting the same | |
US20090192991A1 (en) | Network information searching method by speech recognition and system for the same | |
JP2008287210A (ja) | 音声チャットシステム、情報処理装置、音声認識方法およびプログラム | |
CN102970618A (zh) | 基于音节识别的视频点播方法 | |
CN101770463A (zh) | 利用语音输入进行查询与翻译的电子装置及方法 | |
US7359858B2 (en) | User interface for data access and entry | |
JP2019082981A (ja) | 異言語間コミュニケーション支援装置及びシステム | |
US20080162144A1 (en) | System and Method of Voice Communication with Machines | |
KR20110017600A (ko) | 전자사전에서 음성인식을 이용한 단어 탐색 장치 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20100707 |