CN1441402A - 跨语种语音信息交流方法 - Google Patents
跨语种语音信息交流方法 Download PDFInfo
- Publication number
- CN1441402A CN1441402A CN03116162A CN03116162A CN1441402A CN 1441402 A CN1441402 A CN 1441402A CN 03116162 A CN03116162 A CN 03116162A CN 03116162 A CN03116162 A CN 03116162A CN 1441402 A CN1441402 A CN 1441402A
- Authority
- CN
- China
- Prior art keywords
- agent
- translation
- information
- user
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
一种跨语种语音信息交流方法属于信息技术领域。本发明以Agent技术为基础,接受用户的语音信息,用户交互Agent解析用户提出的语音信息和翻译方案,将结果提交给语音服务器和翻译平台,用户通过语音识别Agent,进行语音信息的处理,翻译Agent根据提供的语义信息和语种信息,识别出合理的翻译方案或者根据用户指定的翻译方案进行处理,并处理和各种翻译服务之间的交互过程,通过信息交互Agent将结果提交给信息传输目的地,由那里的语音表示Agent实现语义信息的语音表达,最后由接收者参与对反馈知识信息库的更新和迭代处理,至此语音信息传播完成。本发明能动态提高翻译质量,处理速度得到了有效的提高,实现了翻译反馈,从而实现多语言跨文化语音信息的交流。
Description
技术领域
本发明设计的是一种网络信息交互方法,特别是一种跨语种语音信息交流方法,属于信息技术领域。
背景技术
随着Internet的发展,Web信息的数量迅速增长,然而各国文化和语言的差异,导致信息的交流存在很大的问题。网络用户往往会受到语言的限制,由于信息所基于的语言和文化的不同,在Internet上形成许多“信息孤岛”,其中每一部分的信息都是不全面的,进而还会导致岛间的信息交流存在很大的障碍,特别是语音的交流存在更大的障碍。国内外专家各学者们提出了很多跨语种网络交流方法,经文献检索发现,日本京都大学在ICE2002实验中实现的TransBBS***(ICE2002 Site,http://ice2002.kuis.kyoto-u.ac.jp)实现了多语种跨文化交流方法,可以支持日韩中马英5种语言的交流。该***已经代表了这个领域的最前沿研究成果。然而却同样存在很多不足:(1)只能提供单一翻译引擎和搜索源的支持,不能动态提高翻译质量。(2)处理速度过慢,无法进行语音级别的交流,而只能实现基于文字的交流。(3)无法保留用户信息,不能实现翻译反馈,使交流过程中的错误无法得到修正,导致信息交流始终存在较大的障碍。
发明内容
本发明的目的在于克服现有技术的不足,提供一种跨语种语音信息交流方法,将原有方式提升到语音的层面来进行研究和设计,使其有助于基于Web和Agent的多语言跨文化语音信息交流的实现。
本发明是通过以下技术方案实现的,本发明以Agent技术为基础,接受用户的语音信息,由用户交互Agent,语音识别Agent,翻译Agent,信息交互Agent,语音表示Agent和多级知识数据库完成“语音识别----翻译过程----信息交互----语音表示---翻译反馈”过程。首先,用户交互Agent解析用户提出的语音信息和翻译方案,将结果提交给语音服务器和翻译平台,用户通过语音识别Agent,进行语音信息的处理,翻译Agent根据提供的语义信息和语种信息,识别出合理的翻译方案或者根据用户指定的翻译方案进行处理,并处理和各种翻译服务之间的交互过程,通过信息交互Agent将结果提交给信息传输目的地,由那里的语音表示Agent实现语义信息的语音表达,最后由接收者参与对反馈知识信息库的更新和迭代处理,这样一次完整的语音信息传播便完成了。
以下对本发明作进一步的描述,具体内容如下:
(1)语音识别过程如下:
①用户在用户交互Agent提供的界面上进行语音信息的录入;
②由语音识别Agent进行独立用户的语音信息库的建立;
③语音识别Agent将用户的语音信息进行有效的识别,将产生的语义信息和语种传递给翻译Agent,由翻译Agent进行有效的语义翻译。
(2)翻译过程具体如下:
①语义信息经由翻译Agent接口传入,翻译方案可选择性地从用户交互Agent处获得;
②翻译方案由翻译Agent根据内容语种决定或由用户指定,调用翻译服务;
③翻译Agent将翻译结果传递信息交互Agent。
(3)信息交互过程如下:
①信息交互Agent接收到由翻译Agent传入的语义信息;
②根据信息源和信息目标进行绑定,提高后期的信息交流效率。
(4)语音表示过程如下:
①利用本地的母语信息,将语义信息用语音形式表现出来,便于用户交流;
②用户选择合适的语音表示Agent完成语音表示。
③本地知识库将保留用户的语音表示信息。
(5)翻译反馈过程如下:
①用户对最终接受到的语音信息进行相关评价,通过用户交互Agent,对翻译错误或者语音表示错误进行记录。
②在本地知识库保留①中的反馈信息,进行更新和迭代处理,将有效且正确的结果提交到中央服务器,优化后期的翻译交流效果。
其中涉及到的语音交流效果的关键是速度问题,在这个问题上,本发明用多种方法加以弥补,得到了有效的提高。首先,翻译Agent会将翻译平均任务分配给各翻译源,以减少瓶颈的出现;其次,采用分布式***,降低单机过载的可能性;在用户交流使用的过程中,***会根据语音数据库和翻译数据库进行有效的自学习,逐渐加快***的处理速度并提高服务的有效性。
本发明具有实质性特点和显著进步,本发明是一种基于语音识别,跨语种信息交流等多种新型技术相结合的跨文化交流方法,克服了现有技术的不足,改变了单一翻译引擎的支持的状况,能动态提高翻译质量;可以方便进行语音级别的交流,处理速度得到了有效的提高;实现了翻译反馈,交流过程中的错误可以方便地修正,从而实现多语言跨文化语音信息的交流。
具体实施方式
结合本发明的内容提供实施例,具体如下:
考虑到语音信息的特殊性,基于本发明方法运用的***由语音客户平台,翻译平台,语音服务器和信息交互服务器。根据Agent的职能不同,***结构中涉及了四种不同的单元,分别部署相应的Agent以及相关的软件。其中,语音客户平台是直接面对用户的界面,它将会和语音识别Agent发生通讯,并且在本机建立语音知识库,以便于优化语音识别效果;翻译平台是翻译Agent的部署单元,它将从语音客户平台处获得语义信息,动态选择翻译源,并将目标语义信息反馈给客户平台;语音服务器是部署语音识别Agent的单元,它将从语音客户平台处获得用户的语音信号及信息,将执行语音处理识别并协助其建立和用户相关的语音数据库;信息交互服务器是执行远程语义信息交互的平台,是沟通各Agent和各用户的枢纽。
实施例过程:语音客户平台要求新用户初始化语音数据库,接受信息,便于后期工作;当初始化完成后,语音客户平台才开始工作,将处理过的语义信息通过网络传给翻译平台,由它来动态选择翻译代理,完成翻译;翻译平台完成翻译后将结构回传给语音客户平台,由语音客户平台与语音服务器发生通信,传送语义信息给目标;语义信息到达目标后,目标端的语音客户平台会把接收到的语义信息送交语音表示Agent,由它完成由语义到语音的转化;最后,由用户交互Agent选择性地接受用户的反馈信息,记录到反馈数据库中以便于迭代。这样一次完整的单工信息交流处理结束。
实施效果:本发明方法实施后,提供了多个语种的翻译源,并有语音处理代理和语音表示的支持;其次,在实施过程中,利用反馈数据库优化翻译效果,加快交互速度;最后,在实施过程中,用户交互Agent不断和用户交互,给用户提供了良好的对话环境,并有效地获得不同用户的信息。
Claims (7)
1、一种跨语种语音信息交流方法,其特征在于:以Agent技术为基础,接受用户的语音信息,由用户交互Agent,语音识别Agent,翻译Agent,信息交互Agent,语音表示Agent和多级知识数据库完成语音识别----翻译过程----信息交互----语音表示---翻译反馈过程:首先,用户交互Agent解析用户提出的语音信息和翻译方案,将结果提交给语音服务器和翻译平台,用户通过语音识别Agent,进行语音信息的处理,翻译Agent根据提供的语义信息和语种信息,识别出合理的翻译方案或者根据用户指定的翻译方案进行处理,并处理和各种翻译服务之间的交互过程,通过信息交互Agent将结果提交给信息传输目的地,由那里的语音表示Agent实现语义信息的语音表达,最后由接收者参与对反馈知识信息库的更新和迭代处理,至此完成一次完整的语音信息传播。
2、根据权利要求1所述的跨语种语音信息交流方法,其特征是,所述的语音识别过程如下:
①用户在用户交互Agent提供的界面上进行语音信息的录入;
②由语音识别Agent进行独立用户的语音信息库的建立;
③语音识别Agent将用户的语音信息进行有效的识别,将产生的语义信息和语种传递给翻译Agent,由翻译Agent进行有效的语义翻译。
3、根据权利要求1所述的跨语种语音信息交流方法,其特征是,所述的翻译过程具体如下:
①语义信息经由翻译Agent接口传入,翻译方案可选择性地从用户交互Agent处获得;
②翻译方案由翻译Agent根据内容语种决定或由用户指定,调用翻译服务;
③翻译Agent将翻译结果传递信息交互Agent。
4、根据权利要求1所述的跨语种语音信息交流方法,其特征是,所述的信息交互过程如下:
①信息交互Agent接收到由翻译Agent传入的语义信息;
②根据信息源和信息目标进行绑定,提高后期的信息交流效率。
5、根据权利要求1所述的跨语种语音信息交流方法,其特征是,所述的语音表示过程如下:
①利用本地的母语信息,将语义信息用语音形式表现出来;
②用户选择合适的语音表示Agent完成语音表示;
③本地知识库保留用户的语音表示信息。
6、根据权利要求1所述的跨语种语音信息交流方法,其特征是,所述的翻译反馈过程如下
①用户对最终接受到的语音信息进行相关评价,通过用户交互Agent,对翻译错误或者语音表示错误进行记录;
②在本地知识库保留①中的反馈信息,进行更新和迭代处理,将有效且正确的结果提交到中央服务器,优化后期的翻译交流效果。
7、根据权利要求1所述的跨语种语音信息交流方法,其特征是,通过以下方法有效提高交流速度:首先,翻译Agent将翻译任务平均分配给各翻译源,减少瓶颈的出现;其次,用户根据自己的偏好,参与选择翻译源和语音表示Agent,数据库将保留这些用户信息;此外,用户交流使用的过程中,***会根据语音数据库和翻译数据库进行有效的自学习,逐渐加快***的处理速度并提高服务的有效性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN03116162A CN1441402A (zh) | 2003-04-03 | 2003-04-03 | 跨语种语音信息交流方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN03116162A CN1441402A (zh) | 2003-04-03 | 2003-04-03 | 跨语种语音信息交流方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1441402A true CN1441402A (zh) | 2003-09-10 |
Family
ID=27770410
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN03116162A Pending CN1441402A (zh) | 2003-04-03 | 2003-04-03 | 跨语种语音信息交流方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1441402A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007121614A1 (fr) * | 2006-04-26 | 2007-11-01 | Wenhe Xu | Procédé de traduction automatisée pour la traduction d'une langue en plusieurs langues |
CN103559879A (zh) * | 2013-11-08 | 2014-02-05 | 安徽科大讯飞信息科技股份有限公司 | 语种识别***中声学特征提取方法及装置 |
CN103744834A (zh) * | 2013-12-23 | 2014-04-23 | 武汉传神信息技术有限公司 | 一种翻译任务准确分配的方法 |
CN104217100A (zh) * | 2014-07-24 | 2014-12-17 | 昆明理工大学 | 一种基于agent社会圈子网络的语言竞争模型的建模仿真方法 |
CN106933812A (zh) * | 2017-02-16 | 2017-07-07 | 牡丹江师范学院 | 一种实现网页中英文翻译的***和方法 |
CN107293297A (zh) * | 2017-06-29 | 2017-10-24 | 深圳双猴科技有限公司 | 一种一对多麦克风控制方法及*** |
CN109949795A (zh) * | 2019-03-18 | 2019-06-28 | 北京猎户星空科技有限公司 | 一种控制智能设备交互的方法及装置 |
CN117808013A (zh) * | 2024-02-29 | 2024-04-02 | 济南幼儿师范高等专科学校 | 一种互动式多语言交流*** |
-
2003
- 2003-04-03 CN CN03116162A patent/CN1441402A/zh active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007121614A1 (fr) * | 2006-04-26 | 2007-11-01 | Wenhe Xu | Procédé de traduction automatisée pour la traduction d'une langue en plusieurs langues |
CN103559879A (zh) * | 2013-11-08 | 2014-02-05 | 安徽科大讯飞信息科技股份有限公司 | 语种识别***中声学特征提取方法及装置 |
CN103559879B (zh) * | 2013-11-08 | 2016-01-06 | 安徽科大讯飞信息科技股份有限公司 | 语种识别***中声学特征提取方法及装置 |
CN103744834A (zh) * | 2013-12-23 | 2014-04-23 | 武汉传神信息技术有限公司 | 一种翻译任务准确分配的方法 |
CN103744834B (zh) * | 2013-12-23 | 2016-08-17 | 武汉传神信息技术有限公司 | 一种翻译任务准确分配的方法 |
CN104217100A (zh) * | 2014-07-24 | 2014-12-17 | 昆明理工大学 | 一种基于agent社会圈子网络的语言竞争模型的建模仿真方法 |
CN104217100B (zh) * | 2014-07-24 | 2017-02-15 | 昆明理工大学 | 一种基于agent社会圈子网络的语言竞争模型的建模仿真方法 |
CN106933812A (zh) * | 2017-02-16 | 2017-07-07 | 牡丹江师范学院 | 一种实现网页中英文翻译的***和方法 |
CN107293297A (zh) * | 2017-06-29 | 2017-10-24 | 深圳双猴科技有限公司 | 一种一对多麦克风控制方法及*** |
CN109949795A (zh) * | 2019-03-18 | 2019-06-28 | 北京猎户星空科技有限公司 | 一种控制智能设备交互的方法及装置 |
CN117808013A (zh) * | 2024-02-29 | 2024-04-02 | 济南幼儿师范高等专科学校 | 一种互动式多语言交流*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100585586C (zh) | 翻译*** | |
CN102096717B (zh) | 搜索方法及搜索引擎 | |
CN101952883B (zh) | 计算机执行的通过基于语音的用户界面与用户交互的方法 | |
EP1199630A2 (en) | Method and apparatus for performing planbased dialog | |
CN1535460A (zh) | 分级语言模型 | |
WO2002049253A2 (en) | Method and interface for intelligent user-machine interaction | |
JP2002304409A (ja) | 音声ユーザ・インターフェースを介したデータベース照会結果の提示方法およびシステム | |
CN101196900A (zh) | 一种基于元数据的信息检索方法 | |
CN1441402A (zh) | 跨语种语音信息交流方法 | |
CN110929007A (zh) | 一种电力营销知识体系平台及应用方法 | |
CN101320451A (zh) | 使用决策树的客户投诉方法 | |
CN116361367A (zh) | 一种高效发布招聘信息的内容识别***及方法 | |
CN112115244A (zh) | 对话交互方法、装置、存储介质及电子设备 | |
US20170308618A1 (en) | Alert Driven Interactive Interface to a Website Mining System | |
Stowell et al. | ‘Soft’systems thinking and information systems: a framework for client‐led design | |
CN116312505A (zh) | 一种基于自然语言处理的供应链语音识别方法 | |
EP1615124A1 (en) | A method for handling a multi-modal dialog | |
US20020129010A1 (en) | System and method for processing user input from a variety of sources | |
WO2004021177A1 (en) | Business application generation system | |
CN1427394A (zh) | 语音浏览网关 | |
CN1710856A (zh) | 一种信息交互***及其方法 | |
KR19990047859A (ko) | 도서 문헌 데이터베이스 검색을 위한 자연언어 대화 시스템 | |
JP2002197107A (ja) | 自然言語対話型システム | |
CN1750499A (zh) | 一种语音浏览*** | |
CN106940724A (zh) | 一种面向大数据的多范型融合分析处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |