CN107515860A - 一种基于神经元的机器翻译方法 - Google Patents

一种基于神经元的机器翻译方法 Download PDF

Info

Publication number
CN107515860A
CN107515860A CN201710664397.8A CN201710664397A CN107515860A CN 107515860 A CN107515860 A CN 107515860A CN 201710664397 A CN201710664397 A CN 201710664397A CN 107515860 A CN107515860 A CN 107515860A
Authority
CN
China
Prior art keywords
server
translation
fpga
method based
gpu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710664397.8A
Other languages
English (en)
Inventor
王晓东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Global Tone Communication Technology Qingdao Co Ltd
Original Assignee
Global Tone Communication Technology Qingdao Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Global Tone Communication Technology Qingdao Co Ltd filed Critical Global Tone Communication Technology Qingdao Co Ltd
Priority to CN201710664397.8A priority Critical patent/CN107515860A/zh
Publication of CN107515860A publication Critical patent/CN107515860A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)

Abstract

本发明提供一种基于神经元的机器翻译方法,包括:服务器接受翻译请求;服务器将翻译请求发送至资源调度模块;资源调度模块根据资源的占用情况将翻译请求发送至相对空闲的处理器;处理器输出翻译结果;服务器对不同的处理器输出的翻译结果进行合并。本发明采用GPU+FPGA+CPU的联合服务模式,可以有效缓解单CPU或单FPGA的压力,通过服务器的CPU调配硬件资源,实现负载均衡,优化服务器的翻译效率。

Description

一种基于神经元的机器翻译方法
技术领域
本发明涉及神经元机器翻译技术领域。
背景技术
神经元机器翻译引擎自问世以来,一直都是人工智能领域的热点之一,由于它仍处于高速发展期,暂时还不能像统计型机器翻译引擎一样高效、稳定。目前,神经元网络分类和用途各有不同,但总体来说对神经元机器翻译引擎的研究侧重于深度学习部分,而由于其解码时间较长,商用难度较大。
发明内容
本发明所要解决的技术问题是提供一种基于神经元的机器翻译方法,能自动合理分配资源,提高翻译效率。
本发明解决技术问题所采用的技术方案是:一种基于神经元的机器翻译方法,包括以下步骤:
(1)服务器接受翻译请求;
(2)服务器将翻译请求发送至资源调度模块;
(3)资源调度模块根据资源的占用情况将翻译请求发送至相对空闲的处理器;
(4)处理器输出翻译结果;
(5)服务器对不同的处理器输出的翻译结果进行合并。
进一步地,服务器所接收到的翻译请求被处理为符合翻译引擎格式的字符串。
进一步地,处理器包括FPGA/GPU处理器和服务器的CPU处理器。
进一步地,翻译模型被存储在FPGA/GPU的显存以及服务器的内存中。
进一步地,资源调度模块的分配原则是:如存在空闲的FPGA/GPU资源,则优先采用FPGA/GPU进行解码,如无空闲的FPGA/GPU资源,则优先采用CPU进行解码,无论采用哪种方式,字符串都将被送入翻译模型中进行翻译。
本发明的有益效果是:本发明采用GPU+FPGA+CPU的联合服务模式,可以有效缓解单CPU或单FPGA的压力,通过服务器的CPU调配硬件资源,实现负载均衡,优化服务器的翻译效率。
附图说明
图1是本发明的流程图。
具体实施方式
在介绍实施例之前,首先对本发明所涉及到的专业术语进行解释如下:
FPGA:FPGA(Field-Programmable Gate Array),即现场可编程门阵列,它是在PAL、GAL、CPLD等可编程器件的基础上进一步发展的产物。它是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。
GPU:图形处理器(英语:Graphics Processing Unit,缩写:GPU),又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上图像运算工作的微处理器。
CPU:中央处理器(CPU,Central Processing Unit)是一块超大规模的集成电路,是一台计算机的运算核心(Core)和控制核心( Control Unit)。它的功能主要是解释计算机指令以及处理计算机软件中的数据。
如图1所示,本发明的机器翻译方法具体包括以下步骤:
1)服务器接收到某一翻译请求A,
该翻译请求A已经由其他***处理为符合翻译引擎格式的字符串A1,A2..An。
2)服务器将该字符串送入资源调度模块,由资源调度模块以决定由哪个或哪些单元来处理。
3)资源调度模块根据FPGA/GPU的资源情况,决定是否优先采用FPGA/GPU作为解码方式:
根据资源调度规则,以FPGA/GPU为先,其翻译模型存在于每个FPGA/GPU的显存以及服务器内存中,无论采用以下哪种方式,字符串An都会被送入翻译模型中进行翻译。
①若有空闲FPGA/GPU资源,则优先采用FPGA/GPU进行解码。
②若无空闲FPGA/GPU资源,则采用CPU进行解码。
按照这样的方式,对于一串字符串A1,A2..An很大可能是FPGA/GPU和CPU同时处理,在这种情况下,需要将翻译结果进行合并,因此,在翻译完成后,FPGA/GPU和CPU会统一将翻译结果输出给服务器。
4)服务器将FPGA/GPU和CPU中的翻译结果进行合并,输出此次翻译请求的结果。

Claims (5)

1.一种基于神经元的机器翻译方法,其特征是,包括以下步骤:
(1)服务器接受翻译请求;
(2)服务器将翻译请求发送至资源调度模块;
(3)资源调度模块根据资源的占用情况将翻译请求发送至相对空闲的处理器;
(4)处理器输出翻译结果;
(5)服务器对不同的处理器输出的翻译结果进行合并。
2.根据权利要求1所述的一种基于神经元的机器翻译方法,其特征是,服务器所接收到的翻译请求被处理为符合翻译引擎格式的字符串。
3.根据权利要求2所述的一种基于神经元的机器翻译方法,其特征是,处理器包括FPGA/GPU处理器和服务器的CPU处理器。
4.根据权利要求3所述的一种基于神经元的机器翻译方法,其特征是,翻译模型被存储在FPGA/GPU的显存以及服务器的内存中。
5.根据权利要求4所述的一种基于神经元的机器翻译方法,其特征是,资源调度模块的分配原则是:如存在空闲的FPGA/GPU资源,则优先采用FPGA/GPU进行解码,如无空闲的FPGA/GPU资源,则优先采用CPU进行解码,无论采用哪种方式,字符串都将被送入翻译模型中进行翻译。
CN201710664397.8A 2017-08-07 2017-08-07 一种基于神经元的机器翻译方法 Pending CN107515860A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710664397.8A CN107515860A (zh) 2017-08-07 2017-08-07 一种基于神经元的机器翻译方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710664397.8A CN107515860A (zh) 2017-08-07 2017-08-07 一种基于神经元的机器翻译方法

Publications (1)

Publication Number Publication Date
CN107515860A true CN107515860A (zh) 2017-12-26

Family

ID=60721937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710664397.8A Pending CN107515860A (zh) 2017-08-07 2017-08-07 一种基于神经元的机器翻译方法

Country Status (1)

Country Link
CN (1) CN107515860A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110400249A (zh) * 2019-07-23 2019-11-01 杨勇 一种基于cpu的图像处理方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567312A (zh) * 2011-12-30 2012-07-11 北京理工大学 一种基于分布式并行计算框架的机器翻译方法
CN102662639A (zh) * 2012-04-10 2012-09-12 南京航空航天大学 一种基于Mapreduce的多GPU协同计算方法
WO2012141677A1 (en) * 2011-04-11 2012-10-18 Hewlett-Packard Development Company, L.P. Performing a task in a system having different types of hardware resources
CN102857565A (zh) * 2012-09-03 2013-01-02 重庆邮电大学 一种基于云计算的智能试衣***
CN102982678A (zh) * 2012-11-28 2013-03-20 青岛海信网络科技股份有限公司 交通数据信息服务***及实现交通数据信息服务的方法
CN103197976A (zh) * 2013-04-11 2013-07-10 华为技术有限公司 异构***的任务处理方法及装置
CN106155635A (zh) * 2015-04-03 2016-11-23 北京奇虎科技有限公司 一种数据处理方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012141677A1 (en) * 2011-04-11 2012-10-18 Hewlett-Packard Development Company, L.P. Performing a task in a system having different types of hardware resources
CN102567312A (zh) * 2011-12-30 2012-07-11 北京理工大学 一种基于分布式并行计算框架的机器翻译方法
CN102662639A (zh) * 2012-04-10 2012-09-12 南京航空航天大学 一种基于Mapreduce的多GPU协同计算方法
CN102857565A (zh) * 2012-09-03 2013-01-02 重庆邮电大学 一种基于云计算的智能试衣***
CN102982678A (zh) * 2012-11-28 2013-03-20 青岛海信网络科技股份有限公司 交通数据信息服务***及实现交通数据信息服务的方法
CN103197976A (zh) * 2013-04-11 2013-07-10 华为技术有限公司 异构***的任务处理方法及装置
CN106155635A (zh) * 2015-04-03 2016-11-23 北京奇虎科技有限公司 一种数据处理方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110400249A (zh) * 2019-07-23 2019-11-01 杨勇 一种基于cpu的图像处理方法

Similar Documents

Publication Publication Date Title
CN112784989B (zh) 推理***、推理方法、电子设备及计算机存储介质
CN109508316A (zh) 异构计算环境的设备和***
CN110650347B (zh) 多媒体数据的处理方法及装置
WO2022042113A1 (zh) 数据处理方法、装置、电子设备及存储介质
CN113079216B (zh) 一种云应用的实现方法、装置、电子设备及可读存储介质
CN111490946B (zh) 基于OpenCL框架的FPGA连接实现方法及装置
CN114281521B (zh) 优化深度学习异构资源通信效率方法、***、设备及介质
EP3779690A1 (en) Processor core scheduling method and apparatus, terminal, and storage medium
US20220004873A1 (en) Techniques to manage training or trained models for deep learning applications
CN111340243B (zh) 用于联盟学习的方法、装置及联盟学习***
WO2021108122A1 (en) Hierarchical partitioning of operators
CN115244511A (zh) 分布式计算流水线处理
CN104142907A (zh) 增强型处理器、处理方法和电子设备
CN113574656A (zh) 一种数据处理装置及方法
CN107515860A (zh) 一种基于神经元的机器翻译方法
CN109509139A (zh) 顶点数据处理方法、装置及设备
KR101620896B1 (ko) 이기종 프로세싱 타입을 고려한 맵리듀스 프로그램 모델의 수행 성능 향상 방법, 수행 성능 향상 장치 및 수행 성능 향상 시스템
CN116244231A (zh) 一种数据传输方法、装置、***、电子设备及存储介质
CN106126342A (zh) 面向智能机器人的多程序运行方法及操作***
CN114003238B (zh) 一种基于转码卡的容器部署方法、装置、设备及存储介质
CN105046638A (zh) 处理器***及其图像数据处理方法
CN105138392B (zh) 一种带宽控制方法及电子设备
EP4148627A1 (en) Neural network scheduling method and apparatus
CN110036621A (zh) 跨窄链路压缩频繁数据值
Ichinose et al. Pipeline-based processing of the deep learning framework caffe

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171226