CN117193960A - 任务处理方法、自动问答方法以及任务处理*** - Google Patents
任务处理方法、自动问答方法以及任务处理*** Download PDFInfo
- Publication number
- CN117193960A CN117193960A CN202310949248.1A CN202310949248A CN117193960A CN 117193960 A CN117193960 A CN 117193960A CN 202310949248 A CN202310949248 A CN 202310949248A CN 117193960 A CN117193960 A CN 117193960A
- Authority
- CN
- China
- Prior art keywords
- data
- processed
- task processing
- mode
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 386
- 238000000034 method Methods 0.000 title claims abstract description 83
- 238000003672 processing method Methods 0.000 title claims abstract description 39
- 238000000605 extraction Methods 0.000 claims abstract description 98
- 238000013136 deep learning model Methods 0.000 claims abstract description 20
- 238000007781 pre-processing Methods 0.000 claims abstract description 18
- 238000004458 analytical method Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 18
- 230000006854 communication Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 13
- 238000004590 computer program Methods 0.000 description 12
- 230000001360 synchronised effect Effects 0.000 description 7
- 238000012549 training Methods 0.000 description 7
- 238000003058 natural language processing Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书实施例提供任务处理方法、自动问答方法以及任务处理***,其中所述任务处理方法应用于任务处理***的服务单元,任务处理***包括服务单元和特征存储单元,包括:接收针对多模态待处理数据的任务处理请求;从特征存储单元中获取多模态待处理数据的待处理数据特征,其中,待处理数据特征为多个特征提取模型对多模态待处理数据预先处理得到的,特征提取模型与待处理数据的模态一一对应;将待处理数据特征输入任务处理模型,获得任务处理结果,其中,任务处理模型为自然语言的深度学习模型。通过利用多个特征提取模块将多模态待处理数据的处理任务前置,从而使得待处理数据特征可以一起进入任务处理模型,有效提高任务处理模型的处理效率。
Description
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种任务处理方法。本说明书一个或者多个实施例同时涉及一种自动问答方法,一种任务处理***,一种任务处理装置,一种自动问答装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序。
背景技术
随着计算机技术的发展,大模型开始大放异彩,在语言理解、生成、交互和推理方面表现出的非凡能力,广泛应用于对话、翻译、代码生成等的自然语言处理领域。然而,企业和用户产生的数据模态越来越多,如何利用大模型处理多模态数据逐渐成为研究重点。
目前,在利用大模型进行任务处理之前,通常利用编码器对不同模态的数据进行编码,将编码得到的数据特征发送给大模型进行任务处理。然而,不同模态的数据在进行编码时的耗时有所不同,大模型需要等待多模态数据均编码完成后才能进行任务处理,导致任务处理效率极低,因此,亟需一种高效的任务处理方案。
发明内容
有鉴于此,本说明书实施例提供了一种任务处理方法。本说明书一个或者多个实施例同时涉及一种自动问答方法,一种任务处理***,一种任务处理装置,一种自动问答装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种任务处理方法,应用于任务处理***的服务单元,任务处理***包括服务单元和特征存储单元,该方法包括:
接收针对多模态待处理数据的任务处理请求;
从特征存储单元中获取多模态待处理数据的待处理数据特征,其中,待处理数据特征为多个特征提取模型对多模态待处理数据预先处理得到的,特征提取模型与待处理数据的模态一一对应;
将待处理数据特征输入任务处理模型,获得任务处理结果,其中,任务处理模型为自然语言的深度学习模型。
根据本说明书实施例的第二方面,提供了一种自动问答方法,应用于任务处理***的服务单元,任务处理***包括服务单元和特征存储单元,该方法包括:
接收针对多模态待解答数据的问题处理请求;
从特征存储单元中获取多模态待解答数据的待解答数据特征,其中,待解答数据特征为多个特征提取模型对多模态待解答数据预先处理得到的,特征提取模型与待解答数据的模态一一对应;
将待解答数据特征输入任务处理模型,获得答复结果,其中,任务处理模型为自然语言的深度学习模型。
根据本说明书实施例的第三方面,提供了一种任务处理***,包括服务单元和特征存储单元;
特征存储单元,用于存储多模态待处理数据的待处理数据特征,其中,待处理数据特征为多个特征提取模型对多模态待处理数据预先处理得到的,特征提取模型与待处理数据的模态一一对应;
服务单元,用于接收针对多模态待处理数据的任务处理请求;从特征存储单元中获取多模态待处理数据的待处理数据特征;将待处理数据特征输入任务处理模型,获得任务处理结果,其中,任务处理模型为自然语言的深度学习模型。
根据本说明书实施例的第四方面,提供了一种任务处理装置,应用于任务处理***的服务单元,任务处理***包括服务单元和特征存储单元,该装置包括:
第一接收模块,被配置为接收针对多模态待处理数据的任务处理请求;
第一获取模块,被配置为从特征存储单元中获取多模态待处理数据的待处理数据特征,其中,待处理数据特征为多个特征提取模型对多模态待处理数据预先处理得到的,特征提取模型与待处理数据的模态一一对应;
第一输入模块,被配置为将待处理数据特征输入任务处理模型,获得任务处理结果,其中,任务处理模型为自然语言的深度学习模型。
根据本说明书实施例的第五方面,提供了一种自动问答装置,应用于任务处理***的服务单元,任务处理***包括服务单元和特征存储单元,该装置包括:
第二接收模块,被配置为接收针对多模态待解答数据的问题处理请求;
第二获取模块,被配置为从特征存储单元中获取多模态待解答数据的待解答数据特征,其中,待解答数据特征为多个特征提取模型对多模态待解答数据预先处理得到的,特征提取模型与待解答数据的模态一一对应;
第二输入模块,被配置为将待解答数据特征输入任务处理模型,获得答复结果,其中,任务处理模型为自然语言的深度学习模型。
根据本说明书实施例的第六方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述第一方面或者第二方面所提供方法的步骤。
根据本说明书实施例的第七方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述第一方面或者第二方面所提供方法的步骤。
根据本说明书实施例的第八方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述第一方面或者第二方面所提供方法的步骤。
本说明书一个实施例提供的任务处理方法,应用于任务处理***的服务单元,任务处理***包括服务单元和特征存储单元,接收针对多模态待处理数据的任务处理请求;从特征存储单元中获取多模态待处理数据的待处理数据特征,其中,待处理数据特征为多个特征提取模型对多模态待处理数据预先处理得到的,特征提取模型与待处理数据的模态一一对应;将待处理数据特征输入任务处理模型,获得任务处理结果,其中,任务处理模型为自然语言的深度学习模型。通过利用多个特征提取模块将多模态待处理数据的处理任务前置,并将待处理数据特征存储到特征存储单元中,实现了在任务处理请求到达时,直接从特征存储单元中取出待处理数据特征,使得待处理数据特征可以一起进入任务处理模型,有效降低任务处理模型处理时长,提高任务处理效率。
附图说明
图1是本说明书一个实施例提供的一种任务处理***的架构图;
图2是本说明书一个实施例提供的另一种任务处理***的架构图;
图3是本说明书一个实施例提供的一种任务处理方法的流程图;
图4是本说明书一个实施例提供的一种自动问答方法的流程图;
图5是本说明书一个实施例提供的另一种任务处理方法的流程图;
图6是本说明书一个实施例提供的第一种任务处理方法的处理过程流程图;
图7a是本说明书一个实施例提供的第二种任务处理方法的处理过程流程图;
图7b是本说明书一个实施例提供的第三种任务处理方法的处理过程流程图;
图8是本说明书一个实施例提供的一种自动问答界面的界面示意图;
图9是本说明书一个实施例提供的一种任务处理装置的结构示意图;
图10是本说明书一个实施例提供的一种自动问答装置的结构示意图;
图11是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
此外,需要说明的是,本说明书一个或多个实施例所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
本说明书一个或多个实施例中,大模型是指具有大规模模型参数的深度学习模型,通常包含上亿、上百亿、上千亿、上万亿甚至十万亿以上的模型参数。大模型又可以称为基石模型/基础模型(Foundation Model),通过大规模无标注的语料进行大模型的预训练,产出亿级以上参数的预训练模型,这种模型能适应广泛的下游任务,模型具有较好的泛化能力,例如大规模语言模型(LLM,Large Language Model)、多模态预训练模型(multi-modal pre-training model)等。
大模型在实际应用时,仅需少量样本对预训练模型进行微调即可应用于不同的任务中,大模型可以广泛应用于自然语言处理(NLP,Natural Language Processing)、计算机视觉等领域,具体可以应用于如视觉问答(VQA,Visual Question Answering)、图像描述(IC,Image Caption)、图像生成等计算机视觉领域任务,以及基于文本的情感分类、文本摘要生成、机器翻译等自然语言处理领域任务,大模型主要的应用场景包括数字助理、智能机器人、搜索、在线教育、办公软件、电子商务、智能设计等。
随着计算机技术的发展,大模型开始大放异彩,在语言理解、生成、交互和推理方面表现出的非凡能力,广泛应用于对话、翻译、代码生成等的自然语言处理领域。然而,企业和用户产生的数据模态越来越多,如何利用大模型处理多模态数据逐渐成为研究重点。目前,在利用大模型进行任务处理之前,用户通常利用编码器对不同模态的数据进行编码,将编码得到的数据特征发送给大模型进行任务处理。
然而,在多模态数据场景下,不同模态的数据在进行编码时,耗时会有不同,因此,不同模态数据的输入会对大模型最终输出结果时的推理时间(runtime)影响较大。尤其是在大模型推理服务场景中,需要用到分组处理(batch)以及流式处理(streaming)的能力,分组推理过程中大模型需要等待多路数据的编码处理结束后进行组推理,如果不同模态数据的输入编码时间过长,所有分组都会等待,会出现由于一个用户处理时长慢导致多个用户受影响,导致任务处理效率极低。
为了解决上述问题,且支持大模型的高并发,较低延迟,本说明书实施例提出了一种多模态推理服务架构。该架构可以通过利用多个特征提取模块将多模态待处理数据的处理任务前置,并将待处理数据特征存储到特征存储单元中,实现了在任务处理请求到达时,直接从特征存储单元中取出待处理数据特征,使得待处理数据特征可以一起进入任务处理模型,有效降低任务处理模型处理时长,提高任务处理效率。
具体地,本说明书实施例提供了一种任务处理方法,应用于任务处理***的服务单元,任务处理***包括服务单元和特征存储单元,接收针对多模态待处理数据的任务处理请求;从特征存储单元中获取多模态待处理数据的待处理数据特征,其中,待处理数据特征为多个特征提取模型对多模态待处理数据预先处理得到的,特征提取模型与待处理数据的模态一一对应;将待处理数据特征输入任务处理模型,获得任务处理结果,其中,任务处理模型为自然语言的深度学习模型。
在本说明书中,提供了一种任务处理方法,本说明书同时涉及一种自动问答方法,一种任务处理***,一种任务处理装置,一种自动问答装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,在下面的实施例中逐一进行详细说明。
参见图1,图1示出了本说明书一个实施例提供的一种任务处理***的架构图,任务处理***可以包括特征存储单元102和服务单元104;
特征存储单元102,用于存储多模态待处理数据的待处理数据特征,其中,待处理数据特征为多个特征提取模型对多模态待处理数据预先处理得到的,特征提取模型与待处理数据的模态一一对应;
服务单元104,用于接收针对多模态待处理数据的任务处理请求;从特征存储单元102中获取多模态待处理数据的待处理数据特征;将待处理数据特征输入任务处理模型,获得任务处理结果,其中,任务处理模型为自然语言的深度学习模型。
应用本说明书实施例的方案,通过利用多个特征提取模块将多模态待处理数据的处理任务前置,并将待处理数据特征存储到特征存储单元中,实现了在任务处理请求到达时,直接从特征存储单元中取出待处理数据特征,使得待处理数据特征可以一起进入任务处理模型,有效降低任务处理模型处理时长,提高任务处理效率。
参见图2,图2示出了本说明书一个实施例提供的另一种任务处理***的架构图,任务处理***可以包括多个客户端100以及服务端200,其中,服务端200可以包括特征存储单元102和服务单元104。多个客户端100之间通过服务端200可以建立通信连接,在任务处理场景中,服务端200即用来在多个客户端100之间提供任务处理服务,多个客户端100可以分别作为发送端或接收端,通过服务端200实现通信。
用户通过客户端100可与服务端200进行交互以接收其它客户端100发送的数据,或将数据发送至其它客户端100等。在任务处理场景中,可以是用户通过客户端100向服务端200发布数据流,服务端200根据该数据流生成任务处理结果,并将任务处理结果推送至其他建立通信的客户端中。
其中,客户端100与服务端200之间通过网络建立连接。网络为客户端100与服务端200之间提供了通信链路的介质。网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。客户端100所传输的数据可能需要经过编码、转码、压缩等处理之后才发布至服务端200。
客户端100可以为浏览器、APP(Application,应用程序)、或网页应用如H5(HyperText Markup Language5,超文本标记语言第5版)应用、或轻应用(也被称为小程序,一种轻量级应用程序)或云应用等,客户端100可以基于服务端200提供的相应服务的软件开发工具包(SDK,Software Development Kit),如基于实时通信(RTC,Real TimeCommunication)SDK开发获得等。客户端100可以部署在电子设备中,需要依赖设备运行或者设备中的某些APP而运行等。电子设备例如可以具有显示屏并支持信息浏览等,如可以是个人移动终端如手机、平板电脑、个人计算机等。在电子设备中通常还可以配置各种其它类应用,例如人机对话类应用、模型训练类应用、文本处理类应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
服务端200可以包括提供各种服务的服务器,例如为多个客户端提供通信服务的服务器,又如为客户端上使用的模型提供支持的用于后台训练的服务器,又如对客户端发送的数据进行处理的服务器等。需要说明的是,服务端200可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。服务器也可以为分布式***的服务器,或者是结合了区块链的服务器。服务器也可以是云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(CDN,Content DeliveryNetwork)以及大数据和人工智能平台等基础云计算服务的云服务器,或者是带人工智能技术的智能云计算服务器或智能云主机。
值得说明的是,本说明书实施例中提供的任务处理方法一般由服务端执行,但是,在本说明书的其它实施例中,客户端也可以与服务端具有相似的功能,从而执行本说明书实施例所提供的任务处理方法。在其它实施例中,本说明书实施例所提供的任务处理方法还可以是由客户端与服务端共同执行。
参见图3,图3示出了本说明书一个实施例提供的一种任务处理方法的流程图,任务处理方法应用于任务处理***的服务单元,任务处理***包括服务单元和特征存储单元,具体包括以下步骤:
步骤302:接收针对多模态待处理数据的任务处理请求。
本说明书一个或多个实施例中,响应于针对多模态待处理数据的任务处理请求,可以开始进行任务处理,从而获得任务处理结果。
具体地,任务处理请求对应的多模态待处理数据可以是不同场景中的数据,如会议场景中的数据、电商场景中的数据等等。任务处理请求对应的任务可以是不同类型的任务,如图像处理任务、视频编辑任务、音频处理任务等等。模态可以理解为类型,多模态待处理数据包括但不限于图像数据、音频数据、视频数据等等,具体根据实际情况进行选择,本说明书实施例对此不做任何限定。
实际应用中,接收针对多模态待处理数据的任务处理请求的方式有多种,具体根据实际情况进行选择,本说明书实施例对此不做任何限定。
本说明书一种可能的实现方式中,可以接收任务请求方直接发送的针对多模态待处理数据的任务处理请求。
本说明书另一种可能的实现方式中,任务处理***还包括网关接口层;上述接收针对多模态待处理数据的任务处理请求,可以包括以下步骤:
接收任务请求方通过网关接口层发送的针对多模态待处理数据的任务处理请求。
具体地,任务请求方是指发送任务处理请求的对象,可以是个人用户,也可以是项目***。网络接口(interface)层可以称为网关(dashscope),设有路由相关信息。服务单元可以称为多模态推理服务单元,也可以称为项目服务单元。
需要说明的是,任务请求方通过网络接口层向服务单元发送针对多模态待处理数据的任务处理请求时,可以先访问网络接口层,网络接口层响应于任务请求方的访问指令,调用服务单元,将任务处理请求转发给服务单元。实际应用中,任务请求方可以通过软件开发工具包访问网络接口层,网络接口层可以通过双向通讯协议(websocket)调用服务单元。
应用本说明书实施例的方案,接收任务请求方通过网关接口层发送的针对多模态待处理数据的任务处理请求,保证任务处理请求可以准确发送至服务单元。
步骤304:从特征存储单元中获取多模态待处理数据的待处理数据特征,其中,待处理数据特征为多个特征提取模型对多模态待处理数据预先处理得到的,特征提取模型与待处理数据的模态一一对应。
本说明书一个或多个实施例中,接收针对多模态待处理数据的任务处理请求之后,进一步地,可以从特征存储单元中获取多模态待处理数据的待处理数据特征。
具体地,待处理数据特征用于表示待处理数据,可以是待处理数据特征数组(embedding tensor)。特征存储单元可以称为模型特征数组键值存储单元(tensorKV,tensor Key-Value),特征存储单元用于存储、读取模型中间产生的特征数组。特征存储单元的底层可以用远程字典服务(redis)、对象存储服务(OSS,Object Storage Service)、网络附属存储(NAS,Network Attached Storage)等键值数据库进行存储,上层对特征数组级别的数据存储、读取以及分布式存储做了有效加速。
优选地,特征存储单元可以为网络附属存储,其具有短时间易实现,并且可快速排查、特征向量较大、快速实现时对时延敏感性不高,后期改远程字典服务等直接切换即可的优点。
特征提取模型用于对待处理数据进行特征提取,生成待处理数据的待处理数据特征。特征提取模型为机器学习模型,可以基于样本数据和样本数据携带的样本标签训练得到。特征提取模型可以是循环神经网络(RNN,Recurrent Neural Network)、卷积神经网络(CNN,Convolutional Neural Networks)等等,具体根据实际情况进行选择,本说明书实施例对此不做任何限定。
实际应用中,特征存储单元中存储的多模态待处理数据的待处理数据特征的生成方式有多种,具体根据实际情况进行选择,本说明书实施例对此不做任何限定。
本说明书一种可选的实施例中,可以通过异步处理的方式,由任务请求方利用多个特征提取模型对多模态待处理数据预先处理得到待处理数据特征,也即,上述从特征存储单元中获取多模态待处理数据的待处理数据特征之前,还包括:
接收任务请求方通过网关接口层发送的待处理数据特征,将待处理数据特征存储至特征存储单元。
需要说明的是,由于任务处理请求方通过网关接口层发送多模态待处理数据的待处理数据特征时,可能不是同时发送的,因此,接收任务请求方通过网关接口层发送的待处理数据特征,并基于待处理数据特征进行任务处理的方式称为异步处理方式。
进一步地,从特征存储单元中获取多模态待处理数据的待处理数据特征时,可以获取多模态待处理数据对应的数据属性信息,基于数据属性信息从特征存储单元中获取待处理数据特征,也即,上述从特征存储单元中获取多模态待处理数据的待处理数据特征,可以包括以下步骤:
根据多模态待处理数据对应的数据属性信息,从特征存储单元中获取多模态待处理数据的待处理数据特征,其中,待处理数据特征为任务请求方通过网关接口层调用多个特征提取模型对多模态待处理数据预先处理得到的。
具体地,数据属性信息为多模态待处理数据自身的属性信息,用于唯一标识待处理数据。数据属性信息包括但不限于数据编码、数据路径地址,具体根据实际情况进行选择,本说明书实施例对此不做任何限定。
需要说明的是,获取多模态待处理数据对应的数据属性信息的方式有多种,具体根据实际情况进行选择,本说明书实施例对此不做任何限定。本说明书一种可能的实现方式中,可以接收任务请求方发送的数据属性信息。本说明书另一种可能的实现方式中,可以基于多模态待处理数据统一资源定位***(URL,Uniform Resource Locator)中的路径和文件名生成数据属性信息。
实际应用中,根据多模态待处理数据对应的数据属性信息,从特征存储单元中获取多模态待处理数据的待处理数据特征时,若特征存储单元中存储有待处理数据特征,则可以直接获取待处理数据特征;若特征存储单元中未存储待处理数据特征,则可以将多模态待处理数据分别输入各模态对应的特征提取模型,获得多模态待处理数据的待处理数据特征;将待处理数据特征存储至特征存储单元。
应用本说明书实施例的方案,根据多模态待处理数据对应的数据属性信息,从特征存储单元中获取多模态待处理数据的待处理数据特征,无需服务单元对多模态待处理数据进行处理生成待处理数据特征,减少了服务单元的压力,降低了任务处理运行时间,并且,在特征存储单元中不包括待处理数据特征的情况下,通过故障恢复(failback)的方式重新利用特征提取模型生成待处理数据特征,保证了任务处理的稳定性。
本说明书另一种可选的实施例中,可以通过同步处理的方式,由服务单元利用各模态对应的特征提取模型对多模态待处理数据预先处理得到待处理数据特征,也即,上述从特征存储单元中获取多模态待处理数据的待处理数据特征之前,还可以包括以下步骤:
将任一模态待处理数据输入该模态对应的特征提取模型,获得任一模态待处理数据的数据特征;
将多模态待处理数据的待处理数据特征存储至特征存储单元。
需要说明的是,由于不同模态待处理数据对应的特征提取模型可能不同,因此,针对多模态待处理数据中的任一模态待处理数据,可以将任一模态待处理数据输入其模态对应的特征提取模型,获得任一模态待处理数据的数据特征。进一步地,可以将多模态待处理数据中各模态待处理数据的数据特征进行组合,获得多模态待处理数据的待处理数据特征。例如,将图像数据输入视觉预训练模型(VIT,Vision Transformer)中,利用视觉预训练模型将图像数据转换为待处理图像特征,待处理图像特征为特征数组。
进一步地,在获得待处理数据特征之后,可以基于多模态待处理数据的数据属性信息将待处理数据特征存储至特征存储单元。
应用本说明书实施例的方案,将多模态待处理数据分别输入各模态对应的特征提取模型,获得多模态待处理数据的待处理数据特征,由服务单元直接生成待处理数据特征,任务请求方无需额外单独请求特征提取模型对多模态数据进行处理,降低了任务处理***的复杂度,便于快速排查错误,并且,利用特征存储单元存储待处理数据特征,以便待处理数据特征在***中流转。同时,在特征提取模型能力强速度快的情况下,甚至可以不用将待处理数据特征存储至特征存储单元,直接将待处理数据特征输入任务处理模型,即可获得任务处理结果,降低了***开销。
本说明书一种可选的实施例中,在利用各模态对应的特征提取模型对多模态待处理数据进行特征提取之前,可以确定多模态待处理数据各模态分别对应的特征提取模型,也即,上述将任一模态待处理数据输入该模态对应的特征提取模型,获得任一模态待处理数据的数据特征之前,还可以包括以下步骤:
对任一模态待处理数据进行模态分析,确定该模态对应的特征提取模型。
需要说明的是,对任一模态待处理数据进行模态分析,确定该模态对应的特征提取模型的方式有多种,具体根据实际情况进行选择,本说明书实施例对此不做任何限定。本说明书一种可能的实现方式中,可以根据任一模态待处理数据的数据格式,确定该模态待处理数据对应的特征提取模型。本说明书另一种可能的实现方式中,可以将任一模态待处理数据和不同模态样本数据进行对比,确定与任一模态待处理数据匹配的样本数据,并将匹配的样本数对应的特征提取模型作为该模态对应的特征提取模型。
应用本说明书实施例的方案,对多模态待处理数据进行模态分析,确定多模态待处理数据各模态对应的特征提取模型,从而准确对各模态的待处理数据进行特征提取,保证了待处理数据特征的准确性。
本说明书另一种可选的实施例中,在利用各模态对应的特征提取模型对多模态待处理数据进行特征提取之前,可以获取多模态待处理数据。实际应用中,获取多模态待处理数据的方式有多种,具体根据实际情况进行选择,本说明书实施例对此不做任何限定。本说明书一种可能的实现方式中,可以接收任务请求方直接发送的多模态待处理数据。本说明书另一种可能的实现方式中,可以从对象存储服务中获取多模态待处理数据,也即,上述将任一模态待处理数据输入该模态对应的特征提取模型,获得任一模态待处理数据的数据特征之前,还可以包括以下步骤:
从对象存储服务中获取多模态待处理数据,其中,多模态待处理数据为任务请求方预先通过客户端上传至对象存储服务中的多模态数据。
需要说明的是,若多模态待处理数据的数据量大,将多模态待处理数据直接发送给服务单元的网络开销过大,任务请求方可以利用对象存储服务中对多模态待处理数据进行中转,服务单元从对象存储服务中获取多模态待处理数据。
进一步地,对象存储服务中的多模态待处理数据,可以是任务请求方预先通过客户端上传至对象存储服务中的。还可以是服务单元基于任务请求方的需求从公开数据平台上获取并存储至对象存储服务中,例如任务请求方的需求为与A市相关的数据,则服务单元可以从公开数据平台上获取与A市相关的图像数据、文本介绍数据、音乐、宣传视频等等。
实际应用中,从对象存储服务中获取多模态待处理数据的方式有多种,具体根据实际情况进行选择,本说明书实施例对此不做任何限定。本说明书一种可能的实现方式中,对象存储服务中只存储多模态待处理数据,因此,可以直接获取对象存储服务中的多模态待处理数据。在获取多模态待处理数据之后,对象存储服务可以删除存储的多模态待处理数据,以便下一任务处理请求使用。本说明书另一种可能的实现方式中,可以对象存储服务中存储有大量数据,可以根据多模态待处理数据的数据属性信息从对象存储服务中获取多模态待处理数据。
应用本说明书实施例的方案,从对象存储服务中获取多模态待处理数据,降低了服务单元的网络实时开销,提高了任务处理效率。
步骤306:将待处理数据特征输入任务处理模型,获得任务处理结果,其中,任务处理模型为自然语言的深度学习模型。
本说明书一个或多个实施例中,接收针对多模态待处理数据的任务处理请求,从特征存储单元中获取多模态待处理数据的待处理数据特征之后,进一步地,可以将待处理数据特征输入任务处理模型,获得任务处理结果。
具体地,任务处理模型为自然语言的深度学习模型,任务处理模型也可以称为大模型,如第三代通用预训练语言模型(GPT3,General Pre-trained Transformer-3)。
需要说明的是,若多模态待处理数据中包括待处理文本数据,本说明书一种可能的实现方式中,可以直接将多模态待处理数据分别输入各模态对应的特征提取模型,生成待处理文本特征和其他模态待处理数据特征,并将待处理文本特征和其他模态待处理数据特征一起输入任务处理模型中的解码器,获得任务处理结果。
本说明书另一种可能的实现方式中,由于任务处理模型可以对文本数据进行处理,因此,可以利用特征提取模型生成文本模态之外的其他模态的待处理数据对应的其他模态待处理数据特征,利用任务处理模型中的编码器生成待处理文本数据对应的待处理文本特征,在编码器生成待处理文本特征之后,从特征存储单元中获取其他模态待处理数据特征,并将其他模态待处理数据特征和待处理文本特征合并输入任务处理模型的解码器,获得任务处理结果。
实际应用中,将待处理数据特征输入任务处理模型时,可以通过超文本传输协议(HTTP,Hypertext Transfer Protocol)、远程过程调用(RPC,Remote Procedure Call)等方式调用任务处理模型,调用任务处理模型的方式具体根据实际情况进行选择,本说明书实施例对此不做任何限定。
应用本说明书实施例的方案,通过利用多个特征提取模块将多模态待处理数据的处理任务前置,并将待处理数据特征存储到特征存储单元中,实现了在任务处理请求到达时,直接从特征存储单元中取出待处理数据特征,使得待处理数据特征可以一起进入任务处理模型,有效降低任务处理模型处理时长,提高任务处理效率。
实际应用中,将待处理数据输入任务处理模型的方式有多种,具体根据实际情况进行选择,本说明书实施例对此不做任何限定。本说明书一种可能的实现方式中,可以直接将待处理数据特征发送至任务处理模型,由任务处理模型对待处理数据特征进行处理,获得任务处理结果。本说明书另一种可能的实现方式中,可以通过网关接口层将待处理数据特征发送至任务处理模型,也即,任务处理***还包括网关接口层;上述将待处理数据特征输入任务处理模型,获得任务处理结果,可以包括以下步骤:
通过网关接口层,将待处理数据特征输入任务处理模型,获得任务处理结果。
需要说明的是,由于网关接口层报包括全局队列,为了保证任务处理请求的分组处理和流式处理的特性,本说明书实施例中,服务单元可以不直接调用任务处理模型,而是通过软件开发工具包或者双向通讯协议访问网关接口层,以穿透调用任务处理模型。
应用本说明书实施例的方案,通过网关接口层,将待处理数据特征输入任务处理模型,获得任务处理结果,保证了任务处理请求的分组处理和流式处理的特性,提高了任务处理准确性。
实际应用中,将待处理数据特征输入任务处理模型,获得任务处理结果的方式有多种,具体根据实际情况进行选择,本说明书实施例对此不做任何限定。
本说明书一种可能的实现方式中,服务单元可以将待处理数据特征拼装为任务处理模型可以接受的待处理数据特征。任务处理模型可以接受的待处理数据特征中可以包括真实的待处理数据特征,服务单元可以直接将真实的待处理数据特征输入任务处理模型,获得任务处理结果。
本说明书另一种可能的实现方式中,任务处理模型可以接受的待处理数据特征中可以包括真实待处理数据特征对应的特征占位符,也即,上述将待处理数据特征输入任务处理模型,获得任务处理结果,可以包括以下步骤:
获取待处理数据特征对应的特征占位符;
将特征占位符发送至任务处理模型,以使任务处理模型基于特征占位符确定待处理数据特征并生成任务处理结果。
具体地,特征占位符是指用于占用特征位置的符号。获取待处理数据特征对应的特征占位符的方式有多种,可以是从其他数据获取设备和数据库中读取待处理数据特征对应的特征占位符。还可以接收任务请求方输入的待处理数据特征对应的特征占位符。
应用本说明书实施例的方案,获取待处理数据特征对应的特征占位符;将特征占位符发送至任务处理模型,任务处理模型可以基于特征占位符从特征存储单元中获取待处理数据特征并生成任务处理结果,减少了数据传输量,降低了网络开销。
本说明书一种可选的实施例中,上述将待处理数据特征输入任务处理模型,获得任务处理结果之后,还可以包括以下步骤:
向客户端发送任务处理结果,以使客户端向任务请求方展示任务处理结果;
接收任务请求方基于任务处理结果发送的调整信息,并根据调整信息对任务处理模型进行参数调整。
需要说明的是,将待处理数据特征输入任务处理模型,获得任务处理结果之后,可以向客户端发送任务处理结果,同时还可以向客户端发送任务处理结果对应的处理方式,其中,处理方式可以是同步处理或异步处理。
实际应用中,客户端向任务请求方展示任务处理结果的方式有多种,具体根据实际情况进行选择,本说明书实施例对此不作任何限定。本说明书一种可能的实现方式中,客户端可以只向任务请求方展示任务处理结果。本说明书另一种可能的实现方式中,客户端可以同时向任务请求方展示任务处理结果以及处理方式,使得任务请求方可以准确知道任务处理结果以及对应的处理方式。
值得说明的是,获得任务处理结果之后,可以对任务处理结果进行质检,质检通过的情况下向客户端发送任务处理结果,质检未通过的情况下重新进行任务处理。
进一步地,客户端向任务请求方展示任务处理结果之后,任务请求方可以根据任务处理结果自行进行数据处理,也可以对客户端展示的任务处理结果进行调整生成调整信息,将调整信息发送至服务单元,以使服务单元根据调整信息对任务处理模型进行参数调整。
应用本说明书实施例的方案,向客户端发送任务处理结果,以使客户端向任务请求方展示任务处理结果,使得任务请求方可以准确获得任务处理结果,增加了与任务请求方之间的交互,提高了任务请求方满意度。
参见图4,图4示出了本说明书一个实施例提供的一种自动问答方法的流程图,自动问答方法应用于任务处理***的服务单元,任务处理***包括服务单元和特征存储单元,具体包括以下步骤:
步骤402:接收针对多模态待解答数据的问题处理请求。
步骤404:从特征存储单元中获取多模态待解答数据的待解答数据特征,其中,待解答数据特征为多个特征提取模型对多模态待解答数据预先处理得到的,特征提取模型与待解答数据的模态一一对应。
步骤406:将待解答数据特征输入任务处理模型,获得答复结果,其中,任务处理模型为自然语言的深度学习模型。
需要说明的是,多模态待解答数据也即多模态待处理数据,答复结果也即任务处理请求对应的任务处理结果。步骤402至步骤406的实现方式与上述302至步骤306的实现方式相同,本说明书实施例便不再进行赘述。
应用本说明书实施例的方案,通过利用多个特征提取模块将多模态待解答数据的处理任务前置,并将待解答数据特征存储到特征存储单元中,实现了在待解答数据到达时,直接从特征存储单元中取出待解答数据特征,使得待解答数据特征可以一起进入任务处理模型,有效降低任务处理模型处理时长,提高自动问答效率。
下述结合附图5,以本说明书提供的任务处理方法在图像处理领域的应用为例,对所述任务处理方法进行进一步说明。其中,图5示出了本说明书一个实施例提供的另一种任务处理方法的流程图,具体包括以下步骤:
步骤502:接收任务请求方通过网关接口层发送的针对多模态待处理数据的任务处理请求。
步骤504:从对象存储服务中获取多模态待处理数据。
步骤506:对任一模态待处理数据进行模态分析,确定该模态对应的特征提取模型。
步骤508:将任一模态待处理数据输入该模态对应的特征提取模型,获得任一模态待处理数据的数据特征。
步骤510:将多模态待处理数据的待处理数据特征存储至特征存储单元。
步骤512:根据多模态待处理数据对应的数据属性信息,从特征存储单元中获取多模态待处理数据的待处理数据特征,其中,待处理数据特征为任务请求方通过网关接口层调用多个特征提取模型对多模态待处理数据预先处理得到的,特征提取模型与待处理数据的模态一一对应。
步骤514:获取待处理数据特征对应的特征占位符。
步骤516:通过网关接口层,将特征占位符发送至任务处理模型,以使任务处理模型基于特征占位符确定待处理数据特征并生成任务处理结果,其中,任务处理模型为自然语言的深度学习模型。
需要说明的是,步骤502至步骤516的实现方式与上述302至步骤306的实现方式相同,本说明书实施例便不再进行赘述。
应用本说明书实施例的方案,通过利用多个特征提取模块将多模态待处理数据的处理任务前置,并将待处理数据特征存储到特征存储单元中,实现了在任务处理请求到达时,直接从特征存储单元中取出待处理数据特征,使得待处理数据特征可以一起进入任务处理模型,有效降低任务处理模型处理时长,提高任务处理效率。
本说明书实施例中,可以通过多模态推理服务单元,在将多模态的信息在送入任务处理模型前实现对多模态待处理数据统一进行编码。在多模态推理服务单元中,可以通过独立部署的模型服务(model serving)调用独立的特征提取模型,以将所有模态的待处理数据转换为任务处理模型需要的待处理数据特征。由于不同的特征提取模型的处理速度各不相同,因此,本说明书实施例提出了同步任务处理方案和异步任务处理方案。
参见图6,图6示出了本说明书一个实施例提供的第一种任务处理方法的处理过程流程图,该任务处理方法为同步任务处理方案,图像数据、短语音数据等可以被快速处理的多模态待处理数据可以使用同步任务处理方案进行处理。参见图7a和图7b,图7a示出了本说明书一个实施例提供的第二种任务处理方法的处理过程流程图,图7b示出了本说明书一个实施例提供的第三种任务处理方法的处理过程流程图,图7a和图7b为异步任务处理方案,视频数据、长语音数据、高清图像数据等下载慢,处理慢的多模态待处理数据可以使用异步任务处理方案进行处理。通过同步任务处理方案和异步任务处理方案的设计,实现了支持不同场景下的服务调用,确保服务稳定性以及用户体验,在下面的实施例中逐一进行详细说明。
如图6所示,任务请求方通过网关接口层发送针对多模态待处理数据的任务处理请求;网关接口层将任务处理请求发送给服务单元以调用服务单元;服务单元通过独立部署的模型服务(model serving)调用独立的特征提取模型,以利用特征提取模型将所有模态的待处理数据转换为任务处理模型需要的待处理数据特征,并将待处理数据特征存储至特征存储单元。具体地,一个特征提取模型单独处理一个模态的待处理数据,例如,文本分类的模型部署后为处理文本分类的模型服务,用于处理待处理文本数据;服务单元访问网关接口层的任务处理模型生成服务,服务单元拼装所有待处理数据特征,生成任务处理模型可以接受的embedding tensor,将embedding tensor发送至任务处理模型,获得任务处理结果。示例性地,假设输入特征提取模型的是待处理图像数据的长宽以及通道数组成的3维数组tensor,特征提取模型的输出为1*128的embedding tensor。其中,embeddingtensor可以包含真实待处理数据特征,也可以包含待处理数据特征的特征占位符,以便降低网络开销。如果是传入特征占位符的情况,任务处理模型可以基于特征占位符从特征存储单元中获取待处理数据特征并生成任务处理结果。
应用本说明书实施例的方案,服务单元接收到任务处理请求之后,将多模态待处理数据分别输入各模态对应的特征提取模型,获得多模态待处理数据的待处理数据特征,并把待处理数据特征拼接到任务处理模型的输入中,从而获得任务处理结果。在特征提取模型处理能力强速度快的情况下,甚至可以不用将待处理数据特征存储在特征存储单元中,可以直接将待处理数据特征发送给任务处理模型,降低了***开销,避免了因读写错误导致的任务报错,便于排查错误。并且,任务请求方不用额外单独请求模型服务,降低了任务处理***的复杂度,待处理数据特征可以一起进入任务处理模型,有效降低任务处理模型处理时长,提高任务处理效率。
如图7a所示,任务请求方通过客户端上传多模态待处理数据至对象存储服务;客户端回调网关接口层,通过网关接口层调用模型服务,以利用多个特征提取模型对多模态待处理数据预先处理得到待处理数据特征,并将待处理数据特征存储至分布式特征存储单元;任务请求方通过网关接口层发送针对多模态待处理数据的任务处理请求;网关接口层将任务处理请求发送给服务单元以调用服务单元;服务单元访问网关接口层的任务处理模型生成服务,服务单元从特征存储单元中获取并拼装所有待处理数据特征,生成任务处理模型可以接受的embedding tensor,将embedding tensor发送至任务处理模型,获得任务处理结果。其中,embedding tensor可以包含真实待处理数据特征,也可以包含待处理数据特征的特征占位符,以便降低网络开销。如果是传入特征占位符的情况,任务处理模型可以基于特征占位符从特征存储单元中获取待处理数据特征并生成任务处理结果。
如图7b所示,任务请求方通过客户端上传多模态待处理数据至对象存储服务;客户端回调网关接口层,通过网关接口层调用模型服务,以利用多个特征提取模型对多模态待处理数据预先处理得到待处理数据特征,并将待处理数据特征存储至分布式特征存储单元;任务请求方通过网关接口层发送针对多模态待处理数据的任务处理请求;网关接口层调用任务处理模型,以使任务处理模型从特征存储单元中获取待处理数据特征并生成任务处理结果。
应用本说明书实施例的方案,独立提供了模态预处理服务,任务请求方上传多模态待处理数据的时候,可以直接调用特征提取模型生成待处理数据特征,并且预存待处理数据特征到特征存储单元。在整体任务处理请求到达的时候,服务单元直接从特征存储单元拿取待处理数据特征,并将待处理数据特征拼装起来送给任务处理模型,从而获得任务处理结果。无需服务单元对多模态待处理数据进行处理生成待处理数据特征,减少了服务单元的压力,减少了任务处理运行时间,并且,在特征存储单元中不包括待处理数据特征的情况下,服务单元通过故障恢复的方式重新调用模型服务,以利用特征提取模型生成待处理数据特征,此时的处理方式与同步任务处理方案相同,保证了任务处理的稳定性。
参见图8,图8示出了本说明书一个实施例提供的一种自动问答界面的界面示意图。自动问答界面分为问题处理请求输入界面和答复结果展示界面。问题处理请求输入界面中包括问题处理请求输入框、“确定”控件以及“取消”控件。答复结果展示界面中包括答复结果展示框。
任务请求方通过客户端显示的问题处理请求输入框输入针对多模态待解答数据的问题处理请求,点选“确定”控件,服务端接收客户端发送的针对多模态待解答数据的问题处理请求,从特征存储单元中获取多模态待解答数据的待解答数据特征,其中,待解答数据特征为多个特征提取模型对多模态待解答数据预先处理得到的,特征提取模型与待解答数据的模态一一对应;将待解答数据特征输入任务处理模型,获得答复结果,其中,任务处理模型为自然语言的深度学习模型,并将答复结果发送至客户端。客户端在答复结果展示框中显示答复结果。
实际应用中,任务请求方对控件进行操作的方式包括点击、双击、触控、鼠标悬停、滑动、长按、语音控制或摇一摇等任一方式,具体根据实际情况进行选择,本说明书实施例对此不作任何限定。
与上述任务处理方法实施例相对应,本说明书还提供了任务处理装置实施例,图9示出了本说明书一个实施例提供的一种任务处理装置的结构示意图。如图9所示,任务处理装置应用于任务处理***的服务单元,任务处理***包括服务单元和特征存储单元,该装置包括:
第一接收模块902,被配置为接收针对多模态待处理数据的任务处理请求;
第一获取模块904,被配置为从特征存储单元中获取多模态待处理数据的待处理数据特征,其中,待处理数据特征为多个特征提取模型对多模态待处理数据预先处理得到的,特征提取模型与待处理数据的模态一一对应;
第一输入模块906,被配置为将待处理数据特征输入任务处理模型,获得任务处理结果,其中,任务处理模型为自然语言的深度学习模型。
可选地,该装置还包括:第三输入模块,被配置为将任一模态待处理数据输入该模态对应的特征提取模型,获得任一模态待处理数据的数据特征;将多模态待处理数据的待处理数据特征存储至特征存储单元。
可选地,该装置还包括:分析模块,被配置为对任一模态待处理数据进行模态分析,确定该模态对应的特征提取模型。
可选地,该装置还包括:第三获取模块,被配置为从对象存储服务中获取多模态待处理数据。
可选地,第一获取模块904,进一步被配置为根据多模态待处理数据对应的数据属性信息,从特征存储单元中获取多模态待处理数据的待处理数据特征,其中,待处理数据特征为任务请求方通过网关接口层调用多个特征提取模型对多模态待处理数据预先处理得到的。
可选地,任务处理***还包括网关接口层;第一接收模块902,进一步被配置为接收任务请求方通过网关接口层发送的针对多模态待处理数据的任务处理请求。
可选地,任务处理***还包括网关接口层;第一输入模块906,进一步被配置为通过网关接口层,将待处理数据特征输入任务处理模型,获得任务处理结果。
可选地,第一输入模块906,进一步被配置为获取待处理数据特征对应的特征占位符;将特征占位符发送至任务处理模型,以使任务处理模型基于特征占位符确定待处理数据特征并生成任务处理结果。
可选地,该装置还包括:发送模块,被配置为向客户端发送任务处理结果,以使客户端向任务请求方展示任务处理结果;接收任务请求方基于任务处理结果发送的调整信息,并根据调整信息对任务处理模型进行参数调整。
应用本说明书实施例的方案,通过利用多个特征提取模块将多模态待处理数据的处理任务前置,并将待处理数据特征存储到特征存储单元中,实现了在任务处理请求到达时,直接从特征存储单元中取出待处理数据特征,使得待处理数据特征可以一起进入任务处理模型,有效降低任务处理模型处理时长,提高任务处理效率。
上述为本实施例的一种任务处理装置的示意性方案。需要说明的是,该任务处理装置的技术方案与上述的任务处理方法的技术方案属于同一构思,任务处理装置的技术方案未详细描述的细节内容,均可以参见上述任务处理方法的技术方案的描述。
与上述自动问答方法实施例相对应,本说明书还提供了自动问答装置实施例,图10示出了本说明书一个实施例提供的一种自动问答装置的结构示意图。如图10所示,自动问答装置应用于任务处理***的服务单元,任务处理***包括服务单元和特征存储单元,该装置包括:
第二接收模块1002,被配置为接收针对多模态待解答数据的问题处理请求;
第二获取模块1004,被配置为从特征存储单元中获取多模态待解答数据的待解答数据特征,其中,待解答数据特征为多个特征提取模型对多模态待解答数据预先处理得到的,特征提取模型与待解答数据的模态一一对应;
第二输入模块1006,被配置为将待解答数据特征输入任务处理模型,获得答复结果,其中,任务处理模型为自然语言的深度学习模型。
应用本说明书实施例的方案,通过利用多个特征提取模块将多模态待解答数据的处理任务前置,并将待解答数据特征存储到特征存储单元中,实现了在待解答数据到达时,直接从特征存储单元中取出待解答数据特征,使得待解答数据特征可以一起进入任务处理模型,有效降低任务处理模型处理时长,提高自动问答效率。
上述为本实施例的一种自动问答装置的示意性方案。需要说明的是,该自动问答装置的技术方案与上述的自动问答方法的技术方案属于同一构思,自动问答装置的技术方案未详细描述的细节内容,均可以参见上述自动问答方法的技术方案的描述。
图11示出了本说明书一个实施例提供的一种计算设备的结构框图。该计算设备1100的部件包括但不限于存储器1110和处理器1120。处理器1120与存储器1110通过总线1130相连接,数据库1150用于保存数据。
计算设备1100还包括接入设备1140,接入设备1140使得计算设备1100能够经由一个或多个网络1160通信。这些网络的示例包括公用交换电话网(PSTN,Public SwitchedTelephone Network)、局域网(LAN,Local Area Network)、广域网(WAN,Wide AreaNetwork)、个域网(PAN,Personal Area Network)或诸如因特网的通信网络的组合。接入设备1140可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC,NetworkInterface Card))中的一个或多个,诸如IEEE802.11无线局域网(WLAN,Wireless LocalArea Networks)无线接口、全球微波互联接入(Wi-MAX,World Interoperability forMicrowave Access)接口、以太网接口、通用串行总线(USB,Universal Serial Bus)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC,Near Field Communication)接口,等等。
在本说明书的一个实施例中,计算设备1100的上述部件以及图11中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图11所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备1100可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或个人计算机(PC,Personal Computer)的静止计算设备。计算设备1100还可以是移动式或静止式的服务器。
其中,处理器1120用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现上述任务处理方法或者自动问答方法的步骤。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的任务处理方法和自动问答方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述任务处理方法或者自动问答方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述任务处理方法或者自动问答方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的任务处理方法和自动问答方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述任务处理方法或者自动问答方法的技术方案的描述。
本说明书一实施例还提供一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述任务处理方法或者自动问答方法的步骤。
上述为本实施例的一种计算机程序的示意性方案。需要说明的是,该计算机程序的技术方案与上述的任务处理方法和自动问答方法的技术方案属于同一构思,计算机程序的技术方案未详细描述的细节内容,均可以参见上述任务处理方法或者自动问答方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。
Claims (13)
1.一种任务处理方法,应用于任务处理***的服务单元,所述任务处理***包括所述服务单元和特征存储单元,所述方法包括:
接收针对多模态待处理数据的任务处理请求;
从所述特征存储单元中获取所述多模态待处理数据的待处理数据特征,其中,所述待处理数据特征为多个特征提取模型对所述多模态待处理数据预先处理得到的,所述特征提取模型与所述待处理数据的模态一一对应;
将所述待处理数据特征输入任务处理模型,获得任务处理结果,其中,所述任务处理模型为自然语言的深度学习模型。
2.根据权利要求1所述的方法,所述从所述特征存储单元中获取所述多模态待处理数据的待处理数据特征之前,还包括:
将任一模态待处理数据输入该模态对应的特征提取模型,获得所述任一模态待处理数据的数据特征;
将所述多模态待处理数据的待处理数据特征存储至特征存储单元。
3.根据权利要求2所述的方法,所述将任一模态待处理数据输入该模态对应的特征提取模型,获得所述任一模态待处理数据的数据特征之前,还包括:
对任一模态待处理数据进行模态分析,确定该模态对应的特征提取模型。
4.根据权利要求2所述的方法,所述将任一模态待处理数据输入该模态对应的特征提取模型,获得所述任一模态待处理数据的数据特征之前,还包括:
从对象存储服务中获取所述多模态待处理数据。
5.根据权利要求1所述的方法,所述从所述特征存储单元中获取所述多模态待处理数据的待处理数据特征,包括:
根据所述多模态待处理数据对应的数据属性信息,从所述特征存储单元中获取所述多模态待处理数据的待处理数据特征,其中,所述待处理数据特征为任务请求方通过网关接口层调用多个特征提取模型对所述多模态待处理数据预先处理得到的。
6.根据权利要求1所述的方法,所述任务处理***还包括网关接口层;
所述接收针对多模态待处理数据的任务处理请求,包括:
接收任务请求方通过所述网关接口层发送的针对多模态待处理数据的任务处理请求。
7.根据权利要求1所述的方法,所述任务处理***还包括网关接口层;
所述将所述待处理数据特征输入任务处理模型,获得任务处理结果,包括:
通过所述网关接口层,将所述待处理数据特征输入任务处理模型,获得任务处理结果。
8.根据权利要求1或7所述的方法,所述将所述待处理数据特征输入任务处理模型,获得任务处理结果,包括:
获取所述待处理数据特征对应的特征占位符;
将所述特征占位符发送至所述任务处理模型,以使所述任务处理模型基于所述特征占位符确定待处理数据特征并生成任务处理结果。
9.根据权利要求1所述的方法,所述将所述待处理数据特征输入任务处理模型,获得任务处理结果之后,还包括:
向客户端发送所述任务处理结果,以使所述客户端向任务请求方展示所述任务处理结果;
接收所述任务请求方基于所述任务处理结果发送的调整信息,并根据所述调整信息对所述任务处理模型进行参数调整。
10.一种自动问答方法,应用于任务处理***的服务单元,所述任务处理***包括所述服务单元和特征存储单元,所述方法包括:
接收针对多模态待解答数据的问题处理请求;
从所述特征存储单元中获取所述多模态待解答数据的待解答数据特征,其中,所述待解答数据特征为多个特征提取模型对所述多模态待解答数据预先处理得到的,所述特征提取模型与所述待解答数据的模态一一对应;
将所述待解答数据特征输入任务处理模型,获得答复结果,其中,所述任务处理模型为自然语言的深度学习模型。
11.一种任务处理***,包括服务单元和特征存储单元;
所述特征存储单元,用于存储多模态待处理数据的待处理数据特征,其中,所述待处理数据特征为多个特征提取模型对所述多模态待处理数据预先处理得到的,所述特征提取模型与所述待处理数据的模态一一对应;
所述服务单元,用于接收针对多模态待处理数据的任务处理请求;从所述特征存储单元中获取所述多模态待处理数据的待处理数据特征;将所述待处理数据特征输入任务处理模型,获得任务处理结果,其中,所述任务处理模型为自然语言的深度学习模型。
12.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至9任意一项或者权利要求10所述方法的步骤。
13.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至9任意一项或者权利要求10所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310949248.1A CN117193960A (zh) | 2023-07-28 | 2023-07-28 | 任务处理方法、自动问答方法以及任务处理*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310949248.1A CN117193960A (zh) | 2023-07-28 | 2023-07-28 | 任务处理方法、自动问答方法以及任务处理*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117193960A true CN117193960A (zh) | 2023-12-08 |
Family
ID=88991404
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310949248.1A Pending CN117193960A (zh) | 2023-07-28 | 2023-07-28 | 任务处理方法、自动问答方法以及任务处理*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117193960A (zh) |
-
2023
- 2023-07-28 CN CN202310949248.1A patent/CN117193960A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116431316B (zh) | 任务处理方法、***、平台及自动问答方法 | |
CN117876941B (zh) | 目标多模态模型***及构建方法、视频处理模型训练方法、视频处理方法 | |
CN117332072B (zh) | 对话处理、语音摘要提取以及目标对话模型训练方法 | |
CN117573842B (zh) | 文档检索方法以及自动问答方法 | |
CN116610781A (zh) | 任务模型训练方法以及装置 | |
CN116578423B (zh) | 任务处理方法、自动问答方法以及图像生成方法 | |
CN117971420A (zh) | 任务处理、交通任务处理以及任务处理模型训练方法 | |
CN117271745A (zh) | 一种信息处理方法、装置及计算设备、存储介质 | |
CN117193964A (zh) | 任务处理方法以及自动问答方法 | |
CN116415597A (zh) | 语音翻译、同声传译方法 | |
CN117193960A (zh) | 任务处理方法、自动问答方法以及任务处理*** | |
CN117633540B (zh) | 样本数据构建方法及装置 | |
CN116522014B (zh) | 数据处理方法及装置 | |
CN116467500B (zh) | 数据关系识别、自动问答、查询语句生成方法 | |
CN117789099B (zh) | 视频特征提取方法及装置、存储介质及电子设备 | |
CN118136154A (zh) | 数据处理方法、分子处理模型的训练方法 | |
CN117648079B (zh) | 任务处理、代码补全、代码问答及任务处理模型训练方法 | |
CN117972047A (zh) | 文档检索方法以及自动问答方法 | |
CN118013246A (zh) | 数据处理方法及计算设备、计算机可读存储介质 | |
CN116415083A (zh) | 统一资源标识符生成方法以及装置 | |
CN118132988A (zh) | 机器学习模型训练方法、基于文本的图像搜索方法、自动问答方法、计算设备、计算机可读存储介质及计算机程序产品 | |
CN118212460A (zh) | 图像分类方法、自动问答方法、图像类别特征融合模型训练方法及基于深度学习模型的信息处理方法 | |
CN117851557A (zh) | 模型处理方法及问答*** | |
CN117830447A (zh) | 图像生成、自动问答以及参数生成模型训练方法 | |
CN116680357A (zh) | 信息抽取方法以及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |