CN110716767A - 模型组件调用、生成方法、装置和存储介质 - Google Patents

模型组件调用、生成方法、装置和存储介质 Download PDF

Info

Publication number
CN110716767A
CN110716767A CN201810769756.0A CN201810769756A CN110716767A CN 110716767 A CN110716767 A CN 110716767A CN 201810769756 A CN201810769756 A CN 201810769756A CN 110716767 A CN110716767 A CN 110716767A
Authority
CN
China
Prior art keywords
model component
material set
customized
specified
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810769756.0A
Other languages
English (en)
Other versions
CN110716767B (zh
Inventor
周躜
王凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201810769756.0A priority Critical patent/CN110716767B/zh
Publication of CN110716767A publication Critical patent/CN110716767A/zh
Application granted granted Critical
Publication of CN110716767B publication Critical patent/CN110716767B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/448Execution paradigms, e.g. implementations of programming paradigms
    • G06F9/4482Procedural

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书实施方式公开了一种模型组件调用、生成方法、装置和存储介质。本案可以实现自动生成模型组件。从而可以实现了,模型组件生成过程中可以无需人工进一步介入,减少了人力劳动。

Description

模型组件调用、生成方法、装置和存储介质
技术领域
本说明书涉及计算机数据处理领域,特别涉及模型组件生成方法、装置和存储介质。
背景技术
随着社会的发展,计算机软件广泛应用于社会的许多领域,给人们生产生活带来了很多便利。比如,通过音频识别进行控制电器设备。
现有技术中,通常可以通过编制计算机模型组件实现一定的业务功能,计算机模型组件通常是开发人员根据使用需求,人工选择训练数据,选择算法以及设置参数等,通过经验调整模型组件的生成过程。
发明内容
本说明书实施方式提供一种便于生成模型组件的模型组件生成方法、装置和存储介质。
本说明书实施方式提供一种模型组件的调用方法,包括:将素材集提供给机器学习模型组件,以用于所述机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件;其中,所述素材集包括至少一个素材;所述定制化模型组件用于实现指定业务功能;调用所述定制化模型组件以实现所述指定业务功能。
本说明书实施方式提供一种模型组件的调用装置,包括:生成模块,将素材集提供给机器学习模型组件,以用于所述机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件;其中,所述素材集包括至少一个素材;所述定制化模型组件用于实现指定业务功能;调用模块,用于调用所述定制化模型组件以实现所述指定业务功能。
本说明书实施方式提供一种计算机存储介质,所述计算机存储介质存储有计算机程序指令,所述计算机程序指令运行时实现:将素材集提供给机器学习模型组件,以用于所述机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件;其中,所述素材集包括至少一个素材;所述定制化模型组件用于实现指定业务功能;调用所述定制化模型组件以实现所述指定业务功能。
本说明书实施方式提供一种模型组件的调用方法,包括:接收用户指定的素材集;其中,所述素材集包括至少一个素材;将所述素材集发送给服务器,以用于所述服务器的机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件;其中,所述素材集包括至少一个素材;所述定制化模型组件用于实现指定业务功能;接收所述服务器反馈的定制化模型组件;调用所述定制化模型组件实现所述指定业务功能。
本说明书实施方式提供一种模型组件的调用装置,包括:第一接收模块,用于接收用户指定的素材集;其中,所述素材集包括至少一个素材;发送模块,用于将所述素材集发送给服务器,以用于所述服务器的机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件;其中,所述素材集包括至少一个素材;所述定制化模型组件用于实现指定业务功能;第二接收模块,用于接收所述服务器反馈的定制化模型组件;调用模块,用于调用所述定制化模型组件实现所述指定业务功能。
本说明书实施方式提供一种计算机存储介质,所述计算机存储介质存储有计算机程序指令,所述计算机程序指令被执行时实现:接收用户指定的素材集;其中,所述素材集包括至少一个素材;将所述素材集发送给服务器,以用于所述服务器的机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件;其中,所述素材集包括至少一个素材;所述定制化模型组件用于实现指定业务功能;接收所述服务器反馈的定制化模型组件;调用所述定制化模型组件实现所述指定业务功能。
本说明书实施方式提供一种模型组件的调用方法,包括:将素材集发送给服务器,以用于所述服务器将所述素材集作为机器学习模型组件的输入并基于指定模型组件生成定制化模型组件;发送调用请求以调用所述定制化模型组件实现指定业务功能。
本说明书实施方式提供一种模型组件的调用装置,包括:素材发送模块,用于将素材集发送给服务器,以用于所述服务器将所述素材集作为机器学习模型组件的输入并基于指定模型组件生成定制化模型组件;请求发送模块,用于发送调用请求以调用所述定制化模型组件实现指定业务功能。
本说明书实施方式提供一种模型组件生成方法,包括:确定用于生成定制化模型组件的素材集;其中,所述素材集中包括多个素材;根据所述素材集,制定指定模型组件的第一约束条件,其中,所述第一约束条件用于约束所述指定模型组件的训练过程;将所述素材集作为输入,基于所述指定模型组件按照所述第一约束条件约束的训练过程得到所述定制化模型组件。
本说明书实施方式提供一种模型组件生成装置,包括:确定模块,用于确定用于生成定制化模型组件的素材集;其中,所述素材集中包括多个素材;制定模块,用于根据所述素材集,制定指定模型组件的第一约束条件,其中,所述第一约束条件用于约束所述指定模型组件的训练过程;生成模块,用于将所述素材集作为输入,基于所述指定模型组件按照所述第一约束条件约束的训练过程生成所述定制化模型组件。
本说明书实施方式提供一种计算机存储介质,所述计算机存储介质存储有计算机程序指令,所述计算机程序指令被执行时实现:确定用于生成定制化模型组件的素材集,其中,所述素材集中包括多个素材;根据所述素材集,制定指定模型组件的第一约束条件,其中,所述第一约束条件用于约束所述指定模型组件的训练过程;将所述素材集作为输入,基于所述指定模型组件按照所述第一约束条件约束的训练过程得到所述定制化模型组件。
由上可见,本说明书提供的技术方案,通过分析目标素材集制定约束条件,以约束模型组件的生成过程。从而实现了,在指定目标素材集之后,便可以无需人工进一步介入,自动生成模型组件。减少了人力劳动。再者,传统模型组件的生成过程中,需要比较富有经验的工程师进行参数调整等,而本案中大大降低了该技术的门槛,使用者可以只提供目标素材集,便可以得出模型组件。如此非常便于音频识别技术的推广使用。
附图说明
为了更清楚地说明本说明书实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书实施方式提供的一个会议***的示意图;
图2为本说明书实施方式提供的一个模型组件生成方法流程示意图;
图3为本说明书实施方式提供的一个素材筛选的方法流程示意图;
图4为本说明书实施方式提供的一个制定约束条件的方法流程示意图;
图5为本说明书实施方式提供的一个制定约束条件的方法流程示意图;
图6为本说明书实施方式提供的一个制定约束条件的方法流程示意图;
图7为本说明书实施方式提供的一个模型组件生成方法流程示意图;
图8为本说明书实施方式提供的一个模型组件生成装置的模块示意图;
图9为本说明书实施方式提供的一个模型组件调用方法流程示意图;
图10为本说明书实施方式提供的一个模型组件调用方法流程示意图;
图11为本说明书实施方式提供的一种模型组件调用装置的模块示意图;
图12为本说明书实施方式提供的一种模型组件调用方法流程示意图;
图13为本说明书实施方式提供的一种模型组件调用装置的模块示意图;
图14为本说明书实施方式提供的一种模型组件调用方法流程示意图;
图15为本说明书实施方式提供的一种模型组件调用装置的模块示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施方式中的附图,对本说明书实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本说明书一部分实施方式,而不是全部的实施方式。基于本说明书中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都应当属于本说明书保护的范围。
请参阅图1,在一个场景示例中,某公司设置有会议***,该会议***可以包括服务器、终端设备和客户端。终端设备可以用于生成音频数据,客户端接收该音频数据生成音频文件。其中,服务器运行有音频识别模型组件,以将终端设备录制并提供的音频文件,进行音频识别生成会议记录。服务器可以采用云计算技术实现。某公司为房地产企业,使得多数开会沟通的内容均与房地产领域相关。
在本场景示例中,用户可以通过客户端向服务器发送请求,以使服务器中的机器学习模型组件根据用户指定的要求自动生成相应的模型组件。本场景示例中,服务器中可以具有机器学习模型组件,所述机器学习模型组件可以生成音频识别模型组件为例进一步介绍。
在本场景示例中,用户可以准备好关于房地产领域的文本材料,例如,关于房屋以及土地买卖的法律规定、房屋的行业标准、房地产行业的合同等等。用户可以将该些文本材料通过所述客户端提供给所述服务器。所述服务器的机器学习模型组件可以自动的根据提供的素材集生成最终的音频识别模型组件。
在本场景示例中,所述服务器接收到该文本材料之后,可以针对文本材料进行分词等操作,得出以词语为单位的素材集。例如,素材集可以为{小区、层高、钢筋、施工、安全帽、8756732847、土地单价、楼面价、物业、24845、钢筋、塑料、施工、混凝土、楼面价、钢筋、……}。
在本场景示例中,服务器可以针对素材集中的素材进行筛选得出目标素材集。具体的,服务器在素材集选择具有一定语义的素材,使得在素材集中剔除了没有语义表达的数字“8756732847”和“24845”。将剩余的素材作为目标素材形成目标素材集。此时,目标素材集可以包括{小区、层高、钢筋、施工、安全帽、土地单价、楼面价、物业、钢筋、塑料、施工、混凝土、楼面价、钢筋、……}。
在本场景示例中,服务器可以分析统计目标素材的数量,进而计算每个目标素材的数量与目标素材集中总量的占比。例如,“小区”的数量为13,“层高”的数量为34,“钢筋”的数量为73等等,不再列举。假设目标素材集中素材的总量为500,此时“小区”的数量占比为2.6%,“层高”的占比为6.8%,“钢筋”的占比为14.6。不同的占比数量,可以一定程度上表示相应的目标素材在日常使用中的频率。在生成音频识别模型组件的过程中,可以相应的提升占比较大的目标素材在与音频信息进行匹配时,命中的可能性。
在本场景示例中,服务器中可以具多个标准模型组件,机器学习组件可以针对标准模型组件进行训练或者参数修改等,以根据标准模型组件生成定制化的音频识别模型组件。服务器可以制定有第一约束条件,该第一约束条件用于约束音频识别模型组件的生成过程。具体的,第一约束条件可以为占比大于10%的目标素材,在将音频信息与目标素材进行匹配时,所述目标素材对应的权重增加0.1。音频识别模型组件在对音频信息进行识别成文字的过程中,会先将语义信息表征为语音特征向量,目标素材也会被表征为素材特征向量。进一步的,可以通过计算语音特征向量与素材特征向量之间的匹配度,确定语音特征向量对应的目标素材。例如,可以采取最大匹配的方式。在本场景示例中,客户端制定了第一约束条件,使得音频识别模型组件在进行向量匹配的过程中,也执行该第一约束条件。具体的,在将音频特征向量与“钢筋”的素材特征向量进行匹配时,假设计算得出的匹配度为0.3,进一步的会在该匹配度0.3的基础上增加所述权重0.1,即最终音频特征向量与“钢筋”的素材特征向量的匹配度被认定为0.4。如此,在一个音频特征向量与多个素材特征向量的匹配度较为接近的情况下,比如“刚劲”的匹配度为0.31,“干劲”的匹配度为0.3,此时增加“钢筋”的匹配度至0.4,增大了“钢筋”被命中的概率。由于通过对目标素材集的分析,“钢筋”在该领域使用的频率较高,如此增加“钢筋”被命中的概率,有助于提升音频识别模型组件的识别准确率。
在本场景示例中,服务器中的标准模型组件可以分别基于多种算法生成。例如,服务器可以具有根据隐马尔科夫、神经网络等算法分别生成用于音频识别的标准模型组件。具体的,服务器可以自动根据目标素材集分别根据不同的标准模型组件,分别构建一个准音频识别模型组件。比如,根据隐马尔科夫作为核心算法的标准模型组件构建生成第一准音频识别模型组件。根据卷积神经网络作为核心算法的标准模型组件构建生成第二准音频识别模型组件。
在本场景示例中,可以对生成的准音频识别模型组件进行筛选,得出最终使用的音频识别模型组件。具体的,可以将第一准音频识别模型组件和第二准音频识别模型组件,基于相同数量的目标素材进行训练,并得出二者的识别准确率。即计算第一准音频识别模型组件根据目标素材,正确识别的数量占总量的比值,以及计算第二准音频识别模型组件正确识别的数量占总量的比值。假设,第一准音频识别模型组件的识别准确率为99.8%,第二准音频识别模型组件的识别准确率为99.7%,此时可以将第一准音频识别模型组件作为最终的音频识别模型组件。
在本场景示例中,服务器生成音频识别模型组件之后,可以进一步的将生成的音频识别模型组件进行发布。服务器中可以原本运行有一个音频识别模型组件。机器学习模型组件生成新的音频识别模型组件之后,可以将新的音频识别模型组件放入识别模型组件集,该识别模型组件集用于存储音频识别模型组件。如此,便于音频识别模型组件的版本管理和存储。进一步的,服务器可以将新生成的音频识别模型组件直接投入使用,以更新服务器原本运行的音频识别模型组件。
在本场景示例中,服务器中的音频识别模型组件更新之后,服务器可以针对终端设备录制的音频文件,进行音频识别得出文本文件,从而给使用者带来了便利。由于,服务器中的音频识别模型组件为自动分析素材集而生成,使得整个更新过程较为便捷而且快速。再者,目标素材集本身有着较为明确的内容,使得得到的音频识别模型组件可以针对目标素材集中的目标素材有着较好的识别准确率。
请参阅图9。本说明书实施方式提供一种模型组件的调用方法。所述调用方法可以应用于客户端,也可以应用于服务器中,还可以应用于客户端和服务器形成的***。所述调用方法可以包括以下步骤。
步骤S62:将素材集提供给机器学习模型组件,以用于所述机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件;其中,所述素材集包括至少一个素材;所述定制化模型组件用于实现指定业务功能;所述指定模型组件用于作为生成所述定制化模型组件的基础。
在本实施方式中,机器学习模型组件可以用于根据素材集自动生成模型组件。生成的模型组件可以实现一定的业务功能。该业务功能可以被素材集所制约,如此模型组件与输入至机器学习模型组件的素材集相关联。进而,可以通过素材集的不同,来指定生成的模型组件。
在本实施方式中,机器学习模型组件可以对指定模型组件进行改进得到定制化模型组件。指定模型组件可以是用户指定的模型组件,还可以是机器学习模型组件预先具有标准模型组件。其中,用户指定的模型组件可以是用户之前调用过的模型组件。用户使用该模型组件之后,认为该模型组件存在一定缺陷,从而指定该模型组件,以使机器学习模型组件可以针对该模型组件进行一定的改进得到定制化模型组件。再者,及其学子模型组件中可以预先设置有标准模型组件。标准模型组件的数量可以是一个或多个。标准模型逐渐可以分别基于相应的算法生成。例如,标准模型组件可以分别基于神经网络、隐马尔可夫等算法生成,或者标准模型组件也可以采用多个算法生成。
在本实施方式中,机器学习模型组件可以在分析素材集的基础上,根据指定模型组件自动生成的定制化模型组件。具体的,例如,可以无需用户对定制化模型组件的整个构建过程非常的了解。机器学习模型组件可以统计素材集中素材的数量,在所述数量大于指定阈值时,指定模型组件可以为选择基于神经网络算法的标准模型组件;否则,指定模型组件可以为选择基于隐马尔可夫算法的标准模型组件。
在本实施方式中,机器学习模型组件生成的定制化模型组件,可以是基于用户提供的素材集对指定模型组件训练生成的。因为在生成定制化模型的过程中,是采用素材集中的素材训练生成的,如此,使得定制化模型组件可以较好的对素材集中的素材进行响应处理。进一步的,素材集中的素材,可以选择现有使用中模型组件处理不够准确的素材,如此,生成的定制化模型组件可以较现有使用中模型组件在处理的准确性方面予以提升。
在本实施方式中,将素材集提供给机器学习模型组件,可以包括:用户将素材集存放于客户端的指定路径中,向机器学习模型组件提供该路径;或者,客户端将素材集通过网络发送给服务器,服务器接收到素材集之后由机器学习模型组件进一步响应处理。
在本实施方式中,指定业务功能可以是指为了满足业务需求,而对数据等进行处理,以追求业务需求所需要的结果。业务需求可以是人们生产生活中对达到某一目的时,所需要达成的条件。具体的,例如,指定业务功能可以包括但不限于音频识别功能、图像锐化处理功能、视频压缩功能等等。
步骤S64:调用所述定制化模型组件以实现所述指定业务功能。
在本实施方式中,在生成定制化模型组件之后,可以将定制化模型组件替换指定模型组件。或者,也可以将定制化模型组件与指定模型组件叠加使用。例如,将指定模型组件输出的结果与定制化模型组件输出的结果进行结合评价后输出最终的结果。例如,在进行图像中的文字识别时,图像中的文字可以是“天下第一”,指定模型组件识别的结果可能是“天”、“干”、“第”、“一”,如此,可以得知指定模型组件在识别“天下第一”中的“下”时,不够准确,如此可以将含有“天下第一”,或者其他含有“下”的图像作为素材,用于生成定制化模型组件。如此使得,定制化模型组件针对上述图像输出的结果可以是“天下第一”。指定模型组件在识别图像中的“下”时,可能会对多个相近似的字进行打分,例如“干”为0.5,“下”为0.4,“大”为0.2。定制化模型组件在识别图像中的“下”时,可能会对相似字的打分,例如“干”为0.1,“下”为0.5,“大”为0.1,如此将相同字的打分相加后,选择最大值对应的字作为输出结果,得出“下”为0.9分,为最大值。如此,将指定模型组件和定制化模型组件叠加使用,可以提升识别的准确率。从而使得定制化模型组件可以实现作为指定模型组件的补充升级模块,以弥补指定模型组件的缺陷。
在本实施方式中,调用所述定制化模型组件可以包括:根据所述定制化模型组件的调用地址,直接调用所述指定模型组件;或者,向指定地址发送调用请求,其中,所述调用请求中附带有业务数据,所述业务数据用于输入至所述定制化模型组件实现所述业务功能。
请参阅图10。在一个实施方式中,在将素材集提供给机器学习模型组件,以用于所述机器学习模型组件根据所述素材集生成定制化模型组件的步骤中可以包括以下步骤。
步骤S70:根据所述素材集,制定所述指定模型组件的第一约束条件,其中,所述第一约束条件用于约束所述指定模型组件的训练过程。
步骤S72:将所述素材集作为输入,基于指定模型组件按照所述第一约束条件约束的训练过程生成所述定制化模型组件。
在本实施方式中,机器学习组件可以将素材集作为输入,并根据第一约束条件约束指定模型组件的训练过程,生成定制化模型组件。第一约束条件可以起到用于约束定制化模型组件的生成过程的作用。生成定制化模型组件需要一些的过程。例如指定算法、设置参数、模型训练等等。本实施方式中,可以根据素材集制定约束条件,机器学习模型组件可以根据阅读条件,选择指定模型组件。通过约束条件来制约指定模型组件的训练过程中,设置指定模型组件的参数等,从而使得最终生成的定制化模型组件可以符合要求。具体的,例如,满足关于素材集所对应的知识领域的音频识别。本实施方式中,第一约束条件的数量并不进行限定,比如,可以是一个或多个。
请参阅图3。在一个实施方式中,在将素材集提供给机器学习模型组件,以用于所述机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件,可以包括以下步骤。
步骤S30:接收用户输入的素材集;其中,所述素材集包括多个素材。
步骤S32:针对所述素材集按照预设规则进行筛选得到目标素材;其中,筛选得到的目标素材形成目标素材集。
步骤S34:将所述目标素材集提供给所述机器学习模型组件,以用于所述机器学习模型组件根据所述目标素材集基于所述指定模型组件生成所述定制化模型组件。
在本实施方式中,可以针对用户提供的素材进行筛选,得出目标素材。如此,使得用于模型组件训练的目标素材,可以具有较好的数据一致性。在本实施方式中,用户提供的素材集可以是用户主要使用场景下,会出现的文本材料。具体的,例如,模型组件应用于法院,用于针对庭审的录音生成庭审记录。此时,可以将庭审记录中的文字,作为目标素材。
在本实施方式中,预设规则可以包括但不限于:选择表达的内容为指定领域的素材;或者,选取数据格式为指定格式的素材。具体的,所述指定领域可以是指某一个业务领域或者知识领域。例如,指定领域可以是足球领域、篮球领域、民法领域、航空领域、贷款领域等等,不再列举。在本实施方式中,表达的内容为指定领域的素材,可以是指素材是该指定领域的经常使用的文字、词语、短语、图片、视频。具体的,例如,“三分球”是篮球领域的常用词;“机翼”是航空领域的常用词。指定格式可以是约定目标素材的数据格式。具体的,例如,指定格式为文本格式,那么将文本格式的素材作为目标素材,非文本格式的图片和视频不放入目标素材集。
请参阅图11。本说明书实施方式还提供一种模型组件的调用装置,包括:生成模块,将素材集提供给机器学习模型组件,以用于所述机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件;其中,所述素材集包括至少一个素材;所述定制化模型组件用于实现指定业务功能;所述指定模型组件用于作为生成所述定制化模型组件的基础;调用模块,用于调用所述定制化模型组件以实现所述指定业务功能。
本实施方式提供的调用装置中模块实现的功能和效果,可以参照其它实施方式对照解释,在此不再赘述。
本说明书实施方式还提供一种计算机存储介质,所述计算机存储介质存储有计算机程序指令,所述计算机程序指令运行时实现:将素材集提供给机器学习模型组件,以用于所述机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件;其中,所述素材集包括至少一个素材;所述定制化模型组件用于实现指定业务功能;所述指定模型组件用于作为生成所述定制化模型组件的基础;调用所述定制化模型组件以实现所述指定业务功能。
在本实施方式中,所述计算机存储介质包括但不限于随机存取存储器(RandomAccess Memory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(HardDisk Drive,HDD)或者存储卡(Memory Card)。
本实施方式中提供的计算机存储介质,其程序指令被执行时实现的功能和效果可以参见其它实施方式对照解释,在此不再赘述。
请参阅图12。本说明书实施方式提供一种模型组件的调用方法。所述方法可以应用于客户端。客户端可以是具有一定数据处理能力的电子设备,比如台式电脑、笔记本电脑、平板电脑或智能手机等。当然,所述客户端也可以是指运行于上述电子设备中的软体。所述方法可以包括以下步骤。
步骤S82:接收用户指定的素材集;其中,所述素材集包括至少一个素材。
步骤S84:将所述素材集发送给服务器,以用于所述服务器的机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件;其中,所述素材集包括至少一个素材;所述定制化模型组件用于实现指定业务功能;所述指定模型组件用于作为生成所述定制化模型组件的基础。
步骤S86:接收所述服务器反馈的定制化模型组件。
步骤S88:调用所述定制化模型组件实现所述指定业务功能。
在本实施方式中,定制化模型组件可以运行于客户端中。用户可以操作客户端,通过指定素材集发给服务器,以使服务器的机器学习模型组件生成定制化模型组件。进一步的,机器学习模型组件生成定制化模型组件之后,可以将定制化模型组件发送给客户端。如此,客户端便可以调用定制化模型组件,以实现对本地的模型组件的更新。上述过程,非常简便,给用户带来了便利。
请参阅图13。本说明书实施方式还提供一种模型组件的调用装置,其可以包括:第一接收模块,用于接收用户指定的素材集;其中,所述素材集包括至少一个素材;发送模块,用于将所述素材集发送给服务器,以用于所述服务器的机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件;其中,所述素材集包括至少一个素材;所述定制化模型组件用于实现指定业务功能;所述指定模型组件用于作为生成所述定制化模型组件的基础;第二接收模块,用于接收所述服务器反馈的定制化模型组件;调用模块,用于调用所述定制化模型组件实现所述指定业务功能。
本实施方式提供的调用装置中模块实现的功能和效果,可以参照其它实施方式对照解释,在此不再赘述。
本说明书实施方式提供一种计算机存储介质,所述计算机存储介质存储有计算机程序指令,所述计算机程序指令被执行时实现:接收用户指定的素材集;其中,所述素材集包括至少一个素材;将所述素材集发送给服务器,以用于所述服务器的机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件;其中,所述素材集包括至少一个素材;所述定制化模型组件用于实现指定业务功能;所述指定模型组件用于作为生成所述定制化模型组件的基础;接收所述服务器反馈的定制化模型组件;调用所述定制化模型组件实现所述指定业务功能。
本实施方式中提供的计算机存储介质,其程序指令被执行时实现的功能和效果可以参见其它实施方式对照解释,在此不再赘述。
请参阅图14。本说明书实施方式还提供一种模型组件的调用方法。所述调用方法可以包括以下步骤。
步骤S92:将素材集发送给服务器,以用于所述服务器将所述素材集作为机器学习模型组件的输入并基于指定模型组件生成定制化模型组件。
步骤S94:发送调用请求以调用所述定制化模型组件实现指定业务功能。
在本实施方式中,所述模型组件的调用方法可以运行于客户端。所述客户端可以具有相对较弱的数据处理能力。如此,使得定制化模型组件本身可以运行于服务器中,客户端可以通过向服务器发送相应的调用请求,以调用定制化模型组件。
本实施方式可以降低了对应用所述调用方法的电子设备的运行能力要求,如此可以便于模型组件的使用推广。
请参阅图15。本说明书实施方式还提供一种模型组件的调用装置。所述模型组件的调用装置可以包括:素材发送模块,用于将素材集发送给服务器,以用于所述服务器将所述素材集作为机器学习模型组件的输入并基于指定模型组件生成定制化模型组件;请求发送模块,用于发送调用请求以调用所述定制化模型组件实现指定业务功能。
本实施方式提供的调用装置中模块实现的功能和效果,可以参照其它实施方式对照解释,在此不再赘述。
本说明书实施方式还提供一种计算机存储介质,所述计算机存储介质中存储有计算机程序指令,所述计算机程序指令被执行时实现:将素材集发送给服务器,以用于所述服务器将所述素材集作为机器学习模型组件的输入并基于指定模型组件生成定制化模型组件;发送调用请求以调用所述定制化模型组件实现指定业务功能。
本实施方式中提供的计算机存储介质,其程序指令被执行时实现的功能和效果可以参见其它实施方式对照解释,在此不再赘述。
请参阅图2。本说明书实施方式提供一种模型组件生成方法。所述模型组件生成方法运行于电子设备中。该电子设备可以是服务器,也可以是具有较佳性能的终端设备,比如台式电脑或笔记本电脑等。所述模型组件生成方法可以包括以下步骤。
步骤S20:确定用于生成定制化模型组件的素材集;其中,所述素材集中包括多个素材。
在本实施方式中,定制模型组件可以是计算机编程实现一定业务功能的功能模块。具体的,例如,定制化模型组件可以包括:用于对音频数据进行识别的音频识别模型组件,可以从音频数据识别出文本数据;或者,用于对图像进行处理的图像处理模型组件,以提升图像的锐度;或者,用于提升视频数据展现的图像清晰度的视频处理模型组件等。定制化模型组件可以是用户根据提供业务需求,服务器的机器学习模型组件自动生成符合业务需求的定制化模型组件。
在本实施方式中,素材可以是用于在定制化模型组件生成过程中,作为输入训练校准指定模型组件的数据对象。素材可以包括:文本、图像、音频或视频等。素材可以是关于某一个知识领域。如此得到的模型组件,可以对该领域的素材具有较好的处理准确率。具体的,例如,针对生成的模型组件多用于与足球相关的知识领域,所述素材可以包括足球赛事新闻、足球比赛视频、足球球星图片、足球报纸评论、足球周刊、球星简介等等相关的文本材料、视频文件和图像等。当然,并不限于足球领域,还可以是曲艺领域、法律领域等等,在此不再赘述。
在一个实施方式中,素材可以是文本。具体的,素材可以是字、词语或短语。可以通过设置分词器等对文本材料进行拆词。例如,输入的文本为“高速行驶的汽车”,可以通过就有语义分析功能的分词器拆分为“高速”、“行使”、“的”和“汽车”,或者拆分为“高速行驶的”和“汽车”,或者可以直接将“高速行驶的汽车”作为一个素材。
在本实施方式中,素材集可以是多个素材形成的数据集合。具体的,可以采用数据表、数组等数据结构,将素材形成素材集。
在本实施方式中,确定素材集的方式可以包括:接收用户提供的素材集;或者,根据用户指定的知识领域,自动获取该知识领域的素材,形成素材集;或者,接收到客户端发送的素材集。
步骤S22:根据所述素材集,制定指定模型组件的第一约束条件,其中,所述第一约束条件用于约束所述指定模型组件的训练过程。
在本实施方式中,该模型组件生成方法可以在确定素材集之后,自动进一步的根据素材集生成模型组件。如此,可以无需人工控制调整,节省了人力。再者,传统生成模型组件的过程中,需要很有经验的专家对生成过程进行控制调整,比如设置参数等等。而本实施方式中,通过程序设置,可以自动识别素材集,进而制定生成定制化模型组件的约束条件。如此,可以大大降低了生成定制化模型组件的工作量,便于技术的推广应用。
在本实施方式中,第一约束条件用于约束指定模型组件的训练过程。指定模型组件的训练过程,可以包括对指定模型组件进行参数设置、训练速度控制、初始值的设置等等。本实施方式中,通过约束条件来制约指定模型组件的训练过程,从而使得最终生成的定制化模型组件可以符合要求。第一约束条件的数量并不进行限定,比如,可以是一个或多个。
在本实施方式中,根据所述素材集制定约束条件,可以使得用户提供素材,便可以进一步得到定制化模型组件。可以无需用户对模型组件的整个构建过程非常的了解。根据素材集制定约束条件可以包括但不限于:统计素材集中素材的数量,在所述数量大于指定阈值时,指定生成模型组件的算法为神经网络,否则,指定生成模型组件的算法为隐马尔可夫;或者,计算每个素材在所述素材集中的占比,可以根据所述占比的大小,制定约束条件,提高占比较大的素材与音频信息进行匹配时的权重,以提升素材的命中率;或者,分析素材集所涉及的知识领域,在涉及两个以上知识领域的情况下,制定约束条件以规定采用至少两个以上算法,分别生成一个模型组件。当然,所属领域技术人员在本方案的技术精髓启示下,还可以做出其它的变更,但之前要其实现的功能和效果,与本申请相同或相似,均应涵盖于本申请保护范围内。
步骤S24:将所述素材集作为输入,基于所述指定模型组件按照所述第一约束条件约束的训练过程得到所述定制化模型组件。
在本实施方式中,在生成定制化模型组件的过程中,会以素材集作为指定模型组件的训练数据。如此最终得出的定制化模型组件对素材集中的素材集,可以具有较好的识别准确率。进一步的,训练过程受到第一约束条件的约束,使得整个过程也较为具有针对性。具体的,例如,第一约束条件指定算法为卷积神经网络,层数为3层。此时,指定模型组件可以为采用卷积神经网络的标准模型组件,并具有3层网络结构,提取音频信息的特征,进而将音频信息形成的语音特征向量与素材的特征向量进行匹配,得出最终识别出的结果。
本说明书实施方式,通过分析素材集制定约束条件,以约束定制化模型组件的生成过程。从而实现了,在指定素材集之后,便可以无需人工进一步介入,自动生成模型组件。减少了人力劳动。再者,传统模型组件的生成过程中,需要比较富有经验的工程师进行参数调整等,而本案中大大降低了该技术的门槛,使用者可以只提供素材集,便可以得出模型组件。如此非常便于音频识别技术的推广使用。
请参阅图4。在一个实施方式中,在根据所述素材集,制定指定模型组件的第一约束条件,可以包括以下步骤。
步骤S36:计算素材在所述素材集中的占比。
步骤S38:制定第一约束条件包括:根据所述占比调整所述指定模型组件中,所述占比对应的素材在进行匹配时的权重。
在本实施方式中,可以计算每个素材在素材集中的数量,进而计算每个素材的数量与总量的占比。具体的,例如,素材集中共有1000个素材,其中素材“计算机”共有50个,此时素材的占比可以为50/1000。
在本实施方式中,素材的占比可以一定程度上表示,所述素材的使用频率。占比较大,说明素材的使用频率相对较高;占比较小,说明素材的使用频率相对较小。
在本实施方式中,模型组件进行工作的过程中,通常采用特征向量表征业务数据,以及通过素材特征向量来表征素材。所述业务数据可以为作为执行所述模型组件所需要输入的数据。可以通过特征向量与素材特征向量的匹配度,确定素材特征向量表征的素材是否被选取。可以为不同的素材特征向量的匹配度配置权重,以修正匹配算法带来的偏差。进一步的,由于占比可以用于反映相应素材的使用频率,所以可以相对增大占比较高的素材的权重,或者可以相对降低占比较低的素材的权重。具体的,例如,业务数据可以是音频信息,上述方式可以提升对音频数据进行文字识别的识别准确率。
请参阅图5。在一个实施方式中,在根据所述素材集,制定所述指定模型组件的第一约束条件,可以包括以下步骤。
步骤S40:统计所述素材集中素材的数量。
步骤S42:制定第一约束条件包括:根据所述数量确定指定模型组件使用的算法。
在本实施方式中,指定模型组件可以基于多种算法生成。具体的,例如,可以用于生成音频识别模型组件的算法包括但不限于:隐马尔科夫或神经网络算法等。或者,生成图像识别模型组件的算法包括但不限于:深度学习、强化学习等。不同的算法,对于不同数量级别等,可能存在一定的差异。比如,在素材的数量较小的情况下,多数算法都可以具有较好的训练结果,以及运算速度。但,如果素材的数量非常大的情况下,有的算法会因为素材的数量较大,导致非常庞大的运算量,给电子设备带来很大的运算负荷。由此,制定第一约束条件包括根据数量进一步指定算法。由此,可以根据素材集的实际情况,自动选择较为适配的算法。
在本实施方式中,确定生成指定模型组件使用的算法,可以为通过算法选择标准模型组件的方式实现。标准模型组件可以基于算法生成。如此,通过确定生成模型组件的算法,便可以指定机器学习模型组件进一步采用的标准模型组件。
在本实施方式中,可以通过设置数据表的方式,或者程序指令集成的方式。在统计得出素材集中素材的数量之后,进一步得出指定的算法和指定模型组件。
请参阅图6。在一个实施方式中,在根据所述素材集,制定所述模型组件的第一约束条件的步骤中可以包括以下步骤。
步骤S44:划分所述素材集中的素材所属于的知识领域。
步骤S46:制定第一约束条件包括:在所述素材集涉及二个以上知识领域的情况下,指定至少二个以上指定模型组件。
在本实施方式中,有的算法针对某一个知识领域的内容,生成的定制化模型组件具有较好的识别准确率,但针对其余知识领域时,可能其生成的定制化模型组件的识别准确率可能不高。本实施方式中,在素材集中的素材涉及二个以上知识领域的情况下,指定多个指定模型组件分别对应知识领域。如此,多个指定模型组件完成训练过程之后,得到多个准定制化模型组件。可以在生成的多个准定制化模型组件中进行挑选,将可以相对较好兼顾各个知识领域的准定制化模型组件作为最终使用的定制化模型组件。具体的,例如,素材集中涉及股票领域和船舶领域,制定的第一约束条件可以为选择两个指定模型组件,并分别基于长短期记忆算法和卷积神经网络算法构建。
在一个实施方式中,所述定制化模型组件生成方法还可以包括:接收用户输入的第二约束条件;其中,所述第二约束条件用于约束所述指定模型组件的训练过程。
相应的,在生成所述定制化模型组件时,将所述素材集作为输入,基于所述指定模型组件按照所述第一约束条件和所述第二约束条件约束的训练过程生成所述定制化模型组件。
在本实施方式中,在根据素材集进行分析制定第一约束条件的基础上,还可以由用户输入的方式指定第二约束条件。第二约束条件也可以约束指定模型组件的训练过程。在所述第一约束条件和所述第二约束条件发生冲突时,可以以所述第二约束条件为准。当然,也可以以所述第一约束条件为准。具体的,例如,第一约束条件为指定选择按照隐马尔科夫算法生成的指定模型组件,第二约束条件为选择按照神经网络算法生成的指定模型组件,此时可以默认用户输入的第二约束条件优先于第一约束条件执行,采用神经网络算法构建的指定模型组件。当然,也可以分别执行第一约束条件和第二约束条件,比如选择两个指定模型组件,其中一个按照第一约束条件生成,另一个按照第二约束条件生成。
在本实施方式中,第一约束条件和所述第二约束条件不发生抵触的情况下,二者共同约束模型组件的生成过程。具体的,例如,第一约束条件为生成两个准定制化模型组件,第二约束条件为指定算法为隐马尔科夫。此时,可以使用基于隐马尔科夫算法的指定模型组件生成两个准定制化模型组件,也可以采用基于隐马尔科夫算法的指定模型组件生成一个准定制化模型组件,并采用其它算法的指定模型组件生成另一个准定制化模型组件。并可以从生成的二个以上准定制化模型组件中挑选一个作为最终的定制化模型组件。
请参阅图7。在一个实施方式中,在将所述素材集作为输入,按照所述第一约束条件约束的生成过程生成所述模型组件,可以包括以下步骤。
步骤S50:将所述素材集作为输入,基于所述指定模型组件按照所述第一约束条件约束的训练过程生成二个以上准定制化模型组件。
步骤S52:针对二个以上所述准定制化模型组件进行评估,确定所述定制化模型组件。
在本实施方式中,可以在不违背第一约束条件的情况下,生成二个以上准定制化模型组件。该准定制化模型组件可以为按照预先设置的指定模型组件分别训练生成。在准定制化模型组件的训练过程中,仍旧受到第一约束条件的约束。具体的,例如,第一约束条件为采用神经网络算法,多个准定制化模型组件可以分别采用基于卷积神经网络、循环神经网络、深度神经网络等等算法的指定模型组件分别生成准定制化模型组件。
在本实施方式中,还可以为第一约束条件指定的定制化模型组件数量用于约束最终输出的定制化模型组件数量,而中间生成过程中,对准定制化模型组件的数量并不构成限定。如此,最终的模型组件可以从生成的多个准定制化模型组件中挑选,选择性能较好,较为切合使用需求的准定制化模型组件,作为最终的模型组件。
在本实施方式中,在针对二个以上所述准定制化模型组件进行评估,确定所述模型组件的步骤中包括:计算每个所述准定制化模型组件的识别准确率,将所述识别准确率较高的作为最终的所述定制化模型组件。
在本实施方式中,在对准定制化模型组件进行挑选时,根据准定制化模型组件的识别准确率,使得最终使用的定制化模型组件,可以较好的应用于使用环境。识别准确率可以是计算准定制化模型组件在进行训练的过程中,识别了一定数量的素材之后,计算准确识别的数量和不准确识别数量之间的比值,或者准确识别的数量与总量的比值。
在本实施方式中,将识别准确率较高的作为最终的定制化模型组件,可以理解为选择识别准确率最高的准定制化模型组件作为最终的定制化模型组件。也可以为综合考虑识别准确率、运算反馈速度、运算工作量等,确定最终的定制化模型组件。此时最终的定制化模型组件不一定是识别准确率最高的准定制化模型组件。
在一个实施方式中,所述模型组件生成方法还可以包括:将所述定制化模型组件发布至模型组件集中,以用于从所述模型组件集中获取所述定制化模型组件;其中,所述模型组件集中包括至少一个定制化模型组件。
在本实施方式中,模型组件集可以是多个定制化模型组件形成的集合。将生成的模型组件放入模型组件集中进行存储,可以便于模型组件的版本管理。在具体某一个模型组件需要上线使用时,可以将相应模型组件推送到相应的业务单元。当然,也可以由业务单元发出获取请求,以请求获取相应的模型组件。
在本实施方式中,在生成模型组件放入模型组件集之后,可以自动的将该模型组件发送给相应的业务单元。如此实现无需人工操作,自动的发布使用最新的模型组件,给操作用户带来了便利。
请参阅图8。本说明书实施方式还提供一种模型组件生成装置,包括:确定模块、制定模块和生成模块。
确定模块,用于确定用于生成定制化模型组件的素材集;其中,所述素材集中包括多个素材;
制定模块,用于根据所述素材集,制定指定模型组件的第一约束条件,其中,所述第一约束条件用于约束所述指定模型组件的训练过程;
生成模块,用于将所述素材集作为输入,基于所述指定模型组件按照所述第一约束条件约束的训练过程生成所述定制化模型组件。
在本实施方式中,相关内容可以对照前述实施方式的内容解释,在此不再赘述。
本说明书实施方式还提供一种计算机存储介质,所述计算机存储介质存储有计算机程序指令,所述计算机程序指令被执行时实现:确定用于生成定制化模型组件的素材集,其中,所述素材集中包括多个素材;根据所述素材集,制定指定模型组件的第一约束条件,其中,所述第一约束条件用于约束所述指定模型组件的训练过程;将所述素材集作为输入,基于所述指定模型组件按照所述第一约束条件约束的训练过程得到所述定制化模型组件。
在本实施方式中,所述计算机存储介质包括但不限于随机存取存储器(RandomAccess Memory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(HardDisk Drive,HDD)或者存储卡(Memory Card)。
本实施方式中提供的计算机存储介质,其程序指令被执行时实现的功能和效果可以参见其它实施方式对照解释,在此不再赘述。
说明书中的各个实施方式均采用递进的方式描述,各个实施方式之间相同相似的部分互相参见即可,每个实施方式重点说明的都是与其他实施方式的不同之处。
本说明书实施方式中提及的服务器,可以是具有一定运算处理能力的电子设备。其可以具有网络通信端子、处理器和存储器等。当然,上述服务器也可以是指运行于所述电子设备中的软体。上述服务器还可以为分布式服务器,可以是具有多个处理器、存储器、网络通信模块等协同运作的***。所述服务器还可以为采用云计算技术实现。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera HardwareDescriptionLanguage)、Confluence、CUPL(Cornell University ProgrammingLanguage)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby Hardware Description Language)等,目前最普遍使用的是VHDL(Very-High-Speed Integrated Circuit Hardware Description Language)与Verilog2。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现客户端、服务器以外,完全可以通过将方法步骤进行逻辑编程来使得客户端、服务器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种客户端、服务器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书各个实施方式或者实施方式的某些部分所述的方法。
本说明书中的各个实施方式均采用递进的方式描述,各个实施方式之间相同相似的部分互相参见即可,每个实施方式重点说明的都是与其他实施方式的不同之处。尤其,针对装置、计算机存储介质的实施方式来说,均可以参照前述方法的实施方式的介绍对照解释。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
虽然通过实施方式描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。

Claims (28)

1.一种模型组件的调用方法,其特征在于,包括:
将素材集提供给机器学习模型组件,以用于所述机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件;其中,所述素材集包括至少一个素材;所述定制化模型组件用于实现指定业务功能;
调用所述定制化模型组件以实现所述指定业务功能。
2.如权利要求1所述的方法,其特征在于,所述指定模型组件包括以下至少之一:用户指定的模型组件,或,所述机器学习模型组件预先设置的标准模型组件。
3.如权利要求1所述的方法,其特征在于,在将素材集提供给机器学习模型组件,以用于所述机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件的步骤中包括:
根据所述素材集,制定所述指定模型组件的第一约束条件,其中,所述第一约束条件用于约束所述指定模型组件的训练过程;
将所述素材集作为输入,基于所述指定模型组件按照所述第一约束条件约束的训练过程得到所述定制化模型组件。
4.如权利要求3所述的方法,其特征在于,根据所述素材集,制定所述指定模型组件的第一约束条件的步骤中,包括:
计算每个素材在所述素材集中的占比;
制定第一约束条件包括:根据所述占比调整对应的素材在所述指定模型组件中,将素材与音频信息进行匹配时,所述素材对应的权重。
5.如权利要求3所述的方法,其特征在于,在根据所述素材集,制定所述指定模型组件的第一约束条件的步骤中,包括:
统计所述素材集中素材的数量;
制定第一约束条件包括:根据所述数量确定指定模型组件使用的算法。
6.如权利要求3所述的方法,其特征在于,根据所述素材集制定所述指定模型组件的第一约束条件的步骤中,包括:
划分所述素材集中的素材所属于的知识领域;
制定第一约束条件包括:在所述素材集涉及二个以上知识领域的情况下,对应知识领域指定至少二个以上指定模型组件。
7.如权利要求1所述的方法,其特征在于,在将素材集提供给机器学习模型组件,以用于所述机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件的步骤中包括:
接收用户输入的素材集;其中,所述素材集包括多个素材;
针对所述素材集按照预设规则进行筛选得到目标素材;其中,筛选得到的目标素材形成所述目标素材集;
将所述目标素材集提供给所述机器学习模型组件,以用于所述机器学习模型组件根据所述目标素材集基于所述指定模型组件生成所述定制化模型组件。
8.如权利要求7所述的方法,其特征在于,所述预设规则至少包括以下之一:选取表达的内容为指定领域的素材;或者,选取数据格式为指定格式的素材。
9.如权利要求3所述的方法,其特征在于,所述方法还包括:
接收用户输入的第二约束条件;其中,所述第二约束条件用于约束所述指定模型组件的训练过程;
相应的,在生成所述定制化模型组件的步骤中,
将所述素材集作为输入,基于所述指定模型组件按照所述第一约束条件和所述第二约束条件约束的训练过程生成所述定制化模型组件。
10.如权利要求3所述的方法,其特征在于,在将所述素材集作为输入,基于所述指定模型组件按照所述第一约束条件约束的训练过程生成所述定制化模型组件的步骤中包括:
将所述素材集作为输入,按照所述第一约束条件约束的生成过程生成二个以上准定制化模型组件;
针对二个以上所述准定制化模型组件进行评估,确定所述定制化模型组件。
11.如权利要求10所述的方法,其特征在于,在针对二个以上所述准定制化模型组件进行评估,确定所述定制化模型组件的步骤中包括:
计算每个所述准定制化模型组件的识别率,将所述识别率较高的作为最终的所述定制化模型组件。
12.一种模型组件的调用装置,其特征在于,包括:
生成模块,将素材集提供给机器学习模型组件,以用于所述机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件;其中,所述素材集包括至少一个素材;所述定制化模型组件用于实现指定业务功能;
调用模块,用于调用所述定制化模型组件以实现所述指定业务功能。
13.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序指令,所述计算机程序指令运行时实现:将素材集提供给机器学习模型组件,以用于所述机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件;其中,所述素材集包括至少一个素材;所述定制化模型组件用于实现指定业务功能;
调用所述定制化模型组件以实现所述指定业务功能。
14.一种模型组件的调用方法,其特征在于,包括:
接收用户指定的素材集;其中,所述素材集包括至少一个素材;
将所述素材集发送给服务器,以用于所述服务器的机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件;其中,所述素材集包括至少一个素材;所述定制化模型组件用于实现指定业务功能;
接收所述服务器反馈的定制化模型组件;
调用所述定制化模型组件实现所述指定业务功能。
15.一种模型组件的调用装置,其特征在于,包括:
第一接收模块,用于接收用户指定的素材集;其中,所述素材集包括至少一个素材;
发送模块,用于将所述素材集发送给服务器,以用于所述服务器的机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件;其中,所述素材集包括至少一个素材;所述定制化模型组件用于实现指定业务功能;
第二接收模块,用于接收所述服务器反馈的定制化模型组件;
调用模块,用于调用所述定制化模型组件实现所述指定业务功能。
16.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序指令,所述计算机程序指令被执行时实现:接收用户指定的素材集;其中,所述素材集包括至少一个素材;将所述素材集发送给服务器,以用于所述服务器的机器学习模型组件根据所述素材集并基于指定模型组件生成定制化模型组件;其中,所述素材集包括至少一个素材;所述定制化模型组件用于实现指定业务功能;接收所述服务器反馈的定制化模型组件;调用所述定制化模型组件实现所述指定业务功能。
17.一种模型组件的调用方法,其特征在于,包括:
将素材集发送给服务器,以用于所述服务器将所述素材集作为机器学习模型组件的输入并基于指定模型组件生成定制化模型组件;
发送调用请求以调用所述定制化模型组件实现指定业务功能。
18.一种模型组件的调用装置,其特征在于,包括:
素材发送模块,用于将素材集发送给服务器,以用于所述服务器将所述素材集作为机器学习模型组件的输入并基于指定模型组件生成定制化模型组件;
请求发送模块,用于发送调用请求以调用所述定制化模型组件实现指定业务功能。
19.一种模型组件生成方法,其特征在于,包括:
确定用于生成定制化模型组件的素材集;其中,所述素材集中包括多个素材;
根据所述素材集,制定指定模型组件的第一约束条件,其中,所述第一约束条件用于约束所述指定模型组件的训练过程;
将所述素材集作为输入,基于所述指定模型组件按照所述第一约束条件约束的训练过程得到所述定制化模型组件。
20.如权利要求19所述的方法,其特征在于,在根据所述素材集,制定指定模型组件的第一约束条件的步骤中,包括:
计算素材在所述素材集中的占比;
制定第一约束条件包括:根据所述占比调整所述指定模型组件中,所述占比对应的素材在进行匹配时的权重。
21.如权利要求19所述的方法,其特征在于,在根据所述素材集,制定指定模型组件的第一约束条件的步骤中,包括:
统计所述素材集中素材的数量;
制定第一约束条件包括:根据所述数量确定指定模型组件使用的算法。
22.如权利要求19所述的方法,其特征在于,在根据所述素材集,制定所述指定模型组件的第一约束条件的步骤中,包括:
划分所述素材集中的素材所属于的知识领域;
制定第一约束条件包括:在所述素材集涉及二个以上知识领域的情况下,对应知识领域指定至少二个以上指定模型组件。
23.如权利要求19所述的方法,其特征在于,所述方法还包括:
接收用户输入的第二约束条件;其中,所述第二约束条件用于约束所述指定模型组件的训练过程;
相应的,在生成所述定制化模型组件的步骤中,
将所述素材集作为输入,基于所述指定模型组件按照所述第一约束条件和所述第二约束条件约束的训练过程生成所述定制化模型组件。
24.如权利要求19所述的方法,其特征在于,在将所述素材集作为输入,基于所述指定模型组件按照所述第一约束条件约束的生成过程生成所述模型组件的步骤中包括:
将所述素材集作为输入,基于所述指定模型组件按照所述第一约束条件约束的训练过程生成二个以上准定制化模型组件;
针对二个以上所述准定制化模型组件进行评估,确定所述定制化模型组件。
25.如权利要求24所述的方法,其特征在于,在针对二个以上所述准定制化模型组件进行评估,确定所述定制化模型组件的步骤中包括:
计算每个所述准定制化模型组件的识别率,将所述识别率较高的作为最终的所述定制化模型组件。
26.如权利要求19所述的方法,其特征在于,所述方法还包括:
将所述定制化模型组件发布至模型组件集中,以用于从所述模型组件集中获取所述定制化模型组件;其中,所述模型组件集中包括至少一个定制化模型组件。
27.一种模型组件生成装置,其特征在于,包括:
确定模块,用于确定用于生成定制化模型组件的素材集;其中,所述素材集中包括多个素材;
制定模块,用于根据所述素材集,制定指定模型组件的第一约束条件,其中,所述第一约束条件用于约束所述指定模型组件的训练过程;
生成模块,用于将所述素材集作为输入,基于所述指定模型组件按照所述第一约束条件约束的训练过程生成所述定制化模型组件。
28.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序指令,所述计算机程序指令被执行时实现:确定用于生成定制化模型组件的素材集,其中,所述素材集中包括多个素材;根据所述素材集,制定指定模型组件的第一约束条件,其中,所述第一约束条件用于约束所述指定模型组件的训练过程;将所述素材集作为输入,基于所述指定模型组件按照所述第一约束条件约束的训练过程得到所述定制化模型组件。
CN201810769756.0A 2018-07-13 2018-07-13 模型组件调用、生成方法、装置和存储介质 Active CN110716767B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810769756.0A CN110716767B (zh) 2018-07-13 2018-07-13 模型组件调用、生成方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810769756.0A CN110716767B (zh) 2018-07-13 2018-07-13 模型组件调用、生成方法、装置和存储介质

Publications (2)

Publication Number Publication Date
CN110716767A true CN110716767A (zh) 2020-01-21
CN110716767B CN110716767B (zh) 2023-05-05

Family

ID=69208501

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810769756.0A Active CN110716767B (zh) 2018-07-13 2018-07-13 模型组件调用、生成方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN110716767B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112184498A (zh) * 2020-09-29 2021-01-05 中国平安财产保险股份有限公司 合同评分的方法、装置、计算机设备和存储介质
CN114579110A (zh) * 2022-05-05 2022-06-03 支付宝(杭州)信息技术有限公司 优化模型的求解方法、电子设备、应用程序及存储介质
CN116302294A (zh) * 2023-05-18 2023-06-23 安元科技股份有限公司 一种界面化自动识别组件属性的方法及***

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1719454A (zh) * 2005-07-15 2006-01-11 清华大学 几何代价和语义-识别代价融合的脱机手写汉字切分方法
US20110144986A1 (en) * 2009-12-10 2011-06-16 Microsoft Corporation Confidence calibration in automatic speech recognition systems
CN103914702A (zh) * 2013-01-02 2014-07-09 国际商业机器公司 用于提高视频中的对象检测性能的***和方法
CN105448292A (zh) * 2014-08-19 2016-03-30 北京羽扇智信息科技有限公司 一种基于场景的实时语音识别***和方法
CN107644638A (zh) * 2017-10-17 2018-01-30 北京智能管家科技有限公司 语音识别方法、装置、终端和计算机可读存储介质
CN107807814A (zh) * 2017-09-27 2018-03-16 百度在线网络技术(北京)有限公司 应用组件的构建方法、装置、设备及计算机可读存储介质
US20180150756A1 (en) * 2016-11-29 2018-05-31 Industrial Technology Research Institute Method for enhancing association rules, apparatus using the same and computer readable medium therefor
CN108229519A (zh) * 2017-02-17 2018-06-29 北京市商汤科技开发有限公司 图像分类的方法、装置及***

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1719454A (zh) * 2005-07-15 2006-01-11 清华大学 几何代价和语义-识别代价融合的脱机手写汉字切分方法
US20110144986A1 (en) * 2009-12-10 2011-06-16 Microsoft Corporation Confidence calibration in automatic speech recognition systems
CN103914702A (zh) * 2013-01-02 2014-07-09 国际商业机器公司 用于提高视频中的对象检测性能的***和方法
CN105448292A (zh) * 2014-08-19 2016-03-30 北京羽扇智信息科技有限公司 一种基于场景的实时语音识别***和方法
US20180150756A1 (en) * 2016-11-29 2018-05-31 Industrial Technology Research Institute Method for enhancing association rules, apparatus using the same and computer readable medium therefor
CN108229519A (zh) * 2017-02-17 2018-06-29 北京市商汤科技开发有限公司 图像分类的方法、装置及***
CN107807814A (zh) * 2017-09-27 2018-03-16 百度在线网络技术(北京)有限公司 应用组件的构建方法、装置、设备及计算机可读存储介质
CN107644638A (zh) * 2017-10-17 2018-01-30 北京智能管家科技有限公司 语音识别方法、装置、终端和计算机可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MARK DREDZE等: "Multi-domain learning by confidence-weighted parameter combination", 《MACHINE LEARNING》 *
贺苏宁;虞厥邦;: "几种小训练样本集的数字语音识别模型的比较性研究", 计算机科学 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112184498A (zh) * 2020-09-29 2021-01-05 中国平安财产保险股份有限公司 合同评分的方法、装置、计算机设备和存储介质
CN114579110A (zh) * 2022-05-05 2022-06-03 支付宝(杭州)信息技术有限公司 优化模型的求解方法、电子设备、应用程序及存储介质
CN114579110B (zh) * 2022-05-05 2022-08-19 支付宝(杭州)信息技术有限公司 优化模型的求解方法、电子设备、应用程序及存储介质
CN116302294A (zh) * 2023-05-18 2023-06-23 安元科技股份有限公司 一种界面化自动识别组件属性的方法及***
CN116302294B (zh) * 2023-05-18 2023-09-01 安元科技股份有限公司 一种界面化自动识别组件属性的方法及***

Also Published As

Publication number Publication date
CN110716767B (zh) 2023-05-05

Similar Documents

Publication Publication Date Title
WO2021203581A1 (zh) 基于精标注文本的关键信息抽取方法、装置及存储介质
US20190364123A1 (en) Resource push method and apparatus
WO2020007224A1 (zh) 知识图谱构建及智能应答方法、装置、设备及存储介质
US20220383854A1 (en) Intent recognition method and intent recognition system having self learning capability
CN111709476A (zh) 一种基于知识蒸馏的小分类模型训练方法及装置
WO2021135562A1 (zh) 特征有效性评估方法、装置、电子设备及存储介质
CN111626049B (zh) 多媒体信息的标题修正方法、装置、电子设备及存储介质
CN112215171B (zh) 目标检测方法、装置、设备及计算机可读存储介质
CN110716767B (zh) 模型组件调用、生成方法、装置和存储介质
CN109918499A (zh) 一种文本分类方法、装置、计算机设备及存储介质
CN111258995A (zh) 数据处理方法、装置、存储介质及设备
US11275994B2 (en) Unstructured key definitions for optimal performance
CN113962965B (zh) 图像质量评价方法、装置、设备以及存储介质
CN111563810A (zh) 信贷风控模型生成方法、信用评估方法、***、机器可读介质及设备
CN109299913B (zh) 员工薪资方案生成方法及装置
CN113569129A (zh) 点击率预测模型处理方法、内容推荐方法、装置及设备
CN114118192A (zh) 用户预测模型的训练方法、预测方法、装置及存储介质
CN111177307A (zh) 一种基于语义理解相似度阀值配置的测试方案及***
CN112799658B (zh) 模型训练方法、模型训练平台、电子设备和存储介质
CN115129902B (zh) 媒体数据处理方法、装置、设备及存储介质
US20230195742A1 (en) Time series prediction method for graph structure data
CN112307371B (zh) 小程序子服务识别方法、装置、设备及存储介质
CN113343076A (zh) 一种基于特征匹配度的创新技术推荐方法及***
CN110879868A (zh) 顾问方案生成方法、装置、***、电子设备及介质
CN108921216A (zh) 一种图像分类模型的处理方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40021951

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant