基于人工智能和互联网的数据分析方法及云计算服务平台
技术领域
本公开涉及人工智能和互联网技术领域,具体而言,涉及一种基于人工智能和互联网的数据分析方法及云计算服务平台。
背景技术
随着大数据和互联网的发展,用户可以通过互联网进行图形搜索对象的搜索,在此过程中可以对用户的图形搜索对象相关联的各个图形单元库(例如与该图形搜索对象存在访问连续关系的用户访问的图形单元库)进行大数据分析,从而可以有效确定出用户在图形搜索过程中的意向画像,以便于后续的信息推荐。
然而发明人研究发现,目前的方案通常是对广义范围的图形单元库的交互过程进行大数据分析,由于图形单元库的数据量巨大,将产生巨大的计算量,不仅可能存在噪声数据的引入导致的画像分析准确度不高,同时还可能过度消耗云计算资源,降低云计算性能。
发明内容
为了至少克服现有技术中的上述不足,本公开的目的在于提供一种基于人工智能和互联网的数据分析方法及云计算服务平台,相较于传统方案中广义范围的图形单元库的交互过程进行大数据分析,可以避免引入过多的噪声数据导致的画像分析准确度不高的情况,提高大数据分析的针对性,同时还可以节省云计算资源,提高云计算性能,有效减少计算量。
第一方面,本公开提供一种基于人工智能和互联网的数据分析方法,应用于云计算服务平台,所述云计算服务平台与多个互联网访问设备通信连接,所述方法包括:
获取所述互联网访问设备发起目标图形搜索对象所对应的图形分类分级书签,其中,所述图形分类分级书签用于表征所述目标图形搜索对象在大数据分析书签下的图形分类分级信息;
根据所述图形分类分级书签对所述目标图形搜索对象中的各个图形单元库进行大数据分析,得到所述目标图形搜索对象中的各个图形单元库的图形交互行为信息以及所述图形交互行为信息对应的交互画像特征信息;
基于预先配置的人工智能推荐模型对所述图形交互行为信息对应的交互画像特征信息进行分类识别,得到所述图形交互行为信息对应的交互画像特征信息匹配的推荐内容项目;
将与所述推荐内容项目关联的热点推荐信息推送到对应的图形单元库的图形交互界面中。
在第一方面的一种可能的实现方式中,所述获取所述互联网访问设备发起目标图形搜索对象所对应的图形分类分级书签的步骤,包括:
从所述互联网访问设备中获取目标图形搜索对象在每个人工智能识别模型的人工智能识别结果下的图像分类标签,并按照预定的大数据收集分类对各个人工智能识别结果下的图像分类标签进行分类,分别生成每个大数据收集分类的图像分类标签序列;
根据所述目标图形搜索对象的用户搜索行为信息确定所述各个人工智能识别结果关联的目标图形分类分级书签,针对所述各个人工智能识别结果关联的目标图形分类分级书签,分别确定出所述目标图形分类分级书签的第一可索引分类书签在所对应的大数据收集分类的图像分类标签序列中的分级标签信息,得到所述目标图形分类分级书签的第一信息管理索引序列,所述目标图形分类分级书签为与所述目标图形搜索对象的用户搜索行为信息预先匹配的图形分类分级书签;
根据所述目标图形搜索对象的历史分级分类信息确定所述各个人工智能识别结果关联的关键图形分类分级书签,针对所述各个人工智能识别结果关联的关键图形分类分级书签,分别获取所述关键图形分类分级书签的第二可索引分类书签,并确定出所述第二可索引分类书签在所对应的大数据收集分类的图像分类标签序列中的分级标签信息,得到所述关键图形分类分级书签的第二信息管理索引序列,所述关键图形分类分级书签为所述目标图形搜索对象的历史分级分类信息中的分类频繁度大于设定频繁度阈值的图形分类分级书签,所述分类频繁度用于表示所述图形分类分级书签在单位时间内的搜索分类次数;
根据所述第一信息管理索引序列以及所述第二信息管理索引序列之间的匹配关系,确定所述目标图形搜索对象所对应的图形分类分级书签。
在第一方面的一种可能的实现方式中,所述根据所述第一信息管理索引序列以及所述第二信息管理索引序列之间的匹配关系,确定所述人工智能识别结果的每个相应的图形分类分级书签的步骤,包括:
将所述第一信息管理索引序列中每个目标图形分类分级书签的信息管理索引序列与所述第二信息管理索引序列中每个匹配的关键图形分类分级书签的信息管理索引序列进行匹配,得到多个匹配度,其中,所述第二信息管理索引序列中每个匹配的关键图形分类分级书签与对应的目标图形分类分级书签在各自的信息管理索引序列中的排列顺序匹配,所述匹配度根据所述目标图形分类分级书签的信息管理索引序列和匹配的关键图形分类分级书签的信息管理索引序列之间的重合度确定;
当任意一个目标图形分类分级书签的信息管理索引序列与匹配的关键图形分类分级书签的信息管理索引序列之间的匹配度大于设定匹配度时,将所述目标图形分类分级书签和所述关键图形分类分级书签作为一个大数据分析组合对象;
当任意一个目标图形分类分级书签的信息管理索引序列与匹配的关键图形分类分级书签的信息管理索引序列之间的匹配度不大于设定匹配度时,将所述目标图形分类分级书签和所述关键图形分类分级书签单独作为一个大数据分析独立对象;
将所述大数据分析组合对象和所述大数据分析独立对象所对应的图形分类分级书签确定为所述目标图形搜索对象所对应的图形分类分级书签。
在第一方面的一种可能的实现方式中,所述根据所述图形分类分级书签对所述目标图形搜索对象中的各个图形单元库进行大数据分析,得到所述目标图形搜索对象中的各个图形单元库的图形交互行为信息以及所述图形交互行为信息对应的交互画像特征信息的步骤,包括:
根据所述图形分类分级书签的预设大数据分析策略,以及所述所述目标图形搜索对象中的各个图形单元库的交互历史记录,从所述目标图形搜索对象中的各个图形单元库中获取至少一个待分析的候选单元数据区域和每个候选单元数据区域对应的交互行为记录节点;
在所述预设大数据分析策略对应的过往交互行为节点序列中,对初始过往交互行为节点进行分组,得到至少一个初始过往交互行为节点序列,对于所述至少一个初始过往交互行为节点序列中的任一初始过往交互行为节点序列,将所述任一初始过往交互行为节点序列的分组簇心对应的过往交互行为节点作为任一簇心节点,对于除所述初始过往交互行为节点外的任一过往交互行为节点,将所述任一过往交互行为节点添加至与所述任一过往交互行为节点相似度最大的簇心节点对应的初始过往交互行为节点序列中,当不存在未添加至初始过往交互行为节点序列中的过往交互行为节点时,得到每个簇心节点对应的过往交互行为节点序列;
对于任一候选单元数据区域对应的交互行为记录节点,基于所述交互行为记录节点与各个簇心节点的相似度,确定所述交互行为记录节点对应的至少一个目标簇心节点,并将各个目标簇心节点对应的过往交互行为节点序列的并集作为所述任一候选单元数据区域对应的第一候选过往交互行为节点序列;
基于至少一个候选单元数据区域中的各个候选单元数据区域对应的第一候选过往交互行为节点序列,获取所述至少一个候选单元数据区域中的各个候选单元数据区域的图形交互行为信息,作为所述目标图形搜索对象中的各个图形单元库的图形交互行为信息;
获取所述目标图形搜索对象中的各个图形单元库的图形交互行为信息的交互过程中的交互业务信息,并将所述交互业务信息转换为相应的结构化数据信息;
通过所述图形交互行为信息的编码节点,确定与所述结构化数据信息所对应的至少一个结构化项目的结构化特征向量;
通过所述图形交互行为信息的解码节点,根据所述至少一个结构化项目的结构化特征向量确定相应交互节点的交互处理信息,并将所述相应交互节点的交互处理信息转换为交互特征向量;
通过所述图形交互行为信息的解码节点,根据交互特征向量和对应的融合特征向量,生成与所述结构化项目的结构化特征向量相对应的画像标签以及所述画像标签的置信度;
根据所述交互处理信息的置信度,选取至少一个画像标签组成与所述结构化数据信息相对应的交互处理信息;
将所述交互处理信息转换为对应所述图形交互行为信息的新的交互业务信息,以得到所述图形交互行为信息对应的交互画像特征信息。
在第一方面的一种可能的实现方式中,所述基于至少一个候选单元数据区域中的各个候选单元数据区域对应的第一候选过往交互行为节点序列,获取所述至少一个候选单元数据区域中的各个候选单元数据区域的图形交互行为信息的步骤,包括:
当所述至少一个候选单元数据区域的数量小于设定数量时,对于所述任一候选单元数据区域,在所述任一候选单元数据区域对应的第一候选过往交互行为节点序列中对所述任一候选单元数据区域进行分析,得到所述任一候选单元数据区域的图形交互行为信息。
在第一方面的一种可能的实现方式中,所述基于至少一个候选单元数据区域中的各个候选单元数据区域对应的第一候选过往交互行为节点序列,获取所述至少一个候选单元数据区域中的各个候选单元数据区域的图形交互行为信息的步骤,包括:
当所述至少一个候选单元数据区域的数量不小于设定数量时,基于所述至少一个候选单元数据区域,确定包括第一目标数量的候选单元数据区域的全部目标区域序列;
获取所述全部目标区域序列中的任一目标区域序列对应的过往交互行为节点数量;
基于所述全部目标区域序列中的各个目标区域序列对应的过往交互行为节点数量,将所述至少一个候选单元数据区域划分为第二目标数量的候选单元数据区域集,所述第二目标数量为所述至少一个候选单元数据区域的数量与所述第一目标数量的比值;
对于任一候选单元数据区域集,将所述任一候选单元数据区域集中的各个候选单元数据区域对应的第一候选过往交互行为节点序列的并集作为所述任一候选单元数据区域集对应的第二候选过往交互行为节点序列;
在所述任一候选单元数据区域集对应的第二候选过往交互行为节点序列中对所述任一候选单元数据区域集中的各个候选单元数据区域进行分析,得到所述任一候选单元数据区域集中的各个候选单元数据区域的图形交互行为信息。
在第一方面的一种可能的实现方式中,所述基于所述全部目标区域序列中的各个目标区域序列对应的过往交互行为节点数量,将所述至少一个候选单元数据区域划分为第二目标数量的候选单元数据区域集的步骤,包括:
基于所述全部目标区域序列中的各个目标区域序列对应的过往交互行为节点数量,确定各个第一交互行为节点序列对应的过往交互行为节点数量,任一第一交互行为节点序列中包括满足第一条件的两个目标区域序列中的候选单元数据区域;
基于所述各个第一交互行为节点序列对应的过往交互行为节点数量和所述各个目标区域序列对应的过往交互行为节点数量,确定各个第二交互行为节点序列对应的过往交互行为节点数量,任一第二交互行为节点序列中包括满足第二条件的三个目标区域序列中的候选单元数据区域;
以此类推,直至确定包括全部候选单元数据区域的最终交互行为节点序列对应的过往交互行为节点数量;
基于所述最终交互行为节点序列对应的过往交互行为节点数量进行反向推导,确定与所述最终交互行为节点序列对应的过往交互行为节点数量对应的第二目标数量的目标区域序列;
根据所述第二目标数量的目标区域序列,将所述至少一个候选单元数据区域划分为第二目标数量的候选单元数据区域集。
在第一方面的一种可能的实现方式中,所述基于所述全部目标区域序列中的各个目标区域序列对应的过往交互行为节点数量,将所述至少一个候选单元数据区域划分为第二目标数量的候选单元数据区域集的步骤,包括:
基于所述全部目标区域序列中的各个目标区域序列对应的过往交互行为节点数量,确定各个第一交互行为节点序列对应的过往交互行为节点数量,任一第一交互行为节点序列中包括满足第一条件的两个目标区域序列中的候选单元数据区域;
基于所述各个第一交互行为节点序列对应的过往交互行为节点数量和所述各个目标区域序列对应的过往交互行为节点数量,确定各个第二交互行为节点序列对应的过往交互行为节点数量,任一第二交互行为节点序列中包括满足第二条件的三个目标区域序列中的候选单元数据区域;
以此类推,直至确定各个中间交互行为节点序列对应的过往交互行为节点数量,任一中间交互行为节点序列中包括一半数量的候选单元数据区域;
基于所述各个中间交互行为节点序列对应的过往交互行为节点数量,确定包括全部候选单元数据区域的最终交互行为节点序列对应的过往交互行为节点数量;
基于所述最终交互行为节点序列对应的过往交互行为节点数量进行反向推导,确定与所述最终交互行为节点序列对应的过往交互行为节点数量对应的第二目标数量的目标区域序列;
根据所述第二目标数量的目标区域序列,将所述至少一个候选单元数据区域划分为第二目标数量的候选单元数据区域集。
在第一方面的一种可能的实现方式中,所述基于预先配置的人工智能推荐模型对所述图形交互行为信息对应的交互画像特征信息进行分类识别,得到所述图形交互行为信息对应的交互画像特征信息匹配的推荐内容项目的步骤,包括:
将所述图形交互行为信息对应的交互画像特征信息输入到所述预先配置的人工智能推荐模型中,提取所述图形交互行为信息对应的交互画像特征信息对应的画像推荐特征向量;
将所述画像推荐特征向量输入到所述预先配置的人工智能推荐模型的分类层进行推荐内容项目分类,得到所述画像推荐特征向量在每个推荐内容项目的分类置信度值;
将分类置信度值大于设定置信度值的推荐内容项目确定为所述图形交互行为信息对应的交互画像特征信息匹配的推荐内容项目。
第二方面,本公开实施例还提供一种基于人工智能和互联网的数据分析装置,应用于云计算服务平台,所述云计算服务平台与多个互联网访问设备通信连接,所述装置包括:
获取模块,用于获取所述互联网访问设备发起目标图形搜索对象所对应的图形分类分级书签,其中,所述图形分类分级书签用于表征所述目标图形搜索对象在大数据分析书签下的图形分类分级信息;
大数据分析模块,用于根据所述图形分类分级书签对所述目标图形搜索对象中的各个图形单元库进行大数据分析,得到所述目标图形搜索对象中的各个图形单元库的图形交互行为信息以及所述图形交互行为信息对应的交互画像特征信息;
分类识别模块,用于基于预先配置的人工智能推荐模型对所述图形交互行为信息对应的交互画像特征信息进行分类识别,得到所述图形交互行为信息对应的交互画像特征信息匹配的推荐内容项目;
推送模块,用于将与所述推荐内容项目关联的热点推荐信息推送到对应的图形单元库的图形交互界面中。
第三方面,本公开实施例还提供一种基于人工智能和互联网的数据分析***,所述基于人工智能和互联网的数据分析***包括云计算服务平台以及与所述云计算服务平台通信连接的多个互联网访问设备;
所述云计算服务平台用于获取所述互联网访问设备发起目标图形搜索对象所对应的图形分类分级书签,其中,所述图形分类分级书签用于表征所述目标图形搜索对象在大数据分析书签下的图形分类分级信息;
所述云计算服务平台用于根据所述图形分类分级书签对所述目标图形搜索对象中的各个图形单元库进行大数据分析,得到所述目标图形搜索对象中的各个图形单元库的图形交互行为信息以及所述图形交互行为信息对应的交互画像特征信息;
所述云计算服务平台用于基于预先配置的人工智能推荐模型对所述图形交互行为信息对应的交互画像特征信息进行分类识别,得到所述图形交互行为信息对应的交互画像特征信息匹配的推荐内容项目;
所述云计算服务平台用于将与所述推荐内容项目关联的热点推荐信息推送到对应的图形单元库的图形交互界面中。
第四方面,本公开实施例还提供一种云计算服务平台,所述云计算服务平台包括处理器、机器可读存储介质和网络接口,所述机器可读存储介质、所述网络接口以及所述处理器之间通过总线***相连,所述网络接口用于与至少一个互联网访问设备通信连接,所述机器可读存储介质用于存储程序、指令或代码,所述处理器用于执行所述机器可读存储介质中的程序、指令或代码,以执行第一方面或者第一方面中任意一个可能的设计中的基于人工智能和互联网的数据分析方法。
第五方面,本公开实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其被执行时,使得计算机执行上述第一方面或者第一方面中任意一个可能的设计中的基于人工智能和互联网的数据分析方法。
基于上述任意一个方面,本公开通过获取互联网访问设备发起目标图形搜索对象所对应的图形分类分级书签,以通过图形分类分级书签用于表征目标图形搜索对象在大数据分析书签下的图形分类分级信息,然后根据图形分类分级书签对目标图形搜索对象中的各个图形单元库进行大数据分析,从而进行画像识别后进行信息推荐,相较于传统方案中广义范围的图形单元库的交互过程进行大数据分析,可以避免引入过多的噪声数据导致的画像分析准确度不高的情况,提高大数据分析的针对性,同时还可以节省云计算资源,提高云计算性能,有效减少计算量。冲时间。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它相关的附图。
图1为本公开实施例提供的基于人工智能和互联网的数据分析***的应用场景示意图;
图2为本公开实施例提供的基于人工智能和互联网的数据分析方法的流程示意图;
图3为本公开实施例提供的基于人工智能和互联网的数据分析装置的功能模块示意图;
图4为本公开实施例提供的用于实现上述的基于人工智能和互联网的数据分析方法的云计算服务平台的结构示意框图。
具体实施方式
下面结合说明书附图对本公开进行具体说明,方法实施例中的具体操作方法也可以应用于装置实施例或***实施例中。
图1是本公开一种实施例提供的基于人工智能和互联网的数据分析***10的交互示意图。基于人工智能和互联网的数据分析***10可以包括云计算服务平台100以及与所述物联网云云计算服务平台100通信连接的互联网访问设备200。图1所示的基于人工智能和互联网的数据分析***10仅为一种可行的示例,在其它可行的实施例中,该基于人工智能和互联网的数据分析***10也可以仅包括图1所示组成部分的其中一部分或者还可以包括其它的组成部分。
本实施例中,互联网访问设备200可以包括移动设备、平板计算机、膝上型计算机等或其任意组合。在一些实施例中,移动设备可以包括智能家居设备、可穿戴设备、智能移动设备、虚拟现实设备、或增强现实设备等,或其任意组合。在一些实施例中,智能家居设备可以包括智能电器设备的控制设备、智能监控设备、智能电视、智能摄像机等,或其任意组合。在一些实施例中,可穿戴设备可包括智能手环、智能鞋带、智能玻璃、智能头盔、智能手表、智能服装、智能背包、智能配件等,或其任何组合。在一些实施例中,智能移动设备可以包括智能手机、个人数字助理、游戏设备等,或其任意组合。在一些实施例中,虚拟现实设备和/或增强现实设备可以包括虚拟现实头盔、虚拟现实玻璃、虚拟现实贴片、增强现实头盔、增强现实玻璃、或增强现实贴片等,或其任意组合。例如,虚拟现实设备和/或增强现实设备可以包括各种虚拟现实产品等。
本实施例中,基于人工智能和互联网的数据分析***10中的物联网云云计算服务平台100和互联网访问设备200可以通过配合执行以下方法实施例所描述的物联网移动基站的网络安全防护方法,具体云计算服务平台100和互联网访问设备200的执行步骤部分可以参照以下方法实施例的详细描述。
本实施例中,上述的基于人工智能和互联网的数据分析***10可以在各种应用场景下实现,例如区块链应用场景、智能家居应用场景、智能控制应用场景等。
为了解决前述背景技术中的技术问题,图2为本公开实施例提供的基于人工智能和互联网的数据分析方法的流程示意图,本实施例提供的基于人工智能和互联网的数据分析方法可以由图1中所示的云计算服务平台100执行,还应理解,在本公开的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本公开实施例的实施过程构成任何限定。下面对该基于人工智能和互联网的数据分析方法进行详细介绍。
步骤S110,获取互联网访问设备200发起目标图形搜索对象所对应的图形分类分级书签。
步骤S120,根据图形分类分级书签对目标图形搜索对象中的各个图形单元库进行大数据分析,得到目标图形搜索对象中的各个图形单元库的图形交互行为信息以及图形交互行为信息对应的交互画像特征信息。
步骤S130,基于预先配置的人工智能推荐模型对图形交互行为信息对应的交互画像特征信息进行分类识别,得到图形交互行为信息对应的交互画像特征信息匹配的推荐内容项目。
步骤S140,将与推荐内容项目关联的热点推荐信息推送到对应的图形单元库的图形交互界面中。
本实施例中,图形分类分级书签可以用于表征目标图形搜索对象在大数据分析书签下的图形分类分级信息。例如,大数据分析书签可以是指预先配置的在进行大数据分析时的标记业务位置。
本实施例中,目标图形搜索对象可以是扫描拍照类图形搜索对象(例如用户通过某个浏览器发起对某些对象的扫描)、图像上传类图形搜索对象(例如用户通过某个识别工具上传某些对象)等,在此不作详细限定。
本实施例中,预先配置的人工智能推荐模型可以基于训练样本(例如交互画像特征信息)和对应的训练标签(例如推荐内容项目)训练得到,具体的训练方式可以采用现有通用的训练方案,此处不是本公开实施例的重点,在此不做赘述。
本实施例中,将与推荐内容项目关联的热点推荐信息推送到对应的图形单元库的图形交互界面中,详细方式可以是指:当用户访问进入图形单元库的图形交互界面中时,为了便于给予用户更好的信息服务体验,可以将与推荐内容项目关联的热点推荐信息展示到图形交互界面中相关的推荐页面中,以便于用户了解自己感兴趣的内容,提高用户体验。
基于上述步骤,本实施例通过获取互联网访问设备200发起目标图形搜索对象所对应的图形分类分级书签,以通过图形分类分级书签用于表征目标图形搜索对象在大数据分析书签下的图形分类分级信息,然后根据图形分类分级书签对目标图形搜索对象中的各个图形单元库进行大数据分析,从而进行画像识别后进行信息推荐,相较于传统方案中广义范围的图形单元库的交互过程进行大数据分析,可以避免引入过多的噪声数据导致的画像分析准确度不高的情况,提高大数据分析的针对性,同时还可以节省云计算资源,提高云计算性能,有效减少计算量。
在一种可能的实现方式中,对于步骤S110而言,经本申请发明人研究发现,在传统方案中,通常并未考虑到不同大数据收集分类的差异,从而容易造成分类过程中出现多分类冲突的情况,并且在分类过程中,用户可能会有需求基于前面大数据分析时的历史分类情况基于一些关键的图形分类分级书签对图像单元库进行更为准确快速的大数据处理,然而传统方案中无法满足此需求,进而对于用户而言,在实际大数据分类过程中可能导致每次缓冲时间较长。
为了解决此问题,步骤S110可以通过以下的示例性子步骤来实现,详细描述如下。
子步骤S111,从互联网访问设备200中获取目标图形搜索对象在每个人工智能识别模型的人工智能识别结果下的图像分类标签,并按照预定的大数据收集分类对各个人工智能识别结果下的图像分类标签进行分类,分别生成每个大数据收集分类的图像分类标签序列。
子步骤S112,根据目标图形搜索对象的用户搜索行为信息确定各个人工智能识别结果关联的目标图形分类分级书签,针对各个人工智能识别结果关联的目标图形分类分级书签,分别确定出目标图形分类分级书签的第一可索引分类书签在所对应的大数据收集分类的图像分类标签序列中的分级标签信息,得到目标图形分类分级书签的第一信息管理索引序列。
子步骤S113,根据目标图形搜索对象的历史分级分类信息确定各个人工智能识别结果关联的关键图形分类分级书签,针对各个人工智能识别结果关联的关键图形分类分级书签,分别获取关键图形分类分级书签的第二可索引分类书签,并确定出第二可索引分类书签在所对应的大数据收集分类的图像分类标签序列中的分级标签信息,得到关键图形分类分级书签的第二信息管理索引序列。
子步骤S114,根据第一信息管理索引序列以及第二信息管理索引序列之间的匹配关系,确定目标图形搜索对象所对应的图形分类分级书签。
本实施例中,目标图形分类分级书签为可以与目标图形搜索对象的用户搜索行为信息预先匹配的图形分类分级书签,详细地,针对不同的目标图形搜索对象(例如扫描拍照类图形搜索对象、图像上传类图形搜索对象等)而言,即可根据各自业务使用需求的不同预设对应的不同的图形分类分级书签。例如,图形分类分级书签可以包括分类标签和和分类标签所在的分级标签。
本实施例中,关键图形分类分级书签可以为目标图形搜索对象的历史分级分类信息中的分类频繁度大于设定频繁度阈值的图形分类分级书签,分类频繁度可以用于表示图形分类分级书签在单位时间内的搜索分类次数。上述的业务使用需求可以根据实际需求进行确定,例如可以包括信息检索、信息分析、信息填充等,在此不作具体限定。
本实施例中,人工智能识别模型可以预先通过各种图形搜索对象的训练样本进行训练获得,并且可以训练识别不同类型的图形对象的人工智能识别模型,从而可以识别出目标图形搜索对象的人工智能识别结果下的图像分类标签。
基于上述子步骤,本实施例通过基于预定的大数据收集分类对各个人工智能识别结果下的图像分类标签进行分类,从而考虑到不同大数据收集分类的差异,改善分类过程中出现多分类冲突的情况,此外通过结合目标图形搜索对象的用户搜索行为信息和历史分级分类信息,以对比二者图形分类分级书签的信息管理索引序列后基于人工智能识别结果的每个相应的图形分类分级书签分别对目标图形搜索对象中的各个图形单元库进行大数据分析,可以便于基于前面大数据分析时的历史分类情况,从而基于一些关键的图形分类分级书签对图像单元库进行更为准确快速的大数据处理,提高大数据分析效率,减少缓冲时间。
在一种可能的实现方式中,针对步骤S111,为了提高划分的精确度,并且减少冗余信息以提高分类准确度,可以通过以下的示例性子步骤进一步实现,详细描述如下。
子步骤S1111,获取每个预定的大数据收集分类所对应的分类目标,形成每个预定的大数据收集分类的分类目标序列,并获取各个人工智能识别结果的每个目标分类目标与分类目标序列的分类目标的关联分类目标信息。
子步骤S1112,根据目标分类目标与分类目标序列的分类目标的关联分类目标信息,计算每种目标大数据收集分类的关键分类目标的密集度,并根据每种目标大数据收集分类的关键分类目标的密集度,从分类目标序列中选取分类目标,得到初始分类目标排列分布。
子步骤S1113,若初始分类目标排列分布的总分类目标分布密集度大于总分类目标分布密集度要求的最大总分类目标分布密集度,则将初始分类目标排列分布中的第一关键分类目标分散到第一分布密集度,并且将初始分类目标排列分布中的第二关键分类目标聚集到第一分布密集度。
例如,在一种可能的示例中,第二关键分类目标可以是指关键分类目标在所在的标签分级的标签密集程度(例如标签在单位区域的数量)小于设定程度的关键分类目标,第一关键分类目标是指关键分类目标在所在的标签分级的标签密集程度不小于设定程度的关键分类目标。
子步骤S1114,计算本次更新后的初始分类目标排列分布的总分类目标分布密集度。
子步骤S1115,若本次更新后的初始分类目标排列分布的总分类目标分布密集度大于最大总分类目标分布密集度,则再一次对本次更新后的初始分类目标排列分布执行以上处理。
子步骤S1116,若本次更新后的初始分类目标排列分布的总分类目标分布密集度小于或者等于最大总分类目标分布密集度,则将本次更新前的初始分类目标排列分布作为第一更新排列分布,按照大数据收集分类由低优先级到高优先级的顺序将各目标大数据收集分类进行排序,得到目标大数据收集分类序列。
子步骤S1117,根据目标大数据收集分类序列对各个人工智能识别结果下的图像分类标签进行分类,分别生成每个大数据收集分类的图像分类标签序列。
在一种可能的实现方式中,针对步骤S112,为了准确获得目标图形分类分级书签的第一信息管理索引序列,可以通过以下示例性的实施方式来实现,详细描述如下。
子步骤S1121,针对各个人工智能识别结果关联的目标图形分类分级书签,分别获取与目标图形分类分级书签匹配的索引运行脚本,并获取索引运行脚本在预设时间段内持续索引查找该人工智能识别结果中的一个标签分类对象对应的对象实体时所对应的标签分类对象作为目标标签分类对象。
子步骤S1122,判断目标标签分类对象的分类索引查找特征与预设的信息管理索引单元的索引节点的分类索引查找特征是否匹配,若分类索引查找特征不匹配,则将目标标签分类对象的分类索引查找特征调整到与信息管理索引单元的索引节点的分类索引查找特征匹配的标签分类对象,输入到信息管理索引单元。
子步骤S1123,采用信息管理索引单元对输入的标签分类对象进行计算,获取与输入的标签分类对象对应的分级标签信息,并对目标标签分类对象中目标图形分类分级书签的每个标签标注信息进行扩展,获取目标标签分类对象中每个标签标注信息的标签扩展信息。
子步骤S1124,将与输入的标签分类对象对应的分级标签信息中标签标注信息的频繁度大于预设频繁度的分级标签确定为第一可索引分类书签,并对输入的标签分类对象中每个标签标注信息的标签特征向量进行转换,获取输入的标签分类对象中每个标签标注信息的标签扩展信息。
子步骤S1125,根据目标标签分类对象中每个标签标注信息的标签扩展信息,确定整个标签分类对象的第一标签扩展信息序列,并根据第一可索引分类书签中每个标签标注信息的标签扩展信息,确定第一可索引分类书签的第二标签扩展信息序列。
子步骤S1126,根据第一标签扩展信息序列、第二标签扩展信息序列和预设比例确定第一可索引分类书签的标签扩展信息序列,并根据目标标签分类对象中每个标签标注信息的标签扩展信息和标签扩展信息序列确定出目标图形分类分级书签的第一可索引分类书签在所对应的大数据收集分类的图像分类标签序列中的分级标签信息,得到目标图形分类分级书签的第一信息管理索引序列。
在一种可能的实现方式中,针对子步骤S114而言,可以通过以下示例性的实施方式中实现,详细描述如下。
子步骤S1141,将第一信息管理索引序列中每个目标图形分类分级书签的信息管理索引序列与第二信息管理索引序列中每个匹配的关键图形分类分级书签的信息管理索引序列进行匹配,得到多个匹配度。
例如,第二信息管理索引序列中每个匹配的关键图形分类分级书签与对应的目标图形分类分级书签在各自的信息管理索引序列中的排列顺序匹配,匹配度根据目标图形分类分级书签的信息管理索引序列和匹配的关键图形分类分级书签的信息管理索引序列之间的重合度确定。
子步骤S1142,当任意一个目标图形分类分级书签的信息管理索引序列与匹配的关键图形分类分级书签的信息管理索引序列之间的匹配度大于设定匹配度时,将目标图形分类分级书签和关键图形分类分级书签作为一个大数据分析组合对象。
子步骤S1143,当任意一个目标图形分类分级书签的信息管理索引序列与匹配的关键图形分类分级书签的信息管理索引序列之间的匹配度不大于设定匹配度时,将目标图形分类分级书签和关键图形分类分级书签单独作为一个大数据分析独立对象。
子步骤S1144,将大数据分析组合对象和大数据分析独立对象所对应的图形分类分级书签确定为目标图形搜索对象所对应的图形分类分级书签。
如此,通过结合目标图形搜索对象的用户搜索行为信息和历史分级分类信息,以对比二者图形分类分级书签的信息管理索引序列后基于人工智能识别结果的每个相应的图形分类分级书签分别对目标图形搜索对象中的各个图形单元库进行大数据分析,可以便于基于前面大数据分析时的历史分类情况,从而基于一些关键的图形分类分级书签对图像单元库进行更为准确快速的大数据处理,提高大数据分析效率,减少缓冲时间。
在此值得特别说明的是,在确定各个人工智能识别结果关联的关键图形分类分级书签之后,本实施例可以按照前述实施例中得到目标图形分类分级书签的第一信息管理索引序列的类似的操作方式进一步得到关键图形分类分级书签的第二信息管理索引序列,由于在此之前已经对此进行了详细阐述,因此在此不再赘述。
在一种可能的实现方式中,针对子步骤S120而言,为了进一步减少分析过程的计算量,可以通过以下示例性的实施方式中实现,详细描述如下。
子步骤S121,根据图形分类分级书签的预设大数据分析策略,以及目标图形搜索对象中的各个图形单元库的交互历史记录,从目标图形搜索对象中的各个图形单元库中获取至少一个待分析的候选单元数据区域和每个候选单元数据区域对应的交互行为记录节点。
本实施例中,例如可以根据图形分类分级书签的预设大数据分析策略获取目标图形搜索对象中的各个图形单元库的交互历史记录的目标记录对象,然后从目标图形搜索对象中的各个图形单元库中获取与目标记录对象匹配的数据区域作为至少一个待分析的候选单元数据区域,然后再继续获取每个候选单元数据区域对应的交互行为记录节点。
本实施例中,交互行为记录节点可以理解为在每次交互行为时的一个交互过程记录单位。
子步骤S122,在预设大数据分析策略对应的过往交互行为节点序列中,对初始过往交互行为节点进行分组,得到至少一个初始过往交互行为节点序列,对于至少一个初始过往交互行为节点序列中的任一初始过往交互行为节点序列,将任一初始过往交互行为节点序列的分组簇心对应的过往交互行为节点作为任一簇心节点,对于除初始过往交互行为节点外的任一过往交互行为节点,将任一过往交互行为节点添加至与任一过往交互行为节点相似度最大的簇心节点对应的初始过往交互行为节点序列中,当不存在未添加至初始过往交互行为节点序列中的过往交互行为节点时,得到每个簇心节点对应的过往交互行为节点序列。
本实施例中,交互行为节点可以理解为每次交互行为时的一个交互过程记录单位下的某个具体的交互行为。
子步骤S123,对于任一候选单元数据区域对应的交互行为记录节点,基于交互行为记录节点与各个簇心节点的相似度,确定交互行为记录节点对应的至少一个目标簇心节点,并将各个目标簇心节点对应的过往交互行为节点序列的并集作为任一候选单元数据区域对应的第一候选过往交互行为节点序列。
本实施例中,交互行为记录节点与各个簇心节点的相似度可以基于业交互行为记录节点与各个簇心节点之间的业务的重合度进行确定,在此不作详细限制。
子步骤S124,基于至少一个候选单元数据区域中的各个候选单元数据区域对应的第一候选过往交互行为节点序列,获取至少一个候选单元数据区域中的各个候选单元数据区域的图形交互行为信息,作为目标图形搜索对象中的各个图形单元库的图形交互行为信息。
本实施例中,图形交互行为信息可以是指交互行为下的图形互动变化信息。
示例性地,当至少一个候选单元数据区域的数量小于设定数量时,对于任一候选单元数据区域,在任一候选单元数据区域对应的第一候选过往交互行为节点序列中对任一候选单元数据区域进行分析,得到任一候选单元数据区域的图形交互行为信息。
再例如,当至少一个候选单元数据区域的数量不小于设定数量时,可以基于至少一个候选单元数据区域,确定包括第一目标数量的候选单元数据区域的全部目标区域序列。然后,获取全部目标区域序列中的任一目标区域序列对应的过往交互行为节点数量,并基于全部目标区域序列中的各个目标区域序列对应的过往交互行为节点数量,将至少一个候选单元数据区域划分为第二目标数量的候选单元数据区域集,第二目标数量为至少一个候选单元数据区域的数量与第一目标数量的比值。
在此基础上,对于任一候选单元数据区域集,可以将任一候选单元数据区域集中的各个候选单元数据区域对应的第一候选过往交互行为节点序列的并集作为任一候选单元数据区域集对应的第二候选过往交互行为节点序列。并且,在任一候选单元数据区域集对应的第二候选过往交互行为节点序列中对任一候选单元数据区域集中的各个候选单元数据区域进行分析,得到任一候选单元数据区域集中的各个候选单元数据区域的图形交互行为信息。
子步骤S125,获取目标图形搜索对象中的各个图形单元库的图形交互行为信息的交互过程中的交互业务信息,并将交互业务信息转换为相应的结构化数据信息。
子步骤S126,通过图形交互行为信息的编码节点,确定与结构化数据信息所对应的至少一个结构化项目的结构化特征向量。
子步骤S127,通过图形交互行为信息的解码节点,根据至少一个结构化项目的结构化特征向量确定相应交互节点的交互处理信息,并将相应交互节点的交互处理信息转换为交互特征向量。
子步骤S128,通过图形交互行为信息的解码节点,根据交互特征向量和对应的融合特征向量,生成与结构化项目的结构化特征向量相对应的画像标签以及画像标签的置信度。
子步骤S129,根据交互处理信息的置信度,选取至少一个画像标签组成与结构化数据信息相对应的交互处理信息。
子步骤S1295,将交互处理信息转换为对应图形交互行为信息的新的交互业务信息,以得到图形交互行为信息对应的交互画像特征信息。
在一种可能的示例中,在基于全部目标区域序列中的各个目标区域序列对应的过往交互行为节点数量,将至少一个候选单元数据区域划分为第二目标数量的候选单元数据区域集的过程中,本实施例可以基于全部目标区域序列中的各个目标区域序列对应的过往交互行为节点数量,确定各个第一交互行为节点序列对应的过往交互行为节点数量,任一第一交互行为节点序列中包括满足第一条件的两个目标区域序列中的候选单元数据区域。
然后,基于各个第一交互行为节点序列对应的过往交互行为节点数量和各个目标区域序列对应的过往交互行为节点数量,确定各个第二交互行为节点序列对应的过往交互行为节点数量,任一第二交互行为节点序列中包括满足第二条件的三个目标区域序列中的候选单元数据区域。
以此类推,直至确定包括全部候选单元数据区域的最终交互行为节点序列对应的过往交互行为节点数量。
由此,可以基于最终交互行为节点序列对应的过往交互行为节点数量进行反向推导,确定与最终交互行为节点序列对应的过往交互行为节点数量对应的第二目标数量的目标区域序列,然后根据第二目标数量的目标区域序列,将至少一个候选单元数据区域划分为第二目标数量的候选单元数据区域集。
在另一种可能的示例中,在基于全部目标区域序列中的各个目标区域序列对应的过往交互行为节点数量,将至少一个候选单元数据区域划分为第二目标数量的候选单元数据区域集的过程中,本实施例可以基于全部目标区域序列中的各个目标区域序列对应的过往交互行为节点数量,确定各个第一交互行为节点序列对应的过往交互行为节点数量,任一第一交互行为节点序列中包括满足第一条件的两个目标区域序列中的候选单元数据区域。
然后,基于各个第一交互行为节点序列对应的过往交互行为节点数量和各个目标区域序列对应的过往交互行为节点数量,确定各个第二交互行为节点序列对应的过往交互行为节点数量,任一第二交互行为节点序列中包括满足第二条件的三个目标区域序列中的候选单元数据区域。
以此类推,直至确定各个中间交互行为节点序列对应的过往交互行为节点数量,任一中间交互行为节点序列中包括一半数量的候选单元数据区域。
由此,可以基于各个中间交互行为节点序列对应的过往交互行为节点数量,确定包括全部候选单元数据区域的最终交互行为节点序列对应的过往交互行为节点数量。然后,基于最终交互行为节点序列对应的过往交互行为节点数量进行反向推导,确定与最终交互行为节点序列对应的过往交互行为节点数量对应的第二目标数量的目标区域序列。从而,可以根据第二目标数量的目标区域序列,将至少一个候选单元数据区域划分为第二目标数量的候选单元数据区域集。
在一种可能的实现方式中,针对子步骤S130而言,可以通过以下示例性的实施方式中实现,详细描述如下。
子步骤S131,将图形交互行为信息对应的交互画像特征信息输入到预先配置的人工智能推荐模型中,提取图形交互行为信息对应的交互画像特征信息对应的画像推荐特征向量。
子步骤S132,将画像推荐特征向量输入到预先配置的人工智能推荐模型的分类层进行推荐内容项目分类,得到画像推荐特征向量在每个推荐内容项目的分类置信度值。
子步骤S133,将分类置信度值大于设定置信度值的推荐内容项目确定为图形交互行为信息对应的交互画像特征信息匹配的推荐内容项目。
可以理解的是,设定置信度值可以根据实际需求进行配置,例如可以配置为80,也即对于推荐内容项目A、推荐内容项目B、推荐内容项目C、推荐内容项目D、推荐内容项目E而言,假设推荐内容项目A、推荐内容项目B、推荐内容项目C、推荐内容项目D、推荐内容项目E各自对应的置信度为60、83、77、92、85,那么匹配的推荐内容项目则可以配置为推荐内容项目B、推荐内容项目D、推荐内容项目E。
当然值得说明的是,在一些可能的实施方式中,上述的推荐内容项目可以为多级菜单,也即可以进一步针对推荐内容项目B、推荐内容项目D、推荐内容项目E下的推荐内容子项目(例如推荐内容子项目B1、推荐内容子项目B2、推荐内容子项目D1、推荐内容子项目E1等)进行进一步的分类置信度判断,从而确定更为精确的推荐内容子项目来进行后续的信息推荐,进一步提高用户体验。
图3为本公开实施例提供的基于人工智能和互联网的数据分析装置300的功能模块示意图,本实施例可以根据上述云计算服务平台100执行的方法实施例对该基于人工智能和互联网的数据分析装置300进行功能模块的划分,也即该基于人工智能和互联网的数据分析装置300所对应的以下各个功能模块可以用于执行上述云计算服务平台100执行的各个方法实施例。其中,该基于人工智能和互联网的数据分析装置300可以包括获取模块310、大数据分析模块320、分类识别模块330以及推送模块340,下面分别对该基于人工智能和互联网的数据分析装置300的各个功能模块的功能进行详细阐述。
获取模块310,用于获取所述互联网访问设备发起目标图形搜索对象所对应的图形分类分级书签,其中,所述图形分类分级书签用于表征所述目标图形搜索对象在大数据分析书签下的图形分类分级信息。其中,获取模块310可以用于执行上述的步骤S110,关于获取模块310的详细实现方式可以参照上述针对步骤S110的详细描述即可。
大数据分析模块320,用于根据所述图形分类分级书签对所述目标图形搜索对象中的各个图形单元库进行大数据分析,得到所述目标图形搜索对象中的各个图形单元库的图形交互行为信息以及所述图形交互行为信息对应的交互画像特征信息。其中,大数据分析模块320可以用于执行上述的步骤S120,关于大数据分析模块320的详细实现方式可以参照上述针对步骤S120的详细描述即可。
分类识别模块330,用于基于预先配置的人工智能推荐模型对所述图形交互行为信息对应的交互画像特征信息进行分类识别,得到所述图形交互行为信息对应的交互画像特征信息匹配的推荐内容项目。其中,分类识别模块330可以用于执行上述的步骤S130,关于分类识别模块330的详细实现方式可以参照上述针对步骤S130的详细描述即可。
推送模块340,用于将与所述推荐内容项目关联的热点推荐信息推送到对应的图形单元库的图形交互界面中。其中,推送模块340可以用于执行上述的步骤S140,关于推送模块340的详细实现方式可以参照上述针对步骤S140的详细描述即可。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现。也可以全部以硬件的形式实现。还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,获取模块310可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上获取模块310的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所描述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(application specific integrated circuit,ASIC),或,一个或多个微处理器(digital signal processor,DSP),或,一个或者多个现场可编程门阵列(field programmable gate array,FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(centralprocessing unit,CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上***(system-on-a-chip,SOC)的形式实现。
图4示出了本公开实施例提供的用于实现上述的基于人工智能和互联网的数据分析方法的云计算服务平台100的硬件结构示意图,如图4所示,云计算服务平台100可包括处理器110、机器可读存储介质120、总线130以及收发器140。
在具体实现过程中,至少一个处理器110执行所述机器可读存储介质120存储的计算机执行指令(例如图3中所示的基于人工智能和互联网的数据分析装置300包括的获取模块310、大数据分析模块320、分类识别模块330以及推送模块340),使得处理器110可以执行如上方法实施例的基于人工智能和互联网的数据分析方法,其中,处理器110、机器可读存储介质120以及收发器140通过总线130连接,处理器110可以用于控制收发器140的收发动作,从而可以与前述的互联网访问设备200进行数据收发。
处理器110的具体实现过程可参见上述云计算服务平台100执行的各个方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
在上述的图4所示的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,DSP)、专用集成电路(英文:ApplicationSpecificIntegrated Circuit,ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
机器可读存储介质120可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器。
总线130可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component Interconnect,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。总线130可以分为地址总线、数据总线、控制总线等。为便于表示,本公开附图中的总线并不限定仅有一根总线或一种类型的总线。
此外,本公开实施例还提供一种可读存储介质,所述可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上基于人工智能和互联网的数据分析方法。
上述的可读存储介质可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-OnlyMemory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DR RAM)。应注意,本文描述的***和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
还应理解,在本公开实施例和所附权利要求书中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开实施例。例如,在本公开实施例和所附权利要求书中所使用的单数形式的“一种”、“上述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
最后应说明的是:以上各实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述各实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各实施例技术方案的范围。