CN111985545B - 基于人工智能的目标数据检测方法、装置、设备及介质 - Google Patents
基于人工智能的目标数据检测方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN111985545B CN111985545B CN202010797375.0A CN202010797375A CN111985545B CN 111985545 B CN111985545 B CN 111985545B CN 202010797375 A CN202010797375 A CN 202010797375A CN 111985545 B CN111985545 B CN 111985545B
- Authority
- CN
- China
- Prior art keywords
- data
- target
- sub
- detected
- target data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 188
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 44
- 238000012706 support-vector machine Methods 0.000 claims abstract description 58
- 238000010845 search algorithm Methods 0.000 claims abstract description 33
- 238000012549 training Methods 0.000 claims description 46
- 238000012795 verification Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 18
- 238000000034 method Methods 0.000 claims description 17
- 239000003016 pheromone Substances 0.000 claims description 15
- 230000004044 response Effects 0.000 claims description 10
- 238000010276 construction Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 abstract description 14
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000004590 computer program Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000007726 management method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001680 brushing effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Technology Law (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及人工智能,提供一种基于人工智能的目标数据检测方法、装置、设备及介质,能够根据目标标签从待检测数据中选择数据构建目标数据集,从待检测数据中选择与子标签对应的数据构建子数据集,计算目标数据集与子数据集的交集得到子交集,结合全局搜索算法,以子交集训练单类支持向量机模型,得到检测模型,将待检测数据输入至检测模型,输出检测结果,整合检测结果为目标的数据作为目标数据,进而能够以人工智能的方式自动进行目标数据的检测及筛选,解决了筛选效率低、出错率高,且可靠性欠佳的问题。本发明还涉及区块链技术,检测模型及目标数据可存储于区块链。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于人工智能的目标数据检测方法、装置、设备及介质。
背景技术
目前,随着保险行业的飞速发展,代理人的队伍也日渐壮大,部分代理人存在代做或者代刷数据的情况(如:利用他人的设备做题等),进而产生大量虚假数据,这些虚假数据会造成较大的数据噪声,降低数据质量,进而由于真实性较低而影响数据的可用性,因此,如何进行快速且准确地目标数据检测成为了亟待解决的问题。
针对上述情况,业内通常采用的解决方式是以预先设置的规则进行数据的筛选,例如:人为设置筛选原则,保留符合该原则的数据,并删除不符合该原则的数据。上述方式仅依赖于人为定义的规则进行数据统计,不仅筛选效率低,且极易出错,导致最终的检测结果可靠性欠佳。
当采用机器自动进行目标数据的筛选时,由于训练样本难以获取,且传统的支持向量机模型的参数也难以确定,导致模型的性能不佳,模型的全局性及鲁棒性也均有待提高。
发明内容
鉴于以上内容,有必要提供一种基于人工智能的目标数据检测方法、装置、设备及介质,能够以人工智能的方式自动进行目标数据的检测及筛选,解决了筛选效率低、出错率高,且可靠性欠佳的问题。
一种基于人工智能的目标数据检测方法,所述基于人工智能的目标数据检测方法包括:
响应于接收到的目标数据检测指令,确定目标标签;
获取与待检测用户对应的待检测数据;
根据所述目标标签从所述待检测数据中选择数据构建目标数据集;
获取预先定义的至少一个子标签,并从所述待检测数据中选择与每个子标签对应的数据构建与每个子标签对应的至少一个子数据集;
计算所述目标数据集与所述至少一个子数据集的交集,得到至少一个子交集;
结合全局搜索算法,以所述至少一个子交集训练单类支持向量机模型,得到检测模型;
将所述待检测数据输入至所述检测模型,输出检测结果,其中,所述检测结果包括目标及非目标;
整合所述检测结果为目标的数据作为所述目标数据。
根据本发明优选实施例,所述确定目标标签包括以下一种或者多种方式的组合:
解析所述目标数据检测指令的方法体,得到所述目标数据检测指令所携带的数据,获取预设标签,以所述预设标签在所述目标数据检测指令所携带的数据中进行匹配,并将匹配的数据确定为所述目标标签;或者
获取历史目标数据,识别所述历史目标数据的关键字作为第一关键字,并计算所述第一关键字的出现频率,获取出现频率最高的第一关键字作为所述目标标签。
根据本发明优选实施例,所述根据所述目标标签从所述待检测数据中选择数据构建目标数据集包括:
识别所述待检测数据中每个数据的关键字作为第二关键字;
将所述待检测数据中带有相同的第二关键字的数据划分为一类,并以所述相同的第二关键字命名每个类别;
配置每个类别在对应的数据中的权重;
将权重大于或者等于配置权重的类别确定为对应的数据的目标类别;
以所述目标类别定义对应的数据的标签;
以所述目标标签在定义的标签中进行匹配,并获取与所述目标标签匹配的标签所对应的数据构建所述目标数据集。
根据本发明优选实施例,所述结合全局搜索算法,以所述至少一个子交集训练单类支持向量机模型,得到检测模型包括:
整合所述至少一个子交集中的数据,得到训练样本;
确定单类支持向量机模型的核函数,并确定所述核函数的初始参数;
采用所述全局搜索算法优化所述初始参数,得到优化后的单类支持向量机模型;
以所述训练样本训练所述优化后的单类支持向量机模型,得到所述检测模型。
根据本发明优选实施例,所述采用全局搜索算法优化所述初始参数,得到优化后的单类支持向量机模型包括:
确定所述全局搜索算法的最高迭代次数及搜索步长;
以所述初始参数为初始位置,并以所述搜索步长进行信息素的迭代搜索,直至达到所述最高迭代次数,停止搜索,得到当前信息素;
以所述当前信息素对应的位置作为优化后的参数替代所述初始参数,得到所述优化后的单类支持向量机模型。
根据本发明优选实施例,所述基于人工智能的目标数据检测方法还包括:
从所述目标数据集中随机获取数据构建验证集;
将所述验证集中的数据输入至所述检测模型中,输出第一检测结果;
获取所述第一检测结果为目标的数据,并计算获取的数据在所述验证集中所占的比例;
当所述比例大于或者等于配置比例时,确定所述检测模型通过验证,并将所述检测模型保存至区块链;或者
当所述比例小于所述配置比例时,确定所述检测模型未通过验证,更新所述至少一个子标签,并根据更新后的至少一个子标签更新所述至少一个子数据集,以更新后的所述至少一个子数据集对所述检测模型进行优化训练。
根据本发明优选实施例,在整合所述检测结果为目标的数据作为所述目标数据后,所述基于人工智能的目标数据检测方法还包括:
计算所述目标数据在所述待检测数据中的占比;
当所述占比低于配置占比时,根据所述占比生成警告信息;
确定所述待检测用户的关联用户;
将所述警告信息发送至所述待检测用户的终端设备及所述关联用户的终端设备。
一种基于人工智能的目标数据检测装置,所述基于人工智能的目标数据检测装置包括:
确定单元,用于响应于接收到的目标数据检测指令,确定目标标签;
获取单元,用于获取与待检测用户对应的待检测数据;
构建单元,用于根据所述目标标签从所述待检测数据中选择数据构建目标数据集;
所述构建单元,还用于获取预先定义的至少一个子标签,并从所述待检测数据中选择与每个子标签对应的数据构建与每个子标签对应的至少一个子数据集;
计算单元,用于计算所述目标数据集与所述至少一个子数据集的交集,得到至少一个子交集;
训练单元,用于结合全局搜索算法,以所述至少一个子交集训练单类支持向量机模型,得到检测模型;
输入单元,用于将所述待检测数据输入至所述检测模型,输出检测结果,其中,所述检测结果包括目标及非目标;
整合单元,用于整合所述检测结果为目标的数据作为所述目标数据。
一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现所述基于人工智能的目标数据检测方法。
一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现所述基于人工智能的目标数据检测方法。
由以上技术方案可以看出,本发明能够响应于接收到的目标数据检测指令,确定目标标签,获取与待检测用户对应的待检测数据,根据所述目标标签从所述待检测数据中选择数据构建目标数据集,获取预先定义的至少一个子标签,并从所述待检测数据中选择与每个子标签对应的数据构建与每个子标签对应的至少一个子数据集,计算所述目标数据集与所述至少一个子数据集的交集,得到至少一个子交集,结合全局搜索算法,以所述至少一个子交集训练单类支持向量机模型,得到检测模型,将所述待检测数据输入至所述检测模型,输出检测结果,其中,所述检测结果包括目标及非目标,整合检测结果为目标的数据作为所述目标数据,进而能够以人工智能的方式自动进行目标数据的检测及筛选,解决了筛选效率低、出错率高,且可靠性欠佳的问题。
附图说明
图1是本发明基于人工智能的目标数据检测方法的较佳实施例的流程图。
图2是本发明基于人工智能的目标数据检测装置的较佳实施例的功能模块图。
图3是本发明实现基于人工智能的目标数据检测方法的较佳实施例的电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
如图1所示,是本发明基于人工智能的目标数据检测方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
所述基于人工智能的目标数据检测方法应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific IntegratedCircuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能式穿戴式设备等。
所述电子设备还可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量主机或网络服务器构成的云。
所述电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
S10,响应于接收到的目标数据检测指令,确定目标标签。
在本发明的至少一个实施例中,所述目标数据检测指令可以由指定人员触发,以便根据实际需要执行。
当然,所述目标数据检测指令也可以被配置为周期性触发,以便定期筛选目标数据,避免其他相关业务场景在利用数据执行任务时,由于非目标数据产生噪声而影响任务的执行效果。
在本实施例中,当一个数据带有所述目标标签时,即可将该数据确定为目标数据。例如:所述目标标签可以为:执行过导入通讯录的操作等。
在本发明的至少一个实施例中,所述确定目标标签包括,但不限于以下一种或者多种方式的组合:
解析所述目标数据检测指令的方法体,得到所述目标数据检测指令所携带的数据,获取预设标签,以所述预设标签在所述目标数据检测指令所携带的数据中进行匹配,并将匹配的数据确定为所述目标标签;或者
通过上述实施方式,能够在所述目标数据检测指令中携带有所述目标标签时,以预设标签直接提取所述目标标签,既节约了数据处理的时间,又保证了所述目标标签的准确性。
获取历史目标数据,识别所述历史目标数据的关键字作为第一关键字,并计算所述第一关键字的出现频率,获取出现频率最高的第一关键字作为所述目标标签。
通过上述实施方式,能够在所述目标数据检测指令中没有携带所述目标标签时,通过历史目标数据确定所述目标标签。
当然,在其他实施例中,还可以采用其他方式确定所述目标标签,本发明不限制。
例如:接收用户上传的标签作为所述目标标签。
S11,获取与待检测用户对应的待检测数据。
在本实施例中,获取所述待检测用户的账号,并获取与所述账号对应的所有数据,将获取的数据确定为所述待检测数据。
可以理解的是,与所述账号对应的数据并不一定为所述待检测用户产生的数据,如果存在其他人登录所述待检测用户的账号进行操作,则所产生的数据并非所述待检测用户的实际数据,可被视为代刷或者代做的数据,即为非目标数据,而所述待检测用户的实际数据即为目标数据。
S12,根据所述目标标签从所述待检测数据中选择数据构建目标数据集。
在本实施例中,由于所述目标数据集中的数据都带有所述目标标签,因此,所述目标数据集中的数据均为目标数据。
在本发明的至少一个实施例中,所述根据所述目标标签从所述待检测数据中选择数据构建目标数据集包括:
识别所述待检测数据中每个数据的关键字作为第二关键字;
将所述待检测数据中带有相同的第二关键字的数据划分为一类,并以所述相同的第二关键字命名每个类别;
配置每个类别在对应的数据中的权重;
将权重大于或者等于配置权重的类别确定为对应的数据的目标类别;
以所述目标类别定义对应的数据的标签;
以所述目标标签在定义的标签中进行匹配,并获取与所述目标标签匹配的标签所对应的数据构建所述目标数据集。
所述配置权重可以根据实际需求进行自定义配置,本发明不限制。
其中,在以所述相同的关键字命名每个类别后,还需要给每个类别赋一定的权重,用来区分不同类别的重要程度,具体地,在确定权重时可以综合考虑多种数据指标,如:面谈次数、吸引面谈次数等。
S13,获取预先定义的至少一个子标签,并从所述待检测数据中选择与每个子标签对应的数据构建与每个子标签对应的至少一个子数据集。
其中,所述至少一个子标签属于对所述目标标签的扩展。
例如:所述至少一个子标签可以包括,但不限于:执行过AI面谈、有考勤记录。
需要说明的是,构建与每个子标签对应的至少一个子数据集的方式与构建所述目标数据集的方式类似,在此不赘述。
S14,计算所述目标数据集与所述至少一个子数据集的交集,得到至少一个子交集。
需要说明的是,同时带有所述至少一个子标签及所述目标标签的数据可以被确定为目标数据。
进一步地,执行交集处理后得到的所述至少一个子交集中的数据属于目标数据,可以以所述至少一个子交集中的数据对其他数据进行标注及提取,以检测出目标数据。
通过上述实施方式,能够在目标数据集的基础上进一步执行数据的扩展,以获取到充足的数据进行模型的训练,提升模型训练的效果。
S15,结合全局搜索算法,以所述至少一个子交集训练单类支持向量机(One-ClassSupport Vector Machine,One-Class SVM)模型,得到检测模型。
需要说明的是,在实际应用场景中,很多时候只能定义正样本,而不能定义负样本。例如:当通过用户的搜索记录预测该用户是否有小孩时,不能说用户没有搜索“宝宝”“早教”这一类的词,就判断该用户没有小孩,这是不绝对的。单类支持向量机模型即可以与该场景适配。
在本发明的至少一个实施例中,所述结合全局搜索算法,以所述至少一个子交集训练单类支持向量机模型,得到检测模型包括:
整合所述至少一个子交集中的数据,得到训练样本;
确定单类支持向量机模型的核函数,并确定所述核函数的初始参数;
采用所述全局搜索算法优化所述初始参数,得到优化后的单类支持向量机模型;
以所述训练样本训练所述优化后的单类支持向量机模型,得到所述检测模型。
通过上述实施方式,能够基于预先标注的子交集构建训练样本,并进一步以所述训练样本训练单类支持向量机模型,以便后续利用训练得到的检测模型对所述待检测数据的目标性进行智能检测。
另外,通常情况下,单类支持向量机模型的参数是难以确定的,本案采用全局搜索算法优化并确定所述单类支持向量机模型的参数,提高了所述单类支持向量机模型的全局性及鲁棒性。
具体地,所述采用全局搜索算法优化所述初始参数,得到优化后的单类支持向量机模型包括:
确定所述全局搜索算法的最高迭代次数及搜索步长;
以所述初始参数为初始位置,并以所述搜索步长进行信息素的迭代搜索,直至达到所述最高迭代次数,停止搜索,得到当前信息素;
以所述当前信息素对应的位置作为优化后的参数替代所述初始参数,得到所述优化后的单类支持向量机模型。
通过上述实施方式,能够以全局搜索算法自动确定所述单类支持向量机模型的参数,不仅提升了单类支持向量机模型的性能,且目标解决了单类支持向量机模型的参数难以确定的问题。
在本发明的至少一个实施例中,所述基于人工智能的目标数据检测方法还包括:
从所述目标数据集中随机获取数据构建验证集;
将所述验证集中的数据输入至所述检测模型中,输出第一检测结果;
获取所述第一检测结果为目标的数据,并计算获取的数据在所述验证集中所占的比例;
当所述比例大于或者等于配置比例时,确定所述检测模型通过验证,并将所述检测模型保存至区块链;或者
所述配置比例可以根据实际需求进行自定义配置,本发明不限制。
通过上述实施方式,能够以少量的目标数据对所述检测模型进行验证,以确保所述检测模型的可用性。
同时,将所述检测模型保存至区块链,以进一步保证所述检测模型的安全性。
当所述比例小于所述配置比例时,确定所述检测模型未通过验证,更新所述至少一个子标签,并根据更新后的至少一个子标签更新所述至少一个子数据集,以更新后的所述至少一个子数据集对所述检测模型进行优化训练。
通过上述实施方式,能够在所述检测模型未通过验证时,及时调整相应的标签优化训练所述检测模型,以增强所述检测模型的适应性,同时提高了所述检测模型的灵活性。
S16,将所述待检测数据输入至所述检测模型,输出检测结果,其中,所述检测结果包括目标及非目标。
具体地,当所述检测结果为第一标识(如:1或Y)时,确定所述检测结果为目标;或者当所述检测结果为第二标识(如:0或N)时,确定所述检测结果为非目标。
通过上述实施方式,能够以人工智能的方式自动进行目标数据的检测及筛选,解决了现有技术中依赖人为定义的规则进行数据统计所造成的筛选效率低、出错率高,且可靠性欠佳的问题。
S17,整合所述检测结果为目标的数据作为所述目标数据。
通过上述实施方式,能够结合人工智能手段自动从所述待检测数据中筛选出所有的目标数据,相较于传统的方式更加高效,且不易出错,实用性更强。
需要说明的是,为了防止数据被篡改,还可以将所述目标数据保存至区块链。
在本发明的至少一个实施例中,在整合所述检测结果为目标的数据作为所述目标数据后,所述基于人工智能的目标数据检测方法还包括:
计算所述目标数据在所述待检测数据中的占比;
当所述占比低于配置占比时,根据所述占比生成警告信息;
确定所述待检测用户的关联用户;
将所述警告信息发送至所述待检测用户的终端设备及所述关联用户的终端设备。
其中,所述警告信息用于警示所述待检测用户当前产生的非目标数据过多。
所述配置占比可以根据实际需求进行自定义配置,本发明不限制。
其中,所述关联用户可以包括,但不限于:所述待检测用户的上级领导、考勤管理人员。
通过上述实施方式,将所述警告信息发送至所述待检测用户的终端设备,能够起到对所述待检测用户的警示作用,避免再次出现违规行为,同时,将所述警告信息发送至所述关联用户的终端设备,能够引起相关人员的重视,并在出现问题时及时处理,避免问题扩大化,起到及时止损的作用。
由以上技术方案可以看出,本发明能够响应于接收到的目标数据检测指令,确定目标标签,获取与待检测用户对应的待检测数据,根据所述目标标签从所述待检测数据中选择数据构建目标数据集,获取预先定义的至少一个子标签,并从所述待检测数据中选择与每个子标签对应的数据构建与每个子标签对应的至少一个子数据集,计算所述目标数据集与所述至少一个子数据集的交集,得到至少一个子交集,结合全局搜索算法,以所述至少一个子交集训练单类支持向量机模型,得到检测模型,将所述待检测数据输入至所述检测模型,输出检测结果,其中,所述检测结果包括目标及非目标,整合检测结果为目标的数据作为所述目标数据,进而能够以人工智能的方式自动进行目标数据的检测及筛选,解决了筛选效率低、出错率高,且可靠性欠佳的问题。
如图2所示,是本发明基于人工智能的目标数据检测装置的较佳实施例的功能模块图。所述基于人工智能的目标数据检测装置11包括确定单元110、获取单元111、构建单元112、计算单元113、训练单元114、输入单元115、整合单元116。本发明所称的模块/单元是指一种能够被处理器13所执行,并且能够完成固定功能的一系列计算机程序段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
确定单元110响应于接收到的目标数据检测指令,确定目标标签。
在本发明的至少一个实施例中,所述目标数据检测指令可以由指定人员触发,以便根据实际需要执行。
当然,所述目标数据检测指令也可以被配置为周期性触发,以便定期筛选目标数据,避免其他相关业务场景在利用数据执行任务时,由于非目标数据产生噪声而影响任务的执行效果。
在本实施例中,当一个数据带有所述目标标签时,即可将该数据确定为目标数据。例如:所述目标标签可以为:执行过导入通讯录的操作等。
在本发明的至少一个实施例中,所述确定单元110确定目标标签包括,但不限于以下一种或者多种方式的组合:
解析所述目标数据检测指令的方法体,得到所述目标数据检测指令所携带的数据,获取预设标签,以所述预设标签在所述目标数据检测指令所携带的数据中进行匹配,并将匹配的数据确定为所述目标标签。
通过上述实施方式,能够在所述目标数据检测指令中携带有所述目标标签时,以预设标签直接提取所述目标标签,既节约了数据处理的时间,又保证了所述目标标签的准确性。
或者,获取历史目标数据,识别所述历史目标数据的关键字作为第一关键字,并计算所述第一关键字的出现频率,获取出现频率最高的第一关键字作为所述目标标签。
通过上述实施方式,能够在所述目标数据检测指令中没有携带所述目标标签时,通过历史目标数据确定所述目标标签。
当然,在其他实施例中,还可以采用其他方式确定所述目标标签,本发明不限制。
例如:接收用户上传的标签作为所述目标标签。
获取单元111获取与待检测用户对应的待检测数据。
在本实施例中,获取所述待检测用户的账号,并获取与所述账号对应的所有数据,将获取的数据确定为所述待检测数据。
可以理解的是,与所述账号对应的数据并不一定为所述待检测用户产生的数据,如果存在其他人登录所述待检测用户的账号进行操作,则所产生的数据并非所述待检测用户的实际数据,可被视为代刷或者代做的数据,即为非目标数据,而所述待检测用户的实际数据即为目标数据。
构建单元112根据所述目标标签从所述待检测数据中选择数据构建目标数据集。
在本实施例中,由于所述目标数据集中的数据都带有所述目标标签,因此,所述目标数据集中的数据均为目标数据。
在本发明的至少一个实施例中,所述构建单元112根据所述目标标签从所述待检测数据中选择数据构建目标数据集包括:
识别所述待检测数据中每个数据的关键字作为第二关键字;
将所述待检测数据中带有相同的第二关键字的数据划分为一类,并以所述相同的第二关键字命名每个类别;
配置每个类别在对应的数据中的权重;
将权重大于或者等于配置权重的类别确定为对应的数据的目标类别;
以所述目标类别定义对应的数据的标签;
以所述目标标签在定义的标签中进行匹配,并获取与所述目标标签匹配的标签所对应的数据构建所述目标数据集。
所述配置权重可以根据实际需求进行自定义配置,本发明不限制。
其中,在以所述相同的关键字命名每个类别后,还需要给每个类别赋一定的权重,用来区分不同类别的重要程度,具体地,在确定权重时可以综合考虑多种数据指标,如:面谈次数、吸引面谈次数等。
所述构建单元112获取预先定义的至少一个子标签,并从所述待检测数据中选择与每个子标签对应的数据构建与每个子标签对应的至少一个子数据集。
其中,所述至少一个子标签属于对所述目标标签的扩展。
例如:所述至少一个子标签可以包括,但不限于:执行过AI面谈、有考勤记录。
需要说明的是,构建与每个子标签对应的至少一个子数据集的方式与构建所述目标数据集的方式类似,在此不赘述。
计算单元113计算所述目标数据集与所述至少一个子数据集的交集,得到至少一个子交集。
需要说明的是,同时带有所述至少一个子标签及所述目标标签的数据可以被确定为目标数据。
进一步地,执行交集处理后得到的所述至少一个子交集中的数据属于目标数据,可以以所述至少一个子交集中的数据对其他数据进行标注及提取,以检测出目标数据。
通过上述实施方式,能够在目标数据集的基础上进一步执行数据的扩展,以获取到充足的数据进行模型的训练,提升模型训练的效果。
训练单元114结合全局搜索算法,以所述至少一个子交集训练单类支持向量机(One-Class Support Vector Machine,One-Class SVM)模型,得到检测模型。
需要说明的是,在实际应用场景中,很多时候只能定义正样本,而不能定义负样本。例如:当通过用户的搜索记录预测该用户是否有小孩时,不能说用户没有搜索“宝宝”“早教”这一类的词,就判断该用户没有小孩,这是不绝对的。单类支持向量机模型即可以与该场景适配。
在本发明的至少一个实施例中,所述训练单元114结合全局搜索算法,以所述至少一个子交集训练单类支持向量机模型,得到检测模型包括:
整合所述至少一个子交集中的数据,得到训练样本;
确定单类支持向量机模型的核函数,并确定所述核函数的初始参数;
采用所述全局搜索算法优化所述初始参数,得到优化后的单类支持向量机模型;
以所述训练样本训练所述优化后的单类支持向量机模型,得到所述检测模型。
通过上述实施方式,能够基于预先标注的子交集构建训练样本,并进一步以所述训练样本训练单类支持向量机模型,以便后续利用训练得到的检测模型对所述待检测数据的目标性进行智能检测。
另外,通常情况下,单类支持向量机模型的参数是难以确定的,本案采用全局搜索算法优化并确定所述单类支持向量机模型的参数,提高了所述单类支持向量机模型的全局性及鲁棒性。
具体地,所述训练单元114采用全局搜索算法优化所述初始参数,得到优化后的单类支持向量机模型包括:
确定所述全局搜索算法的最高迭代次数及搜索步长;
以所述初始参数为初始位置,并以所述搜索步长进行信息素的迭代搜索,直至达到所述最高迭代次数,停止搜索,得到当前信息素;
以所述当前信息素对应的位置作为优化后的参数替代所述初始参数,得到所述优化后的单类支持向量机模型。
通过上述实施方式,能够以全局搜索算法自动确定所述单类支持向量机模型的参数,不仅提升了单类支持向量机模型的性能,且目标解决了单类支持向量机模型的参数难以确定的问题。
在本发明的至少一个实施例中,从所述目标数据集中随机获取数据构建验证集;
将所述验证集中的数据输入至所述检测模型中,输出第一检测结果;
获取所述第一检测结果为目标的数据,并计算获取的数据在所述验证集中所占的比例;
进一步地,当所述比例大于或者等于配置比例时,确定所述检测模型通过验证,并将所述检测模型保存至区块链。
所述配置比例可以根据实际需求进行自定义配置,本发明不限制。
通过上述实施方式,能够以少量的目标数据对所述检测模型进行验证,以确保所述检测模型的可用性。
同时,将所述检测模型保存至区块链,以进一步保证所述检测模型的安全性。
或者当所述比例小于所述配置比例时,确定所述检测模型未通过验证,更新所述至少一个子标签,并根据更新后的至少一个子标签更新所述至少一个子数据集,以更新后的所述至少一个子数据集对所述检测模型进行优化训练。
通过上述实施方式,能够在所述检测模型未通过验证时,及时调整相应的标签优化训练所述检测模型,以增强所述检测模型的适应性,同时提高了所述检测模型的灵活性。
输入单元115将所述待检测数据输入至所述检测模型,输出检测结果,其中,所述检测结果包括目标及非目标。
具体地,当所述检测结果为第一标识(如:1或Y)时,确定所述检测结果为目标;或者当所述检测结果为第二标识(如:0或N)时,确定所述检测结果为非目标。
通过上述实施方式,能够以人工智能的方式自动进行目标数据的检测及筛选,解决了现有技术中依赖人为定义的规则进行数据统计所造成的筛选效率低、出错率高,且可靠性欠佳的问题。
整合单元116整合所述检测结果为目标的数据作为所述目标数据。
通过上述实施方式,能够结合人工智能手段自动从所述待检测数据中筛选出所有的目标数据,相较于传统的方式更加高效,且不易出错,实用性更强。
需要说明的是,为了防止数据被篡改,还可以将所述目标数据保存至区块链。
在本发明的至少一个实施例中,在整合所述检测结果为目标的数据作为所述目标数据后,计算所述目标数据在所述待检测数据中的占比;
当所述占比低于配置占比时,根据所述占比生成警告信息;
确定所述待检测用户的关联用户;
将所述警告信息发送至所述待检测用户的终端设备及所述关联用户的终端设备。
其中,所述警告信息用于警示所述待检测用户当前产生的非目标数据过多。
所述配置占比可以根据实际需求进行自定义配置,本发明不限制。
其中,所述关联用户可以包括,但不限于:所述待检测用户的上级领导、考勤管理人员。
通过上述实施方式,将所述警告信息发送至所述待检测用户的终端设备,能够起到对所述待检测用户的警示作用,避免再次出现违规行为,同时,将所述警告信息发送至所述关联用户的终端设备,能够引起相关人员的重视,并在出现问题时及时处理,避免问题扩大化,起到及时止损的作用。
由以上技术方案可以看出,本发明能够响应于接收到的目标数据检测指令,确定目标标签,获取与待检测用户对应的待检测数据,根据所述目标标签从所述待检测数据中选择数据构建目标数据集,获取预先定义的至少一个子标签,并从所述待检测数据中选择与每个子标签对应的数据构建与每个子标签对应的至少一个子数据集,计算所述目标数据集与所述至少一个子数据集的交集,得到至少一个子交集,结合全局搜索算法,以所述至少一个子交集训练单类支持向量机模型,得到检测模型,将所述待检测数据输入至所述检测模型,输出检测结果,其中,所述检测结果包括目标及非目标,整合检测结果为目标的数据作为所述目标数据,进而能够以人工智能的方式自动进行目标数据的检测及筛选,解决了筛选效率低、出错率高,且可靠性欠佳的问题。
如图3所示,是本发明实现基于人工智能的目标数据检测方法的较佳实施例的电子设备的结构示意图。
所述电子设备1可以包括存储器12、处理器13和总线,还可以包括存储在所述存储器12中并可在所述处理器13上运行的计算机程序,例如基于人工智能的目标数据检测程序。
本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,所述电子设备1既可以是总线型结构,也可以是星形结构,所述电子设备1还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置,例如所述电子设备1还可以包括输入输出设备、网络接入设备等。
需要说明的是,所述电子设备1仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
其中,存储器12至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器12在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。存储器12在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,存储器12还可以既包括电子设备1的内部存储单元也包括外部存储设备。存储器12不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如基于人工智能的目标数据检测程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器13在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器13是所述电子设备1的控制核心(Control Unit),利用各种接口和线路连接整个电子设备1的各个部件,通过运行或执行存储在所述存储器12内的程序或者模块(例如执行基于人工智能的目标数据检测程序等),以及调用存储在所述存储器12内的数据,以执行电子设备1的各种功能和处理数据。
所述处理器13执行所述电子设备1的操作***以及安装的各类应用程序。所述处理器13执行所述应用程序以实现上述各个基于人工智能的目标数据检测方法实施例中的步骤,例如图1所示的步骤。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述电子设备1中的执行过程。例如,所述计算机程序可以被分割成确定单元110、获取单元111、构建单元112、计算单元113、训练单元114、输入单元115、整合单元116。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、计算机设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述基于人工智能的目标数据检测方法的部分。
所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指示相关的硬件设备来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。
其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
进一步地,计算机可用存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的目标性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,在图3中仅用一根箭头表示,但并不表示仅有一根总线或一种类型的总线。所述总线被设置为实现所述存储器12以及至少一个处理器13等之间的连接通信。
尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器13逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
图3仅示出了具有组件12-13的电子设备1,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
结合图1,所述电子设备1中的所述存储器12存储多个指令以实现一种基于人工智能的目标数据检测方法,所述处理器13可执行所述多个指令从而实现:
响应于接收到的目标数据检测指令,确定目标标签;
获取与待检测用户对应的待检测数据;
根据所述目标标签从所述待检测数据中选择数据构建目标数据集;
获取预先定义的至少一个子标签,并从所述待检测数据中选择与每个子标签对应的数据构建与每个子标签对应的至少一个子数据集;
计算所述目标数据集与所述至少一个子数据集的交集,得到至少一个子交集;
结合全局搜索算法,以所述至少一个子交集训练单类支持向量机模型,得到检测模型;
将所述待检测数据输入至所述检测模型,输出检测结果,其中,所述检测结果包括目标及非目标;
整合所述检测结果为目标的数据作为所述目标数据。
具体地,所述处理器13对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。***权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (7)
1.一种基于人工智能的目标数据检测方法,其特征在于,所述基于人工智能的目标数据检测方法包括:
响应于接收到的目标数据检测指令,确定目标标签;
获取与待检测用户对应的待检测数据;
根据所述目标标签从所述待检测数据中选择数据构建目标数据集;
获取预先定义的至少一个子标签,并从所述待检测数据中选择与每个子标签对应的数据构建与每个子标签对应的至少一个子数据集;
计算所述目标数据集与所述至少一个子数据集的交集,得到至少一个子交集;
结合全局搜索算法,以所述至少一个子交集训练单类支持向量机模型,得到检测模型,包括:整合所述至少一个子交集中的数据,得到训练样本;确定单类支持向量机模型的核函数,并确定所述核函数的初始参数;采用所述全局搜索算法优化所述初始参数,得到优化后的单类支持向量机模型;以所述训练样本训练所述优化后的单类支持向量机模型,得到所述检测模型;所述采用全局搜索算法优化所述初始参数,得到优化后的单类支持向量机模型包括:确定所述全局搜索算法的最高迭代次数及搜索步长;以所述初始参数为初始位置,并以所述搜索步长进行信息素的迭代搜索,直至达到所述最高迭代次数,停止搜索,得到当前信息素;以所述当前信息素对应的位置作为优化后的参数替代所述初始参数,得到所述优化后的单类支持向量机模型;
将所述待检测数据输入至所述检测模型,输出检测结果,其中,所述检测结果包括目标及非目标;
整合所述检测结果为目标的数据作为所述目标数据;
计算所述目标数据在所述待检测数据中的占比;当所述占比低于配置占比时,根据所述占比生成警告信息;确定所述待检测用户的关联用户;将所述警告信息发送至所述待检测用户的终端设备及所述关联用户的终端设备。
2. 如权利要求1所述的基于人工智能的目标数据检测方法,其特征在于,所述确定目标标签包括以下一种或者多种方式的组合:
解析所述目标数据检测指令的方法体,得到所述目标数据检测指令所携带的数据,获取预设标签,以所述预设标签在所述目标数据检测指令所携带的数据中进行匹配,并将匹配的数据确定为所述目标标签;或者
获取历史目标数据,识别所述历史目标数据的关键字作为第一关键字,并计算所述第一关键字的出现频率,获取出现频率最高的第一关键字作为所述目标标签。
3.如权利要求1所述的基于人工智能的目标数据检测方法,其特征在于,所述根据所述目标标签从所述待检测数据中选择数据构建目标数据集包括:
识别所述待检测数据中每个数据的关键字作为第二关键字;
将所述待检测数据中带有相同的第二关键字的数据划分为一类,并以所述相同的第二关键字命名每个类别;
配置每个类别在对应的数据中的权重;
将权重大于或者等于配置权重的类别确定为对应的数据的目标类别;
以所述目标类别定义对应的数据的标签;
以所述目标标签在定义的标签中进行匹配,并获取与所述目标标签匹配的标签所对应的数据构建所述目标数据集。
4.如权利要求1所述的基于人工智能的目标数据检测方法,其特征在于,所述基于人工智能的目标数据检测方法还包括:
从所述目标数据集中随机获取数据构建验证集;
将所述验证集中的数据输入至所述检测模型中,输出第一检测结果;
获取所述第一检测结果为目标的数据,并计算获取的数据在所述验证集中所占的比例;
当所述比例大于或者等于配置比例时,确定所述检测模型通过验证,并将所述检测模型保存至区块链;或者
当所述比例小于所述配置比例时,确定所述检测模型未通过验证,更新所述至少一个子标签,并根据更新后的至少一个子标签更新所述至少一个子数据集,以更新后的所述至少一个子数据集对所述检测模型进行优化训练。
5.一种基于人工智能的目标数据检测装置,其特征在于,所述基于人工智能的目标数据检测装置包括:
确定单元,用于响应于接收到的目标数据检测指令,确定目标标签;
获取单元,用于获取与待检测用户对应的待检测数据;
构建单元,用于根据所述目标标签从所述待检测数据中选择数据构建目标数据集;
所述构建单元,还用于获取预先定义的至少一个子标签,并从所述待检测数据中选择与每个子标签对应的数据构建与每个子标签对应的至少一个子数据集;
计算单元,用于计算所述目标数据集与所述至少一个子数据集的交集,得到至少一个子交集;
训练单元,用于结合全局搜索算法,以所述至少一个子交集训练单类支持向量机模型,得到检测模型,包括:整合所述至少一个子交集中的数据,得到训练样本;确定单类支持向量机模型的核函数,并确定所述核函数的初始参数;采用所述全局搜索算法优化所述初始参数,得到优化后的单类支持向量机模型;以所述训练样本训练所述优化后的单类支持向量机模型,得到所述检测模型;所述采用全局搜索算法优化所述初始参数,得到优化后的单类支持向量机模型包括:确定所述全局搜索算法的最高迭代次数及搜索步长;以所述初始参数为初始位置,并以所述搜索步长进行信息素的迭代搜索,直至达到所述最高迭代次数,停止搜索,得到当前信息素;以所述当前信息素对应的位置作为优化后的参数替代所述初始参数,得到所述优化后的单类支持向量机模型;
输入单元,用于将所述待检测数据输入至所述检测模型,输出检测结果,其中,所述检测结果包括目标及非目标;
整合单元,用于整合所述检测结果为目标的数据作为所述目标数据;
计算所述目标数据在所述待检测数据中的占比;当所述占比低于配置占比时,根据所述占比生成警告信息;确定所述待检测用户的关联用户;将所述警告信息发送至所述待检测用户的终端设备及所述关联用户的终端设备。
6. 一种电子设备,其特征在于,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现如权利要求1至4中任意一项所述的基于人工智能的目标数据检测方法。
7.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现如权利要求1至4中任意一项所述的基于人工智能的目标数据检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010797375.0A CN111985545B (zh) | 2020-08-10 | 2020-08-10 | 基于人工智能的目标数据检测方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010797375.0A CN111985545B (zh) | 2020-08-10 | 2020-08-10 | 基于人工智能的目标数据检测方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111985545A CN111985545A (zh) | 2020-11-24 |
CN111985545B true CN111985545B (zh) | 2024-05-17 |
Family
ID=73445448
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010797375.0A Active CN111985545B (zh) | 2020-08-10 | 2020-08-10 | 基于人工智能的目标数据检测方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111985545B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112925958A (zh) * | 2021-02-05 | 2021-06-08 | 深圳力维智联技术有限公司 | 多源异构数据适配方法、装置、设备及可读存储介质 |
CN114004443A (zh) * | 2021-09-13 | 2022-02-01 | 广东省国土资源测绘院 | 一种非法建房数据的检测方法及装置 |
CN114580562A (zh) * | 2022-03-16 | 2022-06-03 | 北京珞安科技有限责任公司 | 基于工艺流程的异常数据检测方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106709506A (zh) * | 2016-11-28 | 2017-05-24 | 广东工业大学 | 一种中草药种类及不同产地的识别分类方法 |
WO2019119515A1 (zh) * | 2017-12-22 | 2019-06-27 | 深圳云天励飞技术有限公司 | 人脸分析、过滤方法、装置、嵌入式设备、介质和集成电路 |
CN110059734A (zh) * | 2019-04-02 | 2019-07-26 | 唯思科技(北京)有限公司 | 一种目标识别分类模型的训练方法、物体识别方法、装置、机器人和介质 |
CN110348490A (zh) * | 2019-06-20 | 2019-10-18 | 宜通世纪科技股份有限公司 | 一种基于支持向量机算法的土壤质量预测方法及装置 |
CN110516251A (zh) * | 2019-08-29 | 2019-11-29 | 秒针信息技术有限公司 | 一种电商实体识别模型的构建方法、构建装置、设备和介质 |
CN111476324A (zh) * | 2020-06-28 | 2020-07-31 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的交通数据标注方法、装置、设备及介质 |
-
2020
- 2020-08-10 CN CN202010797375.0A patent/CN111985545B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106709506A (zh) * | 2016-11-28 | 2017-05-24 | 广东工业大学 | 一种中草药种类及不同产地的识别分类方法 |
WO2019119515A1 (zh) * | 2017-12-22 | 2019-06-27 | 深圳云天励飞技术有限公司 | 人脸分析、过滤方法、装置、嵌入式设备、介质和集成电路 |
CN110059734A (zh) * | 2019-04-02 | 2019-07-26 | 唯思科技(北京)有限公司 | 一种目标识别分类模型的训练方法、物体识别方法、装置、机器人和介质 |
CN110348490A (zh) * | 2019-06-20 | 2019-10-18 | 宜通世纪科技股份有限公司 | 一种基于支持向量机算法的土壤质量预测方法及装置 |
CN110516251A (zh) * | 2019-08-29 | 2019-11-29 | 秒针信息技术有限公司 | 一种电商实体识别模型的构建方法、构建装置、设备和介质 |
CN111476324A (zh) * | 2020-06-28 | 2020-07-31 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的交通数据标注方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111985545A (zh) | 2020-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111950621B (zh) | 基于人工智能的目标数据检测方法、装置、设备及介质 | |
CN111985545B (zh) | 基于人工智能的目标数据检测方法、装置、设备及介质 | |
CN112446025A (zh) | 联邦学习防御方法、装置、电子设备及存储介质 | |
CN111639153B (zh) | 基于法律知识图谱的查询方法、装置、电子设备及介质 | |
CN111949708B (zh) | 基于时序特征提取的多任务预测方法、装置、设备及介质 | |
CN112801718B (zh) | 用户行为预测方法、装置、设备及介质 | |
CN112396547B (zh) | 基于无监督学习的课程推荐方法、装置、设备及介质 | |
CN113806434B (zh) | 大数据处理方法、装置、设备及介质 | |
CN111340240A (zh) | 实现自动机器学习的方法及装置 | |
US10762089B2 (en) | Open ended question identification for investigations | |
CN114997263B (zh) | 基于机器学习的结训率分析方法、装置、设备及存储介质 | |
CN114612194A (zh) | 产品推荐方法、装置、电子设备及存储介质 | |
CN114201482A (zh) | 人口动态分布统计方法、装置、电子设备及可读存储介质 | |
CN115081538A (zh) | 基于机器学习的客户关系识别方法、装置、设备及介质 | |
CN112651782B (zh) | 基于缩放点积注意力的行为预测方法、装置、设备及介质 | |
CN111950707B (zh) | 基于行为共现网络的行为预测方法、装置、设备及介质 | |
CN112700261B (zh) | 基于可疑社团的刷单行为检测方法、装置、设备及介质 | |
CN112115890B (zh) | 基于人工智能的酒驾识别方法、装置、设备及介质 | |
CN113256181A (zh) | 风险因子预测方法、装置、设备及介质 | |
CN116823437A (zh) | 基于配置化风控策略的准入方法、装置、设备及介质 | |
CN112330080B (zh) | 基于连通图的因子筛选方法、装置、设备及介质 | |
CN113657546B (zh) | 信息分类方法、装置、电子设备及可读存储介质 | |
CN111859985B (zh) | Ai客服模型测试方法、装置、电子设备及存储介质 | |
CN114722146A (zh) | 基于人工智能的供应链资产校验方法、装置、设备及介质 | |
CN112183630B (zh) | 基于埋点层级的嵌入向量生成方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |