CN116975578A - 逻辑规则网络模型训练方法、装置、设备、程序及介质 - Google Patents
逻辑规则网络模型训练方法、装置、设备、程序及介质 Download PDFInfo
- Publication number
- CN116975578A CN116975578A CN202310149602.2A CN202310149602A CN116975578A CN 116975578 A CN116975578 A CN 116975578A CN 202310149602 A CN202310149602 A CN 202310149602A CN 116975578 A CN116975578 A CN 116975578A
- Authority
- CN
- China
- Prior art keywords
- network model
- logic
- loss function
- classification
- logic rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 202
- 238000000034 method Methods 0.000 title claims abstract description 73
- 239000013598 vector Substances 0.000 claims abstract description 194
- 238000012545 processing Methods 0.000 claims abstract description 44
- 230000004927 fusion Effects 0.000 claims abstract description 18
- 238000012512 characterization method Methods 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 160
- 230000005540 biological transmission Effects 0.000 claims description 30
- 238000000605 extraction Methods 0.000 claims description 19
- 238000006243 chemical reaction Methods 0.000 claims description 17
- 230000010365 information processing Effects 0.000 claims description 16
- 238000003860 storage Methods 0.000 claims description 13
- 201000010099 disease Diseases 0.000 claims description 12
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 238000007477 logistic regression Methods 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 abstract description 37
- 238000013473 artificial intelligence Methods 0.000 abstract description 15
- 206010037660 Pyrexia Diseases 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 238000013528 artificial neural network Methods 0.000 description 12
- 239000004973 liquid crystal related substance Substances 0.000 description 12
- 238000010801 machine learning Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 10
- 241000711573 Coronaviridae Species 0.000 description 9
- 238000003745 diagnosis Methods 0.000 description 9
- 208000015181 infectious disease Diseases 0.000 description 8
- 206010002653 Anosmia Diseases 0.000 description 7
- 208000035473 Communicable disease Diseases 0.000 description 7
- 206010050515 Hyposmia Diseases 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 7
- 235000019559 hyposmia Nutrition 0.000 description 7
- 206010035664 Pneumonia Diseases 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 210000004072 lung Anatomy 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- 206010012735 Diarrhoea Diseases 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000036760 body temperature Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 235000019800 disodium phosphate Nutrition 0.000 description 3
- 238000011841 epidemiological investigation Methods 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 206010003757 Atypical pneumonia Diseases 0.000 description 2
- 208000008589 Obesity Diseases 0.000 description 2
- 206010047700 Vomiting Diseases 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 230000002458 infectious effect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 235000020824 obesity Nutrition 0.000 description 2
- 230000008092 positive effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000004549 pulsed laser deposition Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000008673 vomiting Effects 0.000 description 2
- 208000030507 AIDS Diseases 0.000 description 1
- 241000193738 Bacillus anthracis Species 0.000 description 1
- 206010008631 Cholera Diseases 0.000 description 1
- 208000001528 Coronaviridae Infections Diseases 0.000 description 1
- 206010012742 Diarrhoea infectious Diseases 0.000 description 1
- 206010019233 Headaches Diseases 0.000 description 1
- 206010019799 Hepatitis viral Diseases 0.000 description 1
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 1
- 208000002979 Influenza in Birds Diseases 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 208000005647 Mumps Diseases 0.000 description 1
- 206010028813 Nausea Diseases 0.000 description 1
- 206010035148 Plague Diseases 0.000 description 1
- 206010035667 Pneumonia anthrax Diseases 0.000 description 1
- 206010035737 Pneumonia viral Diseases 0.000 description 1
- 206010047513 Vision blurred Diseases 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 238000005299 abrasion Methods 0.000 description 1
- 201000007201 aphasia Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 206010064097 avian influenza Diseases 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 208000010877 cognitive disease Diseases 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000003467 diminishing effect Effects 0.000 description 1
- 208000002173 dizziness Diseases 0.000 description 1
- 208000001848 dysentery Diseases 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 231100000869 headache Toxicity 0.000 description 1
- 208000021760 high fever Diseases 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 208000009449 inhalation anthrax Diseases 0.000 description 1
- 208000023372 inhalational anthrax Diseases 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 208000010805 mumps infectious disease Diseases 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 230000008693 nausea Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000452 restraining effect Effects 0.000 description 1
- 201000005404 rubella Diseases 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 201000001862 viral hepatitis Diseases 0.000 description 1
- 208000009421 viral pneumonia Diseases 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种逻辑规则网络模型训练方法、装置、电子设备,方法包括:对原始数据进行特征化处理,得到训练特征向量;确定逻辑规则网络模型的析取范式约束损失函数、网络稀疏性约束损失函数、已知规则约束损失函数;根据析取范式约束损失函数、网络稀疏性约束损失函数和已知规则约束损失函数,确定逻辑规则网络模型的融合损失函数;根据训练特征向量和融合损失函数,对逻辑规则网络模型进行训练,确定逻辑规则网络模型的网络模型参数;经过训练的逻辑规则网络模型生成的逻辑表达中逻辑符号清晰,提升了逻辑表达的可读性,降低了逻辑规则网络模型生成结果的理解难度。本发明实施例还可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。
Description
技术领域
本发明涉及信息分类技术,尤其涉及逻辑规则网络模型训练方法、装置、电子设备、计算机程序产品以及存储介质,使得本方案可应用的领域包括但不限于自动驾驶、车联网、智慧交通等领域。
背景技术
人工智能(AI,Artificial Intelligence)是计算机科学的一个综合技术,通过研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,例如自然语言处理技术以及机器学习/深度学习等几大方向,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
相关技术中,逻辑规则网络模型使用在广告、推荐、搜索等大量业务场景中有着广泛的应用。相关技术所以提供的分类模型训练完成后生成的逻辑表达式往往逻辑符号混杂导致可读性较差,增加了理解的难度。同时,无法引入已知的规则。当训练数据的数据量不足,或数据带有偏置性,或数据背后的本质规则过于复杂或隐晦时,模型难以直接从数据中学习到所有规则。
发明内容
有鉴于此,本发明实施例提供一种逻辑规则网络模型训练方法、装置、电子设备、软件程序以及存储介质,能够通过机器学习技术准确高效地进行逻辑规则网络模型的训练,使得逻辑规则网络模型适用于各种输入为特征向量的分类任务,同时使得逻辑规则网络模型能够挖掘标签与其特征之间的潜在逻辑规则关系,并给分类结果赋予可解释性,便于用户理解。
本发明实施例提供了一种逻辑规则网络模型训练方法,所述方法包括:
对原始数据进行特征化处理,得到训练特征向量;
确定逻辑规则网络模型的析取范式约束损失函数;
确定所述逻辑规则网络模型的网络稀疏性约束损失函数;
确定所述逻辑规则网络模型的已知规则约束损失函数;
根据所述析取范式约束损失函数、所述网络稀疏性约束损失函数和所述已知规则约束损失函数,确定所述逻辑规则网络模型的融合损失函数;
根据所述训练特征向量和所述融合损失函数,对所述逻辑规则网络模型进行训练,确定所述逻辑规则网络模型的网络模型参数。
本发明实施例还提供了一种数据分类方法,包括:
获取待分类数据;
通过所述逻辑规则网络模型的二值化层对所述待分类数据进行拼接,得到二值化分类特征向量;
通过所述逻辑规则网络模型的合取逻辑层对所述二值化分类特征向量进行连接处理,得到与连接分类特征向量;
通过所述逻辑规则网络模型的析取逻辑层对所述连接分类特征向量进行连接处理,得到或连接分类特征向量;
通过所述逻辑规则网络模型的线性转换层对所述或连接分类特征向量进行转换,得到所述待分类数据的分类概率和所述待分类数据对应的逻辑规则。
本发明实施例还提供了一种逻辑规则网络模型训练装置,所述装置包括:
信息传输模块,用于对原始数据进行特征化处理,得到训练特征向量;
信息处理模块,用于确定逻辑规则网络模型的析取范式约束损失函数;
所述信息处理模块,用于确定所述逻辑规则网络模型的网络稀疏性约束损失函数;
所述信息处理模块,用于确定所述逻辑规则网络模型的已知规则约束损失函数;
所述信息处理模块,用于根据所述析取范式约束损失函数、所述网络稀疏性约束损失函数和所述已知规则约束损失函数,确定所述逻辑规则网络模型的融合损失函数;
所述信息处理模块,用于根据所述训练特征向量和所述融合损失函数,对所述逻辑规则网络模型进行训练,确定所述逻辑规则网络模型的网络模型参数。
上述方案中,所述信息传输模块,用于对所述训练特征向量进行切分,得到离散型训练特征向量和连续型训练特征向量;
所述信息传输模块,用于通过所述逻辑规则网络模型的二值化层对所述连续型训练特征向量进行二值化处理,并与所述离散型训练特征向量进行拼接,得到二值化训练特征向量,其中,所述逻辑规则网络模型包括:二值化层、合取逻辑层、析取逻辑层以及线性转换层;
所述信息传输模块,用于通过所述合取逻辑层,利用与连接符对所述二值化训练特征向量进行连接处理,得到与连接训练特征向量;
所述信息传输模块,用于通过所述析取逻辑层,利用或连接符对所述与连接训练特征向量进行连接处理,得到或连接训练特征向量;
所述信息传输模块,用于通过所述线性转换层对所述或连接训练特征向量进行转换,得到分类向量;
所述信息传输模块,用于根据所述分类向量的类别数量、所述训练特征向量的数量以及所述分类向量计算所述逻辑规则网络模型的析取范式约束损失函数。
上述方案中,所述信息传输模块,用于当所述逻辑规则网络模型用于单标签多分类任务时,计算所述分类向量对应的归一化指数分类向量;
所述信息传输模块,用于根据所述分类向量的类别数量、所述训练特征向量的数量以及所述归一化指数分类向量,计算交叉熵作为所述逻辑规则网络模型的析取范式约束损失函数。
上述方案中,所述信息传输模块,用于当所述逻辑规则网络模型用于多标签多分类任务时,计算所述分类向量对应的逻辑回归分类向量;
所述信息传输模块,用于根据所述分类向量的类别数量、所述训练特征向量的数量以及所述逻辑回归分类向量,计算二元交叉熵作为所述逻辑规则网络模型的析取范式约束损失函数。
上述方案中,所述信息传输模块,用于获取所述逻辑规则网络模型中的合取逻辑层的网络模型参数、析取逻辑层的网络模型参数以及线性转换层的网络模型参数;
所述信息传输模块,用于对所述线性转换层的网络模型参数进行正则化约束,得到第一约束损失函数;
所述信息传输模块,用于确定所述与连接训练特征向量的长度和所述或连接训练特征向量的长度;
所述信息传输模块,用于根据所述连接训练特征向量的长度和所述或连接训练特征向量的长度,对所述合取逻辑层的网络模型参数、析取逻辑层的网络模型参数进行正则化,得到第二约束损失函数;
所述信息传输模块,用于根据所述训练特征向量的数量,对所述或连接训练特征向量进行稀疏性约束,得到第三约束损失函数;
所述信息传输模块,用于根据所述第一约束损失函数、第二约束损失函数以及第三约束损失函数的加和,确定所述网络稀疏性约束损失函数。
上述方案中,所述信息传输模块,用于获取所述逻辑规则网络模型对应的预设逻辑规则;
所述信息传输模块,用于对所述合取逻辑层的网络模型参数进行分解,得到可更新合取逻辑层的网络模型参数和不可更新合取逻辑层的网络模型参数;
所述信息传输模块,用于对所述析取逻辑层的网络模型参数进行分解,得到可更新析取逻辑层的网络模型参数和不可更新析取逻辑层的网络模型参数;
所述信息传输模块,用于根据所述预设逻辑规则对所述可更新合取逻辑层的网络模型参数进行扩充,得到扩充可更新合取逻辑层的网络模型参数;
所述信息传输模块,用于根据所述预设逻辑规则对所述可更新析取逻辑层的网络模型参数进行扩充,得到扩充可更新析取逻辑层的网络模型参数;
所述信息传输模块,用于根据所述扩充可更新合取逻辑层的网络模型参数,以及所述扩充可更新析取逻辑层的网络模型参数,计算所述二值化训练特征向量对应的伪二值化训练特征向量;
所述信息传输模块,用于保持所述不可更新合取逻辑层的网络模型参数和所述不可更新析取逻辑层的网络模型参数不变,根据所述训练特征向量的数量、所述二值化训练特征向量,以及所述伪二值化训练特征向量,确定所述已知规则约束损失函数。
上述方案中,所述信息传输模块,用于当所述预设逻辑规则改变时,保持所述析取范式约束损失函数、以及所述网络稀疏性约束损失函数不变,对所述逻辑规则网络模型的已知规则约束损失函数进行动态更新。
本发明实施例还提供了一种数据分类装置,包括:
数据传输模块,用于获取待分类数据;
数据处理模块,用于通过所述逻辑规则网络模型的二值化层对所述待分类数据进行拼接,得到二值化分类特征向量;
所述数据处理模块,用于通过所述逻辑规则网络模型的合取逻辑层对所述二值化分类特征向量进行连接处理,得到与连接分类特征向量;
所述数据处理模块,用于通过所述逻辑规则网络模型的析取逻辑层对所述连接分类特征向量进行连接处理,得到或连接分类特征向量;
所述数据处理模块,用于通过所述逻辑规则网络模型的线性转换层对所述或连接分类特征向量进行转换,得到所述待分类数据的分类概率和所述待分类数据对应的逻辑规则。
本发明实施例还提供了一种电子设备,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于运行所述存储器存储的可执行指令时,实现前述的逻辑规则网络模型训练方法和数据分类方法。
本发明实施例还提供了一种计算机程序产品,包括计算机程序或指令,其特征在于,所述计算机程序或指令被处理器执行时,实现前述的逻辑规则网络模型训练方法和数据分类方法。
本发明实施例还提供了一种计算机可读存储介质,存储有可执行指令,所述可执行指令被处理器执行时实现前述的逻辑规则网络模型训练方法和数据分类方法。
本发明实施例具有以下有益效果:
本发明提供的逻辑规则网络模型训练方法中,述逻辑规则网络模型包括:二值化层、合取逻辑层、析取逻辑层以及线性转换层,逻辑规则网络模型的融合损失函数包括:析取范式约束损失函数、所述网络稀疏性约束损失函数和所述已知规则约束损失函数,由此,经过训练的逻辑规则网络模型生成的逻辑表达中逻辑符号清晰,提升了逻辑表达的可读性较差,降低了逻辑规则网络模型生成结果的理解难度;同时由于训练过程中引入了已知规则约束损失函数,当训练数据的数据量不足,或数据带有偏置性,或数据背后的本质规则过于复杂或隐晦时,逻辑规则网络模型均能够直接从数据中学习到所有规则,使得逻辑规则网络模型可以吸收已有经验,提升逻辑规则网络模型进行分类的准确性。
附图说明
图1为本发明实施例提供的逻辑规则网络模型训练方法的使用场景示意图;
图2为本发明实施例提供的逻辑规则网络模型训练方法一个可选的流程示意图;
图3为本发明实施例中逻辑规则网络模型的结构示意图;
图4为逻辑规则网络模型的已知规则约束损失函数计算过程示意图;
图5为本发明实施例中知规则约束时的网络模型参数扩充示意图;
图6为本发明实施例中数据分类方法的处理过程示意图;
图7为本发明实施例中数据分类方法的处理逻辑示意图;
图8为本发明实施例提供的逻辑规则网络模型训练装置的组成结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
对本发明实施例进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释。
1)响应于,用于表示所执行的操作所依赖的条件或者状态,当满足所依赖的条件或状态时,所执行的一个或多个操作可以是实时的,也可以具有设定的延迟;在没有特别说明的情况下,所执行的多个操作不存在执行先后顺序的限制。
2)基于,用于表示所执行的操作所依赖的条件或者状态,当满足所依赖的条件或状态时,所执行的一个或多个操作可以是实时的,也可以具有设定的延迟;在没有特别说明的情况下,所执行的多个操作不存在执行先后顺序的限制。
3)softmax:机器学习中非常常用而且比较重要的函数,尤其在多分类的场景中使用广泛,把一些输入映射为0-1之间的实数,并且归一化保证和为1。
4)神经网络(Neural Network,NN):人工神经网络(Artificial Neural Network,ANN),简称神经网络或类神经网络,在机器学习和认知科学领域,是一种模仿生物神经网络(动物的中枢神经***,特别是大脑)的结构和功能的数学模型或计算模型,用于对函数进行估计或近似。
5)模型参数:是使用通用变量来建立函数和变量之间关系的一个数量。在人工神经网络中,模型参数通常是实数矩阵。
6)析取范式(DNF,Disjunctive Normal Form):又称析合范式,是一种逻辑表达的标准化范式,是合取子句的析取,例如(A∧B)VC、(A∧B)∨(C∧D)。
其中,本发明实施例可结合云技术实现,云技术(Cloud technology)是指在广域网或局域网内将硬件、软件及网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术,也可理解为基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术及应用技术等的总称。技术网络***的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站,因此云技术需要以云计算作为支撑。
通过云技术,利用本申请所提供的逻辑规则网络模型训练方法,可以将所有的逻辑规则网络模型使用结果记录在对应的云服务器中,当目标对象在不同的终端中进行媒体信息浏览时,均可以通过云服务器中所存储的逻辑规则网络模型对是否向用户推荐信息进行分类。
需要说明的是,云计算是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用***能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。作为云计算的基础能力提供商,会建立云计算资源池平台,简称云平台,一般称为基础设施即服务(IaaS,Infrastructure as a Service),在资源池中部署多种类型的虚拟资源,供外部客户选择使用。云计算资源池中主要包括:计算设备(可为虚拟化机器,包含操作***)、存储设备和网络设备。
在介绍本申请所提供的逻辑规则网络模型训练方法之前,首先对相关技术中逻辑规则网络模型使用的缺陷进行简要说明,在相关技术进行逻辑规则网络模型使用时,将与、或、非逻辑运算引入深度学习网络结构设计,使得模型的参数与逻辑规则具有一一对应的关系,通过查看模型参数对应的逻辑规则及其权重,用户能够直接理解模型输出某个分类标签背后的机制和逻辑;但是模型训练完成后生成的逻辑表达式往往逻辑符号混杂导致可读性较差,增加了理解的难度;并且无法引入已知的规则。当训练数据的数据量不足,或数据带有偏置性,或数据背后的本质规则过于复杂或隐晦时,模型难以直接从数据中学习到所有规则,因此不能用于临床辅助诊断、医学影像分割等需要清晰可读性的分类场景。
为了解决以上逻辑规则网络模型使用中的缺陷,图1为本发明实施例提供的逻辑规则网络模型训练方法的使用场景示意图,参见图1,终端(包括终端10-1和终端10-2)上设置有能够执行不同分类功能相应客户端,例如,终端(包括终端10-1和终端10-2)既可以通过网络300从相应的服务器200中获取与目标对象相匹配的流行病学调查结果,也可以通过网络300从相应的服务器200中获取与当前目标相关联的人群(例如密接病例,次密接病例,同时空伴随病例)的流行病学调查进行浏览。服务器200中可以保存有不同目标对象各自对应的相应目标对象的诊疗信息,也可以保存与目标对象的相应目标对象的诊疗信息相匹配的流行病学调查。在本发明的一些实施例中,服务器200中所保存的疾病种类信息可以包括:各类型传染病的信息,每一种类型的传染病可以通过对应的疾病种类标识进行区分、同时还可以保存与疾病种类标识对应的确诊预警阈值,在通过逻辑规则网络模型得到待分类数据的分类结果后,利用确诊预警阈值及时的发出确诊警报信息通知相应的疾控部门。其中,本申请中的疾病信息所携带的疾病种类标识可以表征各类型的传染病,具体来说,传染病分为甲类、乙类和丙类。甲类传染病是指鼠疫、霍乱。乙类传染病包括传染性非典型肺炎、A型冠状病毒感染、艾滋病、病毒性肝炎等。丙类传染病包括流行性感冒、流行性腮腺炎、风疹等。对乙类传染病中传染性非典型肺炎、炭疽中的肺炭疽和人感染高致病性禽流感,采取甲类传染病的预防、控制措施。
其中,本申请实施例所提供的逻辑规则网络模型训练方法是基于人工智能实现的,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
在本申请实施例中,主要涉及的人工智能软件技术包括上述语音处理技术和机器学习等方向。例如,可以涉及语音技术(Speech Technology)中的语音识别技术(AutomaticSpeech Recognition,ASR),其中包括语音信号预处理(Speech signal preprocessing)、语音信号频域分析(Speech signal frequency analyzing)、语音信号特征提取(Speechsignal feature extraction)、语音信号特征匹配/识别(Speech signal featurematching/recognition)、语音的训练(Speech training)等。
例如可以涉及机器学习(Machine learning,ML),机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习通常包括深度学习(Deep Learning)等技术,深度学习包括人工神经网络(artificial neural network),例如卷积神经网络(ConvolutionalNeural Network,CNN)、循环神经网络(Recurrent Neural Network,RNN)、深度神经网络(Deep neural network,DNN)等。
可以理解的是,本申请提供的逻辑规则网络模型训练方法以及语音处理可以应用于智能设备(Intelligent device)上,智能设备可以是任何一种具有信息展示功能的设备,例如可以是智能终端、智能家居设备(如智能音箱、智能洗衣机等)、智能穿戴设备(如智能手表)、车载智能中控***(通过执行不同任务的小程序向用户展示媒体信息)或者AI智能医疗设备(通过展示媒体信息展示治疗案例)等。
参见图2,图2为本发明实施例提供的逻辑规则网络模型训练方法一个可选的流程示意图,可以理解地,图2所示的步骤可以由运行逻辑规则网络模型训练装置的各种电子设备执行,例如可以是如带有逻辑规则网络模型训练装置的专用服务器、或者云服务集群,下面针对图2示出的步骤进行说明。
步骤201:逻辑规则网络模型训练装置对原始数据进行特征化处理,得到训练特征向量。
其中,本申请所提供的逻辑规则网络模型适用于各种输入为特征向量的分类任务,例如疾病预测、科室预测、情感分类、身份信息分类、银行是否借贷等不同的分类任务。由于分类任务不同,使得原始数据的类型不同,对原始数据进行特征化处理,可以得到离散型训练特征向量(categorical)或者连续型训练特征向量(continuous)。例如:医学分类任务中,由各医学图像采集设备采集的目标对象(患者)原始身体数据可以为连续型训练特征向量,病种表现信息则为离散型训练特征向量。
步骤202:逻辑规则网络模型训练装置确定逻辑规则网络模型的析取范式约束损失函数。
参考图3,图3为本发明实施例中逻辑规则网络模型的结构示意图,其中,逻辑规则网络模型包括:二值化层、合取逻辑层、析取逻辑层以及线性转换层。通过图3所示的网络架构能够生成任意形式的逻辑表达式,逻辑规则网络模型训练完成后生成的逻辑表达式逻辑符号混清晰提升了可读性。
例如:图3所示的逻辑规则网络模型输出的逻辑表达式析取范式(DNF,Disjunctive Normal Form)可以是逻辑表达的标准化范式,是合取子句的析取,例如(A∧B)∨C、(A∧B)∨(C∧D)等。析取范式对人类理解是友好的,以临床诊断为例,医生的推理过程以及医学知识通常可以总结为析取范式:出现“发热且腹泻”或“发热且呕吐”的,可能是感染性腹泻患者;出现“年龄小于5岁且发热且手足部疱疹”的,可能是手足口病患者;出现“发热且嗅觉减退”或“发热且味觉减退”或“发热且肺部磨玻璃影”的,可能是病毒肺炎患者。这就要求逻辑规则网络模型训练时,不但能够进行析取范式约束,还能够吸取已知规则的已有经验,因此,逻辑规则网络模型的融合损失函数由三部分构成:析取范式约束损失函数、网络稀疏性约束损失函数和已知规则约束损失函数,下面分别进行介绍。
在本发明的一些实施例中,确定逻辑规则网络模型的析取范式约束损失函数时,首先对训练特征向量进行切分,得到离散型训练特征向量和连续型训练特征向量;其次通过逻辑规则网络模型的二值化层对连续型训练特征向量进行二值化处理,并与离散型训练特征向量进行拼接,得到二值化训练特征向量,通过合取逻辑层,利用与连接符对二值化训练特征向量进行连接处理,得到与连接训练特征向量;通过析取逻辑层,利用或连接符对与连接训练特征向量进行连接处理,得到或连接训练特征向量;通过线性转换层对或连接训练特征向量进行转换,得到分类向量;最后根据分类向量的类别数量、训练特征向量的数量以及分类向量计算逻辑规则网络模型的析取范式约束损失函数。如图3所示,令x表示输入样例的特征,可切分为以one-hot形式表示的离散型特征xD,以及连续型特征xC。对于连续型特征,首先经过二值化层Binarization Layer进行二值化处理,例如可以使用十分位数将特征连续型特征划分到10个桶中,再转换为one-hot向量。xC转换成one-hot向量与xD进行拼接(Concat)得到长度为n的二值化训练特征向量b∈{0,1}n。
b首先经过合取逻辑层(Conjunction Layer),使用与连接符(∧)连接各个布尔变量bj,得到长度为m的与连接训练特征向量hc,其中hc的计算参考公式1:
其中,训练特征向量为hc,n为二值化训练特征向量的长度,即表示第j个析取范式对第i类的重要性,bj是范式Fc中的布尔变量。
其中,向量中的每个元素都对应一个合取子句。hc再经过析取逻辑层(Disjunction Layer),使用或连接符(∨)连接各个合取子句/>得到长度为t的或连接训练特征向量hd,hd的计算参考公式2:
其中,为向量中的每个元素,训练特征向量为hc,m为二值化训练特征向量的长度,/>即表示每一个元素中第j个析取范式对第i类的重要性。
其中,向量中的每个元素都对应一个析取范式。hd经过一层线性层(LinearLayer)即可得到长度为类别总数K的分类向量(logits)z,其中z的计算参考公式3,:
z=Wlhd+bl公式3
其中,即表示第j个析取范式对第k类的重要性,z为分类向量,hd为向量中的每个元素,bl是二值化层处理结果。
在本发明的一些实施例中,由于逻辑规则网络模型的分类任务包括:单标签多分类任务例如情感分类,以及多标签多分类任务例如病种预测、科室预测,因此,逻辑规则网络模型的析取范式约束损失函数计算时包括两种情况:
1)当逻辑规则网络模型用于单标签多分类任务时,计算分类向量对应的归一化指数分类向量;根据分类向量的类别数量、训练特征向量的数量以及归一化指数分类向量,计算交叉熵作为逻辑规则网络模型的析取范式约束损失函数。具体来说,参考公式4,采用softmax与交叉熵作为析取范式约束损失函数:
其中,Lcls为析取范式约束损失函数,N为训练样本个数,K是类别,softmax()为归一化指数函数。
2)当逻辑规则网络模型用于多标签多分类任务时,计算分类向量对应的逻辑回归分类向量;根据分类向量的类别数量、训练特征向量的数量以及逻辑回归分类向量,计算二元交叉熵作为逻辑规则网络模型的析取范式约束损失函数。具体来说,参考公式5,采用sigmoid与二元交叉熵作为析取范式约束损失函数:
其中,Lcls为析取范式约束损失函数,N为训练样本个数,K是类别,sigmoid()为逻辑回归函数。
至此,析取范式约束损失函数的计算完成,之后获取逻辑规则网络模型中的合取逻辑层的网络模型参数WC、析取逻辑层的网络模型参数Wd以及线性转换层的网络模型参数Wl,同时根据WC、Wd中的非零元,可以得到逻辑规则网络模型对应的析取范式,并从Wl中得到相应析取范式对各个类的权重。
步骤203:逻辑规则网络模型训练装置确定逻辑规则网络模型的网络稀疏性约束损失函数。
在本发明的一些实施例中,网络稀疏性约束损失函数是第一约束损失函数、第二约束损失函数以及第三约束损失函数加和得到的,具体来说,对线性转换层的网络模型参数进行正则化约束,得到第一约束损失函数;确定与连接训练特征向量的长度和或连接训练特征向量的长度;根据连接训练特征向量的长度和或连接训练特征向量的长度,对合取逻辑层的网络模型参数、析取逻辑层的网络模型参数进行正则化,得到第二约束损失函数;根据训练特征向量的数量,对或连接训练特征向量进行稀疏性约束,得到第三约束损失函数;根据第一约束损失函数、第二约束损失函数以及第三约束损失函数的加和,确定网络稀疏性约束损失函数。
其中,第一约束损失函数的配置原则为:产生的析取范式的总数应尽量少。参考公式6,采用group lasso对Wl进行约束:
其中,为第一约束损失函数,即表示每一个元素中第j个析取范式对第k类的重要性,t为析取范式的总数。
期望Wl的某些列同时为0,即永远不使用某些析取范式规则,因此,使用GroupLasso正则化,有效的使卷积层中的大量参数为零,实现各卷积层的高度稀疏化。
其中,第二约束损失函数的配置原则为:提高WC、Wd的稀疏性,参考公式7:
其中,为第二约束损失函数,/>表示每一个元素中第j个析取范式对第i类的重要性,t为析取范式的总数,m为二值化训练特征向量的长度,n为训练样本个数。
其中,第三约束损失函数的配置原则为:对所有训练样本产生的hd进行稀疏性约束,参考公式8:
其中,Lr3为第三约束损失函数,n为训练样本个数,hd为向量中的每个元素,是类别信息。
对于每个样本,当命中的析取范式大于1个时进行惩罚,减少析取范式的命中数量。
步骤204:逻辑规则网络模型训练装置确定逻辑规则网络模型的已知规则约束损失函数。
参考图4,图4为逻辑规则网络模型的已知规则约束损失函数计算过程示意图,具体包括以下步骤:
步骤401:获取逻辑规则网络模型对应的预设逻辑规则。
其中,机器学习的本质是使用训练数据,拟合从输入(特征)到输出(标签)的映射关系,在拟合的过程中挖掘特征与标签时间的内在本质的联系。然而,在大多数的场景中,由于数据量不足,或数据带有偏置性,或数据背后的本质规则过于复杂或隐晦,机器学习逻辑规则网络模型难以直接从数据中学习到所有规则。
例如,对于一个单摆***,逻辑规则网络模型的任务为预测下一时刻的***状态(位置、速度),逻辑规则网络模型很难从数据中学习到***的总能量是在逐渐减少的这一本质规则。具体来说,预设逻辑规则用于智能问诊时,对于一个xx肺炎预测任务,若某个地区的大多数患者都没有出现“嗅觉减退”、“味觉减退”的症状,逻辑规则网络模型将无法学习到这两个症状与xx肺炎的关联。
步骤402:对合取逻辑层的网络模型参数进行分解,得到可更新合取逻辑层的网络模型参数和不可更新合取逻辑层的网络模型参数;对析取逻辑层的网络模型参数进行分解,得到可更新析取逻辑层的网络模型参数和不可更新析取逻辑层的网络模型参数。
其中,在步骤402对合取逻辑层的网络模型参数和析取逻辑层的网络模型参数分别进行分解的过程中,首先将合取逻辑层的网络模型参数Wc拆解为可更新参数的部分与不可更新的部分/>同理,析取逻辑层的网络模型参数Wd也拆解为可更新参数的部分/>与不可更新的部分/>其中,由于逻辑规则能否对各个类别的作用是未知的(可能未知也肯能已知,适配各种使用场景),因此,不可更新合取逻辑层的网络模型参数和不可更新析取逻辑层的网络模型参数在训练时保持不变,不参与逻辑规则网络模型的参数更新。
步骤403:根据预设逻辑规则对可更新合取逻辑层的网络模型参数进行扩充,得到扩充可更新合取逻辑层的网络模型参数,根据预设逻辑规则对可更新析取逻辑层的网络模型参数进行扩充,得到扩充可更新析取逻辑层的网络模型参数。
其中,在步骤403对可更新合取逻辑层的网络模型参数和可更新析取逻辑层的网络模型参数进行扩充时,可以使得更新合取逻辑层的网络模型参数和可更新析取逻辑层的网络模型参数获得预设逻辑规则所带来的经验。例如,参考图5,图5为本发明实施例中知规则约束时的网络模型参数扩充示意图,待引入的两条预设逻辑规则分别为:
q1=(A∧B)∨(C∧D)
q2=(A∧E)
首先,对于每个二值化特征项A、B、C、D、E,若某些特征当前不存在于b中,则需对b进行扩展(增加b的长度,增加一些元素)。其次,对于每个合取子句,即(A∧B)、(C∧D)、(A∧E),在的对应位置填上0或者1,每一行表达一个合取子句。最后,对于每一条待引入的逻辑规则qi,在/>的对应位置填上0或者1,每一行表达一个析取范式。这样,就在逻辑规则网络模型中显式预设了逻辑规则。
步骤404:根据扩充可更新合取逻辑层的网络模型参数,以及扩充可更新析取逻辑层的网络模型参数,计算二值化训练特征向量对应的伪二值化训练特征向量。
其中,当预设的逻辑规则对各个类别的作用未知时,例如不知道“肥胖”是否是xx肺炎的高危因素,也不知道不同身份或者不同种()族的患者是否呈现集中分布,在预设规则后直接训练模型,通过Wl判断“肥胖”对xx肺炎的分类是否有正向或者负向的作用,或者过Wl判断“A身份”或者“A种()族”对xx肺炎的分类是否有正向或者负向的作用。
当预设的逻辑规则对某个类别的作用已知时,例如已知出现“(发热∧肺磨玻璃影)∨嗅觉减退”的患者,有较高的可能性患有xx肺炎。在模型中嵌入预设规则后,在训练过程中不断生成伪样本,并辅以相应的损失函数Lr4,约束模型的更新方向。
步骤405:保持不可更新合取逻辑层的网络模型参数和不可更新析取逻辑层的网络模型参数不变,根据训练特征向量的数量、二值化训练特征向量,以及伪二值化训练特征向量,确定已知规则约束损失函数。
其中,结合步骤404的处理过程,令q表示预设的析取范式,令q=(A∧B)∨(C∨D),已知q=True对类别k具有正向作用(q=True时,输入样本有更高的可能性属于类别k)。输入第i个训练样本x(i),二值化训练特征向量为b(i),随机选择q的任一合取子句p,令p=(A∧B),b(i)中的特征A、特征B位置处的元素人工置1,即对b(i)进行一定扰动,得到伪二值化向量b'(i)。因为q=True对类别k具有正向作用,所以输入b'(i)得到的类别k的预测概率应大于等于输入b(i)得到的类别k的预测概率/>因此,可以通过公式9计算规则约束损失函数/>
其中,为约束损失函数,N为训练样本个数,/>为b'(i)对应的类别k的预测概率,/>为b(i)对应的类别k的预测概率。/>
反之,若已知q=True对类别k具有负向作用,则通过公式10计算规则约束损失函数:
其中,为约束损失函数,N为训练样本个数,/>为b'(i)对应的类别k的预测概率,/>为b(i)对应的类别k的预测概率。
在训练时加入已知规则约束损失函数,能够引导逻辑层的网络学习到训练数据无法涵盖的规则,使学习到的模型具有更好的鲁棒性与适应性,同时,当训练数据的数据量不足,或数据带有偏置性,或数据背后的本质规则过于复杂或隐晦时,逻辑规则网络模型均能够直接从数据中学习到所有规则,使得逻辑规则网络模型可以吸收已有经验,提升逻辑规则网络模型进行分类的准确性。
在本发明的一些实施例中,当预设逻辑规则改变时,可以保持析取范式约束损失函数、以及网络稀疏性约束损失函数不变,对逻辑规则网络模型的已知规则约束损失函数进行动态更新。这样,由于先验知识的变化,通过已知规则约束损失函数能够及时进行调整,使得逻辑规则网络模型及时地吸收已有的规则信息,可以让逻辑规则网络模型的分类结果更加准确
当通过步骤202至步骤204获取到析取范式约束损失函数、网络稀疏性约束损失函数和已知规则约束损失函数之后,继续通过步骤205计算逻辑规则网络模型的融合损失函数。
步骤205:逻辑规则网络模型训练装置根据析取范式约束损失函数、网络稀疏性约束损失函数和已知规则约束损失函数,确定逻辑规则网络模型的融合损失函数。
其中,逻辑规则网络模型融合损失函数L计算参考公式11:
其中,融合损失函数为L,Lcls为析取范式约束损失函数,为约束损失函数αs≥0为超参数;当没有预设的规则,或预设的逻辑规则对各个类别的作用未知时,α4=0。
步骤206:逻辑规则网络模型训练装置根据训练特征向量和融合损失函数,对逻辑规则网络模型进行训练,确定逻辑规则网络模型的网络模型参数。
至此,通过步骤201至步骤206的训练,逻辑规则网络模型的网络模型参数已经确定,经过训练的逻辑规则网络模型可以部署在服务器中对所接收的数据进行分类,经过训练的所述逻辑规则网络模型用于:对待分类数据进行分类,并确定所述待分类数据对应的逻辑规则;图6为本发明实施例中数据分类方法的处理过程示意图,具体包括以下步骤:
步骤601:获取待分类数据,通过逻辑规则网络模型的二值化层对待分类数据进行拼接,得到二值化分类特征向量。
其中,以智能问诊***为例,经过训练的逻辑规则网络模型能够通过待分类的医疗数据判断目标对象是否感染A型冠状病毒,图7为本发明实施例中数据分类方法的处理逻辑示意图,其中,逻辑规则网络模型的训练可以通过前序实施例的步骤201至步骤206执行。A型冠状病毒的确诊预警阈值为0.3,当待分类数据的分类结果大于等于0.3时,待分类数据可能出现肌力下降,感觉症状,失语,视物不清,眩晕,头痛,恶心,呕吐,认知障碍,意识障碍等病症。,说明待分类数据可能已经感染A型冠状病毒,因此需要及时发出确诊警报信息,对待分类数据进行隔离治疗,同时还能够输出待分类数据对应的逻辑规则,即感染A型冠状病毒的逻辑规则:“发热且嗅觉减退”或“发热且味觉减退”或“发热且肺部磨玻璃影”。
在步骤601中,逻辑规则网络模型的二值化层对待分类数据进行拼接,得到二值化分类特征向量时,待分类数据拼接前可以进行特征化处理,得到连续性特征向量和离散型特征向量,例如可以包括:表示目标对象体温的连续型型特征向量,表示目标对象肺部ct图像的连续型型特征向量以及目标对象自述的嗅觉变化的离散型特征向量。
步骤602:通过逻辑规则网络模型的合取逻辑层对二值化分类特征向量进行连接处理,得到与连接分类特征向量。
其中,合取逻辑层进行连接处理,得到与连接分类特征向量,可以为:“嗅觉减退”(∧)“味觉减退”;“发热(∧)腹泻”。
步骤603:通过逻辑规则网络模型的析取逻辑层对连接分类特征向量进行连接处理,得到或连接分类特征向量。
其中,析取逻辑层对连接分类特征向量进行连接处理的结果可以为:嗅觉减退”(∧)“味觉减退”“(∨)发热(∧)腹泻”(∨)“体温为38.1°(∧)39.1°(∧)40.2°”
步骤604:通过逻辑规则网络模型的线性转换层对或连接分类特征向量进行转换,得到待分类数据的分类概率和待分类数据对应的逻辑规则。
其中,通过步骤601至步骤604的处理,通过逻辑规则网络模型判断目标对象感染A型冠状病毒的概率为0.6,同时,输出感染A型冠状病毒的逻辑规则:“发热且嗅觉减退”或“发热且味觉减退”或“体温出现持续高烧”。
在本发明的一些实施例中,随着医疗技术和医疗诊断经验的进步,感染A型冠状病毒的预设逻辑规则改变时,可以保持析取范式约束损失函数、以及网络稀疏性约束损失函数不变,对逻辑规则网络模型的已知规则约束损失函数进行动态更新,使得逻辑规则网络模型能够输出新的感染A型冠状病毒的逻辑规则,并提升感染A型冠状病毒的预测的准确性。
为了实现本申请所提供的逻辑规则网络模型训练方法,本申请还提供了相应的硬件设备,下面对本发明实施例的逻辑规则网络模型训练装置的结构做详细说明,下面对本发明实施例的逻辑规则网络模型训练装置的结构做详细说明,逻辑规则网络模型训练装置可以各种形式来实施,如带有逻辑规则网络模型训练处理功能的专用终端,也可以为设置有逻辑规则网络模型训练装置处理功能的服务器,例如前序图1中的服务器200。图8为本发明实施例提供的逻辑规则网络模型训练装置的组成结构示意图,可以理解,图8仅仅示出了逻辑规则网络模型训练装置的示例性结构而非全部结构,根据需要可以实施图8示出的部分结构或全部结构。
本发明实施例提供的逻辑规则网络模型训练装置包括:至少一个处理器201、存储器202、用户接口203和至少一个网络接口204。逻辑规则网络模型训练装置中的各个组件通过总线***205耦合在一起。可以理解,总线***205用于实现这些组件之间的连接通信。总线***205除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图8中将各种总线都标为总线***205。
其中,用户接口203可以包括显示器、键盘、鼠标、轨迹球、点击轮、按键、按钮、触感板或者触摸屏等。
可以理解,存储器202可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。本发明实施例中的存储器202能够存储数据以支持终端(如10-1)的操作。这些数据的示例包括:用于在终端(如10-1)上操作的任何计算机程序,如操作***和应用程序。其中,操作***包含各种***程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序可以包含各种应用程序。
在一些实施例中,本发明实施例提供的逻辑规则网络模型训练装置可以采用软硬件结合的方式实现,作为示例,本发明实施例提供的逻辑规则网络模型训练装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本发明实施例提供的逻辑规则网络模型训练方法。例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable LogicDevice)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)或其他电子元件。
作为本发明实施例提供的逻辑规则网络模型训练装置采用软硬件结合实施的示例,本发明实施例所提供的逻辑规则网络模型训练装置可以直接体现为由处理器201执行的软件模块组合,软件模块可以位于存储介质中,存储介质位于存储器202,处理器201读取存储器202中软件模块包括的可执行指令,结合必要的硬件(例如,包括处理器201以及连接到总线205的其他组件)完成本发明实施例提供的逻辑规则网络模型训练方法。
作为示例,处理器201可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
作为本发明实施例提供的逻辑规则网络模型训练装置采用硬件实施的示例,本发明实施例所提供的装置可以直接采用硬件译码处理器形式的处理器201来执行完成,例如,被一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-ProgrammableGate Array)或其他电子元件执行实现本发明实施例提供的逻辑规则网络模型训练方法。
本发明实施例中的存储器202用于存储各种类型的数据以支持逻辑规则网络模型训练装置的操作。这些数据的示例包括:用于在逻辑规则网络模型训练装置上操作的任何可执行指令,如可执行指令,实现本发明实施例的从逻辑规则网络模型训练方法的程序可以包含在可执行指令中。
在另一些实施例中,本发明实施例提供的逻辑规则网络模型训练装置可以采用软件方式实现,图8示出了存储在存储器202中的逻辑规则网络模型训练装置,其可以是程序和插件等形式的软件,并包括一系列的模块,作为存储器202中存储的程序的示例,可以包括逻辑规则网络模型训练装置,逻辑规则网络模型训练装置中包括以下的软件模块:
信息传输模块2081和信息处理模块2082。当逻辑规则网络模型训练装置中的软件模块被处理器201读取到RAM中并执行时,将实现本发明实施例提供的逻辑规则网络模型训练方法,其中,逻辑规则网络模型训练装置中各个软件模块的功能,包括:
信息传输模块2081,用于对原始数据进行特征化处理,得到训练特征向量;
信息处理模块2082,用于确定逻辑规则网络模型的析取范式约束损失函数;
信息处理模块2082,用于确定逻辑规则网络模型的网络稀疏性约束损失函数;
信息处理模块2082,用于确定逻辑规则网络模型的已知规则约束损失函数;
信息处理模块2082,用于根据析取范式约束损失函数、网络稀疏性约束损失函数和已知规则约束损失函数,确定逻辑规则网络模型的融合损失函数;
信息处理模块2082,用于根据训练特征向量和融合损失函数,对逻辑规则网络模型进行训练,确定逻辑规则网络模型的网络模型参数。
根据图8所示的电子设备,在本申请的一个方面中,本申请还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该电子设备执行上述逻辑规则网络模型训练方法或者数据分类方法的各种可选实现方式中所提供的不同实施例及实施例的组合。
有益技术效果:
首先,本发明提供的逻辑规则网络模型训练方法中,述逻辑规则网络模型包括:二值化层、合取逻辑层、析取逻辑层以及线性转换层,逻辑规则网络模型的融合损失函数包括:析取范式约束损失函数、网络稀疏性约束损失函数和已知规则约束损失函数,由此,经过训练的逻辑规则网络模型生成的逻辑表达中逻辑符号清晰,提升了逻辑表达的可读性较差,降低了逻辑规则网络模型生成结果的理解难度;同时由于训练过程中引入了已知规则约束损失函数,当训练数据的数据量不足,或数据带有偏置性,或数据背后的本质规则过于复杂或隐晦时,逻辑规则网络模型均能够直接从数据中学习到所有规则,使得逻辑规则网络模型可以吸收已有经验,提升逻辑规则网络模型进行分类的准确性。
其次,由于先验知识的变化,通过已知规则约束损失函数能够及时进行调整,使得逻辑规则网络模型及时地吸收已有的规则信息,可以让逻辑规则网络模型的分类结果更加准确。
以上,仅为本发明的实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (13)
1.一种逻辑规则网络模型训练方法,其特征在于,所述方法包括:
对原始数据进行特征化处理,得到训练特征向量,其中,所述原始数据包括:目标对象的原始身体数据和病种表现信息;
确定逻辑规则网络模型的析取范式约束损失函数;
确定所述逻辑规则网络模型的网络稀疏性约束损失函数;
确定所述逻辑规则网络模型的已知规则约束损失函数;
根据所述析取范式约束损失函数、所述网络稀疏性约束损失函数和所述已知规则约束损失函数,确定所述逻辑规则网络模型的融合损失函数;
根据所述训练特征向量和所述融合损失函数,对所述逻辑规则网络模型进行训练,确定所述逻辑规则网络模型的网络模型参数,其中,经过训练的所述逻辑规则网络模型用于:对待分类数据进行分类,并确定所述待分类数据对应的逻辑规则。
2.根据权利要求1所述的方法,其特征在于,所述确定逻辑规则网络模型的析取范式约束损失函数,包括:
对所述训练特征向量进行切分,得到离散型训练特征向量和连续型训练特征向量;
通过所述逻辑规则网络模型的二值化层对所述连续型训练特征向量进行二值化处理,并与所述离散型训练特征向量进行拼接,得到二值化训练特征向量,其中,所述逻辑规则网络模型包括:二值化层、合取逻辑层、析取逻辑层以及线性转换层;
通过所述合取逻辑层,利用与连接符对所述二值化训练特征向量进行连接处理,得到与连接训练特征向量;
通过所述析取逻辑层,利用或连接符对所述与连接训练特征向量进行连接处理,得到或连接训练特征向量;
通过所述线性转换层对所述或连接训练特征向量进行转换,得到分类向量;
根据所述分类向量的类别数量、所述训练特征向量的数量以及所述分类向量计算所述逻辑规则网络模型的析取范式约束损失函数。
3.根据权利要求2所述的方法,其特征在于,所述根据所述分类向量的类别数量、所述训练特征向量的数量以及所述分类向量计算所述逻辑规则网络模型的析取范式约束损失函数,包括:
当所述逻辑规则网络模型用于单标签多分类任务时,计算所述分类向量对应的归一化指数分类向量;
根据所述分类向量的类别数量、所述训练特征向量的数量以及所述归一化指数分类向量,计算交叉熵作为所述逻辑规则网络模型的析取范式约束损失函数。
4.根据权利要求2所述的方法,其特征在于,所述根据所述分类向量的类别数量、所述训练特征向量的数量以及所述分类向量计算所述逻辑规则网络模型的析取范式约束损失函数,包括:
当所述逻辑规则网络模型用于多标签多分类任务时,计算所述分类向量对应的逻辑回归分类向量;
根据所述分类向量的类别数量、所述训练特征向量的数量以及所述逻辑回归分类向量,计算二元交叉熵作为所述逻辑规则网络模型的析取范式约束损失函数。
5.根据权利要求2所述的方法,其特征在于,所述确定所述逻辑规则网络模型的网络稀疏性约束损失函数,包括:
获取所述逻辑规则网络模型中的合取逻辑层的网络模型参数、析取逻辑层的网络模型参数以及线性转换层的网络模型参数;
对所述线性转换层的网络模型参数进行正则化约束,得到第一约束损失函数;
确定所述与连接训练特征向量的长度和所述或连接训练特征向量的长度;
根据所述连接训练特征向量的长度和所述或连接训练特征向量的长度,对所述合取逻辑层的网络模型参数、析取逻辑层的网络模型参数进行正则化,得到第二约束损失函数;
根据所述训练特征向量的数量,对所述或连接训练特征向量进行稀疏性约束,得到第三约束损失函数;
根据所述第一约束损失函数、第二约束损失函数以及第三约束损失函数的加和,确定所述网络稀疏性约束损失函数。
6.根据权利要求2所述的方法,其特征在于,所述确定所述逻辑规则网络模型的已知规则约束损失函数,包括:
获取所述逻辑规则网络模型对应的预设逻辑规则;
对所述合取逻辑层的网络模型参数进行分解,得到可更新合取逻辑层的网络模型参数和不可更新合取逻辑层的网络模型参数;
对所述析取逻辑层的网络模型参数进行分解,得到可更新析取逻辑层的网络模型参数和不可更新析取逻辑层的网络模型参数;
根据所述预设逻辑规则对所述可更新合取逻辑层的网络模型参数进行扩充,得到扩充可更新合取逻辑层的网络模型参数;
根据所述预设逻辑规则对所述可更新析取逻辑层的网络模型参数进行扩充,得到扩充可更新析取逻辑层的网络模型参数;
根据所述扩充可更新合取逻辑层的网络模型参数,以及所述扩充可更新析取逻辑层的网络模型参数,计算所述二值化训练特征向量对应的伪二值化训练特征向量;
保持所述不可更新合取逻辑层的网络模型参数和所述不可更新析取逻辑层的网络模型参数不变,根据所述训练特征向量的数量、所述二值化训练特征向量,以及所述伪二值化训练特征向量,确定所述已知规则约束损失函数。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
当所述预设逻辑规则改变时,保持所述析取范式约束损失函数、以及所述网络稀疏性约束损失函数不变,对所述逻辑规则网络模型的已知规则约束损失函数进行动态更新。
8.一种数据分类方法,其特征在于,所述方法包括:
获取待分类数据;
通过逻辑规则网络模型的二值化层对所述待分类数据进行拼接,得到二值化分类特征向量;
通过所述逻辑规则网络模型的合取逻辑层对所述二值化分类特征向量进行连接处理,得到与连接分类特征向量;
通过所述逻辑规则网络模型的析取逻辑层对所述连接分类特征向量进行连接处理,得到或连接分类特征向量;
通过所述逻辑规则网络模型的线性转换层对所述或连接分类特征向量进行转换,得到所述待分类数据的分类概率和所述待分类数据对应的逻辑规则;
其中,所述逻辑规则网络模型如权利要求1至7任一项所述的方法训练得到。
9.一种逻辑规则网络模型训练装置,其特征在于,所述装置包括:
信息传输模块,用于对原始数据进行特征化处理,得到训练特征向量,其中,所述原始数据包括:目标对象的原始身体数据和病种表现信息;
信息处理模块,用于确定逻辑规则网络模型的析取范式约束损失函数;
所述信息处理模块,用于确定所述逻辑规则网络模型的网络稀疏性约束损失函数;
所述信息处理模块,用于确定所述逻辑规则网络模型的已知规则约束损失函数;
所述信息处理模块,用于根据所述析取范式约束损失函数、所述网络稀疏性约束损失函数和所述已知规则约束损失函数,确定所述逻辑规则网络模型的融合损失函数;
所述信息处理模块,用于根据所述训练特征向量和所述融合损失函数,对所述逻辑规则网络模型进行训练,确定所述逻辑规则网络模型的网络模型参数,其中,经过训练的所述逻辑规则网络模型用于:对待分类数据进行分类,并确定所述待分类数据对应的逻辑规则。
10.一种数据分类装置,其特征在于,所述装置包括:
数据传输模块,用于获取待分类数据;
数据处理模块,用于通过所述逻辑规则网络模型的二值化层对所述待分类数据进行拼接,得到二值化分类特征向量;
所述数据处理模块,用于通过所述逻辑规则网络模型的合取逻辑层对所述二值化分类特征向量进行连接处理,得到与连接分类特征向量;
所述数据处理模块,用于通过所述逻辑规则网络模型的析取逻辑层对所述连接分类特征向量进行连接处理,得到或连接分类特征向量;
所述数据处理模块,用于通过所述逻辑规则网络模型的线性转换层对所述或连接分类特征向量进行转换,得到所述待分类数据的分类概率和所述待分类数据对应的逻辑规则;
其中,所述逻辑规则网络模型如权利要求1至7任一项所述的方法训练得到。
11.一种计算机程序产品,包括计算机程序或指令,其特征在于,所述计算机程序或指令被处理器执行时,实现权利要求1-7任一项所述的逻辑规则网络模型训练方法,或者,实现权利要求8所述的数据分类方法。
12.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于运行所述存储器存储的可执行指令时,实现权利要求1-7任一项所述的逻辑规则网络模型训练方法,或者,实现权利要求8所述的数据分类方法。
13.一种计算机可读存储介质,存储有可执行指令,其特征在于,所述可执行指令被处理器执行时实现权利要求1-7任一项所述的逻辑规则网络模型训练方法,或者,实现权利要求8所述的数据分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310149602.2A CN116975578A (zh) | 2023-02-09 | 2023-02-09 | 逻辑规则网络模型训练方法、装置、设备、程序及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310149602.2A CN116975578A (zh) | 2023-02-09 | 2023-02-09 | 逻辑规则网络模型训练方法、装置、设备、程序及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116975578A true CN116975578A (zh) | 2023-10-31 |
Family
ID=88475524
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310149602.2A Pending CN116975578A (zh) | 2023-02-09 | 2023-02-09 | 逻辑规则网络模型训练方法、装置、设备、程序及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116975578A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117746167A (zh) * | 2024-02-20 | 2024-03-22 | 四川大学 | 口腔全景片影像摆位错误分类模型训练方法及分类方法 |
-
2023
- 2023-02-09 CN CN202310149602.2A patent/CN116975578A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117746167A (zh) * | 2024-02-20 | 2024-03-22 | 四川大学 | 口腔全景片影像摆位错误分类模型训练方法及分类方法 |
CN117746167B (zh) * | 2024-02-20 | 2024-04-19 | 四川大学 | 口腔全景片影像摆位错误分类模型训练方法及分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liang et al. | Symbolic graph reasoning meets convolutions | |
CN109816032B (zh) | 基于生成式对抗网络的无偏映射零样本分类方法和装置 | |
CN112364880B (zh) | 基于图神经网络的组学数据处理方法、装置、设备及介质 | |
CN109783666A (zh) | 一种基于迭代精细化的图像场景图谱生成方法 | |
CN110795944A (zh) | 推荐内容处理方法及装置、情感属性确定方法及装置 | |
CN111046275A (zh) | 基于人工智能的用户标签确定方法及装置、存储介质 | |
WO2024031933A1 (zh) | 一种基于多模态数据的社交关系分析方法、***和存储介质 | |
CN114064928A (zh) | 一种知识图谱的知识推理方法、装置、设备及存储介质 | |
CN116975578A (zh) | 逻辑规则网络模型训练方法、装置、设备、程序及介质 | |
CN115952343A (zh) | 一种基于多关系图卷积网络的社交机器人检测方法 | |
Liu et al. | Uncertain label correction via auxiliary action unit graphs for facial expression recognition | |
Yusuf et al. | Evaluation of graph convolutional networks performance for visual question answering on reasoning datasets | |
Lonij et al. | Open-world visual recognition using knowledge graphs | |
Li et al. | Multi-label video classification via coupling attentional multiple instance learning with label relation graph | |
Marini et al. | Semi-supervised learning with a teacher-student paradigm for histopathology classification: a resource to face data heterogeneity and lack of local annotations | |
CN116958624A (zh) | 指定材质的识别方法、装置、设备、介质及程序产品 | |
Tian et al. | Scene graph generation by multi-level semantic tasks | |
CN113537325B (zh) | 一种用于图像分类的基于提取高低层特征逻辑的深度学习方法 | |
CN115019342A (zh) | 一种基于类关系推理的濒危动物目标检测方法 | |
Lian et al. | Virtual Reality and Internet of Things‐Based Music Online Learning via the Graph Neural Network | |
CN111552827B (zh) | 标注方法和装置、行为意愿预测模型训练方法和装置 | |
CN115440384A (zh) | 一种基于多任务学习的医疗知识图谱的处理方法及*** | |
Liu et al. | HANA: hierarchical attention network assembling for semantic segmentation | |
Yu et al. | Vision-based vehicle detection in foggy days by convolutional neural network | |
Kuang et al. | Multi-label image classification with multi-layered multi-perspective dynamic semantic representation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |