CN117688222B - 一种基于贝叶斯网络的数字图书馆的实现方法及*** - Google Patents

一种基于贝叶斯网络的数字图书馆的实现方法及*** Download PDF

Info

Publication number
CN117688222B
CN117688222B CN202410154342.2A CN202410154342A CN117688222B CN 117688222 B CN117688222 B CN 117688222B CN 202410154342 A CN202410154342 A CN 202410154342A CN 117688222 B CN117688222 B CN 117688222B
Authority
CN
China
Prior art keywords
resource
class
digital
target
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410154342.2A
Other languages
English (en)
Other versions
CN117688222A (zh
Inventor
旻苏
王霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China National Institute of Standardization
Original Assignee
China National Institute of Standardization
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China National Institute of Standardization filed Critical China National Institute of Standardization
Priority to CN202410154342.2A priority Critical patent/CN117688222B/zh
Publication of CN117688222A publication Critical patent/CN117688222A/zh
Application granted granted Critical
Publication of CN117688222B publication Critical patent/CN117688222B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种基于贝叶斯网络的数字图书馆的实现方法及***,能够通过技术的手段在满足用户需求的条件下,还为用户进行数字资源的推荐。一方面,通过以管理、监督目的的数据处理,实现了基于贝叶斯网络的数字资源的管理;另一方面,为进一步地减少监督、管理资源的消耗提供了条件。

Description

一种基于贝叶斯网络的数字图书馆的实现方法及***
技术领域
本申请涉及适用于管理、监督或预测目的的数据处理技术领域,尤其涉及一种基于贝叶斯网络的数字图书馆的实现方法及***。
背景技术
"数字图书馆"是用数字技术处理和存储各种图文并茂文献的图书馆,该词由英文Digital Library翻译而来,实质上它是一种多媒体制作的分布式信息***,把各种不同载体、不同地理位置的信息资源用数字技术存贮,以跨越区域面向对象的网络查询和传播的一个大型信息***。
例如,公开(公告)号:CN101887549B,专利标题:“一种数字图书馆的图书获取***”(主分类号:G06Q10/00),通过对数字图书馆的设计实现了对数字资源的管理。一方面,能够说明监督或预测目的的数据处理技术在数字图书馆技术领域大有可为;另一方面,也能够说明在该领域的技术挖掘还具有较为宽泛的扩展前景。
发明内容
本申请实施例提供了一种基于贝叶斯网络的数字图书馆的实现方法及***,以至少部分的解决上述技术问题。
本申请实施例采用下述技术方案:
第一方面,本申请实施例提供一种基于贝叶斯网络的数字图书馆的实现方法,所述方法包括:
基于数字图书馆管理的各数字资源历史上的查询情况信息,确定所述数字资源的查询频率的分布周期;
基于所述分布周期对所述数字资源进行聚类,得到若干个资源类;
针对每个所述资源类,确定该资源类所属的分布周期内,该资源类的平均查询频率;
针对每个所述资源类,确定该资源类的边缘概率,所述边缘概率与所述平均查询频率正相关;
对所述资源类的查询情况进行监测,若在距当前时刻第一时长的历史时间段内,对所述资源类的查询频率高于其所属的资源类在最近一个分部周期内的最高查询频率,则确定该资源类的标准化常量,所述标准化常量与所述查询频率高于其所属的资源类的平均查询频率的程度正相关;
在接收到查询请求时,确定所述查询请求针对的所述资源类,作为目标类;
基于所述目标类包含的数字资源在距当前时刻第二时长的历史时间段内的查询频率,确定条件概率,所述条件概率与所述第二时长的历史时间段内的查询频率正相关;
采用贝叶斯网络,基于所述边缘概率、所述标准化常量、以及所述条件概率,确定所述目标类的后验概率,所述贝叶斯网络是基于贝叶斯法则确定的;
将所述目标类中与所述查询请求相匹配的数字资源作为目标资源;
基于所述目标资源所属的目标类的后验概率,对所述目标资源进行排序,得到可展示资源。
在本说明书一个可选的实施例中,所述方法还包括:
所述第二时长大于所述第一时长;和/或,在得到所述可展示资源之后,展示所述可展示资源。
在本说明书一个可选的实施例中,所述方法还包括:
所述聚类采用的是k-means聚类。
在本说明书一个可选的实施例中,在接收到查询请求时,确定所述查询请求针对的所述资源类,作为目标类,包括:
对所述查询请求进行语义解析,得到解析结果;
将所述数字资源中与所述解析结果匹配度最高的指定数量个,作为备选资源;
将所述备选资源所属的资源类,作为所述目标类。
在本说明书一个可选的实施例中,所述方法还包括:
所述指定数量与所述解析结果的语义清晰度正相关。
在本说明书一个可选的实施例中,所述方法还包括:
在接收到待入库资源时,基于所述待入库资源与所述数字图书馆管理的各数字资源的相似度,确定所述待入库资源所属的资源类。
第二方面,本申请实施例还提供一种基于贝叶斯网络的数字图书馆的实现***,所述***包括:
分布周期确定模块,配置为:基于数字图书馆管理的各数字资源历史上的查询情况信息,确定所述数字资源的查询频率的分布周期;
资源类确定模块,配置为:基于所述分布周期对所述数字资源进行聚类,得到若干个资源类;
平均查询频率确定模块,配置为:针对每个所述资源类,确定该资源类所属的分布周期内,该资源类的平均查询频率;
边缘概率确定模块,配置为:针对每个所述资源类,确定该资源类的边缘概率,所述边缘概率与所述平均查询频率正相关;
标准化常量确定模块,配置为:对所述资源类的查询情况进行监测,若在距当前时刻第一时长的历史时间段内,对所述资源类的查询频率高于其所属的资源类在最近一个分部周期内的最高查询频率,则确定该资源类的标准化常量,所述标准化常量与所述查询频率高于其所属的资源类的平均查询频率的程度正相关;
目标类确定模块,配置为:在接收到查询请求时,确定所述查询请求针对的所述资源类,作为目标类;
条件概率确定模块,配置为:基于所述目标类包含的数字资源在距当前时刻第二时长的历史时间段内的查询频率,确定条件概率,所述条件概率与所述第二时长的历史时间段内的查询频率正相关;
后验概率确定模块,配置为:采用贝叶斯网络,基于所述边缘概率、所述标准化常量、以及所述条件概率,确定所述目标类的后验概率,所述贝叶斯网络是基于贝叶斯法则确定的;
目标资源确定模块,配置为:将所述目标类中与所述查询请求相匹配的数字资源作为目标资源;
可展示资源确定模块,配置为:基于所述目标资源所属的目标类的后验概率,对所述目标资源进行排序,得到可展示资源。
第三方面,本申请实施例还提供一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行第一方面所述的方法步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行第一方面所述的方法步骤。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
数字图书馆多用于对数字资源的管理,具体体现为:应用户的查询请求,向用户反馈对应的数字资源。随着用户对使用需求的逐渐提高,仅仅为用户提供其目标的数字资源已经不能够保障用户的体验。此外,在某些情况下,用户未必明确的知道其目标的数字资源,则要求数字图书馆还要具备推荐功能。本说明书中的方法和***则能够通过技术的手段在满足用户需求的条件下,还为用户进行数字资源的推荐。一方面,通过以管理、监督目的的数据处理,实现了基于贝叶斯网络的数字资源的管理;另一方面,为进一步地减少监督、管理资源的消耗提供了条件。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本说明书实施例提供的一种基于贝叶斯网络的数字图书馆的实现方法的过程示意图;
图2为本说明书实施例中一种电子设备的结构示意图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其它元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。而本申请所说“连接”、“联接”,如无特别说明,均包括直接和间接连接(联接)。
以下结合附图,详细说明本申请各实施例提供的技术方案。
如图1所示,本说明书中的基于贝叶斯网络的数字图书馆的实现方法包含以下步骤:
S100:基于数字图书馆管理的各数字资源历史上的查询情况信息,确定所述数字资源的查询频率的分布周期。
本说明书中的数字资源是以数字的形式表征的资源,数字图书馆的功能不仅仅是对数字资源的录入、删除等,还包含基于用户的需求向用户推荐数字资源。
查询频率可以以时间节点进行表征,例如,可以以天作为时间节点。用户对数字资源的需求通常呈周期性。例如,对于考试资料,通常在学期末考试的时候被查询的频率较高,而在其他时间节点被查询的频率则较低。而有的周期性较强,查询频率的波峰和波谷较为明显,而有的周期性较弱,波峰和波谷较为不明显,但总归是有周期性的。对于周期性较弱的,可以视为一个周期还没结束。
此外,周期还有长有短,有的周期是一年,有的是3个月。
S102:基于所述分布周期对所述数字资源进行聚类,得到若干个资源类。
相关技术中的聚类技术手段在条件允许的情况下,均可以适用于本说明书。在本说明书一个可选的实施例中,聚类采用的是k-means聚类。
例如,分布周期为一年和13个月的数字资源被聚为一个类。而分布周期为3个月的数字资源被聚在另一个类中。
在实际操作中,可以为资源类分配唯一标识,添加至该资源类的数字资源中。
S104:针对每个所述资源类,确定该资源类所属的分布周期内,该资源类的平均查询频率。
平均查询频率即为查询频率的均值,表明用户在宏观的层面对该资源类的中的数字资源的需求程度。
S106:针对每个所述资源类,确定该资源类的边缘概率。
本说明书中边缘概率与所述平均查询频率正相关。该边缘概率是在宏观层面对用户对该类数字资源的需求程度,是较为长的历史时间段内情况的表征。也就是说,边缘概率并没有考虑到近期甚至实时发生的突发事件对用户需求的影响。
示例性地,长远来看,一年一度的某资格考试对教辅数字资源的需求的概率即为边缘概率。然而,某年发生了突发事件,导致当年考试取消,被推延至下一年,导致下一年的参考人员激增,则对应的数字资源的查询量也会在下一年激增,这种突发的、不规律的事件是边缘概率无法体现的。
S108:对所述资源类的查询情况进行监测,若在距当前时刻第一时长的历史时间段内,对所述资源类的查询频率高于其所属的资源类在最近一个分部周期内的最高查询频率,则确定该资源类的标准化常量。
通常情况下,突发事件是难以精确预见的。若通过对舆论、对海量的网页信息进行监控,以察觉突发事件,这种方式往往会消耗大量的资源,往往是不可取的。
本说明书中的方法则无需对舆论进行监控。若在距当前时刻第一时长的历史时间段内,对所述资源类的查询频率高于其所属的资源类在最近一个分部周期内的最高查询频率,表明该资源类对应的突发事件发生了。标准化常量表征的是在分布周期对应的查询频率这一条件下,发生的条件概率。标准化常量可以通过贝叶斯算法得到。本说明书中的标准化常量与所述查询频率高于其所属的资源类的平均查询频率的程度正相关。
在本说明书一个可选的实施例中,第一时长是预设时长。
S110:在接收到查询请求时,确定所述查询请求针对的所述资源类,作为目标类。
资源类是基于分布周期得到的,则目标类的确定能够对用户的行为是否基于突发事件进行表征。
在本说明书一个可选的实施例中,对所述查询请求进行语义解析,得到解析结果。相关技术中,能够用于实现语义解析的技术手段,在条件允许的情况下,均适用于本说明书。将所述数字资源中与所述解析结果匹配度最高的指定数量个,作为备选资源。相关技术中,能够确定匹配度的技术手段,在条件允许的情况下,均适用于本说明书。将所述备选资源所属的资源类,作为所述目标类。
目标类包含的数字资源中的至少部分是符合查询请求的,也就是说,目标类相较于备选资源是对用户需求的扩充,其中有可能包含了用户感兴趣的数字资源。
在本说明书一个可选的实施例中,所述指定数量与所述解析结果的语义清晰度正相关。语义清晰度用于表明用户是否明确的知道自己想要什么。语义清晰度越高,表明用户越明确。以专利文献为例,用户明确知道申请号的情况下,表明用户明确知道自己想要什么。若用检索输入的是“数字图书馆”、“***”这样的关键词,则表明用不明确的知道自己想要什么。相关技术中,能够对用户明确与否进行量化的技术手段,在调价允许的情况下,均适用于本说明书。
S112:基于所述目标类包含的数字资源在距当前时刻第二时长的历史时间段内的查询频率,确定条件概率。
条件概率与所述第二时长的历史时间段内的查询频率正相关。
第二时长的历史时间段也是距当前时刻较近的一个时间段,在该时间段内的查询行为结合了突发事件与历史规律之间的结合。
在本说明书一个可选的实施例中,所述第二时长大于所述第一时长。以使得条件概率尽可能的涵盖突发事件的整个过程。
S114:采用贝叶斯网络,基于所述边缘概率、所述标准化常量、以及所述条件概率,确定所述目标类的后验概率。
本说明书中的贝叶斯网络是基于贝叶斯法则确定的,贝叶斯网络可以视为对贝叶斯法则的具象化,可以是能够基于贝叶斯法则进行数据处理的装置。
S116:将所述目标类中与所述查询请求相匹配的数字资源作为目标资源。
相关技术中,用于确定匹配度的技术手段,在条件允许的情况下,均适用于本说明书。本说明书中的目标资源可以是一个以上。
S118:基于所述目标资源所属的目标类的后验概率,对所述目标资源进行排序,得到可展示资源。
基于本步骤进行的排序,能够将突发事件对本次查询造成的影响体现出现,在用户是基于突发事件进行的查询的情况下,能够更符合用户的兴趣。
数字图书馆多用于对数字资源的管理,具体体现为:应用户的查询请求,向用户反馈对应的数字资源。随着用户对使用需求的逐渐提高,仅仅为用户提供其目标的数字资源已经不能够保障用户的体验。此外,在某些情况下,用户未必明确的知道其目标的数字资源,则要求数字图书馆还要具备推荐功能。本说明书中的方法和***则能够在满足用户需求的条件下,还为用户进行数字资源的推荐。
进一步地,本说明书还提供一种基于贝叶斯网络的数字图书馆的实现***,所述***包括:
分布周期确定模块,配置为:基于数字图书馆管理的各数字资源历史上的查询情况信息,确定所述数字资源的查询频率的分布周期;
资源类确定模块,配置为:基于所述分布周期对所述数字资源进行聚类,得到若干个资源类;
平均查询频率确定模块,配置为:针对每个所述资源类,确定该资源类所属的分布周期内,该资源类的平均查询频率;
边缘概率确定模块,配置为:针对每个所述资源类,确定该资源类的边缘概率,所述边缘概率与所述平均查询频率正相关;
标准化常量确定模块,配置为:对所述资源类的查询情况进行监测,若在距当前时刻第一时长的历史时间段内,对所述资源类的查询频率高于其所属的资源类在最近一个分部周期内的最高查询频率,则确定该资源类的标准化常量,所述标准化常量与所述查询频率高于其所属的资源类的平均查询频率的程度正相关;
目标类确定模块,配置为:在接收到查询请求时,确定所述查询请求针对的所述资源类,作为目标类;
条件概率确定模块,配置为:基于所述目标类包含的数字资源在距当前时刻第二时长的历史时间段内的查询频率,确定条件概率,所述条件概率与所述第二时长的历史时间段内的查询频率正相关;
后验概率确定模块,配置为:采用贝叶斯网络,基于所述边缘概率、所述标准化常量、以及所述条件概率,确定所述目标类的后验概率,所述贝叶斯网络是基于贝叶斯法则确定的;
目标资源确定模块,配置为:将所述目标类中与所述查询请求相匹配的数字资源作为目标资源;
可展示资源确定模块,配置为:基于所述目标资源所属的目标类的后验概率,对所述目标资源进行排序,得到可展示资源。
该***能够执行前述任一实施例中的方法,并能够获得相同或相似的技术效果,此处不再赘述。
图2是本申请的一个实施例电子设备的结构示意图。请参考图2,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图2中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成一种基于贝叶斯网络的数字图书馆的实现***。处理器,执行存储器所存放的程序,并具体用于执行前述任意一种基于贝叶斯网络的数字图书馆的实现方法。
上述如本申请图1所示实施例揭示的一种基于贝叶斯网络的数字图书馆的实现方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(CentralProcessing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1中一种基于贝叶斯网络的数字图书馆的实现方法,并实现图1所示实施例的功能,本申请实施例在此不再赘述。
本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,执行前述的任意一种基于贝叶斯网络的数字图书馆的实现方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的***。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令***的制造品,该指令***实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器 (CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM) 和/或非易失性内存等形式,如只读存储器 (ROM) 或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (9)

1.一种基于贝叶斯网络的数字图书馆的实现方法,其特征在于,所述方法包括:
基于数字图书馆管理的各数字资源历史上的查询情况信息,确定所述数字资源的查询频率的分布周期;
基于所述分布周期对所述数字资源进行聚类,得到若干个资源类;
针对每个所述资源类,确定该资源类所属的分布周期内,该资源类的平均查询频率;
针对每个所述资源类,确定该资源类的边缘概率,所述边缘概率与所述平均查询频率正相关;
对所述资源类的查询情况进行监测,若在距当前时刻第一时长的历史时间段内,对所述资源类的查询频率高于其所属的资源类在最近一个分布周期内的最高查询频率,则确定该资源类的标准化常量,所述标准化常量与所述查询频率高于其所属的资源类的平均查询频率的程度正相关;
在接收到查询请求时,确定所述查询请求针对的所述资源类,作为目标类;
基于所述目标类包含的数字资源在距当前时刻第二时长的历史时间段内的查询频率,确定条件概率,所述条件概率与所述第二时长的历史时间段内的查询频率正相关;
采用贝叶斯网络,基于所述边缘概率、所述标准化常量、以及所述条件概率,确定所述目标类的后验概率,所述贝叶斯网络是基于贝叶斯法则确定的;
将所述目标类中与所述查询请求相匹配的数字资源作为目标资源;
基于所述目标资源所属的目标类的后验概率,对所述目标资源进行排序,得到可展示资源。
2.如权利要求1所述方法,其特征在于,所述方法还包括:
所述第二时长大于所述第一时长;和/或,在得到所述可展示资源之后,展示所述可展示资源。
3.如权利要求1所述方法,其特征在于,所述方法还包括:
所述聚类采用的是k-means聚类。
4.如权利要求1所述方法,其特征在于,在接收到查询请求时,确定所述查询请求针对的所述资源类,作为目标类,包括:
对所述查询请求进行语义解析,得到解析结果;
将所述数字资源中与所述解析结果匹配度最高的指定数量个,作为备选资源;
将所述备选资源所属的资源类,作为所述目标类。
5.如权利要求4所述方法,其特征在于,所述方法还包括:
所述指定数量与所述解析结果的语义清晰度正相关。
6.如权利要求1所述方法,其特征在于,所述方法还包括:
在接收到待入库资源时,基于所述待入库资源与所述数字图书馆管理的各数字资源的相似度,确定所述待入库资源所属的资源类。
7.一种基于贝叶斯网络的数字图书馆的实现***,其特征在于,所述***包括:
分布周期确定模块,配置为:基于数字图书馆管理的各数字资源历史上的查询情况信息,确定所述数字资源的查询频率的分布周期;
资源类确定模块,配置为:基于所述分布周期对所述数字资源进行聚类,得到若干个资源类;
平均查询频率确定模块,配置为:针对每个所述资源类,确定该资源类所属的分布周期内,该资源类的平均查询频率;
边缘概率确定模块,配置为:针对每个所述资源类,确定该资源类的边缘概率,所述边缘概率与所述平均查询频率正相关;
标准化常量确定模块,配置为:对所述资源类的查询情况进行监测,若在距当前时刻第一时长的历史时间段内,对所述资源类的查询频率高于其所属的资源类在最近一个分布周期内的最高查询频率,则确定该资源类的标准化常量,所述标准化常量与所述查询频率高于其所属的资源类的平均查询频率的程度正相关;
目标类确定模块,配置为:在接收到查询请求时,确定所述查询请求针对的所述资源类,作为目标类;
条件概率确定模块,配置为:基于所述目标类包含的数字资源在距当前时刻第二时长的历史时间段内的查询频率,确定条件概率,所述条件概率与所述第二时长的历史时间段内的查询频率正相关;
后验概率确定模块,配置为:采用贝叶斯网络,基于所述边缘概率、所述标准化常量、以及所述条件概率,确定所述目标类的后验概率,所述贝叶斯网络是基于贝叶斯法则确定的;
目标资源确定模块,配置为:将所述目标类中与所述查询请求相匹配的数字资源作为目标资源;
可展示资源确定模块,配置为:基于所述目标资源所属的目标类的后验概率,对所述目标资源进行排序,得到可展示资源。
8.一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行所述权利要求1~6之任一所述方法。
9.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行所述权利要求1~6之任一所述方法。
CN202410154342.2A 2024-02-04 2024-02-04 一种基于贝叶斯网络的数字图书馆的实现方法及*** Active CN117688222B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410154342.2A CN117688222B (zh) 2024-02-04 2024-02-04 一种基于贝叶斯网络的数字图书馆的实现方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410154342.2A CN117688222B (zh) 2024-02-04 2024-02-04 一种基于贝叶斯网络的数字图书馆的实现方法及***

Publications (2)

Publication Number Publication Date
CN117688222A CN117688222A (zh) 2024-03-12
CN117688222B true CN117688222B (zh) 2024-04-16

Family

ID=90137541

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410154342.2A Active CN117688222B (zh) 2024-02-04 2024-02-04 一种基于贝叶斯网络的数字图书馆的实现方法及***

Country Status (1)

Country Link
CN (1) CN117688222B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101604322A (zh) * 2009-06-24 2009-12-16 北京理工大学 一种决策级文本自动分类融合方法
CN103186558A (zh) * 2011-12-28 2013-07-03 中国航空工业集团公司第六三一研究所 一种基于图书馆管理信息***的智能管理方法
CN117093653A (zh) * 2023-10-19 2023-11-21 中国标准化研究院 一种信息化资源共享方法及***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11361235B2 (en) * 2017-01-25 2022-06-14 Pearson Education, Inc. Methods for automatically generating Bayes nets using historical data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101604322A (zh) * 2009-06-24 2009-12-16 北京理工大学 一种决策级文本自动分类融合方法
CN103186558A (zh) * 2011-12-28 2013-07-03 中国航空工业集团公司第六三一研究所 一种基于图书馆管理信息***的智能管理方法
CN117093653A (zh) * 2023-10-19 2023-11-21 中国标准化研究院 一种信息化资源共享方法及***

Also Published As

Publication number Publication date
CN117688222A (zh) 2024-03-12

Similar Documents

Publication Publication Date Title
US9465831B2 (en) System and method for optimizing storage of multi-dimensional data in data storage
CN117093653B (zh) 一种信息化资源共享方法及***
CN110290199B (zh) 内容推送方法、装置及设备
US20230409588A1 (en) System and method for subset searching and associated search operators
CN106469182B (zh) 一种基于映射关系的信息推荐方法及装置
CN110609952A (zh) 数据采集方法、***和计算机设备
CN114338413A (zh) 网络中设备的拓扑关系的确定方法、装置以及存储介质
CN117688222B (zh) 一种基于贝叶斯网络的数字图书馆的实现方法及***
CN115516432A (zh) 用于识别、管理和监测数据依赖的方法和***
CN116091111A (zh) 产品需求量预测方法、装置、电子设备及存储介质
Gao et al. Consistency and trends of technological innovations: A network approach to the international patent classification data
CN110245136B (zh) 数据检索方法及装置、设备及存储设备
CN111782880B (zh) 语义泛化方法及显示设备
CN113657635B (zh) 一种预测通信用户流失的方法及电子设备
CN113010795A (zh) 用户动态画像生成方法、***、存储介质及电子设备
CN111858619B (zh) 一种数据自流转的方法、装置和电子设备
CN109739817B (zh) 一种在大数据存储***中存储数据文件的方法及***
CN116910260B (zh) 一种基于大数据的数字资产搜索方法
CN117112808B (zh) 一种信用失信主体的信息知识图谱构建方法
CN113868373A (zh) 一种词云生成方法、装置、电子设备及存储介质
US20190385254A1 (en) Systems and methods for identifying and linking events in structured proceedings
CN117557157B (zh) 一种基于卷积神经网络的质量考核评价方法
CN111737281B (zh) 数据库查询方法、装置、电子设备以及可读存储介质
CN117610943B (zh) 一种信用主体信用评价风险模型的建模方法
CN114519059B (zh) 数据处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant