CN107562854B - 一种定量分析党建数据的建模方法 - Google Patents
一种定量分析党建数据的建模方法 Download PDFInfo
- Publication number
- CN107562854B CN107562854B CN201710751678.7A CN201710751678A CN107562854B CN 107562854 B CN107562854 B CN 107562854B CN 201710751678 A CN201710751678 A CN 201710751678A CN 107562854 B CN107562854 B CN 107562854B
- Authority
- CN
- China
- Prior art keywords
- party building
- party
- work
- keywords
- correlation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种定量分析党建数据的建模方法。本发明首先提取党建工作文本中的党建工作关键词,对两两党建工作关键词之间的相关关系给出定量度量,然后将党建工作关键词抽象为polytree模型的节点,根据两两党建工作关键词之间的相关关系确定模型的有向边,再确定模型的条件概率参数。本发明给出党建工作关键词之间相关关系的定量度量方法,并用polytree模型为所有党建工作关键词之间的相关关系提供直观的建模,为进一步分析党建大数据提供支持。
Description
技术领域
本发明属于数据挖掘技术领域,涉及一种定量分析党建数据的建模方法。
背景技术
党建工作是抓好党员队伍的根本保障,也是做好一切工作的根本保障,提高党建工作科学化水平是目前党建工作的一项重要任务。在党建工作开展的过程中,产生海量的党建数据,包括思想建设数据、组织建设数据、作风建设数据和制度建设数据等等,对党建大数据进行智能化管理和有效分析成为一个迫切需求。对党建大数据进行定量建模以及关联分析,并研究有效的分析挖掘方法,是有效分析党建大数据的关键,也是提高党建科学化水平的基础。polytree模型是一种简单的不确定性知识表示和推理的概率图模型,不仅可以捕捉数据间定量的不确定性关系,同时还为党建工作的定量分析提供高效的推理机制。本发明用polytree模型对党建工作进行定量建模,通过定量度量党建工作关键词之间的相关关系,提供一种挖掘全局相关关系的建模手段,为党建文本分析和党建工作分析提供支持,也为提高党建科学化水平提供技术支持。
发明内容
针对党建工作中产生的海量数据,本发明为挖掘党建数据全局相关关系提供一种有效的建模方法,为党建工作大数据分析提供支持。该方法主要包括以下步骤:
第一步,对每个党建工作文本进行量化,具体为:
1.2、定义文档频度函数f(x),其中x表示文档中出现的和不出现的关键字组合序列,对党建工作关键词表示关键词出现在文档中, 表示关键词不出现在文档中;例如表示出现且不出现的关键字组合,表示关键词出现但不出现的文档频度;
第三步,建立m个节点的最大权生成树T
第五步,在不产生新的汇聚结构的条件下,将G′中所有无向边置为有向边,得到polytree的图结构G;
附图说明
图1. 构建党建数据polytree模型的过程;
具体实施方式
以下结合附图1,对依据本发明提供的具体实施方式,详细说明如下。
第一步,对每个党建工作文本进行量化,具体为:
1.2、定义文档频度函数f(x),其中x表示文档中出现的和不出现的关键字组合序列,对党建工作关键词表示关键词出现在文档中,表示关键词不出现在文档中;例如表示出现且不出现的关键字组合,表示关键词出现但不出现的文档频度;
例如,如果两个词α和β的文档频度分别是第一步中计算的结果,那么
第三步,建立m个节点的最大权生成树T,具体为
最大权生成树T 部分有向图G′ 完整polyree模型(G,P)
图1. 构建党建数据polytree模型的过程
Claims (1)
1.一种定量分析党建数据的建模方法,该方法的特征在于包括以下步骤:
步骤一:量化每个党建工作文本
1.2、定义文档频度函数f(x),表示满足关键词条件x的党建工作文本数量;其中x由文本中出现的关键词条件和不出现的关键词条件组合而成,对党建工作关键词用表示关键词出现在党建工作文本中,用表示关键词不出现在党建工作文本中;
步骤三:建立m个节点的最大权生成树T
步骤五: 在不产生新的汇聚结构的条件下,将G′中所有无向边置为有向边,得到polytree的图结构G;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710751678.7A CN107562854B (zh) | 2017-08-28 | 2017-08-28 | 一种定量分析党建数据的建模方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710751678.7A CN107562854B (zh) | 2017-08-28 | 2017-08-28 | 一种定量分析党建数据的建模方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107562854A CN107562854A (zh) | 2018-01-09 |
CN107562854B true CN107562854B (zh) | 2020-09-22 |
Family
ID=60977304
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710751678.7A Active CN107562854B (zh) | 2017-08-28 | 2017-08-28 | 一种定量分析党建数据的建模方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107562854B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103049569A (zh) * | 2012-12-31 | 2013-04-17 | 武汉传神信息技术有限公司 | 基于向量空间模型的文本相似性匹配方法 |
CN106598999A (zh) * | 2015-10-19 | 2017-04-26 | 北京国双科技有限公司 | 一种计算文本主题归属度的方法及装置 |
CN106844328A (zh) * | 2016-08-23 | 2017-06-13 | 华南师范大学 | 一种新型大规模文档主题语义分析方法及*** |
CN106874695A (zh) * | 2017-03-22 | 2017-06-20 | 北京大数医达科技有限公司 | 医疗知识图谱的构建方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104516904B (zh) * | 2013-09-29 | 2018-04-03 | 北大方正集团有限公司 | 一种关键知识点推荐方法及其*** |
-
2017
- 2017-08-28 CN CN201710751678.7A patent/CN107562854B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103049569A (zh) * | 2012-12-31 | 2013-04-17 | 武汉传神信息技术有限公司 | 基于向量空间模型的文本相似性匹配方法 |
CN106598999A (zh) * | 2015-10-19 | 2017-04-26 | 北京国双科技有限公司 | 一种计算文本主题归属度的方法及装置 |
CN106844328A (zh) * | 2016-08-23 | 2017-06-13 | 华南师范大学 | 一种新型大规模文档主题语义分析方法及*** |
CN106874695A (zh) * | 2017-03-22 | 2017-06-20 | 北京大数医达科技有限公司 | 医疗知识图谱的构建方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN107562854A (zh) | 2018-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rauber et al. | Foolbox native: Fast adversarial attacks to benchmark the robustness of machine learning models in pytorch, tensorflow, and jax | |
Dai et al. | Attribute selection based on a new conditional entropy for incomplete decision systems | |
Ahmed et al. | Network sampling: From static to streaming graphs | |
Krajca et al. | Distributed algorithm for computing formal concepts using map-reduce framework | |
JP7103496B2 (ja) | 関連スコア算出システム、方法およびプログラム | |
Laclavík et al. | Emails as graph: relation discovery in email archive | |
Zhang et al. | I/O efficient: Computing SCCs in massive graphs | |
CN107220902A (zh) | 在线社会网络的级联规模预测方法 | |
Dobra et al. | Loglinear model selection and human mobility | |
Rani et al. | A survey of tools for social network analysis | |
CN103440308B (zh) | 一种基于形式概念分析的数字论文检索方法 | |
CN106202552A (zh) | 基于云计算的数据搜索方法 | |
Lu et al. | Predicting viral news events in online media | |
Sepehr et al. | Inferring the structure of polytree networks of dynamic systems with hidden nodes | |
CN107562854B (zh) | 一种定量分析党建数据的建模方法 | |
Molik et al. | Combining natural language processing and metabarcoding to reveal pathogen-environment associations | |
Okubo et al. | Structural change pattern mining based on constrained maximal k-plex search | |
Xie et al. | A forensic analysis solution of the email network based on email contents | |
Tuchowski et al. | OBCAS-An Ontology-Based Cluster Analysis System | |
Ozgul et al. | Comparing two models for terrorist group detection: Gdm or ogdm? | |
Li et al. | Special section on big data and service computing | |
Ishikawa et al. | A data model for integrating data management and data mining in social big data | |
Meng et al. | Generalizing design of support measures for counting frequent patterns in graphs | |
Sreedevi et al. | Frequent subgraph mining on bigdata | |
Hejazy et al. | An approach for deriving semantically related category hierarchies from Wikipedia category graphs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |