CN111428037B - 一种分析行为政策匹配性的方法 - Google Patents
一种分析行为政策匹配性的方法 Download PDFInfo
- Publication number
- CN111428037B CN111428037B CN202010211001.6A CN202010211001A CN111428037B CN 111428037 B CN111428037 B CN 111428037B CN 202010211001 A CN202010211001 A CN 202010211001A CN 111428037 B CN111428037 B CN 111428037B
- Authority
- CN
- China
- Prior art keywords
- policy
- text
- words
- keywords
- sentences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000000605 extraction Methods 0.000 claims abstract description 26
- 230000006399 behavior Effects 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims description 18
- 230000011218 segmentation Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 7
- 238000010801 machine learning Methods 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 6
- 238000004458 analytical method Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/10—Tax strategies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Finance (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Educational Administration (AREA)
- Technology Law (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种分析行为政策匹配性的方法,该方法包括:从预先配置的网站获取政策文本;对该政策文本进行分类,得到政策文本所属的类别;获取类别对应的提取方式,其中,提取方式用于指示从政策提取关键词和/或句子的方式,关键词和/或句子用于描述符合政策文本的行为,类别对应的提取方式是预先配置的;使用上述提取方式从政策文本中提取关键词和/或句子,保存关键词和/或句子。通过本申请解决了解决相关技术中无法能够自动对该政策中涉及到如何执行的内容进行提示所导致的问题,在一定程度为人工分析政策提供了辅助手段,为提高政策分析的全面性提供了可能。
Description
技术领域
本申请涉及数据处理领域,具体而言,涉及一种分析行为政策匹配性的方法。
背景技术
政策是官方组织以权威形式标准化地规定在一定的历史时期内,应该达到的奋斗目标、遵循的行动原则、完成的明确任务、实行的工作方式、采取的一般步骤和具体措施。政策无论是在国家经济发展过程中还是在企业经营发展的全过程中,亦或是在我们每个人工作、学习、生活中都有着非常重要的作用。
一个政策在颁布之后,政策涉及到的相关人员需要了解该政策。一般情况下,政策中会包括多种内容,例如,政策制定的原因,政策如何执行、政策其他注意事项等。相关人员有时候只需要了解政策执行相关内容。目前是需要人工下载政策文本,然后人工进行分析。在现有技术中无法能够自动对该政策中涉及到如何执行的内容进行提示,从而完全依赖于人工分析。
发明内容
本申请提供一种分析行为政策匹配性的方法,以解决相关技术中无法能够自动对该政策中涉及到如何执行的内容进行提示所导致的问题。
根据本申请的一个方面,提供了一种分析行为政策匹配性的方法,包括:从预先配置的网站获取政策文本;对该政策文本进行分类,得到所述政策文本所属的类别;获取所述类别对应的提取方式,其中,所述提取方式用于指示从所述政策提取关键词和/或句子的方式,所述关键词和/或所述句子用于描述符合所述政策文本的行为,所述类别对应的提取方式是预先配置的;使用上述提取方式从所述政策文本中提取关键词和/或句子,保存所述关键词和/或句子。
进一步地,在从预先配置的所述网站获取所述政策文本之后,所述方法还包括:保存所述政策文本与,所述关键词和/或句子之间的的对应关系。
进一步地,所述方法还包括:接收来自用户的获取请求,其中,所述获取请求用于获取所述政策文本;响应于所述获取请求,向所述用户返回所述政策文本以及所述关键词和/或句子。
进一步地,所述网站为发布政策的官方网站,其中,所述政策为所述政策文本对应的政策。
根据本申请的另一个方面,还提供了一种存储器,用于存储软件,其中,所述软件用于执行上述的方法。
根据本申请的另一个方面,还提供一种处理器,用于执行软件,其中,所述软件用于执行上述的方法。
本申请采用以下步骤:从预先配置的网站获取政策文本;对该政策文本进行分类,得到所述政策文本所属的类别;获取所述类别对应的提取方式,其中,所述提取方式用于指示从所述政策提取关键词和/或句子的方式,所述关键词和/或所述句子用于描述符合所述政策文本的行为,所述类别对应的提取方式是预先配置的;使用上述提取方式从所述政策文本中提取关键词和/或句子,保存所述关键词和/或句子。通过本申请解决了解决相关技术中无法能够自动对该政策中涉及到如何执行的内容进行提示所导致的问题,在一定程度为人工分析政策提供了辅助手段,为提高政策分析的全面性提供了可能。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的分析行为政策匹配性的方法的流程图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
在本实施例中,提供了一种分析行为政策匹配性的方法,该方法虽然是用在政策数据的,但是,也可以用在其他信息中,在以下实施例中,政策都可以替换为信息。例如,该信息是对于某个问题的解决方式,以下步骤就可以用来从解决方式中查找到行为,该行为就是用解决问题的关键,此时就可以屏蔽掉问题的发现原因这类的背景信息。图1是根据本发明实施例的分析行为政策匹配性的方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,从预先配置的网站获取政策文本;
步骤S104,对该政策文本进行分类,得到政策文本所属的类别;
步骤S106,获取类别对应的提取方式,其中,提取方式用于指示从政策提取关键词和/或句子的方式,关键词和/或句子用于描述符合政策文本的行为,类别对应的提取方式是预先配置的;
这里提取方式比较优的是,把所有的日期均提取出来,以及该日期所在的那句话也提取出来,该日期所在的那句话作为关键句子在步骤S108中保存。
步骤S108,使用上述提取方式从政策文本中提取关键词和/或句子,保存关键词和/或句子。
下面举个例子来说明上述步骤,例如,在步骤S102中,可以按照预定周期从官方网站抓取信息,抓取到的信息可以由人工判断一下是否为政策,如果为政策,则保存为政策文本。由计算机对该政策进行分类,例如,如果抓取到是报税时间的政策,则将该政策划分为税务申报类。对于税务申报类,其关键词为“报税时间”,查找包括“报税时间”的句子就是该税务申报类的提取方式。报税时间就是用于来表述应该在该时间节点进行报税行为,这样的报税行为才是符合政策的。在政策文本中搜索到“报税时间截止到当年12月”,将这句话进行保存。这句话就是该政策中包括的行为措施。该行为措施在用户检索政策的时候可以一并发送给用户。通过上述步骤解决了相关技术中无法能够自动对该政策中涉及到如何执行的内容进行提示所导致的问题,在一定程度为人工分析政策提供了辅助手段,为提高政策分析的全面性提供了可能。
在步骤S104中,分类的方式有很多,例如,可以根据政策的名称来进行分类,先对政策的名称进行分词,然后将分词得到后的词语与类别对应的词相匹配,如果能够匹配则就可以确定政策文本的类别。其中,类别对应的词是预先配置的。例如,税务申报类预先配置的关键词为“税”“税务”,高新申报类预先配置的关键词为“高新”。如果一个政策的名称中包括“税务”字样,则该政策文本的分类为税务申报类。
上述步骤可以使用B/S架构来实现,上述步骤需要在后台执行的内容都由服务器来执行,其中的步骤S102到步骤S108都可以由服务器执行。需要呈现的内容,可以由浏览器来实现,例如,如果上个段落中对于某个政策名称没有匹配到类别,可以将未匹配的政策名称在网页中现实给管理员,由管理员来进行人工分类。
作为另一个可选的实施方式,如果政策名称没有匹配到类型,此时可以在使用政策的正文来进行匹配,如果政策正文中匹配到税务,则可以分类到税务申报类。
作为另一个可选的实施方式,如果一个政策的正文中包括多个类别的关键词,此时有可能会匹配多个类别。这没有问题,此时,在步骤S106中,分别获取每个类别对应的提取方式即可。或者做另一个可选的方式,可以统计政策正文中的词频,选择关键词词频高的类别作为该政策的类型。例如,在该政策正文中出现了三次“税务”,出现了五次“高新”,则该政策的类型为高新申报类。
作为另一个可选的实施方式,在政策的标题未匹配成功的情况下,正文的匹配可以使用机器学习来进行。随着网站的不断运营,政策和政策类别的数据积累的越来越多,当积累的数据超过阈值的时候,就可以使用机器学习来进行训练了。使用多组训练数据来进行训练,每一组训练数据均包括政策文本以及该政策文本所属的类别。在训练结束之后,该模型可以用来机器识别。该模型的输入为政策文本,输出的内容就是该政策的类别。
优选地,在从预先配置的网站获取政策文本之后,上述方法还可以包括:保存政策文本与,关键词和/或句子之间的的对应关系。
优选地,上述方法还可以包括:接收来自用户的获取请求,其中,获取请求用于获取政策文本;响应于获取请求,向用户返回政策文本以及关键词和/或句子。
接收到用户的获取请求之后,如果没有找到该请求对应的政策文本,则可以先执行如下政策查询步骤,执行查询步骤找到上述政策之后,再执行步骤S102到步骤S108中的步骤,得到关键词和/或句子之后,再向用户返回。
步骤S202,接收询问消息(即获取请求),其中,询问消息用于查询对应的政策(或者查询对应的信息);
步骤S204,对询问消息中的文本进行分词处理,得到多个词语;
作为一个可以增加的优选实施方式:分词的方式可以使用机器学习的方式来进行,例如,可以训练一个模型,该模型使用多组训练数据训练得到,每一组训练数据包括一段文本以及人工对该文本进行分词之后得到的词语列表,需要注意的是,该人工分词结果中仅仅包括关键的名词,这些关键的名词是人工提取的能够体现该文本中心思想并且在该文本中出现过的词语。通过使用这些训练数据训练得到的模型其输入就是一段文本,输入的结果就是关键词。本实施例其他部分只能够涉及到的分词也可以使用该分词方法。
步骤S206,从多个词语中确定至少一个关键词,其中,关键词作为检索使用的关键词;
选择关键词的时候,可以从多个关键词中与预先配置的无意义词表相匹配,其中,所述无意义词表预先保存了虚拟、助词、代词等对文本含义理解无帮助的词,无意义词表用来过滤词语,在所述无意义词表中的词不被使用在步骤S108中的检索中。匹配后的所有剩余的词语均可以作为关键词使用。
作为一个可以增加的优选实施方式,多个词语被无意义词表匹配后还剩余N个词语,首先使用N个词语均作为关键词来进行检索,如果检索到的结果小于预定数量,则去掉一个关键词,再使用N-1个关键词来进行检索,如果检索结果仍然小于预定数据,则继续去掉关键词进行检索,直到检索结果的数量大于或等于所述预定数量,并且小于第二预定数量,其中,所述第二预定数量小于所述预定数量,也就是说,检索结果的数量要落入到预先定义的范围内。
步骤S208,将关键词在预先配置的多个网站内进行检索,得到该关键词对应的检索结果,将该检索结果中的内容作为步骤S102中的政策文本。多个网站是被认证认可的网站,例如,官方网站等。这些网站中一般仅仅只有政策。
优选地,网站为发布政策的官方网站,其中,政策为政策文本对应的政策。
在本实施例中还提供了一种装置,该装置中的模块对应于上述的方法步骤,在上述实施例中已经进行过说明的,在此不再赘述。
在本实施例中还提供了一种装置,该装置包括:第一获取模块,用于从预先配置的网站获取政策文本;分类模块,用于对该政策文本进行分类,得到政策文本所属的类别;第二获取模块,用于获取类别对应的提取方式,其中,提取方式用于指示从政策提取关键词和/或句子的方式,关键词和/或句子用于描述符合政策文本的行为,类别对应的提取方式是预先配置的;保存模块,用于使用上述提取方式从政策文本中提取关键词和/或句子,保存关键词和/或句子。
在本实施例中,提供了一种存储器,用于存储软件,其中,该软件用于执行上述的方法。
在本实施例中,提供了一种处理器,用于执行软件,其中,该软件用于执行上述的方法。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本发明实施例提供了一种存储介质,其上存储有程序或者软件,该程序被处理器执行时实现上述方法。存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (1)
1.一种分析行为政策匹配性的方法,其特征在于,包括:
步骤S102,从预先配置的网站获取政策文本;
步骤S104,对该政策文本进行分类,得到所述政策文本所属的类别;其中,统计政策正文中的词频,选择关键词词频高的类别作为该政策的类型;或者,在政策的标题未匹配成功的情况下,正文的匹配使用机器学习来进行;其中,使用多组训练数据来进行训练,每一组训练数据均包括政策文本以及该政策文本所属的类别;在训练结束之后,训练得到的模型可以用来机器识别,该模型的输入为政策文本,输出的内容就是该政策的类别;
步骤S106,获取所述类别对应的提取方式,其中,所述提取方式用于指示从所述政策文本提取关键词和/或句子的方式,所述关键词和/或所述句子用于描述符合所述政策文本的行为,所述类别对应的提取方式是预先配置的;
步骤S108,使用上述提取方式从所述政策文本中提取关键词和/或句子,保存所述关键词和/或句子;
接收来自用户的获取请求,其中,获取请求用于获取政策文本,
响应于获取请求,向用户返回政策文本以及关键词和/或句子;
在接收到用户的所述获取请求之后,如果没有找到该请求对应的政策文本,则先执行如下政策查询步骤,执行所述政策查询步骤找到上述政策之后,再执行步骤S102到步骤S108中的步骤,得到关键词和/或句子之后,再向用户返回;其中,所述政策查询步骤包括:
步骤S204,对所述获取请求中的文本进行分词处理,得到多个词语;其中,分词的方式使用机器学习的方式来进行,训练一个模型,该模型使用多组训练数据训练得到,每一组训练数据包括一段文本以及人工对该文本进行分词之后得到的词语列表,该人工分词结果中仅仅包括关键的名词,所述关键的名词是人工提取的能够体现该文本中心思想并且在该文本中出现过的词语,通过使用这些训练数据训练得到的模型其输入为一段文本,输入的结果就是分词得到后的多个词语;
步骤S206,从多个词语中确定至少一个关键词,所述关键词作为检索使用的关键词;其中,选择关键词时,从多个关键词中与预先配置的无意义词表相匹配,其中,所述无意义词表预先保存了虚拟、助词和代词对文本含义理解无帮助的词,无意义词表用来过滤词语;匹配后的所有剩余的词语均作为关键词使用;多个词语被无意义词表匹配后还剩余N个词语,首先使用N个词语均作为关键词来进行检索,如果检索到的结果小于预定数量,则去掉一个关键词,再使用N-1个关键词来进行检索,如果检索结果仍然小于预定数据,则继续去掉关键词进行检索,直到检索结果的数量大于或等于所述预定数量,并且小于第二预定数量,其中,所述第二预定数量小于所述预定数量;
步骤S208,将检索使用的关键词在预先配置的多个网站内进行检索,得到该关键词对应的检索结果,将该检索结果中的内容作为步骤S102中的从预先配置的网站获取的政策文本,所述多个网站是被认证认可的网站。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010211001.6A CN111428037B (zh) | 2020-03-24 | 2020-03-24 | 一种分析行为政策匹配性的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010211001.6A CN111428037B (zh) | 2020-03-24 | 2020-03-24 | 一种分析行为政策匹配性的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111428037A CN111428037A (zh) | 2020-07-17 |
CN111428037B true CN111428037B (zh) | 2022-09-20 |
Family
ID=71549042
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010211001.6A Active CN111428037B (zh) | 2020-03-24 | 2020-03-24 | 一种分析行为政策匹配性的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111428037B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113065050A (zh) * | 2021-03-26 | 2021-07-02 | 深圳供电局有限公司 | 一种电价政策文档采集方法及其*** |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103902652A (zh) * | 2014-02-27 | 2014-07-02 | 深圳市智搜信息技术有限公司 | 自动问答*** |
CN104360993A (zh) * | 2014-11-19 | 2015-02-18 | 广州极盛信息科技开发有限公司 | 一种从文本提取所需内容的方法 |
CN107562732A (zh) * | 2017-10-26 | 2018-01-09 | 北京康夫子科技有限公司 | 电子病历的处理方法及*** |
CN107577763A (zh) * | 2017-09-04 | 2018-01-12 | 北京京东尚科信息技术有限公司 | 检索方法和装置 |
WO2018032937A1 (zh) * | 2016-08-19 | 2018-02-22 | 中兴通讯股份有限公司 | 一种文本信息分类方法及其装置 |
CN110457696A (zh) * | 2019-07-31 | 2019-11-15 | 福州数据技术研究院有限公司 | 一种面向档案数据的人才与政策智能匹配***和方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9798802B2 (en) * | 2012-03-23 | 2017-10-24 | Avast Software B.V. | Systems and methods for extraction of policy information |
CN103870973B (zh) * | 2012-12-13 | 2017-12-19 | 阿里巴巴集团控股有限公司 | 基于电子信息的关键词提取的信息推送、搜索方法及装置 |
CN105930452A (zh) * | 2016-04-21 | 2016-09-07 | 北京紫平方信息技术股份有限公司 | 一种识别自然语言的智能应答方法 |
WO2017185272A1 (zh) * | 2016-04-28 | 2017-11-02 | 华为技术有限公司 | 一种人机交互方法及其装置 |
CN108197109B (zh) * | 2017-12-29 | 2021-04-23 | 北京百分点科技集团股份有限公司 | 一种基于自然语言处理的多语言分析方法和装置 |
CN108491438A (zh) * | 2018-02-12 | 2018-09-04 | 陆夏根 | 一种科技政策检索分析方法 |
CN110532451B (zh) * | 2019-06-26 | 2023-08-29 | 平安科技(深圳)有限公司 | 针对政策文本的检索方法和装置、存储介质、电子装置 |
-
2020
- 2020-03-24 CN CN202010211001.6A patent/CN111428037B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103902652A (zh) * | 2014-02-27 | 2014-07-02 | 深圳市智搜信息技术有限公司 | 自动问答*** |
CN104360993A (zh) * | 2014-11-19 | 2015-02-18 | 广州极盛信息科技开发有限公司 | 一种从文本提取所需内容的方法 |
WO2018032937A1 (zh) * | 2016-08-19 | 2018-02-22 | 中兴通讯股份有限公司 | 一种文本信息分类方法及其装置 |
CN107577763A (zh) * | 2017-09-04 | 2018-01-12 | 北京京东尚科信息技术有限公司 | 检索方法和装置 |
CN107562732A (zh) * | 2017-10-26 | 2018-01-09 | 北京康夫子科技有限公司 | 电子病历的处理方法及*** |
CN110457696A (zh) * | 2019-07-31 | 2019-11-15 | 福州数据技术研究院有限公司 | 一种面向档案数据的人才与政策智能匹配***和方法 |
Non-Patent Citations (3)
Title |
---|
Trained SVMs based rules extraction method for text classification;Miao Zhang et al.;《2008 IEEE International Symposium on IT in Medicine and Education》;20090109;第16-19页 * |
科技成果转化政策文本中的领域关键词汇提取研究;张越等;《中国科技资源导刊》;20180528(第03期);第68-75页 * |
观点挖掘中评价对象抽取方法的研究;刘倩;《中国优秀博硕士学位论文全文数据库(博士)信息科技辑》;20170215;第I138-228页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111428037A (zh) | 2020-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017076263A1 (zh) | 融合知识库处理方法和装置及知识库管理***、存储介质 | |
CN110275965B (zh) | 假新闻检测方法、电子装置及计算机可读存储介质 | |
WO2017097231A1 (zh) | 话题处理方法及装置 | |
CN106815207B (zh) | 用于法律裁判文书的信息处理方法及装置 | |
CN110458324B (zh) | 风险概率的计算方法、装置和计算机设备 | |
CN111008265A (zh) | 企业信息搜索方法及装置 | |
WO2015149690A1 (en) | Media content recommendation method and apparatus | |
CN108694178B (zh) | 一种推荐司法知识的方法及装置 | |
CN111767716A (zh) | 企业多级行业信息的确定方法、装置及计算机设备 | |
US20180089242A1 (en) | Hierarchic model and natural language analyzer | |
TW201923629A (zh) | 資料處理方法及裝置 | |
CN106878242B (zh) | 一种确定用户身份类别的方法及装置 | |
CN114004694A (zh) | 一种基于舆情信息的企业风险预警方法、设备及介质 | |
WO2015084757A1 (en) | Systems and methods for processing data stored in a database | |
CN109101512B (zh) | 法律数据库的构建方法、法律数据查询方法及装置 | |
CN112016317A (zh) | 基于人工智能的敏感词识别方法、装置及计算机设备 | |
CN111428037B (zh) | 一种分析行为政策匹配性的方法 | |
CN110532773B (zh) | 恶意访问行为识别方法、数据处理方法、装置和设备 | |
CN116663505B (zh) | 一种基于互联网的评论区管理方法及*** | |
CN112487181B (zh) | 关键词确定方法和相关设备 | |
CN109948034B (zh) | 基于过滤会话实现提取页面信息的方法及装置 | |
CN110019659B (zh) | 裁判文书的检索方法及装置 | |
CA3230643A1 (en) | Data management suggestions from knowledge graph actions | |
CN109062551A (zh) | 基于大数据开发命令集的开发框架 | |
CN110727850B (zh) | 网络信息的过滤方法,计算机可读存储介质和移动终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |