CN110020205B - 数据信息的筛选方法和*** - Google Patents

数据信息的筛选方法和*** Download PDF

Info

Publication number
CN110020205B
CN110020205B CN201910290132.5A CN201910290132A CN110020205B CN 110020205 B CN110020205 B CN 110020205B CN 201910290132 A CN201910290132 A CN 201910290132A CN 110020205 B CN110020205 B CN 110020205B
Authority
CN
China
Prior art keywords
data
determining
degree
deviation
requirement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910290132.5A
Other languages
English (en)
Other versions
CN110020205A (zh
Inventor
田美乔
王智明
胡庆东
徐雷
陶冶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN201910290132.5A priority Critical patent/CN110020205B/zh
Publication of CN110020205A publication Critical patent/CN110020205A/zh
Application granted granted Critical
Publication of CN110020205B publication Critical patent/CN110020205B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种数据信息的筛选方法,该方法包括:获取用户的浏览记录和初始数据需求,根据浏览记录确定至关键字,根据关键字和初始数据需求确定目标数据需求,响应于获取到与目标数据需求对应的数据信息,将数据信息发送至用户对应的终端。本公开还提供了一种数据信息的筛选***。

Description

数据信息的筛选方法和***
技术领域
本公开实施例涉及互联网技术领域,特别涉及数据信息的筛选方法和***。
背景技术
随着互联网技术的发展,用户可通过浏览网页等方式获取所关注的企业的数据信息。或者获取所关注的企业的某部分数据信息。如,财务报表数据信息和年度报表数据信息等。当然,也可获取相关企业的财务报表数据信息和年度报表数据信息等。相关企业是指同一行业的企业,如苹果公司和三星公司。
在现有技术中,主要由用户基于其自身的数据需求获取与该数数据需求对应的数据信息。或者,通过工作人员在获取到用户的数据需求时,搜索与该数据需求对应的数据信息,并将数据信息推送至用户对应的终端。
发明内容
本公开实施例提供一种数据信息的筛选方法和***。
第一方面,本公开实施例提供了一种数据信息的筛选方法,包括:
获取用户的浏览记录和初始数据需求;
根据所述浏览记录确定至关键字;
根据所述关键字和所述初始数据需求确定目标数据需求;
响应于获取到与所述目标数据需求对应的数据信息,将所述数据信息发送至所述用户对应的终端。
在一些实施例中,如果所述初始数据需求携带数据类别,则所述根据所述关键字和所述初始数据需求确定目标数据需求,包括:
计算所述关键字与所述数据类别之间的偏离程度;
确定最小的偏离程度;
根据所述最小的偏离程度确定所述目标需求。
在一些实施例中,所述计算所述关键字与所述数据类别之间的偏离程度,包括:
计算所述关键字与所述数据类别之间的匹配度;
根据所述匹配度计算所述偏离程度。
在一些实施例中,所述计算所述关键字与所述数据类别之间的匹配度,包括:
获取所述数据类别和所述关键字在预设的三维坐标中的位置信息;
根据所述关键字的位置信息和所述数据类别的位置信息确定所述匹配度。
在一些实施例中,所述根据所述关键字的位置信息和所述数据类别的位置信息确定所述匹配度,包括:
根据式1确定所述匹配度
Figure BDA0002024644440000021
式1:
Figure BDA0002024644440000022
其中,
Figure BDA0002024644440000023
为第k次递归时所述关键字的位置信息,
Figure BDA0002024644440000024
为第k次递归时所述数据类别的位置信息。
在一些实施例中,所述确定最小的偏离程度,包括:
根据式2确定所述最小的偏离程度Mindk,式2:
Figure BDA0002024644440000025
其中,m、n和p为预设的与所述三维坐标中的三个位置分别对应的阈值。
在一些实施例中,所述根据所述最小的偏离程度确定所述目标需求,包括:
根据式3对所述最小偏离程度对应的关键字进行无监督学习,得到无监督学习结果,式3:
Figure BDA0002024644440000026
响应于当前递归次数大于预设阈值,将所述无监督学习结果确定为所述目标需求;
其中,dmink为k次递归匹配度的最小值。
第一方面,本公开实施例提供了一种数据信息的筛选***,包括:
获取模块,用于获取用户的浏览记录和初始数据需求;
确定模块,用于根据所述浏览记录确定至关键字;
所述确定模块还用于,根据所述关键字和所述初始数据需求确定目标数据需求;
发送模块,用于响应于获取到与所述目标数据需求对应的数据信息,将所述数据信息发送至所述用户对应的终端。
在一些实施例中,如果所述初始数据需求携带数据类别,则所述确定模块具体用于:
计算所述关键字与所述数据类别之间的偏离程度;
确定最小的偏离程度;
根据所述最小的偏离程度确定所述目标需求。
在一些实施例中,所述确定模块具体用于:
计算所述关键字与所述数据类别之间的匹配度;
根据所述匹配度计算所述偏离程度。
在一些实施例中,所述确定模块具体用于:
获取所述数据类别和所述关键字在预设的三维坐标中的位置信息;
根据所述关键字的位置信息和所述数据类别的位置信息确定所述匹配度。
在一些实施例中,所述确定模块具体用于:
根据式1确定所述匹配度
Figure BDA0002024644440000031
式1:
Figure BDA0002024644440000032
其中,
Figure BDA0002024644440000033
为第k次递归时所述关键字的位置信息,
Figure BDA0002024644440000034
为第k次递归时所述数据类别的位置信息;
根据式2确定所述最小的偏离程度Mindk,式2:
Figure BDA0002024644440000035
其中,m、n和p为预设的与所述三维坐标中的三个位置分别对应的阈值;
根据式3对所述最小偏离程度对应的关键字进行无监督学习,得到无监督学习结果,式3:
Figure BDA0002024644440000041
响应于当前递归次数大于预设阈值,将所述无监督学习结果确定为所述目标需求;
其中,dmink为k次递归匹配度的最小值。
本公开实施例提供的获取用户的浏览记录和初始数据需求,根据浏览记录确定至关键字,根据关键字和初始数据需求确定目标数据需求,响应于获取到与目标数据需求对应的数据信息,将数据信息发送至用户对应的终端的技术方案,实现了为用户筛选全面的数据信息的技术效果,且节约了成本,提高了效率。
附图说明
附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开,并不构成对本公开的限制。通过参考附图对详细示例实施例进行描述,以上和其他特征和优点对本领域技术人员将变得更加显而易见,在附图中:
图1为本公开实施例的数据信息的筛选方法的示意图;
图2为本公开实施例的确定目标需求的方法的示意图;
图3为本公开实施例的数据信息的筛选***的示意图;
附图标记:
1、获取模块,2、确定模块,3、发送模块。
具体实施方式
为使本领域的技术人员更好地理解本发明的技术方案,下面结合附图对本发明提供的数据信息的筛选方法和***进行详细描述。
在下文中将参考附图更充分地描述示例实施例,但是所述示例实施例可以以不同形式来体现且不应当被解释为限于本文阐述的实施例。反之,提供这些实施例的目的在于使本公开透彻和完整,并将使本领域技术人员充分理解本公开的范围。
如本文所使用的,术语“和/或”包括一个或多个相关列举条目的任何和所有组合。
本文所使用的术语仅用于描述特定实施例,且不意欲限制本公开。如本文所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。还将理解的是,当本说明书中使用术语“包括”和/或“由……制成”时,指定存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或添加一个或多个其他特征、整体、步骤、操作、元件、组件和/或其群组。
本文所述实施例可借助本公开的理想示意图而参考平面图和/或截面图进行描述。因此,可根据制造技术和/或容限来修改示例图示。因此,实施例不限于附图中所示的实施例,而是包括基于制造工艺而形成的配置的修改。因此,附图中例示的区具有示意性属性,并且图中所示区的形状例示了元件的区的具体形状,但并不旨在是限制性的。
除非另外限定,否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本公开的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本文明确如此限定。
根据本公开实施例的一个方面,本公开实施例提供了数据信息的筛选方法。
请参阅图1,图1为本公开实施例的数据信息的筛选方法的示意图。
如图1所示,该方法包括:
S1:获取用户的浏览记录和初始数据需求。
其中,浏览记录是指用户通过终端进行网站等浏览时产生的记录。根据用户的浏览记录,可获悉用户关注的网站等。如果本实施例主要用于为用户筛选其所关注的企业的财报数据信息和年报数据信息。那么,在本实施例中,主要根据用户的浏览记录获悉用户关注的企业,以及该企业的具体项目和相关的数据信息等。
终端可以是移动设备例如手机、笔记本电脑平板电脑、个人数字助理等,也可以是固定设备,例如台式电脑等。
其中,数据需求是指期望获取到的数据信息的请求。也就是说,数据需求体现了用户期望获取具体的某企业(包括一个企业或多个企业)的数据信息,或者,该企业的具体某方面的数据信息(如财报数据信息或年报数据信息等)。
此处的初始数据需求是一个相对概念,即是用户初次设置的关于数据信息的数据需求。
S2:根据浏览记录确定至关键字。
其中,关键字是指能够最大程度概括用户所要查找的信息内容的字或词。
S3:根据关键字和初始数据需求确定目标数据需求。
同理,该步骤中的目标数据需求亦是一个相对概念。目标数据需求时相对于初始数据需求而言的。
该步骤实际是对初始数据需求进行拓展的步骤。由于不同的企业之间的数据信息之间可能存在相互影响。或者,同一企业之间的不同的数据类别之间也存在相互影响。如,同一企业的销售数据类别会受成本数据类别影响。这两种数据类别为存在直接影响的数据类别。而某些不同的两种数据类别之间却是间接影响,此处不再列举。
通过关键字的方式对初始数据需求进行拓展,得到目标数据需求。使得用户在数据信息方面的需求被横向放大,进而可实现在将与初始数据需求对应的数据信息发送至用户对应的终端时,亦将与初始数据需求对应的数据信息相关的数据信息亦发送至用户对应的终端,以用户对数据信息的需求全面性。而又不至于将不相关的数据信息也发送至用户,避免给用户造成数据信息繁杂,浪费用户时间成本的弊端。
当然,在根据关键字和初始数据需求确定了目标数据需求时,可先向用户对应的终端发送询问信息,即是否将初始数据需求修改为目标数据需求。并在接收到用户通过其对应的终端反馈的确认的信息时,确定基于目标数据需求进行数据信息的筛选。
如:用户的初始数据需求为获取企业A的数据信息的请求。在经过上述步骤后,得到了与企业A制造相同产品的企业B。则通过用户对应的终端询问用户是否亦获取企业B的数据信息。如果用户通过其对应的终端反馈是,则不仅将企业A的数据信息发送至用户对应的终端,并且将企业B的数据信息亦发送至用户对应的终端。
当然,如果用户的初始数据需求为获取企业A的销售额的数据信息的请求。在经过上述步骤后,得到了在企业A中与销售额的数据信息相关的进货成本。则通过用户对应的终端询问用户是否亦获取企业A的进货成本的数据信息。如果用户通过其对应的终端反馈是,则不仅将企业A的销售额的数据信息发送至用户对应的终端,并且将企业A的进货成本的数据信息亦发送至用户对应的终端。
结合图2可知,在一些实施例中,初始数据需求携带数据类别,S3包括:
S3-1:计算关键字与数据类别之间的偏离程度。
其中,数据类别是指基于不同的用户的需求而对企业的各类数据信息进行分类后得到的数据的类别。如,财务报表数据信息对应的为财报数据类别,年度报表数据信息对应的为年报数据类别。当然,数据类别的分类也可以进一步细化,如营业额数据类别,净利润数据类别等。
在一些实施例中,S3-1包括:
S3-1-1:计算关键字与数据类别之间的匹配度。
在一些实施例中,S3-1-1包括:
S3-1-1-1:获取数据类别和关键字在预设的三维坐标中的位置信息。
S3-1-1-2:根据关键字的位置信息和数据类别的位置信息确定匹配度。
在一些实施例中,S3-1-1-2包括:
根据式1确定所述匹配度
Figure BDA0002024644440000071
式1:
Figure BDA0002024644440000072
其中,
Figure BDA0002024644440000073
为第k次递归时关键字的位置信息,
Figure BDA0002024644440000074
为第k次递归时数据类别的位置信息。
S3-1-2:根据匹配度计算偏离程度。
S3-2:确定最小的偏离程度。
根据式2确定最小的偏离程度Mindk,式2:
Figure BDA0002024644440000081
其中,m、n和p为预设的与三维坐标中的三个位置分别对应的阈值。
具体地,m对应i,n对应j,p对应t。
当关键字的数量为一个时,则最小的偏离程度即为该关键字对应的偏离程度。
当关键字的数量为多个时,则每一个关键字分别对应一个匹配度,且对应一个偏离程度。则将多个偏离程度进行比较,从中选择最小的偏离程度。具体实现的方式包括:
方式1:依次将多个偏离程度进行比较,直至比较完所有的偏离程度,得到最小的偏离程度。
方式2:对多个偏离程度进行降序排列,排序后的最后一个偏离程度即为最小的偏离程度。
方式3:对多个偏离程度进行升序排列,排序后的第一个偏离程度即为最小的偏离程度。
当然,也可使用其它的从多个偏离程度中确定最小的偏离程度的方式,此处不再赘述。
如果,最小的偏离程度有两个。即,存在两个相同的偏离程度,且该偏离程度为最小的偏离程度。则可从两个相同的偏离程度中随机选取一个作为最小的偏离程度。当然,也可将最小的偏离程度确定为两个。
S3-3:根据最小的偏离程度确定目标需求。
当最小的偏离程度为一个时,则根据该最小偏离程度确定目标需求。
当最小偏离程度为多个时,则分别根据该两个偏离程度确定目标需求。
在一些实施例中,S3-3包括:
S3-3-1:根据式3对最小偏离程度对应的关键字进行无监督学习,得到无监督学习结果,式3:
Figure BDA0002024644440000082
其中,dmink为k次递归匹配度的最小值。
响应于当前递归次数大于预设阈值,执行S3-3-2:将无监督学习结果确定为目标需求。
其中,无监督学习结果为与最小偏离程度对应的关键字相关的文本、PPT和Word中的一种或多种。
响应于当前递归次数小于或等于预设阈值,执行S3-3-3:将当前递归次数加1,并返回至S3-1。
S4:响应于获取到与目标数据需求对应的数据信息,将数据信息发送至用户。
当获取到任意数据信息时,均会判断该数据信息是否为与目标数据需求对应的数据信息。即,判断该数据信息是否为用户所关注的企业的数据信息或者,与该企业相关的企业的数据信息。或者,判断该数据信息是否为用户所关注的某企业的数据类别的数据信息,或者该数据类别相关的数据类别的数据信息。如果不是,则直接过滤掉。如果是,则将该数据信息发送至用户。
可以理解的是,数据信息可分为内容数据信息和标题数据信息。其中,内容数据信息是指该数据信息不仅包括标题,还包括具体的数据内容的数据信息。标题数据信息是指只有标题的数据信息,而没有与该标题相关的具体内容的数据信息。如,当数据信息中仅包含通知性质的信息时,如某公司下个月将发布3月份的财报信息,则说明该数据信息为没有内容的数据信息,即该数据信息为标题数据信息。而当某数据信息中包含了3月份的财报信息时,则说明该数据信息为内容数据信息。
在一些实施例中,当获取到的数据信息为与目标数据需求对应的数据信息时,则先判断该数据信息为内容数据信息还是标题数据信息。
如果为标题数据信息,则根据该标题数据信息生成短信,并将短信发送至用户对应的终端。
如果为内容数据信息,则根据该内容数据信息生成彩信,并将彩信发送至用户对应的终端。
在一些实施例中,初始数据需求和目标数据需求中均携带用户对应的终端的标识。且预先构建用户对应的终端与编号之间的映射关系。
在生成短信或彩信时,先根据目标数据需求确定用户对应的终端的标识,基于标识对短信或彩信进行编号,并基于编号将短信或彩信发送至用户对应的终端。
在一些实施例中,当需要发送的为彩信时,则开启5G通信,基于5G通信将彩信发送至用户对应的终端。
根据本公开实施例的另一个方面,本公开实施例提供了数据信息的筛选***。
请参阅图3,图3为本公开实施例的数据信息的筛选***的示意图。
如图3所示,该***包括:
获取模块1,用于获取用户的浏览记录和初始数据需求;
确定模块2,用于根据浏览记录确定至关键字;
确定模块2还用于,根据关键字和初始数据需求确定目标数据需求;
发送模块3,用于响应于获取到与目标数据需求对应的数据信息,将数据信息发送至用户对应的终端。
在一些实施例中,确定模块2具体用于:
计算关键字与数据类别之间的偏离程度;
确定最小的偏离程度;
根据最小的偏离程度确定目标需求。
在一些实施例中,确定模块2具体用于:
计算关键字与数据类别之间的匹配度;
根据匹配度计算偏离程度。
在一些实施例中,确定模块2具体用于:
获取数据类别和关键字在预设的三维坐标中的位置信息;
根据关键字的位置信息和数据类别的位置信息确定所述匹配度。
在一些实施例中,确定模块2具体用于:
根据式1确定匹配度
Figure BDA0002024644440000101
式1:
Figure BDA0002024644440000102
其中,
Figure BDA0002024644440000103
为第k次递归时关键字的位置信息,
Figure BDA0002024644440000104
为第k次递归时数据类别的位置信息。
在一些实施例中,确定模块2具体用于:
根据式2确定最小的偏离程度Mindk,式2:
Figure BDA0002024644440000111
其中,m、n和p为预设的与三维坐标中的三个位置分别对应的阈值。
在一些实施例中,确定模块2具体用于:
根据式3对最小偏离程度对应的关键字进行无监督学习,得到无监督学习结果,式3:
Figure BDA0002024644440000112
响应于当前递归次数大于预设阈值,将无监督学习结果确定为目标需求;
其中,dmink为k次递归匹配度的最小值。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、***、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
本文已经公开了示例实施例,并且虽然采用了具体术语,但它们仅用于并仅应当被解释为一般说明性含义,并且不用于限制的目的。在一些实例中,对本领域技术人员显而易见的是,除非另外明确指出,否则可单独使用与特定实施例相结合描述的特征、特性和/或元素,或可与其他实施例相结合描述的特征、特性和/或元件组合使用。因此,本领域技术人员将理解,在不脱离由所附的权利要求阐明的本公开的范围的情况下,可进行各种形式和细节上的改变。

Claims (10)

1.一种数据信息的筛选方法,其特征在于,包括:
获取用户的浏览记录和初始数据需求;
根据所述浏览记录确定至关键字;
根据所述关键字和所述初始数据需求确定目标数据需求;
响应于获取到与所述目标数据需求对应的数据信息,将所述数据信息发送至所述用户对应的终端;
如果所述初始数据需求携带数据类别,则所述根据所述关键字和所述初始数据需求确定目标数据需求,包括:
计算所述关键字与所述数据类别之间的偏离程度;
确定最小的偏离程度;
根据所述最小的偏离程度确定目标需求。
2.根据权利要求1所述的方法,其特征在于,所述计算所述关键字与所述数据类别之间的偏离程度,包括:
计算所述关键字与所述数据类别之间的匹配度;
根据所述匹配度计算所述偏离程度。
3.根据权利要求2所述的方法,其特征在于,所述计算所述关键字与所述数据类别之间的匹配度,包括:
获取所述数据类别和所述关键字在预设的三维坐标中的位置信息;
根据所述关键字的位置信息和所述数据类别的位置信息确定所述匹配度。
4.根据权利要求3所述的方法,其特征在于,所述根据所述关键字的位置信息和所述数据类别的位置信息确定所述匹配度,包括:
根据式1确定所述匹配度
Figure FDA0003147891210000011
式1:
Figure FDA0003147891210000012
其中,
Figure FDA0003147891210000021
为第k次递归时所述关键字的位置信息,
Figure FDA0003147891210000022
为第k次递归时所述数据类别的位置信息。
5.根据权利要求4所述的方法,其特征在于,所述确定最小的偏离程度,包括:
根据式2确定所述最小的偏离程度Mindk,式2:
Figure FDA0003147891210000023
其中,m、n和p为预设的与所述三维坐标中的三个位置分别对应的阈值。
6.根据权利要求4所述的方法,其特征在于,所述根据所述最小的偏离程度确定所述目标需求,包括:
根据式3对最小偏离程度对应的关键字进行无监督学习,得到无监督学习结果,式3:
Figure FDA0003147891210000024
响应于当前递归次数大于预设阈值,将所述无监督学习结果确定为所述目标需求;
其中,dmink为k次递归匹配度的最小值。
7.一种数据信息的筛选***,其特征在于,包括:
获取模块,用于获取用户的浏览记录和初始数据需求;
确定模块,用于根据所述浏览记录确定至关键字;
所述确定模块还用于,根据所述关键字和所述初始数据需求确定目标数据需求;
发送模块,用于响应于获取到与所述目标数据需求对应的数据信息,将所述数据信息发送至所述用户对应的终端;
如果所述初始数据需求携带数据类别,则所述确定模块具体用于:
计算所述关键字与所述数据类别之间的偏离程度;
确定最小的偏离程度;
根据所述最小的偏离程度确定目标需求。
8.根据权利要求7所述的***,其特征在于,所述确定模块具体用于:
计算所述关键字与所述数据类别之间的匹配度;
根据所述匹配度计算所述偏离程度。
9.根据权利要求8所述的***,其特征在于,所述确定模块具体用于:
获取所述数据类别和所述关键字在预设的三维坐标中的位置信息;
根据所述关键字的位置信息和所述数据类别的位置信息确定所述匹配度。
10.根据权利要求8所述的***,其特征在于,所述确定模块具体用于:
根据式1确定所述匹配度
Figure FDA0003147891210000031
式1:
Figure FDA0003147891210000032
其中,
Figure FDA0003147891210000033
为第k次递归时所述关键字的位置信息,
Figure FDA0003147891210000034
为第k次递归时所述数据类别的位置信息;
根据式2确定所述最小的偏离程度Mindk,式2:
Figure FDA0003147891210000035
其中,m、n和p为预设的与预设的三维坐标中的三个位置分别对应的阈值;
根据式3对所述最小偏离程度对应的关键字进行无监督学习,得到无监督学习结果,式3:
Figure FDA0003147891210000036
响应于当前递归次数大于预设阈值,将所述无监督学习结果确定为所述目标需求;
其中,dmink为k次递归匹配度的最小值。
CN201910290132.5A 2019-04-11 2019-04-11 数据信息的筛选方法和*** Active CN110020205B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910290132.5A CN110020205B (zh) 2019-04-11 2019-04-11 数据信息的筛选方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910290132.5A CN110020205B (zh) 2019-04-11 2019-04-11 数据信息的筛选方法和***

Publications (2)

Publication Number Publication Date
CN110020205A CN110020205A (zh) 2019-07-16
CN110020205B true CN110020205B (zh) 2021-12-03

Family

ID=67191114

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910290132.5A Active CN110020205B (zh) 2019-04-11 2019-04-11 数据信息的筛选方法和***

Country Status (1)

Country Link
CN (1) CN110020205B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110264726B (zh) * 2019-08-06 2022-04-08 中国联合网络通信集团有限公司 交通控制方法和交通控制***
CN115987372A (zh) * 2022-12-05 2023-04-18 中国联合网络通信集团有限公司 一种信号源筛选输出方法、装置、处理器***

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7082429B2 (en) * 2003-12-10 2006-07-25 National Chiao Tung University Method for web content filtering
CN103064853B (zh) * 2011-10-20 2017-02-08 北京百度网讯科技有限公司 一种搜索建议生成方法、装置及***
CN104298679B (zh) * 2013-07-18 2019-05-07 腾讯科技(深圳)有限公司 应用业务推荐方法及装置
CN104598528A (zh) * 2014-12-26 2015-05-06 腾讯科技(深圳)有限公司 一种交通信息的查询方法、装置和***
CN105260432A (zh) * 2015-09-30 2016-01-20 北京奇虎科技有限公司 一种网络搜索结果筛选方法及电子设备
CN105245957A (zh) * 2015-11-05 2016-01-13 京东方科技集团股份有限公司 视频推荐方法、装置和***
US10032072B1 (en) * 2016-06-21 2018-07-24 A9.Com, Inc. Text recognition and localization with deep learning
CN107526807B (zh) * 2017-08-22 2020-01-31 中国联合网络通信集团有限公司 信息推荐方法及装置
CN108549707A (zh) * 2018-04-18 2018-09-18 安徽智网信息科技有限公司 一种基于行为感知的大数据提取***及方法
CN108876537B (zh) * 2018-06-15 2021-08-17 上海百秋电子商务有限公司 一种用于网上商场***的混合推荐方法

Also Published As

Publication number Publication date
CN110020205A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
CN108121737B (zh) 一种业务对象属性标识的生成方法、装置和***
US8977623B2 (en) Method and system for search engine indexing and searching using the index
US8290927B2 (en) Method and apparatus for rating user generated content in search results
US9317613B2 (en) Large scale entity-specific resource classification
US10031975B2 (en) Presentation of search results based on the size of the content sources from which they are obtained
US9262528B2 (en) Intent management tool for identifying concepts associated with a plurality of users' queries
CN102567408B (zh) 推荐搜索关键词的方法和装置
US8868609B2 (en) Tagging method and apparatus based on structured data set
JP2013504118A (ja) クエリのセマンティックパターンに基づく情報検索
WO2019169978A1 (zh) 资源推荐方法及装置
US9436758B1 (en) Methods and systems for partitioning documents having customer feedback and support content
US9576032B2 (en) Providing dynamic content in context of particular equipment
US20150032753A1 (en) System and method for pushing and distributing promotion content
CN104424302B (zh) 一种同类数据对象的匹配方法和装置
CA2836491C (en) Auto-suggested content item requests
CN103838798A (zh) 页面分类***及页面分类方法
US20140379723A1 (en) Automatic method for profile database aggregation, deduplication, and analysis
CN107391535A (zh) 在文档应用中搜索文档的方法及装置
CN110020205B (zh) 数据信息的筛选方法和***
WO2012115965A1 (en) Entity fingerprints
CN113836128A (zh) 一种异常数据识别方法、***、设备及存储介质
CN105808740A (zh) 信息搜索方法及信息搜索装置
Segura et al. Metamorphic relation patterns for query-based systems
CN108234392B (zh) 一种网站的监控方法及装置
KR20190109628A (ko) 개인화된 기사 컨텐츠 제공 방법 및 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant