CN108268482A - 信息推送方法、装置以及设备 - Google Patents

信息推送方法、装置以及设备 Download PDF

Info

Publication number
CN108268482A
CN108268482A CN201611258479.4A CN201611258479A CN108268482A CN 108268482 A CN108268482 A CN 108268482A CN 201611258479 A CN201611258479 A CN 201611258479A CN 108268482 A CN108268482 A CN 108268482A
Authority
CN
China
Prior art keywords
record
value
field
score
alternative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611258479.4A
Other languages
English (en)
Inventor
李曙聪
牛朋涛
魏炎炎
伊辉
阳健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201611258479.4A priority Critical patent/CN108268482A/zh
Publication of CN108268482A publication Critical patent/CN108268482A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了信息推送方法、装置以及设备。该方法的一具体实施方式包括:接收用户通过终端发送的查询请求,其中,查询请求包括关键字;在预先设置的数据库中查询包含关键字的记录,将包含关键字的记录作为备选记录;对每条备选记录执行以下步骤:基于备选记录中各个预定字段的值确定备选记录中相应预定字段的值对应的分数;累加备选记录中各个预定字段的值对应的分数与预先设置的该预定字段的权重的乘积得到备选记录的总分数;向终端推送总分数大于预设阈值的备选记录。该实施方式实现了信息的筛选,使用户获取信息的效率更高。

Description

信息推送方法、装置以及设备
技术领域
本申请涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及信息推送方法、装置以及设备。
背景技术
随着互联网技术的发展,信息量已经以几何级别增长,同时,信息缺乏管理或管理不善,导致了用户筛选以及获取信息的效率较低。
例如,企业在选择供应商时,有时仅根据对供应商的印象来筛选供应商,主观的成分过多,没有利用互联网中供应商各方面的信息形成全面的评价体系,不能高效客观的进行供应商筛选。
发明内容
本申请的目的在于提出一种改进的信息推送方法、装置以及设备,来解决以上背景技术部分提到的技术问题。
第一方面,本申请提供了改进的信息推送方法,该方法包括:接收用户通过终端发送的查询请求,其中,所述查询请求包括关键字;在预先设置的数据库中查询包含所述关键字的记录,将包含所述关键字的记录作为备选记录;对每条备选记录执行以下步骤:基于备选记录中各个预定字段的值确定备选记录中相应预定字段的值对应的分数;累加备选记录中各个预定字段的值对应的分数与预先设置的该预定字段的权重的乘积得到备选记录的总分数;向所述终端推送总分数大于预设阈值的备选记录。
在一些实施例中,所述基于备选记录中各个预定字段的值确定备选记录中相应预定字段的值对应的分数,包括:确定备选记录中每个预定字段的值与其他备选记录中相同预定字段的值的重要度之比;根据所确定的重要度之比为每个预定字段构建判断矩阵;计算所构建的判断矩阵的最大特征值对应的特征向量;获取计算出的特征向量中相 应的元素作为备选记录中每个预定字段的值对应的分数。
在一些实施例中,所述基于备选记录中各个预定字段的值确定备选记录中相应预定字段的值对应的分数,包括:根据预先建立的各个预定字段的值与分数的对应关系,确定备选记录中各个预定字段的值对应的分数。
在一些实施例中,所述数据库中预定字段的权重通过以下步骤确定:获取所述数据库中每个预定字段与其他预定字段的重要度之比;根据所获取的重要度之比建立判断矩阵;确定所建立的判断矩阵的最大特征值对应的特征向量;获取所确定的特征向量中相应的元素作为所述数据库中每个预定字段的权重。
在一些实施例中,所述查询请求还包括筛选信息,所述筛选信息包括待筛选字段和筛选条件;以及所述在预先设置的数据库中查询包含所述关键字的记录,将包含所述关键字的至少一条记录作为备选记录,包括:在预先设置的数据库中查询包含所述关键字的记录;判断查询到的记录中待筛选字段的值是否满足所述筛选条件;如果是,则将查询到的记录作为备选记录。
在一些实施例中,所述数据库通过以下步骤设置:搜索包括特征信息的网页,其中,所述特征信息包括以下至少一项:企业名称、工商注册号、统一社会信用代码、组织机构代码;抓取搜索到的网页中内容;响应于判断出所述数据库中不存在包括所述特征信息的记录,新建包括所述特征信息的记录;将抓取的内容存入包括所述特征信息的记录中。
在一些实施例中,所述预定字段包括以下至少一项:企业所属行业,企业规模,企业产品类型,企业物流能力。
在一些实施例中,所述向所述终端推送所述总分数大于预设阈值的备选记录,包括:基于所述总分数大于预设阈值的备选记录中各个补充字段的值确定所述总分数大于预设阈值的备选记录中各个补充字段的值对应的分数,其中,所述补充字段包括以下至少一项:企业许可经营项目的数量、企业采购成本、企业注册资本金额、企业生产的产品数量,企业的专利和著作权个数、企业信息化程度、企业违规失 信行为的次数、企业舆情信息;累加所述总分数大于预设阈值的备选记录中各个补充字段的值对应的分数与预先设置的该补充字段的权重的乘积得到所述总分数大于预设阈值的备选记录的补充分数;向所述终端推送所述补充分数大于预先设置的补充阈值的备选记录。
第二方面,本申请提供了一种信息推送装置,该装置包括:接收单元,用于接收用户通过终端发送的查询请求,其中,所述查询请求包括关键字;查询单元,用于在预先设置的数据库中查询包含所述关键字的记录,将包含所述关键字的记录作为备选记录;计算单元,用于对每条备选记录执行以下步骤:基于备选记录中各个预定字段的值确定备选记录中相应预定字段的值对应的分数;累加备选记录中各个预定字段的值对应的分数与预先设置的该预定字段的权重的乘积得到备选记录的总分数;推送单元,用于向所述终端推送总分数大于预设阈值的备选记录。
在一些实施例中,所述计算单元,包括第二确定子单元;以及所述第二确定子单元,包括:确定模块,用于确定备选记录中每个预定字段的值与其他备选记录中相同预定字段的值的重要度之比;构建模块,用于根据所确定的重要度之比为每个预定字段构建判断矩阵;计算模块,用于计算所构建的判断矩阵的最大特征值对应的特征向量;获取模块,用于获取计算出的特征向量中相应的元素作为备选记录中每个预定字段的值对应的分数。
在一些实施例中,所述计算单元,包括:第一确定子单元,用于根据预先建立的各个预定字段的值与分数的对应关系,确定备选记录中各个预定字段的值对应的分数。
在一些实施例中,所述装置还包括确定单元,用于确定数据库中预定字段的权重;以及所述确定单元,包括:第一获取子单元,用于获取所述数据库中每个预定字段与其他预定字段的重要度之比;建立子单元,用于根据所获取的重要度之比建立判断矩阵;第三确定子单元,用于确定所建立的判断矩阵的最大特征值对应的特征向量;第二获取子单元,用于获取所确定的特征向量中相应的元素作为所述数据库中每个预定字段的权重。
在一些实施例中,所述查询请求还包括筛选信息,所述筛选信息包括待筛选字段和筛选条件;以及所述查询单元,包括:查询子单元,用于在预先设置的数据库中查询包含所述关键字的记录;判断子单元,用于判断查询到的记录中待筛选字段的值是否满足所述筛选条件,如果是,则将查询到的记录作为备选记录。
在一些实施例中,所述装置还包括设置单元,用于设置所述数据库;以及所述设置单元,包括:搜索子单元,用于搜索包括特征信息的网页,其中,所述特征信息包括以下至少一项:企业名称、工商注册号、统一社会信用代码、组织机构代码;抓取子单元,用于抓取搜索到的网页中内容;新建子单元,用于响应于判断出所述数据库中不存在包括所述特征信息的记录,新建包括所述特征信息的记录;存储子单元,用于将抓取的内容存入包括所述特征信息的记录中。
在一些实施例中,所述推送单元,包括:第四确定子单元,用于基于所述总分数大于预设阈值的备选记录中各个补充字段的值确定所述总分数大于预设阈值的备选记录中各个补充字段的值对应的分数,其中,所述补充字段包括以下至少一项:企业许可经营项目的数量、企业采购成本、企业注册资本金额、企业生产的产品数量,企业的专利和著作权个数、企业信息化程度、企业违规失信行为的次数、企业舆情信息;
计算子单元,用于累加所述总分数大于预设阈值的备选记录中各个补充字段的值对应的分数与预先设置的该补充字段的权重的乘积得到所述总分数大于预设阈值的备选记录的补充分数;
推送子单元,用于向所述终端推送所述补充分数大于预先设置的补充阈值的备选记录。
第三方面,本申请提供了一种设备,包括:一个或多个处理器;存储器,用于存储一个或多个计算机程序,在所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如第一方面中任一实现方式所述的方法。
本申请提供的信息推送方法、装置以及设备,通过接收用户通过终端发送的查询请求,在预先设置的数据库中查询包含关键字的记录, 并将包含关键字的记录作为备选记录,而后对每条备选记录执行以下步骤:基于备选记录中各个预定字段的值确定备选记录中相应预定字段的值对应的分数,累加备选记录中各个预定字段的值对应的分数与预先设置的该预定字段的权重的乘积得到备选记录的总分数;最后向终端推送总分数大于预设阈值的备选记录,从而实现了信息的筛选,使用户获取信息的效率更高。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性***架构图;
图2是根据本申请的信息推送方法的一个实施例的流程图;
图3是根据本申请的信息推送方法的一个应用场景的示意图;
图4是根据本申请的信息推送方法的又一个实施例的流程图;
图5是根据本申请的本申请的信息推送装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的服务器的计算机***的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的信息推送方法或装置的实施例的示例性***架构100。
如图1所示,***架构100可以包括终端设备101、102、103, 网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供传输链路的介质。网络104可以包括各种连接类型,例如有线、无线传输链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种应用,例如,电子商务类应用、浏览器类应用、***工具类应用、即时通讯类应用、搜索类应用、文字处理类应用等。
终端设备101、102、103可以是各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。
服务器105可以是为终端设备101、102、103上安装的应用提供支持的后台服务器,例如为终端设备101、102、103推送信息的后台服务器。后台服务器可以接收用户通过终端设备101、102、103发送的查询请求,在预先设置的数据库中查询包含关键字的记录,并将包含关键字的记录作为备选记录,而后对每条备选记录执行以下步骤:基于备选记录中各个预定字段的值确定备选记录中相应预定字段的值对应的分数,累加备选记录中各个预定字段的值对应的分数与预先设置的该预定字段的权重的乘积得到备选记录的总分数;最后向终端设备101、102、103推送总分数大于预设阈值的备选记录。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
需要说明的是,本申请实施例所提供的信息推送方法一般由服务器105执行,相应地,信息推送装置一般设置于服务器105中。
继续参考图2,示出了根据本申请的信息推送方法的一个实施例的流程200。该信息推送方法,包括以下步骤:
步骤201,接收用户通过终端发送的查询请求。
在本实施例中,信息推送方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式接收用户通过终端发送的查询请求,其中,查询请求包括关键字,关键字可以是 产品名称等。例如,用户需要采购某种产品或需要某种服务时,可以输入该产品或服务的名称,或该产品或服务所处的行业作为关键字,并通过终端向上述电子设备发送包括该关键字的查询请求。
步骤202,在预先设置的数据库中查询包含关键字的记录,将包含关键字的记录作为备选记录。
在本实施例中,上述电子设备可以在预先设置的数据库中查询包含步骤201中接收的查询请求包括的关键字的记录,将包含关键字的记录作为备选记录。预先设置的数据库中可以包括关于待推送对象的各方面的信息,各方面的信息可以分别记录于数据库的不同的字段中。例如,预先设置的数据库可以是用于存储企业信息的数据库,数据库中的字段可以包括企业所属行业,企业规模,企业产品类型,企业物流能力等。若用户输入的关键字是产品名称,则可以查询数据库中企业产品类型的字段是否包括该产品名称,将包括该产品名称的记录作为备选记录。企业所属行业可根据工商注册国民经济行业以及经营范围确定。
在本实施例的一些可选的实现方式中,数据库可以通过以下步骤设置:搜索包括特征信息的网页,其中,特征信息可以包括以下至少一项:企业名称、工商注册号、统一社会信用代码、组织机构代码;抓取搜索到的网页中内容;响应于判断出数据库中不存在包括特征信息的记录,新建包括特征信息的记录;将抓取的内容存入包括特征信息的记录中。企业名称可以是企业全称、企业简称和企业法人名称。具体的,可以抓取各种形式的信息(例如文本文档、日志文件、数据表格以及实时数据流等等),抓取的信息可以包括以下至少一项:企业基础数据、经营行为数据、政府监督数据、企业站点搜索数据、媒体舆情数据,其中,企业基础数据可以包括企业名称、注册时间、注册地址、公司法人、经营范围、公司性质等等,经营行为数据可以包括企业主营产品信息,政府监督数据可以包括企业工商行政处罚记录、司法监管记录、税务监管记录、财务监管记录等,企业站点搜索数据可以包括针对已注册网站并运营的企业获取的对应网站运营情况信息,媒体舆情数据可以包括目标企业在网络媒体上曝光的经营信息。 由于数据量非常大,可以周期性的进行抓取,例如,可以十天进行一次抓取。
在本实施例的一些可选的实现方式中,数据库也可以通过接收外部数据提供者提供的数据来建立,例如,可以接收用户输入或与其他数据库建立连接,直接获取其他数据库中的数据,其他数据库可以是已存储有企业征信数据的数据库。
在本实施例的一些可选的实现方式中,查询请求还可以包括筛选信息,筛选信息包括待筛选字段和筛选条件;以及在预先设置的数据库中查询包含关键字的记录,将包含关键字的至少一条记录作为备选记录,可以包括:在预先设置的数据库中查询包含关键字的记录;判断查询到的记录中待筛选字段的值是否满足筛选条件;如果是,则将查询到的记录作为备选记录。例如,数据库是用于存储企业信息的数据库,用户可以选定待筛选字段是“企业规模”,筛选条件是500人以上。
步骤203,对每条备选记录执行以下步骤:基于备选记录中各个预定字段的值确定备选记录中相应预定字段的值对应的分数;累加备选记录中各个预定字段的值对应的分数与预先设置的该预定字段的权重的乘积得到备选记录的总分数。
在本实施例中,上述电子设备可以对步骤202中查询到的每条备选记录执行以下步骤:基于备选记录中各个预定字段的值确定备选记录中相应预定字段的值对应的分数;累加备选记录中各个预定字段的值对应的分数与预先设置的该预定字段的权重的乘积得到备选记录的总分数。
在本实施例的一些可选的实现方式中,基于备选记录中各个预定字段的值确定备选记录中相应预定字段的值对应的分数,包括:根据预先建立的各个预定字段的值与分数的对应关系,确定备选记录中各个预定字段的值对应的分数。
在本实施例的一些可选的实现方式中,基于备选记录中各个预定字段的值确定备选记录中相应预定字段的值对应的分数,包括:确定备选记录中每个预定字段的值与其他备选记录中相同预定字段的值的重要度之比;根据所确定的重要度之比为每个预定字段构建判断矩阵; 计算所构建的判断矩阵的最大特征值对应的特征向量;获取计算出的特征向量中相应的元素作为备选记录中每个预定字段的值对应的分数。备选记录中每个预定字段的值与其他备选记录中相同预定字段的值的重要度之比可按9分位比率排定,可根据重要度之比建立判断矩阵矩阵B中元素bij为备选记录中预定字段的值i与其他备选记录中相同预定字段的值j的重要度之比,bij可以有9种取值,分别为1/9,1/7,1/5,1/3,1/1,3/1,5/1,7/1,9/1,分别表示备选记录中预定字段的值i与其他备选记录中相同预定字段的值j的重要程度由轻到重。获取重要度之比的方式可以是接收用户输入、通过预先设置的预定字段的值所处的范围与重要度的对应关系获取、或通过机器学习方法进行训练得到。
计算所构建的判断矩阵的最大特征值对应的特征向量,可以采用几何平均法(根法)或规范列平均法(和法)。几何平均法即计算矩阵B各行各个元素的乘积,得到一个n行一列的矩阵H;计算矩阵H每个元素的n次方根得到矩阵I;对矩阵I进行归一化处理得到矩阵J;该矩阵J即为所求向量。规范列平均法即对矩阵B每一列归一化得到矩阵K;将矩阵K每一行元素的平均值得到一个一列n行的矩阵L;矩阵L即为所求向量。求得的向量中相应的元素即为数据库中每个预定字段的权重。
在本实施例的一些可选的实现方式中,数据库中预定字段的权重可以通过层次分析法、变异系数法等权重确定方法来确定。具体可以通过以下步骤确定:获取数据库中每个预定字段与其他预定字段的重要度之比;根据所获取的重要度之比建立判断矩阵;确定所建立的判断矩阵的最大特征值对应的特征向量;获取所确定的特征向量中相应的元素作为数据库中每个预定字段的权重。
上述重要度之比可以理解为重要性的比较结果,可按9分位比率 排定,可根据重要度之比建立判断矩阵矩阵A中元素aij为预定字段i与预定字段j的重要度之比,例如,a12可以代表预定字段“企业所属行业”与“企业规模”的重要度之比,a13可以代表预定字段“企业所属行业”与“企业产品类型”的重要度之比,a23可以代表预定字段“企业规模”与“企业产品类型”的重要度之比,aij有9种取值,分别为1/9,1/7,1/5,1/3,1/1,3/1,5/1,7/1,9/1,分别表示预定字段i相对于预定字段j的重要程度由轻到重。获取重要度之比的方式可以是接收用户输入或通过机器学习方法进行训练得到。
确定所建立的判断矩阵的最大特征值对应的特征向量,可以采用几何平均法(根法)或规范列平均法(和法)。几何平均法即计算矩阵A各行各个元素的乘积,得到一个n行一列的矩阵G;计算矩阵G每个元素的n次方根得到矩阵C;对矩阵C进行归一化处理得到矩阵D;该矩阵D即为所求向量。规范列平均法即对矩阵A每一列归一化得到矩阵E;将矩阵E每一行元素的平均值得到一个一列n行的矩阵F;矩阵F即为所求向量。可以对求得的向量进行归一化处理,向量中相应的元素即为数据库中每个预定字段的权重。
在本实施例的一些可选的实现方式中,预定字段包括以下至少一项:企业所属行业,企业规模,企业产品类型,企业物流能力。
步骤204,向终端推送总分数大于预设阈值的备选记录。
在本实施例中,上述电子设备可以向终端推送步骤203中计算得到的总分数大于预设阈值的备选记录。推送备选记录可以直接推送备选记录所有的内容,也可以以超链接的形式推送备选记录的主键或部分字段,用户可以通过点击超链接进入相应页面了解备选记录的更多详细信息。
在本实施例的一些可选的实现方式中,向终端推送总分数大于预设阈值的备选记录,包括:基于总分数大于预设阈值的备选记录中各个补充字段的值确定总分数大于预设阈值的备选记录中各个补充字段 的值对应的分数,其中,补充字段包括以下至少一项:企业许可经营项目的数量、企业采购成本、企业注册资本金额、企业生产的产品数量,企业的专利和著作权个数、企业信息化程度、企业违规失信行为的次数、企业舆情信息;累加总分数大于预设阈值的备选记录中各个补充字段的值对应的分数与预先设置的该补充字段的权重的乘积得到总分数大于预设阈值的备选记录的补充分数;向终端推送补充分数大于预先设置的补充阈值的备选记录。企业采购成本可以体现企业的采购管理能力,采购管理能力可以通过采购预算资金与实际采购成本之差与采购预算资金之比来表示,其结果越大,说明采购管理能力越强。企业生产的产品数量和企业的专利和著作权个数可以体现企业的生产及研发能力。企业舆情信息可以通过网页爬取的方式,对网络中各种类型媒体所发布的信息进行独立的第三方观察,形成量化统计和定性分析,并结合语义分析算法推导、归纳总结而最终形成的一套网络舆情指数体系。通过补充字段实现了对备选记录的二次筛选,同时避免了单次处理的数据量过大。
继续参见图3,图3是根据本实施例信息推送方法的应用场景的一个示意图。图3的应用场景是为用户选择供应商的方法,包括以下步骤:步骤301,供应商信息采集。信息采集方法可以包括,搜集各管理部门如国家工商总局公布的企业公示信息,提取企业征信信息、人工采集信息等,采集到的信息可以存储到计算机硬件存储设备或互联网云端虚拟存储介质上。步骤302,信息处理与分析。信息处理与分析用于将采集到的信息分类与聚合,可以将企业的各类征信信息归类为:供应商基本资质信息、许可经营能力、采购管理能力、资本及财务能力、生产及研发能力、信息化程度、有关执法部门监管记录以及企业舆情信息。步骤303,供应商初选。可以利用信息处理与分析结果,从目标企业所属行业,企业规模,产品类型,物流能力四个方面建立矩阵,对企业进行筛选。步骤304,供应商优选。可以采用层次分析法比较供应商基本资质信息、许可经营能力、采购管理能力、资本及财务能力、生产及研发能力、信息化程度、有关执法部门监管记录以及企业舆情信息从而选出目标供应商。
本实施例提供的信息推送方法,通过接收用户通过终端发送的查询请求,在预先设置的数据库中查询包含关键字的记录,并将包含关键字的记录作为备选记录,而后对每条备选记录执行以下步骤:基于备选记录中各个预定字段的值确定备选记录中相应预定字段的值对应的分数,累加备选记录中各个预定字段的值对应的分数与预先设置的该预定字段的权重的乘积得到备选记录的总分数;最后向终端推送总分数大于预设阈值的备选记录,从而实现了信息的筛选,使用户获取信息的效率更高。
进一步参考图4,其示出了信息推送方法的又一个实施例的流程400。该信息推送方法的流程400,包括以下步骤:
步骤401,接收用户通过终端发送的查询请求。
在本实施例中,信息推送方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式接收用户通过终端发送的查询请求,其中,查询请求包括关键字,关键字可以是产品名称等。
步骤402,在预先设置的数据库中查询包含关键字的记录,将包含关键字的记录作为备选记录。
在本实施例中,上述电子设备可以在预先设置的数据库中查询包含步骤401中接收的查询请求包括的关键字的记录,将包含关键字的记录作为备选记录。
步骤4031,确定备选记录中每个预定字段的值与其他备选记录中相同预定字段的值的重要度之比。
在本实施例中,上述电子设备可以确定步骤402中得到的备选记录中每个预定字段的值与其他备选记录中相同预定字段的值的重要度之比。重要程度与重要度之比的量化关系可以如表1所示。预定字段可以包括以下至少一项:企业所属行业,企业规模,企业产品类型,企业物流能力。备选记录中每个预定字段的值与其他备选记录中相同预定字段的值的重要度之比可按9分位比率排定。获取重要度之比的方式可以是接收用户输入、或通过机器学习方法进行训练得到。也可 以通过预先设置的预定字段的值所处的范围与重要度的对应关系获取重要度之比,例如,预先设置“企业规模”字段的值为500以上的记录,与“企业规模”字段的值为100以下的记录的重要度之比为7。
表1
步骤4032,根据所确定的重要度之比为每个预定字段构建判断矩阵。
在本实施例中,上述电子设备可以根据步骤4031所确定的重要度之比为每个预定字段构建判断矩阵。构建的判断矩阵可以是 矩阵B中元素bij为备选记录中预定字段的值i与其他备选记录中相同预定字段的值j的重要度之比,bij可以有9种取值,分别为1/9,1/7,1/5,1/3,1/1,3/1,5/1,7/1,9/1,分别表示备选记录中预定字段的值i与其他备选记录中相同预定字段的值j的重要程度由轻到重。此外,还可以对构建的判断矩阵进行一致性检验。
步骤4033,计算所构建的判断矩阵的最大特征值对应的特征向量。
在本实施例中,上述电子设备可以计算步骤4032所构建的判断矩阵的最大特征值对应的特征向量。计算所构建的判断矩阵的最大特征值对应的特征向量,可以采用几何平均法(根法)或规范列平均法(和法)。几何平均法即计算矩阵B各行各个元素的乘积,得到一个n行一列的矩阵H;计算矩阵H每个元素的n次方根得到矩阵I;对矩阵I进行归一化处理得到矩阵J;该矩阵J即为所求向量。规范列平均法即 对矩阵B每一列归一化得到矩阵K;将矩阵K每一行元素的平均值得到一个一列n行的矩阵L;矩阵L即为所求向量。
步骤4034,获取计算出的特征向量中相应的元素作为备选记录中每个预定字段的值对应的分数。
在本实施例中,上述电子设备可以获取步骤4033计算出的特征向量中相应的元素作为备选记录中每个预定字段的值对应的分数。构建的判断矩阵B的特征向量中第i个元素即为备选记录中预定字段的值i的分数。
步骤4035,累加备选记录中各个预定字段的值对应的分数与预先设置的该预定字段的权重的乘积得到备选记录的总分数。
在本实施例中,上述电子设备可以累加步骤4034获取的备选记录中各个预定字段的值对应的分数与预先设置的该预定字段的权重的乘积得到备选记录的总分数。
步骤404,向终端推送总分数大于预设阈值的备选记录。
在本实施例中,上述电子设备可以向终端推送步骤4035中计算得到的总分数大于预设阈值的备选记录。推送备选记录可以直接推送备选记录所有的内容,也可以以超链接的形式推送备选记录的主键或部分字段,用户可以通过点击超链接进入相应页面了解备选记录的更多详细信息。
从图4中可以看出,与图2对应的实施例不同的是,本实施例中首先增加了如何确定备选记录中相应预定字段的值对应的分数的步骤,进一步提高了筛选信息的准确性,使用户获取信息的效率更高。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种信息推送装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的信息推送装置500包括:接收单元501、查询单元502、计算单元503以及推送单元504。其中,接收单元501,用于接收用户通过终端发送的查询请求,其中,查询请求包括关键字;查询单元502,用于在预先设置的数据库中查询包含关键字的记录, 将包含关键字的记录作为备选记录;计算单元503,用于对每条备选记录执行以下步骤:基于备选记录中各个预定字段的值确定备选记录中相应预定字段的值对应的分数;累加备选记录中各个预定字段的值对应的分数与预先设置的该预定字段的权重的乘积得到备选记录的总分数;推送单元504,用于向终端推送总分数大于预设阈值的备选记录。
在本实施例中,接收单元501、查询单元502、计算单元503以及推送单元504的具体处理可以参考图2对应实施例步骤201、步骤202、步骤203和步骤204的详细描述,在此不再赘述。
在本实施例的一些可选的实现方式中,计算单元503,包括:第一确定子单元,用于根据预先建立的各个预定字段的值与分数的对应关系,确定备选记录中各个预定字段的值对应的分数。
在本实施例的一些可选的实现方式中,计算单元503,包括第二确定子单元;以及第二确定子单元,包括:确定模块,用于确定备选记录中每个预定字段的值与其他备选记录中相同预定字段的值的重要度之比;构建模块,用于根据所确定的重要度之比为每个预定字段构建判断矩阵;计算模块,用于计算所构建的判断矩阵的最大特征值对应的特征向量;获取模块,用于获取计算出的特征向量中相应的元素作为备选记录中每个预定字段的值对应的分数。
在本实施例的一些可选的实现方式中,装置还包括确定单元,用于确定数据库中预定字段的权重;以及确定单元,包括:第一获取子单元,用于获取数据库中每个预定字段与其他预定字段的重要度之比;建立子单元,用于根据所获取的重要度之比建立判断矩阵;第三确定子单元,用于确定所建立的判断矩阵的最大特征值对应的特征向量;第二获取子单元,用于获取所确定的特征向量中相应的元素作为数据库中每个预定字段的权重。
在本实施例的一些可选的实现方式中,查询请求还包括筛选信息,筛选信息包括待筛选字段和筛选条件;以及查询单元502,包括:查询子单元,用于在预先设置的数据库中查询包含关键字的记录;判断子单元,用于判断查询到的记录中待筛选字段的值是否满足筛选条件, 如果是,则将查询到的记录作为备选记录。
在本实施例的一些可选的实现方式中,装置还包括设置单元,用于设置数据库;以及设置单元,包括:搜索子单元,用于搜索包括特征信息的网页,其中,特征信息包括以下至少一项:企业名称、工商注册号、统一社会信用代码、组织机构代码;抓取子单元,用于抓取搜索到的网页中内容;新建子单元,用于响应于判断出数据库中不存在包括特征信息的记录,新建包括特征信息的记录;存储子单元,用于将抓取的内容存入包括特征信息的记录中。
在本实施例的一些可选的实现方式中,推送单元504,包括:第四确定子单元,用于基于总分数大于预设阈值的备选记录中各个补充字段的值确定总分数大于预设阈值的备选记录中各个补充字段的值对应的分数,其中,补充字段包括以下至少一项:企业许可经营项目的数量、企业采购成本、企业注册资本金额、企业生产的产品数量,企业的专利和著作权个数、企业信息化程度、企业违规失信行为的次数、企业舆情信息;计算子单元,用于累加总分数大于预设阈值的备选记录中各个补充字段的值对应的分数与预先设置的该补充字段的权重的乘积得到总分数大于预设阈值的备选记录的补充分数;推送子单元,用于向终端推送补充分数大于预先设置的补充阈值的备选记录。
下面参考图6,其示出了适于用来实现本申请实施例的服务器的计算机***600的结构示意图。
如图6所示,计算机***600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有***600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络 接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。
附图中的流程图和框图,图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括接收单元、查询单元、计算单元以及推送单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,接收单元还可以被描述为“接收用户通过终端发送的查询请求的单元”。
作为另一方面,本申请还提供了一种非易失性计算机存储介质, 该非易失性计算机存储介质可以是上述实施例中装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当一个或者多个程序被一个设备执行时,使得设备:接收用户通过终端发送的查询请求,在预先设置的数据库中查询包含关键字的记录,并将包含关键字的记录作为备选记录,而后对每条备选记录执行以下步骤:基于备选记录中各个预定字段的值确定备选记录中相应预定字段的值对应的分数,累加备选记录中各个预定字段的值对应的分数与预先设置的该预定字段的权重的乘积得到备选记录的总分数;最后向终端推送总分数大于预设阈值的备选记录。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (16)

1.一种信息推送的方法,其特征在于,所述方法包括:
接收用户通过终端发送的查询请求,其中,所述查询请求包括关键字;
在预先设置的数据库中查询包含所述关键字的记录,将包含所述关键字的记录作为备选记录;
对每条备选记录执行以下步骤:基于备选记录中各个预定字段的值确定备选记录中相应预定字段的值对应的分数;累加备选记录中各个预定字段的值对应的分数与预先设置的该预定字段的权重的乘积得到备选记录的总分数;
向所述终端推送总分数大于预设阈值的备选记录。
2.根据权利要求1所述的方法,其特征在于,所述基于备选记录中各个预定字段的值确定备选记录中相应预定字段的值对应的分数,包括:
确定备选记录中每个预定字段的值与其他备选记录中相同预定字段的值的重要度之比;
根据所确定的重要度之比为每个预定字段构建判断矩阵;
计算所构建的判断矩阵的最大特征值对应的特征向量;
获取计算出的特征向量中相应的元素作为备选记录中每个预定字段的值对应的分数。
3.根据权利要求1所述的方法,其特征在于,所述基于备选记录中各个预定字段的值确定备选记录中相应预定字段的值对应的分数,包括:
根据预先建立的各个预定字段的值与分数的对应关系,确定备选记录中各个预定字段的值对应的分数。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述数据库中预定字段的权重通过以下步骤确定:
获取所述数据库中每个预定字段与其他预定字段的重要度之比;
根据所获取的重要度之比建立判断矩阵;
确定所建立的判断矩阵的最大特征值对应的特征向量;
获取所确定的特征向量中相应的元素作为所述数据库中每个预定字段的权重。
5.根据权利要求1-3中任一项所述的方法,其特征在于,所述查询请求还包括筛选信息,所述筛选信息包括待筛选字段和筛选条件;以及
所述在预先设置的数据库中查询包含所述关键字的记录,将包含所述关键字的至少一条记录作为备选记录,包括:
在预先设置的数据库中查询包含所述关键字的记录;
判断查询到的记录中待筛选字段的值是否满足所述筛选条件;
如果是,则将查询到的记录作为备选记录。
6.根据权利要求1-3中任一项所述的方法,其特征在于,所述数据库通过以下步骤设置:
搜索包括特征信息的网页,其中,所述特征信息包括以下至少一项:企业名称、工商注册号、统一社会信用代码、组织机构代码;
抓取搜索到的网页中内容;
响应于判断出所述数据库中不存在包括所述特征信息的记录,新建包括所述特征信息的记录;
将抓取的内容存入包括所述特征信息的记录中。
7.根据权利要求1-3中任一项所述的方法,其特征在于,所述预定字段包括以下至少一项:企业所属行业,企业规模,企业产品类型,企业物流能力。
8.根据权利要求1-3中任一项所述的方法,其特征在于,所述向所述终端推送所述总分数大于预设阈值的备选记录,包括:
基于所述总分数大于预设阈值的备选记录中各个补充字段的值确定所述总分数大于预设阈值的备选记录中各个补充字段的值对应的分数,其中,所述补充字段包括以下至少一项:企业许可经营项目的数量、企业采购成本、企业注册资本金额、企业生产的产品数量,企业的专利和著作权个数、企业信息化程度、企业违规失信行为的次数、企业舆情信息;
累加所述总分数大于预设阈值的备选记录中各个补充字段的值对应的分数与预先设置的该补充字段的权重的乘积得到所述总分数大于预设阈值的备选记录的补充分数;
向所述终端推送所述补充分数大于预先设置的补充阈值的备选记录。
9.一种信息推送的装置,其特征在于,所述装置包括:
接收单元,用于接收用户通过终端发送的查询请求,其中,所述查询请求包括关键字;
查询单元,用于在预先设置的数据库中查询包含所述关键字的记录,将包含所述关键字的记录作为备选记录;
计算单元,用于对每条备选记录执行以下步骤:基于备选记录中各个预定字段的值确定备选记录中相应预定字段的值对应的分数;累加备选记录中各个预定字段的值对应的分数与预先设置的该预定字段的权重的乘积得到备选记录的总分数;
推送单元,用于向所述终端推送总分数大于预设阈值的备选记录。
10.根据权利要求9所述的装置,其特征在于,所述计算单元,包括第二确定子单元;以及
所述第二确定子单元,包括:
确定模块,用于确定备选记录中每个预定字段的值与其他备选记录中相同预定字段的值的重要度之比;
构建模块,用于根据所确定的重要度之比为每个预定字段构建判断矩阵;
计算模块,用于计算所构建的判断矩阵的最大特征值对应的特征向量;
获取模块,用于获取计算出的特征向量中相应的元素作为备选记录中每个预定字段的值对应的分数。
11.根据权利要求9所述的装置,其特征在于,所述计算单元,包括:
第一确定子单元,用于根据预先建立的各个预定字段的值与分数的对应关系,确定备选记录中各个预定字段的值对应的分数。
12.根据权利要求9-11中任一项所述的装置,其特征在于,所述装置还包括确定单元,用于确定数据库中预定字段的权重;以及
所述确定单元,包括:
第一获取子单元,用于获取所述数据库中每个预定字段与其他预定字段的重要度之比;
建立子单元,用于根据所获取的重要度之比建立判断矩阵;
第三确定子单元,用于确定所建立的判断矩阵的最大特征值对应的特征向量;
第二获取子单元,用于获取所确定的特征向量中相应的元素作为所述数据库中每个预定字段的权重。
13.根据权利要求9-11中任一项所述的装置,其特征在于,所述查询请求还包括筛选信息,所述筛选信息包括待筛选字段和筛选条件;以及
所述查询单元,包括:
查询子单元,用于在预先设置的数据库中查询包含所述关键字的记录;
判断子单元,用于判断查询到的记录中待筛选字段的值是否满足所述筛选条件,如果是,则将查询到的记录作为备选记录。
14.根据权利要求9-11中任一项所述的装置,其特征在于,所述装置还包括设置单元,用于设置所述数据库;以及
所述设置单元,包括:
搜索子单元,用于搜索包括特征信息的网页,其中,所述特征信息包括以下至少一项:企业名称、工商注册号、统一社会信用代码、组织机构代码;
抓取子单元,用于抓取搜索到的网页中内容;
新建子单元,用于响应于判断出所述数据库中不存在包括所述特征信息的记录,新建包括所述特征信息的记录;
存储子单元,用于将抓取的内容存入包括所述特征信息的记录中。
15.根据权利要求9-11中任一项所述的装置,其特征在于,所述推送单元,包括:
第四确定子单元,用于基于所述总分数大于预设阈值的备选记录中各个补充字段的值确定所述总分数大于预设阈值的备选记录中各个补充字段的值对应的分数,其中,所述补充字段包括以下至少一项:企业许可经营项目的数量、企业采购成本、企业注册资本金额、企业生产的产品数量,企业的专利和著作权个数、企业信息化程度、企业违规失信行为的次数、企业舆情信息;
计算子单元,用于累加所述总分数大于预设阈值的备选记录中各个补充字段的值对应的分数与预先设置的该补充字段的权重的乘积得到所述总分数大于预设阈值的备选记录的补充分数;
推送子单元,用于向所述终端推送所述补充分数大于预先设置的补充阈值的备选记录。
16.一种设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机程序,在所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1到8中任一项所述的方法。
CN201611258479.4A 2016-12-30 2016-12-30 信息推送方法、装置以及设备 Pending CN108268482A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611258479.4A CN108268482A (zh) 2016-12-30 2016-12-30 信息推送方法、装置以及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611258479.4A CN108268482A (zh) 2016-12-30 2016-12-30 信息推送方法、装置以及设备

Publications (1)

Publication Number Publication Date
CN108268482A true CN108268482A (zh) 2018-07-10

Family

ID=62754863

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611258479.4A Pending CN108268482A (zh) 2016-12-30 2016-12-30 信息推送方法、装置以及设备

Country Status (1)

Country Link
CN (1) CN108268482A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110020974A (zh) * 2019-03-06 2019-07-16 平安科技(深圳)有限公司 律师推荐方法、装置、介质及电子设备
CN111833197A (zh) * 2020-07-13 2020-10-27 北京逸风金科软件有限公司 一种征信协议的遥测数据处理方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101021852A (zh) * 2006-10-10 2007-08-22 鲍东山 基于内容的视频搜索调度***
CN101360064A (zh) * 2008-09-27 2009-02-04 北京邮电大学 一种实现网络资源选择的方法和装置
CN102737063A (zh) * 2011-04-15 2012-10-17 阿里巴巴集团控股有限公司 一种日志信息的处理方法及***
US20140207801A1 (en) * 2013-01-21 2014-07-24 Salesforce.Com, Inc. Computer implemented methods and apparatus for recommending events

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101021852A (zh) * 2006-10-10 2007-08-22 鲍东山 基于内容的视频搜索调度***
CN101360064A (zh) * 2008-09-27 2009-02-04 北京邮电大学 一种实现网络资源选择的方法和装置
CN102737063A (zh) * 2011-04-15 2012-10-17 阿里巴巴集团控股有限公司 一种日志信息的处理方法及***
US20140207801A1 (en) * 2013-01-21 2014-07-24 Salesforce.Com, Inc. Computer implemented methods and apparatus for recommending events

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110020974A (zh) * 2019-03-06 2019-07-16 平安科技(深圳)有限公司 律师推荐方法、装置、介质及电子设备
CN111833197A (zh) * 2020-07-13 2020-10-27 北京逸风金科软件有限公司 一种征信协议的遥测数据处理方法和装置

Similar Documents

Publication Publication Date Title
TWI759620B (zh) 確定用戶金融違約風險的方法及裝置與電腦可讀儲存媒體及計算設備
WO2021025926A1 (en) Digital content prioritization to accelerate hyper-targeting
KR102297669B1 (ko) 제조사 및 유통사 간 연결을 위한 매칭 서비스 제공 시스템
JP5960887B1 (ja) 算出装置、算出方法及び算出プログラム
US10423675B2 (en) System and method for automated domain-extensible web scraping
CN112330412B (zh) 一种产品推荐方法、装置、计算机设备及存储介质
Kaabi et al. Overview of E-commerce technologies, data analysis capabilities and marketing knowledge
JP6560323B2 (ja) 判定装置、判定方法及び判定プログラム
CN110990486A (zh) 基于网络数据交互的区块链通证发放和存证方法及装置
CN111861760A (zh) 产品推荐方法、装置、设备及存储介质
CN110674391A (zh) 基于大数据的产品数据推送方法、***和计算机设备
CN114398553A (zh) 对象推荐方法、装置、电子设备以及存储介质
CN115630221A (zh) 终端应用界面展示数据处理方法、装置及计算机设备
Byrne The digital economy and productivity
US20170193539A1 (en) Time-value estimation method and system for sharing environment
CN108268482A (zh) 信息推送方法、装置以及设备
Azcoitia et al. Measuring the price of data in commercial data marketplaces
KR20170092516A (ko) 싸이버 빅데이터 거래시스템 및 방법
CN116091242A (zh) 推荐产品组合生成方法及装置、电子设备和存储介质
CN111460300B (zh) 网络内容推送方法、装置及存储介质
Zhang et al. Visitor Information System of Cross‐Border E‐Commerce Platform Based on Mobile Edge Computing
CN114549125A (zh) 物品推荐方法及装置、电子设备和计算机可读存储介质
CN109829091B (zh) 电子作品传播程度的测评方法、计算机存储介质、及终端
CN114066513A (zh) 一种用户分类的方法和装置
Ben-Shimon et al. Anytime algorithms for recommendation service providers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180710