CN107291740A - 服务信息查询方法、装置和终端设备 - Google Patents

服务信息查询方法、装置和终端设备 Download PDF

Info

Publication number
CN107291740A
CN107291740A CN201610201348.6A CN201610201348A CN107291740A CN 107291740 A CN107291740 A CN 107291740A CN 201610201348 A CN201610201348 A CN 201610201348A CN 107291740 A CN107291740 A CN 107291740A
Authority
CN
China
Prior art keywords
information
services
address
address object
objective
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610201348.6A
Other languages
English (en)
Other versions
CN107291740B (zh
Inventor
马超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaodu Information Technology Co Ltd
Original Assignee
Beijing Xiaodu Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaodu Information Technology Co Ltd filed Critical Beijing Xiaodu Information Technology Co Ltd
Priority to CN201610201348.6A priority Critical patent/CN107291740B/zh
Publication of CN107291740A publication Critical patent/CN107291740A/zh
Application granted granted Critical
Publication of CN107291740B publication Critical patent/CN107291740B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提出一种服务信息查询方法、装置和终端设备,其中,该服务信息查询方法,包括以下步骤:分析待查询目标地点的资源分布信息,获取与所述目标地点对应的多个地址对象;根据每个地址对象的位置信息获取对应的网络信息;分析所述网络信息提取与每个地址对象对应的服务信息。本发明的服务信息查询方法,效地提高了服务信息查询的覆盖度与效率。

Description

服务信息查询方法、装置和终端设备
技术领域
本发明涉及互联网技术领域,特别涉及一种服务信息查询方法、装置和终端设备。
背景技术
近些年来,各类O2O(Online To Offline,线上到线下)类网站、软件、APP(Application)如雨后春笋般地迅速崛起。例如,团购、餐饮、出行、服务类等等涵盖各个领域的线下服务的软件层出不穷。由于O2O线下与线上高度耦合的特点,在通过软件或者网页提供O2O服务时,对提供服务的用户的地理位置信息高度依赖,使用用户大多需要先进行定位,然后才能获取到定位附近的服务信息。
然而,目前,大多是通过网页爬虫技术对PC(Personal Computer,个人计算机)端的网页以深度遍历的方式爬取需要的信息。这种方式却难以对于基于位置信息或定位信息的页面或者App抓取与位置信息相关的服务信息,并通过人工的方式通过位置信息或定位信息对应的多个URL(Uniform Resource Locator,统一资源定位符)链接入口进入相应的页面以获取各个页面中的服务信息。而随着手机端App的快速发展,APP服务覆盖的区域不断扩张,因此,目前,采用目前的服务信息的提取方式,提取效率和覆盖度均较低。
发明内容
本发明旨在至少在一定程度上解决上述技术问题。
为此,本发明的第一个目的在于提出一种服务信息查询方法,能够提高服务信息查询的覆盖度与效率。
本发明的第二个目的在于提出一种服务信息查询装置。
本发明的第三个目的在于提出一种终端设备。
为达上述目的,根据本发明第一方面实施例提出了一种服务信息查询方法,包括以下步骤:分析待查询目标地点的资源分布信息,获取与所述目标地点对应的多个地址对象;根据每个地址对象的位置信息获取对应的网络信息;分析所述网络信息提取与每个地址对象对应的服务信息。
本发明实施例的服务信息查询方法,通过分析待查询目标地点的资源分布信息,获取与待查询目标地点对应的多个地址对象,并根据每个地址对象的位置信息获取对应的网络信息,并分析网络信息以提取与每个地址对象对应的服务信息,能够根据输入的查询目标地点获取该目标地点内各个地址对象对应的服务信息,有效减少了请求次数,且不但能够对网页信息进行提取,也能够对各种类型的应用程序、O2O类软件中的信息进行抓取汇总,有效地提高了服务信息查询的覆盖度与效率。
本发明第二方面实施例提出了一种服务信息查询装置,包括:第一获取模块,用于分析待查询目标地点的资源分布信息,获取与所述目标地点对应的多个地址对象;第二获取模块,用于根据每个地址对象的位置信息获取对应的网络信息;分析模块,用于分析所述网络信息提取与每个地址对象对应的服务信息。
本发明实施例的服务信息查询装置,通过分析待查询目标地点的资源分布信息,获取与待查询目标地点对应的多个地址对象,并根据每个地址对象的位置信息获取对应的网络信息,并分析网络信息以提取与每个地址对象对应的服务信息,能够根据输入的查询目标地点获取该目标地点内各个地址对象对应的服务信息,有效减少了请求次数,且不但能够对网页信息进行提取,也能够对各种类型的应用程序、O2O类软件中的信息进行抓取汇总,有效地提高了服务信息查询的覆盖度与效率。
本发明第三方面实施例提出了一种终端设备,包括本发明任一实施例的服务信息查询装置。
本发明实施例的终端设备,通过分析待查询目标地点的资源分布信息,获取与待查询目标地点对应的多个地址对象,并根据每个地址对象的位置信息获取对应的网络信息,并分析网络信息以提取与每个地址对象对应的服务信息,能够根据输入的查询目标地点获取该目标地点内各个地址对象对应的服务信息,有效减少了请求次数,且不但能够对网页信息进行提取,也能够对各种类型的应用程序、O2O类软件中的信息进行抓取汇总,有效地提高了服务信息查询的覆盖度与效率。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明一个实施例的服务信息查询方法的流程图
图2为根据本发明另一个实施例的服务信息查询方法的流程图;
图3为根据本发明一个实施例的调整目标地点与地址对象的对应关系的示意图;
图4为根据本发明另一个实施例的服务信息查询方法的流程图;
图5为根据本发明一个实施例的服务信息查询方法的示意图;
图6为根据本发明一个实施例的服务信息查询装置的结构示意图一;
图7为根据本发明的一个实施例的服务信息查询装置的结构示意图二;
图8为根据本发明的一个实施例的服务信息查询装置的结构示意图三。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“多个”指两个或两个以上;术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
下面参考附图描述根据本发明实施例的服务信息查询方法、装置和终端设备。
为了提高服务信息的提取、查询效率及提升提取服务信息的覆盖度,本发明提出了一种服务信息查询方法,包括以下步骤:分析待查询目标地点的资源分布信息,获取与所述目标地点对应的多个地址对象;根据每个地址对象的位置信息获取对应的网络信息;分析所述网络信息提取与每个地址对象对应的服务信息。
图1为根据本发明一个实施例的服务信息查询方法的流程图。
如图1所示,根据本发明实施例的服务信息查询方法,包括:
S101,分析待查询目标地点的资源分布信息,获取与待查询目标地点对应的多个地址对象。
其中,待查询目标地点可以是国家、地区、省市或者其他行政区域,或者还可以是其他区域划分单位。地址对象可以是待查询目标地点所在区域中所包括的子区域。
待查询目标地点的资源分布信息可包括但不限于以下各项:
人口资源分布信息、商圈分布信息、行政区域分布信息等。
从而,可根据人口资源、商圈或者行政区域等分布或者聚集程度将待查询目标地点划分为多个区域,每个区域可作为一个地址对象,由此,得到与待查询目标地点对应的多个地址对象。
举例来说,如果待查询目标地点为“北京”,则根据人口资源分布信息可确定待查询目标地点“北京”对应的地址对象可为“西直门”、“中关村”“人民大学”、“魏公村”等等。
本发明的实施例中,待查询目标地点可由用户输入或选择。举例来说,可提供输入框,以供用户输入待查询目标地点;或者,提供目标地点列表,从而用户可根据需要从中选择待查询目标地点。
S102,根据每个地址对象的位置信息获取对应的网络信息。
其中,地址对象对应的网络信息可以是地址对象所在区域内提供服务的对象的网络信息。网络信息可包括但不限于页面信息、网络接口信息等。
举例来说,对于地址对象“西直门”,可根据“西直门”所在区域的位置信息确定覆盖区域内位置信息的所有或者符合预设条件的部分的商户、店铺,并获取这些商户、店铺的页面信息、网络接口信息等,即得到“西直门”对应的网络信息。
S103,分析所述网络信息提取与每个地址对象对应的服务信息。
其中,服务信息可以包括但不限于:联系方式、地理位置、优惠信息、服务时间信息等。在本发明的实施例中,服务信息可由查询用户根据需要进行选择或设定。
在本发明的一个实施例中,所述分析所述网络信息提取与每个地址对象对应的服务信息可包括:分析网页(例如web页面、html页面等)信息,和/或,网络接口信息(例如,json接口信息)提取与每个地址对象对应的服务信息。举例来说,对于网页信息,可对网页信息进行文字识别、图像识别,以获取网页内容,并从网页内容中提取出对应的服务信息。
本发明实施例的服务信息查询方法,通过分析待查询目标地点的资源分布信息,获取与待查询目标地点对应的多个地址对象,并根据每个地址对象的位置信息获取对应的网络信息,并分析网络信息以提取与每个地址对象对应的服务信息,能够根据输入的查询目标地点获取该目标地点内各个地址对象对应的服务信息,有效减少了请求次数,且不但能够对网页信息进行提取,也能够对各种类型的应用程序、O2O类软件中的信息进行抓取汇总,有效地提高了服务信息查询的覆盖度与效率。
为了进一步提高服务信息查询的覆盖度与效率,在本发明的实施例中,在分析网络信息提取与每个地址对象对应的服务信息之后,可根据地址对象对应的服务信息的相似度调整目标地点与地址对象的对应关系。从而,能够避免因目标地点内服务对象的快速发展壮大而导致服务信息提取效率低或者覆盖度低的问题。
下面结合图2-图5对本发明实施例中对调整目标地点与地址对象的对应关系进行说明。其中,在图2和图4中,以资源分布信息为人口资源分布信息为例进行说明。对于其他类型的资源分布信息与人口资源分布信息类似,不再一一进行说明。
图2为根据本发明另一个实施例的服务信息查询方法的流程图。
如图2所示,根据本发明实施例的服务信息查询方法,包括:
S201,分析待查询目标地点的人口资源分布信息,根据预设的单位区域人口密度与单位距离的对应关系,获取与所述目标地点对应的多个地址对象。
由于单位区域人口密度高的区域,即人口多的地域,服务信息的覆盖度一般都较高(视具体情况分析)。因此,在预先设定单位区域人口密度与单位距离的对应关系时,如果单位区域人口密度越大,则设定的与其对应的单位距离越小。
具体地,在本发明的一个实施例中,S201可具体包括:
S1,对于单位区域人口密度小于预设第一阈值的第一区域,采用第一单位距离获取与所述目标地点对应的多个第一地址对象;
S2,对于单位区域人口密度大于等于所述第一阈值的第二区域,采用第二单位距离获取与所述目标地点对应的多个第二地址对象,其中,所述第二单位距离小于所述第一单位距离;
S3,对于单位区域人口密度小于预设第二阈值的第三区域,停止获取地址对象,其中,所述第二阈值小于所述第一阈值。
也就是说,在人口密度较高的区域,对应的地址对象越密集;在人口密度较为稀疏区域,对应的地址对象越稀疏;如果遇到山区、湖泊等无人地段,则可进行过滤排除,即不获取地址对象。由此,可形成疏密不均的地址对象的网格状集合。
S202,根据每个地址对象的位置信息获取对应的网络信息。
其中,地址对象对应的网络信息可以是地址对象所在区域内提供服务的对象的网络信息。网络信息可包括但不限于页面信息、网络接口信息等。
举例来说,对于地址对象“西直门”,可根据“西直门”所在区域的位置信息确定覆盖区域内位置信息的所有或者符合预设条件的部分的商户、店铺,并获取这些商户、店铺的页面信息、网络接口信息等,即得到“西直门”对应的网络信息。
S203,分析所述网络信息提取与每个地址对象对应的服务信息。
其中,服务信息可以包括但不限于:联系方式、地理位置、优惠信息、服务时间信息等。在本发明的实施例中,服务信息可由查询用户根据需要进行选择或设定。
在本发明的一个实施例中,所述分析所述网络信息提取与每个地址对象对应的服务信息可包括:分析网页(例如web页面、html页面等)信息,和/或,网络接口信息(例如,json接口信息)提取与每个地址对象对应的服务信息。举例来说,对于网页信息,可对网页信息进行文字识别、图像识别,以获取网页内容,并从网页内容中提取出对应的服务信息。
进一步地,在提取出服务信息后,可进行存储,以供后续调整目标地点与地址对象的对应关系时参考。
S204,根据与相邻地址对象对应的服务信息相似度,调整与所述目标地点对应的多个地址对象。
在本发明的实施例中,可根据某个地址对象周围点的服务信息之间的相似度对地址对象的网格状集合中的网格位置进行优化,也即对地址对象的疏密进行调整。
具体地,如果与相邻地址对象对应的服务信息相似度大于预设阈值,则对所述相邻的地址对象进行合并处理;如果与相邻地址对象对应的服务信息相似度小于等于预设阈值,则在所述相邻的地址对象之间增设地址对象。
也就是说,如果相邻两个地址对象对应的服务信息相似度有很大的差异,则可以认为这两个地址对象的服务信息变动较大,那么如果在来年刚刚地址对象之间增加新的地址对象,则有可能增加服务信息的召回数量。
举例来说,如图3所示,地址对象B点对应服务信息为信息1、2、3,地址对象C点对应的服务信息为信息4、5。地址对象B和C对应的服务信息之间没有任何交集,存在很大差异,则可在下提取服务信息时,在地址对象B和C两点之间增加一个新的地址对象E,从而提高提取服务信息的覆盖程度。
如果相邻两个地址对象对应的服务信息相似度很相似,或者有完全包含关系,则可以认为这两个地址对象的服务信息的提取效率是较低的,增大两个地址对象之间距离并不会影响服务信息的查询,因此,可以对两个地址对象进行删除、合并、汇聚。
举例来说,如图3所示,地址对象A和B对应的服务信息完全相同,那么在下次查询服务信息时,可以不需要抓取两次,因此,可将地址对象A和B两点汇聚成一点D,从而提升服务信息查询的效率。
由此,可根据某个地址对象周围点的服务信息之间的相似度,动态调整目标地点与地址对象之间的对应关系,从而在下次查询服务信息时,能够进一步提升服务信息查询的效率或覆盖度。
图4为根据本发明另一个实施例的服务信息查询方法的流程图。
如图4所示,根据本发明实施例的服务信息查询方法,包括:
S401,分析待查询目标地点的人口资源分布信息,根据预设的单位区域人口密度与单位距离的对应关系,获取与所述目标地点对应的多个地址对象。
由于单位区域人口密度高的区域,即人口多的地域,服务信息的覆盖度一般都较高(视具体情况分析)。因此,在预先设定单位区域人口密度与单位距离的对应关系时,如果单位区域人口密度越大,则设定的与其对应的单位距离越小。
具体地,在本发明的一个实施例中,S201可具体包括:
S1,对于单位区域人口密度小于预设第一阈值的第一区域,采用第一单位距离获取与所述目标地点对应的多个第一地址对象;
S2,对于单位区域人口密度大于等于所述第一阈值的第二区域,采用第二单位距离获取与所述目标地点对应的多个第二地址对象,其中,所述第二单位距离小于所述第一单位距离;
S3,对于单位区域人口密度小于预设第二阈值的第三区域,停止获取地址对象,其中,所述第二阈值小于所述第一阈值。
也就是说,在人口密度较高的区域,对应的地址对象越密集;在人口密度较为稀疏区域,对应的地址对象越稀疏;如果遇到山区、湖泊等无人地段,则可进行过滤排除,即不获取地址对象。由此,可形成疏密不均的网格状地址对象点集合。
S402,根据每个地址对象的位置信息获取对应的网络信息。
其中,地址对象对应的网络信息可以是地址对象所在区域内提供服务的对象的网络信息。网络信息可包括但不限于页面信息、网络接口信息等。
举例来说,对于地址对象“西直门”,可根据“西直门”所在区域的位置信息确定覆盖区域内位置信息的所有或者符合预设条件的部分的商户、店铺,并获取这些商户、店铺的页面信息、网络接口信息等,即得到“西直门”对应的网络信息。
S403,分析所述网络信息提取与每个地址对象对应的服务信息。
其中,服务信息可以包括但不限于:联系方式、地理位置、优惠信息、服务时间信息等。在本发明的实施例中,服务信息可由查询用户根据需要进行选择或设定。
在本发明的一个实施例中,所述分析所述网络信息提取与每个地址对象对应的服务信息可包括:分析网页(例如web页面、html页面等)信息,和/或,网络接口信息(例如,json接口信息)提取与每个地址对象对应的服务信息。举例来说,对于网页信息,可对网页信息进行文字识别、图像识别,以获取网页内容,并从网页内容中提取出对应的服务信息。
S404,根据与每个地址对象对应的服务信息热度变化情况,调整与所述目标地点对应的多个地址对象。
在本发明的实施例中,可根据每个地址对象对应的服务信息的热度变化对地址对象的网格状集合中的网格密度进行优化,也即对地址对象的疏密进行调整。
具体地,如果与地址对象对应的服务信息热度提升、且高于预设的第一指标,则在所述地址对象的相邻区域增设地址对象;如果与地址对象对应的服务信息热度降低、且低于预设的第二指标,则删除所述地址对象,其中,所述第二指标小于所述第一指标。
也就是说,可根据每次查询到的地址对象的服务信息量的多少评估地址对象的服务信息热度。并根据附近地域及历史的服务信息热度变化评估。对于服务信息热度升高的地域,可增加地址对象的设置量,即增加地址对象的密度;对于没有服务信息召回(即未查询到对应的服务信息)或热度下降的地域,则可逐渐减少地址对象的设置量,即降低地址对象的密度,直至达到预设的地址对象设置量的下限。
举例来说,如只抽取城市周边,使得地址对象的网格状集合密度变稀疏。由此,使得总体的查询服务信息逐步变得优化,既不会在没有服务信息或服务信息量较少的地域浪费多余的查询流量,且对于一些业务新开放的地域能够迅速感知,并动态提升服务信息抓取密度。
图5为根据本发明一个实施例的服务信息查询方法的示意图。
如图5所示,在获取地址对象对应的服务信息之后,可通过对地址对象对应的服务信息相似度进行热度分析,以对地址对象的网格分布进行优化。其中,热度分析包括对相邻两个地址对象的服务信息相似度进行分析,以对地址对象的网格位置进行优化;热度分析还可包括对一个地址对象的服务信息的热度变化情况进行分析,以对地址对象的网格密度进行优化。
然后根据优化后的地址对象分布进行位置信息戳取,即根据每个地址对象的位置信息获取对应的网络信息,并进行信息解析存储,即分析网络信息以提取与每个地址对象对应的服务信息。
进而,可根据新查询的服务信息再次优化地址对象的网格分布,由此,不断动态优化,能够有效地提升了服务信息查询的覆盖度与效率。
需要说明的是,在首次查询服务信息时,由于并不清楚待查询目标地点的覆盖程度及密度,因此,可根据经验或者预设规则设置目标地点对应的多个地址对象,并进行后续服务信息提取的过程。
与上述服务信息查询方法实施例相对应,本发明还提出一种服务信息查询装置。
一种服务信息查询装置,包括:第一获取模块,用于分析待查询目标地点的资源分布信息,获取与所述目标地点对应的多个地址对象;第二获取模块,用于根据每个地址对象的位置信息获取对应的网络信息;分析模块,用于分析所述网络信息提取与每个地址对象对应的服务信息。
图6为根据本发明一个实施例的服务信息查询装置的结构示意图一。
如图6所示,根据本发明实施例的服务信息查询装置,包括:第一获取模块10、第二获取模块20和分析模块30。
具体地,第一获取模块10用于分析待查询目标地点的资源分布信息,获取与所述目标地点对应的多个地址对象。
其中,待查询目标地点可以是国家、地区、省市或者其他行政区域,或者还可以是其他区域划分单位。地址对象可以是待查询目标地点所在区域中所包括的子区域。
待查询目标地点的资源分布信息可包括但不限于以下各项:
人口资源分布信息、商圈分布信息、行政区域分布信息等。
从而,第一获取模块10可根据人口资源、商圈或者行政区域等分布或者聚集程度将待查询目标地点划分为多个区域,每个区域可作为一个地址对象,由此,得到与待查询目标地点对应的多个地址对象。
举例来说,如果待查询目标地点为“北京”,则根据人口资源分布信息可确定待查询目标地点“北京”对应的地址对象可为“西直门”、“中关村”“人民大学”、“魏公村”等等。
本发明的实施例中,待查询目标地点可由用户输入或选择。举例来说,可提供输入框,以供用户输入待查询目标地点;或者,提供目标地点列表,从而用户可根据需要从中选择待查询目标地点。
以资源分布信息为人口资源分布信息为例,第一获取模块10可用于分析待查询目标地点的人口资源分布信息,根据预设的单位区域人口密度与单位距离的对应关系,获取与所述目标地点对应的多个地址对象。
在本发明的一个实施例中,第一获取模块10可具体用于:
S1,对于单位区域人口密度小于预设第一阈值的第一区域,采用第一单位距离获取与所述目标地点对应的多个第一地址对象;
S2,对于单位区域人口密度大于等于所述第一阈值的第二区域,采用第二单位距离获取与所述目标地点对应的多个第二地址对象,其中,所述第二单位距离小于所述第一单位距离;
S3,对于单位区域人口密度小于预设第二阈值的第三区域,停止获取地址对象,其中,所述第二阈值小于所述第一阈值。
也就是说,在人口密度较高的区域,对应的地址对象越密集;在人口密度较为稀疏区域,对应的地址对象越稀疏;如果遇到山区、湖泊等无人地段,则可进行过滤排除,即不获取地址对象。由此,可形成疏密不均的地址对象的网格状集合。
第二获取模块20用于根据每个地址对象的位置信息获取对应的网络信息。
其中,地址对象对应的网络信息可以是地址对象所在区域内提供服务的对象的网络信息。网络信息可包括但不限于页面信息、网络接口信息等。
举例来说,对于地址对象“西直门”,可根据“西直门”所在区域的位置信息确定覆盖区域内位置信息的所有或者符合预设条件的部分的商户、店铺,并获取这些商户、店铺的页面信息、网络接口信息等,即得到“西直门”对应的网络信息。
分析模块30用于分析所述网络信息提取与每个地址对象对应的服务信息。
其中,服务信息可以包括但不限于:联系方式、地理位置、优惠信息、服务时间信息等。在本发明的实施例中,服务信息可由查询用户根据需要进行选择或设定。
在本发明的一个实施例中,分析模块30可用于:分析网页(例如web页面、html页面等)信息,和/或,网络接口信息(例如,json接口信息)提取与每个地址对象对应的服务信息。举例来说,对于网页信息,可对网页信息进行文字识别、图像识别,以获取网页内容,并从网页内容中提取出对应的服务信息。
本发明实施例的服务信息查询装置,通过分析待查询目标地点的资源分布信息,获取与待查询目标地点对应的多个地址对象,并根据每个地址对象的位置信息获取对应的网络信息,并分析网络信息以提取与每个地址对象对应的服务信息,能够根据输入的查询目标地点获取该目标地点内各个地址对象对应的服务信息,有效减少了请求次数,且不但能够对网页信息进行提取,也能够对各种类型的应用程序、O2O类软件中的信息进行抓取汇总,有效地提高了服务信息查询的覆盖度与效率。
图7为根据本发明的一个实施例的服务信息查询装置的结构示意图二。
如图7所示,在图6所示的基础上,还可包括第一调整模块40。
第一调整模块40用于在所述分析所述网络信息提取与每个地址对象对应的服务信息之后,根据与相邻地址对象对应的服务信息相似度,调整与所述目标地点对应的多个地址对象。
在本发明的实施例中,第一调整模块40可根据某个地址对象周围点的服务信息之间的相似度对地址对象的网格状集合中的网格位置进行优化,也即对地址对象的疏密进行调整。
进一步地,第一调整模块40可具体用于:如果与相邻地址对象对应的服务信息相似度大于预设阈值,则对所述相邻的地址对象进行合并处理;如果与相邻地址对象对应的服务信息相似度小于等于预设阈值,则在所述相邻的地址对象之间增设地址对象。
也就是说,如果相邻两个地址对象对应的服务信息相似度有很大的差异,则可以认为这两个地址对象的服务信息变动较大,那么如果在来年刚刚地址对象之间增加新的地址对象,则有可能增加服务信息的召回数量。
举例来说,如图3所示,地址对象B点对应服务信息为信息1、2、3,地址对象C点对应的服务信息为信息4、5。地址对象B和C对应的服务信息之间没有任何交集,存在很大差异,则可在下提取服务信息时,在地址对象B和C两点之间增加一个新的地址对象E,从而提高提取服务信息的覆盖程度。
如果相邻两个地址对象对应的服务信息相似度很相似,或者有完全包含关系,则可以认为这两个地址对象的服务信息的提取效率是较低的,增大两个地址对象之间距离并不会影响服务信息的查询,因此,第一调整模块40可以对两个地址对象进行删除、合并、汇聚。
举例来说,如图3所示,地址对象A和B对应的服务信息完全相同,那么在下次查询服务信息时,可以不需要抓取两次,因此,第一调整模块40可将地址对象A和B两点汇聚成一点D,从而提升服务信息查询的效率。
由此,可根据某个地址对象周围点的服务信息之间的相似度,动态调整目标地点与地址对象之间的对应关系,从而在下次查询服务信息时,能够进一步提升服务信息查询的效率或覆盖度。
图8为根据本发明的一个实施例的服务信息查询装置的结构示意图三。
如图8所示,在图6所示的基础上,还可包括第二调整模块50。
第二调整模块50用于在所述分析所述网络信息提取与每个地址对象对应的服务信息之后,根据与每个地址对象对应的服务信息热度变化情况,调整与所述目标地点对应的多个地址对象。
在本发明的实施例中,第二调整模块50可根据每个地址对象对应的服务信息的热度变化对地址对象的网格状集合中的网格密度进行优化,也即对地址对象的疏密进行调整。
进一步地,第二调整模块50可用于:如果与地址对象对应的服务信息热度提升、且高于预设的第一指标,则在所述地址对象的相邻区域增设地址对象;如果与地址对象对应的服务信息热度降低、且低于预设的第二指标,则删除所述地址对象,其中,所述第二指标小于所述第一指标。
也就是说,第二调整模块50可根据每次查询到的地址对象的服务信息量的多少评估地址对象的服务信息热度。并根据附近地域及历史的服务信息热度变化评估。对于服务信息热度升高的地域,第二调整模块50可增加地址对象的设置量,即增加地址对象的密度;对于没有服务信息召回(即未查询到对应的服务信息)或热度下降的地域,则第二调整模块50可逐渐减少地址对象的设置量,即降低地址对象的密度,直至达到预设的地址对象设置量的下限。
举例来说,如只抽取城市周边,使得地址对象的网格状集合密度变稀疏。由此,使得总体的查询服务信息逐步变得优化,既不会在没有服务信息或服务信息量较少的地域浪费多余的查询流量,且对于一些业务新开放的地域能够迅速感知,并动态提升服务信息抓取密度。
本发明还提出一种终端设备。
根据本发明实施例的终端设备,包括本发明任一实施例的服务信息查询装置。
本发明实施例的终端设备,通过分析待查询目标地点的资源分布信息,获取与待查询目标地点对应的多个地址对象,并根据每个地址对象的位置信息获取对应的网络信息,并分析网络信息以提取与每个地址对象对应的服务信息,能够根据输入的查询目标地点获取该目标地点内各个地址对象对应的服务信息,有效减少了请求次数,且不但能够对网页信息进行提取,也能够对各种类型的应用程序、O2O类软件中的信息进行抓取汇总,有效地提高了服务信息查询的覆盖度与效率。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (17)

1.一种服务信息查询方法,其特征在于,包括以下步骤:
分析待查询目标地点的资源分布信息,获取与所述目标地点对应的多个地址对象;
根据每个地址对象的位置信息获取对应的网络信息;
分析所述网络信息提取与每个地址对象对应的服务信息。
2.如权利要求1所述的方法,其特征在于,所述分析待查询目标地点的资源分布信息,获取与所述目标地点对应的多个地址对象,包括:
分析待查询目标地点的人口资源分布信息,根据预设的单位区域人口密度与单位距离的对应关系,获取与所述目标地点对应的多个地址对象。
3.如权利要求2所述的方法,其特征在于,所述根据预设的单位区域人口密度与单位距离的对应关系,获取与所述目标地点对应的多个地址对象,包括:
对于单位区域人口密度小于预设第一阈值的第一区域,采用第一单位距离获取与所述目标地点对应的多个第一地址对象;
对于单位区域人口密度大于等于所述第一阈值的第二区域,采用第二单位距离获取与所述目标地点对应的多个第二地址对象,其中,所述第二单位距离小于所述第一单位距离;
对于单位区域人口密度小于预设第二阈值的第三区域,停止获取地址对象,其中,所述第二阈值小于所述第一阈值。
4.如权利要求1所述的方法,其特征在于,在所述分析所述网络信息提取与每个地址对象对应的服务信息之后,还包括:
根据与相邻地址对象对应的服务信息相似度,调整与所述目标地点对应的多个地址对象。
5.如权利要求4所述的方法,其特征在于,所述根据与相邻地址对象对应的服务信息相似度,调整与所述目标地点对应的多个地址对象,包括:
如果与相邻地址对象对应的服务信息相似度大于预设阈值,则对所述相邻的地址对象进行合并处理;
如果与相邻地址对象对应的服务信息相似度小于等于预设阈值,则在所述相邻的地址对象之间增设地址对象。
6.如权利要求1所述的方法,其特征在于,在所述分析所述网络信息提取与每个地址对象对应的服务信息之后,还包括:
根据与每个地址对象对应的服务信息热度变化情况,调整与所述目标地点对应的多个地址对象。
7.如权利要求6所述的方法,其特征在于,所述根据与每个地址对象对应的服务信息热度变化情况,调整与所述目标地点对应的多个地址对象,包括:
如果与地址对象对应的服务信息热度提升、且高于预设的第一指标,则在所述地址对象的相邻区域增设地址对象;
如果与地址对象对应的服务信息热度降低、且低于预设的第二指标,则删除所述地址对象,其中,所述第二指标小于所述第一指标。
8.如权利要求1-7任一所述的方法,其特征在于,所述分析所述网络信息提取与每个地址对象对应的服务信息,包括:
分析网页信息,和/或,网络接口信息提取与每个地址对象对应的服务信息。
9.一种服务信息查询装置,其特征在于,包括:
第一获取模块,用于分析待查询目标地点的资源分布信息,获取与所述目标地点对应的多个地址对象;
第二获取模块,用于根据每个地址对象的位置信息获取对应的网络信息;
分析模块,用于分析所述网络信息提取与每个地址对象对应的服务信息。
10.如权利要求9所述的装置,其特征在于,所述第一获取模块用于:
分析待查询目标地点的人口资源分布信息,根据预设的单位区域人口密度与单位距离的对应关系,获取与所述目标地点对应的多个地址对象。
11.如权利要求10所述的装置,其特征在于,所述第一获取模块具体用于:
对于单位区域人口密度小于预设第一阈值的第一区域,采用第一单位距离获取与所述目标地点对应的多个第一地址对象;
对于单位区域人口密度大于等于所述第一阈值的第二区域,采用第二单位距离获取与所述目标地点对应的多个第二地址对象,其中,所述第二单位距离小于所述第一单位距离;
对于单位区域人口密度小于预设第二阈值的第三区域,停止获取地址对象,其中,所述第二阈值小于所述第一阈值。
12.如权利要求9所述的装置,其特征在于,还包括:
第一调整模块,用于在所述分析所述网络信息提取与每个地址对象对应的服务信息之后,根据与相邻地址对象对应的服务信息相似度,调整与所述目标地点对应的多个地址对象。
13.如权利要求12所述的装置,其特征在于,所述第一调整模块用于:
如果与相邻地址对象对应的服务信息相似度大于预设阈值,则对所述相邻的地址对象进行合并处理;
如果与相邻地址对象对应的服务信息相似度小于等于预设阈值,则在所述相邻的地址对象之间增设地址对象。
14.如权利要求8所述的装置,其特征在于,还包括:
第二调整模块,用于在所述分析所述网络信息提取与每个地址对象对应的服务信息之后,根据与每个地址对象对应的服务信息热度变化情况,调整与所述目标地点对应的多个地址对象。
15.如权利要求14所述的装置,其特征在于,所述第二调整模块用于:
如果与地址对象对应的服务信息热度提升、且高于预设的第一指标,则在所述地址对象的相邻区域增设地址对象;
如果与地址对象对应的服务信息热度降低、且低于预设的第二指标,则删除所述地址对象,其中,所述第二指标小于所述第一指标。
16.如权利要求9-15任一所述的装置,其特征在于,所述分析模块用于:
分析网页信息,和/或,网络接口信息提取与每个地址对象对应的服务信息。
17.一种终端设备,其特征在于,包括如权利要求9-16任一项所述的服务信息查询装置。
CN201610201348.6A 2016-03-31 2016-03-31 服务信息查询方法、装置和终端设备 Active CN107291740B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610201348.6A CN107291740B (zh) 2016-03-31 2016-03-31 服务信息查询方法、装置和终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610201348.6A CN107291740B (zh) 2016-03-31 2016-03-31 服务信息查询方法、装置和终端设备

Publications (2)

Publication Number Publication Date
CN107291740A true CN107291740A (zh) 2017-10-24
CN107291740B CN107291740B (zh) 2021-07-09

Family

ID=60087841

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610201348.6A Active CN107291740B (zh) 2016-03-31 2016-03-31 服务信息查询方法、装置和终端设备

Country Status (1)

Country Link
CN (1) CN107291740B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101689201A (zh) * 2007-06-29 2010-03-31 微软公司 联合搜索
CN102737047A (zh) * 2011-04-01 2012-10-17 北京千橡网景科技发展有限公司 内容显示方法和内容显示设备
CN103457975A (zh) * 2012-06-01 2013-12-18 腾讯科技(深圳)有限公司 获取地图兴趣点评价数据的方法和装置
US20140358414A1 (en) * 2013-06-01 2014-12-04 Faroog Ibrahim System and method for creating, storing, and updating local dynamic MAP database with safety attribute
CN104598504A (zh) * 2014-05-15 2015-05-06 腾讯科技(深圳)有限公司 电子地图的信息显示控制方法和装置
US20150242420A1 (en) * 2014-02-21 2015-08-27 Quixey, Inc. Location-Based Searching

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101689201A (zh) * 2007-06-29 2010-03-31 微软公司 联合搜索
CN102737047A (zh) * 2011-04-01 2012-10-17 北京千橡网景科技发展有限公司 内容显示方法和内容显示设备
CN103457975A (zh) * 2012-06-01 2013-12-18 腾讯科技(深圳)有限公司 获取地图兴趣点评价数据的方法和装置
US20140358414A1 (en) * 2013-06-01 2014-12-04 Faroog Ibrahim System and method for creating, storing, and updating local dynamic MAP database with safety attribute
US20150242420A1 (en) * 2014-02-21 2015-08-27 Quixey, Inc. Location-Based Searching
CN104598504A (zh) * 2014-05-15 2015-05-06 腾讯科技(深圳)有限公司 电子地图的信息显示控制方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
穷游锦囊手把手系列: "Agoda酒店预订穷游锦囊", 《HTTP://GUIDE.QYER.COM/AGODA/》 *

Also Published As

Publication number Publication date
CN107291740B (zh) 2021-07-09

Similar Documents

Publication Publication Date Title
US20190007440A1 (en) Dark web monitoring, analysis and alert system and method
Saikia et al. Land-use/land-cover change and fragmentation in the Nameri Tiger Reserve, India
Ito Digital China: a fourth industrial revolution with Chinese characteristics?
US20130041962A1 (en) Information Filtering
de La Torre et al. Using elephant movements to assess landscape connectivity under Peninsular Malaysia's central forest spine land use policy
CN109657063A (zh) 一种海量环保人工上报事件数据的处理方法及存储介质
Johansen et al. Special Feature–Geographic object-based image analysis
CN107613043A (zh) Ip地址的地域信息搜索方法及其装置
Rodríguez‐Pérez et al. Spatial networks of fleshy‐fruited trees drive the flow of avian seed dispersal through a landscape
CN108074140A (zh) 智能问卷***及数据采集方法
CN104298782A (zh) 互联网用户主动访问行为轨迹的分析方法
CN112801132A (zh) 一种图像处理方法和装置
KR102137961B1 (ko) 개인정보보호를 위한 실시간 즉석만남 서비스 제공 시스템
Wang et al. Monitoring vegetation dynamics in East Rennell Island World Heritage Site using multi-sensor and multi-temporal remote sensing data
CN105631016A (zh) 一种向导式的检索方法和***
CN107330577A (zh) 一种基于大数据的公司评价***和方法
CN107193870A (zh) 网页内容的提取方法和***
Molina et al. Defining and measuring transnational fields
Wilson et al. A path toward the use of trail users’ tweets to assess effectiveness of the environmental stewardship scheme: an exploratory analysis of the Pennine Way National Trail
CN109271145A (zh) 基于pythonQT及智能算法的快速规则定制方法
CN107291740A (zh) 服务信息查询方法、装置和终端设备
CN112906382A (zh) 基于图神经网络的政策文本多标签标注方法及***
CN112347976A (zh) 遥感卫星影像的区域提取方法、装置、电子设备和介质
Wamba et al. A bibliometric analysis and research agenda on smart cities
Evans et al. Big data fusion model for heterogeneous financial market data (findf)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room 202, 2 / F, 1-3 / F, No. 11, Shangdi Information Road, Haidian District, Beijing 100084

Applicant after: Beijing Xingxuan Technology Co.,Ltd.

Address before: 100085, No. 11, information road, Haidian District, Beijing

Applicant before: Beijing Xiaodu Information Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant