CN110069687A - 目标小区房价走势图生成方法、装置、设备及存储介质 - Google Patents

目标小区房价走势图生成方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110069687A
CN110069687A CN201910202634.8A CN201910202634A CN110069687A CN 110069687 A CN110069687 A CN 110069687A CN 201910202634 A CN201910202634 A CN 201910202634A CN 110069687 A CN110069687 A CN 110069687A
Authority
CN
China
Prior art keywords
room rate
target cell
trend graph
month
cell room
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910202634.8A
Other languages
English (en)
Inventor
高月
侯斯靓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Urban Construction Technology Shenzhen Co Ltd
Original Assignee
Ping An Urban Construction Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Urban Construction Technology Shenzhen Co Ltd filed Critical Ping An Urban Construction Technology Shenzhen Co Ltd
Priority to CN201910202634.8A priority Critical patent/CN110069687A/zh
Publication of CN110069687A publication Critical patent/CN110069687A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种目标小区房价走势图生成方法、装置、设备及存储介质,该方法包括:基于爬虫技术从多个房源网站获取成交信息,所述成交信息包括小区名称、成交月份和房价;从所述成交信息中筛选目标小区房价信息;从所述目标小区房价信息中获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图,所述目标小区房价走势图为xy坐标图。本发明基于数据分析,从房源网站从房源网站爬取成交信息成交信息,并将所述成交信息按小区位置分布生成房价走势图,由此,更全面、更直观的反应小区的房价走势。

Description

目标小区房价走势图生成方法、装置、设备及存储介质
技术领域
本发明涉及数据分析技术领域,尤其涉及一种目标小区房价走势图生成方法、装置、设备及存储介质。
背景技术
目前,人们能看到的房价走势图一般都以城市、行政域为目标的走势图,未细化至小区,客户难以知晓小区房价走势。并且很多走势图都是个别企业根据单方数据绘制所得,因此并不能全面、直观地反应小区的房价走势。
发明内容
本发明提供一种目标小区房价走势图生产方法、装置、设备及存储介质,旨在全面、直观的反应小区的房价走势。
为实现上述目的,本发明提供一种目标小区房价走势图生成方法,所述方法应用于小区房价走势图生成设备,所述方法包括:
基于爬虫技术从多个房源网站获取成交信息,所述成交信息包括小区名称、成交月份和房价;
从所述成交信息中筛选目标小区房价信息;
从所述目标小区房价信息获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图,所述目标小区房价走势图为xy坐标图。
优选地,所述基于爬虫技术从多个房源网站获取成交信息的步骤包括:
通过预设的爬虫程序向目标服务器发送网页访问请求;
接收所述目标服务器返回的网页内容;
对所述网页内容进行解析,获取所述爬虫程序预设的抓取信息,所述抓取信息包括所述成交信息。
优选地,所述从所述成交信息中筛选目标小区房价信息的步骤包括:
标记所述成交信息中的小区名称关键词;
从所述成交信息中提取所述小区名称关键词与目标小区名称一致的成交信息,并保存为目标小区成交信息;
从所述目标小区成交信息中筛选目标小区房价信息。
优选地,所述从所述目标小区成交信息中筛选目标小区房价信息的步骤包括:
对所述目标小区成交信息进行筛选,去除重复记录的所述目标小区成交信息,获得去重目标小区成交信息;
判断所述去重目标小区成交信息中的房价是否在预设房价区间内;
若所述去重目标小区成交信息中的房价在预设房价区间内,则判定所述去重成交信息中的房价真实可靠,并将所述房价保存为目标小区房价信息。
优选地,所述目标小区房价走势图包括第一曲线,所述从所述目标小区房价信息中获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图的步骤包括:
从所述目标小区房价信息中分别获取n个月份的n个第一当月均价,将所述n个月份对应的月份依次设为x轴的n个坐标值,其中n为大于1的整数;
根据所述n个第一当月均价计算中间值和间隔值,将所述间隔值设为y轴的刻度间距;
基于所述中间值和所述间隔值确定所述第一曲线的n个y轴坐标值;
依次连接所述n个y轴坐标值即获得所述目标小区房价走势图的第一曲线。
优选地,所述目标小区房价走势图包括A曲线和B曲线,所述从所述目标小区房价信息中获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图的步骤包括:
从所述目标小区房价信息中分别获取m个月份的m个第二当月均价,将所述m个月份对应的月份依次设为x轴的m个坐标值,将所述m个第二当月均价设为x轴的m个坐标值,其中m为大于1的整数;
根据所述m个第二当月均价计算平均值,将y=平均值设为所述A曲线;
分别计算所述平均值与所述m个第二当月均价的m个差值,并计算所述m个差值的差值平均值,将所述差值平均值设为y轴轴间距;
在以所述差值平均值为y轴轴间距的坐标图中,依次连接所述m个y轴坐标值即获得所述目标小区房价走势图的B曲线。
优选地,所述从所述目标小区房价信息获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图的步骤之后还包括:
接收客户端发送的小区房价走势图查询指令,所述查询指令包括待查询小区名称;
根据所述待查询小区名称向所述客户端发送对应的小区房价走势图。
为实现上述目的,本发明实施例还提供一种目标小区房价走势图生成装置,所述目标小区房价走势图生成装置包括:
获取模块,用于基于爬虫技术从多个房源网站获取成交信息,所述成交信息包括小区名称、成交月份和房价;
筛选模块,用于从所述成交信息中筛选目标小区房价信息;
生成模块,用于从所述目标小区房价信息中获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图,所述目标小区房价走势图为xy坐标图。
为实现上述目的,本发明实施例还提供一种目标小区房价走势图生成设备,所述目标小区房价走势图生成设备包括处理器,存储器以及存储在所述存储器中的目标小区房价走势图生成程序,所述目标小区房价走势图生成程序被所述处理器运行时,实现如上所述的目标小区房价走势图生成方法的步骤。
相比现有技术,本发明提供一种目标小区房价走势图生成方法、装置、设备及存储介质,基于爬虫技术从多个房源网站获取成交信息,所述成交信息包括小区名称、成交月份和房价;从所述成交信息中筛选目标小区房价信息;从所述目标小区房价信息中获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图,所述目标小区房价走势图为xy坐标图。本发明基于数据分析,从房源网站爬取成交信息,并将所述成交信息按小区位置分布生成房价走势图,由此,更全面、更直观的反应小区的房价走势。
附图说明
图1是本发明各实施例涉及的目标小区房价走势图生成设备的硬件结构示意图;
图2是本发明目标小区房价走势图生成方法第一实施例的流程示意图;
图3是本发明目标小区房价走势图生成方法第二实施例的流程示意图;
图4是本发明目标小区房价走势图生成装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例主要涉及的目标小区房价走势图生成设备是指能够实现网络连接的网络连接设备,所述目标小区房价走势图生成设备可以是服务器、云平台等。参照图1,图1是本发明各实施例涉及的目标小区房价走势图生成设备的硬件结构示意图。本发明实施例中,目标小区房价走势图生成设备可以包括处理器1001(例如中央处理器CentralProcessing Unit、CPU),通信总线1002,输入端口1003,输出端口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;输入端口1003用于数据输入;输出端口1004用于数据输出,存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图1中示出的硬件结构并不构成对本发明的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
继续参照图1,图1中作为一种可读存储介质的存储器1005可以包括操作***、网络通信模块、应用程序模块以及目标小区房价走势图生成程序。在图1中,网络通信模块主要用于连接服务器,与服务器进行数据通信;而处理器1001可以调用存储器1005中存储的目标小区房价走势图生成程序,并执行本发明实施例提供的目标小区房价走势图生成方法。
本发明实施例提供了一种目标小区房价走势图生成方法。
参照图2,图2是本发明目标小区房价走势图生成方法第一实施例的流程示意图。
本实施例中,所述目标小区房价走势图生成方法应用于目标小区房价走势图生成设备,所述方法包括:
步骤S101,基于爬虫技术从多个房源网站获取成交信息,所述成交信息包括小区名称、成交月份和房价;
本实施例中,利用爬虫技术从全网的多个房源网站获取成交信息,其中所述房源网站包括链家、好房网、中原、房天下等。所述成交信息包括小区名称、小区位置、房源编号、房价、成交月份等具体成交信息。
所述基于爬虫技术从多个房源网站获取成交信息的步骤包括:
步骤a:通过预设的爬虫程序向目标服务器发送网页访问请求;
爬虫程序用于模拟浏览器发送所述网页请求,从目标服务器获取网页内容,然后提取并保存所需要的数据。所述爬虫程序可以根据设置从互联网中获取所需要的信息。
本实施例中,将所述房源网站的服务器设为目标服务器,也即将链家、好房网、中原、房天下等网站的服务器设为目标服务器,获取所述目标服务的的统一资源定位符(Uniform Resource Locator,URL),并存入所述爬虫程序的URL列表。然后再基于所述URL发送网页访问请求,所述网页请求包括所述目标服务器的URL、请求方式、待请求内容等。
步骤b:接收所述目标服务器返回的网页内容;
所述目标服务器在接收到所述网页访问请求后会返回一个响应包,所述响应包包括响应状态、响应头、响应体等。其中,所述相应状态包括成功、跳转、找不到页面、服务器错误等,所述响应头包括内容类型、内容长度、服务器信息、设置cookies等,所述响应体包括请求资源的内容,如网页HTML、图片二进制数据等。
步骤c:对所述网页内容进行解析,获取所述爬虫程序预设的抓取信息,所述抓取信息包括所述成交信息。
本实施例中,对所述网页内容进行解析,获得可识别的内容文本。若得到的所述网页内容是是超文本标记语言(HyperText Markup Language,HTML),则可以用正则表达式、网页解析库进行解析;若得到的所述网页内容是是对象简谱(JavaScript ObjectNotation,JSON),可以直接转成JOSN对象进行解析,若得到的网页内容是二进制数据,则可以直接可以保存或者进一步处理。
进一步地,将所述网页内容进行关键字提取,将小区名称、小区位置、房源编号、房价、成交月份等具体成交信息作为关键字,提取并保存对应的成交信息。
步骤S102,从所述成交信息中筛选目标小区房价信息;
本实施例中,标记所述成交信息中的小区名称关键词;也即将所述成交信息根据关键字进行区分,并标记小区名称。从所述成交信息中提取所述小区名称关键词与目标小区名称一致成交信息,并保存为的目标小区成交信息;可以理解的,所述目标小区名称为需要生成小区房价走势图的一个或多个目标小区的名称,所述目标小区可以根据需要选择。在其它实施例中,获取小区名称后,进一步获取小区位置,以便将相同小区名称的不同小区彻底区分。
进一步地,从所述目标小区成交信息中筛选目标小区房价信息。具体地,对所述目标小区成交信息进行筛选,去除重复记录的所述目标小区成交信息,获得去重目标小区成交信息;去除重复信息以保证数据的真实性和准确性,提高所述目标小区房价走势图的可信度。其次,判断所述去重目标小区成交信息中的房价是否在预设房价区间内;所述预设房价区间是根据所述爬虫程序获得的房价信息统计所得,并由本领域资深估价师进行评估后确定的。将所述房价与预设房价区间进行比较,若所述去重目标小区成交信息中的房价在预设房价区间内,则判定所述去重成交信息中的房价真实可靠,并将所述房价保存为目标小区房价信息。反之,若所述去重目标小区成交信息中的房价不在预设房价区间内,则判定所述不在所述预设房价区间内的房价为异常房价,并从所述去重目标小区成交信息中删除所述异常房间对应的信息。由此,对获取的目标小区成交信息中房价的准确性进行判断,并删除异常房价对应的信息,由此,进一步提升了所述小区房价的准确性和可信度。
步骤S103,从所述目标小区房价信息中获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图,所述目标小区房价走势图为xy坐标图。
本实施例中,所述小区房价走势图中包括的房价信息可以是单独一个小区的房价信息或者是若干个小区的房价信息。例如可以将碧桂园开发的若干个小区的房价信息生成一个目标小区房价走势图,也可以将某地区的若干个小区的房价信息生成一个目标小区房价走势图。
所述当月均价是与所述成交月份月份对应的月份均价。本实施例中,获取到所述目标小区房价信息后,则能根据成交月份分别计算对应月份的成交均价。具体地,统计所述目标小区房价信息中所有成交房源的成交月份以及房价,再按月份进行分类,获得当月多个成交房源的房价,将多个成交房源的房价的总和除以对应的成交房源数量,则获得当月均价。
本实施例中,为了生成直观反应小区房价走势图,按以下以下方法生成所述目标小区房价走势图:
所述目标小区房价走势图包括和第一曲线,所述从所述目标小区房价信息获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图的步骤包括:
步骤S103-11,从所述目标小区房价信息中分别获取n个月份的n个第一当月均价,将所述n个月份对应的月份依次设为x轴的n个坐标值,其中n为大于1的整数;例如,设n为6,若某年度某小区1-6月份的第一当月均价分别为50234元、48960元、51000元、49386元、50678元、51009元。
步骤S103-12,根据所述n个第一当月均价计算中间值和间隔值,将所述间隔值设为y轴的刻度间距;
其中,所述中间值=(最大值-最小值)/2,所述间隔值=(最大值-最小值)/n,其中,其中所述中间值和所述间隔值均取整数。所述最大值为所述n个房价中的最高价,所述最小值为所述n个房价中的最低价。将所述间隔值设为y轴的刻度间距。基于所述某小区1-6月份的第一当月均价可知,所述中间值=(51009-48960)/2=1025,所述间隔值=(51009-48960)/6=342。
步骤S103-13,基于所述中间值和所述间隔值确定所述第一曲线的n个y轴坐标值;
具体地,根据所述中间值和所述间隔值计算一个或两个中间坐标的y轴坐标值y1,其中,将所述中间坐标表示为第n/2和/或第(n+1)/2个y轴的坐标值,y1=(中间值±间隔值)/2;根据所述坐标值y1和所述间隔值计算两个次中间坐标的y轴坐标值y2,所述次中间坐标是所述中间坐标左右两边的4个坐标值,y2=(y1±间隔值);依次计算,直到获得所述n个所述y轴坐标值。
在其它实施例中,所述y1=(中间值±间隔值);所述y2=(y1±间隔值)。
例如,基于所述某小区1-6月份的第一当月均价,中间值1025以及间隔值342,生成所述某小区的房价走势图确定第一曲线的6个y轴坐标值的步骤如下:首先计算中间第3坐标值和第4坐标值,所述第3坐标值=(1025+342)/2=684,所述第4坐标值=(1025-342)/2=342;其次,根据所述第3坐标值、所述第4坐标值和所述间隔值分别计算第1坐标值、第2坐标值、第5坐标值、第6坐标值,所述第1坐标值=(第3坐标值+间隔值)=684+342=1026;所述第2坐标值=(第3坐标值-间隔值)=(684-342)=342;所述第5坐标值=(第4坐标值+间隔值)=342+342=684;所述第6坐标值=(第4坐标值-间隔值)=(342-342)=0。因此,所述6个所述y轴坐标值分别为1026、342、684、342、654、0。
步骤S103-14,依次连接所述n个y轴坐标值即获得所述目标小区房价走势图的第一曲线。从所述目标小区房价信息中获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图,所述目标小区房价走势图为xy坐标图。
根据所述间隔值设置y轴的刻度间距,依次连接所述n个y轴坐标值,即可获得所述第一曲线。由于所述n个y轴坐标值都基于所述中间值和间隔值计算所得,故所述第一曲线的编化范围较大,波动明显,能清楚地看出房价走势。
本实施中,所述目标小区房价走势图包括A曲线和B曲线,所述从所述目标小区房价信息中获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图的步骤还包括:
从所述目标小区房价信息中分别获取m个月份的m个第二当月均价,将所述m个月份对应的月份依次设为x轴的m个坐标值,将所述m个第二当月均价设为x轴的m个坐标值,其中m为大于1的整数;根据所述m个第二当月均价计算平均值,将y=平均值设为所述A曲线;所述A曲线为与x轴平行的直线。
分别计算所述平均值与所述m个第二当月均价的m个差值,并计算所述m个差值的差值平均值,将所述差值平均值设为y轴轴间距;所述y轴轴间距是指y轴坐标中相邻刻度点之间的间距。其中,所述差值=丨第二当月均价-平均值丨,可以理解地,所述差值均为正数。
在以所述差值平均值为y轴轴间距的坐标图中,依次连接所述m个y轴坐标值即获得所述目标小区房价走势图的B曲线。因此,以所述差值平均值为y轴轴间距,B曲线中各数据点之间差值较大,并且在所述第一曲线上下波动,能明显看出房价走势。
可以理解的,还可以收集相关数据,通过用上述方案生成挂牌数走势图、查询量走势图等。
本实施例通过上述方案,基于爬虫技术从多个房源网站获取成交信息,所述成交信息包括小区名称、成交月份和房价;从所述成交信息中筛选目标小区房价信息;从所述目标小区房价信息中获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图,所述目标小区房价走势图为xy坐标图。本发明基于数据分析,从房源网站爬取成交信息,并将所述成交信息按小区位置分布生成房价走势图,由此,更全面、更直观的反应小区的房价走势
如图3所示,本发明第二实施例提出一种目标小区房价走势图生成方法,基于上述图2所示的第一实施例,所述从所述目标小区房价信息中获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图的步骤之后还包括:
步骤S104,接收客户端发送的小区房价走势图查询指令,所述查询指令包括待查询小区名称;
本实施例中,所述客户端包括手机、ipad、电脑等网络设备。所述小区房价走势图生成设备接收所述客户端发送的小区房价走势图查询指令,并从所述小区房价走势图查询指令中获取待查询小区名称。
步骤S105,根据所述待查询小区名称向所述客户端发送对应的小区房价走势图。
从已生成的所述目标小区房价走势图中查找与所述待查询小区名称对应的小区房价走势图,若查找到与所述待查询小区名称对应的小区房价走势图,则向所述客户端发送对应的小区房价走势图;若未查找到与所述待查询小区名称对应的小区房价走势图,则向所述客户端发送未查询到结果的提示,并将所述客户端发送的小区名称保存,以便后续完善该小区的房价走势图。
本实施例同上述方案,接收客户端发送的小区房价走势图查询指令,所述查询指令包括待查询小区名称;根据所述待查询小区名称向所述客户端发送对应的小区房价走势图。由此,更全面、更直观的反应小区的房价走势。
此外,本实施例还提供一种目标小区房价走势图生成装置。参照图4,图4为本发明目标小区房价走势图生成装置第一实施例的功能模块示意图。
本发明提供的目标小区房价走势图生成装置是虚拟装置,存储于图1所示的目标小区房价走势图生成设备的存储器1005中,以实现所述目标小区房价走势图生成程序的所有功能:用于基于爬虫技术从多个房源网站获取成交信息,所述成交信息包括小区名称、成交月份和房价;用于从所述成交信息中筛选目标小区房价信息;用于从所述目标小区房价信息中获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图,所述目标小区房价走势图为xy坐标图。
具体地,本实施例中,所述目标小区房价走势图生成装置包括:
获取模块10,用于基于爬虫技术从多个房源网站获取成交信息,所述成交信息包括小区名称、成交月份和房价;
筛选模块20,用于从所述成交信息中筛选目标小区房价信息;
生成模块30,用于从所述目标小区房价信息中获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图,所述目标小区房价走势图为xy坐标图。
进一步地,所述获取模块还用于:
通过预设的爬虫程序向目标服务器发送网页访问请求;
接收所述目标服务器返回的网页内容;
对所述网页内容进行解析,获取所述爬虫程序预设的抓取信息,所述抓取信息包括所述成交信息。
进一步地,所述筛选模块还用于:
标记所述成交信息中的小区名称关键词;
从所述成交信息中提取所述小区名称关键词与目标小区名称一致的成交信息,并保存为目标小区成交信息;
从所述目标小区成交信息中筛选目标小区房价信息。
进一步地,所述筛选模块还用于:
对所述目标小区成交信息进行筛选,去除重复记录的所述目标小区成交信息,获得去重目标小区成交信息;
判断所述去重目标小区成交信息中的房价是否在预设房价区间内;
若所述去重目标小区成交信息中的房价在预设房价区间内,则判定所述去重成交信息中的房价真实可靠,并将所述房价保存为目标小区房价信息。
进一步地,所述生成模块还用于:
从所述目标小区房价信息中分别获取n个月份的n个第一当月均价,将所述n个月份对应的月份依次设为x轴的n个坐标值,其中n为大于1的整数;
根据所述n个第一当月均价计算中间值和间隔值,将所述间隔值设为y轴的刻度间距;
基于所述中间值和所述间隔值确定所述第一曲线的n个y轴坐标值;
依次连接所述n个y轴坐标值即获得所述目标小区房价走势图的第一曲线。
进一步地,所述生成模块还用于:
从所述目标小区房价信息中分别获取m个月份的m个第二当月均价,将所述m个月份对应的月份依次设为x轴的m个坐标值,将所述m个第二当月均价设为x轴的m个坐标值,其中m为大于1的整数;
根据所述m个第二当月均价计算平均值,将y=平均值设为所述A曲线;
分别计算所述平均值与所述m个第二当月均价的m个差值,并计算所述m个差值的差值平均值,将所述差值平均值设为y轴轴间距;
在以所述差值平均值为y轴轴间距的坐标图中,依次连接所述m个y轴坐标值即获得所述目标小区房价走势图的B曲线。
进一步地,所述生成模块还用于:
接收客户端发送的小区房价走势图查询指令,所述查询指令包括待查询小区名称;
根据所述待查询小区名称向所述客户端发送对应的小区房价走势图。
此外,本发明实施例还提供一种计算机存储介质,所述计算机存储介质上存储有目标小区房价走势图生成程序,所述目标小区房价走势图生成程序被处理器运行时实现如上所述目标小区房价走势图生成方法的步骤。
相比现有技术,本发明提出的一种目标小区房价走势图生成方法、装置、设备及存储介质,基于爬虫技术从多个房源网站获取成交信息,所述成交信息包括小区名称、成交月份和房价;从所述成交信息中筛选目标小区房价信息;从所述目标小区房价信息中获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图,所述目标小区房价走势图为xy坐标图。本发明基于数据分析,从房源网站爬取成交信息,并将所述成交信息按小区位置分布生成房价走势图,由此,更全面、更直观的反应小区的房价走势
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备执行本发明各个实施例所述的方法。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种目标小区房价走势图生成方法,其特征在于,所述方法应用于小区房价走势图生成设备,所述方法包括:
基于爬虫技术从多个房源网站获取成交信息,所述成交信息包括小区名称、成交月份和房价;
从所述成交信息中筛选目标小区房价信息;
从所述目标小区房价信息中获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图,所述目标小区房价走势图为xy坐标图。
2.根据权利要求1所述的方法,其特征在于,所述基于爬虫技术从多个房源网站获取成交信息的步骤包括:
通过预设的爬虫程序向目标服务器发送网页访问请求;
接收所述目标服务器返回的网页内容;
对所述网页内容进行解析,获取所述爬虫程序预设的抓取信息,所述抓取信息包括所述成交信息。
3.根据权利要求1所述的方法,其特征在于,所述从所述成交信息中筛选目标小区房价信息的步骤包括:
标记所述成交信息中的小区名称关键词;
从所述成交信息中提取所述小区名称关键词与目标小区名称一致的成交信息,并保存为目标小区成交信息;
从所述目标小区成交信息中筛选目标小区房价信息。
4.根据权利要求3所述的方法,其特征在于,所述从所述目标小区成交信息中筛选目标小区房价信息的步骤包括:
对所述目标小区成交信息进行筛选,去除重复记录的所述目标小区成交信息,获得去重目标小区成交信息;
判断所述去重目标小区成交信息中的房价是否在预设房价区间内;
若所述去重目标小区成交信息中的房价在预设房价区间内,则判定所述去重成交信息中的房价真实可靠,并将所述房价保存为目标小区房价信息。
5.根据权利要求1所述的方法,其特征在于,所述目标小区房价走势图包括第一曲线,所述从所述目标小区房价信息中获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图的步骤包括:
从所述目标小区房价信息中分别获取n个月份的n个第一当月均价,将所述n个月份对应的月份依次设为x轴的n个坐标值,其中n为大于1的整数;
根据所述n个第一当月均价计算中间值和间隔值,将所述间隔值设为y轴的刻度间距;
基于所述中间值和所述间隔值确定所述第一曲线的n个y轴坐标值;
依次连接所述n个y轴坐标值即获得所述目标小区房价走势图的第一曲线。
6.根据权利要求1所述的方法,其特征在于,所述目标小区房价走势图包括A曲线和B曲线,所述从所述目标小区房价信息中获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图的步骤还包括:
从所述目标小区房价信息中分别获取m个月份的m个第二当月均价,将所述m个月份对应的月份依次设为x轴的m个坐标值,将所述m个第二当月均价设为x轴的m个坐标值,其中m为大于1的整数;
根据所述m个第二当月均价计算平均值,将y=平均值设为所述A曲线;
分别计算所述平均值与所述m个第二当月均价的m个差值,并计算所述m个差值的差值平均值,将所述差值平均值设为y轴轴间距;
在以所述差值平均值为y轴轴间距的坐标图中,依次连接所述m个y轴坐标值即获得所述目标小区房价走势图的B曲线。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述从所述目标小区房价信息获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图的步骤之后还包括:
接收客户端发送的小区房价走势图查询指令,所述查询指令包括待查询小区名称;
根据所述待查询小区名称向所述客户端发送对应的小区房价走势图。
8.一种目标小区房价走势图生成装置,其特征在于,所述目标小区房价走势图生成装置包括:
获取模块,用于基于爬虫技术从多个房源网站获取成交信息,所述成交信息包括小区名称、成交月份和房价;
筛选模块,用于从所述成交信息中筛选目标小区房价信息;
生成模块,用于从所述目标小区房价信息中获取多个当月均价,并根据所述多个当月均价生成目标小区房价走势图,所述目标小区房价走势图为xy坐标图。
9.一种目标小区房价走势图生成设备,其特征在于,所述目标小区房价走势图生成设备包括处理器,存储器以及存储在所述存储器中的目标小区房价走势图生成程序,所述目标小区房价走势图生成程序被所述处理器运行时,实现如权利要求1-7中任一项所述的目标小区房价走势图生成方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有目标小区房价走势图生成程序,所述目标小区房价走势图生成程序被处理器运行时实现如权利要求1-7中任一项所述目标小区房价走势图生成方法的步骤。
CN201910202634.8A 2019-03-15 2019-03-15 目标小区房价走势图生成方法、装置、设备及存储介质 Pending CN110069687A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910202634.8A CN110069687A (zh) 2019-03-15 2019-03-15 目标小区房价走势图生成方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910202634.8A CN110069687A (zh) 2019-03-15 2019-03-15 目标小区房价走势图生成方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN110069687A true CN110069687A (zh) 2019-07-30

Family

ID=67365350

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910202634.8A Pending CN110069687A (zh) 2019-03-15 2019-03-15 目标小区房价走势图生成方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110069687A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114119062A (zh) * 2021-10-11 2022-03-01 深圳市房帮帮互联网科技有限公司 一种基于多变量的房地产自动估价方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105684030A (zh) * 2016-01-26 2016-06-15 盛玉伟 一种房产网成交价格统计方法及***
CN106157195A (zh) * 2016-07-08 2016-11-23 盛玉伟 房地产价格绘制方法及***
JP2018075220A (ja) * 2016-11-10 2018-05-17 フクダ電子株式会社 生体情報表示装置、生体情報表示制御装置、及び、生体情報処理装置
CN109299081A (zh) * 2018-08-21 2019-02-01 中国平安人寿保险股份有限公司 清洗房价数据的方法、装置、计算机设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105684030A (zh) * 2016-01-26 2016-06-15 盛玉伟 一种房产网成交价格统计方法及***
CN106157195A (zh) * 2016-07-08 2016-11-23 盛玉伟 房地产价格绘制方法及***
JP2018075220A (ja) * 2016-11-10 2018-05-17 フクダ電子株式会社 生体情報表示装置、生体情報表示制御装置、及び、生体情報処理装置
CN109299081A (zh) * 2018-08-21 2019-02-01 中国平安人寿保险股份有限公司 清洗房价数据的方法、装置、计算机设备和存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114119062A (zh) * 2021-10-11 2022-03-01 深圳市房帮帮互联网科技有限公司 一种基于多变量的房地产自动估价方法

Similar Documents

Publication Publication Date Title
US8352318B2 (en) Exclusivity in internet marketing campaigns system and method
US8682904B1 (en) System of intuitive sorting of a table based on a column containing fractions
JP6744480B2 (ja) ネットワークベースの広告データトラフィックレイテンシ削減
CN105247507A (zh) 品牌的影响力得分
US7836005B2 (en) System and method for automatic generation of user-oriented homepage
CN102411614A (zh) 图像搜索结果的显示
WO2015175324A1 (en) Active summaries in user interfaces to collaboration services
CN110070411A (zh) 房源信息展示方法、装置、设备及存储介质
CN110795305B (zh) 用于处理和管理web流量数据的***、装置和方法
US20130024394A1 (en) Server apparatus, reaction transmitting program, recording medium having computer-readable reaction transmitting program recorded thereon, terminal device, reaction counting method, and reaction counting system
US8429535B2 (en) Client utility interaction analysis
CN103577447A (zh) 一种用于确定目标页面的页面类型信息的方法和设备
CN108781223A (zh) 用于内容项选择的数据的数据分组传输优化
JP6479239B1 (ja) 情報処理装置、情報処理システム、情報処理方法、およびプログラム
CN108984070A (zh) 用于热力图成像的方法、装置、电子设备及可读介质
CN108965360A (zh) 一种推荐数据处理方法及服务器、计算机存储介质
CN110069687A (zh) 目标小区房价走势图生成方法、装置、设备及存储介质
CN108140177B (zh) 优化的数字分量
CN102810110B (zh) 获取网络文本数据的方法和***
US20220067078A1 (en) Aggregation system, Response Summary Process, and Method of Use
CN103761024A (zh) 界面显示方法、装置、终端、服务器和***
CN104239452A (zh) 资源获取方法及装置
US10339187B2 (en) System and method for conducting a search
CN113792232A (zh) 页面特征计算方法、装置、电子设备、介质及程序产品
CN101383838A (zh) 一种Web界面在线评估的方法、***和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190730

WD01 Invention patent application deemed withdrawn after publication