CN109213911B - 一种网络数据采集*** - Google Patents

一种网络数据采集*** Download PDF

Info

Publication number
CN109213911B
CN109213911B CN201810858457.4A CN201810858457A CN109213911B CN 109213911 B CN109213911 B CN 109213911B CN 201810858457 A CN201810858457 A CN 201810858457A CN 109213911 B CN109213911 B CN 109213911B
Authority
CN
China
Prior art keywords
software
mobile terminal
ikj
rectangular area
kth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810858457.4A
Other languages
English (en)
Other versions
CN109213911A (zh
Inventor
孙凌峰
魏荣
陈大山
孙明慧
蔡志毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Nuoxin Connection Technology Co ltd
Original Assignee
Shenzhen Nuoxin Connection Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Nuoxin Connection Technology Co ltd filed Critical Shenzhen Nuoxin Connection Technology Co ltd
Priority to CN201810858457.4A priority Critical patent/CN109213911B/zh
Publication of CN109213911A publication Critical patent/CN109213911A/zh
Application granted granted Critical
Publication of CN109213911B publication Critical patent/CN109213911B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开一种网络数据采集***,包括区域划分模块、网络数据获取模块、数据存储模块、云服务器和显示终端,云服务器分别与区域划分模块、网络数据获取模块、数据存储模块和显示终端连接,网络数据获取模块与数据存储模块连接。本发明提供的网络数据采集***,通过采用网络技术获取移动终端和非移动终端内的软件名称、各软件运行时长和各软件登录次数进行分析和统计,进而统计各区域内各软件推广使用系数以及同一软件在检测区域内的总推广使用系数,提高了网络数据的采集与分析效率,为管理人员提供参考,同时,便于管理人员了解各软件的推广使用效果,进而便于管理人员将需投放的广告发布至推广使用系数高的软件,提高了推广广告的收益。

Description

一种网络数据采集***
技术领域
本发明属于数据采集技术领域,涉及到一种网络数据采集***。
背景技术
“网络数据采集”是指利用互联网搜索引擎技术实现有针对性、行业性、精准性的数据抓取,并按照一定规则和筛选标准进行数据归类,并形成数据库文件的一个过程。
现有网络数据在采集的过程中,存在采集效率低,以及无法对采集的网络数据进行快速有效地分析,例如现有的软件种类较多,用户可在手机、平板、电脑上进行软件的下载和使用,但是无法对各软件的使用状况进行准确的采集与分析,特别针对需要投放广告的客户,为了提高投放广告的客户的最大利益化,需对各软件的使用进行有效地评估,现设计一种网络数据采集***。
发明内容
本发明的目的在于提供的一种网络数据采集***,解决了现有网络数据在采集软件使用的过程中,存在采集效率低以及无法对软件的使用状况进行有效地评估的问题。
本发明的目的可以通过以下技术方案实现:
一种网络数据采集***,包括区域划分模块、网络数据获取模块、数据存储模块、云服务器和显示终端,云服务器分别与区域划分模块、网络数据获取模块、数据存储模块和显示终端连接,网络数据获取模块与数据存储模块连接;
区域划分模块用于对需采集的区域进行划分,划分成若干面积相等的矩形区域,将各矩形区域按照设定的顺序进行编号,依次为1,2,...,i,...,n;
网络数据获取模块用于对各矩形区域内的移动终端数量和非移动终端数量进行统计,构成移动终端数量集合和非移动终端数量集合,其中移动终端为手机,所述移动终端数量集合为A(a1,a2,...,ai,...,an),ai表示为第i个矩形区域内移动终端的数量,非移动终端为ipad、电脑等,所述非移动终端数量集合为B(b1,b2,...,bi,...,bn),bi表示为第i个矩形区域内非移动终端的数量,网络数据获取模块对移动终端数量集合和非移动终端数量集合中各终端中的软件名称、各软件运行时间和登录次数进行获取,并将获取的移动终端和非移动终端中的软件名称、各终端中软件运行时间和登录次数分别发送至云服务器和数据存储模块;
数据存储模块用于接收网络数据获取模块发送的各矩形区域内各移动终端和非移动终端发送的软件名称、各软件运行时间和登录次数,且数据存储模块中存储不同软件类型对应的软件名称以及软件名称的关键字;
云服务器接收网络数据获取模块发送的各矩形区域内各移动终端和非移动终端发送的软件名称、各软件运行时间和登录次数,且各矩形区域内各移动终端和非移动终端分别进行编号,依次为1,2....,k,...,x和1,2....,k,...,y,并对所有软件名称按照设定的顺序进行编号,分别为1,2,...,j,...,m,各矩形区域内各移动终端的软件名称分别与数据存储模块中所有软件名称进行逐一对比,得到移动终端软件对比集合为Cik(cik1,cik2,...,cikj,...,cikm),cikj表示为第i矩形区域内第k个移动终端中各软件名称与数据存储模块中存储的第j个软件名称的对比值,若第i矩形区域内第k个移动终端中各软件名称与第j个软件名称相匹配,则取cikj=1;将各矩形区域内各非移动终端的软件名称分别与数据存储模块中所有软件进行逐一对比,得到非移动终端软件对比集合Dik(dik1,dik2,...,dikj,...,dikm),dikj表示为第i矩形区域内第k个非移动终端中各软件名称与数据存储模块中存储的第j个软件名称的对比值,若第i矩形区域内第k个非移动终端中各软件名称与第j个软件名称相匹配,则取dikj=1;
云服务器对各移动终端和非移动终端内的各软件的运行时间进行统计,并划分成若干时间段,统计各时间段内各软件的运行累计时间,得到移动终端软件运行时间集合和非移动终端软件运行时间集合,其中,移动终端软件运行时间集合Eikj(eikj1,eikj2,...,eikjf,...,eikjv),非移动终端软件运行时间集合Fikj(fikj1,fikj2,...,fikjf,...,fikjv),Eikj表示为第i矩形区域内第k个移动终端中第j个软件在各时间段内的累计时长,eikjf表示为第i矩形区域内第k个移动终端中第j个软件在第f个时间段内运行的累计时长,Fikj表示为第i矩形区域内第k个非移动终端中第j个软件在各时间段内的累计时长,fikjf表示为第i矩形区域内第k个非移动终端中第j个软件在第f个时间段内运行的累计时长;
云服务器将各软件在各时间段内的运行累计时间与设定的若干标准运行时长范围进行逐一对比,得到移动终端软件运行对比集合和非移动终端软件运行对比集合,所述标准运行时长范围分别为0-2h、2-4h、4-6h、...、(2s-2)-2sh,且不同的标准运行时长对应不同的运行时长等级,标准运行时长范围对应的运行时长等级分别为1、2、3、...、s,不同运行时间等级对应不同运行权重比值,分别为g1、g2、g3…gs,g1<g2<g3<…<gs,且g1+g2+g3+…+gs=1;
将移动终端软件运行时间集合Eikj中各时间段累计时长与若干标准运行时长范围进行一一对比,得到移动终端运行等级集合E″ikj(e″ikj1,e″ikj2,...,e″ikjf,...,e″ikjv),e″ikjf表示为第i矩形区域内第k个非移动终端中第j个软件在第f个时间段内运行时间等级,将非移动终端软件运行时间集合Fikj中各时间段累计时长与若干标准运行时长范围进行一一对比,得到非移动终端运行等级集合F″ikj(f″ikj1,f″ikj2,...,f″ikjf,...,f″ikjv),f″ikjf表示为第i矩形区域内第k个非移动终端中第j个软件在第f个时间段内运行时间等级,同时,云服务器根据移动终端运行等级集合和非移动终端运行等级集合中运行时间等级与对应的运行时间等级进行逐一对比,得到移动终端运行时间等级对应的权重和非移动终端运行时间等级对应的权重,所述移动终端运行时间等级对应的权重分别为ge″ikj1,ge″ikj2,...,ge″ikjf,...,ge″ikjv,所述非移动终端运行时间等级对应的权重分别为gf″ikj1,gf″ikj2,...,gf″ikjf,...,gf″ikjv;
云服务器接收网络数据获取模块发送的各矩形区域内各移动终端累计等级各软件的次数,分别构成移动终端软件登录次数集合和非移动终端软件登录次数集合,移动终端软件登录次数集合Hik(hik1,hik2,...,hikj,...,hikm),非移动终端软件登录次数集合Rik(rik1,rik2,...,rikj,...,rikm),hikj表示为第i矩形区域内第k个移动终端中第j个软件登录的总次数,rikj表示为第i矩形区域内第k个非移动终端中第j个软件登录的总次数。
云服务器通过对移动终端和非移动终端内的软件名称、各软件运行时长和各软件登录次数统计各区域内各软件推广使用系数,根据各区域内各软件的推广使用系数了解各区域内软件使用的状况,并统计同一软件在各矩形区域内的总推广使用系数,云服务器将各区域内各软件推广使用系数和总推广使用系数发送至显示终端;
显示终端用于接收云服务器发送的各区域内各软件推广使用系数以及该软件的总推广使用系数并进行显示。
进一步地,所述软件类型包括游戏软件类型、交流软件类型、购物软件类型、音乐软件类型,其中游戏软件类型包括消消乐、穿越火线、植物大战僵尸;交流软件类型包括微信、QQ;购物软件类型包括京东、淘宝、拼多多、唯品会;音乐软件类型包括QQ音乐、网易云、酷狗音乐。
进一步地,移动终端内各软件对应的权重比值不同,分别为gcik1,gcik2,...,gcikj,...,gcikm,且gcik1+gcik2+...+gcikj+...+gcikm<1,gcikj表示为第i矩形区域内第k个移动终端中第j个软件名称所占所有软件名称的比重。
进一步地,非移动终端内各软件名称所占的权重比值不同,分别为gdik1,gdik2,...,gdikj,...,gdikm,且gdik1+gdik2+...+gdikj+...+gdikm<1,gcik1+...+gcikj+...+gcikm+gdik1+...+gdikj+...+gdikm=1,gdikj表示为第i矩形区域内第k个非移动终端中第j个软件名称在所有软件名称中所占的比重。
进一步地,各区域内各软件推广使用系数的计算公式为
Figure GDA0003073209150000051
其中,cikj表示为第i矩形区域内第k个移动终端中各软件名称与数据存储模块中存储的第j个软件名称的对比值,gcikj表示为第i矩形区域内第k个移动终端中第j个软件名称所占所有软件名称的比重,dikj表示为第i矩形区域内第k个非移动终端中各软件名称与数据存储模块中存储的第j个软件名称的对比值,gdikj表示为第i矩形区域内第k个非移动终端中第j个软件名称在所有软件名称中所占的比重,eikjf表示为第i矩形区域内第k个移动终端中第j个软件在第f个时间段内运行的累计时长,fikjf表示为第i矩形区域内第k个非移动终端中第j个软件在第f个时间段内运行的累计时长,e″ikjf表示为第i矩形区域内第k个移动终端中第j个软件在第f个时间段内运行时间等级,ge″ikjf表示为第i矩形区域内第k个移动终端中第j个软件在第f个时间段内运行时间等级所对应的权重数值,f″ikjf表示为第i矩形区域内第k个非移动终端中第j个软件在第f个时间段内运行时间等级,gf″ikjf表示为第i矩形区域内第k个非移动终端中第j个软件在第f个时间段内运行时间等级所对应的权重数值,hikj表示为第i矩形区域内第k个移动终端中第j个软件登录的总次数,rikj表示为第i矩形区域内第k个非移动终端中第j个软件登录的总次数。
进一步地,同一软件在各矩形区域内的总推广使用系数的计算公式为
Figure GDA0003073209150000061
Qij表示为第i各矩形区域内第j个软件对应的推广使用系数。
本发明的有益效果:
本发明提供的网络数据采集***,通过对检测区域划分成若干矩形区域,便于对各矩形区域内的移动终端和非移动终端中的软件信息进行获取,便于分析不同区域内各软件的推广使用系数,避免区域特殊化;
云服务器并结合网络数据获取模块对获取的移动终端和非移动终端内的软件名称、各软件运行时长和各软件登录次数进行分析和统计,进而统计各区域内各软件推广使用系数以及同一软件在检测区域内的总推广使用系数,提高了网络数据的采集与分析效率,便于为管理人员提供参考的数据,同时,便于管理人员直观地了解各软件的推广使用效果,进而便于管理人员将需投放的广告发布至推广使用系数高的软件,提高了推广广告的收益。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的一种网络数据采集***的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1所示,一种网络数据采集***,包括区域划分模块、网络数据获取模块、数据存储模块、云服务器和显示终端,云服务器分别与区域划分模块、网络数据获取模块、数据存储模块和显示终端连接,网络数据获取模块与数据存储模块连接;
区域划分模块用于对需采集的区域进行划分,划分成若干面积相等的矩形区域,将各矩形区域按照设定的顺序进行编号,依次为1,2,...,i,...,n;
网络数据获取模块用于对各矩形区域内的移动终端数量和非移动终端数量进行统计,构成移动终端数量集合和非移动终端数量集合,其中移动终端为手机,所述移动终端数量集合为A(a1,a2,...,ai,...,an),ai表示为第i个矩形区域内移动终端的数量,非移动终端为ipad、电脑等,所述非移动终端数量集合为B(b1,b2,...,bi,...,bn),bi表示为第i个矩形区域内非移动终端的数量,并对移动终端数量集合和非移动终端数量集合中各终端中的软件名称、各软件运行时间和登录次数进行获取,并将获取的移动终端和非移动终端中的软件名称、各终端中软件运行时间和登录次数分别发送至云服务器和数据存储模块;
数据存储模块用于接收网络数据获取模块发送的各矩形区域内各移动终端和非移动终端发送的软件名称、各软件运行时间和登录次数,且数据存储模块中存储不同软件类型对应的软件名称以及软件名称的关键字,所述软件类型包括游戏软件类型、交流软件类型、购物软件类型、音乐软件类型等,其中游戏软件类型包括消消乐、穿越火线、植物大战僵尸等,交流软件类型包括微信、QQ等,购物软件类型包括京东、淘宝、拼多多、唯品会等,音乐软件类型包括QQ音乐、网易云、酷狗音乐等;
云服务器接收网络数据获取模块发送的各矩形区域内各移动终端和非移动终端发送的软件名称、各软件运行时间和登录次数,且各矩形区域内各移动终端和非移动终端分别进行编号,依次为1,2....,k,...,x和1,2....,k,...,y,并对所有软件名称按照设定的顺序进行编号,分别为1,2,...,j,...,m,各矩形区域内各移动终端的软件名称分别与数据存储模块中所有软件名称进行逐一对比,得到移动终端软件对比集合为Cik(cik1,cik2,...,cikj,...,cikm),移动终端内各软件对应的权重比值不同,分别为gcik1,gcik2,...,gcikj,...,gcikm,且gcik1+gcik2+...+gcikj+...+gcikm<1,cikj表示为第i矩形区域内第k个移动终端中各软件名称与数据存储模块中存储的第j个软件名称的对比值,若第i矩形区域内第k个移动终端中各软件名称与第j个软件名称相匹配,则取cikj=1,gcikj表示为第i矩形区域内第k个移动终端中第j个软件名称所占所有软件名称的比重;将各矩形区域内各非移动终端的软件名称分别与数据存储模块中所有软件进行逐一对比,得到非移动终端软件对比集合Dik(dik1,dik2,...,dikj,...,dikm),非移动终端内各软件名称所占的权重比值不同,分别为gdik1,gdik2,...,gdikj,...,gdikm,且gdik1+gdik2+...+gdikj+...+gdikm<1,gcik1+...+gcikj+...+gcikm+gdik1+...+gdikj+...+gdikm=1,dikj表示为第i矩形区域内第k个非移动终端中各软件名称与数据存储模块中存储的第j个软件名称的对比值,若第i矩形区域内第k个非移动终端中各软件名称与第j个软件名称相匹配,则取dikj=1,gdikj表示为第i矩形区域内第k个非移动终端中第j个软件名称在所有软件名称中所占的比重;
云服务器对各移动终端和非移动终端内的各软件的运行时间进行统计,并划分成若干时间段,统计各时间段内各软件的运行累计时间,得到移动终端软件运行时间集合和非移动终端软件运行时间集合,其中,移动终端软件运行时间集合Eikj(eikj1,eikj2,...,eikjf,...,eikjv),非移动终端软件运行时间集合Fikj(fikj1,fikj2,...,fikjf,...,fikjv),Eikj表示为第i矩形区域内第k个移动终端中第j个软件在各时间段内的累计时长,eikjf表示为第i矩形区域内第k个移动终端中第j个软件在第f个时间段内运行的累计时长,Fikj表示为第i矩形区域内第k个非移动终端中第j个软件在各时间段内的累计时长,fikjf表示为第i矩形区域内第k个非移动终端中第j个软件在第f个时间段内运行的累计时长;
云服务器将各软件在各时间段内的运行累计时间与设定的若干标准运行时长范围进行逐一对比,得到移动终端软件运行对比集合和非移动终端软件运行对比集合,标准运行时长范围分别为0-2h、2-4h、4-6h、...、(2s-2)-2sh,且不同的标准运行时长对应不同的运行时长等级,标准运行时长范围对应的运行时长等级分别为1、2、3、...、s,不同运行时间等级对应不同运行权重比值,分别为g1、g2、g3…gs,g1<g2<g3<…<gs,且g1+g2+g3+…+gs=1;
将移动终端软件运行时间集合Eikj中各时间段累计时长与若干标准运行时长范围进行一一对比,得到移动终端运行等级集合E″ikj(e″ikj1,e″ikj2,...,e″ikjf,...,e″ikjv),e″ikjf表示为第i矩形区域内第k个非移动终端中第j个软件在第f个时间段内运行时间等级,将非移动终端软件运行时间集合Fikj中各时间段累计时长与若干标准运行时长范围进行一一对比,得到非移动终端运行等级集合F″ikj(f″ikj1,f″ikj2,...,f″ikjf,...,f″ikjv),f″ikjf表示为第i矩形区域内第k个非移动终端中第j个软件在第f个时间段内运行时间等级,同时,云服务器根据移动终端运行等级集合和非移动终端运行等级集合中运行时间等级与对应的运行时间等级进行逐一对比,得到移动终端运行时间等级对应的权重和非移动终端运行时间等级对应的权重,所述移动终端运行时间等级对应的权重分别为ge″ikj1,ge″ikj2,...,ge″ikjf,...,ge″ikjv,所述非移动终端运行时间等级对应的权重分别为gf″ikj1,gf″ikj2,...,gf″ikjf,...,gf″ikjv。
云服务器接收网络数据获取模块发送的各矩形区域内各移动终端累计等级各软件的次数,分别构成移动终端软件登录次数集合和非移动终端软件登录次数集合,移动终端软件登录次数集合Hik(hik1,hik2,...,hikj,...,hikm),非移动终端软件登录次数集合Rik(rik1,rik2,...,rikj,...,rikm),hikj表示为第i矩形区域内第k个移动终端中第j个软件登录的总次数,rikj表示为第i矩形区域内第k个非移动终端中第j个软件登录的总次数。
云服务器通过对移动终端和非移动终端内的软件名称、各软件运行时长和各软件登录次数统计各区域内各软件推广使用系数,计算公式为
Figure GDA0003073209150000111
其中,cikj表示为第i矩形区域内第k个移动终端中各软件名称与数据存储模块中存储的第j个软件名称的对比值,gcikj表示为第i矩形区域内第k个移动终端中第j个软件名称所占所有软件名称的比重,dikj表示为第i矩形区域内第k个非移动终端中各软件名称与数据存储模块中存储的第j个软件名称的对比值,gdikj表示为第i矩形区域内第k个非移动终端中第j个软件名称在所有软件名称中所占的比重,eikjf表示为第i矩形区域内第k个移动终端中第j个软件在第f个时间段内运行的累计时长,fikjf表示为第i矩形区域内第k个非移动终端中第j个软件在第f个时间段内运行的累计时长,e″ikjf表示为第i矩形区域内第k个移动终端中第j个软件在第f个时间段内运行时间等级,ge″ikjf表示为第i矩形区域内第k个移动终端中第j个软件在第f个时间段内运行时间等级所对应的权重数值,f″ikjf表示为第i矩形区域内第k个非移动终端中第j个软件在第f个时间段内运行时间等级,gf″ikjf表示为第i矩形区域内第k个非移动终端中第j个软件在第f个时间段内运行时间等级所对应的权重数值,hikj表示为第i矩形区域内第k个移动终端中第j个软件登录的总次数,rikj表示为第i矩形区域内第k个非移动终端中第j个软件登录的总次数;根据各区域内各软件的推广使用系数了解各区域内软件使用的状况,便于获取各区域内用户的终端网络数据,并统计同一软件在各矩形区域内的总推广使用系数
Figure GDA0003073209150000121
Qij表示为第i各矩形区域内第j个软件对应的推广使用系数,云服务器将各区域内各软件推广使用系数和总推广使用系数发送至显示终端,各软件的推广使用系数越高,表明该软件受欢迎的程度越大;
显示终端用于接收云服务器发送的各区域内各软件推广使用系数以及该软件的总推广使用系数并进行显示,便于管理人员清楚地了解各软件的使用情况,同时便于将需推广的广告放置在推广使用系数高的软件上,提高了广告投放效果。
本发明提供的网络数据采集***,通过对检测区域划分成若干矩形区域,便于对各矩形区域内的移动终端和非移动终端中的软件信息进行获取,便于分析不同区域内各软件的推广使用系数,避免区域特殊化;
云服务器并结合网络数据获取模块对获取的移动终端和非移动终端内的软件名称、各软件运行时长和各软件登录次数进行分析和统计,进而统计各区域内各软件推广使用系数以及同一软件在检测区域内的总推广使用系数,提高了网络数据的采集与分析效率,便于为管理人员提供参考的数据,同时,便于管理人员直观地了解各软件的推广使用效果,进而便于管理人员将需投放的广告发布至推广使用系数高的软件,提高了推广广告的收益。
以上内容仅仅是对本发明的构思所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的构思或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (5)

1.一种网络数据采集***,其特征在于:包括区域划分模块、网络数据获取模块、数据存储模块、云服务器和显示终端,云服务器分别与区域划分模块、网络数据获取模块、数据存储模块和显示终端连接,网络数据获取模块与数据存储模块连接;
区域划分模块用于对需采集的区域进行划分,划分成若干面积相等的矩形区域,将各矩形区域按照设定的顺序进行编号,依次为1,2,...,i,...,n;
网络数据获取模块用于对各矩形区域内的移动终端数量和非移动终端数量进行统计,构成移动终端数量集合和非移动终端数量集合,其中移动终端为手机,所述移动终端数量集合为A(a1,a2,...,ai,...,an),ai表示为第i个矩形区域内移动终端的数量,非移动终端为ipad、电脑,所述非移动终端数量集合为B(b1,b2,...,bi,...,bn),bi表示为第i个矩形区域内非移动终端的数量,网络数据获取模块对移动终端数量集合和非移动终端数量集合中各终端中的软件名称、各软件运行时间和登录次数进行获取,并将获取的移动终端和非移动终端中的软件名称、各终端中软件运行时间和登录次数分别发送至云服务器和数据存储模块;
数据存储模块用于接收网络数据获取模块发送的各矩形区域内各移动终端和非移动终端发送的软件名称、各软件运行时间和登录次数,且数据存储模块中存储不同软件类型对应的软件名称以及软件名称的关键字;
云服务器接收网络数据获取模块发送的各矩形区域内各移动终端和非移动终端发送的软件名称、各软件运行时间和登录次数,且各矩形区域内各移动终端和非移动终端分别进行编号,依次为1,2....,k,...,x和1,2....,k,...,y,并对所有软件名称按照设定的顺序进行编号,分别为1,2,...,j,...,m,各矩形区域内各移动终端的软件名称分别与数据存储模块中所有软件名称进行逐一对比,得到移动终端软件对比集合为Cik(cik1,cik2,...,cikj,...,cikm),cikj表示为第i矩形区域内第k个移动终端中各软件名称与数据存储模块中存储的第j个软件名称的对比值,若第i矩形区域内第k个移动终端中各软件名称与第j个软件名称相匹配,则取cikj=1;将各矩形区域内各非移动终端的软件名称分别与数据存储模块中所有软件进行逐一对比,得到非移动终端软件对比集合Dik(dik1,dik2,...,dikj,...,dikm),dikj表示为第i矩形区域内第k个非移动终端中各软件名称与数据存储模块中存储的第j个软件名称的对比值,若第i矩形区域内第k个非移动终端中各软件名称与第j个软件名称相匹配,则取dikj=1;
云服务器对各移动终端和非移动终端内的各软件的运行时间进行统计,并划分成若干时间段,统计各时间段内各软件的运行累计时间,得到移动终端软件运行时间集合和非移动终端软件运行时间集合,其中,移动终端软件运行时间集合Eikj(eikj1,eikj2,...,eikjf,...,eikjv),非移动终端软件运行时间集合Fikj(fikj1,fikj2,...,fikjf,...,fikjv),Eikj表示为第i矩形区域内第k个移动终端中第j个软件在各时间段内的累计时长,eikjf表示为第i矩形区域内第k个移动终端中第j个软件在第f个时间段内运行的累计时长,Fikj表示为第i矩形区域内第k个非移动终端中第j个软件在各时间段内的累计时长,fikjf表示为第i矩形区域内第k个非移动终端中第j个软件在第f个时间段内运行的累计时长;
云服务器将各软件在各时间段内的运行累计时间与设定的若干标准运行时长范围进行逐一对比,得到移动终端软件运行对比集合和非移动终端软件运行对比集合,所述标准运行时长范围分别为0-2h、2-4h、4-6h、...、(2s-2)-2sh,且不同的标准运行时长对应不同的运行时长等级,标准运行时长范围对应的运行时长等级分别为1、2、3、...、s,不同运行时间等级对应不同运行权重比值,分别为g1、g2、g3…gs,g1<g2<g3<…<gs,且g1+g2+g3+…+gs=1;
将移动终端软件运行时间集合Eikj中各时间段累计时长与若干标准运行时长范围进行一一对比,得到移动终端运行等级集合E″ikj(e″ikj1,e″ikj2,...,e″ikjf,...,e″ikjv),e″ikjf表示为第i矩形区域内第k个非移动终端中第j个软件在第f个时间段内运行时间等级,将非移动终端软件运行时间集合Fikj中各时间段累计时长与若干标准运行时长范围进行一一对比,得到非移动终端运行等级集合F″ikj(f″ikj1,f″ikj2,...,f″ikjf,...,f″ikjv),f″ikjf表示为第i矩形区域内第k个非移动终端中第j个软件在第f个时间段内运行时间等级,同时,云服务器根据移动终端运行等级集合和非移动终端运行等级集合中运行时间等级与对应的运行时间等级进行逐一对比,得到移动终端运行时间等级对应的权重和非移动终端运行时间等级对应的权重,所述移动终端运行时间等级对应的权重分别为ge″ikj1,ge″ikj2,...,ge″ikjf,...,ge″ikjv,所述非移动终端运行时间等级对应的权重分别为gf″ikj1,gf″ikj2,...,gf″ikjf,...,gf″ikjv;
云服务器接收网络数据获取模块发送的各矩形区域内各移动终端累计等级各软件的次数,分别构成移动终端软件登录次数集合和非移动终端软件登录次数集合,移动终端软件登录次数集合Hik(hik1,hik2,...,hikj,...,hikm),非移动终端软件登录次数集合Rik(rik1,rik2,...,rikj,...,rikm),hikj表示为第i矩形区域内第k个移动终端中第j个软件登录的总次数,rikj表示为第i矩形区域内第k个非移动终端中第j个软件登录的总次数;
云服务器通过对移动终端和非移动终端内的软件名称、各软件运行时长和各软件登录次数统计各区域内各软件推广使用系数,根据各区域内各软件的推广使用系数了解各区域内软件使用的状况,并统计同一软件在各矩形区域内的总推广使用系数,云服务器将各区域内各软件推广使用系数和总推广使用系数发送至显示终端;显示终端用于接收云服务器发送的各区域内各软件推广使用系数以及该软件的总推广使用系数并进行显示;
各区域内各软件推广使用系数的计算公式为
Figure FDA0003073209140000041
Figure FDA0003073209140000042
其中,cikj表示为第i矩形区域内第k个移动终端中各软件名称与数据存储模块中存储的第j个软件名称的对比值,gcikj表示为第i矩形区域内第k个移动终端中第j个软件名称所占所有软件名称的比重,dikj表示为第i矩形区域内第k个非移动终端中各软件名称与数据存储模块中存储的第j个软件名称的对比值,gdikj表示为第i矩形区域内第k个非移动终端中第j个软件名称在所有软件名称中所占的比重,eikjf表示为第i矩形区域内第k个移动终端中第j个软件在第f个时间段内运行的累计时长,fikjf表示为第i矩形区域内第k个非移动终端中第j个软件在第f个时间段内运行的累计时长,e″ikjf表示为第i矩形区域内第k个移动终端中第j个软件在第f个时间段内运行时间等级,ge″ikjf表示为第i矩形区域内第k个移动终端中第j个软件在第f个时间段内运行时间等级所对应的权重数值,f″ikjf表示为第i矩形区域内第k个非移动终端中第j个软件在第f个时间段内运行时间等级,gf″ikjf表示为第i矩形区域内第k个非移动终端中第j个软件在第f个时间段内运行时间等级所对应的权重数值,hikj表示为第i矩形区域内第k个移动终端中第j个软件登录的总次数,rikj表示为第i矩形区域内第k个非移动终端中第j个软件登录的总次数。
2.根据权利要求1所述的一种网络数据采集***,其特征在于:所述软件类型包括游戏软件类型、交流软件类型、购物软件类型、音乐软件类型,其中游戏软件类型包括消消乐、穿越火线、植物大战僵尸;交流软件类型包括微信、QQ;购物软件类型包括京东、淘宝、拼多多、唯品会;音乐软件类型包括QQ音乐、网易云、酷狗音乐。
3.根据权利要求1所述的一种网络数据采集***,其特征在于:移动终端内各软件对应的权重比值不同,分别为gcik1,gcik2,...,gcikj,...,gcikm,且gcik1+...+gcik2+...+gcikj+...+gcikm<1,gcikj表示为第i矩形区域内第k个移动终端中第j个软件名称所占所有软件名称的比重。
4.根据权利要求3所述的一种网络数据采集***,其特征在于:非移动终端内各软件名称所占的权重比值不同,分别为gdik1,gdik2,...,gdikj,...,gdikm,且gdik1+gdik2+...+gdikj+...+gdikm<1,gcik1+...+gcikj+...+gcikm+gdik1+...+gdikj+...+gdikm=1,gdikj表示为第i矩形区域内第k个非移动终端中第j个软件名称在所有软件名称中所占的比重。
5.根据权利要求1所述的一种网络数据采集***,其特征在于:同一软件在各矩形区域内的总推广使用系数的计算公式为
Figure FDA0003073209140000061
Qij表示为第i个矩形区域内第j个软件对应的推广使用系数。
CN201810858457.4A 2018-07-31 2018-07-31 一种网络数据采集*** Active CN109213911B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810858457.4A CN109213911B (zh) 2018-07-31 2018-07-31 一种网络数据采集***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810858457.4A CN109213911B (zh) 2018-07-31 2018-07-31 一种网络数据采集***

Publications (2)

Publication Number Publication Date
CN109213911A CN109213911A (zh) 2019-01-15
CN109213911B true CN109213911B (zh) 2021-07-27

Family

ID=64990892

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810858457.4A Active CN109213911B (zh) 2018-07-31 2018-07-31 一种网络数据采集***

Country Status (1)

Country Link
CN (1) CN109213911B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106130A (zh) * 2013-01-31 2013-05-15 广东欧珀移动通信有限公司 一种移动终端的软件行为数据监控方法及***
CN104537496A (zh) * 2014-12-30 2015-04-22 广州视睿电子科技有限公司 智能终端设备使用状况统计分析方法及装置
CN106326081A (zh) * 2016-08-23 2017-01-11 上海创景计算机***有限公司 软件情况记录***
CN106850335A (zh) * 2016-12-28 2017-06-13 四川秘无痕信息安全技术有限责任公司 一种统计软件使用率和调整试用期的方法
CN108038058A (zh) * 2017-12-21 2018-05-15 北京星河星云信息技术有限公司 应用软件性能的监控方法、***、存储器和服务器

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9189792B2 (en) * 2005-04-04 2015-11-17 Mediaport Entertainment, Inc. System and methods for monitoring devices, systems, users, and user activity at remote locations
JP5369744B2 (ja) * 2009-02-13 2013-12-18 三菱電機株式会社 情報収集システム、端末装置、情報収集用プログラム、端末用プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106130A (zh) * 2013-01-31 2013-05-15 广东欧珀移动通信有限公司 一种移动终端的软件行为数据监控方法及***
CN104537496A (zh) * 2014-12-30 2015-04-22 广州视睿电子科技有限公司 智能终端设备使用状况统计分析方法及装置
CN106326081A (zh) * 2016-08-23 2017-01-11 上海创景计算机***有限公司 软件情况记录***
CN106850335A (zh) * 2016-12-28 2017-06-13 四川秘无痕信息安全技术有限责任公司 一种统计软件使用率和调整试用期的方法
CN108038058A (zh) * 2017-12-21 2018-05-15 北京星河星云信息技术有限公司 应用软件性能的监控方法、***、存储器和服务器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
用电信息***运行数据的统计与分析;吴亮 等;《浙江电力》;20170425;第36卷(第4期);56-59,73 *

Also Published As

Publication number Publication date
CN109213911A (zh) 2019-01-15

Similar Documents

Publication Publication Date Title
KR101894226B1 (ko) Ip 어드레스에 대응하는 위치를 결정하기 위한 방법, 장치, 및 시스템
CN106651458B (zh) 一种广告反作弊方法和装置
CN108259638B (zh) 个人群组列表智能排序方法、智能终端及存储介质
CA2637975A1 (en) Method and system for determining topical on-line influence of an entity
CN107896153B (zh) 一种基于移动用户上网行为的流量套餐推荐方法及装置
EP1222599A2 (en) System and method for selecting alternative advertising inventory in place of sold out advertising inventory
CN109522475A (zh) 一种基于用户历史消费数据的商家推荐方法
CN108833453A (zh) 一种确定应用账号的方法及设备
JP6694962B2 (ja) メディア情報提示方法、サーバ及び記憶媒体
CN109885656B (zh) 基于量化热度的微博转发预测方法及装置
EP2335207A2 (en) System and method for sharing profits with one or more content providers
CN107993056A (zh) 结合周薪和月薪的薪酬发放***及方法
US20110029377A1 (en) System and method for forecasting an inventory of online advertisement impressions by sampling in a map-reduce framework
CN108648017B (zh) 易于扩展的用户需求匹配方法、装置、设备及存储介质
JP5001682B2 (ja) マイニングシステム及びマイニング方法
CN110175438A (zh) 分享账号检测方法及相关设备
CN109213911B (zh) 一种网络数据采集***
CN107025567A (zh) 一种数据处理方法和装置
CN110020035B (zh) 数据识别方法和装置、存储介质及电子装置
CN110737691B (zh) 用于处理访问行为数据的方法和装置
CN110830809A (zh) 视频内容热度确定方法、电子设备及存储介质
CN115640486A (zh) 基于多源数据融合的网络新闻媒体影响力评估方法及装置
CN104410874A (zh) 视频粘度信息的检测方法、装置和***
CN106549914B (zh) 一种独立访问者的识别方法及装置
CN107948742A (zh) 一种活跃用户查找方法与装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant