CN106021476A - 一种个人信息推送*** - Google Patents
一种个人信息推送*** Download PDFInfo
- Publication number
- CN106021476A CN106021476A CN201610331230.5A CN201610331230A CN106021476A CN 106021476 A CN106021476 A CN 106021476A CN 201610331230 A CN201610331230 A CN 201610331230A CN 106021476 A CN106021476 A CN 106021476A
- Authority
- CN
- China
- Prior art keywords
- module
- information
- user
- time
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种个人信息推送***,涉及信息技术领域。该***包括:个人兴趣采集***、信息推送***和信息采集***;所述用户端包括:数据接收模块、用户注册模块、用户搜索模块和用户自主修改模块;所述个人兴趣采集***包括:用户属性静态分析模块、词频统计模块、时间分析模块、日志挖掘分析模块、分析模块和个人兴趣集;所述信息推送***包括:信息检索模块、兴趣采集模块和信息发送模块;所述信息采集***包括:信息采集模块、信息分类模块和数据库。该***提供了一种能针对个人兴趣推送信息的***,具有准确性高、学习性强、针对性强等优点。
Description
技术领域
本发明涉及物联网技术领域,特别涉及一种个人信息推送***。
背景技术
互联网的出现人人加速了现代社会信息化的进程,已经和正在深刻地改变着人们的工作、生活的方式,互联网上丰富的资源也让每个人心动。然而,要在如此浩瀚的资源中找到自己所需的信息是一件费时费力的事情。当用户需要某方面的信息时,通常有两种方式:通过搜索引擎查询或逐个访问专业网站。
搜索引擎的出现和不断完善使得人们在互联网上搜索资源变得容易多了,对于一个搜索主题,可以在很短的时间内得到返回结果。像雅虎、谷歌这些著名的搜索引擎无疑是大多数用户的首选,因为它速度快,准确率高,并且将查找结果按相关程度排序。
但是通过现有的搜索引擎查询信息存在不少缺点:
1、针对性弱,不能就用户查询的信息提供更适合用户兴趣点的信息,导致用户还需要进行筛选信息。
2、时效性弱,网上的信息往往都已经发布很久,存在时间很久,而用户不能第一时间进行查阅,导致时效性较弱。
对一个企业或组织来说,无法通过统一途径对信息进行实时采集,仍然保持剪报、个体上网、信息罗列的低效方法,这种多部门重复收集信息的情况,更加剧了资源浪费和管理上的凌乱。而企业对这种搜集来的良莠不齐又杂乱无章的信息难以进行有效的管理和充分的利用。因此,用户期望出现一些能够协助其理解、检索所需信息的***。一些信息服务机构也希望能够为它们的川户提供贴切的个性化服务,从而在激烈的竞争中击败对手。
由以上分析可知,无论是通过搜索引擎或逐个访问专业网站查询信息都存在同样的问题:现在绝大多数的网站都只能被动地接受访问。而现在的用户希望能够开发一个***自动搜集用户定制的某方面的信息,并根据用户的兴趣对获得的信息进行筛选后分类并推荐给用户。为不同用户提供切合其需求的个性化服务是当前最迫切的任务。
发明内容
鉴于此,本发明提供了一种个人信息推送***,该***具有集成度高、引导性足、提供个性化服务、安全性高等优点。
本发明采用的技术方案如下:
一种个人信息推送***,其特征在于,所述***包括:用户端、个人兴趣采集***、信息推送***和信息采集***;所述用户端包括:数据接收模块、用户注册模块、用户搜索模块和用户自主修改模块;所述个人兴趣采集***包括:用户属性静态分析模块、词频统计模块、时间分析模块、日志挖掘分析模块、分析模块和个人兴趣集;所述信息推送***包括:信息检索模块、兴趣采集模块和信息发送模块;所述信息采集***包括:信息采集模块、信息分类模块和数据库;
所述用户注册模块,用于在用户初次使用软件应用时,对用户的个人兴趣进行初次采集,将采集好的个人兴趣信息发送至用户属性静态分析模块;
所述数据接收模块,用于接收来自信息推送***发送过来数据信息;
所述用户搜索模块,用于提供给用户自主搜索相关数据信息;
所述用户自主修改模块,用于用户自主修改自己的个人兴趣集数据信息;
所述用户属性静态分析模块,用于对用户注册模块初次采集的个人兴趣记性静态分析,将分析后的个人兴趣发送至个人兴趣集进行存储;
所述词频统计模块,用于对用户搜索模块的搜索关键词进行频率统计,将统计结果发送至分析模块;
所述时间分析模块,用于分析用户在用户搜索模块反馈回来的信息以及信息接收模块接收到的信息上的停留时间,将分析结果发送至分析模块;
所述日志挖掘分析模块,用于对用户的操作日志进行分析,将分析结果发送至分析模块;
所述分析模块,用于根据词频统计模块、时间分析模块和日志挖掘分析模块发送过来分析结果进行分析,得出新的个人兴趣结果,将新的个人兴趣结果发送至个人兴趣集;
所述个人兴趣集,用于存储个人兴趣信息;
所述兴趣采集模块,用于对个人兴趣集中的兴趣进行数据采集,将采集后的结果发送至信息检索模块;
所述信息检索模块,用于根据兴趣采集模块发送过来的采集结果,在数据库中检索相关信息,将信息发送至数据发送模块;
所述数据发送模块,用于将信息检索模块发送过来的数据信息,发送至数据接收模块;
所述信息采集模块,用于采集互联网中的相关数据信息,将这些信息发送至数据分类模块;
所述信息分类模块,用于将信息采集模块采集到的数据信息进行分类处理,将分类后的数据信息发送至数据库;
所述数据库,用于对分类后的数据信息进行分类存储。
所述词频统计模块的统计方法包括以下步骤;
步骤1:在搜索模块设置词频触发器,用户每次进行搜索操作的时候,词频触发器启动发送信号至词频统计模块;
步骤2:对用户进行搜索的关键词进行拆分处理;
步骤2:词频统计模块对该次搜索行为的搜索关键词进行记录,存储在本地缓存中;
步骤3:设定一个统计阈值:D;若词频统计模块统计到的某个搜索关键词高于该阈值,则发送该关键词至分析模块。
所述时间分析模块的时间分析方法包括以下步骤:
步骤1:在用户搜索模块和数据接收模块设置时间触发器,当用户每次查阅用户搜索模块反馈回来和数据接收模块接收到的数据信息时,时间触发器启动发送信号至时间分析模块;
步骤2:时间分析模块中设定一个时间阈值:T;
步骤3:时间分析模块记录用户点击进入该页面到最后离开该页面,停留在该数据信息页面的时间,将该时间和时间阈值T进行比较,若该时间大于时间阈值,则发送页面信息至时间分析模块;
所述日志挖掘分析模块的日志挖掘分析方法包括以下步骤:
步骤1:在用户搜索模块设置日志触发器,当用于每次对用户搜索模块反馈回来的数据信息进行复制、截图操作时,触发器启动,将该数据信息至日志挖掘分析模块;
步骤2:用户挖掘分析模块对这些操作进行记录,记载在本地缓存中,生成操作日志;
步骤3:设定一个时间周期:H,设定一个日志阈值:I;
步骤4:用户挖掘分析模块每隔该时间周期,对本地缓存中的操作日志进行统计分析;若针对某个网站的数据信息进行的操作高于时间阈值I,则发送该网站和域名信息至分析模块。
所述分析模块的分析方法包括以下步骤:
步骤1:接收来自词频统计模块、时间分析模块和日志挖掘分析模块发送过来的信息;
步骤2:提取时间分析模块发送过来的页面信息中的关键词,将词频统计模块发送过来的关键词信息和提取自时间分析模块中的关键词进行比对,筛选出比对一致的关键词;
步骤3:获取筛选出一致的关键词信息的源网站信息;将网站信息和日志挖掘分析模块发送过来的网站信息进行比对,筛选出一致的网站信息;
步骤4:将筛选出的网站信息发送至个人兴趣集。
所述信息采集模块的信息采集方法包括以下步骤:
步骤1:由***管理员选定多个网站作为网站集:
步骤2:设定站点的权重最大值为100,最小值为0,再设定两个权重阈值:C=70,B=40;然后对每个站点设定权重值;
步骤3:信息检索模块根据每个站点的权重值,采用蜘蛛程序进行不同深度和广度的信息采集;权重值高于70的站点,采集深度和广度为高级;权重值介于40到70之间的站点,采集深度和广度为中级;权重值低于40的站点,采集深度和广度为低级。
所述信息采集模块的蜘蛛程序采集后,对信息的排序方法包括以下步骤:
步骤1:取检索***中的数据结构为G,G的规模为N,设定网站集合为:
Wsite={(site1,web1),(site2,web2),(site3,web3),…(siten,webn)},其中1≤i≤n,Wsite中的每一个元素为一个网站站点;每个网站站点为G中的一个结点。
步骤2:对于G中的每一个节点n,设W(n)是权重值,而向量为G对应的W(n)结果向量。
步骤:3:设定即:对G中每一个节点n,设定其初始值W(n0)均为
步骤4:当k=1,2,3……n;对G中的每一个节点,均有:
步骤5:其中,a为预先设定的参数,scanf(pi)为页面的出度值;
步骤6:按照出度值对每个采集到的信息进行排序。
采用以上技术方案,本发明产生了以下有益效果:
1、数据处理效率高:***从安卓手机应用的线程级别入手分析其计算与数据,把应用程序中部分运算量大的函数迁移到云端上执行,利用云端的强大性能来减轻手机端的计算压力,提高手机应用的运行效率。。
2、简洁易操作,无需修改源代码:本专利提出一种高效稳定的划分机制,通过一定的规则和算法自动灵活地划分安卓手机应用的执行模块并计算函数的运行时间,无需修改应用程序的源代码,就能自动地使正在运行的大计算量函数从手机端无缝地转移到云端运行。该***能够极大地加快安卓手机应用的响应速度,提供更好的用户体验。
3、数据完整性:为了保证数据在传送过程中不会被篡改,手机端利用md5码对传送数据进行加密。服务端接收到数据以后,首先进行的是md5码检测校验,即将接收到的数据信息的md5码计算出来,然后与接收到的数据中的md5码进行对比,如果完全相同,则表示数据再传送过程中未被篡改,可以继续执行。否则就表示数据已经被篡改,转移失败。
附图说明
图1是本发明的一种个人信息推送***的***结构示意图。
具体实施方式
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
本说明书(包括任何附加权利要求、摘要)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
本发明实施例1中提供了一种基于云计算的安卓手机应用加速***,***结构如图1所示:
一种个人信息推送***,其特征在于,所述***包括:用户端、个人兴趣采集***、信息推送***和信息采集***;所述用户端包括:数据接收模块、用户注册模块、用户搜索模块和用户自主修改模块;所述个人兴趣采集***包括:用户属性静态分析模块、词频统计模块、时间分析模块、日志挖掘分析模块、分析模块和个人兴趣集;所述信息推送***包括:信息检索模块、兴趣采集模块和信息发送模块;所述信息采集***包括:信息采集模块、信息分类模块和数据库;
所述用户注册模块,用于在用户初次使用软件应用时,对用户的个人兴趣进行初次采集,将采集好的个人兴趣信息发送至用户属性静态分析模块;
所述数据接收模块,用于接收来自信息推送***发送过来数据信息;
所述用户搜索模块,用于提供给用户自主搜索相关数据信息;
所述用户自主修改模块,用于用户自主修改自己的个人兴趣集数据信息;
所述用户属性静态分析模块,用于对用户注册模块初次采集的个人兴趣记性静态分析,将分析后的个人兴趣发送至个人兴趣集进行存储;
所述词频统计模块,用于对用户搜索模块的搜索关键词进行频率统计,将统计结果发送至分析模块;
所述时间分析模块,用于分析用户在用户搜索模块反馈回来的信息以及信息接收模块接收到的信息上的停留时间,将分析结果发送至分析模块;
所述日志挖掘分析模块,用于对用户的操作日志进行分析,将分析结果发送至分析模块;
所述分析模块,用于根据词频统计模块、时间分析模块和日志挖掘分析模块发送过来分析结果进行分析,得出新的个人兴趣结果,将新的个人兴趣结果发送至个人兴趣集;
所述个人兴趣集,用于存储个人兴趣信息;
所述兴趣采集模块,用于对个人兴趣集中的兴趣进行数据采集,将采集后的结果发送至信息检索模块;
所述信息检索模块,用于根据兴趣采集模块发送过来的采集结果,在数据库中检索相关信息,将信息发送至数据发送模块;
所述数据发送模块,用于将信息检索模块发送过来的数据信息,发送至数据接收模块;
所述信息采集模块,用于采集互联网中的相关数据信息,将这些信息发送至数据分类模块;
所述信息分类模块,用于将信息采集模块采集到的数据信息进行分类处理,将分类后的数据信息发送至数据库;
所述数据库,用于对分类后的数据信息进行分类存储。
本发明实施例2中提供了一种个人信息推送***的连接,***结构如图1所示:
一种个人信息推送***,其特征在于,所述***包括:用户端、个人兴趣采集***、信息推送***和信息采集***;所述用户端包括:数据接收模块、用户注册模块、用户搜索模块和用户自主修改模块;所述个人兴趣采集***包括:用户属性静态分析模块、词频统计模块、时间分析模块、日志挖掘分析模块、分析模块和个人兴趣集;所述信息推送***包括:信息检索模块、兴趣采集模块和信息发送模块;所述信息采集***包括:信息采集模块、信息分类模块和数据库;
所述用户注册模块,用于在用户初次使用软件应用时,对用户的个人兴趣进行初次采集,将采集好的个人兴趣信息发送至用户属性静态分析模块;
所述数据接收模块,用于接收来自信息推送***发送过来数据信息;
所述用户搜索模块,用于提供给用户自主搜索相关数据信息;
所述用户自主修改模块,用于用户自主修改自己的个人兴趣集数据信息;
所述用户属性静态分析模块,用于对用户注册模块初次采集的个人兴趣记性静态分析,将分析后的个人兴趣发送至个人兴趣集进行存储;
所述词频统计模块,用于对用户搜索模块的搜索关键词进行频率统计,将统计结果发送至分析模块;
所述时间分析模块,用于分析用户在用户搜索模块反馈回来的信息以及信息接收模块接收到的信息上的停留时间,将分析结果发送至分析模块;
所述日志挖掘分析模块,用于对用户的操作日志进行分析,将分析结果发送至分析模块;
所述分析模块,用于根据词频统计模块、时间分析模块和日志挖掘分析模块发送过来分析结果进行分析,得出新的个人兴趣结果,将新的个人兴趣结果发送至个人兴趣集;
所述个人兴趣集,用于存储个人兴趣信息;
所述兴趣采集模块,用于对个人兴趣集中的兴趣进行数据采集,将采集后的结果发送至信息检索模块;
所述信息检索模块,用于根据兴趣采集模块发送过来的采集结果,在数据库中检索相关信息,将信息发送至数据发送模块;
所述数据发送模块,用于将信息检索模块发送过来的数据信息,发送至数据接收模块;
所述信息采集模块,用于采集互联网中的相关数据信息,将这些信息发送至数据分类模块;
所述信息分类模块,用于将信息采集模块采集到的数据信息进行分类处理,将分类后的数据信息发送至数据库;
所述数据库,用于对分类后的数据信息进行分类存储。
所述词频统计模块的统计方法包括以下步骤;
步骤1:在搜索模块设置词频触发器,用户每次进行搜索操作的时候,词频触发器启动发送信号至词频统计模块;
步骤2:对用户进行搜索的关键词进行拆分处理;
步骤2:词频统计模块对该次搜索行为的搜索关键词进行记录,存储在本地缓存中;
步骤3:设定一个统计阈值:D;若词频统计模块统计到的某个搜索关键词高于该阈值,则发送该关键词至分析模块。
本发明实施例3中提供了一种个人信息推送***,***结构如图1所示:
所述词频统计模块的统计方法包括以下步骤;
步骤1:在搜索模块设置词频触发器,用户每次进行搜索操作的时候,词频触发器启动发送信号至词频统计模块;
步骤2:对用户进行搜索的关键词进行拆分处理;
步骤2:词频统计模块对该次搜索行为的搜索关键词进行记录,存储在本地缓存中;
步骤3:设定一个统计阈值:D;若词频统计模块统计到的某个搜索关键词高于该阈值,则发送该关键词至分析模块。
所述时间分析模块的时间分析方法包括以下步骤:
步骤1:在用户搜索模块和数据接收模块设置时间触发器,当用户每次查阅用户搜索模块反馈回来和数据接收模块接收到的数据信息时,时间触发器启动发送信号至时间分析模块;
步骤2:时间分析模块中设定一个时间阈值:T;
步骤3:时间分析模块记录用户点击进入该页面到最后离开该页面,停留在该数据信息页面的时间,将该时间和时间阈值T进行比较,若该时间大于时间阈值,则发送页面信息至时间分析模块;
所述日志挖掘分析模块的日志挖掘分析方法包括以下步骤:
步骤1:在用户搜索模块设置日志触发器,当用于每次对用户搜索模块反馈回来的数据信息进行复制、截图操作时,触发器启动,将该数据信息至日志挖掘分析模块;
步骤2:用户挖掘分析模块对这些操作进行记录,记载在本地缓存中,生成操作日志;
步骤3:设定一个时间周期:H,设定一个日志阈值:I;
步骤4:用户挖掘分析模块每隔该时间周期,对本地缓存中的操作日志进行统计分析;若针对某个网站的数据信息进行的操作高于时间阈值I,则发送该网站和域名信息至分析模块。
所述分析模块的分析方法包括以下步骤:
步骤1:接收来自词频统计模块、时间分析模块和日志挖掘分析模块发送过来的信息;
步骤2:提取时间分析模块发送过来的页面信息中的关键词,将词频统计模块发送过来的关键词信息和提取自时间分析模块中的关键词进行比对,筛选出比对一致的关键词;
步骤3:获取筛选出一致的关键词信息的源网站信息;将网站信息和日志挖掘分析模块发送过来的网站信息进行比对,筛选出一致的网站信息;
步骤4:将筛选出的网站信息发送至个人兴趣集。
所述信息采集模块的信息采集方法包括以下步骤:
步骤1:由***管理员选定多个网站作为网站集:
步骤2:设定站点的权重最大值为100,最小值为0,再设定两个权重阈值:C=70,B=40;然后对每个站点设定权重值;
步骤3:信息检索模块根据每个站点的权重值,采用蜘蛛程序进行不同深度和广度的信息采集;权重值高于70的站点,采集深度和广度为高级;权重值介于40到70之间的站点,采集深度和广度为中级;权重值低于40的站点,采集深度和广度为低级。
所述信息采集模块的蜘蛛程序采集后,对信息的排序方法包括以下步骤:
步骤1:取检索***中的数据结构为G,G的规模为N,设定网站集合为:
Wsite={(site1,web1),(site2,web2),(site3,web3),…(siten,webn)},其中1≤i≤n,Wsite中的每一个元素为一个网站站点;每个网站站点为G中的一个结点。
步骤2:对于G中的每一个节点n,设W(n)是权重值,而向量为G对应的W(n)结果向量。
步骤:3:设定即:对G中每一个节点n,设定其初始值W(n0)均为
步骤4:当k=1,2,3……n;对G中的每一个节点,均有:
步骤5:其中,a为预先设定的参数,scanf(pi)为页面的出度值;
步骤6:按照出度值对每个采集到的信息进行排序。
本发明实施例4中提供了一种个人信息推送***,***结构如图1所示:
一种个人信息推送***,其特征在于,所述***包括:用户端、个人兴趣采集***、信息推送***和信息采集***;所述用户端包括:数据接收模块、用户注册模块、用户搜索模块和用户自主修改模块;所述个人兴趣采集***包括:用户属性静态分析模块、词频统计模块、时间分析模块、日志挖掘分析模块、分析模块和个人兴趣集;所述信息推送***包括:信息检索模块、兴趣采集模块和信息发送模块;所述信息采集***包括:信息采集模块、信息分类模块和数据库;
所述用户注册模块,用于在用户初次使用软件应用时,对用户的个人兴趣进行初次采集,将采集好的个人兴趣信息发送至用户属性静态分析模块;
所述数据接收模块,用于接收来自信息推送***发送过来数据信息;
所述用户搜索模块,用于提供给用户自主搜索相关数据信息;
所述用户自主修改模块,用于用户自主修改自己的个人兴趣集数据信息;
所述用户属性静态分析模块,用于对用户注册模块初次采集的个人兴趣记性静态分析,将分析后的个人兴趣发送至个人兴趣集进行存储;
所述词频统计模块,用于对用户搜索模块的搜索关键词进行频率统计,将统计结果发送至分析模块;
所述时间分析模块,用于分析用户在用户搜索模块反馈回来的信息以及信息接收模块接收到的信息上的停留时间,将分析结果发送至分析模块;
所述日志挖掘分析模块,用于对用户的操作日志进行分析,将分析结果发送至分析模块;
所述分析模块,用于根据词频统计模块、时间分析模块和日志挖掘分析模块发送过来分析结果进行分析,得出新的个人兴趣结果,将新的个人兴趣结果发送至个人兴趣集;
所述个人兴趣集,用于存储个人兴趣信息;
所述兴趣采集模块,用于对个人兴趣集中的兴趣进行数据采集,将采集后的结果发送至信息检索模块;
所述信息检索模块,用于根据兴趣采集模块发送过来的采集结果,在数据库中检索相关信息,将信息发送至数据发送模块;
所述数据发送模块,用于将信息检索模块发送过来的数据信息,发送至数据接收模块;
所述信息采集模块,用于采集互联网中的相关数据信息,将这些信息发送至数据分类模块;
所述信息分类模块,用于将信息采集模块采集到的数据信息进行分类处理,将分类后的数据信息发送至数据库;
所述数据库,用于对分类后的数据信息进行分类存储。
所述词频统计模块的统计方法包括以下步骤;
步骤1:在搜索模块设置词频触发器,用户每次进行搜索操作的时候,词频触发器启动发送信号至词频统计模块;
步骤2:对用户进行搜索的关键词进行拆分处理;
步骤2:词频统计模块对该次搜索行为的搜索关键词进行记录,存储在本地缓存中;
步骤3:设定一个统计阈值:D;若词频统计模块统计到的某个搜索关键词高于该阈值,则发送该关键词至分析模块。
所述时间分析模块的时间分析方法包括以下步骤:
步骤1:在用户搜索模块和数据接收模块设置时间触发器,当用户每次查阅用户搜索模块反馈回来和数据接收模块接收到的数据信息时,时间触发器启动发送信号至时间分析模块;
步骤2:时间分析模块中设定一个时间阈值:T;
步骤3:时间分析模块记录用户点击进入该页面到最后离开该页面,停留在该数据信息页面的时间,将该时间和时间阈值T进行比较,若该时间大于时间阈值,则发送页面信息至时间分析模块;
所述日志挖掘分析模块的日志挖掘分析方法包括以下步骤:
步骤1:在用户搜索模块设置日志触发器,当用于每次对用户搜索模块反馈回来的数据信息进行复制、截图操作时,触发器启动,将该数据信息至日志挖掘分析模块;
步骤2:用户挖掘分析模块对这些操作进行记录,记载在本地缓存中,生成操作日志;
步骤3:设定一个时间周期:H,设定一个日志阈值:I;
步骤4:用户挖掘分析模块每隔该时间周期,对本地缓存中的操作日志进行统计分析;若针对某个网站的数据信息进行的操作高于时间阈值I,则发送该网站和域名信息至分析模块。
所述分析模块的分析方法包括以下步骤:
步骤1:接收来自词频统计模块、时间分析模块和日志挖掘分析模块发送过来的信息;
步骤2:提取时间分析模块发送过来的页面信息中的关键词,将词频统计模块发送过来的关键词信息和提取自时间分析模块中的关键词进行比对,筛选出比对一致的关键词;
步骤3:获取筛选出一致的关键词信息的源网站信息;将网站信息和日志挖掘分析模块发送过来的网站信息进行比对,筛选出一致的网站信息;
步骤4:将筛选出的网站信息发送至个人兴趣集。
所述信息采集模块的信息采集方法包括以下步骤:
步骤1:由***管理员选定多个网站作为网站集:
步骤2:设定站点的权重最大值为100,最小值为0,再设定两个权重阈值:C=70,B=40;然后对每个站点设定权重值;
步骤3:信息检索模块根据每个站点的权重值,采用蜘蛛程序进行不同深度和广度的信息采集;权重值高于70的站点,采集深度和广度为高级;权重值介于40到70之间的站点,采集深度和广度为中级;权重值低于40的站点,采集深度和广度为低级。
所述信息采集模块的蜘蛛程序采集后,对信息的排序方法包括以下步骤:
步骤1:取检索***中的数据结构为G,G的规模为N,设定网站集合为:
Wsite={(site1,web1),(site2,web2),(site3,web3),…(siten,webn)},其中1≤i≤n,Wsite中的每一个元素为一个网站站点;每个网站站点为G中的一个结点。
步骤2:对于G中的每一个节点n,设W(n)是权重值,而向量为G对应的W(n)结果向量。
步骤:3:设定即:对G中每一个节点n,设定其初始值W(n0)均为
步骤4:当k=1,2,3……n;对G中的每一个节点,均有:
步骤5:其中,a为预先设定的参数,scanf(pi)为页面的出度值;
步骤6:按照出度值对每个采集到的信息进行排序。
本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合,以及披露的任一新的方法或过程的步骤或任何新的组合。
Claims (7)
1.一种个人信息推送***,其特征在于,所述***包括:用户端、个人兴趣采集***、信息推送***和信息采集***;所述用户端包括:数据接收模块、用户注册模块、用户搜索模块和用户自主修改模块;所述个人兴趣采集***包括:用户属性静态分析模块、词频统计模块、时间分析模块、日志挖掘分析模块、分析模块和个人兴趣集;所述信息推送***包括:信息检索模块、兴趣采集模块和信息发送模块;所述信息采集***包括:信息采集模块、信息分类模块和数据库;
所述用户注册模块,用于在用户初次使用软件应用时,对用户的个人兴趣进行初次采集,将采集好的个人兴趣信息发送至用户属性静态分析模块;
所述数据接收模块,用于接收来自信息推送***发送过来数据信息;
所述用户搜索模块,用于提供给用户自主搜索相关数据信息;
所述用户自主修改模块,用于用户自主修改自己的个人兴趣集数据信息;
所述用户属性静态分析模块,用于对用户注册模块初次采集的个人兴趣记性静态分析,将分析后的个人兴趣发送至个人兴趣集进行存储;
所述词频统计模块,用于对用户搜索模块的搜索关键词进行频率统计,将统计结果发送至分析模块;
所述时间分析模块,用于分析用户在用户搜索模块反馈回来的信息以及信息接收模块接收到的信息上的停留时间,将分析结果发送至分析模块;
所述日志挖掘分析模块,用于对用户的操作日志进行分析,将分析结果发送至分析模块;
所述分析模块,用于根据词频统计模块、时间分析模块和日志挖掘分析模块发送过来分析结果进行分析,得出新的个人兴趣结果,将新的个人兴趣结果发送至个人兴趣集;
所述个人兴趣集,用于存储个人兴趣信息;
所述兴趣采集模块,用于对个人兴趣集中的兴趣进行数据采集,将采集后的结果发送至信息检索模块;
所述信息检索模块,用于根据兴趣采集模块发送过来的采集结果,在数据库中检索相关信息,将信息发送至数据发送模块;
所述数据发送模块,用于将信息检索模块发送过来的数据信息,发送至数据接收模块;
所述信息采集模块,用于采集互联网中的相关数据信息,将这些信息发送至数据分类模块;
所述信息分类模块,用于将信息采集模块采集到的数据信息进行分类处理,将分类后的数据信息发送至数据库;
所述数据库,用于对分类后的数据信息进行分类存储。
2.如权利要求1所述的个人信息推送***,其特征在于,所述词频统计模块的统计方法包括以下步骤;
步骤1:在搜索模块设置词频触发器,用户每次进行搜索操作的时候,词频触发器启动发送信号至词频统计模块;
步骤2:对用户进行搜索的关键词进行拆分处理;
步骤2:词频统计模块对该次搜索行为的搜索关键词进行记录,存储在本地缓存中;
步骤3:设定一个统计阈值:D;若词频统计模块统计到的某个搜索关键词高于该阈值,则发送该关键词至分析模块。
3.如权利要求1所述的个人信息推送***,其特征在于,所述时 间分析模块的时间分析方法包括以下步骤:
步骤1:在用户搜索模块和数据接收模块设置时间触发器,当用户每次查阅用户搜索模块反馈回来和数据接收模块接收到的数据信息时,时间触发器启动发送信号至时间分析模块;
步骤2:时间分析模块中设定一个时间阈值:T;
步骤3:时间分析模块记录用户点击进入该页面到最后离开该页面,停留在该数据信息页面的时间,将该时间和时间阈值T进行比较,若该时间大于时间阈值,则发送页面信息至时间分析模块。
4.如权利要求1所述的个人信息推送***,其特征在于,所述日志挖掘分析模块的日志挖掘分析方法包括以下步骤:
步骤1:在用户搜索模块设置日志触发器,当用于每次对用户搜索模块反馈回来的数据信息进行复制、截图操作时,触发器启动,将该数据信息至日志挖掘分析模块;
步骤2:用户挖掘分析模块对这些操作进行记录,记载在本地缓存中,生成操作日志;
步骤3:设定一个时间周期:H,设定一个日志阈值:I;
步骤4:用户挖掘分析模块每隔该时间周期,对本地缓存中的操作日志进行统计分析;若针对某个网站的数据信息进行的操作高于时间阈值I,则发送该网站和域名信息至分析模块。
5.如权利要求1所述的个人信息推送***,其特征在于,所述分析模块的分析方法包括以下步骤:
步骤1:接收来自词频统计模块、时间分析模块和日志挖掘分析模块发送过来的信息;
步骤2:提取时间分析模块发送过来的页面信息中的关键词,将词频统计模块发送过来的关键词信息和提取自时间分析模块中的关 键词进行比对,筛选出比对一致的关键词;
步骤3:获取筛选出一致的关键词信息的源网站信息;将网站信息和日志挖掘分析模块发送过来的网站信息进行比对,筛选出一致的网站信息;
步骤4:将筛选出的网站信息发送至个人兴趣集。
6.如权利要求1所述的个人信息推送***,其特征在于,所述信息采集模块的信息采集方法包括以下步骤:
步骤1:由***管理员选定多个网站作为网站集:
步骤2:设定站点的权重最大值为100,最小值为0,再设定两个权重阈值:C=70,B=40;然后对每个站点设定权重值;
步骤3:信息检索模块根据每个站点的权重值,采用蜘蛛程序进行不同深度和广度的信息采集;权重值高于70的站点,采集深度和广度为高级;权重值介于40到70之间的站点,采集深度和广度为中级;权重值低于40的站点,采集深度和广度为低级。
7.如权利要求6所述的个人信息推送***,其特征在于,所述信息采集模块的蜘蛛程序采集后,对信息的排序方法包括以下步骤:
步骤1:取检索***中的数据结构为G,G的规模为N,设定网站集合为:
Wsite=
{(site1,web1),(site2,web2),(site3,web3),…(siten,webn)},其中1≤i≤n,Wsite中的每一个元素为一个网站站点;每个网站站点为G中的一个结点。
步骤2:对于G中的每一个节点n,设W(n)是权重值,而向量为G对应的W(n)结果向量。
步骤:3:设定即:对G中每一个节点n,
设定其
初始值W(n0)均为
步骤4:当k=1,2,3……n;对G中的每一个节点,均有:
步骤5:其中,a为预先设定的参数,scanf(pi)为页面的出度值;
步骤6:按照出度值对每个采集到的信息进行排序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610331230.5A CN106021476A (zh) | 2016-05-18 | 2016-05-18 | 一种个人信息推送*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610331230.5A CN106021476A (zh) | 2016-05-18 | 2016-05-18 | 一种个人信息推送*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106021476A true CN106021476A (zh) | 2016-10-12 |
Family
ID=57097866
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610331230.5A Pending CN106021476A (zh) | 2016-05-18 | 2016-05-18 | 一种个人信息推送*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106021476A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108763330A (zh) * | 2018-05-09 | 2018-11-06 | 张耀伦 | 一种信息资源的导航推荐***及方法 |
WO2019000133A1 (zh) * | 2017-06-28 | 2019-01-03 | 深圳市秀趣品牌文化传播有限公司 | 电商数据处理方法 |
CN109145634A (zh) * | 2018-07-13 | 2019-01-04 | 安徽信尔联信息科技有限公司 | 一种客户信息自动采集*** |
CN111460308A (zh) * | 2020-04-07 | 2020-07-28 | 贵阳块数据城市建设有限公司 | 一种基于互联网的app推送*** |
CN114159828A (zh) * | 2021-11-30 | 2022-03-11 | 高小红 | 一种超临界二氧化碳温控*** |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070201376A1 (en) * | 2006-02-27 | 2007-08-30 | Marshall-Wilson Maria I | Apparatus and methods for group communications |
CN104135498A (zh) * | 2013-05-03 | 2014-11-05 | 杭州诺霖信息科技有限公司 | 一种跨平台的信息推送***及其推送方法 |
-
2016
- 2016-05-18 CN CN201610331230.5A patent/CN106021476A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070201376A1 (en) * | 2006-02-27 | 2007-08-30 | Marshall-Wilson Maria I | Apparatus and methods for group communications |
CN104135498A (zh) * | 2013-05-03 | 2014-11-05 | 杭州诺霖信息科技有限公司 | 一种跨平台的信息推送***及其推送方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019000133A1 (zh) * | 2017-06-28 | 2019-01-03 | 深圳市秀趣品牌文化传播有限公司 | 电商数据处理方法 |
CN108763330A (zh) * | 2018-05-09 | 2018-11-06 | 张耀伦 | 一种信息资源的导航推荐***及方法 |
CN109145634A (zh) * | 2018-07-13 | 2019-01-04 | 安徽信尔联信息科技有限公司 | 一种客户信息自动采集*** |
CN111460308A (zh) * | 2020-04-07 | 2020-07-28 | 贵阳块数据城市建设有限公司 | 一种基于互联网的app推送*** |
CN114159828A (zh) * | 2021-11-30 | 2022-03-11 | 高小红 | 一种超临界二氧化碳温控*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106021476A (zh) | 一种个人信息推送*** | |
US20200159741A1 (en) | Selection of a representative data subset of a set of unstructured data | |
CN107800591B (zh) | 一种统一日志数据的分析方法 | |
CN104951465B (zh) | 应用推荐方法及装置 | |
CN104899324B (zh) | 一种基于idc有害信息监测***的样本训练*** | |
CN103744954A (zh) | 一种词关联网模型的构建方法及其构建器 | |
CN109408701A (zh) | 一种网络爬虫爬取路径的展示方法和装置 | |
CN106941493A (zh) | 一种网络安全态势感知结果输出方法及装置 | |
JP2009048380A5 (zh) | ||
CN105515836A (zh) | 日志处理方法、装置及服务器 | |
CN105530265A (zh) | 一种基于频繁项集描述的移动互联网恶意应用检测方法 | |
CN104615627A (zh) | 一种基于微博平台的事件舆情信息提取方法及*** | |
Cuttone et al. | Inferring human mobility from sparse low accuracy mobile sensing data | |
CN111159135A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN104281619A (zh) | 搜索结果排序***及方法 | |
CN105471635B (zh) | 一种***日志的处理方法、装置和*** | |
CN103248511B (zh) | 一种单点业务性能的分析方法、装置和*** | |
CN102737125B (zh) | 基于Web时态对象模型的过时网页信息自动发现方法 | |
CN106557483B (zh) | 一种数据处理、数据查询方法及设备 | |
CN111198934B (zh) | 一种信息处理方法及相关设备 | |
CN109635022B (zh) | 一种可视化的ElasticSearch数据采集方法及装置 | |
CN103248513A (zh) | 基于Office办公套件的网络信息数据采集方法及*** | |
CN103853771A (zh) | 一种搜索结果的推送方法及*** | |
Nethra et al. | WEB CONTENT EXTRACTION USING HYBRID APPROACH. | |
CN107679240B (zh) | 一种虚拟身份挖掘方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20161012 |
|
RJ01 | Rejection of invention patent application after publication |