CN112131459A - 基于大数据的知识产权信息检索软件管理***及方法 - Google Patents

基于大数据的知识产权信息检索软件管理***及方法 Download PDF

Info

Publication number
CN112131459A
CN112131459A CN202010789517.9A CN202010789517A CN112131459A CN 112131459 A CN112131459 A CN 112131459A CN 202010789517 A CN202010789517 A CN 202010789517A CN 112131459 A CN112131459 A CN 112131459A
Authority
CN
China
Prior art keywords
retrieval
marking
user
value
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010789517.9A
Other languages
English (en)
Other versions
CN112131459B (zh
Inventor
曾素梅
黄鹏
易露霞
唐小梦
王月甜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Kewo Technology Service Co.,Ltd.
Original Assignee
Guangzhou College of Technology and Business
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou College of Technology and Business filed Critical Guangzhou College of Technology and Business
Priority to CN202010789517.9A priority Critical patent/CN112131459B/zh
Publication of CN112131459A publication Critical patent/CN112131459A/zh
Application granted granted Critical
Publication of CN112131459B publication Critical patent/CN112131459B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • G06Q50/184Intellectual property management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Tourism & Hospitality (AREA)
  • Technology Law (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于大数据的知识产权信息检索软件管理***及方法,包括数据采集模块、若干个用户终端、浏览模块、用户行为分析模块、服务器、检索模块、数据采集模块、数据库以及评价模块;检索模块用于用户终端发布检索信息并将检索信息发送至服务器;数据采集模块用于采集每件专利的基本信息并将每件专利的基本信息传输到数据库进行存储;调查模块用于监测每隔预设时间专利的发明人与用户的交流信息并将交流信息传输到数据分析模块;数据分析模块接收点击信息和交流信息并结合检索模块进行专利的推送分析。本发明巧妙利用大数据智能分析和用户的行为来提高搜索效率,减轻用户负担。

Description

基于大数据的知识产权信息检索软件管理***及方法
技术领域
本发明涉及信息检索领域,尤其涉及基于大数据的知识产权信息检索软件管理***及方法。
背景技术
随着互联网应用的普及和大数据时代的到来,每天全球互联网网页数目以千万级的数量增加。要在浩瀚网络检索需要的信息,搜索引擎已成为访问互联网不可或缺的助手。
公开号CN106503199A的文件公开了一种基于网络的计算机信息检索***,包括前台信息输入***和后台信息检索***,所述前台信息输入***和后台信息检索***均通过计算机中心***双向电性连接;所述前台信息输入***包括图片输入子***、语言输入子***和文字输入子***;所述后台信息检索***包括信息检索子***、检索检索子***和检索共享子***,该发明提出的一种基于网络的计算机信息检索***,包括前台信息输入***和后台信息检索***,当需要检索时,可以输入图片、语言和文字三种检索信息,克服了传统的检索***的检索方式单一的问题,检索共享子***实现了检索的共享,实现了远程的传输。
但是该专利是将所有可能的结果全部呈现给用户,由用户自己选择其中需要的检索项;增加了用户负担,降低了搜索效率;而且在检索项排序的时候并没有充分考虑用户的行为。
发明内容
针对现有技术存在的不足,本发明目的是提供基于大数据的知识产权信息检索软件管理***及方法;本发明巧妙利用大数据智能分析和用户的行为来提高搜索效率,减轻用户负担;同时对检索服务***形成一个有效评价,方便后来查看。
本发明的目的可以通过以下技术方案实现:
基于大数据的知识产权信息检索软件管理***,包括数据采集模块、若干个用户终端、浏览模块、用户行为分析模块、服务器、检索模块、数据采集模块、数据库以及评价模块;
所述用户终端用于录入用户的登录信息和注册信息,用户在已有账户时通过用户终端输入登录信息后进行登录,用户在不存在账户时通过用户终端输入注册信息注册新的账户后进行首次登录;
所述检索模块用于用户终端发布检索信息并将检索信息发送至服务器,所述检索信息包括关键字和技术领域;
所述数据采集模块用于采集每件专利的基本信息并将每件专利的基本信息传输到数据库进行存储;所述数据库用于存储服务器接收的浏览记录、评价记录、检索信息、登录信息以及注册信息;
所述访问统计模块用于统计数据库中每件专利在***当前时间前10天内的点击信息并将点击信息传输到数据分析模块;所述调查模块用于监测每隔预设时间专利的发明人与用户的交流信息并将交流信息传输到数据分析模块;
所述数据分析模块接收点击信息和交流信息并结合检索模块进行专利的推送分析,具体推送分析过程如下:
S11:获取符合检索信息中关键字和技术领域的专利并将其标记为初选专利;
S12:将***当前时间前10天内该初选专利每天被点击的次数标记为Bk,每次点击的观看时间标记为Tki,每天被评论的次数标记为Ck,每天被转发的次数标记为Dk,每天被收藏的次数标记为Ek,每天被点赞的次数标记为Fk;k=1,2,…,10;i=1,2,…,Bk;
S13:将***当前时间前10天内该初选专利每天被观看的时间标记为Tk;
Figure BDA0002623256400000031
S14:利用公式
Figure BDA0002623256400000032
计算得出该初选专利每天的热度值Qk,其中,b1、b2、b3、r1、r2、r3和r4均为系数因子;
S15:按照平均值计算公式得出该初选专利当前时间前10天内的平均热度值L;按照标准差计算公式得出前10天内该初选专利每天热度值的标准差α,利用公式β=(L×η1-α×η2)(η3+η4)计算得出该初选专利的持续热度值β,其中η1、η2、η3和η4均为系数因子;
S16:将服务评价系数标记为Ko,将服务评价系数Ko求取平均值得到服务评价均值K;
S17:将初选专利发明人答复用户问题的反应时间标记为J3o,所述J3o=J2o-J1o,o=1,...,n,将反应时间J3o求和并取平均值得到平均反应时间J;
S18:将初选专利发明人名下专利总数量标记为P1;将初选专利发明人名下已成交的专利数量标记为P2;
S19:利用公式
Figure BDA0002623256400000033
计算得出该初选专利发明人的信誉值R,其中c1、c2、c3和c4均为系数因子;
S20:利用公式
Figure BDA0002623256400000041
得出该初选专利的推送值TS;其中d1、d2、d3、d4和d5为预设比例系数;λ=0.00564327;P(x)为用户对该初选专利的兴趣值;
数据分析模块将推送值TS传输到服务器,所述服务器根据推送值TS对初选专利做降序排列并将排列后的初选专利发送至用户终端。
进一步地,所述浏览模块用于用户终端浏览专利信息,并将浏览记录发送至服务器;所述浏览记录包括浏览时间、持续时长以及评论、转发、收藏和点赞的行为特征;所述浏览时间为用户点开专利链接的时间;所述用户行为分析模块用于接收服务器传输的浏览记录并作出分析;具体步骤包括:
S41:获取浏览记录中浏览时间并将浏览时间标记为Hx,将持续时长标记为Rx,评论行为值标记为S(C),转发行为值标记为S(D),收藏行为值标记为S(E),点赞行为值标记为S(F);
S42:获取***当前时间,将当前时间标记为TV,利用公式
Figure BDA0002623256400000042
计算得出该条记录的时效值f(x);其中g1为系数因子,Hx与TV越接近,则f(x)值越大;σ为预设因子;
S43:若用户对该专利有评论,则S(C)=1,否则S(C)=0;若用户对该专利有转发,则S(D)=1,否则S(D)=0;若用户对该专利有收藏,则S(E)=1,否则S(E)=0,若用户对该专利有点赞,则S(F)=1,否则S(F)=0;
S44:利用公式
Figure BDA0002623256400000043
计算得出用户对该专利的兴趣值P(x);其中g2为预设系数因子。
进一步地,所述服务器接收到检索模块传输的检索信息时会自动驱动控制计时模块开始计时,在服务器返回检索结果至用户终端时会通过检索模块向服务器传输检索信号,在浏览器关闭时会通过检索模块向服务器传输解决信号;所述服务器在接收到反应信号和解决信号时均会驱动计时模块记录检索时间和解决时间;所述服务器将检索时间标记为RT1并将其传输到评价模块,服务器将解决时间标记为RT2并将其传输到评价模块;
所述评价模块用于用户对专利的检索服务进行评价,评价规则为:给检索服务评分,满分为100分;所述评价模块的具体工作步骤如下:
S51:将服务评分标记为Qs;获取整个检索过程中用户浏览专利的数量并将其标记为Cs;
S52:根据大数据内用户对服务评分Qs、浏览专利的数量Cs、检索时间RT1和解决时间RT2的重视程度分配权重;
对服务评分Qs分配权重为D1;对浏览专利的数量Cs分配权重为D2;对检索时间RT1分配权重D3,对解决时间RT2分配权重为D4;且D1+D2+D3+D4=1;D1>D2>D3>D4;
S53:利用公式
Figure BDA0002623256400000051
计算得到用户的检索满意值QR。
进一步地,所述评价模块用于将检索满意值QR传输到服务器,所述服务器用于将检索满意值QR打上时间戳存储到存储模块并将检索满意值QR传输到显示模块进行实时显示;所述专利的基本信息包括专利包括发明人、发明类型、技术领域以及名称;所述点击信息包括点击次数、每次点击的观看时间以及评论、转发、收藏和点赞的行为特征;所述交流信息包括用户提出问题的时间J1x、发明人答复问题的时间J2x、服务评价系数、发明人名下专利总数量以及发明人名下已成交的专利数量,所述服务评价系数规则为:给发明人服务评分,满分为100分。
进一步地,基于大数据的知识产权信息检索方法,包括如下步骤:
步骤一:用户通过若干个用户终端进行注册和登录,对专利进行浏览查看,而后发布检索信息;
步骤二:所述数据分析模块接收点击信息和交流信息并结合检索信息进行专利的推送分析;包括:
X11:获取符合检索信息中关键字和技术领域的专利并将其标记为初选专利;
X12:将***当前时间前10天内该初选专利每天被点击的次数标记为Bk,每次点击的观看时间标记为Tki,每天被评论的次数标记为Ck,每天被转发的次数标记为Dk,每天被收藏的次数标记为Ek,每天被点赞的次数标记为Fk;
X13:将***当前时间前10天内该初选专利每天被观看的时间标记为Tk;
Figure BDA0002623256400000061
X14:利用公式
Figure BDA0002623256400000062
计算得出该初选专利每天的热度值Qk;
X15:按照平均值计算公式得出该初选专利当前时间前10天内的平均热度值L;按照标准差计算公式得出前10天内该初选专利每天热度值的标准差α,利用公式β=(L×η1-α×η2)(η3+η4)计算得出该初选专利的持续热度值β;
X16:将服务评价系数标记为Ko,将服务评价系数Ko求取平均值得到服务评价均值K;
X17:将初选专利发明人答复用户问题的反应时间标记为J3o;J3o=J2o-J1o;将反应时间J3o求和并取平均值得到平均反应时间J;
X18:将初选专利发明人名下专利总数量标记为P1;将初选专利发明人名下已成交的专利数量标记为P2;
X19:利用公式
Figure BDA0002623256400000071
计算得出该初选专利发明人的信誉值R;
X20:利用公式
Figure BDA0002623256400000072
得出该初选专利的推送值TS;
步骤三:根据推送值TS对专利做降序排列并将排列后的专利发送至用户终端;
步骤四:用户终端通过浏览模块浏览专利信息,并将浏览记录发送至服务器;用户行为分析模块接收服务器传输的浏览记录并作出分析;获得用户对专利的兴趣值P(x);具体步骤如下:
X31:获取浏览记录中的浏览时间并将浏览时间标记为Hx,将持续时长标记为Rx,评论行为值标记为S(C),转发行为值标记为S(D),收藏行为值标记为S(E),点赞行为值标记为S(F);
X32:获取***当前时间,将当前时间标记为TV,利用公式
Figure BDA0002623256400000073
计算得出该条记录的时效值f(x);其中g1为系数因子,Hx与TV越接近,则f(x)值越大;σ为预设因子;
X33:若用户对该专利有评论,则S(C)=1,否则S(C)=0;若用户对该专利有转发,则S(D)=1,否则S(D)=0;若用户对该专利有收藏,则S(E)=1,否则S(E)=0,若用户对该专利有点赞,则S(F)=1,否则S(F)=0;
X34:利用公式
Figure BDA0002623256400000074
计算得出用户对该专利的兴趣值P(x);
步骤五:检索完成后,用户通过评价模块对专利的检索服务进行评价,包括:
X41:将服务评分标记为Qs;获取整个检索过程中用户浏览专利的数量并将其标记为Cs;
X42:根据大数据内用户对服务评分Qs、浏览专利的数量Cs、检索时间RT1和解决时间RT2的重视程度分配权重;
对服务评分Qs分配权重为D1;对浏览专利的数量Cs分配权重为D2;对检索时间RT1分配权重D3,对解决时间RT2分配权重为D4;且D1+D2+D3+D4=1;D1>D2>D3>D4;
X43:利用公式
Figure BDA0002623256400000081
计算得到用户的检索满意值QR;
步骤六:服务器将检索满意值QR打上时间戳存储到存储模块并将检索满意值QR传输到显示模块进行实时显示。
本发明的有益效果是:
(1)本发明通过访问统计模块统计数据库中每件专利在***当前时间前10天内的点击信息,通过调查模块监测每隔预设时间专利的发明人与用户的交流信息;数据分析模块接收点击信息和交流信息并结合检索模块进行专利的推送分析;首先获取符合检索信息中关键字和技术领域的专利并将其标记为初选专利;结合相关算法得到该初选专利的持续热度值β;同时根据交流信息获得该初选专利发明人的信誉值R;利用公式
Figure BDA0002623256400000082
得出该初选专利的推送值TS;服务器根据推送值TS对初选专利做降序排列并将排列后的初选专利发送至用户终端;巧妙利用大数据智能分析,提高检索效率;
(2)本发明通过浏览模块浏览专利信息,并将浏览记录发送至服务器;用户行为分析模块用于接收服务器传输的浏览记录并作出分析;获取浏览记录中浏览时间并将浏览时间标记为Hx,将持续时长标记为Rx,评论行为值标记为S(C),转发行为值标记为S(D),收藏行为值标记为S(E),点赞行为值标记为S(F);利用公式
Figure BDA0002623256400000091
计算得出用户对该专利的兴趣值P(x);结合持续热度值β和发明人的信誉值R,利用公式
Figure BDA0002623256400000092
得出该初选专利的推送值TS;使推送结果更准确,提高检索效率;
(3)本发明通过评价模块对专利的检索服务进行评价;根据大数据内用户对服务评分Qs、浏览专利的数量Cs、检索时间RT1和解决时间RT2的重视程度分配权重;利用公式
Figure BDA0002623256400000093
计算得到用户的检索满意值QR;评价模块将检索满意值QR传输到服务器,服务器将检索满意值QR打上时间戳存储到存储模块并将检索满意值QR传输到显示模块进行实时显示,本发明对检索服务***形成一个有效评价,方便后来查看。
附图说明
为了便于本领域技术人员理解,下面结合附图对本发明作进一步的说明。
图1为本发明的***框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,基于大数据的知识产权信息检索软件管理***及方法,包括数据采集模块、若干个用户终端、浏览模块、服务器、检索模块、数据采集模块、数据库以及评价模块;
用户终端用于录入用户的登录信息和注册信息,用户在已有账户时通过用户终端输入登录信息后进行登录,用户在不存在账户时通过用户终端输入注册信息注册新的账户后进行首次登录;
检索模块用于用户终端发布检索信息并将检索信息发送至服务器,检索信息包括关键字和技术领域;
数据采集模块用于采集每件专利的基本信息并将每件专利的基本信息传输到数据库进行存储;专利的基本信息包括专利包括发明人、发明类型、技术领域以及名称;数据库用于存储服务器接收的浏览记录、评价记录、检索信息、登录信息以及注册信息;
访问统计模块用于统计数据库中每件专利在***当前时间前10天内的点击信息并将点击信息传输到数据分析模块;点击信息包括点击次数、每次点击的观看时间以及评论、转发、收藏和点赞的行为特征;调查模块用于监测每隔预设时间专利的发明人与用户的交流信息并将交流信息传输到数据分析模块;交流信息包括用户提出问题的时间J1x、发明人答复问题的时间J2x、服务评价系数、发明人名下专利总数量以及发明人名下已成交的专利数量,服务评价系数规则为:给发明人服务评分,满分为100分;
数据分析模块接收点击信息和交流信息并结合检索模块进行专利的推送分析,具体推送分析过程如下:
S11:获取符合检索信息中关键字和技术领域的专利并将其标记为初选专利;
S12:将***当前时间前10天内该初选专利每天被点击的次数标记为Bk,每次点击的观看时间标记为Tki,每天被评论的次数标记为Ck,每天被转发的次数标记为Dk,每天被收藏的次数标记为Ek,每天被点赞的次数标记为Fk;k=1,2,…,10;i=1,2,…,Bk;
S13:将***当前时间前10天内该初选专利每天被观看的时间标记为Tk;
Figure BDA0002623256400000111
S14:利用公式
Figure BDA0002623256400000112
计算得出该初选专利每天的热度值Qk,其中,b1、b2、b3、r1、r2、r3和r4均为系数因子;
S15:按照平均值计算公式得出该初选专利当前时间前10天内的平均热度值L;按照标准差计算公式得出前10天内该初选专利每天热度值的标准差α,利用公式β=(L×η1-α×η2)(η3+η4)计算得出该初选专利的持续热度值β,其中η1、η2、η3和η4均为系数因子;
S16:将服务评价系数标记为Ko,将服务评价系数Ko求取平均值得到服务评价均值K;
S17:将初选专利发明人答复用户问题的反应时间标记为J3o,J3o=J2o-J1o,o=1,...,n,将反应时间J3o求和并取平均值得到平均反应时间J;
S18:将初选专利发明人名下专利总数量标记为P1;将初选专利发明人名下已成交的专利数量标记为P2;
S19:利用公式
Figure BDA0002623256400000113
计算得出该初选专利发明人的信誉值R,其中c1、c2、c3和c4均为系数因子;
S20:利用公式
Figure BDA0002623256400000114
得出该初选专利的推送值TS;其中d1、d2、d3、d4和d5为预设比例系数;λ=0.00564327;P(x)为用户对该初选专利的兴趣值;
数据分析模块将推送值TS传输到服务器,服务器根据推送值TS对初选专利做降序排列并将排列后的初选专利发送至用户终端;
浏览模块用于用户终端浏览专利信息,并将浏览记录发送至服务器;浏览记录包括浏览时间、持续时长以及评论、转发、收藏和点赞的行为特征;浏览时间为用户点开专利链接的时间;用户行为分析模块用于接收服务器传输的浏览记录并作出分析;具体步骤包括:
S41:获取浏览记录中浏览时间并将浏览时间标记为Hx,将持续时长标记为Rx,评论行为值标记为S(C),转发行为值标记为S(D),收藏行为值标记为S(E),点赞行为值标记为S(F);
S42:获取***当前时间,将当前时间标记为TV,利用公式
Figure BDA0002623256400000121
计算得出该条记录的时效值f(x);其中g1为系数因子,Hx与TV越接近,则f(x)值越大;σ为预设因子;
S43:若用户对该专利有评论,则S(C)=1,否则S(C)=0;若用户对该专利有转发,则S(D)=1,否则S(D)=0;若用户对该专利有收藏,则S(E)=1,否则S(E)=0,若用户对该专利有点赞,则S(F)=1,否则S(F)=0;
S44:利用公式
Figure BDA0002623256400000122
计算得出用户对该专利的兴趣值P(x);其中g2为预设系数因子;
服务器接收到检索模块传输的检索信息时会自动驱动控制计时模块开始计时,在服务器返回检索结果至用户终端时会通过检索模块向服务器传输检索信号,在浏览器关闭时会通过检索模块向服务器传输解决信号;服务器在接收到反应信号和解决信号时均会驱动计时模块记录检索时间和解决时间;服务器将检索时间标记为RT1并将其传输到评价模块,服务器将解决时间标记为RT2并将其传输到评价模块;
评价模块用于用户对专利的检索服务进行评价,评价规则为:给检索服务评分,满分为100分;评价模块的具体工作步骤如下:
S51:将服务评分标记为Qs;获取整个检索过程中用户浏览专利的数量并将其标记为Cs;
S52:根据大数据内用户对服务评分Qs、浏览专利的数量Cs、检索时间RT1和解决时间RT2的重视程度分配权重;
对服务评分Qs分配权重为D1;对浏览专利的数量Cs分配权重为D2;对检索时间RT1分配权重D3,对解决时间RT2分配权重为D4;且D1+D2+D3+D4=1;D1>D2>D3>D4;
S53:利用公式
Figure BDA0002623256400000131
计算得到用户的检索满意值QR;
评价模块用于将检索满意值QR传输到服务器,服务器用于将检索满意值QR打上时间戳存储到存储模块并将检索满意值QR传输到显示模块进行实时显示。
基于大数据的知识产权信息检索软件管理***及方法,在工作时,用户通过若干个用户终端进行注册和登录,并通过浏览模块对专利进行浏览查看,而后通过检索模块发布检索信息;检索信息包括关键字和技术领域;同时数据采集模块采集每件专利的基本信息并将每件专利的基本信息传输到数据库进行存储;访问统计模块统计数据库中每件专利在***当前时间前10天内的点击信息并将点击信息传输到数据分析模块;调查模块监测每隔预设时间专利的发明人与用户的交流信息并将交流信息传输到数据分析模块;数据分析模块接收点击信息和交流信息并结合检索模块进行专利的推送分析;首先获取符合检索信息中关键字和技术领域的专利并将其标记为初选专利;将***当前时间前10天内该初选专利每天被点击的次数标记为Bk,每次点击的观看时间标记为Tki,每天被评论的次数标记为Ck,每天被转发的次数标记为Dk,每天被收藏的次数标记为Ek,每天被点赞的次数标记为Fk;其中
Figure BDA0002623256400000141
利用公式
Figure BDA0002623256400000142
计算得出该初选专利每天的热度值Qk;利用公式β=(L×η1-α×η2)(η3+η4)计算得出该初选专利的持续热度值β;
将服务评价系数标记为Ko,将服务评价系数Ko求取平均值得到服务评价均值K,将初选专利发明人答复用户问题的反应时间标记为J3o,将反应时间J3o求和并取平均值得到平均反应时间J;将初选专利发明人名下专利总数量标记为P1;将初选专利发明人名下已成交的专利数量标记为P2;利用公式
Figure BDA0002623256400000143
计算得出该初选专利发明人的信誉值R;利用公式
Figure BDA0002623256400000144
得出该初选专利的推送值TS;服务器根据推送值TS对初选专利做降序排列并将排列后的初选专利发送至用户终端;
用户终端通过浏览模块浏览专利信息,并将浏览记录发送至服务器;用户行为分析模块用于接收服务器传输的浏览记录并作出分析;获取浏览记录中浏览时间并将浏览时间标记为Hx,将持续时长标记为Rx,评论行为值标记为S(C),转发行为值标记为S(D),收藏行为值标记为S(E),点赞行为值标记为S(F);获取***当前时间,将当前时间标记为TV,利用公式
Figure BDA0002623256400000145
计算得出该条记录的时效值f(x);
利用公式
Figure BDA0002623256400000151
计算得出用户对该专利的兴趣值P(x);
评价模块用于用户对专利的检索服务进行评价,评价规则为:给检索服务评分,满分为100分;首先将服务评分标记为Qs;获取整个检索过程中用户浏览专利的数量并将其标记为Cs,根据大数据内用户对服务评分Qs、浏览专利的数量Cs、检索时间RT1和解决时间RT2的重视程度分配权重;利用公式
Figure BDA0002623256400000152
计算得到用户的检索满意值QR;评价模块将检索满意值QR传输到服务器,服务器将检索满意值QR打上时间戳存储到存储模块并将检索满意值QR传输到显示模块进行实时显示。
上述公式均是由采集大量数据进行软件模拟及相应专家进行参数设置处理,得到与真实结果符合的公式。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims (5)

1.基于大数据的知识产权信息检索软件管理***,其特征在于,包括数据采集模块、若干个用户终端、浏览模块、用户行为分析模块、服务器、检索模块、数据采集模块、数据库以及评价模块;
所述用户终端用于录入用户的登录信息和注册信息,用户在已有账户时通过用户终端输入登录信息后进行登录,用户在不存在账户时通过用户终端输入注册信息注册新的账户后进行首次登录;
所述检索模块用于用户终端发布检索信息并将检索信息发送至服务器,所述检索信息包括关键字和技术领域;
所述数据采集模块用于采集每件专利的基本信息并将每件专利的基本信息传输到数据库进行存储;所述数据库用于存储服务器接收的浏览记录、评价记录、检索信息、登录信息以及注册信息;
所述访问统计模块用于统计数据库中每件专利在***当前时间前10天内的点击信息并将点击信息传输到数据分析模块;所述调查模块用于监测每隔预设时间专利的发明人与用户的交流信息并将交流信息传输到数据分析模块;
所述数据分析模块接收点击信息和交流信息并结合检索模块进行专利的推送分析,具体推送分析过程如下:
S11:获取符合检索信息中关键字和技术领域的专利并将其标记为初选专利;
S12:将***当前时间前10天内该初选专利每天被点击的次数标记为Bk,每次点击的观看时间标记为Tki,每天被评论的次数标记为Ck,每天被转发的次数标记为Dk,每天被收藏的次数标记为Ek,每天被点赞的次数标记为Fk;k=1,2,…,10;i=1,2,…,Bk;
S13:将***当前时间前10天内该初选专利每天被观看的时间标记为Tk;
Figure FDA0002623256390000021
S14:利用公式
Figure FDA0002623256390000022
计算得出该初选专利每天的热度值Qk,其中,b1、b2、b3、r1、r2、r3和r4均为系数因子;
S15:按照平均值计算公式得出该初选专利当前时间前10天内的平均热度值L;按照标准差计算公式得出前10天内该初选专利每天热度值的标准差α,利用公式
Figure FDA0002623256390000023
计算得出该初选专利的持续热度值β,其中η1、η2、η3和η4均为系数因子;
S16:将服务评价系数标记为Ko,将服务评价系数Ko求取平均值得到服务评价均值K;
S17:将初选专利发明人答复用户问题的反应时间标记为J3o,所述J3o=J2o-J1o,o=1,...,n,将反应时间J3o求和并取平均值得到平均反应时间J;
S18:将初选专利发明人名下专利总数量标记为P1;将初选专利发明人名下已成交的专利数量标记为P2;
S19:利用公式
Figure FDA0002623256390000024
计算得出该初选专利发明人的信誉值R,其中c1、c2、c3和c4均为系数因子;
S20:利用公式
Figure FDA0002623256390000025
得出该初选专利的推送值TS;其中d1、d2、d3、d4和d5为预设比例系数;λ=0.00564327;P(x)为用户对该初选专利的兴趣值;
所述数据分析模块将推送值TS传输到服务器,所述服务器根据推送值TS对初选专利做降序排列并将排列后的初选专利发送至用户终端。
2.根据权利要求1所述的基于大数据的知识产权信息检索软件管理***,其特征在于,所述浏览模块用于用户终端浏览专利信息,并将浏览记录发送至服务器;所述浏览记录包括浏览时间、持续时长以及评论、转发、收藏和点赞的行为特征;所述浏览时间为用户点开专利链接的时间;所述用户行为分析模块用于接收服务器传输的浏览记录并作出分析;具体步骤包括:
S41:获取浏览记录中的浏览时间并将浏览时间标记为Hx,将持续时长标记为Rx,评论行为值标记为S(C),转发行为值标记为S(D),收藏行为值标记为S(E),点赞行为值标记为S(F);
S42:获取***当前时间,将当前时间标记为TV,利用公式
Figure FDA0002623256390000031
计算得出该条记录的时效值f(x);其中g1为系数因子,Hx与TV越接近,则f(x)值越大;σ为预设因子;
S43:若用户对该专利有评论,则S(C)=1,否则S(C)=0;若用户对该专利有转发,则S(D)=1,否则S(D)=0;若用户对该专利有收藏,则S(E)=1,否则S(E)=0,若用户对该专利有点赞,则S(F)=1,否则S(F)=0;
S44:利用公式
Figure FDA0002623256390000032
计算得出用户对该专利的兴趣值P(x);其中g2为预设系数因子。
3.根据权利要求1所述的基于大数据的知识产权信息检索软件管理***,其特征在于,所述服务器接收到检索模块传输的检索信息时会自动驱动控制计时模块开始计时,在服务器返回检索结果至用户终端时会通过检索模块向服务器传输检索信号,在浏览器关闭时会通过检索模块向服务器传输解决信号;所述服务器在接收到反应信号和解决信号时均会驱动计时模块记录检索时间和解决时间;所述服务器将检索时间标记为RT1并将其传输到评价模块,服务器将解决时间标记为RT2并将其传输到评价模块;
所述评价模块用于用户对专利的检索服务进行评价,评价规则为:给检索服务评分,满分为100分;所述评价模块的具体工作步骤如下:
S51:将服务评分标记为Qs;获取整个检索过程中用户浏览专利的数量并将其标记为Cs;
S52:根据大数据内用户对服务评分Qs、浏览专利的数量Cs、检索时间RT1和解决时间RT2的重视程度分配权重;
对服务评分Qs分配权重为D1;对浏览专利的数量Cs分配权重为D2;对检索时间RT1分配权重D3,对解决时间RT2分配权重为D4;且D1+D2+D3+D4=1;D1>D2>D3>D4;
S53:利用公式
Figure FDA0002623256390000041
计算得到用户的检索满意值QR。
4.根据权利要求1所述的基于大数据的知识产权信息检索软件管理***,其特征在于,所述评价模块用于将检索满意值QR传输到服务器,所述服务器用于将检索满意值QR打上时间戳存储到存储模块并将检索满意值QR传输到显示模块进行实时显示;所述专利的基本信息包括专利包括发明人、发明类型、技术领域以及名称;所述点击信息包括点击次数、每次点击的观看时间以及评论、转发、收藏和点赞的行为特征;所述交流信息包括用户提出问题的时间J1x、发明人答复问题的时间J2x、服务评价系数、发明人名下专利总数量以及发明人名下已成交的专利数量,所述服务评价系数规则为:给发明人服务评分,满分为100分。
5.基于大数据的知识产权信息检索方法,其特征在于,包括如下步骤:
步骤一:用户通过若干个用户终端进行注册和登录,对专利进行浏览查看,而后发布检索信息;
步骤二:所述数据分析模块接收点击信息和交流信息并结合检索信息进行专利的推送分析;包括:
X11:获取符合检索信息中关键字和技术领域的专利并将其标记为初选专利;
X12:将***当前时间前10天内该初选专利每天被点击的次数标记为Bk,每次点击的观看时间标记为Tki,每天被评论的次数标记为Ck,每天被转发的次数标记为Dk,每天被收藏的次数标记为Ek,每天被点赞的次数标记为Fk;
X13:将***当前时间前10天内该初选专利每天被观看的时间标记为Tk;
Figure FDA0002623256390000051
X14:利用公式
Figure FDA0002623256390000052
计算得出该初选专利每天的热度值Qk;
X15:按照平均值计算公式得出该初选专利当前时间前10天内的平均热度值L;按照标准差计算公式得出前10天内该初选专利每天热度值的标准差α,利用公式
Figure FDA0002623256390000053
计算得出该初选专利的持续热度值β;
X16:将服务评价系数标记为Ko,将服务评价系数Ko求取平均值得到服务评价均值K;
X17:将初选专利发明人答复用户问题的反应时间标记为J3o;J3o=J2o-J1o;将反应时间J3o求和并取平均值得到平均反应时间J;
X18:将初选专利发明人名下专利总数量标记为P1;将初选专利发明人名下已成交的专利数量标记为P2;
X19:利用公式
Figure FDA0002623256390000061
计算得出该初选专利发明人的信誉值R;
X20:利用公式
Figure FDA0002623256390000062
得出该初选专利的推送值TS;
步骤三:根据推送值TS对专利做降序排列并将排列后的专利发送至用户终端;
步骤四:用户终端通过浏览模块浏览专利信息,并将浏览记录发送至服务器;用户行为分析模块接收服务器传输的浏览记录并作出分析;获得用户对专利的兴趣值P(x);具体步骤如下:
X31:获取浏览记录中的浏览时间并将浏览时间标记为Hx,将持续时长标记为Rx,评论行为值标记为S(C),转发行为值标记为S(D),收藏行为值标记为S(E),点赞行为值标记为S(F);
X32:获取***当前时间,将当前时间标记为TV,利用公式
Figure FDA0002623256390000063
计算得出该条记录的时效值f(x);其中g1为系数因子,Hx与TV越接近,则f(x)值越大;σ为预设因子;
X33:若用户对该专利有评论,则S(C)=1,否则S(C)=0;若用户对该专利有转发,则S(D)=1,否则S(D)=0;若用户对该专利有收藏,则S(E)=1,否则S(E)=0,若用户对该专利有点赞,则S(F)=1,否则S(F)=0;
X34:利用公式
Figure FDA0002623256390000064
计算得出用户对该专利的兴趣值P(x);
步骤五:检索完成后,用户通过评价模块对专利的检索服务进行评价,包括:
X41:将服务评分标记为Qs;获取整个检索过程中用户浏览专利的数量并将其标记为Cs;
X42:根据大数据内用户对服务评分Qs、浏览专利的数量Cs、检索时间RT1和解决时间RT2的重视程度分配权重;
对服务评分Qs分配权重为D1;对浏览专利的数量Cs分配权重为D2;对检索时间RT1分配权重D3,对解决时间RT2分配权重为D4;且D1+D2+D3+D4=1;D1>D2>D3>D4;
X43:利用公式
Figure FDA0002623256390000071
计算得到用户的检索满意值QR;
步骤六:服务器将检索满意值QR打上时间戳存储到存储模块并将检索满意值QR传输到显示模块进行实时显示。
CN202010789517.9A 2020-08-07 2020-08-07 基于大数据的知识产权信息检索软件管理***及方法 Active CN112131459B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010789517.9A CN112131459B (zh) 2020-08-07 2020-08-07 基于大数据的知识产权信息检索软件管理***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010789517.9A CN112131459B (zh) 2020-08-07 2020-08-07 基于大数据的知识产权信息检索软件管理***及方法

Publications (2)

Publication Number Publication Date
CN112131459A true CN112131459A (zh) 2020-12-25
CN112131459B CN112131459B (zh) 2021-06-01

Family

ID=73850262

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010789517.9A Active CN112131459B (zh) 2020-08-07 2020-08-07 基于大数据的知识产权信息检索软件管理***及方法

Country Status (1)

Country Link
CN (1) CN112131459B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348602A (zh) * 2021-01-07 2021-02-09 浙江争游网络科技有限公司 一种基于大数据的广告自动化投放管理***
CN113011798A (zh) * 2021-05-24 2021-06-22 江苏荣泽信息科技股份有限公司 一种基于区块链的产品检测信息处理***
CN113111333A (zh) * 2021-04-15 2021-07-13 广东省林业科学研究院 一种快检平台用远程交互***
CN118096267A (zh) * 2024-04-29 2024-05-28 山东铂明网络科技有限公司 一种基于数据分析的个性化广告投放***及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8010527B2 (en) * 2007-06-29 2011-08-30 Fuji Xerox Co., Ltd. System and method for recommending information resources to user based on history of user's online activity
CN102930052A (zh) * 2012-11-19 2013-02-13 西北大学 一种基于多维度属性关注度的兴趣资源推荐方法
CN105630871A (zh) * 2015-12-16 2016-06-01 广州神马移动信息科技有限公司 搜索结果显示方法、装置及搜索***
CN109783740A (zh) * 2019-01-24 2019-05-21 北京字节跳动网络技术有限公司 关注页面的排序方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8010527B2 (en) * 2007-06-29 2011-08-30 Fuji Xerox Co., Ltd. System and method for recommending information resources to user based on history of user's online activity
CN102930052A (zh) * 2012-11-19 2013-02-13 西北大学 一种基于多维度属性关注度的兴趣资源推荐方法
CN105630871A (zh) * 2015-12-16 2016-06-01 广州神马移动信息科技有限公司 搜索结果显示方法、装置及搜索***
CN109783740A (zh) * 2019-01-24 2019-05-21 北京字节跳动网络技术有限公司 关注页面的排序方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348602A (zh) * 2021-01-07 2021-02-09 浙江争游网络科技有限公司 一种基于大数据的广告自动化投放管理***
CN112348602B (zh) * 2021-01-07 2021-04-06 浙江争游网络科技有限公司 一种基于大数据的广告自动化投放管理***
CN113111333A (zh) * 2021-04-15 2021-07-13 广东省林业科学研究院 一种快检平台用远程交互***
CN113111333B (zh) * 2021-04-15 2022-03-04 广东省林业科学研究院 一种快检平台用远程交互***
CN113011798A (zh) * 2021-05-24 2021-06-22 江苏荣泽信息科技股份有限公司 一种基于区块链的产品检测信息处理***
CN113011798B (zh) * 2021-05-24 2021-08-13 江苏荣泽信息科技股份有限公司 一种基于区块链的产品检测信息处理***
CN118096267A (zh) * 2024-04-29 2024-05-28 山东铂明网络科技有限公司 一种基于数据分析的个性化广告投放***及方法

Also Published As

Publication number Publication date
CN112131459B (zh) 2021-06-01

Similar Documents

Publication Publication Date Title
CN112131459B (zh) 基于大数据的知识产权信息检索软件管理***及方法
CN112348602B (zh) 一种基于大数据的广告自动化投放管理***
JP5632574B2 (ja) ニュース記事のランク付けを向上させるためのシステムおよび方法
US8527585B2 (en) Prereading method and system for web browser
US20070136429A1 (en) Methods and systems for building participant profiles
US20140200988A1 (en) System and method for normalizing campaign data gathered from a plurality of advertising platforms
US20050235030A1 (en) System and method for estimating prevalence of digital content on the World-Wide-Web
CN106227832A (zh) 互联网大数据技术架构在企业内业务分析中的应用方法
US20110238662A1 (en) Method and system for searching a wide area network
CN102667761A (zh) 可扩展的集群数据库
KR20060121923A (ko) 인터넷 상의 웹사이트들의 동작을 분석하기 위한 방법 및툴
TW200925909A (en) Traffic predictor for network-accessible informaton modules
JP2002334104A (ja) 情報配信システム、情報配信サーバ、クライアント、情報送信方法、受信方法、並びにプログラム
JP2006202253A (ja) 情報評価装置、コンテンツ検索装置、情報評価方法、コンテンツ検索方法、それらのプログラム及び記録媒体
CN105183925A (zh) 内容关联推荐方法及装置
JP2002342124A (ja) オブジェクト指向技術を用いたユーザ操作履歴保存装置
CN110533467A (zh) 基于大数据分析的用户行为分析平台及其工作方法
Wu et al. Mining web navigations for intelligence
CN107977452A (zh) 一种基于大数据的信息检索***及方法
CN102298621B (zh) 基于关注度的同源信息搜索引擎聚合显示方法的获取网页用户关注度PageFocus的***
CN111159519B (zh) 一种基于网站点击流的公共安全舆情分析方法
KR20010087880A (ko) 인터넷 지식 정보 등록 및 검색 서비스 시스템과 방법
CN113449169B (zh) 一种基于rpa的舆情数据获取方法及***
JP2007513440A (ja) 情報を概念的に編成してプレゼンテーションする方法及びシステム
JP2022111544A (ja) 情報処理システム、及び情報処理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230531

Address after: Unit A204/A205, 2nd Floor, Building A, Zima Technology Innovation Industrial Park, No. 18 Xinhua Street, Xincun, East District, Zhongshan City, Guangdong Province, 528400

Patentee after: Zhongshan Kewo Technology Service Co.,Ltd.

Address before: 509 Kangrui Times Square, Keyuan Business Building, 39 Huarong Road, Gaofeng Community, Dalang Street, Longhua District, Shenzhen, Guangdong Province, 518000

Patentee before: Shenzhen lizhuan Technology Transfer Center Co.,Ltd.

Effective date of registration: 20230531

Address after: 509 Kangrui Times Square, Keyuan Business Building, 39 Huarong Road, Gaofeng Community, Dalang Street, Longhua District, Shenzhen, Guangdong Province, 518000

Patentee after: Shenzhen lizhuan Technology Transfer Center Co.,Ltd.

Address before: 510800 Haibu, Shiling Town, Huadu District, Guangzhou City, Guangdong Province

Patentee before: GUANGZHOU College OF TECHNOLOGY AND BUSINESS

CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: Unit A204/A205, 2nd Floor, Building A, Zima Technology Innovation Industrial Park, No. 18 Xinhua Street, Xincun, East District, Zhongshan City, Guangdong Province, 528400

Patentee after: Guangdong Kewo Technology Service Co.,Ltd.

Address before: Unit A204/A205, 2nd Floor, Building A, Zima Technology Innovation Industrial Park, No. 18 Xinhua Street, Xincun, East District, Zhongshan City, Guangdong Province, 528400

Patentee before: Zhongshan Kewo Technology Service Co.,Ltd.