CN116910352A - 基于人工智能的报表推荐方法、装置、设备及介质 - Google Patents
基于人工智能的报表推荐方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116910352A CN116910352A CN202310651645.0A CN202310651645A CN116910352A CN 116910352 A CN116910352 A CN 116910352A CN 202310651645 A CN202310651645 A CN 202310651645A CN 116910352 A CN116910352 A CN 116910352A
- Authority
- CN
- China
- Prior art keywords
- report
- user
- target
- recommended
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 27
- 239000011159 matrix material Substances 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 238000013075 data extraction Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000004891 communication Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 6
- 230000006399 behavior Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Finance (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Accounting & Taxation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例涉及人工智能技术领域,公开了一种基于人工智能的报表推荐方法、装置、设备及介质,所述方法包括:获取报表的历史调用信息;根据所述用户数据和所述身份数据构建不同用户之间的交集统计表;通过交集统计表计算不同用户的相似度值,并基于所述相似度值确定不同用户的相似关系;获取待推荐用户的用户数据,并通过待推荐用户的用户数据与所述相似关系确定与所述待推荐用户存在相似关系的目标用户;在所述历史调用信息中确定所述目标用户调用过的目标报表,并将所述目标报表推荐给所述待推荐用户。通过计算用户之间的相似度,更精准辨别不同用户的相似程度,避免特征识别的误差。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于人工智能的报表推荐方法、装置、设备及介质。
背景技术
数据报表作为常用的数据载体被应用于实际生活中的各个方面,例如传统的银行报表需求模式,当工作人员需要查看报表时,需要对接特定的技术人员才将这种报表诉求传达给服务端,服务端针对报表诉求进行报表推荐,整个过程需要较长的时间,缺少智能化,而且不同报表因为权限分配等不同问题导致有相同诉求的用户,无法共享报表,部分用户只能依赖单一的推广方式了解报表情况,进而导致一线用户的需求落地时间长,而且需求落地后的可扩展性受到限制,同时,报表***的报表数量庞大种类繁多,用户并不了解***中已有的报表资源,导致用户看不到想要的报表,也造成报表数据资源的浪费,影响了业务用户的工作效率。
现有的报表推荐方法通过特征提取的方式对用户进行分类,进而完成报表的推荐,但特征提取的过程需要预先训练模型,对每个用户都进行特征提取,特征对比等过程,虽在部分程度上提高了报表推荐的智能化,但存在漏推荐,重复推荐,计算量大,运算时间长,效率低的问题。
发明内容
有鉴于此,本发明提供了一种基于人工智能的报表推荐方法、装置、设备及介质,用于解决现有技术中报表推荐效率低下,推荐质量低下问题。
为达上述之一或部分或全部目的或是其他目的,本发明提出一种基于人工智能的报表推荐方法,包括:获取报表的历史调用信息,所述历史调用信息包括调用所述报表的历史用户的用户数据和所述报表的身份数据;
根据所述用户数据和所述身份数据构建不同用户之间的交集统计表;
通过所述交集统计表计算不同用户之间的相似度值,并基于所述相似度值确定不同用户之间的相似关系;
获取待推荐用户的用户数据,并通过待推荐用户的用户数据与所述相似关系确定与所述待推荐用户存在相似关系的目标用户;
在所述历史调用信息中确定所述目标用户调用过的目标报表,并将所述目标报表推荐给所述待推荐用户。
另一方面,本申请提供了一种基于人工智能的报表推荐装置,所述装置包括:
数据提取模块,用于获取报表的历史调用信息,所述历史调用信息包括调用所述报表的历史用户的用户数据和所述报表的身份数据;
构建模块,用于根据所述用户数据和所述身份数据构建不同用户之间的交集统计表;
计算模块,用于通过所述交集统计表计算不同用户之间的相似度值,并基于所述相似度值确定不同用户之间的相似关系;
请求接收模块,用于获取待推荐用户的用户数据,并通过待推荐用户的用户数据与所述相似关系确定与所述待推荐用户存在相似关系的目标用户;
推荐模块,用于在所述历史调用信息中确定所述目标用户调用过的目标报表,并将所述目标报表推荐给所述待推荐用户。
第三方面,本申请提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线通信,所述机器可读指令被所述处理器执行时执行:获取报表的历史调用信息,所述历史调用信息包括调用所述报表的历史用户的用户数据和所述报表的身份数据;根据所述用户数据和所述身份数据构建不同用户之间的交集统计表;通过所述交集统计表计算不同用户之间的相似度值,并基于所述相似度值确定不同用户之间的相似关系;获取待推荐用户的用户数据,并通过待推荐用户的用户数据与所述相似关系确定与所述待推荐用户存在相似关系的目标用户;在所述历史调用信息中确定所述目标用户调用过的目标报表,并将所述目标报表推荐给所述待推荐用户的步骤。
第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行:获取报表的历史调用信息,所述历史调用信息包括调用所述报表的历史用户的用户数据和所述报表的身份数据;根据所述用户数据和所述身份数据构建不同用户之间的交集统计表;通过所述交集统计表计算不同用户之间的相似度值,并基于所述相似度值确定不同用户之间的相似关系;获取待推荐用户的用户数据,并通过待推荐用户的用户数据与所述相似关系确定与所述待推荐用户存在相似关系的目标用户;在所述历史调用信息中确定所述目标用户调用过的目标报表,并将所述目标报表推荐给所述待推荐用户的步骤。
实施本发明实施例,将具有如下有益效果:
通过获取报表的历史调用信息,所述历史调用信息包括调用所述报表的历史用户的用户数据和所述报表的身份数据;根据所述用户数据和所述身份数据构建不同用户之间的交集统计表;通过所述交集统计表计算不同用户之间的相似度值,并基于所述相似度值确定不同用户之间的相似关系;获取待推荐用户的用户数据,并通过待推荐用户的用户数据与所述相似关系确定与所述待推荐用户存在相似关系的目标用户;在所述历史调用信息中确定所述目标用户调用过的目标报表,并将所述目标报表推荐给所述待推荐用户。可以及时获取用户使用报表的行为数据,例如,报表的历史调用信息有效分析出报表适合的用户和用户可能需要的报表,准确高效寻找***,将报表的使用率最大化,使公司的数据资源利用率最大化,避免出现用户需要的报表漏提供,不需要的报表强行提供的现象,实时采集用户使用报表的数据,实时分析用户使用报表的情况,也能促进报表***服务能力提升,从而提高用户业务工作效率。与提取用户特征,并基于用户特征识别相似用户的方法相比,大大减小了计算量,提高了报表推荐的效率,通过计算用户之间的相似度,更精准直观地辨别不同用户的相似程度,避免特征识别的误差。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1是本申请实施例提供的一种基于人工智能的报表推荐方法的应用场景图;
图2是本申请实施例提供的一种基于人工智能的报表推荐方法的流程图;
图3是本申请实施例提供的一种基于人工智能的报表推荐装置的结构示意图;
图4是本发明一实施例中计算机设备的一结构示意图;
图5是本发明一实施例中计算机设备的另一结构示意图。
图6是本申请实施例提供的一种电子设备的结构示意图;
图7是本申请实施例提供的一种存储介质的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的基于人工智能的报表推荐方法,可应用在如图1的应用环境中,其中,客户端通过网络与服务端进行通信。服务端可以获取报表的历史调用信息,所述历史调用信息包括调用所述报表的历史用户的用户数据和所述报表的身份数据;根据所述用户数据和所述身份数据构建不同用户之间的交集统计表;通过所述交集统计表计算不同用户之间的相似度值,并基于所述相似度值确定不同用户之间的相似关系;通过所述客户端获取待推荐用户的用户数据,并通过待推荐用户的用户数据与所述相似关系确定与所述待推荐用户存在相似关系的目标用户;在所述历史调用信息中确定所述目标用户调用过的目标报表,并将所述目标报表推荐给所述待推荐用户,即,将所述目标报表推荐至所述客户端。在本发明中,获取用户使用报表的行为数据有效分析出相似的用户,并根据相似用户调用的报表预测待推荐用户可能需要的报表,准确高效寻找***,将报表的使用率最大化,使报表资源利用率最大化,避免出现用户需要的报表漏提供,不需要的报表强行提供的现象,实时采集用户使用报表的数据,实时分析用户使用报表的情况,也能促进报表***服务能力提升,从而提高用户业务工作效率。其中,客户端可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。下面通过具体的实施例对本发明进行详细的描述。
如图2所示,本申请实施例提供了一种基于人工智能的报表推荐方法,包括:
S101、获取报表的历史调用信息,所述历史调用信息包括调用所述报表的历史用户的用户数据和所述报表的身份数据;
本申请实施例提供的报表推荐方法,可应用于各种场景下的信息推广装置或信息推广引擎中,选择特定信息进行推广的过程通常通过服务端来实现,该服务端可以实时接收用户的用户数据。比如,在银行***内部的人员,常常需要通过报表进行业务核对、风险分析等操作,常需要信息推广引擎将可能用到的报表主动推送出来,以提高银行***内部的人员的操作效率。
示例性的,每个用户每一次登录报表***进行检索报表、查看报表、收藏报表、订阅报表等操作时,服务端均会生成日志数据,即,报表的历史调用信息,而所述日志数据中记录有用户的用户数据和***作的报表的身份数据,具体的得到“哪个用户在什么时间对哪个报表进行了什么操作”。针对日志数据,可以通过用于转发集中日志数据的传输工具(FileBeat)实时采集服务端生成的日志数据,并将数据储存到高吞吐量的分布式发布订阅消息***(Kafka)。
示例性的,为保证后续推荐的报表的准确性,作为推荐基础的日志数据需要保证数据的正确性,因此,需要在所述日志数据中查找出丢弃缺失用户信息或报表信息的无效日志并剔除,具体的,根据用户对报表的操作类型将日志数据分为两个维度,查找搜索操作的日志数据中的无效日志时,使用日志收集***(flume)服务器1处理;查找收藏订阅操作的日志数据中的无效日志时,使用flume服务器2处理,可以分流对日志数据处理时的压力。
其中,所述用户数据可以为能够代表用户身份的ID、编号和身份识别码等,所述身份数据可以为能够代表报表的报表名称等。
S102、根据所述用户数据和所述身份数据构建不同用户之间的交集报表;
在获取所述用户数据和所述身份数据后,得到每个用户对哪些报表进行了调用,例如,存在用户A、用户B、用户C和用户D,存在报表r1、报表r2、报表r3、报表r4和报表r5,为更直观地表现用户与报表的关系,采用表1用户-报表关系表进行表示:
表1:用户-报表关系表
用户 | 报表 |
A | r1,r2,r4 |
B | r1,r3,r4 |
C | r2,r5 |
D | r3,r4,r5 |
即,用户A调用过报表r1、报表r2和报表r4,用户B调用过报表r1、报表r3和报表r4,用户C调用过报表r2和报表r5,用户D调用过报表r3、报表r4和报表r5。
在一种可能的实施方式中,所述根据所述用户数据和所述身份数据构建不同用户之间的交集报表的步骤,包括:
根据所述用户数据和所述身份数据将调用同一报表的历史用户进行分类,得到分类数据,并基于所述分类数据构建分类矩阵;
基于所述分类矩阵构建不同用户之间的交集矩阵,并统计所述交集矩阵中不同用户之间交集报表的数量构建所述交集统计表。
示例性的,如表1所示的用户数据和身份数据,将用户按使用报表的情况划分成若干个类,比如用户A和用户B都使用了报表r1,所以被分在划分在一个类中,得到分类数据,即,表2:报表-用户关系表:
表2:报表-用户关系表
报表 | 用户 |
r1 | A,B |
r2 | A,C |
r3 | B,D |
r4 | A,B,D |
r5 | C,D |
即,报表r1的用户为用户A和用户B,报表r2的用户为用户A和用户C,报表r3的用户为用户B和用户D,报表r4的用户为用户A、用户B和用户D,报表r5的用户为用户C和用户D。
构建不同用户之间的交集矩阵,并统计所述交集矩阵中不同用户之间交集报表的数量构建所述交集统计表,如表3:交集统计表所示:
表3:交集统计表
用户 | A | B | C | D |
A | 0 | 2 | 1 | 1 |
B | 2 | 0 | 0 | 2 |
C | 1 | 0 | 0 | 1 |
D | 1 | 2 | 1 | 0 |
其中,用户A和用户B有两个交集报表,即,报表r1和报表r4;用户A和用户C有一个交集报表,即,报表r2;用户A和用户D有一个交集报表,即,报表r4;用户B和用户D有两个交集报表,即,报表r3和报表r4;用户B和用户C不存在交集报表;用户C和用户D有一个交集报表,即,报表r5。
S103、通过所述交集统计表计算不同用户之间的相似度值,并基于所述相似度值确定不同用户之间的相似关系;
在一种可能的实施方式中,所述通过所述交集报表计算不同用户之间的相似度值,并基于所述相似度值确定不同用户之间的相似关系的步骤,包括:
通过余弦相似度算法计算不同用户之间的相似度值Wμv,其中,所述余弦相似度算法中将所述不同用户之间交集报表的数量作为除数|N(μ)∩N(v)|,将不同用户调用的所有报表的数量之积的开根号值作为被除数其中,余弦相似度公式为:
例如,用户A和用户C的相识度值为:
根据不同用户之间的相似度值构建相似度矩阵,如表4所示:
表4:相似度矩阵
用户 | A | B | C | D |
A | 0 | 0.67 | 0.41 | 0.33 |
B | 0.67 | 0 | 0 | 0.67 |
C | 0.41 | 0 | 0 | 0.41 |
D | 0.33 | 0.67 | 0.41 | 0 |
由于不同用户之间的交集矩阵为对称矩阵,所以所述相似度矩阵也是一个对称矩阵,即,用户A和用户B的交集和用户B和用户A的交集相同,用户A和用户B的相似度等于用户B和用户A的相似度。
若所述相似度值大于等于阈值,则确定不同用户之间具有相似关系;
若所述相似度值小于所述阈值,则确定不同用户之间不具有相似关系。
以在银行***为例,存在各种各样的报表,报表的数量较大,因此,阈值的选择极为重要,阈值过大,则容易造成漏掉待推荐用户的相似用户的风险,阈值过小,则容易造成满足推荐条件的报表的数量巨大,带来不必要的推荐,因此,阈值的选择根据实际需求进行选择。本例采用的阈值为0.4,当不同用户的相似度值大于等于0.4,则确定不同用户之间具有相似关系,当不同用户的相似度值小于0.4,则确定不同用户之间不具有相似关系,在避免漏推荐的风险的同时,控制满足推荐条件的报表的数量。
S104、获取待推荐用户的用户数据,并通过待推荐用户的用户数据与所述相似关系确定与所述待推荐用户存在相似关系的目标用户;
比如获取待推荐用户的用户数据,以确定待推荐用户为用户C,则通过所述相似度矩阵,用户A与用户C的相似度高于0.4,用户D与用户C的相似度高于0.4,则确定用户A与用户D具有相似关系,即,用户A与用户D均为目标用户。
S105、在所述历史调用信息中确定所述目标用户调用过的目标报表,并将所述目标报表推荐给所述待推荐用户。
示例性的,通过表1和/或表2查询到用户A使用过报表r1,报表r2,报表r4,用户D使用过报表r3,报表r4,报表r5,所以用户A和用户D的报表交集结果是报表r1,报表r2,报表r3,报表r4,报表r5,即,目标报表为报表r1,报表r2,报表r3,报表r4,报表r5。
在将报表r1,报表r2,报表r3,报表r4,报表r5推荐给所述待推荐用户前,为避免重复推荐,获取所述待推荐用户在预设时间内的报表浏览数据,所述报表浏览数据包括所述待推荐用户在预设时间内已浏览报表的身份数据;根据所述已浏览报表的身份数据在所述推荐顺序中剔除所述已浏览报表,得到目标推荐顺序,,以将所述目标报表按所述目标推荐顺序推荐给所述待推荐用。例如,用户C在一个小时内已浏览过报表r2和报表r5,则只将报表r1,报表r3和报表r4推荐给所述待推荐用户。
通过获取报表的历史调用信息,所述历史调用信息包括调用所述报表的历史用户的用户数据和所述报表的身份数据;采集用户使用报表的数据,实时分析用户使用报表的情况,可以及时获取用户使用报表的行为数据有效分析出报表适合的用户和用户可能需要的报表,准确高效寻找***;根据所述用户数据和所述身份数据构建不同用户之间的交集统计表;通过所述交集统计表计算不同用户之间的相似度值,并基于所述相似度值确定不同用户之间的相似关系;与提取用户特征,并基于用户特征识别相似用户的方法相比,大大减小了计算量,提高了报表推荐的效率,通过计算用户之间的相似度,更精准直观地辨别不同用户的相似程度,避免特征识别的误差;获取待推荐用户的用户数据,并通过待推荐用户的用户数据与所述相似关系确定与所述待推荐用户存在相似关系的目标用户;在所述历史调用信息中确定所述目标用户调用过的目标报表,并将所述目标报表推荐给所述待推荐用户。实时分析用户使用报表的情况,也能促进报表***服务能力提升,从而提高用户业务工作效率。
在一种可能的实施方式中,在所述将所述目标报表推荐给所述待推荐用户的步骤之前,还包括:
当所述目标报表为所述交集报表时,获取所述目标用户与所述待推荐用户的目标相似度值,并将所述目标相似度值作为所述目标报表的使用度值;
按所述使用度值对各目标报表进行排序,生成所述目标报表的推荐顺序,以将所述目标报表按所述推荐顺序推荐给所述待推荐用户。
示例性的,在获取报表r1的使用度值,报表r1为用户A与所述待推荐用户,用户C的交集报表,则将用户A与用户C的相似度值作为报表r1的使用度值;在获取报表r4的使用度值,报表r4为用户A与所述待推荐用户,用户C的交集报表,同时,报表r4也为用户D与所述待推荐用户,用户C的交集报表,则将用户A与用户C的相似度值与用户D与用户C的相似度值之和作为报表r4的使用度值.
具体的,根据表3所示的相似度值,用户C对报表r1的使用度为:w[c][a]=0.41,用户C对报表r3的使用度为:w[c][d]=0.41,用户C对报表r4的使用度为:w[c][a]+w[c][d]=0.82。
按所述使用度值对各目标报表进行排序,生成所述目标报表的推荐顺序为报表r4,报表r3,报表r1。
在一种可能的实施方式中,所述方法,还包括:
基于所述历史调用信息中调用所述报表的历史用户的用户数据将所述历史用户按职能部门进行分类,得到各职能部门对所述报表的调用信息;
根据各职能部门对所述报表的调用信息计算各职能部门对于所述报表的关注度,得到关注度表;
获取所述待推荐用户的用户数据,并确定所述待推荐用户所属的目标职能部门,在所述关注度表中确定所述目标职能部门对于所述报表的目标关注度;
按所述目标关注度由大到小的顺序排列所有报表,并选择预设数量个排名靠前的报表推荐至所述待推荐用户。
示例性的,按企业的框架可知整个企业内包含不同的职能部门,如银行企业包含风险部和交易银行等职能部门,由于不同职能部门所负责的具体业务不同,因此不同部门对同一报表的关注度不同,为了保证报表推荐的准确性,使得推荐的报表具有针对性,则计算出不同报表在不同职能部门的均值avg,avg=按部门汇总报表分值/该部门使用该报表的记录总数,将不同报表在不同职能部门的均值avg作为各职能部门对于所述报表的关注度。
不同报表在不同职能部门的均值avg,如表4所示:
表4:部门均值表
风险部报表推荐顺序为:报表r3,报表r1,报表r2,报表r4,报表r5;交易银行报表推荐顺序为:报表r2,报表r5,报表r3,报表r1,报表r4。
在计算各职能部门对于所述报表的关注度之前,获取所有报表的名称信息,提取所述名称信息的关键词,基于所述关键词判断各报表与目标职能部门的关联程度,将与目标职能部门关联性较低的报表剔除,例如,当所述目标职能部门为风险部门时,名称信息内包括“采购”的报表与风险部门的关联性较低,显然,名称信息内包括“采购”的报表不应该被推荐,因此,并不需要计算名称信息内包括“采购”的报表在风险部的均值avg,可以直接将名称信息内包括“采购”的报表忽略,减少计算量,提高报表推荐效率。而当所述目标职能部门为后勤部门时,名称信息内包括“采购”的报表与后勤部的关联性较高,需要计算名称信息内包括“采购”的报表在后勤部的均值avg,以避免遗漏推荐。
对所述报表的操作类型分为查看、搜索、收藏、订阅,设置查看报表的评分为1,搜索报表的评分为2,收藏报表的评分为3,订阅报表的评分为4,比如:目标部门中有4条报表1的使用记录分布是查看、搜索、收藏、订阅,不加权重情况下,那报表r1在目标部门中的评分为:(1+2+3+4)/4=2.5。
而当用户不属于任何职能部门时,通过所述历史调用信息确定热点报表,即,被不属于任何职能部门的用户调用频率高于预设频率的报表,并根据调用频率生成推荐顺序。
在一种可能的实施方式中,所述根据各职能部门对所述报表的调用信息计算各职能部门对于所述报表的关注度的步骤,包括:
识别各职能部门对所述报表的调用信息,确定各职能部门对所述报表的操作类型;
为不同操作类型设置不同权重,得到各职能部门对所述报表的操作评分,并将所述操作评分作为所述关注度。
示例性的,对所述报表的操作类型分为查看、搜索、收藏、订阅,设置查看报表的权重为0.1,搜索报表的权重为0.2,收藏报表的权重为0.3,订阅报表的权重为0.4,报表r1评分为:1*0.1+2*0.2+3*0.3+4*0.4=3。采用分值权重算法提高报表定位的准确度。
在一种可能的实施方式中,FileBeat实时采集后端服务器用户日志数据,并将数据存储到Kafka,Flume通过监听kafka记录文件变化,多路复用的方式开源流处理框架Flink会实时计算kafka和分布式文件***hdfs中的日志数据,得到推荐数据,即,目标报表,将目标推荐报表存储在数据库***Mysql和Redis中。用户登录报表***时,***识别用户信息后从redis中快速找到用户可能需要的报表,redis是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,在提示栏展示报表名称和口径。用户可以点击报表名链接到对应的报表页面查看详情或找报表管理员授权。
在一种可能的实施方式中,如图3所示,本申请提供了一种基于人工智能的报表推荐装置,所述装置包括:
数据提取模块201,用于获取报表的历史调用信息,所述历史调用信息包括调用所述报表的历史用户的用户数据和所述报表的身份数据;
构建模块202,用于根据所述用户数据和所述身份数据构建不同用户之间的交集报表;
计算模块203,用于通过所述交集报表计算不同用户之间的相似度值,并基于所述相似度值确定不同用户之间的相似关系;
请求接收模块204,用于获取待推荐用户的用户数据,并通过待推荐用户的用户数据与所述相似关系确定与所述待推荐用户存在相似关系的目标用户;
推荐模块205,用于在所述历史调用信息中确定所述目标用户调用过的目标报表,并将所述目标报表推荐给所述待推荐用户。
在一种可能的实施方式中,构建模块202,具体用于:
根据所述用户数据和所述身份数据将调用同一报表的历史用户进行分类,得到分类数据,并基于所述分类数据构建分类矩阵;
基于所述分类矩阵构建不同用户之间的交集矩阵,并统计所述交集矩阵中不同用户之间交集报表的数量构建所述交集统计表。
在一种可能的实施方式中,计算模块203,具体用于:
通过余弦相似度算法计算不同用户之间的相似度值,其中,所述余弦相似度算法中将所述不同用户之间交集报表的数量作为除数,将不同用户调用的所有报表的数量之积的开根号值作为被除数;
若所述相似度值大于等于阈值,则确定不同用户之间具有相似关系;
若所述相似度值小于所述阈值,则确定不同用户之间不具有相似关系。
在一种可能的实施方式中,推荐模块205,具体用于:
当所述目标报表为所述交集报表时,获取所述目标用户与所述待推荐用户的目标相似度值,并将所述目标相似度值作为所述目标报表的使用度值;
按所述使用度值对各目标报表进行排序,生成所述目标报表的推荐顺序。
在一种可能的实施方式中,推荐模块205,具体用于:
获取所述待推荐用户在预设时间内的报表浏览数据,所述报表浏览数据包括所述待推荐用户在预设时间内已浏览报表的身份数据;
根据所述已浏览报表的身份数据在所述推荐顺序中剔除所述已浏览报表,得到目标推荐顺序。
在一种可能的实施方式中,请求接收模块204,具体用于:
基于所述历史调用信息中调用所述报表的历史用户的用户数据将所述历史用户按职能部门进行分类,得到各职能部门对所述报表的调用信息;
根据各职能部门对所述报表的调用信息计算各职能部门对于所述报表的关注度,得到关注度表;
获取所述待推荐用户的用户数据,并确定所述待推荐用户所属的目标职能部门,在所述关注度表中确定所述目标职能部门对于所述报表的目标关注度;
按所述目标关注度由大到小的顺序排列所有报表,并选择预设数量个排名靠前的报表推荐至所述待推荐用户。
在一种可能的实施方式中,推荐模块205,具体用于:
识别各职能部门对所述报表的调用信息,确定各职能部门对所述报表的操作类型;
为不同操作类型设置不同权重,得到各职能部门对所述报表的操作评分,并将所述操作评分作为所述关注度。
本发明提供了一种报表推荐装置,通过获取报表的历史调用信息,所述历史调用信息包括调用所述报表的历史用户的用户数据和所述报表的身份数据;采集用户使用报表的数据,实时分析用户使用报表的情况,可以及时获取用户使用报表的行为数据有效分析出报表适合的用户和用户可能需要的报表,准确高效寻找***;根据所述用户数据和所述身份数据构建不同用户之间的交集统计表;通过所述交集统计表计算不同用户之间的相似度值,并基于所述相似度值确定不同用户之间的相似关系;与提取用户特征,并基于用户特征识别相似用户的方法相比,大大减小了计算量,提高了报表推荐的效率,通过计算用户之间的相似度,更精准直观地辨别不同用户的相似程度,避免特征识别的误差;获取待推荐用户的用户数据,并通过待推荐用户的用户数据与所述相似关系确定与所述待推荐用户存在相似关系的目标用户;在所述历史调用信息中确定所述目标用户调用过的目标报表,并将所述目标报表推荐给所述待推荐用户。实时分析用户使用报表的情况,也能促进报表***服务能力提升,从而提高用户业务工作效率。
关于智能问答处理装置的具体限定可以参见上文中对于报表推荐方法的限定,在此不再赘述。上述报表推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务端,其内部结构图可以如图4所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性和/或易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的客户端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的报表推荐方法服务端侧的功能或步骤。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是客户端,其内部结构图可以如图5所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的报表推荐方法客户端侧的功能或步骤。
在一种可能的实施方式中,如图6所示,本申请实施例提供了一种电子设备300,包括:包括存储器310、处理器320及存储在存储器310上并可在处理器320上运行的计算机程序311,处理器320执行计算机程序311时,实现:获取报表的历史调用信息,所述历史调用信息包括调用所述报表的历史用户的用户数据和所述报表的身份数据;根据所述用户数据和所述身份数据构建不同用户之间的交集报表;通过所述交集报表计算不同用户之间的相似度值,并基于所述相似度值确定不同用户之间的相似关系;获取待推荐用户的用户数据,并通过待推荐用户的用户数据与所述相似关系确定与所述待推荐用户存在相似关系的目标用户;在所述历史调用信息中确定所述目标用户调用过的目标报表,并将所述目标报表推荐给所述待推荐用户的步骤。
在一种可能的实施方式中,如图7所示,本申请实施例提供了一种计算机可读存储介质400,其上存储有计算机程序411,该计算机程序411被处理器执行时实现:获取报表的历史调用信息,所述历史调用信息包括调用所述报表的历史用户的用户数据和所述报表的身份数据;根据所述用户数据和所述身份数据构建不同用户之间的交集报表;通过所述交集报表计算不同用户之间的相似度值,并基于所述相似度值确定不同用户之间的相似关系;获取待推荐用户的用户数据,并通过待推荐用户的用户数据与所述相似关系确定与所述待推荐用户存在相似关系的目标用户;在所述历史调用信息中确定所述目标用户调用过的目标报表,并将所述目标报表推荐给所述待推荐用户的步骤。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本领域普通技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,或者分布在多个计算装置所组成的网络上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里上述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (10)
1.一种基于人工智能的报表推荐方法,其特征在于,包括:
获取报表的历史调用信息,所述历史调用信息包括调用所述报表的历史用户的用户数据和所述报表的身份数据;
根据所述用户数据和所述身份数据构建不同用户之间的交集统计表;
通过所述交集统计表计算不同用户之间的相似度值,并基于所述相似度值确定不同用户之间的相似关系;
获取待推荐用户的用户数据,并通过待推荐用户的用户数据与所述相似关系确定与所述待推荐用户存在相似关系的目标用户;
在所述历史调用信息中确定所述目标用户调用过的目标报表,并将所述目标报表推荐给所述待推荐用户。
2.如权利要求1所述的基于人工智能的报表推荐方法,其特征在于,所述根据所述用户数据和所述身份数据构建不同用户之间的交集统计表的步骤,包括:
根据所述用户数据和所述身份数据将调用同一报表的历史用户进行分类,得到分类数据,并基于所述分类数据构建分类矩阵;
基于所述分类矩阵构建不同用户之间的交集矩阵,并统计所述交集矩阵中不同用户之间交集报表的数量构建所述交集统计表。
3.如权利要求2所述的基于人工智能的报表推荐方法,其特征在于,所述通过所述交集统计表计算不同用户之间的相似度值,并基于所述相似度值确定不同用户之间的相似关系的步骤,包括:
通过余弦相似度算法计算不同用户之间的相似度值,其中,所述余弦相似度算法中将所述不同用户之间交集报表的数量作为除数,将不同用户调用的所有报表的数量之积的开根号值作为被除数;
若所述相似度值大于等于阈值,则确定不同用户之间具有相似关系;
若所述相似度值小于所述阈值,则确定不同用户之间不具有相似关系。
4.如权利要求3所述的基于人工智能的报表推荐方法,其特征在于,所述将所述目标报表推荐给所述待推荐用户的步骤,还包括:
当所述目标报表为所述交集报表时,获取所述目标用户与所述待推荐用户的目标相似度值,并将所述目标相似度值作为所述目标报表的使用度值;
按所述使用度值对各目标报表进行排序,生成所述目标报表的推荐顺序,将所述目标报表按所述推荐顺序推荐给所述待推荐用户。
5.如权利要求4所述的基于人工智能的报表推荐方法,其特征在于,所述将所述目标报表推荐给所述待推荐用户的步骤,还包括:
获取所述待推荐用户在预设时间内的报表浏览数据,所述报表浏览数据包括所述待推荐用户在预设时间内已浏览报表的身份数据;
根据所述已浏览报表的身份数据在所述推荐顺序中剔除所述已浏览报表,得到目标推荐顺序,将所述目标报表按所述目标推荐顺序推荐给所述待推荐用户。
6.如权利要求1所述的基于人工智能的报表推荐方法,其特征在于,所述将所述目标报表推荐给所述待推荐用户的步骤,还包括:
基于所述历史调用信息中调用所述报表的历史用户的用户数据,将所述历史用户按职能部门进行分类,得到各职能部门对所述报表的调用信息;
根据各职能部门对所述报表的调用信息计算各职能部门对于所述报表的关注度,得到关注度表;
获取所述待推荐用户的用户数据,并确定所述待推荐用户所属的目标职能部门,在所述关注度表中确定所述目标职能部门对于所述报表的目标关注度;
按所述目标关注度由大到小的顺序排列所有报表,并选择预设数量个排名靠前的报表推荐至所述待推荐用户。
7.如权利要求6所述的基于人工智能的报表推荐方法,其特征在于,所述根据各职能部门对所述报表的调用信息计算各职能部门对于所述报表的关注度的步骤,包括:
识别各职能部门对所述报表的调用信息,确定各职能部门对所述报表的操作类型;
为不同操作类型设置不同权重,得到各职能部门对所述报表的操作评分,并将所述操作评分作为所述关注度。
8.一种基于人工智能的报表推荐装置,其特征在于,所述装置包括:
数据提取模块,用于获取报表的历史调用信息,所述历史调用信息包括调用所述报表的历史用户的用户数据和所述报表的身份数据;
构建模块,用于根据所述用户数据和所述身份数据构建不同用户之间的交集统计表;
计算模块,用于通过所述交集统计表计算不同用户之间的相似度值,并基于所述相似度值确定不同用户之间的相似关系;
请求接收模块,用于获取待推荐用户的用户数据,并通过待推荐用户的用户数据与所述相似关系确定与所述待推荐用户存在相似关系的目标用户;
推荐模块,用于在所述历史调用信息中确定所述目标用户调用过的目标报表,并将所述目标报表推荐给所述待推荐用户。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至7中任一项所述的基于人工智能的报表推荐方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7中任一项所述的基于人工智能的报表推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310651645.0A CN116910352A (zh) | 2023-06-02 | 2023-06-02 | 基于人工智能的报表推荐方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310651645.0A CN116910352A (zh) | 2023-06-02 | 2023-06-02 | 基于人工智能的报表推荐方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116910352A true CN116910352A (zh) | 2023-10-20 |
Family
ID=88367443
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310651645.0A Pending CN116910352A (zh) | 2023-06-02 | 2023-06-02 | 基于人工智能的报表推荐方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116910352A (zh) |
-
2023
- 2023-06-02 CN CN202310651645.0A patent/CN116910352A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200050968A1 (en) | Interactive interfaces for machine learning model evaluations | |
US10042887B2 (en) | Query optimization with zone map selectivity modeling | |
CN107895011B (zh) | 会话信息的处理方法、***、存储介质和电子设备 | |
US10229210B2 (en) | Search query task management for search system tuning | |
US9646081B1 (en) | System and method to present a summarized task view in a case management system | |
CN113157947A (zh) | 知识图谱的构建方法、工具、装置和服务器 | |
US20190050435A1 (en) | Object data association index system and methods for the construction and applications thereof | |
CN114461644A (zh) | 一种数据采集方法、装置、电子设备及存储介质 | |
CN113297458A (zh) | 一种分页查询方法、装置和设备 | |
CN110362607B (zh) | 异常号码识别方法、装置、计算机设备及存储介质 | |
CN114971714A (zh) | 一种基于大数据标签的精准客户运营方法和计算机设备 | |
CN110912757A (zh) | 业务的监控方法和服务器 | |
Hu et al. | A faq finding process in open source project forums | |
Pintas et al. | SciLightning: a cloud provenance-based event notification for parallel workflows | |
CN113781068B (zh) | 线上问题解决方法、装置、电子设备和存储介质 | |
US11822578B2 (en) | Matching machine generated data entries to pattern clusters | |
CN114356712A (zh) | 数据处理方法、装置、设备、可读存储介质及程序产品 | |
CN116910352A (zh) | 基于人工智能的报表推荐方法、装置、设备及介质 | |
CN113626387A (zh) | 一种任务数据的导出方法、装置、电子设备及存储介质 | |
CN104376021A (zh) | 文件推荐***及方法 | |
CN115168297A (zh) | 绕行日志审计方法及装置 | |
CN109828983A (zh) | Pg数据库处理方法、装置、电子设备及存储介质 | |
CN111552674A (zh) | 日志处理方法及设备 | |
CN112115194B (zh) | 群体对比画像确定方法、服务器、终端、***及存储介质 | |
CN112527880B (zh) | 大数据集群元数据信息的采集方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |