CN111475731A - 数据处理方法、装置、存储介质及设备 - Google Patents

数据处理方法、装置、存储介质及设备 Download PDF

Info

Publication number
CN111475731A
CN111475731A CN202010284402.4A CN202010284402A CN111475731A CN 111475731 A CN111475731 A CN 111475731A CN 202010284402 A CN202010284402 A CN 202010284402A CN 111475731 A CN111475731 A CN 111475731A
Authority
CN
China
Prior art keywords
information
comment information
historical
historical comment
comment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010284402.4A
Other languages
English (en)
Other versions
CN111475731B (zh
Inventor
何锐明
田元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010284402.4A priority Critical patent/CN111475731B/zh
Publication of CN111475731A publication Critical patent/CN111475731A/zh
Application granted granted Critical
Publication of CN111475731B publication Critical patent/CN111475731B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种数据处理方法、装置、存储介质及设备,属于人工智能‑自然语言处理相关的技术领域。其中,方法包括:响应针对待评论的目标对象的评论请求,获取与所述目标对象关联的至少两条历史评论信息;对所述至少两条历史评论信息进行聚类处理,得到至少两个信息集合,一个信息集合与一个评论信息类别对应,所述至少两个信息集合中的每个信息集合包括至少一条历史评论信息;根据所述评论信息类别生成所述至少两个信息集合中的各个信息集合分别对应的展示区域;将所述各个信息集合中的历史评论信息分别展示在所对应的展示区域内。通过本申请能够提高评论效率。

Description

数据处理方法、装置、存储介质及设备
技术领域
本申请涉及人工智能-自然语言处理技术领域,尤其涉及一种数据处理方法、装置、存储介质及设备。
背景技术
随着互联网技术的快速发展,电子商务等类别的应用程序均提供了针对服务或产品的评论功能,用户在购买产品或体验服务后,可通过这些应用的评论功能对产品或服务进行评论。用户的评论对消费者以及供应商具有重要意义;例如,对于消费者,不仅可以对产品或服务进行评论,还可以浏览其他用户的评论来了解产品和服务的质量,帮助自己做出可靠的决策。对于供应商,可以对用户的评论进行分析,进而,利用分析结果为用户提供更优质的服务等。但是,用户在对产品或服务进行评论的过程中,需要用户自主构思评论信息,导致评论效率比较低。
发明内容
本申请实施例所要解决的技术问题在于,提供一种数据处理方法、装置、存储介质及设备,能够提高评论效率。
本申请实施例一方面提供一种数据处理方法,包括:
响应针对待评论的目标对象的评论请求,获取与所述目标对象关联的至少两条历史评论信息;
对所述至少两条历史评论信息进行聚类处理,得到至少两个信息集合,一个信息集合与一个评论信息类别对应,所述至少两个信息集合中的每个信息集合包括至少一条历史评论信息;
根据所述评论信息类别生成所述至少两个信息集合中的各个信息集合分别对应的展示区域;
将所述各个信息集合中的历史评论信息分别展示在所对应的展示区域内。
本申请实施例一方面提供一种数据处理装置,包括:
获取模块,用于响应针对待评论的目标对象的评论请求,获取与所述目标对象关联的至少两条历史评论信息;
聚类模块,用于对所述至少两条历史评论信息进行聚类处理,得到至少两个信息集合,一个信息集合与一个评论信息类别对应,所述至少两个信息集合中的每个信息集合包括至少一条历史评论信息;
生成模块,用于根据所述评论信息类别生成所述至少两个信息集合中的各个信息集合分别对应的展示区域;
展示模块,用于将所述各个信息集合中的历史评论信息分别展示在所对应的展示区域内。
可选的,展示模块,具体用于获取所述各个信息集合中的历史评论信息的条数;根据所述条数对所述各个信息集合所对应的展示区域进行排列;将所述各个信息集合中的历史评论信息分别展示在对应排序后的展示区域内。
可选的,展示模块,具体用于获取所述各个信息集合中的历史评论信息的生成时间戳;根据所述生成时间戳,确定所述各个信息集合中的历史评论信息的生成时间戳总值;按照所述生成时间戳总值,对所述各个信息集合对应的展示区域进行排列;将所述各个信息集合中的历史评论信息分别展示在对应排序后的展示区域内。
可选的,所述至少两个信息集合包括信息集合Ki和信息集合Kj,所述信息集合Ki与展示区域Pm相对应,所述信息集合Kj与展示区域Pn,i、j、m、n均为小于或等于S的正整数,S为所述至少两个信息集合中的信息集合的数量;
可选的,展示模块,具体用于在第一时刻将所述信息集合Ki中的历史评论信息展示在所述展示区域Pm内;在第二时刻将所述信息集合Kj中的历史评论信息展示在所述展示区域Pn内,所述第一时刻早于所述第二时刻,所述展示区域Pm的排列顺序位于所述展示区域Pn的排序顺序之前。
可选的,展示模块,具体用于获取所述各个信息集合中的历史评论信息的特征属性,所述特征属性包括:历史评论信息在历史评论文本中出现的次数、历史评论信息被查看的次数以及历史评论信息被收藏的次数;根据所述历史评论信息在历史评论文本中出现的次数、所述历史评论信息被查看的次数以及所述历史评论信息被收藏的次数,确定所述历史评论信息的评论权重;从所述各个信息集合中,筛选评论权重大于权重阈值的历史评论信息,作为第一目标评论信息;将从所述各个信息集合筛选出的所述第一目标评论信息分别展示在所属的展示区域内。
可选的,展示模块,具体用于获取所述评论信息类别对应的类别数量,以及展示界面;将所述展示界面划分为至少两个展示区域,所述至少两个展示区域的区域数量与所述类别数量相同;获取所述各个信息集合中的历史评论信息的条数,以及所述至少两个展示区域中的各个展示区域的大小;根据所述条数以及所述各个展示区域的大小,确定所述各个信息集合分别对应的展示区域。
可选的,聚类模块,具体用于提取所述至少两条历史评论信息中各条历史评论信息的语义信息,所述语义信息用于指示历史评论信息的评论信息类别;获取所述至少两条历史评论信息中的各条历史评论信息的语义信息之间的相似度;根据所述相似度对所述至少两条历史评论信息进行聚类处理,得到至少两个信息集合。
可选的,聚类模块,具体用于获取所述至少两条历史评论信息中的各条历史评论信息的语义信息之间的距离;根据所述距离确定所述至少两条历史评论信息中的各条历史评论信息的语义信息之间的相似度。
可选的,获取模块,具体用于获取所述目标对象的对象类别;获取对象类别与所述目标对象的对象类别匹配的对象对应的历史评论文本;
从所述历史评论文本中提取文本片段,作为与所述目标对象关联的至少两条历史评论信息。
可选的,获取模块,具体用于对所述历史评论文本进行切分处理,得到至少两个候选文本片段;从至少两个候选文本片段中,筛选字段与关键字段字典中的字段匹配的候选文本片段,作为与所述目标对象关联的至少两条历史评论信息。
可选的,所述装置还包括:评论模块,用于响应于针对所述至少两条历史评论信息中的第二目标历史评论信息的选择操作,在评论信息输入界面上展示所述第二目标历史评论信息;接收在所述评论信息输入界面上输入的评论信息;采用所输入的评论信息以及所述第二目标历史评论信息,对所述目标对象进行评论。
本申请一方面提供了一种计算机设备,包括:处理器及存储器;
其中,上述存储器用于存储计算机程序,上述处理器用于调用上述计算机程序,以执行如下步骤:
响应针对待评论的目标对象的评论请求,获取与所述目标对象关联的至少两条历史评论信息;
对所述至少两条历史评论信息进行聚类处理,得到至少两个信息集合,一个信息集合与一个评论信息类别对应,所述至少两个信息集合中的每个信息集合包括至少一条历史评论信息;
根据所述评论信息类别生成所述至少两个信息集合中的各个信息集合分别对应的展示区域;
将所述各个信息集合中的历史评论信息分别展示在所对应的展示区域内。
本申请实施例一方面提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序包括程序指令,上述程序指令当被处理器执行时,以执行如下步骤:
响应针对待评论的目标对象的评论请求,获取与所述目标对象关联的至少两条历史评论信息;
对所述至少两条历史评论信息进行聚类处理,得到至少两个信息集合,一个信息集合与一个评论信息类别对应,所述至少两个信息集合中的每个信息集合包括至少一条历史评论信息;
根据所述评论信息类别生成所述至少两个信息集合中的各个信息集合分别对应的展示区域;
将所述各个信息集合中的历史评论信息分别展示在所对应的展示区域内。
本申请实施例中,计算机设备接收到针对待评论的目标对象的评论请求时,可获取与目标对象关联的至少两条历史评论信息;对至少两条历史评论信息进行聚类处理,得到至少两个信息集合,一个信息集合与一个评论信息类别对应。根据评论信息类别生成各个信息集合对应的展示区域,将各个信息集合中的历史评论信息展示在所对应的展示区域。即通过在展示区域展示历史评论信息,有利于用户通过选择历史评论信息对目标对象进行评论,不需要用户对自主构思评论信息,可提高评论效率。另外,通过对至少两条历史评论信息进行聚类处理,将各个信息集合展示在所对应的展示区域,有利于用户了解每个展示区域的历史评论信息对应的评论信息类别,这样有利于用户快速地选择适合的历史评论信息。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请提供的一种数据处理***的架构示意图;
图2是本申请提供的一种数据处理的交互示意图;
图3a是本申请提供的一种展示区域示意图;
图3b是本申请提供的一种展示区域的示意图;
图3c是本申请提供的一种展示区域的示意图;
图4是本申请提供的一种数据处理方法的流程示意图;
图5是本申请提供的一种生成信息集合对应的展示区域示意图;
图6是本申请提供的将信息集合中的历史评论信息展示在所对应的展示区域的场景示意图;
图7是本申请提供的将信息集合中的历史评论信息展示在所对应的展示区域的场景示意图;
图8a是本申请提供的将信息集合中的历史评论信息展示在所对应的展示区域的场景示意图;
图8b是本申请提供的将信息集合中的历史评论信息展示在所对应的展示区域的场景示意图;
图9是本申请实施例提供的一种数据处理装置的结构示意图;
图10是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。语音技术(Speech Technology)的关键技术有自动语音识别技术(ASR)和语音合成技术(TTS)以及声纹识别技术。让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式之一。
其中,自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。本申请中,利用自然语言处理技术对至少两条历史评论信息进行聚类处理,得到至少两个信息集合,即利用自然语言处理技术对至少两条历史评论信息进行分类,得到至少两个信息集合,一个信息集合对应一个评论信息类别;然后,分别将各个信息集合展示在所对应的展示区域,有助于用户理解历史评论信息的评论信息类别,这样有利于用户快速地选择适合的历史评论信息。
首先介绍本申请实施例提供的数据处理***,图1示出了本申请一个示例性实施例提供的一种数据处理***的结构示意图,数据处理***包括服务器11及至少一个终端,图1中以两个终端为例,分别包括终端12和终端13。
其中,服务器11可以是指用于对用户的评论信息进行处理的后端设备,可用于对用户的评论信息进行分析,并为用户推荐评论信息;具体可以是一***立的服务器、或由若干台服务器组成的服务器集群、或云计算中心。终端12和终端13均是指面向用户的终端,具体可以是指用户用于对产品或服务进行评论的终端;具体可以是智能手机、平板电脑、便携式个人计算机、智能手表、手环及智能电视等智能设备。
具体的,以用户采用终端12对产品或服务进行评论为例进行说明,请参见图2,图2为本申请实施例提供的一种数据处理***的交互示意图。如图2所示,当用户购买某一种产品或体验某种服务后,可通过网页页面14对该产品或服务进行评论,该网页页面14可以是指购物应用程序的服务页面、论坛网页、社交应用程序的服务界面(如内容发布平台)等等。产品可以包括应用程序(社交应用程序、游戏应用程序、办公应用程序等)、文章、衣物、食品、器材以及书籍等等;服务可以是指餐饮服务、心理咨询、网络课程以及法律咨询等等。该网页页面14包括评论选项15,评论选项15用于调用评论页面16,如果终端12检测到用户针对评论选项15的选择操作,则展示该评论页面16,该评论页面16可包括展示界面17以及评论区域18;展示界面17用于展示历史评论信息,评论区域17用于展示用户从展示界面17中所选择的历史评论信息,以及用于接收用户所输入的评论信息。进一步,终端12可生成针对目标对象的评论请求,将该评论请求发送至该网页页面14对应的服务器(假设为服务器11);此处目标对象可以是指待评论的产品或服务,图2中以目标对象为女式包为例进行说明。由服务器11获取与目标对象关联的至少两条历史评论信息,将至少两条历史评论信息发送至终端12。与目标对象关联的至少两条历史评论信息可以是指:目标对象的至少两条历史评论信息;或者,与目标对象的对象类别相同或相似的对象对应的至少两条历史评论信息。终端12可以对至少两条历史评论信息进行聚类处理,得到至少两个信息集合,一个信息集合与一个评论信息类别对应,按照用户的情感划分,评论信息类别可包括好评、中评以及差评;按照对象的特征划分,评论信息类别可包括功能类别(描述对象的功能的评论信息)、外观类别(描述对象的外观的评论信息)、价格类别(描述对象的价格的评论信息)、物流类别(描述对象的发货速度、邮寄速度的评论信息)等等。终端12可以根据评论信息类别生成每个信息集合对应的展示区域,即根据评论信息类别对展示界面17进行划分,得到每个信息集合对应的展示区域,即一个信息集合对应一个展示区域。
需要说明的是,各个信息集合对应的展示区域的大小可以相同,也可以不相同;各个信息集合对应的展示区域的形状可以相同,也可以不相同,展示区域的形状包括矩形、圆形、六边形或其他形状;各个信息集合对应的展示区域的排列方式可以包括列的排列方式、行的排列方式、行列组合的方式排列或者其他排列方式。例如,假设生成三个展示区域,分别为展示区域19、展示区域20以及展示区域21;如图3a中,三个展示区域是以行的排列方式排列,三个展示区域的大小以及形状均相同。或者,如图3b所示,三个展示区域是以列的排列方式排列,三个展示区域的大小以及形状均相同。或者,如图3c所示,三个展示区域是以行列组合的排列方式排列,展示区域19最大,展示区域21的大小大于展示区域20的大小,三个展示区域的形状均为矩形。
假设至少两个信息集合中包括三个信息集合;分别为信息集合1、信息集合2以及信息集合3,信息集合1、信息集合2以及信息集合3对应的展示区域分别为展示区域19、展示区域20以及展示区域21;以这三个展示区域如图3a所示为例进行说明。在生成展示区域后,终端12可以将各个信息集合中的历史评论信息分别展示在对应的展示区域,即将信息集合1中的历史评论信息展示在展示区域19中;将信息集合2中的历史评论信息展示在展示区域20中;将信息集合3中的历史评论信息展示在展示区域21中。在终端12展示历史评论信息后,用户可以选择对所展示的历史评论信息进行执行选择操作,终端12可以将用户所选择的历史评论信息作为目标历史评论信息,采用目标历史评论信息对目标对象进行评论。
可见,本申请,通过在展示区域展示历史评论信息,有利于用户通过选择历史评论信息对目标对象进行评论,不需要用户对自主构思评论信息,可提高评论效率;另外,通过对历史评论信息进行聚类处理,有利于为用户展示多种类别的历史评论信息,有助于用户理解历史评论信息的评论信息类别,这样有利于用户快速地选择适合的历史评论信息。
需要说明的是,在一个实施例中,上述对历史评论信息的聚类处理过程可以在终端12中实现,即终端12可以从服务器11中获取与目标对象关联的至少两条历史评论信息,对至少两条历史评论信息进行聚类处理,得到至少两个信息集合;在另一个实施例中,上述对历史评论信息的聚类处理过程可以在服务11中实现,即服务器11可获取与目标对象关联的至少两条历史评论信息,对至少两条历史评论信息进行聚类处理,得到至少两个信息集合;将该至少两个信息集合,以及每个信息集合对应的评论信息类别返回给终端12。
基于上述的描述,请参见图4,是本申请实施例提供的一种数据处理方法的流程示意图。该方法可由计算机设备来执行,该计算机设备可以是指图1中的服务器11或任一终端,如图4所示,该数据处理方法可以包括:
S101、响应针对待评论的目标对象的评论请求,获取与该目标对象关联的至少两条历史评论信息。
当计算机设备接收针对待评论的目标对象的评论请求时,可从网页页面中或者服务器中获取与目标对象关联的至少两条历史评论信息;此处目标对象可以是指用户所购买的产品或所体验的服务;与目标对象关联的历史评论信息可以是指与目标对象关联的预设时间段内的历史评论信息,预设时间段可以是指近一周、近一个月或近三个月。具体的,与目标对象关联的历史评论信息可以是指:目标对象的历史评论信息;例如,该目标对象为女式包,则与目标对象关联的历史评论信息可以是指该女式包的历史评论信息。或者,与目标对象关联的历史评论信息可以是指:对象类别与目标对象的对象类别相同的对象的历史评论信息,对象类别可以包括服饰、纸质书籍、电子文章、应用程序、餐饮类服务等等;例如,该目标对象为A款女式包,则与该目标对象关联的历史评论信息可以是指B款女式包的历史评论信息。或者,与目标对象关联的历史评论信息可以是指:与目标对象属于同一个供应商的对象对应的历史评论信息;例如,目标对象可以是指C公司所提供的女式包,则与目标对象关联的历史评论信息可以是指C公司提供的拉杆箱的历史评论信息。
需要说明是,历史评论信息可以是指与目标对象关联的历史评论文本中的词、短语或句子;历史评论文本可以是指评论得到原始文本,即历史评论信息可以是指从历史评论文本中提取的词、短语、句子、图像或视频等。例如,历史评论文本可以是“包包质量特别好,也没有异味,款式简单大方”,则历史评论信息可以包括“包包质量特别好”、“没有异味”以及“款式简单大方”等等。
S102、对该至少两条历史评论信息进行聚类处理,得到至少两个信息集合,一个信息集合与一个评论信息类别对应,该至少两个信息集合中的每个信息集合包括至少一条历史评论信息。
为了展示多种类别的历史评论信息,计算机设备可以获取历史评论信息之间的相似度,根据历史评论之间的相似度对该至少两条历史评论信息进行聚类处理,得到至少两个信息集合;即将相似度大于相似度阈值的历史评论信息归类到一个信息集合。或者,计算机设备可以采用自然语言处理技术获取历史评论信息的语义信息,根据语义信息对至少两条历史评论信息进行聚类处理,得到至少两个信息集合。一个信息集合与一个评论信息类别对应,即属于同一信息集合中的历史评论信息的评论信息类别相同。通过对历史评论信息进行聚类,有利于为用户展示多种类别的历史评论信息,有助于用户理解历史评论信息的评论信息类别,这样有利于用户快速地选择适合的历史评论信息。
S103、根据该评论信息类别生成该至少两个信息集合中的各个信息集合分别对应的展示区域。
计算机设备的展示界面上可包括多个展示区域,一个展示区域与一个评论信息类别相对应,可根据评论信息类别与展示区域之间的对应关系,确定至少两个信息集合中各个信息集合分别对应的展示区域。例如,评论信息类别与展示区域之间的对应关系如表1所示,评论信息类别1、评论信息类别2、评论信息类别3分别与展示区域19、展示区域20、展示区域21相对应。假设至少两个信息集合中包括信息集合1、信息集合2以及信息集合3,信息集合1、信息集合2以及信息集合3分别与评论信息类别1、评论信息类别2以及评论信息类别3相对应;因此,可确定信息集合1与展示区域19对应,确定信息集合2与展示区域20对应,确定信息集合3与展示区域21对应。或者,计算设备可以根据评论信息类别对展示界面进行划分,得到至少两个展示区域,从至少两个展示区域确定至少两个信息集合中的各个信息集合对应的展示区域。
表1:
评论信息类别1 展示区域19
评论信息类别2 展示区域20
评论信息类别3 展示区域21
…… ……
S104、将该各个信息集合中的历史评论信息分别展示在所对应的展示区域内。
计算机设备在确定各个信息集合对应的展示区域后,可将各个信息集合中的历史评论信息展示在所对应的展示区域;具体的,采用滚动展示方式将各个信息集合中的历史评论信息分别展示在所对应的展示区域内。例如,T时刻在所对应的展示区域中展示各个信息集合中排序位于前十条历史评论信息,T+1时刻在所对应的展示区域中展示各个信息集合中排序位于后十条历史评论信息,按照此顺序循环;各个信息集合中的历史评论的信息的排序可以是根据历史评论信息的操作信息确定的,操作信息包括被使用的频率、被收藏的次数、被点赞的次数、被转发的次数等中的至少一种确定的。或者,可以采用并列展示方式将各个信息集合中的历史评论信息分别展示在所对应的展示区域内。以行排列方式将各个信息集合中的历史评论信息排列展示在所对应的展示区域内,或者,以列排列方式将各个信息集合中的历史评论信息排列展示在所对应的展示区域内,或者,以行列组合排列方式将各个信息集合中的历史评论信息排列展示在所对应的展示区域内,或者,以其他排列方式将各个信息集合中的历史评论信息排列展示在所对应的展示区域内。通过在展示区域展示历史评论信息,有利于用户通过选择历史评论信息对目标对象进行评论,不需要用户对自主构思评论信息,可提高评论效率。可选的,为了便于用户快速地了解各个信息集合的评论信息类别,可以分别展示各个信息集合对应的评论信息类别。
本申请实施例中,计算机设备接收到针对待评论的目标对象的评论请求时,可获取与目标对象关联的至少两条历史评论信息;对至少两条历史评论信息进行聚类处理,得到至少两个信息集合,一个信息集合与一个评论信息类别对应。根据评论信息类别生成各个信息集合对应的展示区域,将各个信息集合中的历史评论信息展示在所对应的展示区域。即通过在展示区域展示历史评论信息,有利于用户通过选择历史评论信息对目标对象进行评论,不需要用户对自主构思评论信息,可提高评论效率。另外,通过对至少两条历史评论信息进行聚类处理,将各个信息集合展示在所对应的展示区域,有利于用户了解每个展示区域的历史评论信息对应的评论信息类别,这样有利于用户快速地选择适合的历史评论信息。
在一个实施例中,步骤S101可包括如下步骤s11~s13。
s11、获取该目标对象的对象类别。
s12、获取对象类别与该目标对象的对象类别匹配的对象对应的历史评论文本。
s13、从该历史评论文本中提取文本片段,作为与该目标对象关联的至少两条历史评论信息。
在步骤s11~s13中,计算机设备可以将对象类别与目标对象的对象类别匹配的对应的历史评论信息,作为与目标对象关联的历史评论信息。具体的,计算机设备可以根据目标对象的描述信息中获取该目标对象的对象类别,目标对象的描述信息可以是指展示于购买目标对象的网页中,用于对目标对象进行描述的信息,该描述信息包括不限于目标对象的对象类别、产地、价格以及作用等等。进一步,计算机设备可获取对象类别与目标对象的对象类别匹配的对象对应的历史评论文本;对象类别与目标对象的对象类别匹配可以是指:对象类别与目标对象的对象类别相同,或者,对象类别与目标对象的对象类别相似。例如,目标对象为女式包,则该目标对象的对象类别为箱包类别,与目标对象的对象类别相似的对象类别包括鞋类或服饰类别等。在计算机设备获取到历史评论文本后,采用自然语言处理方法对从该历史评论文本中提取文本片段,作为与该目标对象关联的至少两条历史评论信息;例如,可采用词典分词算法(即字符串匹配分词算法)从该历史评论文本中提取文本片段,作为与该目标对象关联的至少两条历史评论信息;词典分词算法是指采用关键字段字典中的字段与历史评论文本这的字段进行匹配的算法。或者,计算设备可以采用基于统计的机器学习算法从该历史评论文本中提取文本片段,作为与该目标对象关联的至少两条历史评论信息;基于统计的机器学习算法可以是指隐马尔可夫模型(Hidden MarkovModel,HMM)、条件随机场(conditional random field,CRF)、支持向量机(Support VectorMachine,SVM)以及深度学习等算法。文本片段可以是指词、短语或句子等等,具体的,文本片段可以是指在历史评论文本中出现的频率大于频率阈值的词、短语或句子等等。
在此实施例中,步骤s13可包括如下步骤s21~s22。
s21、对该历史评论文本进行切分处理,得到至少两个候选文本片段。
s22、从至少两个候选文本片段中,筛选字段与关键字段字典中的字段匹配的候选文本片段,作为与该目标对象关联的至少两条历史评论信息。
在步骤s21~s22中,计算机设备可以按照特殊符号(如句号、逗号)对历史评论文本进行切分处理,得到至少两个候选文本片段(即至少两个候选句子);按照词对历史评论文本进行切分处理,得到至少两个候选文本(即至少两个候选词);按照短语对历史评论文本进行切分处理,得到至少两个候选文本片段(即至少两个候选短语)。在计算机设备获取到候选文本片段后,可以从至少两个候选文本片段中,筛选字段与关键字段字典中的字段匹配的候选文本片段,作为与该目标对象关联的至少两条历史评论信息;关键字段词典可以是指出现在评论文本中的频率大于频率阈值的字段集合,即关键字段词典包括常用于评论的字段。通过对至少两个候选文本片段进行筛选,可避免将无效的历史评论信息展示在展示区域,提高展示区域的利用率;有利于为用户展示更多有效的历史评论信息。
在一个实施例中,步骤S102可包括如下步骤s31~s33。
s31、提取该至少两条历史评论信息中各条历史评论信息的语义信息,该语义信息用于指示历史评论信息的评论信息类别。
s32、获取该至少两条历史评论信息中的各条历史评论信息的语义信息之间的相似度。
s33、根据该相似度对该至少两条历史评论信息进行聚类处理,得到至少两个信息集合。
在步骤s31~s33中,计算机设备可以根据历史评论信息的语义信息,对至少两条历史评论信息进行聚类处理,得到至少两个信息集合。具体的,计算机设备可以提取该至少两条历史评论信息中各条历史评论信息的语义信息,该语义信息用于指示历史评论信息的评论信息类别;即语义信息可以是指历史评论信息的内在含义。在获取到历史评论信息的语义信息后,计算机设备可以对各条历史评论信息的语义信息进行对比,确定该至少两条历史评论信息中的各条历史评论信息的语义信息之间的相似度;根据该相似度对该至少两条历史评论信息进行聚类处理,得到至少两个信息集合,即将相似度大于相似度阈值的历史评论信息归为一个信息集合。
在此实施例中,步骤s32可包括如下步骤s41~s42。
s41、获取该至少两条历史评论信息中的各条历史评论信息的语义信息之间的距离。
s42、根据该距离确定该至少两条历史评论信息中的各条历史评论信息的语义信息之间的相似度。
在步骤s41~s42中,计算机设备可以采用距离算法获取该至少两条历史评论信息中的各条历史评论信息的语义信息之间的距离;此处距离算法可包括欧氏距离算法、曼哈顿距离算法、切比雪夫距离算法或马氏距离算法等等。进一步,计算机设备可以根据该距离确定该至少两条历史评论信息中的各条历史评论信息的语义信息之间的相似度;即两条历史评论信息之间的距离与两条历史评论信息之间的相似度具有负相关关系,即两条历史评论信息之间的距离越大,则该两条历史评论信息之间的相似度越小;反之,两条历史评论信息之间的距离越小,则该两条历史评论信息之间的相似度越大。
在一个实施例中,步骤S103可包括如下步骤s51~s54。
s51、获取该评论信息类别对应的类别数量,以及展示界面。
s52、将该展示界面划分为至少两个展示区域,该至少两个展示区域的区域数量与该类别数量相同。
s53、获取该各个信息集合中的历史评论信息的条数,以及该至少两个展示区域中的各个展示区域的大小。
s54、根据该条数以及该各个展示区域的大小,确定该各个信息集合分别对应的展示区域。
在步骤s51~s54中,计算机设备可根据评论信息类别生成各个信息集合分别对应的展示区域;具体的,可获取所述评论信息类别对应的类别数量,以及展示界面,该类别数量与信息集合的集合数量相同。进一步,可以将该展示界面划分为至少两个展示区域,该至少两个展示区域的区域数量与所述类别数量相同,各个展示区域的大小可以相同,也可以不相同。当各个展示区域的大小相同时,可以随机为各个信息集合分配对应的展示区域。当各个展示区域的大小不相同时,可以获取该各个信息集合中的历史评论信息的条数,以及该至少两个展示区域中的各个展示区域的大小;根据条数以及各个展示区域的大小,确定各个信息集合分别对应的展示区域,即较大的展示区域分配给条数较多的信息集合,将较小的展示区域分配给条数较少的信息集合。
例如,如图5所示,评论信息类别对应的类别数量为3,计算机设备可以将展示界面17划分为3个展示区域,分别为展示区域19、展示区域20以及展示区域21;其中,展示区域19的大小最大,展示区域20的大小最小,展示区域21的大小大于展示区域20的大小,且小于展示区域19的大小。假设信息集合的集合数量为3,分别为信息集合1、信息集合2以及信息集合3,计算机设备可以获取这三个信息集合分别对应的历史评论信息的条数,如果信息集合1对应的条数>信息集合2对应的条数>信息集合3对应的条数。计算机设备可以确定展示区域19与信息集合1对应,展示区域21与信息集合2对应,展示区域20与信息集合3对应。
在一个实施例中,步骤S104可包括如下步骤s61~s63。
s61、获取该各个信息集合中的历史评论信息的条数。
s62、根据该条数对该各个信息集合所对应的展示区域进行排列。
s63、将该各个信息集合中的历史评论信息分别展示在对应排序后的展示区域内。
在步骤s61~s63中,计算机设备可以获取该各个信息集合中的历史评论信息的条数,信息集合中的历史评论信息的条数越多,表明用户热衷于采用该信息集合对应的评论信息类别的评论信息对对象进行评论,即该信息集合中的历史评论信息均比较精炼,被使用的频率比较高;相反,信息集合中的历史评论信息的条数越少,表明用户较少采用该信息集合对应的评论信息类别的评论信息对对象进行评论,即该信息集合中的历史评论信息被使用的频率比较低。因此,计算机设备可以根据该条数对该各个信息集合所对应的展示区域进行排列,即按照条数由高到低的顺序依次排列该各个信息集合所对应的展示区域,这样有利于用户快速地选择被使用频率比较高的历史评论信息(即热门历史评论信息);或者,按照条数由低到高的顺序依次排列该各个信息集合所对应的展示区域,这样有利于用户快速地选择被使用频率比较低的历史评论信息,即可实现对目标对象的多样化评论。进一步,将该各个信息集合中的历史评论信息分别展示在对应排序后的展示区域内。
例如,如图6所示,展示区域19与信息集合1对应,展示区域21与信息集合2对应,展示区域20与信息集合3对应,信息集合1中的历史评论信息的条数>信息集合2中的历史评论信息的条数>信息集合3中的历史评论信息的条数。因此,根据各个信息集合对应的历史评论信息的条数对各个展示区域进行排序,即各个展示区域的顺序由先到后为:展示区域19、展示区域21以及展示区域20,即可在展示界面的从左到右依次显示展示区域19、展示区域21以及展示区域20。然后,将信息集合1中的历史评论信息展示于展示区域19中,将信息集合2中的历史评论信息展示于展示区域21中,将信息集合3中的历史评论信息展示于展示区域20中。
可选的,步骤S104可包括如下步骤s71~s74。
s71、获取该各个信息集合中的历史评论信息的生成时间戳。
s72、根据该生成时间戳,确定该各个信息集合中的历史评论信息的生成时间戳总值。
s73、按照该生成时间戳总值,对该各个信息集合对应的展示区域进行排列。
s74、将该各个信息集合中的历史评论信息分别展示在对应排序后的展示区域内。在步骤s71~s74中,计算机设备可以获取各个信息集合中的历史评论信息的生成时间戳;历史评论信息的生成时间戳是一个字符序列,可唯一地标识历史评论信息的生成时间,此处字符序列可以是指一串数字构成,如历史评论信息的生成时间戳为20200408,表明该历史评论信息的生成时间为2020年4月8号。计算机设备可以根据该生成时间戳,确定该各个信息集合中的历史评论信息的生成时间戳总值,即可对生成时间戳进行累加,得到各个信息集合中的历史评论信息的生成时间戳总值。如果信息集合对应的生成时间戳总值越大,表明该信息集合内的历史评论信息是最近生成的,即该信息集合中的历史评论信息更具有代表性;相反,如果信息集合对应的生成时间戳总值越小,表明该信息集合内的历史评论信息不是最近生成的,即该信息集合中的历史评论信息的代表性比较差。因此,计算机设备可以按照生成时间戳总值,对各个信息集合对应的展示区域进行排序,如可按照时间戳总值由大到小的顺序,对各个信息集合对应的展示区域进行排序;或者,将最大时间戳总值对应的展示区域排列在展示界面中的中心位置,并依次排列时间戳总值比较小的展示区域。进一步,可将该各个信息集合中的历史评论信息分别展示在对应排序后的展示区域内,这样有利于用户快速地选择到具有代表性的历史评论信息。
例如,如图7所示,展示区域19与信息集合1对应,展示区域21与信息集合2对应,展示区域20与信息集合3对应,如果信息集合3对应的时间戳总值>信息集合2对应的时间戳总值>信息集合1对应的时间戳总值。因此,根据各个信息集合对应的时间戳总值对各个展示区域进行排序,即各个展示区域的顺序由先到后为:展示区域20、展示区域21以及展示区域19,即可在展示界面的从左到右依次显示展示区域20、展示区域21以及展示区域19。然后,将信息集合1中的历史评论信息展示于展示区域19中,将信息集合2中的历史评论信息展示于展示区域21中,将信息集合3中的历史评论信息展示于展示区域20中。
可选的,该至少两个信息集合包括信息集合Ki和信息集合Kj,该信息集合Ki与展示区域Pm相对应,该信息集合Kj与展示区域Pn,i、j、m、n均为小于或等于S的正整数,S为该至少两个信息集合中的信息集合的数量;
上述将该各个信息集合中的历史评论信息分别展示在对应排序后的展示区域内的步骤可包括如下步骤s81~s82:
s81、在第一时刻将该信息集合Ki中的历史评论信息展示在该展示区域Pm内。
s82、在第二时刻将该信息集合Kj中的历史评论信息展示在该展示区域Pn内,该第一时刻早于该第二时刻,该展示区域Pm的排列顺序位于该展示区域Pn的排序顺序之前。
在步骤s81~s82中,计算机设备可以以滚动展示方式展示各个信息集合,具体的,可在第一时刻将该信息集合Ki中的历史评论信息展示在该展示区域Pm内,在第二时刻将该信息集合Kj中的历史评论信息展示在该展示区域Pn内;这样有利于一次性展示各个信息集合中更多的历史评论信息,或者,可避免用户被其他评论信息类别的历史评论信息干扰。
例如,如图8a所示,计算机设备可以在T时刻将信息集合1中的历史评论信息展示于展示区域19中,在T+1时刻将信息集合2中的历史评论信息展示于展示区域21中,在T+2时刻将信息集合3中的历史评论信息展示于展示区域20中。然后,按照上述步骤,循环展示各个信息集合中的历史评论信息,这样可避免用户在选择历史评论信息时,被其他评论信息类别的历史评论信息干扰。可选的,各个展示区域可以均是指展示界面,如图8b所示,计算机设备可在T时刻将信息集合1中的历史评论信息展示于展示界面17中,在T+1时刻将信息集合2中的历史评论信息展示于展示界面17中,在T+2时刻将信息集合3中的历史评论信息展示于展示界面17中。然后,按照上述步骤,循环展示各个信息集合中的历史评论信息,这样有利于一次性展示各个信息集合中更多的历史评论信息。
可选的,步骤S104可包括如下步骤s91~s94。
s91、获取该各个信息集合中的历史评论信息的特征属性,该特征属性包括:历史评论信息在历史评论文本中出现的次数、历史评论信息被查看的次数以及历史评论信息被收藏的次数。
s92、根据该历史评论信息在历史评论文本中出现的次数、该历史评论信息被查看的次数以及该历史评论信息被收藏的次数,确定该历史评论信息的评论权重。
s93、从该各个信息集合中,筛选评论权重大于权重阈值的历史评论信息,作为第一目标评论信息。
s94、将从该各个信息集合筛选出的该第一目标评论信息分别展示在所属的展示区域内。
在步骤s91~s94中,计算机设备可以获取该各个信息集合中的历史评论信息的特征属性,对该特征属性所包括的该历史评论信息在历史评论文本中出现的次数、该历史评论信息被查看的次数以及该历史评论信息被收藏的次数分别设置权值,根据权值、该历史评论信息在历史评论文本中出现的次数、该历史评论信息被查看的次数以及该历史评论信息被收藏的次数进行加权求和,得到该历史评论信息的评论权重;或者,直接对该历史评论信息在历史评论文本中出现的次数、该历史评论信息被查看的次数以及该历史评论信息被收藏的次数进行求和,得到该历史评论信息的评论权重。评论权重可以用于指示历史评论信息的代表性,即评论权重越大,历史评论信息更具有代表性;评论权重越小,历史评论信息的代表性较差。进一步,计算机设备可从该各个信息集合中,筛选评论权重大于权重阈值的历史评论信息,作为第一目标评论信息;将从该各个信息集合筛选出的该第一目标评论信息分别展示在所属的展示区域内,具体的,可以按照评论权重依次展示信息集合中的第一目标评论信息。
可选的,该方法可包括如下步骤s111~s113。
s111、响应于针对该至少两条历史评论信息中的第二目标历史评论信息的选择操作,在评论信息输入界面上展示该第二目标历史评论信息。
s112、接收在该评论信息输入界面上输入的评论信息。
s113、采用所输入的评论信息以及该第二目标历史评论信息,对该目标对象进行评论。
在步骤s111~s113中,用户可以对展示界面上所展示的任一历史评论信息执行选择操作,此处评论信息输入界面可以是指上述图2中的评论区域18;相应地,如果计算机设备检测到针对该至少两条历史评论信息中的第二目标历史评论信息的选择操作,在评论信息输入界面上展示该第二目标历史评论信息,可以采用该第二目标历史评论信息对该目标对象进行评论。可选的,用户还可以评论信息输入界面上输入评论信息,相应地,计算机设备可接收在该评论信息输入界面上输入的评论信息,采用所输入的评论信息以及该第二目标历史评论信息,对该目标对象进行评论。
请参见图9,是本申请实施例提供的一种数据处理装置的结构示意图。上述数据处理装置可以是运行于计算机设备中的一个计算机程序(包括程序代码),例如该数据处理装置为一个应用软件;该装置可以用于执行本申请实施例提供的方法中的相应步骤。如图9所示,该数据处理装置可以包括:获取模块901、聚类模块902、生成模块903、展示模块904以及评论模块905。
获取模块901,用于响应针对待评论的目标对象的评论请求,获取与所述目标对象关联的至少两条历史评论信息;
聚类模块902,用于对所述至少两条历史评论信息进行聚类处理,得到至少两个信息集合,一个信息集合与一个评论信息类别对应,所述至少两个信息集合中的每个信息集合包括至少一条历史评论信息;
生成模块903,用于根据所述评论信息类别生成所述至少两个信息集合中的各个信息集合分别对应的展示区域;
展示模块904,用于将所述各个信息集合中的历史评论信息分别展示在所对应的展示区域内。
可选的,展示模块904,具体用于获取所述各个信息集合中的历史评论信息的条数;根据所述条数对所述各个信息集合所对应的展示区域进行排列;将所述各个信息集合中的历史评论信息分别展示在对应排序后的展示区域内。
可选的,展示模块904,具体用于获取所述各个信息集合中的历史评论信息的生成时间戳;根据所述生成时间戳,确定所述各个信息集合中的历史评论信息的生成时间戳总值;按照所述生成时间戳总值,对所述各个信息集合对应的展示区域进行排列;将所述各个信息集合中的历史评论信息分别展示在对应排序后的展示区域内。
可选的,所述至少两个信息集合包括信息集合Ki和信息集合Kj,所述信息集合Ki与展示区域Pm相对应,所述信息集合Kj与展示区域Pn,i、j、m、n均为小于或等于S的正整数,S为所述至少两个信息集合中的信息集合的数量;
可选的,展示模块904,具体用于在第一时刻将所述信息集合Ki中的历史评论信息展示在所述展示区域Pm内;在第二时刻将所述信息集合Kj中的历史评论信息展示在所述展示区域Pn内,所述第一时刻早于所述第二时刻,所述展示区域Pm的排列顺序位于所述展示区域Pn的排序顺序之前。
可选的,展示模块904,具体用于获取所述各个信息集合中的历史评论信息的特征属性,所述特征属性包括:历史评论信息在历史评论文本中出现的次数、历史评论信息被查看的次数以及历史评论信息被收藏的次数;根据所述历史评论信息在历史评论文本中出现的次数、所述历史评论信息被查看的次数以及所述历史评论信息被收藏的次数,确定所述历史评论信息的评论权重;从所述各个信息集合中,筛选评论权重大于权重阈值的历史评论信息,作为第一目标评论信息;将从所述各个信息集合筛选出的所述第一目标评论信息分别展示在所属的展示区域内。
可选的,展示模块904,具体用于获取所述评论信息类别对应的类别数量,以及展示界面;将所述展示界面划分为至少两个展示区域,所述至少两个展示区域的区域数量与所述类别数量相同;获取所述各个信息集合中的历史评论信息的条数,以及所述至少两个展示区域中的各个展示区域的大小;根据所述条数以及所述各个展示区域的大小,确定所述各个信息集合分别对应的展示区域。
可选的,聚类模块902,具体用于提取所述至少两条历史评论信息中各条历史评论信息的语义信息,所述语义信息用于指示历史评论信息的评论信息类别;获取所述至少两条历史评论信息中的各条历史评论信息的语义信息之间的相似度;根据所述相似度对所述至少两条历史评论信息进行聚类处理,得到至少两个信息集合。
可选的,聚类模块902,具体用于获取所述至少两条历史评论信息中的各条历史评论信息的语义信息之间的距离;根据所述距离确定所述至少两条历史评论信息中的各条历史评论信息的语义信息之间的相似度。
可选的,获取模块901,具体用于获取所述目标对象的对象类别;获取对象类别与所述目标对象的对象类别匹配的对象对应的历史评论文本;
从所述历史评论文本中提取文本片段,作为与所述目标对象关联的至少两条历史评论信息。
可选的,获取模块901,具体用于对所述历史评论文本进行切分处理,得到至少两个候选文本片段;从至少两个候选文本片段中,筛选字段与关键字段字典中的字段匹配的候选文本片段,作为与所述目标对象关联的至少两条历史评论信息。
可选的,所述装置还包括:评论模块905,用于响应于针对所述至少两条历史评论信息中的第二目标历史评论信息的选择操作,在评论信息输入界面上展示所述第二目标历史评论信息;接收在所述评论信息输入界面上输入的评论信息;采用所输入的评论信息以及所述第二目标历史评论信息,对所述目标对象进行评论。
根据本申请的一个实施例,图4所示的数据处理方法所涉及的步骤可由图9所示的数据处理装置中的各个模块来执行。例如,图4中所示的步骤S101可由图9中的获取模块901来执行,图4中所示的步骤S102可由图9中的聚类模块902来执行;图4中所示的步骤S103可由图9中的生成模块903来执行;图4中所示的步骤S104可由图9中的展示模块904来执行。
根据本申请的一个实施例,图9所示的数据处理装置中的各个模块可以分别或全部合并为一个或若干个单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个子单元,可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述模块是基于逻辑功能划分的,在实际应用中,一个模块的功能也可以由多个单元来实现,或者多个模块的功能由一个单元实现。在本申请的其它实施例中,数据处理装置也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。
根据本申请的一个实施例,可以通过在包括中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的例如计算机的通用计算机设备上运行能够执行如图4中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图9中所示的数据处理装置,以及来实现本申请实施例的数据处理方法。上述计算机程序可以记载于例如计算机可读记录介质上,并通过计算机可读记录介质装载于上述计算设备中,并在其中运行。
本申请实施例中,计算机设备接收到针对待评论的目标对象的评论请求时,可获取与目标对象关联的至少两条历史评论信息;对至少两条历史评论信息进行聚类处理,得到至少两个信息集合,一个信息集合与一个评论信息类别对应。根据评论信息类别生成各个信息集合对应的展示区域,将各个信息集合中的历史评论信息展示在所对应的展示区域。即通过在展示区域展示历史评论信息,有利于用户通过选择历史评论信息对目标对象进行评论,不需要用户对自主构思评论信息,可提高评论效率。另外,通过对至少两条历史评论信息进行聚类处理,将各个信息集合展示在所对应的展示区域,有利于用户了解每个展示区域的历史评论信息对应的评论信息类别,这样有利于用户快速地选择适合的历史评论信息。
请参见图10,是本申请实施例提供的一种计算机设备的结构示意图。如图10所示,上述计算机设备1000可以包括:处理器1001,网络接口1004和存储器1005,此外,上述计算机设备1000还可以包括:用户接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非易失性的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图10所示,作为一种计算机可读存储介质的存储器1005中可以包括操作***、网络通信模块、用户接口模块以及设备控制应用程序。
在图10所示的计算机设备1000中,网络接口1004可提供网络通讯功能;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
响应针对待评论的目标对象的评论请求,获取与所述目标对象关联的至少两条历史评论信息;
对所述至少两条历史评论信息进行聚类处理,得到至少两个信息集合,一个信息集合与一个评论信息类别对应,所述至少两个信息集合中的每个信息集合包括至少一条历史评论信息;
根据所述评论信息类别生成所述至少两个信息集合中的各个信息集合分别对应的展示区域;
将所述各个信息集合中的历史评论信息分别展示在所对应的展示区域内。
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
获取所述各个信息集合中的历史评论信息的条数;
根据所述条数对所述各个信息集合所对应的展示区域进行排列;
将所述各个信息集合中的历史评论信息分别展示在对应排序后的展示区域内。
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
获取所述各个信息集合中的历史评论信息的生成时间戳;
根据所述生成时间戳,确定所述各个信息集合中的历史评论信息的生成时间戳总值;
按照所述生成时间戳总值,对所述各个信息集合对应的展示区域进行排列;
将所述各个信息集合中的历史评论信息分别展示在对应排序后的展示区域内。
可选的,所述至少两个信息集合包括信息集合Ki和信息集合Kj,所述信息集合Ki与展示区域Pm相对应,所述信息集合Kj与展示区域Pn,i、j、m、n均为小于或等于S的正整数,S为所述至少两个信息集合中的信息集合的数量;
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
在第一时刻将所述信息集合Ki中的历史评论信息展示在所述展示区域Pm内;
在第二时刻将所述信息集合Kj中的历史评论信息展示在所述展示区域Pn内,所述第一时刻早于所述第二时刻,所述展示区域Pm的排列顺序位于所述展示区域Pn的排序顺序之前。
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
获取所述各个信息集合中的历史评论信息的特征属性,所述特征属性包括:历史评论信息在历史评论文本中出现的次数、历史评论信息被查看的次数以及历史评论信息被收藏的次数;
根据所述历史评论信息在历史评论文本中出现的次数、所述历史评论信息被查看的次数以及所述历史评论信息被收藏的次数,确定所述历史评论信息的评论权重;
从所述各个信息集合中,筛选评论权重大于权重阈值的历史评论信息,作为第一目标评论信息;
将从所述各个信息集合筛选出的所述第一目标评论信息分别展示在所属的展示区域内。
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
获取所述评论信息类别对应的类别数量,以及展示界面;
将所述展示界面划分为至少两个展示区域,所述至少两个展示区域的区域数量与所述类别数量相同;
获取所述各个信息集合中的历史评论信息的条数,以及所述至少两个展示区域中的各个展示区域的大小;
根据所述条数以及所述各个展示区域的大小,确定所述各个信息集合分别对应的展示区域。
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
提取所述至少两条历史评论信息中各条历史评论信息的语义信息,所述语义信息用于指示历史评论信息的评论信息类别;
获取所述至少两条历史评论信息中的各条历史评论信息的语义信息之间的相似度;
根据所述相似度对所述至少两条历史评论信息进行聚类处理,得到至少两个信息集合。
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
获取所述至少两条历史评论信息中的各条历史评论信息的语义信息之间的距离;
根据所述距离确定所述至少两条历史评论信息中的各条历史评论信息的语义信息之间的相似度。
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
获取所述目标对象的对象类别;
获取对象类别与所述目标对象的对象类别匹配的对象对应的历史评论文本;
从所述历史评论文本中提取文本片段,作为与所述目标对象关联的至少两条历史评论信息。
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
对所述历史评论文本进行切分处理,得到至少两个候选文本片段;
从至少两个候选文本片段中,筛选字段与关键字段字典中的字段匹配的候选文本片段,作为与所述目标对象关联的至少两条历史评论信息。
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
响应于针对所述至少两条历史评论信息中的第二目标历史评论信息的选择操作,在评论信息输入界面上展示所述第二目标历史评论信息;
接收在所述评论信息输入界面上输入的评论信息;
采用所输入的评论信息以及所述第二目标历史评论信息,对所述目标对象进行评论。
应当理解,本申请实施例中所描述的计算机设备1000可执行前文图4所对应实施例中对上述数据处理方法的描述,也可执行前文图9所对应实施例中对上述数据处理装置的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
本申请实施例中,计算机设备接收到针对待评论的目标对象的评论请求时,可获取与目标对象关联的至少两条历史评论信息;对至少两条历史评论信息进行聚类处理,得到至少两个信息集合,一个信息集合与一个评论信息类别对应。根据评论信息类别生成各个信息集合对应的展示区域,将各个信息集合中的历史评论信息展示在所对应的展示区域。即通过在展示区域展示历史评论信息,有利于用户通过选择历史评论信息对目标对象进行评论,不需要用户对自主构思评论信息,可提高评论效率。另外,通过对至少两条历史评论信息进行聚类处理,将各个信息集合展示在所对应的展示区域,有利于用户了解每个展示区域的历史评论信息对应的评论信息类别,这样有利于用户快速地选择适合的历史评论信息。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且上述计算机可读存储介质中存储有前文提及的数据处理装置所执行的计算机程序,且上述计算机程序包括程序指令,当上述处理器执行上述程序指令时,能够执行前文图4对应实施例中对上述数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。
作为示例,上述程序指令可被部署在一个计算机设备上执行,或者被部署位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链网络。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,上述的存储介质可为磁盘、光盘、只读存储器(Read-Only Memory,ROM)或随机存储器(Random Access Memory,RAM)等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (14)

1.一种数据处理方法,其特征在于,包括:
响应针对待评论的目标对象的评论请求,获取与所述目标对象关联的至少两条历史评论信息;
对所述至少两条历史评论信息进行聚类处理,得到至少两个信息集合,一个信息集合与一个评论信息类别对应,所述至少两个信息集合中的每个信息集合包括至少一条历史评论信息;
根据所述评论信息类别生成所述至少两个信息集合中的各个信息集合分别对应的展示区域;
将所述各个信息集合中的历史评论信息分别展示在所对应的展示区域内。
2.如权利要求1所述的方法,其特征在于,所述将所述各个信息集合中的历史评论信息分别展示在所对应的展示区域内,包括:
获取所述各个信息集合中的历史评论信息的条数;
根据所述条数对所述各个信息集合所对应的展示区域进行排列;
将所述各个信息集合中的历史评论信息分别展示在对应排序后的展示区域内。
3.如权利要求1所述的方法,其特征在于,所述将所述各个信息集合中的历史评论信息分别展示在所对应的展示区域内,包括:
获取所述各个信息集合中的历史评论信息的生成时间戳;
根据所述生成时间戳,确定所述各个信息集合中的历史评论信息的生成时间戳总值;
按照所述生成时间戳总值,对所述各个信息集合对应的展示区域进行排列;
将所述各个信息集合中的历史评论信息分别展示在对应排序后的展示区域内。
4.如权利要求2或3所述的方法,其特征在于,所述至少两个信息集合包括信息集合Ki和信息集合Kj,所述信息集合Ki与展示区域Pm相对应,所述信息集合Kj与展示区域Pn,i、j、m、n均为小于或等于S的正整数,S为所述至少两个信息集合中的信息集合的数量;
所述将所述各个信息集合中的历史评论信息分别展示在对应排序后的展示区域内,包括:
在第一时刻将所述信息集合Ki中的历史评论信息展示在所述展示区域Pm内;
在第二时刻将所述信息集合Kj中的历史评论信息展示在所述展示区域Pn内,所述第一时刻早于所述第二时刻,所述展示区域Pm的排列顺序位于所述展示区域Pn的排序顺序之前。
5.如权利要求1所述的方法,其特征在于,所述将所述各个信息集合中的历史评论信息分别展示在所对应的展示区域内,包括:
获取所述各个信息集合中的历史评论信息的特征属性,所述特征属性包括:历史评论信息在历史评论文本中出现的次数、历史评论信息被查看的次数以及历史评论信息被收藏的次数;
根据所述历史评论信息在历史评论文本中出现的次数、所述历史评论信息被查看的次数以及所述历史评论信息被收藏的次数,确定所述历史评论信息的评论权重;
从所述各个信息集合中,筛选评论权重大于权重阈值的历史评论信息,作为第一目标评论信息;
将从所述各个信息集合筛选出的所述第一目标评论信息分别展示在所属的展示区域内。
6.如权利要求1所述的方法,其特征在于,所述根据所述评论信息类别生成所述至少两个信息集合中的各个信息集合分别对应的展示区域,包括:
获取所述评论信息类别对应的类别数量,以及展示界面;
将所述展示界面划分为至少两个展示区域,所述至少两个展示区域的区域数量与所述类别数量相同;
获取所述各个信息集合中的历史评论信息的条数,以及所述至少两个展示区域中的各个展示区域的大小;
根据所述条数以及所述各个展示区域的大小,确定所述各个信息集合分别对应的展示区域。
7.如权利要求1所述的方法,其特征在于,所述对所述至少两条历史评论信息进行聚类处理,得到至少两个信息集合,包括:
提取所述至少两条历史评论信息中各条历史评论信息的语义信息,所述语义信息用于指示历史评论信息的评论信息类别;
获取所述至少两条历史评论信息中的各条历史评论信息的语义信息之间的相似度;
根据所述相似度对所述至少两条历史评论信息进行聚类处理,得到至少两个信息集合。
8.如权利要求7所述的方法,其特征在于,所述获取所述至少两条历史评论信息中的各条历史评论信息的语义信息之间的相似度,包括:
获取所述至少两条历史评论信息中的各条历史评论信息的语义信息之间的距离;
根据所述距离确定所述至少两条历史评论信息中的各条历史评论信息的语义信息之间的相似度。
9.如权利要求1所述的方法,其特征在于,所述获取与所述目标对象关联的至少两条历史评论信息,包括:
获取所述目标对象的对象类别;
获取对象类别与所述目标对象的对象类别匹配的对象对应的历史评论文本;
从所述历史评论文本中提取文本片段,作为与所述目标对象关联的至少两条历史评论信息。
10.如权利要求9所述的方法,其特征在于,所述从所述历史评论文本中提取文本片段,作为与所述目标对象关联的至少两条历史评论信息,包括:
对所述历史评论文本进行切分处理,得到至少两个候选文本片段;
从至少两个候选文本片段中,筛选字段与关键字段字典中的字段匹配的候选文本片段,作为与所述目标对象关联的至少两条历史评论信息。
11.如权利要求1所述的方法,其特征在于,所述方法还包括:
响应于针对所述至少两条历史评论信息中的第二目标历史评论信息的选择操作,在评论信息输入界面上展示所述第二目标历史评论信息;
接收在所述评论信息输入界面上输入的评论信息;
采用所输入的评论信息以及所述第二目标历史评论信息,对所述目标对象进行评论。
12.一种数据处理装置,其特征在于,包括:
获取模块,用于响应针对待评论的目标对象的评论请求,获取与所述目标对象关联的至少两条历史评论信息;
聚类模块,用于对所述至少两条历史评论信息进行聚类处理,得到至少两个信息集合,一个信息集合与一个评论信息类别对应,所述至少两个信息集合中的每个信息集合包括至少一条历史评论信息;
生成模块,用于根据所述评论信息类别生成所述至少两个信息集合中的各个信息集合分别对应的展示区域;
展示模块,用于将所述各个信息集合中的历史评论信息分别展示在所对应的展示区域内。
13.一种计算机设备,其特征在于,包括:处理器及存储器;
其中,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,以执行如权利要求1至11任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如权利要求1至11中任一项所述方法的步骤。
CN202010284402.4A 2020-04-13 2020-04-13 数据处理方法、装置、存储介质及设备 Active CN111475731B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010284402.4A CN111475731B (zh) 2020-04-13 2020-04-13 数据处理方法、装置、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010284402.4A CN111475731B (zh) 2020-04-13 2020-04-13 数据处理方法、装置、存储介质及设备

Publications (2)

Publication Number Publication Date
CN111475731A true CN111475731A (zh) 2020-07-31
CN111475731B CN111475731B (zh) 2021-10-15

Family

ID=71752209

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010284402.4A Active CN111475731B (zh) 2020-04-13 2020-04-13 数据处理方法、装置、存储介质及设备

Country Status (1)

Country Link
CN (1) CN111475731B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215607A (zh) * 2020-10-21 2021-01-12 拉扎斯网络科技(上海)有限公司 虚拟支付信息的处理方法和装置,存储介质和电子设备
CN113254711A (zh) * 2021-06-29 2021-08-13 腾讯科技(深圳)有限公司 一种互动图像的显示方法、装置、计算机设备和存储介质
CN113553421A (zh) * 2021-06-22 2021-10-26 北京百度网讯科技有限公司 评论文本的生成方法、装置、电子设备和存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070115256A1 (en) * 2005-11-18 2007-05-24 Samsung Electronics Co., Ltd. Apparatus, medium, and method processing multimedia comments for moving images
US20140013241A1 (en) * 2012-07-03 2014-01-09 Wendell Brown System & method for online rating of electronic content
CN104731554A (zh) * 2015-03-30 2015-06-24 北京奇艺世纪科技有限公司 一种评论信息发布方法及装置
US20150186947A1 (en) * 2013-12-30 2015-07-02 Verizon and Redbox Digital Entertainment Services, LLC Digital content recommendations based on user comments
CN104951432A (zh) * 2015-05-21 2015-09-30 腾讯科技(深圳)有限公司 一种对信息进行处理的方法及装置
CN107291780A (zh) * 2016-04-12 2017-10-24 腾讯科技(深圳)有限公司 一种用户评论信息展示方法和装置
CN109003113A (zh) * 2018-05-30 2018-12-14 浙江口碑网络技术有限公司 评价数据处理和展示的方法及装置,电子设备及存储设备
CN109634489A (zh) * 2018-12-13 2019-04-16 北京达佳互联信息技术有限公司 发表评论的方法、装置、设备及可读存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070115256A1 (en) * 2005-11-18 2007-05-24 Samsung Electronics Co., Ltd. Apparatus, medium, and method processing multimedia comments for moving images
US20140013241A1 (en) * 2012-07-03 2014-01-09 Wendell Brown System & method for online rating of electronic content
US20150186947A1 (en) * 2013-12-30 2015-07-02 Verizon and Redbox Digital Entertainment Services, LLC Digital content recommendations based on user comments
CN104731554A (zh) * 2015-03-30 2015-06-24 北京奇艺世纪科技有限公司 一种评论信息发布方法及装置
CN104951432A (zh) * 2015-05-21 2015-09-30 腾讯科技(深圳)有限公司 一种对信息进行处理的方法及装置
CN107291780A (zh) * 2016-04-12 2017-10-24 腾讯科技(深圳)有限公司 一种用户评论信息展示方法和装置
CN109003113A (zh) * 2018-05-30 2018-12-14 浙江口碑网络技术有限公司 评价数据处理和展示的方法及装置,电子设备及存储设备
CN109634489A (zh) * 2018-12-13 2019-04-16 北京达佳互联信息技术有限公司 发表评论的方法、装置、设备及可读存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215607A (zh) * 2020-10-21 2021-01-12 拉扎斯网络科技(上海)有限公司 虚拟支付信息的处理方法和装置,存储介质和电子设备
CN112215607B (zh) * 2020-10-21 2021-11-26 拉扎斯网络科技(上海)有限公司 虚拟支付信息的处理方法和装置,存储介质和电子设备
CN113553421A (zh) * 2021-06-22 2021-10-26 北京百度网讯科技有限公司 评论文本的生成方法、装置、电子设备和存储介质
CN113254711A (zh) * 2021-06-29 2021-08-13 腾讯科技(深圳)有限公司 一种互动图像的显示方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN111475731B (zh) 2021-10-15

Similar Documents

Publication Publication Date Title
CN111444428B (zh) 基于人工智能的信息推荐方法、装置、电子设备及存储介质
US20220198516A1 (en) Data recommendation method and apparatus, computer device, and storage medium
CN108536852B (zh) 问答交互方法和装置、计算机设备及计算机可读存储介质
US11645517B2 (en) Information processing method and terminal, and computer storage medium
CN111475731B (zh) 数据处理方法、装置、存储介质及设备
CN112395506A (zh) 一种资讯推荐方法、装置、电子设备和存储介质
CN111784455A (zh) 一种物品推荐方法及推荐设备
CN106294500B (zh) 内容项目的推送方法、装置及***
CN110909165A (zh) 数据处理方法、装置、介质及电子设备
CN102750366B (zh) 基于自然交互输入的视频搜索***及方法
US20150379610A1 (en) Recommendation information presentation device, recommendation information presentation method, and recommendation information presentation program
CN113111264B (zh) 界面内容显示方法、装置、电子设备及存储介质
CN112905897B (zh) 相似用户确定方法、向量转化模型、装置、介质及设备
EP4150480A1 (en) Descriptive insight generation and presentation system
US20230244862A1 (en) Form processing method and apparatus, device, and storage medium
Kiran et al. User specific product recommendation and rating system by performing sentiment analysis on product reviews
CN112749330A (zh) 信息推送方法、装置、计算机设备和存储介质
CN111310025A (zh) 模型训练方法、数据处理方法、装置以及相关设备
CN111737607B (zh) 数据处理方法、装置、电子设备以及存储介质
CN113065329A (zh) 数据的处理方法和装置
CN116127066A (zh) 文本聚类方法、文本聚类装置、电子设备及存储介质
CN113505293B (zh) 信息推送方法、装置、电子设备及存储介质
CN110852078A (zh) 生成标题的方法和装置
CN114330519A (zh) 数据确定方法、装置、电子设备及存储介质
CN111325575A (zh) 问题信息推荐方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40025846

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant