CN116663505B

CN116663505B - 一种基于互联网的评论区管理方法及***

Info

Publication number: CN116663505B
Application number: CN202310944810.1A
Authority: CN
Inventors: 黄�俊; 雷伟坚; 颜啸宇
Original assignee: Xiamen Qiliang Technology Co ltd
Current assignee: Xiamen Qiliang Technology Co ltd
Priority date: 2023-07-31
Filing date: 2023-07-31
Publication date: 2023-10-13
Anticipated expiration: 2043-07-31
Also published as: CN116663505A

Abstract

本申请涉及一种基于互联网的评论区管理方法、***、计算机设备、存储介质和计算机程序产品。所述方法包括：获取与目标对象相关联的评论区数据集；调用预设的语义分析算法提取所述评论内容数据中的语义特征；根据所述语义特征对所述评论内容数据赋予至少一个话题标签；根据所述类别标签将所述评论区数据集划分至若干个评论区数据子集；筛选出样本数量超过预设的分区阈值的第一评论区数据子集，创建话题评论分区；当检测到所述第一评论区数据子集中的任一所述评论内容数据的曝光时长超过预设的第一曝光阈值时，提高对应的话题评论分区的展示优先级采用本方法能够改善用户阅览体验。

Description

一种基于互联网的评论区管理方法及***

技术领域

本申请涉及互联网信息管理技术领域，特别是涉及一种基于互联网的评论区管理方法、***、计算机设备、存储介质和计算机程序产品。

背景技术

评论一般指媒体编辑部或作者对新近发生的有价值的新闻事件和有普遍意义的紧迫问题，运用分析和综合的方法，就事论理，就实论虚，有着鲜明针对性和指导性的一种新闻文体，属于论说文的范畴。随着现代媒体的发展，评论的主体逐渐由新闻媒体转向了阅览新闻事件等的群众。在此背景下，媒体内容下的评论区也成为了人们抒发观点、彰显个性的主要阵地。在当代社交媒体中，评论区发挥的重要的价值，对于企业、平台来说做评论区的目的是在于提高产品活跃度，提高用户黏性，增加用户互动，营造良好氛围，从而增强产品关系留存、打造社交关系、话题动态后续讨论。而对于用户的需求是作为动态发布者可以了解他人对内容的看法，希望有所收获。同时作为动态消费者可以发表见解或表达态度，并希望获得反馈及认同。

在现实场景中，热门媒体视频的评论区中评论数量可能多至几千甚至上万条，过于大量的评论区内容容易导致用户的浏览体验下降，因此亟须实现对评论区的有效管理，将更有价值的评论内容呈现给用户。

相关技术中，通常对评论区设置多种展示结构，主要包括主题式、平铺式以及盖楼式三种，三种评论区管理结构主要是针对评论的字母关系进行区分的，评论的字母关系中，针对动态的评论视为一级评论，针对一级评论的评论则视为二级评论。

然而，目前的评论区管理方法，存在如下的技术问题：

不同用户对评论内容的话题阅览需求存在差异，在大批量评论的管理中，仅以评论的字母关系作为管理逻辑，容易导致评论区结构简单，用户体验差的问题。

发明内容

基于此，有必要针对上述技术问题，提供一种能够基于话题类别将评论区进行分类管理，从而提高相同话题类别的评论内容聚集的可能性，改善用户阅览体验的一种基于互联网的评论区管理方法、***、计算机设备、计算机可读存储介质和计算机程序产品。

第一方面，本申请提供了一种基于互联网的评论区管理方法。所述方法包括：

获取与目标对象相关联的评论区数据集，所述评论区数据集包括评论内容数据；

调用预设的语义分析算法提取所述评论内容数据中的语义特征；

根据所述语义特征对所述评论内容数据赋予至少一个话题标签，所述话题标签为预设的、用于实现评论区分区的类别标签；

根据所述类别标签将所述评论区数据集划分至若干个评论区数据子集，所述评论区数据子集与所述类别标签一一对应；

筛选出样本数量超过预设的分区阈值的第一评论区数据子集，创建与所述第一评论区数据子集对应的话题评论分区；

当检测到所述第一评论区数据子集中的任一所述评论内容数据的曝光时长超过预设的第一曝光阈值时，提高对应的所述话题评论分区中的所述评论内容数据的展示优先级。

在其中一个实施例中，所述根据所述类别标签将所述评论区数据集划分至若干个评论区数据子集包括：

获取所述评论内容数据所属的类别标签的交并比，所述交并比的计算公式为：

；

所述重合的类别标签数为任意两条所述评论内容数据所属的类别标签的重合数，所述所属的类别标签总数为任意两条所述评论内容数据所属的类别标签的总数；

根据所述交并比确定目标评论内容数据与其他评论内容数据的关联度参数。

在其中一个实施例中，所述方法还包括：

当检测到所述目标评论内容数据的曝光时长超过预设的第二曝光阈值时，

提高与所述目标评论内容数据的关联度参数高于预设的关联阈值的所述评论内容数据的展示优先级。

在其中一个实施例中，所述方法还包括：

遍历所述评论区数据集，获取随机选取的两个所述评论内容数据的重复度；

将所述重复度高于预设的重复阈值的相似评论内容数据择一保留，将其余的所述相似评论内容数据折叠隐藏。

在其中一个实施例中，所述当检测到所述第一评论区数据子集中的任一所述评论内容数据的曝光时长超过预设的第一曝光阈值时，提高对应的所述话题评论分区中的所述评论内容数据的展示优先级包括：

获取所述评论内容数据的基础展示权重参数；

在提高所述展示优先级时，按照预设的加权规则增加需要提高所述展示优先级的所述评论内容数据的展示权重参数。

在其中一个实施例中，所述评论内容数据包括文字内容、图像内容以及预设的符号内容。

第二方面，本申请还提供了一种基于互联网的评论区管理***。所述***包括：

评论数据集模块，用于获取与目标对象相关联的评论区数据集，所述评论区数据集包括评论内容数据；

语义识别模块，用于调用预设的语义分析算法提取所述评论内容数据中的语义特征；

标签赋予模块，用于根据所述语义特征对所述评论内容数据赋予至少一个话题标签，所述话题标签为预设的、用于实现评论区分区的类别标签；

子集划分模块，用于根据所述类别标签将所述评论区数据集划分至若干个评论区数据子集，所述评论区数据子集与所述类别标签一一对应；

分区创建模块，用于筛选出样本数量超过预设的分区阈值的第一评论区数据子集，创建与所述第一评论区数据子集对应的话题评论分区；

分区展示模块，用于当检测到所述第一评论区数据子集中的任一所述评论内容数据的曝光时长超过预设的第一曝光阈值时，提高对应的所述话题评论分区中的所述评论内容数据的展示优先级。

在其中一个实施例中，所述子集划分模块包括：

交并比计算模块，用于获取所述评论内容数据所属的类别标签的交并比，所述交并比的计算公式为：

；

内容关联识别模块，用于根据所述交并比确定目标评论内容数据与其他评论内容数据的关联度参数。

在其中一个实施例中，所述***还包括：

曝光检测模块，用于当检测到所述目标评论内容数据的曝光时长超过预设的第二曝光阈值时，

关联展示模块，用于提高与所述目标评论内容数据的关联度参数高于预设的关联阈值的所述评论内容数据的展示优先级。

在其中一个实施例中，所述***还包括：

重复检测模块，用于遍历所述评论区数据集，获取随机选取的两个所述评论内容数据的重复度；

重复折叠模块，用于将所述重复度高于预设的重复阈值的相似评论内容数据择一保留，将其余的所述相似评论内容数据折叠隐藏。

在其中一个实施例中，所述分区展示模块包括：

基础权重模块，用于获取所述评论内容数据的基础展示权重参数；

加权展示模块，用于在提高所述展示优先级时，按照预设的加权规则增加需要提高所述展示优先级的所述评论内容数据的展示权重参数。

第三方面，本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现如第一方面中任意一项实施例所述的一种基于互联网的评论区管理方法中的步骤。

第四方面，本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面中任意一项实施例所述的一种基于互联网的评论区管理方法中的步骤。

第五方面，本申请还提供了一种计算机程序产品。所述计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现如第一方面中任意一项实施例所述的一种基于互联网的评论区管理方法中的步骤。

上述一种基于互联网的评论区管理方法、***、计算机设备、存储介质和计算机程序产品，能够达到对应背景技术中的技术问题的如下有益效果：

在对评论区内容的管理中，对评论内容数据进行语义分析，从而获取能够概况评论内容的语义特征，根据语义特征对评论内容数据附加标签，从而有助于通过标签对评论内容数据进行分类标识，在大量的分类标识中，将数量达到一定规模的子集合创建为话题评论分区，从而使得话题评论分区内能够有足够的评论内容激发用户的阅览兴趣以及讨论兴趣，当监测到用户对某一类型的评论内容阅览时间较长时，提高相关话题评论分区中的评论内容的展示优先级。在实施中，能够摆脱评论的字母关系对评论内容展示的限制，还能够基于话题类别将评论区进行分类管理，从而提高相同话题类别的评论内容聚集的可能性，改善用户阅览体验。

附图说明

图1为一个实施例中一种基于互联网的评论区管理方法的流程示意图；

图2为一个实施例中一种基于互联网的评论区管理***的结构框图；

图3为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

然而，目前的评论区管理方法，存在如下的技术问题：

基于此，本申请实施例提供了一种基于互联网的评论区管理方法。

在一个实施例中，如图1所示，提供了一种基于互联网的评论区管理方法，本实施例以该方法应用于终端进行举例说明，可以理解的是，该方法也可以应用于服务器，还可以应用于包括终端和服务器的***，并通过终端和服务器的交互实现。本实施例中，该方法包括以下步骤：

步骤101：获取与目标对象相关联的评论区数据集，所述评论区数据集包括评论内容数据；

步骤102：调用预设的语义分析算法提取所述评论内容数据中的语义特征；

步骤103：根据所述语义特征对所述评论内容数据赋予至少一个话题标签，所述话题标签为预设的、用于实现评论区分区的类别标签；

步骤104：根据所述类别标签将所述评论区数据集划分至若干个评论区数据子集，所述评论区数据子集与所述类别标签一一对应；

步骤105：筛选出样本数量超过预设的分区阈值的第一评论区数据子集，创建与所述第一评论区数据子集对应的话题评论分区；

步骤106：当检测到所述第一评论区数据子集中的任一所述评论内容数据的曝光时长超过预设的第一曝光阈值时，提高对应的所述话题评论分区中的所述评论内容数据的展示优先级。

上述一种基于互联网的评论区管理方法中，能够产生如下的有益效果：

在其中一个实施例中，所述步骤104包括：

步骤201：获取所述评论内容数据所属的类别标签的交并比，所述交并比的计算公式为：

；

步骤202：根据所述交并比确定目标评论内容数据与其他评论内容数据的关联度参数。

其中，关联度参数可以指用于描述目标评论内容数据以及其他评论内容数据的相关程度的量化参数。

示例性地，终端在获取目标评论内容数据以及其他评论内容数据的交并比后，可以进一步对目标评论内容数据以及其他评论内容数据之间的关联度参数进行计算。在应用中，交并比数据可以用于比对两个对象之间的关联性，两个评论内容数据之间重合的类别标签数占比越高，则可以表明两个评论内容数据之间的关联性越强。因此，交并比参数可以作为其中一个关联度参数。此外，关联度参数还可以包括通过其他算法获取的数据，例如两个评论内容数据整段内容的重复度、两个评论内容数据中关键词的重复度、两个评论内容数据中相同或等同的关键词数量等。

这样，终端可以以交并比为基础，获取能够表征目标评论内容数据以及其他评论内容数据之间关联程度的关联性参数。

在其中一个实施例中，所述方法还包括：

步骤301：当检测到所述目标评论内容数据的曝光时长超过预设的第二曝光阈值时；

步骤302：提高与所述目标评论内容数据的关联度参数高于预设的关联阈值的所述评论内容数据的展示优先级。

在其中一个实施例中，所述方法还包括：

步骤401：遍历所述评论区数据集，获取随机选取的两个所述评论内容数据的重复度；

其中，重复度可以指评论内容数据之间的内容的重复程度。

示例性地，终端可以对评论内容数据进行解析，将评论内容数据切分为一个包括若干个待查字段的比对集合。此时，比对集合中包括了能够表示特定内容的第一类待查字段，例如：名称、形容词等，还包括了不具备特定含义、能够表示逻辑关系等的语法词，例如：的、地等。终端可以分别对参数比对的两个评论内容数据进行解析，并比对两个比对集合中的第一类待查字段，从而获取两个评论内容数据中的重复的待查字段数量。此时，终端可以基于重复的待查字段数量对两个评论内容数据之间的重复程度进行量化，得到重复度。

具体地，在量化过程中，终端可以根据技术人员的预先设定的重复度量化算法，分别计算重复的待查字段数量、表情包等媒体数据在重复度中占据的比重大小。此外，还对重复待查字段数量等不同的重复元素在重复度中占据的权重进行设定。作为补充地，终端还可以预先建立关键词库，对不同的关键词设定不同的权重。

步骤402：将所述重复度高于预设的重复阈值的相似评论内容数据择一保留，将其余的所述相似评论内容数据折叠隐藏。

在其中一个实施例中，所述步骤106包括：

步骤501：获取所述评论内容数据的基础展示权重参数；

步骤502：在提高所述展示优先级时，按照预设的加权规则增加需要提高所述展示优先级的所述评论内容数据的展示权重参数。

应该理解的是，虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思，本申请实施例还提供了一种用于实现上述所涉及的一种基于互联网的评论区管理方法的一种基于互联网的评论区管理***。该***所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个一种基于互联网的评论区管理***实施例中的具体限定可以参见上文中对于一种基于互联网的评论区管理方法的限定，在此不再赘述。

在一个实施例中，如图2所示，提供了一种基于互联网的评论区管理***，包括：

在其中一个实施例中，所述子集划分模块包括：

；

在其中一个实施例中，所述***还包括：

在其中一个实施例中，所述分区展示模块包括：

上述一种基于互联网的评论区管理***中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图3所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output，简称I/O）和通信接口。其中，处理器、存储器和输入/输出接口通过***总线连接，通信接口通过输入/输出接口连接到***总线。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于互联网的评论区管理方法。

本领域技术人员可以理解，图3中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，还提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

需要说明的是，本申请所涉及的用户信息（包括但不限于用户设备信息、用户个人信息等）和数据（包括但不限于用于分析的数据、存储的数据、展示的数据等），均为经用户授权或者经过各方充分授权的信息和数据，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器（Read-OnlyMemory，ROM）、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器（ReRAM）、磁变存储器（Magnetoresistive Random Access Memory，MRAM）、铁电存储器（Ferroelectric Random Access Memory，FRAM）、相变存储器（Phase Change Memory，PCM）、石墨烯存储器等。易失性存储器可包括随机存取存储器（Random Access Memory，RAM）或外部高速缓冲存储器等。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器（Static Random Access Memory，SRAM）或动态随机存取存储器（Dynamic RandomAccess Memory，DRAM）等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等，不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等，不限于此。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请的保护范围应以所附权利要求为准。

Claims

1.一种基于互联网的评论区管理方法，其特征在于，所述方法包括：

当检测到所述第一评论区数据子集中的任一所述评论内容数据的曝光时长超过预设的第一曝光阈值时，提高对应的所述话题评论分区中的所述评论内容数据的展示优先级，所述曝光时长为所述评论内容数据的阅览时长；

所述根据所述类别标签将所述评论区数据集划分至若干个评论区数据子集包括：

；

根据所述交并比确定目标评论内容数据与其他评论内容数据的关联度参数；

所述方法还包括：

提高与所述目标评论内容数据的关联度参数高于预设的关联阈值的所述评论内容数据的展示优先级；

所述当检测到所述第一评论区数据子集中的任一所述评论内容数据的曝光时长超过预设的第一曝光阈值时，提高对应的所述话题评论分区中的所述评论内容数据的展示优先级包括：

获取所述评论内容数据的基础展示权重参数；

2.根据权利要求1所述的一种基于互联网的评论区管理方法，其特征在于，所述方法还包括：

遍历所述评论区数据集，获取随机选取的两个所述评论内容数据的重复度，所述重复度用于表示两个所述评论内容数据在内容维度的重复程度；

3.根据权利要求1所述的一种基于互联网的评论区管理方法，其特征在于，所述评论内容数据包括文字内容、图像内容以及预设的符号内容。

4.一种基于互联网的评论区管理***，其特征在于，所述***包括：

分区展示模块，用于当检测到所述第一评论区数据子集中的任一所述评论内容数据的曝光时长超过预设的第一曝光阈值时，提高对应的所述话题评论分区中的所述评论内容数据的展示优先级；

所述子集划分模块包括：

；

内容关联识别模块，用于根据所述交并比确定目标评论内容数据与其他评论内容数据的关联度参数；

所述***还包括：

关联展示模块，用于提高与所述目标评论内容数据的关联度参数高于预设的关联阈值的所述评论内容数据的展示优先级；

所述分区展示模块包括：

5.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至3中任一项所述的方法的步骤。

6.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至3中任一项所述的方法的步骤。