CN113630306A

CN113630306A - 信息处理方法、装置、电子设备及存储介质

Info

Publication number: CN113630306A
Application number: CN202110857187.7A
Authority: CN
Inventors: 龚存晨; 魏文长; 李求会; 于猛; 杨子闻; 张凯; 赵忻
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2021-07-28
Filing date: 2021-07-28
Publication date: 2021-11-09

Abstract

本公开是关于一种信息处理方法、装置、电子设备及存储介质，其方法包括：在接收到预设房间内第一终端发送的语音信息时，将所述语音信息转换为文本信息；将所述文本信息进行分词处理，得到分词集合，所述分词集合包括一个或者多个词汇；如果所述分词集合中存在符合预设提示条件的目标词汇，生成针对所述第一终端的提示信息。这样可以避免通过人工审核导致的管理成本较高且效率较低的问题，并且本公开实施例可以对用户发出的语音信息进行实时监控，而且还可以避免用户的隐私泄露。

Description

信息处理方法、装置、电子设备及存储介质

技术领域

本公开涉及信息技术领域，尤其涉及一种信息处理方法、装置、电子设备及存储介质。

背景技术

目前的语音聊天程序可供用户使用各自的终端设备通过网络进入同一房间，在房间内进行语音交流。为了维护房间内的秩序，会有管理员来监管各方的发言。但通过人工的方式来进行管理，通常存在管理成本较高且效率较低的问题。

发明内容

为克服相关技术中存在的问题，本公开提供一种信息处理方法、装置、电子设备及存储介质。

根据本公开实施例的第一方面，提供一种信息处理方法，所述方法包括：

在接收到预设房间内第一终端发送的语音信息时，将所述语音信息转换为文本信息；

将所述文本信息进行分词处理，得到分词集合，所述分词集合包括一个或者多个词汇；

如果所述分词集合中存在符合预设提示条件的目标词汇，生成针对所述第一终端的提示信息。

可选地，所述方法还包括：

提取所述分词集合中的实体词，并将所述分词集合中的实体词分别与预设词汇集合中的词汇进行匹配，所述预设词汇集合中的词汇均符合所述预设提示条件；

如果所述分词集合中的实体词存在与所述预设词汇集合中的词汇相匹配的词汇，确定所述分词集合中存在符合所述预设提示条件的目标词汇。

可选地，所述方法还包括：

获取所述目标词汇在所述语音信息中所处的目标位置；

将所述语音信息中目标位置对于的语音数据进行屏蔽处理，得到处理后的语音信息；

将所述处理后的语音信息发送给第二终端。

可选地，所述方法还包括：

获取针对所述第一终端的提示信息的生成次数；

如果所述生成次数大于预设阈值，屏蔽所述第一终端发送的语音信息，以使所述预设房间内的其他终端在屏蔽期间无法接收所述第一终端发送的语音信息。

可选地，所述屏蔽所述第一终端发送的语音信息，包括：

获取所述第一终端所处的违规等级；其中，所述违规等级的级别与所述提示信息的生成次数正相关；

根据所述第一终端的违规等级，确定对所述第一终端发送的语音信息的屏蔽时长，并按照所述屏蔽时长对所述第一终端发送的语音信息进行屏蔽处理；其中，所述屏蔽时长与所述违规等级的级别正相关。

可选地，所述方法还包括：

如果未检测到所述分词集合中存在符合所述预设提示条件的目标词汇，，接收所述预设房间内其他终端发送的针对所述第一终端的投诉信息；

将所述投诉信息发送到人工审核平台，以使人工审核人员基于所述投诉信息对所述第一终端发送的语音信息进行评估。

根据本公开实施例的第二方面，提供一种信息处理装置，所述装置包括：

转换单元，被配置为在接收到预设房间内第一终端发送的语音信息时，将所述语音信息转换为文本信息；

分词单元，被配置为将所述文本信息进行分词处理，得到分词集合，所述分词集合包括一个或者多个词汇；

信息生成单元，被配置为在所述分词集合中存在符合预设提示条件的目标词汇时，生成针对所述第一终端的提示信息。

可选地，所述装置还包括：

实体词提取单元，被配置为提取所述分词集合中的实体词，并将所述分词集合中的实体词分别与预设词汇集合中的词汇进行匹配，所述预设词汇集合中的词汇均符合所述预设提示条件；

目标词汇确定单元，被配置为在所述分词集合中的实体词存在与所述预设词汇集合中的词汇相匹配的词汇，确定所述分词集合中存在符合预设提示条件的目标词汇。

可选地，所述装置还包括：

位置获取单元，被配置为获取所述目标词汇在所述语音信息中所处的目标位置；

第一屏蔽单元，被配置为将所述语音信息中目标位置对于的语音数据进行屏蔽处理，得到处理后的语音信息；

发送单元，被配置为将所述处理后的语音信息发送给第二终端。

可选地，所述装置还包括：

次数生成单元，被配置为获取针对所述第一终端的提示信息的生成次数；

第二屏蔽单元，被配置为如果所述生成次数大于预设阈值，屏蔽所述第一终端发送的语音信息，以使所述预设房间内的其他终端在屏蔽期间无法接收所述第一终端发送的语音信息。

可选地，所述第二屏蔽单元，包括：

等级获取模块，被配置为获取所述第一终端所处的违规等级；其中，所述违规等级的级别与所述提示信息的生成次数正相关；

屏蔽模块，被配置为根据所述第一终端的违规等级，确定对所述第一终端发送的语音信息的屏蔽时长，并按照所述屏蔽时长对所述第一终端发送的语音信息进行屏蔽处理；其中，所述屏蔽时长与所述违规等级的级别正相关。

可选地，所述装置还包括：

投诉信息接收单元，被配置为在如果未检测到所述分词集合中存在符合所述预设提示条件的目标词汇，，接收所述预设房间内其他终端发送的针对所述第一终端的投诉信息；

投诉信息发送单元，被配置为将所述投诉信息发送到人工审核平台，以使人工审核人员基于所述投诉信息对所述第一终端发送的语音信息进行评估。

根据本公开实施例的第三方面，提供一种服务器，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行上述任一所述的信息处理方法。

本公开实施例的第四方面，提供一种非临时性计算机可读存储介质，当所述存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行上述一种信息处理方法。

根据本公开实施例的第五方面，提供一种应用程序/计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的信息处理方法的步骤。

本公开的实施例提供的技术方案可以包括以下有益效果：

本公开实施例提供的信息处理方法、装置、电子设备及存储介质，在接收到预设房间内第一终端发送的语音信息时，通过将该语音信息转换为文本信息，并且对该文本信息进行分词处理，如果得到的分词集合中存在符合预设提示条件的目标词汇，那么就会生成第一终端的提示信息。这样可以避免通过人工审核导致的管理成本较高且效率较低的问题，并且本公开实施例可以对用户发出的语音信息进行实时监控，还可以避免用户的隐私泄露。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种信息处理方法的流程图；

图2是根据一示例性实施例示出的一种信息处理装置的框图；

图3是根据一示例性实施例示出的一种服务器的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种信息处理方法的流程图，如图1所示，该方法可以用于服务器中，该服务器与预设房间内的多个终端通信连接，可以包括以下步骤：

在步骤S110中，在接收到预设房间内第一终端发送的语音信息时，将语音信息转换为文本信息。

在本公开提供的实施例中，多个用户在通过终端一起联网玩游戏、观影、语音聊天或者视频聊天时，通常会在同一个房间内进行，即某个用户通过终端发出的语音信息会被同一个房间内的其他用户接收。但是用户在进行语音聊天时，有时候出于情绪激动或者其他原因，会发出不当言论，造成网络中不文明的现象出现。而为了净化网络环境，很多时候相关方会通过人工在线监督的方式监督这种现象，在人数比较多的房间中，通常会以网管的身份对用户发出的语音信息进行监督。但是由于人工成本较高，效率也比较低，并且受限于各地方言用语，很多时候人工审核也无法做出及时回应。

因此，本公开实施例中通过在线实时识别的方式，对用户发出的语音信息进行审核。具体的，服务器在接收到第一终端发送的语音信息时，会将语音信息转换为文本信息，以便通过对文本中的文字进行分析处理。

需要说明的是，服务器在接收到终端发送的语音信息时，可以首先检测用户使用的语言，如是否为汉语或外语等，如果是汉语，会检测用的是普通话还是地方方言，以便对该语音信息进行更好的识别。

在步骤S120中，将文本信息进行分词处理，得到分词集合。其中，该分词集合包括一个或者多个词汇。

在将预约信息转换为文本信息时，需要对该文本信息进行分词处理，处理后会得到包括一个或者多个词汇的分词集合。例如，该文本信息为“颐和园是我国四大园林之一”，经过分词处理，可以得到包含“颐和园”、“是”、“我国”、“四大园林”、“之一”这几个词汇的分词集合。当然，根据分词规则不同，其中的词汇还可以再进一步分解。

在步骤S130中，如果分词集合中存在符合预设提示条件的目标词汇，生成针对第一终端的提示信息。

本公开实施例中，可以通过预先设置符合预设提示条件的目标词汇集合，通过将分词集合中的各个词汇分别与预设词汇集合中的词汇进行匹配，来识别语音信息中是否存在符合预设提示条件的目标词汇。可以理解的是，预设词汇集合中的词汇均符合预设提示条件。并且，在实际应用中，如果一个词汇属于敏感词汇，那么，该词汇满足预设提示条件。

其中，实施例中的预设词汇集合可以根据预先的统计得到，并且不断融入用户反映较多的词汇等来对预设词汇集合进行优化。一旦该分词集合中存在符合预设提示条件的目标词汇，及时通过生成的提示信息对第一终端的用户发出提示信息，使该用户注意自己的用语，进而达到实时监控的目的。

因此，该方法还可以包括以下步骤：

在步骤S131中，提取分词集合中的实体词，并将分词集合中的实体词分别与预设词汇集合中的词汇进行匹配，其中，预设词汇集合中的词汇均符合预设提示条件。

在步骤S132中，如果分词集合中的实体词存在与预设词汇集合中的词汇相匹配的词汇，确定分词集合中存在符合预设提示条件的目标词汇。

需要说明的是，本公开实施例在通过将分词集合中的词汇分别与预设词汇集合中的词汇进行匹配之前，还可以对该分词集合中的词汇进行预处理。由于符合预设提示条件的目标词汇通常都是实体词，因此可以将分词集合中的虚词等其他词汇过滤掉，保留其中的实体词，然后将这实体词分别与预设词汇集合中的词汇进行匹配，这样可以提高匹配的效率。

本公开实施例提供的信息处理方法，在接收到预设房间内第一终端发送的语音信息时，通过将该语音信息转换为文本信息，并且对该文本信息进行分词处理，如果得到的分词集合中存在符合预设提示条件的目标词汇，那么就会生成第一终端的提示信息。这样可以避免通过人工审核导致的管理成本较高且效率较低的问题，并且本公开实施例可以对用户发出的语音信息进行实时监控，而且还可以避免用户的隐私泄露。

一旦用户发出的语音信息中出现符合预设提示条件的目标词汇，为了对该符合预设提示条件的目标词汇进行精准识别处理，且不影响该用户与其他用户的整天聊天，在本公开提供的又一实施例中，结合上述实施例，该方法还可以包括以下步骤：

在步骤S133中，获取目标词汇在语音信息中所处的目标位置。

在步骤S134中，将语音信息中目标位置对于的语音数据进行屏蔽处理，得到处理后的语音信息。

在步骤S135中，将处理后的语音信息发送给第二终端。

在多个用户在同一个房间内进行语音聊天过程中，期间例如玩游戏或者其他情况出现某个用户情绪激动的情况时，那么聊天过程中很可能会出现不文明用于的出现，例如骂人的话等，而这些不文明的用语往往就是几个词汇，本公开实施例通过检测这些词汇的位置，然后将其屏蔽掉，使用户可以正常发送处理后语音信息，不但可以避免不文明的词汇被其他用户听到，还可以起到净化网络环境的目的，并且还可以让该用户表达出其说话的其他含义，不会因为屏蔽了一个或几个符合预设提示条件的目标词汇而影响话语的正常表达。

示例性的，第一用户在于其他用户在同一个房间内玩游戏过程中，某个时间发出的语音信息对应的文本信息为：“我说过几遍了，小黑你就是个后期英雄，现在要低调发育，早点出神装后期就稳了，你却一直到处打架，连死三次，现在身上还是一双草鞋，你简直就是一个**”。本公开实施例通过敏感词匹配，发现这几句话的最后一个词汇为符合预设提示条件的目标词汇，那么就可以将其屏蔽掉，避免不文明用语的现象，而且还不会影响用户整个意思的表达。

需要说明的是，本公开实施例在对语音信息中的符合预设提示条件的目标词汇进行屏蔽处理时，可以通过对声音的频率调整，将其转换为“滴滴”的声音，避免其他用户以为发出语音的这个用户话还没说完而影响其他用户的表达。实施例中通过将处理后的语音信息发送给第二终端，可以避免第二用户接收到不文明用语。

在本公开提供的又一实施例中，结合上述实施例，该方法还可以包括以下步骤：

在步骤S140中，获取针对第一终端的提示信息的生成次数。

在步骤S150中，如果生成次数大于预设阈值，屏蔽第一终端发送的语音信息，以使预设房间内的其他终端在屏蔽期间无法接收第一终端发送的语音信息。

本公开实施例中，会对用户发出的语音信息进行监控，如果对其提示信息的生成次数大于预设阈值，说明这个用户现在的心态不适合在线发布语音信息，为避免进一步对其他用户造成干扰，可以将其语音信息进行屏蔽处理。这样房间内的其他终端在屏蔽期间无法接收第一终端发送的语音信息。

具体的，可以通过获取第一终端所处的违规等级；其中，违规等级的级别与提示信息的生成次数正相关；并根据第一终端的违规等级，确定对第一终端发送的语音信息的屏蔽时长，并按照屏蔽时长对第一终端发送的语音信息进行屏蔽处理；其中，屏蔽时长与违规等级的级别正相关。

示例性的，用户通过第一终端发出的语音信息中，如果一段时间内有三次提示信息，那么可以将其违规等级设置为初级，屏蔽其后续的语音信息发布的屏蔽时长为5分钟。如果一段时间内该用户累计有5次提示信息，那么可以将其违规等级设置为中级，会屏蔽其后续的语音信息发布的屏蔽时长为15分钟。如果一段时间内该用户累计有超过5次提示信息，那么可以将其违规等级设置为高级，会屏蔽其后续的语音信息发布的屏蔽时长为24小时。具体可以根据情况进行设定，本公开实施例不限于此。即用户在一段时间内的提示信息生成次数越多，对其惩罚的力度会越大，以净化网络环境，提示用户注意自己要规范用语。

在本公开提供的又一实施例中，结合上述实施例，该方法还可以包括如下步骤：

在步骤S160中，如果未检测到所述分词集合中存在符合所述预设提示条件的目标词汇，接收预设房间内其他终端发送的针对第一终端的投诉信息。

在步骤S170中，将投诉信息发送到人工审核平台，以使人工审核人员基于投诉信息对第一终端发送的语音信息进行评估。

受限于预设词汇集合词汇的数量和更新速度，以及用户如果采用方言或者外语等不能及时识别时，一旦接收到预设房间内其他终端发送的针对第一终端的投诉信息，可以将该投诉信息及时发送到人工审核平台，通过人工审核人员基于投诉信息对第一终端发送的语音信息进行评估，避免相关符合预设提示条件的目标词汇会被大量传播而影响其他用户。

图2是根据一示例性实施例示出的一种信息处理装置框图。参照图2，该装置包括转换单元10，分词单元20和信息生成单元30。

在本公开提供的又一实施例中，所述装置还包括：

目标词汇确定单元，被配置为在所述分词集合中的实体词存在与所述预设词汇集合中的词汇相匹配的词汇时，确定所述分词集合中存在符合预设提示条件的目标词汇。

在本公开提供的又一实施例中，所述装置还包括：

在本公开提供的又一实施例中，所述第二屏蔽单元，包括：

在本公开提供的又一实施例中，所述装置还包括：

投诉信息接收单元，被配置为如果未检测到所述分词集合中存在符合所述预设提示条件的目标词汇，，接收所述预设房间内其他终端发送的针对所述第一终端的投诉信息；

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本公开实施例提供的信息处理装置，在接收到预设房间内第一终端发送的语音信息时，通过将该语音信息转换为文本信息，并且对该文本信息进行分词处理，如果得到的分词集合中存在符合预设提示条件的目标词汇，那么就会生成第一终端的提示信息。这样可以避免通过人工审核导致的管理成本较高且效率较低的问题，并且本公开实施例可以对用户发出的语音信息进行实时监控，而且还可以避免用户的隐私泄露。

图3是根据一示例性实施例示出的一种用于信息处理的装置1900的框图。例如，装置1900可以被提供为一服务器。参照图3，装置1900包括处理组件1922，其进一步包括一个或多个处理器，以及由存储器1932所代表的存储器资源，用于存储可由处理组件1922的执行的指令，例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件1922被配置为执行指令，以执行上述信息处理方法。

装置1900还可以包括一个电源组件1926被配置为执行装置1900的电源管理，一个有线或无线网络接口1950被配置为将装置1900连接到网络，和一个输入输出(I/O)接口1958。装置1900可以操作基于存储在存储器1932的操作***，例如Windows ServerTM，MacOS XTM，UnixTM,LinuxTM，FreeBSDTM或类似。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器804，上述指令可由装置800的处理器820执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本公开实施例还提供一种非临时性计算机可读存储介质，当所述存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行上述一种信息处理方法。

根据本公开实施例还提供一种应用程序/计算机程序产品，在本公开提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的信息处理方法的步骤。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本公开实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、DSL(Digital Subscriber Line，数字用户线))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD(Digital Versatile Disc，数字多功能光盘))、或者半导体介质(例如SSD(Solid StateDisk，固态硬盘))等。

上述存储器可以包括RAM(Random Access Memory，随机存取存储器)，也可以包括NVM(Non-Volatile Memory，非易失性存储器)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离于上述处理器的存储装置。

上述处理器可以是通用处理器，包括CPU(Central Processing Unit，中央处理器)、NP(Network Processor，网络处理器)等；还可以是DSP(Digital Signal Processor，数字信号处理器)、ASIC(Application Specific Integrated Circuit，专用集成电路)、FPGA(Field-Programmable Gate Array，现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种信息处理方法，其特征在于，所述方法包括：

在接收到预设语音聊天室内第一终端发送的语音信息时，将所述语音信息转换为文本信息；

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

获取所述目标词汇在所述语音信息中所处的目标位置；

将所述语音信息中目标位置对应的语音数据进行屏蔽处理，得到处理后的语音信息；

将所述处理后的语音信息发送给第二终端。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取针对所述第一终端的提示信息的生成次数；

5.根据权利要求4所述的方法，其特征在于，所述屏蔽所述第一终端发送的语音信息，包括：

6.根据权利要求1～5任一所述的方法，其特征在于，所述方法还包括：

如果未检测到所述分词集合中存在符合所述预设提示条件的目标词汇，接收所述预设房间内其他终端发送的针对所述第一终端的投诉信息；

7.一种信息处理装置，其特征在于，所述装置包括：

8.一种服务器，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行权利要求1-6任一所述的信息处理方法。

9.一种非临时性计算机可读存储介质，其特征在于，当所述存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行一种信息处理方法，所述方法包括权利要求1-6任一所述的信息处理方法的步骤。

10.一种应用程序/计算机程序产品，其特征在于，当其在计算机上运行时，使得计算机执行权利要求1-6任一所述的信息处理方法的步骤。