CN109067557A - 通信群组的监控方法、装置及相应的服务器及存储介质 - Google Patents
通信群组的监控方法、装置及相应的服务器及存储介质 Download PDFInfo
- Publication number
- CN109067557A CN109067557A CN201810799355.XA CN201810799355A CN109067557A CN 109067557 A CN109067557 A CN 109067557A CN 201810799355 A CN201810799355 A CN 201810799355A CN 109067557 A CN109067557 A CN 109067557A
- Authority
- CN
- China
- Prior art keywords
- group
- server
- label
- communication group
- name
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 title claims abstract description 183
- 238000012544 monitoring process Methods 0.000 title claims abstract description 63
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000006870 function Effects 0.000 claims description 26
- 239000000284 extract Substances 0.000 claims description 14
- 230000008901 benefit Effects 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 6
- 238000012806 monitoring device Methods 0.000 claims description 5
- 230000035945 sensitivity Effects 0.000 claims description 4
- 238000013461 design Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 235000013399 edible fruits Nutrition 0.000 description 4
- 230000000977 initiatory effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 239000003999 initiator Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 208000001613 Gambling Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
- H04L12/1813—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
- H04L12/1831—Tracking arrangements for later retrieval, e.g. recording contents, participants activities or behavior, network status
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
- H04L12/1813—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/51—Discovery or management thereof, e.g. service location protocol [SLP] or web services
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Economics (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明提供一种通信群组的监控方法、装置及相应的服务器及存储介质,所述方法包括步骤:第一服务器接收客户端发送的通信群组组名称的设置请求;提取所述设置请求中包含的群组名称,并依据所述群组名称向第二服务器获取所述群组名称对应的通信群组的第一标签;依据所述第一标签创建待监控群组列表,实时监测并更新所述非法通信群组中各所述通信群组的第一标签,当监测到所述第一标签大于预设阈值时关闭所述通信群组的指定功能。本发明基于对群名以及群成员的聊天信息进行敏感词识别,以给通信群组以及用户设定非法级别,最终实现有效地识别并监控非法通信群组和待监控用户。
Description
技术领域
本发明涉及通信技术领域,具体涉及一种通信群组的监控方法、装置及相应的服务器及存储介质。
背景技术
目前,几乎所有的IM都带有群聊功能,群的一个特点是里面的人很多,很杂,有的通信群组中得聊天内容或群性质可能存在非法内容或非法建群目的,如涉及黄赌毒等。因此,如何快速有效的识别一个非法的群组织以及一些非法的用户一直是一个有待解决的难题。
现有的方案一般都是基于用户的举报,如某人发表了不良言论,语言攻击,散布费发消息等,通过举报按钮来通报给客服,然后再又客服来分析这个人是否符合待监控用户的特性。
然而,这种识别方法很传统,效率慢,不及时,容易误报,导致误伤害,用户体验差。
发明内容
本发明的目的在于提供一种通信群组的监控方法、装置及相应的服务器及存储介质,解决快速有效地识别非法的通信和非法的用户,基于敏感词自动判断并设定通信群组和用户的所述第二标签。
为实现该目的,本发明采用如下技术方案:
第一方面,本发明提供一种通信群组的监控方法,包括以下步骤:
第一服务器接收客户端发送的通信群组组名称的设置请求;
所述第一服务器提取所述设置请求中包含的群组名称,并依据所述群组名称向第二服务器获取所述群组名称对应的通信群组的第一标签;
所述第一服务器依据所述第一标签创建待监控群组列表,实时监测并更新所述待监控群组列表中各通信群组的第一标签,当监测到所述第一标签大于预设阈值时关闭所述通信群组的指定功能。
具体的,所述所述第一服务器提取所述群组名称设置请求中包含的群组名称,并依据所述群组名称向第二服务器获取所述群组名称对应的通信群组的第一标签,具体包括:
所述第一服务器将所述群组名称转发至第二服务器;
所述第二服务器依据所述群组名称向第三服务器获取第一识别结果并依据所述第一识别结果为所述群组名称对应的通信群组设定所述第一标签后反馈至所述第一服务器。
具体的,所述第二服务器依据所述群组名称向第三服务器获取第一识别结果并依据所述第一识别结果为所述群组名称对应的通信群组设定所述第一标签后反馈至所述第一服务器,具体包括:
所述第三服务器提取所述群组名称中的第一特征词,并将所述第一特征词与预设的第一敏感词数据库中的各敏感词进行匹配,以确定包含敏感词以及敏感词个数的所述第一识别结果。
优选的,所述第二服务器依据所述群组名称向第三服务器获取第一识别结果并依据所述第一识别结果为所述群组名称对应的通信群组设定所述第一标签后反馈至所述第一服务器,具体还包括:
所述第二服务器依据所述第一识别结果中的所述敏感词个数设定各通信群组的第一标签,其中,将敏感词个数为零个的通信群组的非法级别设定为零级。
具体的,所述第一服务器依据所述第一标签创建待监控群组列表,具体包括:
第一服务器将所述第一标签大于零级的通信群组加入所述待监控群组列表中。
优选的,所述所述第一服务器提取所述设置请求中包含的群组名称,并依据所述群组名称向第二服务器获取所述群组名称对应的通信群组的第一标签,具体包括:
为当前建群账户设定其用户属性的第二标签。
具体的,所述第一服务器依据所述第一标签创建待监控群组列表,并实时监测并更新所述非法通信群组中各所述通信群组的第一标签,当监测到所述第一标签大于预设阈值时关闭所述通信群组的指定功能,具体包括:
所述第一服务器实时获取所述待监控群组列表中各通信群组的聊天信息,将所述聊天信息转发至第四服务器;
所述第四服务器对所述聊天信息进行敏感词识别以确定并记录所述通信群组中指定成员账户的所述第二标签并反馈;
所述第一服务器依据所述第二标签更新所述第一标签。
具体的,所述第四服务器对所述聊天信息进行敏感词识别以确定并记录所述通信群组中成员的第二标签并反馈,具体包括:
所述第四服务器提取所述聊天信息中的第二特征词,并将所述第二特征词与预设的第二敏感词数据库中敏感词进行匹配以确定所述聊天信息对应的包含敏感词个数的第二识别结果并反馈;
所述第一服务器接收所述第二识别结果,并依据所述第二识别结果确定该通信群组的成员的第二标签。
具体的,所述第一服务器接收所述第二识别结果,并依据所述第二识别结果确定该通信群组的成员的第二标签,具体包括:
所述第一服务器设定所述第二标签的初始值为零;
所述第一服务器依据所述第二识别结果中的所述敏感词的个数以及所述初始值更新并记录所述第二标签。
优选的,所述关闭所述通信群组的指定功能包括以下任意一种:
屏蔽所述通信群组、关闭所述通信群组的发言功能、关闭所述通信群组中指定成员的发言功能以及解散所述通信群组。
具体的,所述第一服务器提取所述群组名称设置请求中包含的群组名称,并依据所述群组名称向第二服务器获取所述群组名称对应的通信群组的第一标签之后,还包括:
所述第一服务器依据所述第一标签设定各通信群组的非法级别列表并存入kafka。
第二方面,本发明提供一种非法通信群组的监控装置,包括:
接收模块,被配置为接收客户端发送的群组名称设置请求;
提取模块,被配置为提取所述群组名称设置请求中包含的群组名称,并依据所述群组名称向第二服务器获取所述群组名称对应的通信群组的第一标签;
监控模块,被配置为依据所述第一标签创建待监控群组列表,并实时监测并更新所述非法通信群组中各所述通信群组的第一标签,当监测到所述第一标签大于预设阈值时关闭所述通信群组的指定功能。
第三方面,本发明提供一种服务器,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:执行第一方面中任一项所述的通信群组的监控方法的步骤。
第四方面,本发明提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种非法通信群组的监控非法,所述方法包括如第一方面任意一项所述的通信群组的监控方法的步骤。
第五方面,提供一种应用程序/计算机程序产品,当所述存储介质中的指令由服务器的处理器执行时,使得服务器能够执行一种通信群组的监控方法,所述方法包括任一技术方案所述的通信群组的监控方法的步骤。
与现有技术相比,本发明具备如下优点:
1,本发明提供通信群组的监控方法,通过第一服务器接收客户端发送的通信群组组名称的设置请求;提取所述设置请求中包含的群组名称,并依据所述群组名称向第二服务器获取所述群组名称对应的通信群组的第一标签;依据所述第一标签创建待监控群组列表,实时监测并更新所述非法通信群组中各所述通信群组的第一标签,当监测到所述第一标签大于预设阈值时关闭所述通信群组的指定功能。本发明通过第一服务器及第二服务器等的相互协作,实现对通信群组的非法级别的识别并判定后对实时对非法通信群组进行监测。本发明通过判断群组名称触发的违禁词,直接且高效,可及时发现通信群组的非法动态,有助于从源头防控非法群的创建。
2,本发明对各通信群组的非法级别采用逐渐升高的方式并形成一个非法级别的优先级队列存入kafka中,便于后续的监控,不同的非法级别采取不同的处理方式,防止对初级别的误伤害以及高级别数据的疏漏。
3,发明在判定通信群组为非法通信群组之后,对非法通信群组实行实时监测,并通过第四服务器对非法通信群组中的各成员的聊天信息进行敏感词的识别,以设定并记录群成员的用户属性的第二标签,并依据所述第二标签更新所述第一标签,当所述第一标签达到预设阈值后对通信群组的指定功能实行关闭以实现实时监控非法通信群组。
显然,上述有关本发明优点的描述是概括性的,更多的优点描述将体现在后续的实施例揭示中,以及,本领域技术人员也可以本发明所揭示的内容合理地发现本发明的其他诸多优点。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明通信群组的监控方法的一种实施例流程示意图;
图2为本发明通信群组的监控装置的一种实施例示意图;
图3为本发明实施例服务器基本结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本领域技术人员应当理解,本发明所称的“应用”、“应用程序”、“应用软件”以及类似表述的概念,是业内技术人员所公知的相同概念,是指由一系列计算机指令及相关数据资源有机构造的适于电子运行的计算机软件。除非特别指定,这种命名本身不受编程语言种类、级别,也不受其赖以运行的操作***或平台所限制。理所当然地,此类概念也不受任何形式的终端所限制。
本领域技术人员应当理解,本发明所称的用户界面、显示界面泛指能够用于向智能终端发送所述控制指令的显示界面,例如,可以是Android/IOS/Windows Phone***的设置页面中的一个选项(或按键,由所述应用程序添加其中,下同),也可以是从桌面呼出的通知栏或者交互页面中的一个选项,还可以是所述应用程序的一个活动组件所构造的页面中的一个选项。
图1是根据一示例性实施例示出的一种通信群组的监控方法的流程图,如图1所示,非所述法通信群组的监控方法用于服务器中,包括以下步骤。
在步骤S11中:第一服务器接收客户端发送的通信群组组名称的设置请求。
本发明实施例中,所述一种通信群组的监控方法由第一服务器、第三服务器、第二服务器以及第四服务器共同参与完成。其中,一种可能的设计中,所述第一服务器为业务服务器、所述第二服务器为标记服务器、所述第三服务器为敏感词服务器以及所述第四服务器为策略服务器。
进一步的,所述第一服务器负责接收客户端发送的群名设置请求,设置相应的群组名称并将所述群组名称发送至第二服务器进行第一标签的标记。另外,所述第一服务器还负责对已经加入待检测群组列表的通信群组进行监控。
其中,所述第一标签用于标识所述通信群中所包含的敏感词的数量等级或用于标识所述通信群组的非法级别。
进一步的,所述第二服务器对所述群组名称进行第一标签的标记时具体通过将所述群组名称发送至所述第三服务器,以使所述第三服务器对所述群组名称进行敏感词识别并向所述第二服务器反馈对应的第一识别结果。其中,所述第二服务器用来记录通信群组和用户实体的非法级别并将相应的结果反馈至所述第一服务器。所述第三服务器用于对所述群组名称进行敏感词识别并将识别结果反馈至所述第二服务器。
本发明所述设置请求中携带了通信群组的群组名称。
在步骤S12中:所述第一服务器提取所述设置请求中包含的群组名称,并依据所述群组名称向第二服务器获取所述群组名称对应的通信群组的第一标签。
本发明实施例中,所述第一服务器依据所述群组名称向第二服务器获取所述群组名称对应的通信群组的第一标签优选以下方案:
所述第一服务器将所述群组名称转发至第二服务器;所述第二服务器依据所述群组名称向第三服务器获取第一识别结果并依据所述第一识别结果为所述群组名称对应的通信群组设定所述第一标签后反馈至所述第一服务器。其中,所述第二服务器用来记录通信群组和用户实体的非法级别,默认所述非法级别以一个byte记录,所述非法级别包括[0,1,2,3,4,5,6,7],默认0表示合法,从1到7均表示待监控用户或非法通信群组,级别逐渐升高,每次重复标记则增加该非法级别的字段。所述第三服务器提供词汇判断功能,能够通过后端的数据库识别当前群组名称中的敏感词以及敏感词的个数。
具体的,一种可能的设计中,所述第三服务器提取所述群组名称中的第一特征词,并将所述第一特征词与预设的第一敏感词数据库中的各敏感词进行匹配,以确定包含敏感词以及敏感词个数的所述第一识别结果。进一步的,所述第二服务器依据所述第一识别结果设定所述第一标签。
一种可能的设计中,所述第二服务器设定所述第一标签时优选以下方案:
依据所述第一识别结果中的所述敏感词个数设定各通信群组的第一标签,其中,将敏感词个数为零个的通信群组的非法级别设定为零级。其他级别可以依据所述敏感词的个数依次设定,例如,敏感词个数为一个的设定所述第一标签为一级,敏感词个数为两个的设定其第一标签为二级,依次类推。当然,也可以为前提的设定方式,例如,敏感词个数为两个的设定所述第一标签为一级,敏感词个数为四个的设定所述第一标签为二级。可以理解的,本发明实施例中,依据所述第一识别结果设定所述第一标签还可以根据需要有其他设定算法,在此不做具体限定。
本发明实施例中,通过群组名称初步确定当前通信群组的所述第一标签并记录,后续通过实时监测当前通信群组中各成员账户的聊天信息,依据该聊天信息进一步设定成员账户的所述第二标签,最终依据所述第二标签更新所述第一标签。
其中,所述第二标签用于标识所述通信群中群成员的聊天信息所包含的敏感词的数量等级或用于标识所述通信群中群成员的用户属性的非法级别。
本发明实施例中,在确定当前群的所述第一标签时,同时为当前建群账户设定其用户属性的第二标签。其设定依据同上面所述群属性的第一标签的设定依据。
优选的,本发明实施例中,所述第一服务器获取所述第一标签以及群成员的用户属性的第二标签后将各标签存入kafka形成各通信群组的非法级别优先级队列,便于进行监听,然后通过web端的方式给管理人员进行监控处理。本发明所有标签将根据其级别级别进入到不同的优先级队列,优先级高的队列的标签优先由人工处理。本发明由所述第三服务器的敏感词库和kafka作为基础服务串联整个业务,鲁棒性好,联动性灵活度高。
本发明实施例中,对通信群组的第一标签进行记录的同时也设定用户的第二标签,如设定当前通信群组的第一标签时,同时设定该通信群组的建群用户的第二标签并存储,后续也对第二标签大于预设阈值的用户进行监控。
在步骤S13中:所述第一服务器依据所述第一标签创建待监控群组列表,实时监测并更新所述非法通信群组中各所述通信群组的第一标签,当监测到所述第一标签大于预设阈值时关闭所述通信群组的指定功能。
本发明实施例中,所述第一服务器将所述第一标签大于零级的通信群组判断为非法通信群组,并将其建立一个分组形成待监控群组列表,以便后续实时监控该待监控群组列表。
需要说明的时,本发明也根据用户的所述第二标签建立待监控用户列表,以便后续对待监控用户也实行监控。
进一步的,所述第一服务器实时获取所述待监控群组列表中各通信群组中各成员的聊天信息,将所述聊天信息转发至第四服务器,所述第四服务器对所述聊天信息进行敏感词识别得到第二识别结果后将所述第二识别结果反馈至所述第一服务器,以便所述第一服务器依据所述第二标签更新所述第一标签。其中,所述第二识别结果的内容包括但不限于聊天信息所包含的敏感词以及敏感词个数、聊天信息的内容、聊天信息的发起方的账户等。
进一步的,所述第四服务器获取当前聊天信息后,具体通过提取当前聊天信息中的第二特征词,并将所述第二特征词与预设的第二敏感词数据库中敏感词进行匹配以确定当前聊天信息中包含的敏感词的个数。
一种实施方式中,所述第一服务器中预先对各条聊天信息添加信息标识如编号,并将各条聊天信息以及其信息标识与发起该聊天信息的成员账户建立对应关系,后续向所述第四服务器仅发送当前聊天信息以及所述信息标识,所述第四服务器接收所述聊天信息以及所述信息标识后对所述聊天信息进行敏感词识别以得到包含所述信息标识的所述第二识别结果。所述第一服务器接收所述第二识别结果后依据所述信息标识对应记录该信息标识对应用户的所述第二标签。
另一种所述方式中,所述第一服务器将当前聊天信息以及发起该聊天信息的发起方账户一并发送至第四服务器,所述第四服务器接收所述当前聊天信息以及发起方账户后对所述聊天信息进行敏感词识别以生成包含所述发起方账户的所述第二识别结果并反馈至第一服务器。所述第一服务器接收所述第二识别结果后对应记录该发起方账户对应的所述第二标签。
进一步的,所述第一服务器设定所述第二标签优选以下方案:
所述第一服务器设定所述第二标签的初始值为零,依据所述第二识别结果中的所述敏感词的个数以及所述初始值更新并记录所述第二标签。例如,敏感词个数为一个则对应将所述第二标签加一级,以此类推。
进一步的,所述第一服务器实时累积各聊天信息的发起方账户的所述第二标签,当所述第二标签达到预设阈值时,则将所述第一标签加一级,以实现依据通信群组中各聊天信息的监测结果更新所述第二标签。
本发明实施例中,所述关闭所述通信群组的指定功能包括但不限于:屏蔽所述通信群组、关闭所述通信群组的发言功能、关闭所述通信群组中指定成员的发言功能以及解散所述通信群组。例如,本发明对于所述第一标签为5的通信群组和用户进行重点观测,如果到达7的阈值则采用屏蔽群和发言功能,性质恶劣的将解散群。
图2是根据一示例性实施例示出的非法通信群组的监控装置框图。参照图2,该装置包括接收模块11、提取模块12以及监控模块13。
该接收模块11被配置为第一服务器接收客户端发送的通信群组组名称的设置请求。
本发明实施例中,所述一种通信群组的监控方法由第一服务器、第三服务器、第二服务器以及第四服务器共同参与完成。其中,一种可能的设计中,所述第一服务器为业务服务器、所述第二服务器为标记服务器、所述第三服务器为敏感词服务器以及所述第四服务器为策略服务器。
进一步的,所述第一服务器负责接收客户端发送的群名设置请求,设置相应的群组名称并将所述群组名称发送至第二服务器进行第一标签的标记。另外,所述第一服务器还负责对已经加入待检测群组列表的通信群组进行监控。
其中,所述第一标签用于标识所述通信群中所包含的敏感词的数量等级或用于标识所述通信群组的非法级别。
进一步的,所述第二服务器对所述群组名称进行第一标签的标记时具体通过将所述群组名称发送至所述第三服务器,以使所述第三服务器对所述群组名称进行敏感词识别并向所述第二服务器反馈对应的第一识别结果。其中,所述第二服务器用来记录通信群组和用户实体的非法级别并将相应的结果反馈至所述第一服务器。所述第三服务器用于对所述群组名称进行敏感词识别并将识别结果反馈至所述第二服务器。
本发明所述设置请求中携带了通信群组的群组名称。
所述提取模块12被配置为所述第一服务器提取所述设置请求中包含的群组名称,并依据所述群组名称向第二服务器获取所述群组名称对应的通信群组的第一标签。
本发明实施例中,所述第一服务器依据所述群组名称向第二服务器获取所述群组名称对应的通信群组的第一标签优选以下方案:
所述第一服务器将所述群组名称转发至第二服务器;所述第二服务器依据所述群组名称向第三服务器获取第一识别结果并依据所述第一识别结果为所述群组名称对应的通信群组设定所述第一标签后反馈至所述第一服务器。其中,所述第二服务器用来记录通信群组和用户实体的非法级别,默认所述非法级别以一个byte记录,所述非法级别包括[0,1,2,3,4,5,6,7],默认0表示合法,从1到7均表示待监控用户或非法通信群组,级别逐渐升高,每次重复标记则增加该非法级别的字段。所述第三服务器提供词汇判断功能,能够通过后端的数据库识别当前群组名称中的敏感词以及敏感词的个数。
具体的,一种可能的设计中,所述第三服务器提取所述群组名称中的第一特征词,并将所述第一特征词与预设的第一敏感词数据库中的各敏感词进行匹配,以确定包含敏感词以及敏感词个数的所述第一识别结果。进一步的,所述第二服务器依据所述第一识别结果设定所述第一标签。
一种可能的设计中,所述第二服务器设定所述第一标签时优选以下方案:
依据所述第一识别结果中的所述敏感词个数设定各通信群组的第一标签,其中,将敏感词个数为零个的通信群组的非法级别设定为零级。其他级别可以依据所述敏感词的个数依次设定,例如,敏感词个数为一个的设定所述第一标签为一级,敏感词个数为两个的设定其第一标签为二级,依次类推。当然,也可以为前提的设定方式,例如,敏感词个数为两个的设定所述第一标签为一级,敏感词个数为四个的设定所述第一标签为二级。可以理解的,本发明实施例中,依据所述第一识别结果设定所述第一标签还可以根据需要有其他设定算法,在此不做具体限定。
本发明实施例中,通过群组名称初步确定当前通信群组的所述第一标签并记录,后续通过实时监测当前通信群组中各成员账户的聊天信息,依据该聊天信息进一步设定成员账户的所述第二标签,最终依据所述第二标签更新所述第一标签。
其中,所述第二标签用于标识所述通信群中群成员的聊天信息所包含的敏感词的数量等级或用于标识所述通信群中群成员的用户属性的非法级别。
本发明实施例中,在确定当前群的所述第一标签时,同时为当前建群账户设定其用户属性的第二标签。其设定依据同上面所述群属性的第一标签的设定依据。
优选的,本发明实施例中,所述第一服务器获取所述第一标签以及群成员的用户属性的第二标签后将各标签存入kafka形成各通信群组的非法级别优先级队列,便于进行监听,然后通过web端的方式给管理人员进行监控处理。本发明所有标签将根据其级别级别进入到不同的优先级队列,优先级高的队列的标签优先由人工处理。本发明由所述第三服务器的敏感词库和kafka作为基础服务串联整个业务,鲁棒性好,联动性灵活度高。
本发明实施例中,对通信群组的第一标签进行记录的同时也设定用户的第二标签,如设定当前通信群组的第一标签时,同时设定该通信群组的建群用户的第二标签并存储,后续也对第二标签大于预设阈值的用户进行监控。
该监控模块13被配置为所述第一服务器依据所述第一标签创建待监控群组列表,实时监测并更新所述非法通信群组中各所述通信群组的第一标签,当监测到所述第一标签大于预设阈值时关闭所述通信群组的指定功能。
本发明实施例中,所述第一服务器将所述第一标签大于零级的通信群组判断为非法通信群组,并将其建立一个分组形成待监控群组列表,以便后续实时监控该待监控群组列表。
需要说明的时,本发明也根据用户的所述第二标签建立待监控用户列表,以便后续对待监控用户也实行监控。
进一步的,所述第一服务器实时获取所述待监控群组列表中各通信群组中各成员的聊天信息,将所述聊天信息转发至第四服务器,所述第四服务器对所述聊天信息进行敏感词识别得到第二识别结果后将所述第二识别结果反馈至所述第一服务器,以便所述第一服务器依据所述第二标签更新所述第一标签。其中,所述第二识别结果的内容包括但不限于聊天信息所包含的敏感词以及敏感词个数、聊天信息的内容、聊天信息的发起方的账户等。
进一步的,所述第四服务器获取当前聊天信息后,具体通过提取当前聊天信息中的第二特征词,并将所述第二特征词与预设的第二敏感词数据库中敏感词进行匹配以确定当前聊天信息中包含的敏感词的个数。
一种实施方式中,所述第一服务器中预先对各条聊天信息添加信息标识如编号,并将各条聊天信息以及其信息标识与发起该聊天信息的成员账户建立对应关系,后续向所述第四服务器仅发送当前聊天信息以及所述信息标识,所述第四服务器接收所述聊天信息以及所述信息标识后对所述聊天信息进行敏感词识别以得到包含所述信息标识的所述第二识别结果。所述第一服务器接收所述第二识别结果后依据所述信息标识对应记录该信息标识对应用户的所述第二标签。
另一种所述方式中,所述第一服务器将当前聊天信息以及发起该聊天信息的发起方账户一并发送至第四服务器,所述第四服务器接收所述当前聊天信息以及发起方账户后对所述聊天信息进行敏感词识别以生成包含所述发起方账户的所述第二识别结果并反馈至第一服务器。所述第一服务器接收所述第二识别结果后对应记录该发起方账户对应的所述第二标签。
进一步的,所述第一服务器设定所述第二标签优选以下方案:
所述第一服务器设定所述第二标签的初始值为零,依据所述第二识别结果中的所述敏感词的个数以及所述初始值更新并记录所述第二标签。例如,敏感词个数为一个则对应将所述第二标签加一级,以此类推。
进一步的,所述第一服务器实时累积各聊天信息的发起方账户的所述第二标签,当所述第二标签达到预设阈值时,则将所述第一标签加一级,以实现依据通信群组中各聊天信息的监测结果更新所述第二标签。
本发明实施例中,所述关闭所述通信群组的指定功能包括但不限于:屏蔽所述通信群组、关闭所述通信群组的发言功能、关闭所述通信群组中指定成员的发言功能以及解散所述通信群组。例如,本发明对于所述第一标签为5的通信群组和用户进行重点观测,如果到达7的阈值则采用屏蔽群和发言功能,性质恶劣的将解散群。
请参考图3,图3是根据一示例性实施例示出的一种非法通信群组的监控装置3的框图。例如,装置3可以被提供为一服务器。参照图3,装置3包括处理组件0322,其进一步包括一个或多个处理器,以及由存储器0332所代表的存储器资源,用于存储可由处理组件0322的执行的指令,例如应用程序。存储器0332中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件0322被配置为执行指令,以执行上述方法:第一服务器接收客户端发送的通信群组组名称的设置请求;所述第一服务器提取所述设置请求中包含的群组名称,并依据所述群组名称向第二服务器获取所述群组名称对应的通信群组的第一标签;所述第一服务器依据所述第一标签创建待监控群组列表,实时监测并更新所述非法通信群组中各所述通信群组的第一标签,当监测到所述第一标签大于预设阈值时关闭所述通信群组的指定功能。
装置3还可以包括一个电源组件0326被配置为执行装置3的电源管理,一个有线或无线网络接口0350被配置为将装置3连接到网络,和一个输入输出(I/O)接口0358。装置3可以操作基于存储在存储器0332的操作***,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
另一种实施例中,本发明还提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种非法通信群组的监控非法,所述方法包括任一技术方案所述的通信群组的监控方法的步骤。
另一种实施例中,本发明提供一种应用程序,当所述存储介质中的指令由服务器的处理器执行时,使得服务器能够执行一种通信群组的监控方法,所述方法包括任一技术方案所述的通信群组的监控方法的步骤。
综上所述,本发明最大的有益效果在于:本发明通过对群名进行第一步敏感词识别,初步确定通信群组以及用户的第一标签,并根据所述第一标签建立通信群组的非法名单,后续对加入所述非法名单中的通信群组进行实时监测,具体的,对非法通信群组中的聊天信息进行敏感词的识别,以判断通信群组中各用户的第二标签,从而根据所述第二标签更新所述第一标签,最终当所述第一标签大于预设阈值时,对所述通信群组采取监控措施,本发明所述方法各个步骤逻辑严密,监控措施牢固,客服、监控、非法数据实时联动,以敏感词库和kafka作为基础服务串联整个业务,鲁棒性好,联动性灵活度高。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (10)
1.一种通信群组的监控方法,其特征在于,包括以下步骤:
第一服务器接收客户端发送的通信群组的群组名称的设置请求;
所述第一服务器提取所述设置请求中包含的群组名称,并依据所述群组名称向第二服务器获取所述群组名称对应的通信群组的第一标签;
所述第一服务器依据所述第一标签创建待监控群组列表,实时监测并更新所述待监控群组列表中各通信群组的第一标签,当监测到所述第一标签大于预设阈值时关闭所述通信群组的指定功能。
2.根据权利要求1所述的方法,其特征在于,所述所述第一服务器提取所述群组名称设置请求中包含的群组名称,并依据所述群组名称向第二服务器获取所述群组名称对应的通信群组的第一标签,具体包括:
所述第一服务器将所述群组名称转发至第二服务器;
所述第二服务器依据所述群组名称向第三服务器获取第一识别结果并依据所述第一识别结果为所述群组名称对应的通信群组设定所述第一标签后反馈至所述第一服务器。
3.根据权利要求2所述的方法,其特征在于,所述第二服务器依据所述群组名称向第三服务器获取第一识别结果并依据所述第一识别结果为所述群组名称对应的通信群组设定所述第一标签后反馈至所述第一服务器,具体包括:
所述第三服务器提取所述群组名称中的第一特征词,并将所述第一特征词与预设的第一敏感词数据库中的各敏感词进行匹配,以确定包含敏感词以及敏感词个数的所述第一识别结果。
4.根据权利要求3所述的方法,其特征在于,所述第二服务器依据所述群组名称向第三服务器获取第一识别结果并依据所述第一识别结果为所述群组名称对应的通信群组设定所述第一标签后反馈至所述第一服务器,具体还包括:
所述第二服务器依据所述第一识别结果中的所述敏感词个数设定各通信群组的第一标签,其中,将敏感词个数为零个的通信群组的非法级别设定为零级。
5.根据权利要求1所述的方法,其特征在于,所述所述第一服务器提取所述设置请求中包含的群组名称,并依据所述群组名称向第二服务器获取所述群组名称对应的通信群组的第一标签,具体包括:
为当前建群账户设定其用户属性的第二标签。
6.根据权利要求5所述的方法,其特征在于,所述第一服务器依据所述第一标签创建待监控群组列表,并实时监测并更新所述非法通信群组中各所述通信群组的第一标签,当监测到所述第一标签大于预设阈值时关闭所述通信群组的指定功能,具体包括:
所述第一服务器实时获取所述待监控群组列表中各通信群组的聊天信息,将所述聊天信息转发至第四服务器;
所述第四服务器对所述聊天信息进行敏感词识别以确定并记录所述通信群组中指定成员账户的所述第二标签并反馈;
所述第一服务器依据所述第二标签更新所述第一标签。
7.根据权利要求6所述的方法,其特征在于,所述第四服务器对所述聊天信息进行敏感词识别以确定并记录所述通信群组中成员的第二标签并反馈,具体包括:
所述第四服务器提取所述聊天信息中的第二特征词,并将所述第二特征词与预设的第二敏感词数据库中敏感词进行匹配以确定所述聊天信息对应的包含敏感词个数的第二识别结果并反馈;
所述第一服务器接收所述第二识别结果,并依据所述第二识别结果确定该通信群组的成员的第二标签。
8.一种非法通信群组的监控装置,其特征在于,包括:
接收模块,被配置为接收客户端发送的群组名称设置请求;
提取模块,被配置为提取所述群组名称设置请求中包含的群组名称,并依据所述群组名称向第二服务器获取所述群组名称对应的通信群组的第一标签;
监控模块,被配置为依据所述第一标签创建待监控群组列表,并实时监测并更新所述非法通信群组中各所述通信群组的第一标签,当监测到所述第一标签大于预设阈值时关闭所述通信群组的指定功能。
9.一种服务器,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:执行根据权利要求1至7任一项所述的通信群组的监控方法的步骤。
10.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种通信群组的监控方法,所述方法包括权利要求1-7任意一项所述的通信群组的监控方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810799355.XA CN109067557A (zh) | 2018-07-19 | 2018-07-19 | 通信群组的监控方法、装置及相应的服务器及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810799355.XA CN109067557A (zh) | 2018-07-19 | 2018-07-19 | 通信群组的监控方法、装置及相应的服务器及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109067557A true CN109067557A (zh) | 2018-12-21 |
Family
ID=64817663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810799355.XA Pending CN109067557A (zh) | 2018-07-19 | 2018-07-19 | 通信群组的监控方法、装置及相应的服务器及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109067557A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112307015A (zh) * | 2019-07-31 | 2021-02-02 | 腾讯科技(深圳)有限公司 | 一种数据更新的方法以及相关装置 |
CN117294669A (zh) * | 2023-08-17 | 2023-12-26 | 湖南马兰数字教育科技有限公司 | 虚拟聊天室的发言管理方法、装置、设备和介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1427969A (zh) * | 2000-05-01 | 2003-07-02 | 网际运行公司 | 借助大量通信网络的大群体交互 |
CN101106748A (zh) * | 2006-07-11 | 2008-01-16 | 华为技术有限公司 | 一种移动网络的内容过滤***、装置及方法 |
CN101132404A (zh) * | 2007-09-14 | 2008-02-27 | 腾讯科技(深圳)有限公司 | 一种网页内容分级显示***及方法 |
CN103701693A (zh) * | 2013-12-31 | 2014-04-02 | 广州华多网络科技有限公司 | 通讯过程中的消息处理方法和*** |
CN106161203A (zh) * | 2015-04-28 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 群组消息处理方法及装置 |
CN107682253A (zh) * | 2017-10-27 | 2018-02-09 | 奇酷互联网络科技(深圳)有限公司 | 群聊消息处理方法、装置、移动终端及存储介质 |
CN107733773A (zh) * | 2016-08-10 | 2018-02-23 | 中兴通讯股份有限公司 | 信息保护方法、保护信息发送装置及保护信息接收装置 |
-
2018
- 2018-07-19 CN CN201810799355.XA patent/CN109067557A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1427969A (zh) * | 2000-05-01 | 2003-07-02 | 网际运行公司 | 借助大量通信网络的大群体交互 |
CN101106748A (zh) * | 2006-07-11 | 2008-01-16 | 华为技术有限公司 | 一种移动网络的内容过滤***、装置及方法 |
CN101132404A (zh) * | 2007-09-14 | 2008-02-27 | 腾讯科技(深圳)有限公司 | 一种网页内容分级显示***及方法 |
CN103701693A (zh) * | 2013-12-31 | 2014-04-02 | 广州华多网络科技有限公司 | 通讯过程中的消息处理方法和*** |
CN106161203A (zh) * | 2015-04-28 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 群组消息处理方法及装置 |
CN107733773A (zh) * | 2016-08-10 | 2018-02-23 | 中兴通讯股份有限公司 | 信息保护方法、保护信息发送装置及保护信息接收装置 |
CN107682253A (zh) * | 2017-10-27 | 2018-02-09 | 奇酷互联网络科技(深圳)有限公司 | 群聊消息处理方法、装置、移动终端及存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112307015A (zh) * | 2019-07-31 | 2021-02-02 | 腾讯科技(深圳)有限公司 | 一种数据更新的方法以及相关装置 |
CN112307015B (zh) * | 2019-07-31 | 2023-11-03 | 腾讯科技(深圳)有限公司 | 一种数据更新的方法以及相关装置 |
CN117294669A (zh) * | 2023-08-17 | 2023-12-26 | 湖南马兰数字教育科技有限公司 | 虚拟聊天室的发言管理方法、装置、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9213946B1 (en) | Comparing models | |
US11869480B2 (en) | Idea scoring for creativity tool selection | |
US11025741B2 (en) | Dynamic cognitive user interface | |
EP3362891A1 (en) | Customizing program features on a per-user basis | |
US9679124B2 (en) | Smart CAPTCHAs | |
CN112035638A (zh) | 信息处理方法、装置、存储介质及设备 | |
CN109067557A (zh) | 通信群组的监控方法、装置及相应的服务器及存储介质 | |
CN108306813B (zh) | 会话消息的处理方法、服务器及客户端 | |
CN110837549B (zh) | 一种信息处理方法、装置及存储介质 | |
US20180150748A1 (en) | Enhanced Ingestion of Question-Answer Pairs into Question Answering Systems by Preprocessing Online Discussion Sites | |
US20210295186A1 (en) | Computer-implemented system and method for collecting feedback | |
US20180150747A1 (en) | Enhancing Time-to-Answer for Community Questions in Online Discussion Sites | |
WO2021135322A1 (zh) | 一种自动出题方法、装置及*** | |
CN112860995A (zh) | 交互方法、装置、客户端、服务器以及存储介质 | |
CN112685551A (zh) | 语料库构建方法、聊天机器人会话方法及相关装置 | |
CN109635214A (zh) | 一种学习资源的推送方法及电子设备 | |
CN113360617B (zh) | 异常识别方法、装置、设备和存储介质 | |
CN114969333A (zh) | 基于数据挖掘的网络信息安全管理方法及装置 | |
CN109359177A (zh) | 用于讲故事机器人的多模态交互方法及*** | |
CN114363277A (zh) | 基于社会关系的智能聊天方法、装置及相关产品 | |
CN116050520A (zh) | 风险处理模型训练方法、风险对象处理方法及相关装置 | |
JP2019046388A (ja) | チャットシステム、サーバ、画面生成方法及びコンピュータプログラム | |
CN113608945B (zh) | 一种数据处理方法、装置、设备及计算机可读存储介质 | |
CN111008373A (zh) | 智能问答的处理方法、装置、计算机可读介质及电子设备 | |
CN112651413A (zh) | 低俗图的集成学习分类方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181221 |