CN110895652A - 一种评论信息的处理方法、装置、***、设备和存储介质 - Google Patents
一种评论信息的处理方法、装置、***、设备和存储介质 Download PDFInfo
- Publication number
- CN110895652A CN110895652A CN201910925712.7A CN201910925712A CN110895652A CN 110895652 A CN110895652 A CN 110895652A CN 201910925712 A CN201910925712 A CN 201910925712A CN 110895652 A CN110895652 A CN 110895652A
- Authority
- CN
- China
- Prior art keywords
- comment
- comment information
- information
- terminal
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 44
- 238000003672 processing method Methods 0.000 title claims abstract description 25
- 238000001914 filtration Methods 0.000 claims abstract description 15
- 239000013598 vector Substances 0.000 claims description 290
- 238000011176 pooling Methods 0.000 claims description 72
- 238000004458 analytical method Methods 0.000 claims description 47
- 238000000034 method Methods 0.000 claims description 44
- 230000006870 function Effects 0.000 claims description 34
- 238000012545 processing Methods 0.000 claims description 34
- 238000001514 detection method Methods 0.000 claims description 17
- 230000004913 activation Effects 0.000 claims description 10
- 238000012552 review Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 description 22
- 238000013527 convolutional neural network Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 17
- 230000001976 improved effect Effects 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 8
- 230000002596 correlated effect Effects 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 6
- 239000010813 municipal solid waste Substances 0.000 description 6
- 238000003058 natural language processing Methods 0.000 description 6
- 230000002452 interceptive effect Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000001960 triggered effect Effects 0.000 description 4
- 230000003213 activating effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000010897 surface acoustic wave method Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明实施例公开了一种评论信息的处理方法、装置、***、设备和存储介质,所述方法应用在组终端中,包括:接收主终端的评论操作;根据所述评论操作,通知从终端显示评论界面,所述从终端与所述组终端处于同一个分组中;接收所述从终端在所述评论界面中输入的评论信息;在所述评论信息中检测敏感信息;若所述评论信息包含敏感信息,则滤除所述评论信息;若所述评论信息未包含敏感信息,则将所述评论信息发送至主终端,所述主终端用于针对所述分组,显示分组界面,所述分组界面包含所述评论信息中的评论关键词。在评论信息中检测敏感信息可过滤含有敏感信息的评论信息,避免在主终端显示含有敏感信息的评论信息,并且,可从而减少运算的时间。
Description
技术领域
本发明实施例涉及教育的技术,尤其涉及一种评论信息的处理方法、装置、***、设备和存储介质。
背景技术
随着网络科技的快速发展,在工作、学习、生活等场景中,用户经常使用各种终端辅助进行教学、会议等活动,在这些活动中,用户经常就一些主题交流评论。
在传统的技术中,用户提交的评论信息以弹幕的方式呈现,即用户提交评论信息,终端将所有的评论信息以字幕的形式实时在终端内移动,使得可以浏览用户提交的评论信息。
但是,当评论信息的数量较多时,用户浏览容易引起疲惫,错过重点,并且,若用户输入了涉及色情、暴力等敏感信息,会直接显示,造成恶劣的影响。
发明内容
本发明实施例提供一种评论信息的处理方法、装置、***、设备和存储介质,以解决当评论信息的数量较多时,用户容易错过重点,并且,直接显示敏感信息,造成恶劣的影响的问题。
第一方面,本发明实施例提供了一种评论信息的处理方法,应用在组终端中,所述方法包括:
接收主终端的评论操作;
根据所述评论操作,通知从终端显示评论界面,所述从终端与所述组终端处于同一个分组中;
接收所述从终端在所述评论界面中输入的评论信息;
在所述评论信息中检测敏感信息;
若所述评论信息包含敏感信息,则滤除所述评论信息;
若所述评论信息未包含敏感信息,则将所述评论信息发送至主终端,所述主终端用于针对所述分组,显示分组界面,所述分组界面包含所述评论信息中的评论关键词。
第二方面,本发明实施例还提供了一种评论信息的处理方法,应用在主终端内,所述方法包括:
向组终端发送评论操作;
接收所述组终端响应所述评论操作发送的评论信息,所述评论信息来源于与所述组终端处于同一个分组中的从终端,所述评论信息未包含敏感信息;
针对所述分组,从所述评论信息中提取关键词,作为评论关键词;
针对所述分组,将所述评论关键词写入分组界面中;
显示所述分组界面。
第三方面,本发明实施例还提供了一种评论信息的处理方法,一主终端连接组终端,从终端与所述组终端处于同一个分组中,所述方法包括:
所述主终端向所述组终端发送评论操作;
所述组终端根据所述评论操作,通知所述从终端显示评论界面;
所述从终端接收在所述评论界面中输入的评论信息,以及,将所述评论信息发送至所述组终端;
所述组终端在所述评论信息中检测敏感信息,若所述评论信息包含敏感信息,则滤除所述评论信息,若所述评论信息未包含敏感信息,则将所述评论信息发送至主终端;
所述主终端针对所述分组,从所述评论信息中提取关键词,作为评论关键词,将所述评论关键词写入分组界面中,以及,显示所述分组界面。
第四方面,本发明实施例还提供了一种评论信息的处理装置,应用在组终端中,所述装置包括:
评论操作接收模块,用于接收主终端的评论操作;
评论通知模块,用于根据所述评论操作,通知从终端显示评论界面,所述从终端与所述组终端处于同一个分组中;
评论信息接收模块,用于接收所述从终端在所述评论界面中输入的评论信息;
敏感信息检测模块,用于在所述评论信息中检测敏感信息;
评论信息滤除模块,用于若所述评论信息包含敏感信息,则滤除所述评论信息;
评论信息发送模块,用于若所述评论信息未包含敏感信息,则将所述评论信息发送至主终端,所述主终端用于针对所述分组,显示分组界面,所述分组界面包含所述评论信息中的评论关键词。
第五方面,本发明实施例还提供了一种评论信息的处理装置,应用在主终端内,所述装置包括:
评论操作发送模块,用于向组终端发送评论操作;
评论信息接收模块,用于接收所述组终端响应所述评论操作发送的评论信息,所述评论信息来源于与所述组终端处于同一个分组中的从终端,所述评论信息未包含敏感信息;
关键词提取模块,用于针对所述分组,从所述评论信息中提取关键词,作为评论关键词;
关键词写入模块,用于针对所述分组,将所述评论关键词写入分组界面中;
分组界面显示模块,用于显示所述分组界面。
第六方面,本发明实施例还提供了一种评论信息的处理***,所述***包括主终端、组终端与从终端,所述从终端与所述组终端处于同一个分组中;
所述主终端,用于向所述组终端发送评论操作;
所述组终端,用于根据所述评论操作,通知所述从终端显示评论界面;
所述从终端,用于接收在所述评论界面中输入的评论信息,以及,将所述评论信息发送至所述组终端;
所述组终端,还用于在所述评论信息中检测敏感信息,若所述评论信息包含敏感信息,则滤除所述评论信息,若所述评论信息未包含敏感信息,则将所述评论信息发送至主终端;
所述主终端,还用于针对所述分组,从所述评论信息中提取关键词,作为评论关键词,将所述评论关键词写入分组界面中,以及,显示所述分组界面。
第七方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面、第二方面或第三方面中任一所述的评论信息的处理方法。
第八方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面、第二方面或第三方面中任一所述的评论信息的处理方法。
在本实施例中,组终端接收主终端的评论操作,通知同一分组中的从终端显示评论界面,接收从终端在评论界面中输入的评论信息,在评论信息中检测敏感信息,若评论信息包含敏感信息,则滤除评论信息,若评论信息未包含敏感信息,则将评论信息发送至主终端,主终端用于针对分组,显示分组界面,分组界面包含评论信息中的评论关键词,一方面,在评论信息中检测敏感信息可过滤含有敏感信息的评论信息,避免在主终端显示含有敏感信息的评论信息,并且,在评论信息中检测敏感信息属于自然语言处理,处理较为复杂,组终端针对其分组内评论信息的检测敏感信息,相对于主终端针对所有分组内评论信息的检测敏感信息,单个分组内评论信息的数量少于所有分组评论信息的数量,可减少单个设备处理评论信息的数量,从而减少运算的时间,另一方面,评论关键词可以体现出评论信息的重点,以评论关键词的形式在主终端显示评论信息,可以让持有从终端的用户的注意力集中在主终端处、集中在评论关键词处,方便持有主终端的用户进行教学、会议等活动,让用户保持关注重点。
附图说明
图1A为一种评论***的架构示意图;
图1B为一种评论***的应用示例图;
图2为一种课件编辑页面的内容示意图;
图3为本发明实施例一提供的一种评论信息的处理方法的流程图;
图4A至图4D为一种在评论界面输入评论信息的示例图;
图5A与图5B为一种分组界面的示例图;
图6是本发明实施例二提供的一种评论信息的处理方法的流程图;
图7为一种层级架构的示意图;
图8为一种CNN的结构示意图;
图9是本发明实施例三提供的一种评论信息的处理方法的流程图;
图10是本发明实施例四提供的一种评论信息的处理方法的流程图;
图11为本发明实施例五提供的一种评论信息的处理装置的结构示意图;
图12为本发明实施例六提供的一种评论信息的处理装置的结构示意图;
图13为本发明实施例七提供的一种评论信息的处理***的结构示意图;
图14为本发明实施例八提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
图1A为一种评论***的架构示意图。
如图1A所示,该评论***包括主终端101、组终端102、从终端103。
其中,主终端101可以指教师、会议***等在教学、会议等场合主持活动的用户所持有的终端。
该主终端101可以包括智能交互平板、智能电视、可投影的个人电脑,等等,在主终端101中可安装iOS、Android(安卓)、windows、harmony(鸿蒙)等操作***。
组终端102可以指在教学、会议等场合管理分组的终端,可辅助主终端101执行显示课件等操作。
该组终端102可以包括智能交互平板、智能电视、可投影的个人电脑,等等,在组终端102中可安装Android(安卓)、windows、harmony(鸿蒙)等操作***。
其中,从终端103可以指学生、与会人员等在教学、会议等场合参与活动的用户所持有的终端。
该从终端103可以包括移动终端(如手机、平板电脑等)、个人电脑、智能穿戴设备(如智能手表、智能眼镜等),等等,在从终端103中可安装iOS、Android(安卓)、windows、harmony(鸿蒙)等操作***。
以智能交互平板作为主终端101、组终端102的示例,智能交互平板的硬件部分由显示模组、智能处理***(包括控制器)等部分所构成,由整体结构件结合到一起,同时也由专用的软件***作为支撑,其中显示模组包括显示屏和背光灯组件,其中显示屏包括透明电导层和液晶层等。
显示屏,在本说明书中的实施例中,是指触摸屏、触控屏、触控面板,是一种感应式液晶显示装置,当接触了屏幕上的图形按钮时,屏幕上的触觉反馈***可根据预先编程的程式驱动各种连接装置,可用以取代机械式的按钮面板,并借由液晶显示画面制造出生动的影音效果。从技术原理来区别触摸屏,可以分为五个基本种类;矢量压力传感技术触摸屏、电阻技术触摸屏、电容技术触摸屏、红外线技术触摸屏、表面声波技术触摸屏。按照触摸屏的工作原理和传输信息的介质,可以把触摸屏分为四个种类:电阻式、电容感应式、红外线式以及表面声波式。
当用户用手指或笔触摸屏幕时,将该点坐标定位,从而实现对智能处理***的控制,然后随着智能处理***内置的软件来实现不同的功能应用。
在本申请中所提到的“屏幕”、“大屏”均指智能交互平板的显示屏;智能交互平板显示某个界面是指智能交互平板的显示屏显示该界面。
进一步的,主终端101、组终端102中安装有操作***自带的应用软件,同时,也安装有从第三方设备或者服务器中下载的应用软件,其中,应用软件的具体类型及内容可以根据实际情况设定,通常,该应用软件具有电子白板功能,其可以通过电子白板功能实现:书写、绘图、批注、课件制作以及展示播放等功能。实施例中设定电子白板功能具有课件制作及展示播放功能,其中,课件制作是指在主终端101、组终端102上通过用户在课件编辑页面中进行的元素输入或***操作,具体地,课件编辑页面是指主终端101、组终端102中具备编辑画布、可输入元素栏、编辑设置选项以及展示播放按钮的编辑页面,可输入元素栏中包含了用户输入一定操作后可以显示的要素。例如,图2为课件编辑页面的内容示意图,参考图2,编辑画布20具体用于当前用户进行元素的输入编辑,可输入元素栏21中给出了当前用户可在课件编辑页面中输入的元素,其包括:文本、图形形状、多媒体、表格、课堂活动、思维导图、拼音、汉字以及学科工具。其中,学科工具可以是函数编辑器以及公式等。可以理解的是,可输入元素栏21的具体内容可以根据实际情况设定和更改,实施例对此不作限定。
同时,编辑设置选项中包含了用户编辑过程中对所编辑元素进行设置的选项按钮,同样参考图2,编辑设置选项22中给出了当前用户可在课件编辑页面中设置调控的按钮,其包括:正向撤销、反向撤销、剪切、属性以及动画等设置按钮,其中,属性可以用于对所编辑元素的显示状态进行个性化设置,如对思维导图的属性设置,对文本的属性设置以及对当前编辑页面排版的属性设置等,动画可以用于对所编辑元素的播放动画轨迹进行个性化设置,如,对可编辑元素在演示播放场景下的出现动画轨迹、消失动画轨迹以及展示动作的动作轨迹进行设置。
此外,展示播放具体可指将课件编辑页面中内容在授课模式下作为演示播放页面进行的课件演示,展示播放具体可通过演示播放按钮触发,图2中还给出了演示播放按钮23的一种,即开始授课按钮,用户触发开始授课按钮后就可以在演示模式下对编辑画布20中的内容进行演示播放。
主终端101可以通过有线或无线(如Wi-Fi)的方式与一个或多个组终端102建立长连接,组终端102可以通过有线或无线(如Wi-Fi)的方式与一个或多个从终端103建立长连接。
其中,长连接指在一个连接上可以连续发送多个数据包,在连接保持期间,如果没有数据包发送,需要双方发链路检测包,包括HTTP(Hyper Text Transport Protocol,超文本传输协议)连接等等。
在教学、会议等场合,主终端101的用户可以按照实际需求,将其他用户划分为至少两个分组,以方便分组讨论、分组竞赛等,此时,其他用户可将其从终端103连接至其所属分组的组终端102中,当从终端103连接至组终端102时,即该从终端103加入该组终端102的分组中。
例如,如图1B所示,在教室中,1个教师面向16个学生进行教学,教师持有主终端101、每个学生持有从终端103。
主终端101设置在黑板处,方便教师进行教学,4个组终端102分别设置在教室的两侧墙壁,每侧墙壁分别设置2个组终端102,学生持有的从终端103可放置在课桌上。
在教师进行分组讨论时,将位于左上角的4个学生划分至同一个分组中,该4个学生将其从终端103连接至左侧墙壁靠后的组终端102,将位于右上角的4个学生划分至同一个分组中,该4个学生将其从终端103连接至右侧墙壁靠后的组终端102,将位于左下角的4个学生划分至同一个分组中,该4个学生将其从终端103连接至左侧墙壁靠前的组终端102,将位于右下角的4个学生划分至同一个分组中,该4个学生将其从终端103连接至右侧墙壁靠前的组终端102。
实施例一
图3为本发明实施例一提供的一种评论信息的处理方法的流程图,本实施例可适用于分组内的从终端发表评论信息、组终端收集该分组的评论信息并过滤敏感信息,主终端汇总各个分组的评论信息显示评论关键词的情况,该方法可以由评论信息的处理装置来执行,该评论信息的处理装置可以由软件和/或硬件实现,可配置在组终端中,该方法具体包括如下步骤:
S301、接收主终端的评论操作。
在本实施例中,持有主终端的用户可以根据教学、会议等场合的情况,进行分组讨论、分组竞赛等活动,此时,可触发评论操作,主终端将该评论操作发送至每一个相连的组终端。
进一步而言,主终端可以在评论操作中确定评论的主题、评论的时间等参数,其中,每个分组中评论的主题可以相同,也可以相互独立,本实施例对此不加以限制。
当然,评论的主题也可以由持有主终端的用户口头发布,该评论操作仅用于收集评论信息,并不发布评论的主题,本实施例对此不加以限制。
需要说明的是,持有主终端的用户可以通过触控的方式,利用手指或者触控笔点击控件,以使主终端触发评论操作。或者是,持有主终端的用户还可以通过与主终端触连接的外置设备,利用键控的方式点击控件,以使主终端触发评论操作。其中,外置设备包括但不限定于鼠标等。本实施优选以通过触控的方式为例进行说明。可以理解的是,本实施例中出现的所有操作均可以采用触控或者键控的方式执行,且均以触控的方式为例进行描述。
在本示例中,点击控件的操作发送是指当一个触摸操作(MotionEvent)产生之后,***需要把它传递给一个具体的视图(view)的过程,在本请实施例中,则是将该触摸操作传递给控件所在的界面(如侧边栏)。
在Android***中,点击控件的操作发送可以理解为:用户接触显示屏产生触摸操作(MotionEvent),该操作由Activity接收,Activity接收后将该操作进行传递,传递过程为Activity→Window→DecorView(DecorView是当前界面的底层容器,是一个ViewGroup)→执行ViewGroup的dispatchTouchEventO,其中,dispatchTouchEvent0用来进行操作的发送。
需要说明的是,该评论操作可以是主终端内一个独立的功能,可以与主终端当前正在显示的课件关联,也可以与主终端当前正在显示的课件不关联,本实施例对此不加以限制。
例如,在主终端的侧边栏提供一控件,主终端在显示课件时,用户在主终端的侧边栏中点击该控件,此时,主终端触发评论操作,该评论操作可以指示其他用户对与该课件相关联的主题发表评论信息,也可以指示其他用户对其他主题发表评论信息。
S302、根据所述评论操作,通知从终端显示评论界面。
组终端在接收到评论操作时,向从终端发送操作指令,其中,从终端与组终端处于同一个分组中。
从终端响应于该操作指令,在其屏幕显示评论界面,如图4A所示,该评论界面至少包括输入框402,如Android***中的EditText,持有从终端用户可在该输入框输入评论信息。
当然,除输入框402外,该评论界面还可以包括其他元素,如主题框401,用于显示主题,取消控件403,用于取消此次发表评论信息,确定控件404,用于发送输入框402中的评论信息至组终端,等等,本实施例对此不加以限制。
在Android***中,该评论界面可以为视图(view),创建视图(view)可以包括如下两种方式:
其一,调用Activity的onCreate方法,并执行setContentView,从而创建View对象。
其二,获取一个WindowManager,并调用其addView方法,将视图交给WindowManagerService进行管理。
S303、接收所述从终端在所述评论界面中输入的评论信息。
持有从终端的用户在从终端显示的评论界面输入评论信息,并确认发表,此时,从终端可以将该评论信息发送至组终端,组终端可以汇总其所管理的分组中、所有从终端发表的评论信息。
S304、在所述评论信息中检测敏感信息。
部分持有从终端的用户发表的评论信息,并未包含敏感信息,适合显示给全体用户浏览,部分持有从终端的用户发表的评论信息,可能包含敏感信息,如涉及色情、涉及暴力、涉及政治,等等,不适合显示给全体用户浏览。
例如,如图4B和图4C所示,持有主终端的用户发布了主题为“针对篮球世界杯发表自己的感想”的评论操作,部分持有从终端的用户,可能发表了自己观看比赛之后的兴奋感想,部分持有从终端的用户,可能发表了自己对于表现较差的球员的辱骂。
在本实施例中,组终端可以通过自然语言处理,对其分组内从终端的评论信息检测敏感信息。
S305、若所述评论信息包含敏感信息,则滤除所述评论信息。
如果组终端检测评论信息包含敏感信息,此时,可滤除该评论信息,即该评论信息提交失败,并不发送至主终端。
此外,组终端可以发送提交失败信息给从终端,从终端显示该提交失败信息,提示用户该评论信息提交失败。
进一步地,该提交失败信息中对评论信息包含的敏感关键词进行加粗、高亮等提示,方便用户对该评论信息进行修改,重新提交。
例如,如图4D所示,在提交失败信息中,对于敏感关键词“垃圾”进行提示,若持有从终端的用户点击取消控件,则取消发布此次评论信息,若持有从终端的用户点击重新评论控件,则显示如图4C所示的评论界面,持有从终端的用户可在该评论界面重新修改评论信息。
S306、若所述评论信息未包含敏感信息,则将所述评论信息发送至主终端。
如果组终端检测评论信息未包含敏感信息,此时,可将评论信息发送至主终端。
如图5A和图5B所示,主终端收集各个分组中、组终端发送的评论信息,针对每个分组,可从每个分组的评论信息中提取关键词,作为评论关键词,将该评论关键词写入分组界面中,以及,显示分组界面,其中,分组界面可以图像数据、窗口、视图,等等,包含评论信息中的评论关键词。
在具体实现中,在分组界面中具有指定的形状,如椭圆、动物、字词等,该形状中具有目标位置,如中心位置等。
主终端可统计该评论关键词在该分组中的频次,根据该频次确定关键词的尺寸,以及,在该形状中的参考位置,从而将该形状写入该参考位置。
其中,评论关键词的尺寸与评论关键词的频率正相关,即评论关键词的频率越高,则评论关键词越大,反之,评论关键词的频率越低,则评论关键词越小。
参考位置与目标位置之间的距离与评论关键词的频率负相关,即评论关键词的频率越高,则评论关键词越靠近目标位置,反之,评论关键词的频率越低,则评论关键词越远离目标位置。
当然,除了尺寸、参考位置之外,主终端还可以针对评论关键词设置其他参数,如透明度、颜色、字体类型,等等,本实施例对此不加以限制。
此外,在分组界面中可写入其所属分组的名称,如“第一小组”、“第二小组”、“第三小组”、“第四小组”。
主终端可以显示单个分组的分组界面,也可以显示全部分组的分组界面,本实施例对此不加以限制。
在本实施例中,组终端接收主终端的评论操作,通知同一分组中的从终端显示评论界面,接收从终端在评论界面中输入的评论信息,在评论信息中检测敏感信息,若评论信息包含敏感信息,则滤除评论信息,若评论信息未包含敏感信息,则将评论信息发送至主终端,主终端用于针对分组,显示分组界面,分组界面包含评论信息中的评论关键词,一方面,在评论信息中检测敏感信息可过滤含有敏感信息的评论信息,避免在主终端显示含有敏感信息的评论信息,并且,在评论信息中检测敏感信息属于自然语言处理,处理较为复杂,组终端针对其分组内评论信息的检测敏感信息,相对于主终端针对所有分组内评论信息的检测敏感信息,单个分组内评论信息的数量少于所有分组评论信息的数量,可减少单个设备处理评论信息的数量,从而减少运算的时间,另一方面,评论关键词可以体现出评论信息的重点,以评论关键词的形式在主终端显示评论信息,可以让持有从终端的用户的注意力集中在主终端处、集中在评论关键词处,方便持有主终端的用户进行教学、会议等活动,让用户保持关注重点。
实施例二
图6为本发明实施例二提供的一种评论信息的处理方法的流程图,本实施例以前述实施例为基础,进一步细化检测敏感信息的处理操作,该方法具体包括如下步骤:
S601、接收主终端的评论操作。
S602、根据所述评论操作,通知从终端显示评论界面。
其中,从终端与组终端处于同一个分组中。
S603、接收所述从终端在所述评论界面中输入的评论信息。
S604、将所述评论信息与预设的敏感关键词进行比较。
如图7所示,在本实施例中,使用分层架构对评论信息检测敏感信息。
在分层架构的第一层中,使用敏感关键词对评论信息进行检测,由于敏感关键词的比较较为简单,可以快速减少评论信息的数量,在第二层中,使用语义分析对评论信息进行检测,可以精确检测出敏感信息,按照运算复杂度的大小,先易后难,即先考察相对简单的敏感关键词,后考察较复杂的语义分析,从而在保证检测的精确度的情况下,降低了整体的运算量,减少运算的耗时。
在具体实现中,在服务器可以预先生成词典,通过词库导出、网页爬虫、用户举报等方式采集敏感关键词,并将敏感关键词更新至该词典中。
这些词典可分发各个组终端,服务器可以每间隔一定的时间,将新的敏感关键词推送至组终端,组终端将新的敏感关键词更新至词典中。
组终端在接收到其分组内从终端的评论信息之后,可依次将词典中的敏感词与评论信息进行比较。
S605、若所述评论信息未包含所述敏感关键词,则确定所述评论信息未包含敏感信息。
如果评论信息未包含任一敏感关键词,则可以确定该评论信息未包含敏感信息,属于内容正常的评论信息。
S606、若所述评论信息包含至少一个所述敏感关键词,则对所述评论信息进行语义分析,以确定所述评论信息归属的语义类别。
如果评论信息包含至少一个敏感关键词,则可以确定该评论信息是有风险的评论信息,可能包含敏感信息,属于内容委托的评论信息,也可能包含敏感信息,属于内容正常的评论信息。
例如,将“垃圾”设置为敏感关键词,如图4D所示的评论信息“张三真垃圾,连个球都发不好!!!”,“垃圾”具有辱骂人的含义,此时,该评论信息含有敏感信息,此外,在诸如“将垃圾丢到垃圾桶里”、“垃圾分类处理,保护环境,人人有责”等评论信息中,“垃圾”是指失去使用价值、无法利用的废弃物品,属于物质循环的环节,此时,此时,该评论信息未含有敏感信息。
需要说明的是,为了提高处理速度,减少处理耗时,在检测到评论信息未包含一个敏感关键词时,则可以停止检测评论信息是否包含其他敏感关键词,直接对评论信息进行语义分析。
此时,在分层架构的第二层中,组终端可进一步对评论信息进行语义分析,从而确定评论信息归属的语义类别。
其中,语义可以分为两部分,分析单个词的语义(即词义)以及单个词的含义是怎么联合起来组成句子(或者更大的单位)的含义。
在本实施例中,可预先确定语义类别——敏感类别、正常类别,其中,敏感类别指具有敏感信息的类别,正常类别指不具有敏感信息的类别。
进一步地,该敏感类别可以划分为涉及色情的类别、涉及暴力的类别、涉及政治的类别,等等。
采集标记敏感类别、正常类别的评论信息作为样本,训练语义分析模型并部署在组终端中,因此,组终端可对其组内从终端的评论信息输入语义分析模型中,该语义分析模型对该评论信息进行语义分析,输出其归属的语义类别。
在本发明的一个实施例中,S606可以包括如下步骤:
S6061、确定字向量。
在语义分析模型中,可将评论信息转换为向量,获得字向量,该字向量为矩阵的形式,用于表示评论信息中的字。
在一个示例中,以CNN(Convolutional Neural Network,卷积神经网络)作为语义分析模型的示例,如图8所示,该CNN包括编码层(embedding)、卷积层(con)、池化层(pooling)和全连接层(dense)。
编码层可以包括char-embedding等,可将评论信息切分字,对字进行编码,获得字向量。
S6062、确定关联向量。
在语义分析模型中,可确定字向量之间的相关性,作为关联向量,即关联向量用于表示字向量之间的相关性。
以N-Gram作为相关性的示例,N-Gram假设第n个字出现与前n-1个字相关,而与其他任何字不相关。
一般常用的N-Gram模型是Bi-Gram(又称2-Gram)和Tri-Gram(又称3-Gram),其中,Bi-Gram假设一个子的出现依赖于它前面出现的一个字,Tri-Gram假设一个子的出现仅依赖于它前面出现的两个字。
针对如图8所示的CNN,卷积层是CNN的核心,激活函数帮助网络获得非线性特征。
在一个卷积层中,使用第一卷积核(又称过滤器filter)对字向量进行卷积操作,获得关联向量,其中,第一卷积核的大小为2(即2×2),此时,该关联向量相当于Bi-Gram。
此后,可使用带泄露线性整流函数(Leaky ReLU)对关联向量进行激活处理,即将关联向量转换为0-1之间的值。
在另一个卷积层中,使用第二卷积核(又称过滤器filter)对字向量进行卷积操作,获得关联向量,其中,第二卷积核的大小为3(即3×3),此时,该关联向量相当于Tri-Gram。
此后,可使用带泄露线性整流函数(Leaky ReLU)对关联向量进行激活处理,即将关联向量转换为0-1之间的值。
在本实施例中,在字向量的基础上,使用第一卷积核、第二卷积核对字向量进行卷积操作,增加向量的多样性,可以提高语义之间的关联性,保证语义分析的精确度。
其中,在输入值x为负的时候,带泄露线性整流函数(Leaky ReLU)的梯度为一个常数λ∈(0,1),而不是0。在输入值x为正的时候,带泄露线性整流函数(Leaky ReLU)和普通斜坡函数保持一致。换言之:
因此,使用带泄露线性整流函数(Leaky ReLU)对关联向量进行激活处理,速度较快,减少运算的耗时,可以保证实时性。
当然,除了使用大小为2、3的卷积核外,本实施例还可以使用其他大小的卷积核进行卷积操作,以获得其他的关联向量,如4、5,等等,本实施例对此不加以限制。
此外,除了带泄露线性整流函数(Leaky ReLU)外,本实施例还可以使用其他函数进行激活操作,如sigmoid、tanh,等等,本实施例对此不加以限制。
S6063、将所述字向量与所述关联向量相加,获得目标向量。
对于字向量本身,可以认为是与自身相关,即相当于1-Gram,即字向量与关联向量性质相同,属于多维向量,将相同维的向量相加,则可以生成目标向量。
针对如图8所示的CNN,可以将字向量(1-Gram)与关联向量(2-Gram)、关联向量(3-Gram)中的向量按维相加,生成目标向量。
S6064、从所述目标向量中提取特征,获得特征向量。
在语义分析模型中,可从目标向量中提取特征,作为特征向量,由于目标向量可体现字之间的相关性,即该特征向量可以体现字之间的相关性特征。
针对如图8所示的CNN,池化层的作用体现在降采样:保留显著特征、降低特征维度,增大kernel的感受野。CNN越往后面越能捕捉到物体的语义信息,这种语义信息是建立在较大的感受野基础上。
在一个池化层中,可对目标向量进行最大池化操作(Max Pooling),获得第一子向量。
其中,最大池化操作(Max Pooling)将目标向量被不重叠的分割成若干个同样大小的小块(pooling size),每个小块内只取最大的向量,再舍弃其他节点后,保持原有的平面结构得到输出,作为第一子向量,即第一子向量可体现字之间最显著的相关性特征。
在另一个池化层中,可对目标向量进行平均池化操作(Average Pooling),获得第二子向量。
其中,平均池化操作(Average Pooling)将目标向量被不重叠的分割成若干个同样大小的小块(pooling size),每个小块内只取向量的平均值,保持原有的平面结构得到输出,作为第二子向量,即第二子向量可体现字之间全局的相关性特征。
针对如下表中的向量:
4 | 8 | 9 | 8 |
5 | 7 | 7 | 6 |
1 | 2 | 7 | 8 |
3 | 5 | 5 | 5 |
左上角的四个向量(4、8、5、7)作为一个小块(pooling size),右上角的四个向量(9、8、7、6)作为一个小块(pooling size),左下角的四个向量(1、2、3、5)作为一个小块(pooling size),右下角的四个向量(7、8、5、5)作为一个小块(pooling size)。
对于最大池化操作(Max Pooling),可输出如下向量:
8 | 9 |
5 | 8 |
对于平均池化操作(Average Pooling),可输出如下向量:
6 | 7.5 |
2.75 | 6.25 |
第一子向量与第二子向量性质相同,属于多维向量,将第一子向量与第二子向量中相同维的向量相乘,则获得特征向量。
在本实施例中,可以联合最大池化操作(Max Pooling)、平均池化操作(AveragePooling)提取特征向量,考虑向量的最显著特征与全局特征,增加特征的多样性,保证语义分析的精确度。
当然,除了联合最大池化操作(Max Pooling)、平均池化操作(Average Pooling)之外,还可以采用其他方式提取特征向量,例如,单独进行最大池化操作(Max Pooling),单独进行平均池化操作(Average Pooling),等等,本实施例对此不加以限制。
S6065、基于所述特征向量进行分类,以获得所述评论信息的语义类别。
在语义分析模型中,可针使用特征向量对评论信息进行分类,从而输出评论信息归属的语义类别。
针对如图8所示的CNN,卷积层、池化层和激活等操作是将原始数据映射到隐层特征空间,全连接层(fully connected layers,FC)在CNN中起到分类器的作用,即将学到的“分布式特征表示”映射到样本标记空间的作用。
在本实施例中,在全连接层中,将所有特征向量映射至预设的语义类别,作为评论信息的语义类别。
在本实施例中,确定字向量,字向量用于表示评论信息中的字,确定关联向量,关联向量用于表示字向量之间的相关性,将字向量与关联向量相加,获得目标向量,从目标向量中提取特征,获得特征向量,基于特征向量进行分类,以获得评论信息的语义类别,语义分析模型中的处理较为简单,在保证检测的精确度的情况下,可降低运算的复杂度,减少运算的耗时,保证实时性。
S607、若所述语义类别为敏感类别,则确定所述评论信息包含敏感信息。
如果确定评论信息归属的语义类别为敏感类别,则可进一步确定评论信息包含敏感信息,此后,可执行S609,滤除评论信息。
此外,若语义类别为敏感类别,则可以将词典中的所有敏感关键词与检测信息进行匹配,确定评论信息中包含的所有敏感关键词。
一方面,评论信息的所有敏感关键词记录在日志中,传输至服务器,方便技术人员对语义分析模型的性能进行评估,从而更新语义分析模型,提升语义分析模型的性能。
另一方面,将评论信息的所有敏感关键词发送至从终端,提示持有从终端的用户评论信息包含的所有敏感关键词,方便持有从终端的用户修改评论信息,减少再次提交失败的概率,提高提交评论信息的简便性。
S608、若所述语义类别为正常类别,则确定所述评论信息未包含敏感信息。
如果确定评论信息归属的语义类别为正常类别,则可进一步确定评论信息未包含敏感信息,此后,可执行S610,将评论信息发送至主终端。
S609、若所述评论信息包含敏感信息,则滤除所述评论信息。
S610、若所述评论信息未包含敏感信息,则将所述评论信息发送至主终端。
在具体实现中,主终端用于针对分组,显示分组界面,分组界面包含评论信息中的评论关键词。
实施例三
图9为本发明实施例三提供的一种评论信息的处理方法的流程图,本实施例可适用于分组内的从终端发表评论信息、组终端收集该分组的评论信息并过滤敏感信息,主终端汇总各个分组的评论信息显示评论关键词的情况,该方法可以由评论信息的处理装置来执行,该评论信息的处理装置可以由软件和/或硬件实现,可配置在主终端中,该方法具体包括如下步骤:
S901、向组终端发送评论操作。
在本实施例中,持有主终端的用户可以根据教学、会议等场合的情况,进行分组讨论、分组竞赛等活动,此时,可触发评论操作,主终端将该评论操作发送至每一个相连的组终端。
进一步而言,主终端可以在评论操作中确定评论的主题、评论的时间等参数,其中,每个分组中评论的主题可以相同,也可以相互独立,本实施例对此不加以限制。
当然,评论的主题也可以由持有主终端的用户口头发布,该评论操作仅用于收集评论信息,并不发布评论的主题,本实施例对此不加以限制。
需要说明的是,持有主终端的用户可以通过触控的方式,利用手指或者触控笔点击控件,以使主终端触发评论操作。或者是,持有主终端的用户还可以通过与主终端触连接的外置设备,利用键控的方式点击控件,以使主终端触发评论操作。其中,外置设备包括但不限定于鼠标等。本实施优选以通过触控的方式为例进行说明。可以理解的是,本实施例中出现的所有操作均可以采用触控或者键控的方式执行,且均以触控的方式为例进行描述。
在本示例中,点击控件的操作发送是指当一个触摸操作(MotionEvent)产生之后,***需要把它传递给一个具体的视图(view)的过程,在本请实施例中,则是将该触摸操作传递给控件所在的界面(如侧边栏)。
在Android***中,点击控件的操作发送可以理解为:用户接触显示屏产生触摸操作(MotionEvent),该操作由Activity接收,Activity接收后将该操作进行传递,传递过程为Activity→Window→DecorView(DecorView是当前界面的底层容器,是一个ViewGroup)→执行ViewGroup的dispatchTouchEventO,其中,dispatchTouchEvent0用来进行操作的发送。
需要说明的是,该评论操作可以是主终端内一个独立的功能,可以与主终端当前正在显示的课件关联,也可以与主终端当前正在显示的课件不关联,本实施例对此不加以限制。
例如,在主终端的侧边栏提供一控件,主终端在显示课件时,用户在主终端的侧边栏中点击该控件,此时,主终端触发评论操作,该评论操作可以指示其他用户对与该课件相关联的主题发表评论信息,也可以指示其他用户对其他主题发表评论信息。
S902、接收所述组终端响应所述评论操作发送的评论信息。
其中,评论信息来源于与组终端处于同一个分组中的从终端,评论信息未包含敏感信息。
在具体实现中,每个分组的组终端根据评论操作,通知从终端显示评论界面,其中,从终端与组终端处于同一个分组中。
组终端接收从终端在评论界面中输入的评论信息,在评论信息中检测敏感信息。
若评论信息包含敏感信息,则组终端滤除评论信息;
若评论信息未包含敏感信息,则组终端将评论信息发送至主终端。
在一些实施方式中,在评论信息中检测敏感信息,包括:
将评论信息与预设的敏感关键词进行比较;
若评论信息未包含所述敏感关键词,则确定评论信息未包含敏感信息;
若评论信息包含至少一个敏感关键词,则对评论信息进行语义分析,以确定评论信息归属的语义类别;
若语义类别为敏感类别,则确定评论信息包含敏感信息;
若语义类别为正常类别,则确定评论信息未包含敏感信息。
在一些实施方式中,对所述评论信息进行语义分析,以确定评论信息归属的语义类别,包括:
确定字向量,字向量用于表示评论信息中的字;
确定关联向量,关联向量用于表示字向量之间的相关性;
将字向量与关联向量相加,获得目标向量;
从目标向量中提取特征,获得特征向量;
基于特征向量进行分类,以获得评论信息的语义类别。
在一些实施方式中,确定字向量,包括:
将评论信息切分字;
对字进行编码,获得字向量。
在一些实施方式中,确定关联向量,包括:
使用第一卷积核对字向量进行卷积操作,获得关联向量,其中,第一卷积核的大小为2;
使用第二卷积核对字向量进行卷积操作,获得关联向量,其中,第二卷积核的大小为3。
在一些实施方式中,确定关联向量,还包括:
使用带泄露线性整流函数对关联向量进行激活处理。
在一些实施方式中,从目标向量中提取特征,获得特征向量,包括:
对目标向量进行最大池化操作,获得第一子向量;
对目标向量进行平均池化操作,获得第二子向量;
将第一子向量与所述第二子向量相乘,获得特征向量。
在一些实施方式中,基于特征向量进行分类,以获得评论信息的语义类别,包括:
将所有特征向量映射至预设的语义类别,作为评论信息的语义类别。
在一些实施方式中,在评论信息中检测敏感信息,还包括:
若语义类别为敏感类别,则确定评论信息中包含的所有敏感关键词。
在本实施例中,由于组终端的操作与实施例一、二的应用基本相似,所以描述的比较简单,相关之处参见实施例一、二的部分说明即可,本实施例在此不加以详述。
S903、针对所述分组,从所述评论信息中提取关键词,作为评论关键词。
在本实施例中,主终端可以使用TextRank、TF-IDF、LDA、TPR等算法,从每个分组中的评论信息中提取关键词,将该关键词设置为评论关键词。
以TF-IDF为例,TF-IDF是一种基于统计的关键词抽取算法,词语的关键程度跟词语在文档中出现的次数有关。
TF(Term Frequency,词频)是词在文档中出现的次数越多,越能代表该文档。由于同一个词语在长文件里可能会比短文件有更高的词频,所以需要对词频进行归一化处理。
而有些通用词在每个文档中都出现很多次,但不能表示任一文档的含义,所以引入IDF(Inverse Document Frequency,逆文档频率)。
其中,分母加1是考虑到包含词条的文档数为0的情况,对公式进行拉普拉斯平滑处理。
IDF对于某一文档中的词,如果在该文档中出现次数很多,而在其他文档中出现次数很少或不出现,则该词的区分能力越高。
某文档内的高频词,以及该词在文档集中的低文档频率,得到的TF-IDF值更高。因此,TF-IDF可以过滤掉通用词,只保留重要的词语。
S904、针对所述分组,将所述评论关键词写入分组界面中。
在具体实现中,分组界面可以图像数据、窗口、视图,等等,在分组界面中具有指定的形状,如椭圆、动物、字词等,该形状中具有目标位置,如中心位置等。
主终端可统计该评论关键词在该分组中的频次,根据该频次确定关键词的尺寸,以及,在该形状中的参考位置,从而将该形状写入该参考位置。
其中,评论关键词的尺寸与评论关键词的频率正相关,即评论关键词的频率越高,则评论关键词越大,反之,评论关键词的频率越低,则评论关键词越小。
参考位置与目标位置之间的距离与评论关键词的频率负相关,即评论关键词的频率越高,则评论关键词越靠近目标位置,反之,评论关键词的频率越低,则评论关键词越远离目标位置。
在本实施例中,评论关键词的频率在一定程度表现其重要性,基于频率确定其尺寸、与目标位置之间的距离,在分组界面中可以提高较为重要的评论关键词的集中程度,从而提高用户对该较为重要的评论关键词的注意。
当然,除了尺寸、参考位置之外,主终端还可以针对评论关键词设置其他参数,如透明度、颜色、字体类型,等等,本实施例对此不加以限制。
此外,在分组界面中可写入其所属分组的名称,如“第一小组”、“第二小组”、“第三小组”、“第四小组”。
S905、显示所述分组界面。
在具体实现中,主终端可以显示单个分组的分组界面,也可以显示全部分组的分组界面,本实施例对此不加以限制。
在本实施例中,主终端向组终端发送评论操作,接收组终端响应评论操作发送的评论信息,评论信息来源于与组终端处于同一个分组中的从终端,评论信息未包含敏感信息,针对分组,从评论信息中提取关键词,作为评论关键词,以及,将评论关键词写入分组界面中,显示该分组界面,一方面,在评论信息中检测敏感信息可过滤含有敏感信息的评论信息,避免在主终端显示含有敏感信息的评论信息,并且,在评论信息中检测敏感信息属于自然语言处理,处理较为复杂,组终端针对其分组内评论信息的检测敏感信息,相对于主终端针对所有分组内评论信息的检测敏感信息,单个分组内评论信息的数量少于所有分组评论信息的数量,可减少单个设备处理评论信息的数量,从而减少运算的时间,另一方面,评论关键词可以体现出评论信息的重点,以评论关键词的形式在主终端显示评论信息,可以让持有从终端的用户的注意力集中在主终端处、集中在评论关键词处,方便持有主终端的用户进行教学、会议等活动,让用户保持关注重点。
实施例四
图10为本发明实施例四提供的一种评论信息的处理方法的流程图,本实施例可适用于分组内的从终端发表评论信息、组终端收集该分组的评论信息并过滤敏感信息,主终端汇总各个分组的评论信息显示评论关键词的情况,该方法可以由评论信息的处理***来执行,该评论信息的处理***可以由软件和/或硬件实现,可配置在主终端、组终端、从终端中,其中,主终端连接一个或多个组终端,一个或多个从终端与组终端处于同一个分组中,该方法具体包括如下步骤:
S1001、所述主终端向所述组终端发送评论操作。
在本实施例中,持有主终端的用户可以根据教学、会议等场合的情况,进行分组讨论、分组竞赛等活动,此时,可触发评论操作,主终端将该评论操作发送至每一个相连的组终端。
进一步而言,主终端可以在评论操作中确定评论的主题、评论的时间等参数,其中,每个分组中评论的主题可以相同,也可以相互独立,本实施例对此不加以限制。
当然,评论的主题也可以由持有主终端的用户口头发布,该评论操作仅用于收集评论信息,并不发布评论的主题,本实施例对此不加以限制。
需要说明的是,持有主终端的用户可以通过触控的方式,利用手指或者触控笔点击控件,以使主终端触发评论操作。或者是,持有主终端的用户还可以通过与主终端触连接的外置设备,利用键控的方式点击控件,以使主终端触发评论操作。其中,外置设备包括但不限定于鼠标等。本实施优选以通过触控的方式为例进行说明。可以理解的是,本实施例中出现的所有操作均可以采用触控或者键控的方式执行,且均以触控的方式为例进行描述。
在本示例中,点击控件的操作发送是指当一个触摸操作(MotionEvent)产生之后,***需要把它传递给一个具体的视图(view)的过程,在本请实施例中,则是将该触摸操作传递给控件所在的界面(如侧边栏)。
在Android***中,点击控件的操作发送可以理解为:用户接触显示屏产生触摸操作(MotionEvent),该操作由Activity接收,Activity接收后将该操作进行传递,传递过程为Activity→Window→DecorView(DecorView是当前界面的底层容器,是一个ViewGroup)→执行ViewGroup的dispatchTouchEventO,其中,dispatchTouchEvent0用来进行操作的发送。
需要说明的是,该评论操作可以是主终端内一个独立的功能,可以与主终端当前正在显示的课件关联,也可以与主终端当前正在显示的课件不关联,本实施例对此不加以限制。
例如,在主终端的侧边栏提供一控件,主终端在显示课件时,用户在主终端的侧边栏中点击该控件,此时,主终端触发评论操作,该评论操作可以指示其他用户对与该课件相关联的主题发表评论信息,也可以指示其他用户对其他主题发表评论信息。
S1002、所述组终端根据所述评论操作,通知所述从终端显示评论界面。
每个组终端在接收到评论操作时,向其所处分组中的从终端发送操作指令,该操作指令用于通知该从终端显示评论界面。
S1003、所述从终端接收在所述评论界面中输入的评论信息,以及,将所述评论信息发送至所述组终端。
在本实施例中,从终端响应于该操作指令,在其屏幕显示评论界面,如图4A所示,该评论界面至少包括输入框402,如Android***中的EditText,持有从终端用户可在该输入框输入评论信息。
当然,除输入框402外,该评论界面还可以包括其他元素,如主题框401,用于显示主题,取消控件403,用于取消此次发表评论信息,确定控件404,用于发送输入框402中的评论信息至组终端,等等,本实施例对此不加以限制。
在Android***中,该评论界面可以为视图(view),创建视图(view)可以包括如下两种方式:
其一,调用Activity的onCreate方法,并执行setContentView,从而创建View对象。
其二,获取一个WindowManager,并调用其addView方法,将视图交给WindowManagerService进行管理。
持有从终端的用户在从终端显示的评论界面输入评论信息,并确认发表,此时,从终端可以将该评论信息发送至组终端,组终端可以汇总其所管理的分组中、所有从终端发表的评论信息。
S1004、所述组终端在所述评论信息中检测敏感信息,若所述评论信息包含敏感信息,则滤除所述评论信息,若所述评论信息未包含敏感信息,则将所述评论信息发送至主终端。
部分持有从终端的用户发表的评论信息,并未包含敏感信息,适合显示给全体用户浏览,部分持有从终端的用户发表的评论信息,可能包含敏感信息,如涉及色情、涉及暴力、涉及政治,等等,不适合显示给全体用户浏览。
例如,如图4B和图4C所示,持有主终端的用户发布了主题为“针对篮球世界杯发表自己的感想”的评论操作,部分持有从终端的用户,可能发表了自己观看比赛之后的兴奋感想,部分持有从终端的用户,可能发表了自己对于表现较差的球员的辱骂。
在本实施例中,组终端可以通过自然语言处理,对其分组内从终端的评论信息检测敏感信息。
如果组终端检测评论信息包含敏感信息,此时,可滤除该评论信息,即该评论信息提交失败,并不发送至主终端。
此外,组终端可以发送提交失败信息给从终端,从终端显示该提交失败信息,提示用户该评论信息提交失败。
进一步地,该提交失败信息中对评论信息包含的敏感关键词进行加粗、高亮等提示,方便用户对该评论信息进行修改,重新提交。
例如,如图4D所示,在提交失败信息中,对于敏感关键词“垃圾”进行提示,若持有从终端的用户点击取消控件,则取消发布此次评论信息,若持有从终端的用户点击重新评论控件,则显示如图4C所示的评论界面,持有从终端的用户可在该评论界面重新修改评论信息。
如果组终端检测评论信息未包含敏感信息,此时,可将评论信息发送至主终端。
在本发明的一个实施例中,S1004包括如下步骤:
S10041、将所述评论信息与预设的敏感关键词进行比较。
如图7所示,在本实施例中,使用分层架构对评论信息检测敏感信息。
在分层架构的第一层中,使用敏感关键词对评论信息进行检测,由于敏感关键词的比较较为简单,可以快速减少评论信息的数量,在第二层中,使用语义分析对评论信息进行检测,可以精确检测出敏感信息,按照运算复杂度的大小,先易后难,即先考察相对简单的敏感关键词,后考察较复杂的语义分析,从而在保证检测的精确度的情况下,降低了整体的运算量,减少运算的耗时。
在具体实现中,在服务器可以预先生成词典,通过词库导出、网页爬虫、用户举报等方式采集敏感关键词,并将敏感关键词更新至该词典中。
这些词典可分发各个组终端,服务器可以每间隔一定的时间,将新的敏感关键词推送至组终端,组终端将新的敏感关键词更新至词典中。
组终端在接收到其分组内从终端的评论信息之后,可依次将词典中的敏感词与评论信息进行比较。
S10042、若所述评论信息未包含所述敏感关键词,则确定所述评论信息未包含敏感信息。
如果评论信息未包含任一敏感关键词,则可以确定该评论信息未包含敏感信息,属于内容正常的评论信息。
S10043、若所述评论信息包含至少一个所述敏感关键词,则对所述评论信息进行语义分析,以确定所述评论信息归属的语义类别。
如果评论信息包含至少一个敏感关键词,则可以确定该评论信息是有风险的评论信息,可能包含敏感信息,属于内容委托的评论信息,也可能包含敏感信息,属于内容正常的评论信息。
例如,将“垃圾”设置为敏感关键词,如图4D所示的评论信息“张三真垃圾,连个球都发不好!!!”,“垃圾”具有辱骂人的含义,此时,该评论信息含有敏感信息,此外,在诸如“将垃圾丢到垃圾桶里”、“垃圾分类处理,保护环境,人人有责”等评论信息中,“垃圾”是指失去使用价值、无法利用的废弃物品,属于物质循环的环节,此时,此时,该评论信息未含有敏感信息。
需要说明的是,为了提高处理速度,减少处理耗时,在检测到评论信息未包含一个敏感关键词时,则可以停止检测评论信息是否包含其他敏感关键词,直接对评论信息进行语义分析。
此时,在分层架构的第二层中,组终端可进一步对评论信息进行语义分析,从而确定评论信息归属的语义类别。
其中,语义可以分为两部分,分析单个词的语义(即词义)以及单个词的含义是怎么联合起来组成句子(或者更大的单位)的含义。
在本实施例中,可预先确定语义类别——敏感类别、正常类别,其中,敏感类别指具有敏感信息的类别,正常类别指不具有敏感信息的类别。
进一步地,该敏感类别可以划分为涉及色情的类别、涉及暴力的类别、涉及政治的类别,等等。
采集标记敏感类别、正常类别的评论信息作为样本,训练语义分析模型并部署在组终端中,因此,组终端可对其组内从终端的评论信息输入语义分析模型中,该语义分析模型对该评论信息进行语义分析,输出其归属的语义类别。
在本发明的一个实施例中,S10043可以包括如下步骤:
S100431、确定字向量。
在语义分析模型中,可将评论信息转换为向量,获得字向量,该字向量为矩阵的形式,用于表示评论信息中的字。
在一个示例中,以CNN(Convolutional Neural Network,卷积神经网络)作为语义分析模型的示例,如图8所示,该CNN包括编码层(embedding)、卷积层(con)、池化层(pooling)和全连接层(dense)。
编码层可以包括char-embedding等,可将评论信息切分字,对字进行编码,获得字向量。
S100432、确定关联向量。
在语义分析模型中,可确定字向量之间的相关性,作为关联向量,即关联向量用于表示字向量之间的相关性。
以N-Gram作为相关性的示例,N-Gram假设第n个字出现与前n-1个字相关,而与其他任何字不相关。
一般常用的N-Gram模型是Bi-Gram(又称2-Gram)和Tri-Gram(又称3-Gram),其中,Bi-Gram假设一个子的出现依赖于它前面出现的一个字,Tri-Gram假设一个子的出现仅依赖于它前面出现的两个字。
针对如图8所示的CNN,卷积层是CNN的核心,激活函数帮助网络获得非线性特征。
在一个卷积层中,使用第一卷积核(又称过滤器filter)对字向量进行卷积操作,获得关联向量,其中,第一卷积核的大小为2(即2×2),此时,该关联向量相当于Bi-Gram。
此后,可使用带泄露线性整流函数(Leaky ReLU)对关联向量进行激活处理,即将关联向量转换为0-1之间的值。
在另一个卷积层中,使用第二卷积核(又称过滤器filter)对字向量进行卷积操作,获得关联向量,其中,第二卷积核的大小为3(即3×3),此时,该关联向量相当于Tri-Gram。
此后,可使用带泄露线性整流函数(Leaky ReLU)对关联向量进行激活处理,即将关联向量转换为0-1之间的值。
在本实施例中,在字向量的基础上,使用第一卷积核、第二卷积核对字向量进行卷积操作,增加向量的多样性,可以提高语义之间的关联性,保证语义分析的精确度。
其中,在输入值x为负的时候,带泄露线性整流函数(Leaky ReLU)的梯度为一个常数λ∈(0,1),而不是0。在输入值x为正的时候,带泄露线性整流函数(Leaky ReLU)和普通斜坡函数保持一致。换言之:
因此,使用带泄露线性整流函数(Leaky ReLU)对关联向量进行激活处理,速度较快,减少运算的耗时,可以保证实时性。
当然,除了使用大小为2、3的卷积核外,本实施例还可以使用其他大小的卷积核进行卷积操作,以获得其他的关联向量,如4、5,等等,本实施例对此不加以限制。
此外,除了带泄露线性整流函数(Leaky ReLU)外,本实施例还可以使用其他函数进行激活操作,如sigmoid、tanh,等等,本实施例对此不加以限制。
S100433、将所述字向量与所述关联向量相加,获得目标向量。
对于字向量本身,可以认为是与自身相关,即相当于1-Gram,即字向量与关联向量性质相同,属于多维向量,将相同维的向量相加,则可以生成目标向量。
针对如图8所示的CNN,可以将字向量(1-Gram)与关联向量(2-Gram)、关联向量(3-Gram)中的向量按维相加,生成目标向量。
S100434、从所述目标向量中提取特征,获得特征向量。
在语义分析模型中,可从目标向量中提取特征,作为特征向量,由于目标向量可体现字之间的相关性,即该特征向量可以体现字之间的相关性特征。
针对如图8所示的CNN,池化层的作用体现在降采样:保留显著特征、降低特征维度,增大kernel的感受野。CNN越往后面越能捕捉到物体的语义信息,这种语义信息是建立在较大的感受野基础上。
在一个池化层中,可对目标向量进行最大池化操作(Max Pooling),获得第一子向量。
其中,最大池化操作(Max Pooling)将目标向量被不重叠的分割成若干个同样大小的小块(pooling size),每个小块内只取最大的向量,再舍弃其他节点后,保持原有的平面结构得到输出,作为第一子向量,即第一子向量可体现字之间最显著的相关性特征。
在另一个池化层中,可对目标向量进行平均池化操作(Average Pooling),获得第二子向量。
其中,平均池化操作(Average Pooling)将目标向量被不重叠的分割成若干个同样大小的小块(pooling size),每个小块内只取向量的平均值,保持原有的平面结构得到输出,作为第二子向量,即第二子向量可体现字之间全局的相关性特征。
针对如下表中的向量:
4 | 8 | 9 | 8 |
5 | 7 | 7 | 6 |
1 | 2 | 7 | 8 |
3 | 5 | 5 | 5 |
左上角的四个向量(4、8、5、7)作为一个小块(pooling size),右上角的四个向量(9、8、7、6)作为一个小块(pooling size),左下角的四个向量(1、2、3、5)作为一个小块(pooling size),右下角的四个向量(7、8、5、5)作为一个小块(pooling size)。
对于最大池化操作(Max Pooling),可输出如下向量:
8 | 9 |
5 | 8 |
对于平均池化操作(Average Pooling),可输出如下向量:
6 | 7.5 |
2.75 | 6.25 |
第一子向量与第二子向量性质相同,属于多维向量,将第一子向量与第二子向量中相同维的向量相乘,则获得特征向量。
在本实施例中,可以联合最大池化操作(Max Pooling)、平均池化操作(AveragePooling)提取特征向量,考虑向量的最显著特征与全局特征,增加特征的多样性,保证语义分析的精确度。
当然,除了联合最大池化操作(Max Pooling)、平均池化操作(Average Pooling)之外,还可以采用其他方式提取特征向量,例如,单独进行最大池化操作(Max Pooling),单独进行平均池化操作(Average Pooling),等等,本实施例对此不加以限制。
S100435、基于所述特征向量进行分类,以获得所述评论信息的语义类别。
在语义分析模型中,可针使用特征向量对评论信息进行分类,从而输出评论信息归属的语义类别。
针对如图8所示的CNN,卷积层、池化层和激活等操作是将原始数据映射到隐层特征空间,全连接层(fully connected layers,FC)在CNN中起到分类器的作用,即将学到的“分布式特征表示”映射到样本标记空间的作用。
在本实施例中,在全连接层中,将所有特征向量映射至预设的语义类别,作为评论信息的语义类别。
在本实施例中,确定字向量,字向量用于表示评论信息中的字,确定关联向量,关联向量用于表示字向量之间的相关性,将字向量与关联向量相加,获得目标向量,从目标向量中提取特征,获得特征向量,基于特征向量进行分类,以获得评论信息的语义类别,语义分析模型中的处理较为简单,在保证检测的精确度的情况下,可降低运算的复杂度,减少运算的耗时,保证实时性。
S10044、若所述语义类别为敏感类别,则确定所述评论信息包含敏感信息。
如果确定评论信息归属的语义类别为敏感类别,则可进一步确定评论信息包含敏感信息,此后,可滤除评论信息。
此外,若语义类别为敏感类别,则可以将词典中的所有敏感关键词与检测信息进行匹配,确定评论信息中包含的所有敏感关键词。
一方面,评论信息的所有敏感关键词记录在日志中,传输至服务器,方便技术人员对语义分析模型的性能进行评估,从而更新语义分析模型,提升语义分析模型的性能。
另一方面,将评论信息的所有敏感关键词发送至从终端,提示持有从终端的用户评论信息包含的所有敏感关键词,方便持有从终端的用户修改评论信息,减少再次提交失败的概率,提高提交评论信息的简便性。
S10045、若所述语义类别为正常类别,则确定所述评论信息未包含敏感信息。
如果确定评论信息归属的语义类别为正常类别,则可进一步确定评论信息未包含敏感信息,此后,可将评论信息发送至主终端。
S1005、所述主终端针对所述分组,从所述评论信息中提取关键词,作为评论关键词,将所述评论关键词写入分组界面中,以及,显示所述分组界面。
在本实施例中,主终端可以使用TextRank、TF-IDF、LDA、TPR等算法,从每个分组中的评论信息中提取关键词,将该关键词设置为评论关键词。
以TF-IDF为例,TF-IDF是一种基于统计的关键词抽取算法,词语的关键程度跟词语在文档中出现的次数有关。
TF(Term Frequency,词频)是词在文档中出现的次数越多,越能代表该文档。由于同一个词语在长文件里可能会比短文件有更高的词频,所以需要对词频进行归一化处理。
而有些通用词在每个文档中都出现很多次,但不能表示任一文档的含义,所以引入IDF(Inverse Document Frequency,逆文档频率)。
其中,分母加1是考虑到包含词条的文档数为0的情况,对公式进行拉普拉斯平滑处理。
IDF对于某一文档中的词,如果在该文档中出现次数很多,而在其他文档中出现次数很少或不出现,则该词的区分能力越高。
某文档内的高频词,以及该词在文档集中的低文档频率,得到的TF-IDF值更高。因此,TF-IDF可以过滤掉通用词,只保留重要的词语。
在本实施例中,分组界面可以图像数据、窗口、视图,等等,在分组界面中具有指定的形状,如椭圆、动物、字词等,该形状中具有目标位置,如中心位置等。
主终端可统计该评论关键词在该分组中的频次,根据该频次确定关键词的尺寸,以及,在该形状中的参考位置,从而将该形状写入该参考位置。
其中,评论关键词的尺寸与评论关键词的频率正相关,即评论关键词的频率越高,则评论关键词越大,反之,评论关键词的频率越低,则评论关键词越小。
参考位置与目标位置之间的距离与评论关键词的频率负相关,即评论关键词的频率越高,则评论关键词越靠近目标位置,反之,评论关键词的频率越低,则评论关键词越远离目标位置。
在本实施例中,评论关键词的频率在一定程度表现其重要性,基于频率确定其尺寸、与目标位置之间的距离,在分组界面中可以提高较为重要的评论关键词的集中程度,从而提高用户对该较为重要的评论关键词的注意。
当然,除了尺寸、参考位置之外,主终端还可以针对评论关键词设置其他参数,如透明度、颜色、字体类型,等等,本实施例对此不加以限制。
此外,在分组界面中可写入其所属分组的名称,如“第一小组”、“第二小组”、“第三小组”、“第四小组”。
在生成分组界面之后,主终端可以显示单个分组的分组界面,也可以显示全部分组的分组界面,本实施例对此不加以限制。
在本实施例中,主终端向组终端发送评论操作,组终端根据评论操作,通知从终端显示评论界面,从终端接收在评论界面中输入的评论信息,以及,将评论信息发送至组终端,组终端在评论信息中检测敏感信息,若评论信息包含敏感信息,则滤除评论信息,若评论信息未包含敏感信息,则将评论信息发送至主终端,主终端针对分组,从评论信息中提取关键词,作为评论关键词,将评论关键词写入分组界面中,以及,显示分组界面,一方面,在评论信息中检测敏感信息可过滤含有敏感信息的评论信息,避免在主终端显示含有敏感信息的评论信息,并且,在评论信息中检测敏感信息属于自然语言处理,处理较为复杂,组终端针对其分组内评论信息的检测敏感信息,相对于主终端针对所有分组内评论信息的检测敏感信息,单个分组内评论信息的数量少于所有分组评论信息的数量,可减少单个设备处理评论信息的数量,从而减少运算的时间,另一方面,评论关键词可以体现出评论信息的重点,以评论关键词的形式在主终端显示评论信息,可以让持有从终端的用户的注意力集中在主终端处、集中在评论关键词处,方便持有主终端的用户进行教学、会议等活动,让用户保持关注重点。
实施例五
图11为本发明实施例五提供的一种评论信息的处理装置的结构示意图,该装置应用在组终端中,具体可以包括如下模块:
评论操作接收模块1101,用于接收主终端的评论操作;
评论通知模块1102,用于根据所述评论操作,通知从终端显示评论界面,所述从终端与所述组终端处于同一个分组中;
评论信息接收模块1103,用于接收所述从终端在所述评论界面中输入的评论信息;
敏感信息检测模块1104,用于在所述评论信息中检测敏感信息;
评论信息滤除模块1105,用于若所述评论信息包含敏感信息,则滤除所述评论信息;
评论信息发送模块1106,用于若所述评论信息未包含敏感信息,则将所述评论信息发送至主终端,所述主终端用于针对所述分组,显示分组界面,所述分组界面包含所述评论信息中的评论关键词。
在本发明的一个实施例中,所述敏感信息检测模块1104包括:
关键词比较子模块,用于将所述评论信息与预设的敏感关键词进行比较;
第一正常信息确定子模块,用于若所述评论信息未包含所述敏感关键词,则确定所述评论信息未包含敏感信息;
语义分析子模块,用于若所述评论信息包含至少一个所述敏感关键词,则对所述评论信息进行语义分析,以确定所述评论信息归属的语义类别;
敏感信息确定子模块,用于若所述语义类别为敏感类别,则确定所述评论信息包含敏感信息;
第二正常信息确定子模块,用于若所述语义类别为正常类别,则确定所述评论信息未包含敏感信息。
在本发明的一个实施例中,所述语义分析子模块包括:
字向量确定单元,用于确定字向量,所述字向量用于表示所述评论信息中的字;
关联向量确定单元,用于确定关联向量,所述关联向量用于表示所述字向量之间的相关性;
向量相加单元,用于将所述字向量与所述关联向量相加,获得目标向量;
特征提取单元,用于从所述目标向量中提取特征,获得特征向量;
特征分类单元,用于基于所述特征向量进行分类,以获得所述评论信息的语义类别。
在本发明的一个实施例中,所述字向量确定单元包括:
信息切分子单元,用于将所述评论信息切分字;
编码子单元,用于对所述字进行编码,获得字向量。
在本发明的一个实施例中,所述关联向量确定单元包括:
第一卷积子单元,用于使用第一卷积核对所述字向量进行卷积操作,获得关联向量,其中,所述第一卷积核的大小为2;
第二卷积子单元,用于使用第二卷积核对所述字向量进行卷积操作,获得关联向量,其中,所述第二卷积核的大小为3。
在本发明的一个实施例中,所述关联向量确定单元还包括:
激活子单元,用于使用带泄露线性整流函数对所述关联向量进行激活处理。
在本发明的一个实施例中,所述特征提取单元包括:
最大池化操作子单元,用于对所述目标向量进行最大池化操作,获得第一子向量;
平均池化操作子单元,用于对所述目标向量进行平均池化操作,获得第二子向量;
向量相乘子单元,用于将所述第一子向量与所述第二子向量相乘,获得特征向量。
在本发明的一个实施例中,所述特征分类单元包括:
全连接子单元,用于将所有所述特征向量映射至预设的语义类别,作为所述评论信息的语义类别。
在本发明的一个实施例中,所述敏感信息检测模块1104还包括:
敏感关键词遍历子模块,用于若所述语义类别为敏感类别,则确定所述评论信息中包含的所有敏感关键词。
本发明实施例所提供的评论信息的处理装置可执行本发明任意实施例所提供的评论信息的处理方法,具备执行方法相应的功能模块和有益效果。
实施例六
图12为本发明实施例六提供的一种评论信息的处理装置的结构示意图,该装置应用在主终端内,具体可以包括如下模块:
评论操作发送模块1201,用于向组终端发送评论操作;
评论信息接收模块1202,用于接收所述组终端响应所述评论操作发送的评论信息,所述评论信息来源于与所述组终端处于同一个分组中的从终端,所述评论信息未包含敏感信息;
关键词提取模块1203,用于针对所述分组,从所述评论信息中提取关键词,作为评论关键词;
关键词写入模块1204,用于针对所述分组,将所述评论关键词写入分组界面中;
分组界面显示模块1205,用于显示所述分组界面。
在具体实现中,所述分组界面具有目标位置,所述评论关键词位于所述分组界面中的参考位置;
所述评论关键词的尺寸与所述评论关键词的频率正相关;
所述参考位置与所述目标位置之间的距离与所述评论关键词的频率负相关。
本发明实施例所提供的评论信息的处理装置可执行本发明任意实施例所提供的评论信息的处理方法,具备执行方法相应的功能模块和有益效果。
实施例七
图13为本发明实施例七提供的一种评论信息的处理***的结构示意图,所述***包括主终端1301、组终端1302与从终端1303,所述从终端1303与所述组终端1302处于同一个分组中;
所述主终端1301,用于向所述组终端发送评论操作;
所述组终端1302,用于根据所述评论操作,通知所述从终端显示评论界面;
所述从终端1303,用于接收在所述评论界面中输入的评论信息,以及,将所述评论信息发送至所述组终端;
所述组终端1302,还用于在所述评论信息中检测敏感信息,若所述评论信息包含敏感信息,则滤除所述评论信息,若所述评论信息未包含敏感信息,则将所述评论信息发送至主终端;
所述主终端1301,还用于针对所述分组,从所述评论信息中提取关键词,作为评论关键词,将所述评论关键词写入分组界面中,以及,显示所述分组界面。
在本发明的一个实施例中,所述组终端1302还用于:
将所述评论信息与预设的敏感关键词进行比较;
若所述评论信息未包含所述敏感关键词,则确定所述评论信息未包含敏感信息;
若所述评论信息包含至少一个所述敏感关键词,则对所述评论信息进行语义分析,以确定所述评论信息归属的语义类别;
若所述语义类别为敏感类别,则确定所述评论信息包含敏感信息;
若所述语义类别为正常类别,则确定所述评论信息未包含敏感信息。
在本发明的一个实施例中,所述组终端1302还用于:
确定字向量,所述字向量用于表示所述评论信息中的字;
确定关联向量,所述关联向量用于表示所述字向量之间的相关性;
将所述字向量与所述关联向量相加,获得目标向量;
从所述目标向量中提取特征,获得特征向量;
基于所述特征向量进行分类,以获得所述评论信息的语义类别。
在本发明的一个实施例中,所述组终端1302还用于:
将所述评论信息切分字;
对所述字进行编码,获得字向量。
在本发明的一个实施例中,所述组终端1302还用于:
使用第一卷积核对所述字向量进行卷积操作,获得关联向量,其中,所述第一卷积核的大小为2;
使用第二卷积核对所述字向量进行卷积操作,获得关联向量,其中,所述第二卷积核的大小为3。
在本发明的一个实施例中,所述组终端1302还用于:
使用带泄露线性整流函数对所述关联向量进行激活处理。
在本发明的一个实施例中,所述组终端1302还用于:
对所述目标向量进行最大池化操作,获得第一子向量;
对所述目标向量进行平均池化操作,获得第二子向量;
将所述第一子向量与所述第二子向量相乘,获得特征向量。
在本发明的一个实施例中,所述组终端1302还用于:
将所有所述特征向量映射至预设的语义类别,作为所述评论信息的语义类别。
在本发明的一个实施例中,所述组终端1302还用于:
若所述语义类别为敏感类别,则确定所述评论信息中包含的所有敏感关键词。
在具体实现中,所述分组界面具有目标位置,所述评论关键词位于所述分组界面中的参考位置;
所述评论关键词的尺寸与所述评论关键词的频率正相关;
所述参考位置与所述目标位置之间的距离与所述评论关键词的频率负相关。
本发明实施例所提供的评论信息的处理***可执行本发明任意实施例所提供的评论信息的处理方法,具备执行方法相应的功能模块和有益效果。
实施例八
图14为本发明实施例八提供的一种计算机设备的结构示意图。如图14所示,该计算机设备包括处理器1400、存储器1401、通信模块1402、输入装置1403和输出装置1404;计算机设备中处理器1400的数量可以是一个或多个,图14中以一个处理器1400为例;计算机设备中的处理器1400、存储器1401、通信模块1402、输入装置1403和输出装置1404可以通过总线或其他方式连接,图14中以通过总线连接为例。
存储器1401作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本实施例中的评论信息的处理方法对应的模块(例如,如图11所示的评论信息的处理装置中的评论操作接收模块1101、评论通知模块1102、评论信息接收模块1103、敏感信息检测模块1104、评论信息滤除模块1105和评论信息发送模块1106,或者,如图12所示的评论信息的处理装置中的评论操作发送模块1201、评论信息接收模块1202、关键词提取模块1203、关键词写入模块1204和分组界面显示模块1205,或者,如图13所示的评论信息的处理***主终端1301、组终端1302与从终端1303)。处理器1400通过运行存储在存储器1401中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的评论信息的处理方法。
存储器1401可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器1401可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器1401可进一步包括相对于处理器1400远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
通信模块1402,用于与显示屏建立连接,并实现与显示屏的数据交互。输入装置1403可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。
本实施例提供的计算机设备,可执行本发明任一实施例提供的评论信息的处理方法,具体相应的功能和有益效果。
实施例九
本发明实施例九还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现一种评论信息的处理方法。
在一些实施例方式,该方法应用在组终端中,包括:
接收主终端的评论操作;
根据所述评论操作,通知从终端显示评论界面,所述从终端与所述组终端处于同一个分组中;
接收所述从终端在所述评论界面中输入的评论信息;
在所述评论信息中检测敏感信息;
若所述评论信息包含敏感信息,则滤除所述评论信息;
若所述评论信息未包含敏感信息,则将所述评论信息发送至主终端,所述主终端用于针对所述分组,显示分组界面,所述分组界面包含所述评论信息中的评论关键词。
在另一些实施例方式,该方法应用在主终端中,包括:
向组终端发送评论操作;
接收所述组终端响应所述评论操作发送的评论信息,所述评论信息来源于与所述组终端处于同一个分组中的从终端,所述评论信息未包含敏感信息;
针对所述分组,从所述评论信息中提取关键词,作为评论关键词;
针对所述分组,将所述评论关键词写入分组界面中;
显示所述分组界面。
在又一些实施例方式,一主终端连接组终端,从终端与所述组终端处于同一个分组中,该方法包括:
所述主终端向所述组终端发送评论操作;
所述组终端根据所述评论操作,通知所述从终端显示评论界面;
所述从终端接收在所述评论界面中输入的评论信息,以及,将所述评论信息发送至所述组终端;
所述组终端在所述评论信息中检测敏感信息,若所述评论信息包含敏感信息,则滤除所述评论信息,若所述评论信息未包含敏感信息,则将所述评论信息发送至主终端;
所述主终端针对所述分组,从所述评论信息中提取关键词,作为评论关键词,将所述评论关键词写入分组界面中,以及,显示所述分组界面。
当然,本发明实施例所提供的计算机可读存储介质,其计算机程序不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的评论信息的处理方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述评论信息的处理装置、评论信息的处理***的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (15)
1.一种评论信息的处理方法,其特征在于,应用在组终端中,所述方法包括:
接收主终端的评论操作;
根据所述评论操作,通知从终端显示评论界面,所述从终端与所述组终端处于同一个分组中;
接收所述从终端在所述评论界面中输入的评论信息;
在所述评论信息中检测敏感信息;
若所述评论信息包含敏感信息,则滤除所述评论信息;
若所述评论信息未包含敏感信息,则将所述评论信息发送至主终端,所述主终端用于针对所述分组,显示分组界面,所述分组界面包含所述评论信息中的评论关键词。
2.根据权利要求1所述的方法,其特征在于,所述在所述评论信息中检测敏感信息,包括:
将所述评论信息与预设的敏感关键词进行比较;
若所述评论信息未包含所述敏感关键词,则确定所述评论信息未包含敏感信息;
若所述评论信息包含至少一个所述敏感关键词,则对所述评论信息进行语义分析,以确定所述评论信息归属的语义类别;
若所述语义类别为敏感类别,则确定所述评论信息包含敏感信息;
若所述语义类别为正常类别,则确定所述评论信息未包含敏感信息。
3.根据权利要求2所述的方法,其特征在于,所述对所述评论信息进行语义分析,以确定所述评论信息归属的语义类别,包括:
确定字向量,所述字向量用于表示所述评论信息中的字;
确定关联向量,所述关联向量用于表示所述字向量之间的相关性;
将所述字向量与所述关联向量相加,获得目标向量;
从所述目标向量中提取特征,获得特征向量;
基于所述特征向量进行分类,以获得所述评论信息的语义类别。
4.根据权利要求3所述的方法,其特征在于,所述确定字向量,包括:
将所述评论信息切分字;
对所述字进行编码,获得字向量。
5.根据权利要求3所述的方法,其特征在于,所述确定关联向量,包括:
使用第一卷积核对所述字向量进行卷积操作,获得关联向量,其中,所述第一卷积核的大小为2;
使用第二卷积核对所述字向量进行卷积操作,获得关联向量,其中,所述第二卷积核的大小为3。
6.根据权利要求5所述的方法,其特征在于,所述确定关联向量,还包括:
使用带泄露线性整流函数对所述关联向量进行激活处理。
7.根据权利要求3-6任一所述的方法,其特征在于,所述从所述目标向量中提取特征,获得特征向量,包括:
对所述目标向量进行最大池化操作,获得第一子向量;
对所述目标向量进行平均池化操作,获得第二子向量;
将所述第一子向量与所述第二子向量相乘,获得特征向量。
8.根据权利要求3-6任一所述的方法,其特征在于,所述基于所述特征向量进行分类,以获得所述评论信息的语义类别,包括:
将所有所述特征向量映射至预设的语义类别,作为所述评论信息的语义类别。
9.一种评论信息的处理方法,其特征在于,应用在主终端内,所述方法包括:
向组终端发送评论操作;
接收所述组终端响应所述评论操作发送的评论信息,所述评论信息来源于与所述组终端处于同一个分组中的从终端,所述评论信息未包含敏感信息;
针对所述分组,从所述评论信息中提取关键词,作为评论关键词;
针对所述分组,将所述评论关键词写入分组界面中;
显示所述分组界面。
10.一种评论信息的处理方法,其特征在于,一主终端连接组终端,从终端与所述组终端处于同一个分组中,所述方法包括:
所述主终端向所述组终端发送评论操作;
所述组终端根据所述评论操作,通知所述从终端显示评论界面;
所述从终端接收在所述评论界面中输入的评论信息,以及,将所述评论信息发送至所述组终端;
所述组终端在所述评论信息中检测敏感信息,若所述评论信息包含敏感信息,则滤除所述评论信息,若所述评论信息未包含敏感信息,则将所述评论信息发送至主终端;
所述主终端针对所述分组,从所述评论信息中提取关键词,作为评论关键词,将所述评论关键词写入分组界面中,以及,显示所述分组界面。
11.一种评论信息的处理装置,其特征在于,应用在组终端中,所述装置包括:
评论操作接收模块,用于接收主终端的评论操作;
评论通知模块,用于根据所述评论操作,通知从终端显示评论界面,所述从终端与所述组终端处于同一个分组中;
评论信息接收模块,用于接收所述从终端在所述评论界面中输入的评论信息;
敏感信息检测模块,用于在所述评论信息中检测敏感信息;
评论信息滤除模块,用于若所述评论信息包含敏感信息,则滤除所述评论信息;
评论信息发送模块,用于若所述评论信息未包含敏感信息,则将所述评论信息发送至主终端,所述主终端用于针对所述分组,显示分组界面,所述分组界面包含所述评论信息中的评论关键词。
12.一种评论信息的处理装置,其特征在于,应用在主终端内,所述装置包括:
评论操作发送模块,用于向组终端发送评论操作;
评论信息接收模块,用于接收所述组终端响应所述评论操作发送的评论信息,所述评论信息来源于与所述组终端处于同一个分组中的从终端,所述评论信息未包含敏感信息;
关键词提取模块,用于针对所述分组,从所述评论信息中提取关键词,作为评论关键词;
关键词写入模块,用于针对所述分组,将所述评论关键词写入分组界面中;
分组界面显示模块,用于显示所述分组界面。
13.一种评论信息的处理***,其特征在于,所述***包括主终端、组终端与从终端,所述从终端与所述组终端处于同一个分组中;
所述主终端,用于向所述组终端发送评论操作;
所述组终端,用于根据所述评论操作,通知所述从终端显示评论界面;
所述从终端,用于接收在所述评论界面中输入的评论信息,以及,将所述评论信息发送至所述组终端;
所述组终端,还用于在所述评论信息中检测敏感信息,若所述评论信息包含敏感信息,则滤除所述评论信息,若所述评论信息未包含敏感信息,则将所述评论信息发送至主终端;
所述主终端,还用于针对所述分组,从所述评论信息中提取关键词,作为评论关键词,将所述评论关键词写入分组界面中,以及,显示所述分组界面。
14.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-10中任一所述的评论信息的处理方法。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-10中任一所述的评论信息的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910925712.7A CN110895652A (zh) | 2019-09-27 | 2019-09-27 | 一种评论信息的处理方法、装置、***、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910925712.7A CN110895652A (zh) | 2019-09-27 | 2019-09-27 | 一种评论信息的处理方法、装置、***、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110895652A true CN110895652A (zh) | 2020-03-20 |
Family
ID=69785940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910925712.7A Pending CN110895652A (zh) | 2019-09-27 | 2019-09-27 | 一种评论信息的处理方法、装置、***、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110895652A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112364154A (zh) * | 2020-11-10 | 2021-02-12 | 北京乐学帮网络技术有限公司 | 一种评论内容显示方法及装置 |
CN112672183A (zh) * | 2020-12-30 | 2021-04-16 | 南京伯索网络科技有限公司 | 一种直播课堂中语音分组讨论的监管方法和*** |
CN112925881A (zh) * | 2021-02-01 | 2021-06-08 | 大箴(杭州)科技有限公司 | 敏感性弹幕的检测方法、装置、计算机设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103871287A (zh) * | 2014-03-18 | 2014-06-18 | 天闻数媒科技(北京)有限公司 | 一种教学数据处理*** |
CN106375829A (zh) * | 2016-08-31 | 2017-02-01 | 腾讯科技(深圳)有限公司 | 一种视频评论方法、相关设备及*** |
CN107291780A (zh) * | 2016-04-12 | 2017-10-24 | 腾讯科技(深圳)有限公司 | 一种用户评论信息展示方法和装置 |
CN109121011A (zh) * | 2017-06-22 | 2019-01-01 | 格局商学教育科技(深圳)有限公司 | 一种网络课堂直播互动*** |
CN110209795A (zh) * | 2018-06-11 | 2019-09-06 | 腾讯科技(深圳)有限公司 | 评论识别方法、装置、计算机可读存储介质和计算机设备 |
CN110276065A (zh) * | 2018-03-15 | 2019-09-24 | 北京京东尚科信息技术有限公司 | 一种处理物品评论的方法和装置 |
CN110647614A (zh) * | 2019-08-01 | 2020-01-03 | 平安科技(深圳)有限公司 | 智能问答方法、装置、介质及电子设备 |
-
2019
- 2019-09-27 CN CN201910925712.7A patent/CN110895652A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103871287A (zh) * | 2014-03-18 | 2014-06-18 | 天闻数媒科技(北京)有限公司 | 一种教学数据处理*** |
CN107291780A (zh) * | 2016-04-12 | 2017-10-24 | 腾讯科技(深圳)有限公司 | 一种用户评论信息展示方法和装置 |
CN106375829A (zh) * | 2016-08-31 | 2017-02-01 | 腾讯科技(深圳)有限公司 | 一种视频评论方法、相关设备及*** |
CN109121011A (zh) * | 2017-06-22 | 2019-01-01 | 格局商学教育科技(深圳)有限公司 | 一种网络课堂直播互动*** |
CN110276065A (zh) * | 2018-03-15 | 2019-09-24 | 北京京东尚科信息技术有限公司 | 一种处理物品评论的方法和装置 |
CN110209795A (zh) * | 2018-06-11 | 2019-09-06 | 腾讯科技(深圳)有限公司 | 评论识别方法、装置、计算机可读存储介质和计算机设备 |
CN110647614A (zh) * | 2019-08-01 | 2020-01-03 | 平安科技(深圳)有限公司 | 智能问答方法、装置、介质及电子设备 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112364154A (zh) * | 2020-11-10 | 2021-02-12 | 北京乐学帮网络技术有限公司 | 一种评论内容显示方法及装置 |
CN112672183A (zh) * | 2020-12-30 | 2021-04-16 | 南京伯索网络科技有限公司 | 一种直播课堂中语音分组讨论的监管方法和*** |
CN112672183B (zh) * | 2020-12-30 | 2021-07-13 | 南京伯索网络科技有限公司 | 一种直播课堂中语音分组讨论的监管方法和*** |
CN112925881A (zh) * | 2021-02-01 | 2021-06-08 | 大箴(杭州)科技有限公司 | 敏感性弹幕的检测方法、装置、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110895652A (zh) | 一种评论信息的处理方法、装置、***、设备和存储介质 | |
JP2011523739A (ja) | 協働的な相互作用のためのシステム及び方法 | |
CN103577556A (zh) | 一种获取问答对的相关联程度的装置和方法 | |
JP5099595B2 (ja) | 電子ペン・システム及びそのプログラム | |
CN109815485A (zh) | 一种微博短文本情感极性识别的方法、装置及存储介质 | |
Margetis et al. | Augmenting natural interaction with physical paper in ambient intelligence environments | |
Ng'ethe et al. | SignSupport: A mobile aid for deaf people learning computer literacy skills | |
US20150301726A1 (en) | Systems and Methods for Displaying Free-Form Drawing on a Contact-Sensitive Display | |
Chisega-Negrilă | Education in web 3.0 | |
Barnet | Hypertext before the web—or, what the web could have been | |
Chisega-Negrilă | Web 3.0 in education | |
CN116662960A (zh) | 通过有限身份信息生成自我介绍的***、方法及存储介质 | |
CN107239209A (zh) | 一种拍照搜索方法、装置、终端及存储介质 | |
TWI554983B (zh) | 電子裝置、學習方法及其電腦程式產品 | |
JP5288340B2 (ja) | 表示システムおよびそのプログラム | |
Kulkarni | Dynamic sign language translating system using deep learning and natural language processing | |
Heintz et al. | Comparison of paper-and tool-based participatory design approaches: A case study with PDotcapturer | |
CN113505596A (zh) | 话题切换标记方法、装置及计算机设备 | |
US20220197587A1 (en) | Surface presentations | |
JP2012194991A (ja) | コンピュータ、それを用いた表示システム、およびそのプログラム | |
CN117236347B (zh) | 交互文本翻译的方法、交互文本的显示方法和相关装置 | |
Bonthu et al. | A survey paper on emerging techniques used to translate audio or text to sign language | |
JP5141935B2 (ja) | コンピュータ、それを用いた表示システム、およびそのプログラム | |
Zahid et al. | A Computer Vision‐Based System for Recognition and Classification of Urdu Sign Language Dataset for Differently Abled People Using Artificial Intelligence | |
CN112579023B (zh) | 一种课件的显示方法、***、设备与存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |