CN104317781B - 敏感词编辑器 - Google Patents
敏感词编辑器 Download PDFInfo
- Publication number
- CN104317781B CN104317781B CN201410649236.8A CN201410649236A CN104317781B CN 104317781 B CN104317781 B CN 104317781B CN 201410649236 A CN201410649236 A CN 201410649236A CN 104317781 B CN104317781 B CN 104317781B
- Authority
- CN
- China
- Prior art keywords
- sensitive word
- sensitive
- text
- user
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明涉及软件技术领域,公开了一种敏感词编辑器。本发明中,敏感词编辑器包含:敏感词过滤器与文本编辑器;其中,敏感词过滤器中包含有预设的敏感词包,预设的敏感词包内包含若干个敏感词;敏感词过滤器,用于根据敏感词对文本编辑器中编辑的文本进行敏感词检测;文本编辑器,用于编辑用户输入的文本,并输出根据敏感词检测结果编辑后的文本。与现有技术相比,可以迅速定位敏感词,使用户在网络上发布信息时更加便利和高效。
Description
技术领域
本发明涉及软件技术领域,特别涉及一种敏感词编辑器。
背景技术
在这个网络时代,每个人都可以并经常在互联网上发布自己的信息和表达观点,但是,现在各网站对于用户发布的信息都有敏感词的审核,这样,经常造成用户发送消息失败,并且用户在收到发布失败的消息时很难定位究竟是由哪个敏感词造成,这降低了广大网民发布信息的效率,并给广大网民发布信息带来一定的困扰。
发明内容
本发明的目的在于提供一种敏感词编辑器,可以在用户编辑信息时就迅速定位敏感词,使用户在网络上发布信息时更加便利和高效。
为解决上述技术问题,本发明的实施方式提供了一种敏感词编辑器,包含:敏感词过滤器与文本编辑器;
其中,敏感词过滤器中包含有预设的敏感词包,所述预设的敏感词包内包含若干个敏感词;
所述敏感词过滤器,用于根据所述敏感词对所述文本编辑器中进行编辑的文本进行敏感词检测;
所述文本编辑器,用于编辑用户输入的文本,并输出用户根据敏感词检测结果编辑后的文本。
本发明的实施方式还提供了一种网页插件,内嵌于网页上,包含上述的敏感词编辑器。
本发明实施方式相对于现有技术而言,是利用敏感词过滤器对文本编辑器中用户编辑的文字进行敏感词检测,迅速锁定文本中包含的敏感词,以供用户根据敏感词检测结果对编辑的文本进行修改,避免使用敏感词,这样,能够使用户在网络上发布信息时更加便利和高效。
进一步地,所述敏感词过滤器包含导入模块;所述导入模块,用于导入若干个敏感词包;其中,所述敏感词包上设有标识符,该标识符用于指示该敏感词包所属的领域。用户可以根据自身需求与敏感词包上的标识符选择并导入需要的敏感词包,以减小敏感词编辑器所占的资源。
另外,所述敏感词过滤器包含检测模块与选择模块;所述检测模块,用于检测用户输入的文本内容的领域;所述选择模块,用于根据所述检测模块的检测结果与所述标识符,选择与用户输入的文本内容的领域匹配的敏感词包作为所述预设的敏感词包。这样,可以根据用户输入的文本内容所属领域与敏感词包上的标识符智能地选择敏感词包,而且只采用与用户输入的文本内容属于相同领域的敏感词包作为预设的敏感词包,对用户输入的文本内容进行敏感词检测,针对性强,检索量小,检测效率高。
另外,所述敏感词过滤器包含选择模块;所述选择模块,用于供用户根据输入的文本内容的领域与所述标识符,从若干个所述敏感词包中选择一个或多个敏感词包作为所述预设的敏感词包。用户可以根据输入的文本内容从若干个导入的敏感词包中选择一个或多个与输入的文本内容领域相关的敏感词包作为预设的敏感词包,针对性强,并增加了本发明实施方式的的灵活性。
进一步地,所述敏感词编辑器包含提示模块;所述提示模块,用于将检测到的敏感词通过突显方式进行标记,以提示用户进行修改。采用突显方式对检测出的敏感词进行标记,可以使检测到的敏感词更醒目,进而起到提示作用,避免用户漏改敏感词而影响信息发布。
另外,所述突显方式可以为颜色突显、闪烁突显、颜色闪烁突显、字体突显、颜色字体突显。上述各突显方式均属现有成熟的技术,保证了本发明实施方式的可行性。而且,用户可以根据自身习惯与喜好选择敏感词的突显方式,增加了本发明实施方式的人性化,有利于提升用户体验。
进一步地,所述敏感词过滤器包含显示模块与替换模块;所述显示模块,用于在用户选定检测到的敏感词时,显示与该敏感词对应的非敏感同义替换词,以供用户选择替换;所述替换模块,用于将用户选定的敏感词替换为用户选择的非敏感同义替换词。采用显示模块显示用户选定的敏感词的非敏感同义替换词,一方面,节约了用户寻找非敏感同义替换词的时间,另一方面,避免用户自行提供的替换词还是敏感词,总之,节约了用户的时间,进一步提高了用户在网络上发布信息的效率。
另外,所述显示模块,可以通过下拉菜单或者弹出替换列表显示所述非敏感同义替换词。
另外,所述敏感词包的格式可以为以下任意一种:文本文档TXT、便携文档格式PDF、电子表格EXCEL或者逗号分隔值CSV。
附图说明
图1是根据本发明第一实施方式的敏感词编辑器的结构示意图;
图2是根据本发明第一实施方式中的显示模块调用示意图;
图3是根据本发明第二实施方式的敏感词编辑器的结构示意图;
图4是根据本发明第三实施方式的敏感词编辑器的结构示意图;
图5是根据本发明第四实施方式的敏感词编辑器的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请各权利要求所要求保护的技术方案。
本发明的第一实施方式涉及一种敏感词编辑器,具体如图1所示,包含:敏感词过滤器与文本编辑器。
其中,敏感词过滤器中包含有预设的敏感词包,预设的敏感词包中包含的敏感词与用户输入的文本内容属于相同或相关领域,针对性强,检索量小,检测效率高。
优选地,敏感词包的格式采用文本文档(TXT),所占资源少、启动快、可以被绝大多数文档处理软件支持,可在任何一台机器上运行,适用性强。
敏感词过滤器,用于根据敏感词对文本编辑器中进行编辑的文本进行敏感词检测,并提示用户进行修改替换。敏感词过滤器可以随着用户的输入对文本编辑器中编辑的文本进行敏感词检测,即用户输入编辑的文本的同时进行敏感词检测,直至用户结束输入文本,这样,用户可以及时发现文本中的敏感词,并对其进行修改替换。
其中,敏感词过滤器包含:提示模块、显示模块与替换模块,下面对这3个模块进行详细的介绍:
提示模块,用于将检测到的敏感词通过突显方式进行标记,以提示用户进行修改。比如,通常编辑页面是以黑色字体颜色为主,“亮色系列”(如红色、绿色、蓝色、黄色等)的文字相对于黑色字体颜色较为醒目。所以,在本实施方式中,优选地,将检测到的敏感词进行红色显示,以引起用户的注意,进而起到提示作用,避免用户漏改敏感词而影响信息发布,提高信息发布的效率。
显示模块,用于在用户选定检测到的敏感词时,通过下拉菜单显示与该敏感词对应的非敏感同义替换词,以供用户选择替换。在本实施方式中,当用户将鼠标移动至红色显示的敏感词处时,视为选定了该敏感词,同时,显示模块通过下拉菜单显示与该敏感词对应的非敏感同义替换词,以供用户选择替换。例如,中国文化中,在公共场合,人们将谈论“厕所”的有关话题视为不雅之事,在文化版块发布信息时可能会将“厕所”视为敏感词,若用户发布的信息中出现“厕所”时,提示模块将“厕所”二字进行红色标记,以提醒用户进行替换,当用户的鼠标移动至“厕所”二字处,则视为选定了该敏感词,显示模块便通过下拉菜单显示非敏感同义替换词“洗手间、盥洗室、茅房、东厮”,具体如图2所示,以供用户选择替换。
替换模块,用于将用户选定的敏感词替换为用户选择的非敏感同义替换词。用户从下拉菜单中选择敏感词的非敏感同义替换词,替换模块将用户选定的敏感词替换为用户选择的非敏感同义替换词。例如,当用户从下拉下单中选择了“盥洗室”时,替换模块就将文本中“厕所”二字替换为“盥洗室”。采用显示模块显示用户选定的敏感词的非敏感同义替换词,一方面,节约了用户寻找非敏感同义替换词的时间,特别是不容易想到的替换词,另一方面,避免用户自行提供的替换词还是敏感词,总之,节约了用户的时间,进一步提高了用户在网络上发布信息的效率。
文本编辑器,用于编辑用户输入的文本,并输出用户根据敏感词检测结果编辑后的文本。文本编辑器是现有成熟的技术,在此不作赘述。
另外,在实际应用中,还可以在用户将编辑的文本全部输入后,再对输入文本中的敏感词进行检测,这样,可以集中时间在对文本中的敏感词进行替换,避免输入编辑文本的过程中不停地替换出现的敏感词而打断用户的思路,避免影响用户发布信息的效率。
另外,在实际应用中,检测到的敏感词还可以以其他突显方式进行显示,如闪烁显示、加粗显示、红色加粗显示、蓝色闪烁显示等。而且,用户可以根据自身习惯与喜好选择敏感词的突显方式,增加了本发明实施方式的人性化,有利于提升用户体验。
另外,在实际应用中,预设的敏感词包可以为1个综合的敏感词包,该敏感词包包含经济、政治、文化、军事、体育等领域中涉及的敏感词。只采用1个包含所有敏感词的敏感词包作为预设的敏感词包,对敏感词进行检测,这样,无论用户编辑的文本涉及哪个领域,都可以检测出文本中包含的敏感词,适用性强。
另外,在实际应用中,显示模块还可以通过弹出替换列表的方式显示非敏感同义替换词,保证了本发明实施方式的多样性与灵活性。
另外,敏感词包的格式还可以为以下任意一种:便携文档格式(PDF)、电子表格(EXCEL)或者逗号分隔值(CSV),保证了本发明实施方式的多样性与灵活性。
与现有技术相比,是利用敏感词过滤器对文本编辑器中用户编辑的文字进行敏感词检测,在用户输入文本时就迅速锁定文本中包含的敏感词,以供用户根据敏感词检测结果对编辑的文本进行修改,避免使用敏感词,这样,能够使用户在网络上发布信息时更加便利和高效。
本发明的第二实施方式涉及一种敏感词编辑器,具体如图3所示。第二实施方式在第一实施方式的基础上作了进一步改进,主要改进之处在于:在本发明第二实施方式中,敏感词过滤器包含导入模块,用户可以根据自身需求与敏感词包上的标识符选择并导入需要的敏感词包,以减小敏感词编辑器所占的资源。
具体地说,导入模块,用于导入若干个敏感词包;其中,敏感词包上设有标识符,该标识符用于指示该敏感词包所属的领域。即,用户可以根据自身涉猎的领域与敏感词包上的标识符选择需求的敏感词包,这样,可以减小敏感词编辑器所占的资源,提高敏感词编辑器的速度。
本发明的第三实施方式涉及一种敏感词编辑器,具体如图4所示。第三实施方式在第二实施方式的基础上作了进一步改进,主要改进之处在于:在本发明第三实施方式中,敏感词过滤器包含选择模块,这样,用户可以根据输入的文本内容从若干个导入的敏感词包中选择一个或多个与输入的文本内容领域相关的敏感词包作为预设的敏感词包,针对性强,并增加了本发明实施方式的的灵活性。
具体地说,敏感词过滤器除了包含:提示模块、显示模块与替换模块,还包含选择模块。其中,提示模块、显示模块、替换模块与第一实施方式中的相同,在此不做赘述。
选择模块,用于供用户根据输入的文本内容的领域与敏感词包上的标识符,从若干个敏感词包中选择一个或多个敏感词包作为预设的敏感词包。比如,若用户输入的文本内容的领域属于政治领域,则用户利用选择模块选择标识符为“政治”的敏感词包作为预设的敏感词包,对用户输入的文本进行敏感词检测;用户输入的文本内容的领域涉及政治与经济领域,则用户采用选择模块选择标识符为“政治”与“经济”的敏感词包作为预设的敏感词包,对用户输入的文本进行敏感词检测。这样,用户可以根据输入的文本内容自主地选择敏感词包,对输入的文本进行敏感词检测,针对性强,误选率低。
其中,预设的敏感词包为有效的敏感词包,即对输入的文本进行敏感词检测的敏感词包,也就是,只有当用户将导入的敏感词包预先设置为有效的敏感词包,才能在敏感词检测时,采用有效的敏感词包中的敏感词对输入的文本进行检测。这样,针对性强,检索量小,检测效率高。
本发明的第四实施方式涉及一种敏感词编辑器,具体如图5所示。第四实施方式在第二实施方式的基础上作了进一步改进,主要改进之处在于:在本发明第四实施方式中,敏感词过滤器包含检测模块与选择模块,这样,可以根据用户输入的文本内容所属领域与敏感词包上的标识符智能地选择敏感词包,而且只采用与用户输入的文本内容属于相同领域的敏感词包作为预设的敏感词包,对用户输入的文本内容进行敏感词检测,针对性强,检索量小,检测效率高。
具体地说,敏感词过滤器除了包含:提示模块、显示模块与替换模块,还包含检测模块与选择模块。其中,提示模块、显示模块、替换模块与第一实施方式中的相同,在此不做赘述。
检测模块,用于检测用户输入的文本内容的领域;选择模块,用于根据检测模块的检测结果与标识符,选择与用户输入的文本内容的领域匹配的敏感词包作为预设的敏感词包。比如,检测模块若检测到用户输入的文本内容的领域属于政治领域,则选择模块则选择标识符为“政治”的敏感词包作为预设的敏感词包,对用户输入的文本进行敏感词检测;检测模块若检测到用户输入的文本内容的领域涉及政治与经济领域,则选择模块则选择标识符为“政治”与“经济”的敏感词包作为预设的敏感词包,对用户输入的文本进行敏感词检测。这样,智能化程度高,针对性强,效率高。
本发明第五实施方式涉及一种网页插件,内嵌于网页上,包含上述的敏感词编辑器。本实施方式中的网页插件,是利用敏感词过滤器对文本编辑器中用户编辑的文字进行敏感词检测,迅速锁定文本中包含的敏感词,以供用户根据敏感词检测结果对编辑的文本进行修改,避免使用敏感词,这样,能够使用户在网络上发布信息时更加便利和高效;同时,用户不用自己再安装敏感词编辑器,方便用户发布信息。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。
Claims (8)
1.一种敏感词编辑器,其特征在于,包含:敏感词过滤器与文本编辑器;
所述敏感词过滤器中包含有预设的敏感词包,所述预设的敏感词包内包含若干个敏感词;其中,所述敏感词过滤器包含导入模块;所述导入模块用于导入若干个敏感词包;所述敏感词包上设有标识符,该标识符用于指示该敏感词包所属的领域;
所述敏感词过滤器,用于根据所述敏感词对所述文本编辑器中进行编辑的文本进行敏感词检测;其中,所述敏感词过滤器包含检测模块与选择模块;所述检测模块,用于检测用户输入的文本内容的领域;所述选择模块,用于根据所述检测模块的检测结果与所述标识符,选择与用户输入的文本内容的领域匹配的敏感词包作为所述预设的敏感词包;
所述文本编辑器,用于编辑用户输入的文本,并输出根据敏感词检测结果编辑后的文本。
2.根据权利要求1所述的敏感词编辑器,其特征在于,所述敏感词过滤器包含选择模块;
所述选择模块,用于供用户根据输入的文本内容的领域与所述标识符,从若干个所述敏感词包中选择一个或多个敏感词包作为所述预设的敏感词包。
3.根据权利要求1所述的敏感词编辑器,其特征在于,所述敏感词编辑器包含提示模块;
所述提示模块,用于将检测到的敏感词通过突显方式进行标记,以提示用户进行修改。
4.根据权利要求3所述的敏感词编辑器,其特征在于,所述突显方式包含颜色突显、闪烁突显、颜色闪烁突显、字体突显、颜色字体突显。
5.根据权利要求1所述的敏感词编辑器,其特征在于,所述敏感词过滤器包含显示模块与替换模块;
所述显示模块,用于在用户选定检测到的敏感词时,显示与该敏感词对应的非敏感同义替换词,以供用户选择替换;
所述替换模块,用于将用户选定的敏感词替换为用户选择的非敏感同义替换词。
6.根据权利要求5所述的敏感词编辑器,其特征在于,所述显示模块,通过下拉菜单或者弹出替换列表显示所述非敏感同义替换词。
7.根据权利要求1所述的敏感词编辑器,其特征在于,所述敏感词包的格式为以下任意一种:
文本文档TXT、便携文档格式PDF、电子表格EXCEL或者逗号分隔值CSV。
8.一种网页插件,内嵌于网页上,其特征在于,该网页插件包含权利要求1至7中任一项所述的敏感词编辑器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410649236.8A CN104317781B (zh) | 2014-11-14 | 2014-11-14 | 敏感词编辑器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410649236.8A CN104317781B (zh) | 2014-11-14 | 2014-11-14 | 敏感词编辑器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104317781A CN104317781A (zh) | 2015-01-28 |
CN104317781B true CN104317781B (zh) | 2018-03-02 |
Family
ID=52373014
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410649236.8A Active CN104317781B (zh) | 2014-11-14 | 2014-11-14 | 敏感词编辑器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104317781B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105183761B (zh) * | 2015-07-27 | 2020-04-07 | 网易传媒科技(北京)有限公司 | 敏感词替换方法和装置 |
JP6689421B1 (ja) * | 2019-01-25 | 2020-04-28 | 株式会社インタラクティブソリューションズ | 音声解析システム |
JP6749705B2 (ja) * | 2019-01-25 | 2020-09-02 | 株式会社インタラクティブソリューションズ | プレゼンテーション支援システム |
CN109947943A (zh) * | 2019-03-15 | 2019-06-28 | 四川长虹电器股份有限公司 | 一种检测网络***息健康真实性的方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1929513A (zh) * | 2005-09-06 | 2007-03-14 | 中兴通讯股份有限公司 | 一种短消息过滤方法 |
CN101964000A (zh) * | 2010-11-09 | 2011-02-02 | 焦点科技股份有限公司 | 一种敏感词自动过滤管理*** |
CN102033915A (zh) * | 2010-12-03 | 2011-04-27 | 百度在线网络技术(北京)有限公司 | 一种开放式知识共享平台及其编辑提示方法 |
CN103092975A (zh) * | 2013-01-25 | 2013-05-08 | 武汉大学 | 基于主题共识覆盖率的网络社区垃圾信息检测与过滤方法 |
CN103544265A (zh) * | 2013-10-17 | 2014-01-29 | 常熟市华安电子工程有限公司 | 一种论坛过滤*** |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103514238B (zh) * | 2012-06-30 | 2017-12-19 | 重庆新媒农信科技有限公司 | 基于分类查找的敏感词识别处理方法 |
-
2014
- 2014-11-14 CN CN201410649236.8A patent/CN104317781B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1929513A (zh) * | 2005-09-06 | 2007-03-14 | 中兴通讯股份有限公司 | 一种短消息过滤方法 |
CN101964000A (zh) * | 2010-11-09 | 2011-02-02 | 焦点科技股份有限公司 | 一种敏感词自动过滤管理*** |
CN102033915A (zh) * | 2010-12-03 | 2011-04-27 | 百度在线网络技术(北京)有限公司 | 一种开放式知识共享平台及其编辑提示方法 |
CN103092975A (zh) * | 2013-01-25 | 2013-05-08 | 武汉大学 | 基于主题共识覆盖率的网络社区垃圾信息检测与过滤方法 |
CN103544265A (zh) * | 2013-10-17 | 2014-01-29 | 常熟市华安电子工程有限公司 | 一种论坛过滤*** |
Also Published As
Publication number | Publication date |
---|---|
CN104317781A (zh) | 2015-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104317781B (zh) | 敏感词编辑器 | |
CN103064584B (zh) | 粘贴方法和装置 | |
CN103869931B (zh) | 语音控制用户界面的方法及装置 | |
CN106406867A (zh) | 一种基于android***的读屏方法及装置 | |
CN102866988B (zh) | 一种终端及其实现拖曳复制粘贴文本的方法 | |
CN110268428A (zh) | 基于主题的消息分组和概括 | |
CN103838499A (zh) | 一种触屏终端的解锁方法及触屏终端 | |
CN108197114A (zh) | 表格数据的检测方法、装置、存储介质及电子装置 | |
CN106354519A (zh) | 一种用户画像的标签生成方法和装置 | |
CN103778128B (zh) | 一种列表信息的绘制方法和装置 | |
CN105404514B (zh) | JavaScript渲染方法和装置 | |
CN104484486B (zh) | 一种信息推荐方法及电子设备 | |
CN106330678A (zh) | 一种应用消息提醒方法及*** | |
CN113010255B (zh) | 基于捆绑会话组的交互方法、装置和计算机设备 | |
TW200822683A (en) | Methods and systems of speed dial | |
CN104142780B (zh) | 一种终端设备及其关联窗口的显示方法 | |
CN107301189A (zh) | 一种数据展示方法及装置 | |
CN104407839A (zh) | 一种复杂运算逻辑的解析方法及装置 | |
CN103731544A (zh) | 智能终端界面显示方法、装置及智能终端 | |
CN106406709A (zh) | 图片处理方法、装置及终端设备 | |
CN105956593A (zh) | 图片处理方法和装置 | |
CN103268443B (zh) | 一种基于符号的Android恶意代码检测方法及*** | |
CN103248736B (zh) | 显示会话信息的方法及装置 | |
CN105573596B (zh) | 一种播放列表的播放顺序调整方法及用户终端 | |
CN107330081A (zh) | 一种信息特征提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 200241 room A2110, building, No. 555 Dongchuan Road, Shanghai, China Applicant after: Mobile Intelligent Technology (Shanghai) Limited by Share Ltd Address before: 200241 room A2110, building, No. 555 Dongchuan Road, Shanghai, China Applicant before: Eques Technology Co., Ltd. |
|
CB02 | Change of applicant information | ||
CB03 | Change of inventor or designer information |
Inventor after: Zhou Chen Inventor after: Zhou Jun Inventor after: Zhu Pengcheng Inventor before: Zhou Chen |
|
CB03 | Change of inventor or designer information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |