CN111401075A - 一种智能短信审核的方法 - Google Patents

一种智能短信审核的方法 Download PDF

Info

Publication number
CN111401075A
CN111401075A CN202010268666.0A CN202010268666A CN111401075A CN 111401075 A CN111401075 A CN 111401075A CN 202010268666 A CN202010268666 A CN 202010268666A CN 111401075 A CN111401075 A CN 111401075A
Authority
CN
China
Prior art keywords
short message
model
auditing
result
intelligent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010268666.0A
Other languages
English (en)
Inventor
元方
唐小波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Chuanglan Culture Communication Co ltd
Original Assignee
Shanghai Chuanglan Culture Communication Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Chuanglan Culture Communication Co ltd filed Critical Shanghai Chuanglan Culture Communication Co ltd
Priority to CN202010268666.0A priority Critical patent/CN111401075A/zh
Publication of CN111401075A publication Critical patent/CN111401075A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种智能短信审核的方法,包括如下步骤:步骤1:一个短信文本经过拦截词库的过滤,没有拦截词的时候进入***入口;步骤2:从已审核的短信模板缓冲区中检索新短信;步骤3:步骤2后进入合规的单一模型,该模型语义分析后输出识别结果;步骤4:步骤2后进入营销性质的单一模型,该模型语义分析后输出识别结果;步骤5:步骤2后进入短信业务的单一模型,该模型语义分析后输出识别结果;步骤6:步骤3‑5中的模型的输出结果作为纠错模型的输入,同时结合上述三个维度的信息最终判断本条短信文本是否合规。本发明自动的对短信进行审核,代替人工进行短信审核,提供高准确率的短信审核,多维度的全自动的提取关键信息。

Description

一种智能短信审核的方法
技术领域
本发明涉及短信内容审核技术领域,特别涉及一种智能短信审核的方法。
背景技术
早期的区分文本好与坏,在邮件***中较为常见。最直接高效的方法,是收集大量的敏感词库,如果命中则拦截该电子邮件。更高级的技术有用到机器学习方法,其中贝叶斯分类最为典型。近期也发布了很多自然语言处理的深度学习模型,比如BERT在文本分类中表现尤为突出。
这些方法或者模型,在比较单一维度的文本应用场景非常适用,比如拦截垃圾信息,拦截黄赌毒信息,网评的好与坏等。
作为短信发送平台,有亿万短信在平台发送,有责任确保通过平台发送出去的短信安全(低风险/低投诉)。高危敏感信息较容易判断,除了高危之外还有很大一部分短信文本,内容本身是健康的,却不满足某些业务上的要求。这类短信,审核的时候需要进行驳回。所以,单纯的从一个维度去判断,是无法满足短信审核场景的需求。
发明内容
本发明的目的在于提供一种智能短信审核的方法,自动的对短信进行审核,可以提取出与短信性质相关的信息,可以代替人工进行短信审核,可以提供高准确率的短信审核,可以多维度的全自动的提取关键信息,可以提供高速的短信审核,甚至快于人工,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种智能短信审核的方法,包括如下步骤:
步骤1:一个短信文本经过拦截词库的过滤(这就过略掉了高危敏感词等,确保了AI模型的安全性),没有拦截词的时候进入***入口;
步骤2:从已审核的短信模板缓冲区中检索新短信,如果检索到了,则直接返回该模板对应的审核结果,如果没有检索到,进行下一步;
步骤3:步骤2后进入合规的单一模型,该模型语义分析后输出识别结果;
步骤4:步骤2后进入营销性质的单一模型,该模型语义分析后输出识别结果;
步骤5:步骤2后进入短信业务的单一模型,该模型语义分析后输出识别结果;
步骤6:步骤3-5中的模型的输出结果作为纠错模型的输入,同时结合上述三个维度的信息最终判断本条短信文本是否合规;
步骤7:步骤6输出的审核结果,为最终模型的审核结果;与此同时,保存原始文本和审核结果到模板缓冲区。
进一步地,短信文本经步骤1确保一定程度得安全再进去步骤2和步骤3。
进一步地,步骤3的识别结果为合规或者不合规。
进一步地,步骤4的识别结果为营销短信或通知短信。
进一步地,步骤5的识别结果为业务信息。
进一步地,步骤6的纠错模型,该模型多维度的纠正步骤3的结果,从而最后提升整个智能能短信审核的准确性。
进一步地,步骤7最后的智能审核结果保存到缓冲区,避免了每条短信都进步骤3到6的模型预测计算,从步骤3到步骤6比较依赖计算资源,进一步提高整个审核***的处理速度,从而达到高吞吐的智能审核服务。
与现有技术相比,本发明的有益效果是:
本发明利用深度学习与自然语言处理技术对文件进行审核,该短信审核方法,排除了人在疲脑时的误审,从而降低了短信审核时的风险,审核速度,是人工审核速度的10倍以上,可以代替人工或者很大程度的减少了人工审核的成本,对短信审核的准确性高于人工。
附图说明
图1为本发明智能短信审核的方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1展示了智能短信审核的方法的流程图,其包括如下步骤:
步骤1:一个短信文本经过拦截词库的过滤,没有拦截词的时候进入***入口;短信文本经步骤1确保了一定程度得安全再进去步骤2和步骤3。
步骤2:从已审核的短信模板缓冲区中检索新短信,如果检索到了,则直接返回该模板对应的审核结果,如果没有检索到,进行下一步;
步骤3:步骤2后进入合规的单一模型,该模型语义分析后输出识别结果(合规/不合规)。
步骤4:步骤2后进入营销性质的单一模型,该模型语义分析后输出识别结果(营销短信/通知短信)。
步骤5:步骤2后进入短信业务的单一模型,该模型语义分析后输出识别结果(业务信息)。
步骤6:步骤3-5中的模型的输出结果作为纠错模型的输入,同时结合上述三个维度的信息最终判断本条短信文本是否合规;纠错模型,该模型多维度的去纠正了步骤3的结果,从而最后提升整个智能能短信审核的准确性。
步骤7:步骤6输出的审核结果,为最终模型的审核结果;与此同时,保持原始文本和审核结果到模板缓冲区。最后的智能审核结果保存到缓冲区,避免了每条短信都进步骤3到6的模型预测计算,从步骤3到步骤6比较依赖计算资源;进一步提高了整个审核***的处理速度,从而达到高吞吐的智能审核服务。
短信信息经过查缓冲,通过AI分类器1识别是否合规,AI分类器2识别营销属性,AI分类器3识别短信业务,然后三者进行AI纠正模型(AI分类器1、AI分类器2、AI分类器3输入)(二次识别短信合规),返回审核结果,保存AI审核结果,已经审核的短信及审核结果,再次查缓冲,返回审核结果。
本发明利用深度学习与自然语言处理技术对文件进行审核,该短信审核方法,排除了人在疲脑时的误审,从而降低了短信审核时的风险,审核速度,是人工审核速度的10倍以上,可以代替人工或者很大程度的减少了人工审核的成本,对短信审核的准确性高于人工。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (7)

1.一种智能短信审核的方法,其特征在于,包括如下步骤:
步骤1:一个短信文本经过拦截词库的过滤,没有拦截词的时候进入***入口;
步骤2:从已审核的短信模板缓冲区中检索新短信,如果检索到了,则直接返回该模板对应的审核结果,如果没有检索到,进行下一步;
步骤3:步骤2后进入合规的单一模型,该模型语义分析后输出识别结果;
步骤4:步骤2后进入营销性质的单一模型,该模型语义分析后输出识别结果;
步骤5:步骤2后进入短信业务的单一模型,该模型语义分析后输出识别结果;
步骤6:步骤3-5中的模型的输出结果作为纠错模型的输入,同时结合上述三个维度的信息最终判断本条短信文本是否合规;
步骤7:步骤6输出的审核结果,为最终模型的审核结果;与此同时,保存原始文本和审核结果到模板缓冲区。
2.如权利要求1所述的智能短信审核的方法,其特征在于,短信文本经步骤1确保一定程度得安全再进去步骤2和步骤3。
3.如权利要求1所述的智能短信审核的方法,其特征在于,步骤3的识别结果为合规或者不合规。
4.如权利要求1所述的智能短信审核的方法,其特征在于,步骤4的识别结果为营销短信或通知短信。
5.如权利要求1所述的智能短信审核的方法,其特征在于,步骤5的识别结果为业务信息。
6.如权利要求1所述的智能短信审核的方法,其特征在于,步骤6的纠错模型,该模型多维度的纠正步骤3的结果,从而最后提升整个智能能短信审核的准确性。
7.如权利要求1所述的智能短信审核的方法,其特征在于,步骤7最后的智能审核结果保存到缓冲区,避免了每条短信都进步骤3到6的模型预测计算,从步骤3到步骤6比较依赖计算资源,进一步提高整个审核***的处理速度,从而达到高吞吐的智能审核服务。
CN202010268666.0A 2020-04-07 2020-04-07 一种智能短信审核的方法 Pending CN111401075A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010268666.0A CN111401075A (zh) 2020-04-07 2020-04-07 一种智能短信审核的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010268666.0A CN111401075A (zh) 2020-04-07 2020-04-07 一种智能短信审核的方法

Publications (1)

Publication Number Publication Date
CN111401075A true CN111401075A (zh) 2020-07-10

Family

ID=71431470

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010268666.0A Pending CN111401075A (zh) 2020-04-07 2020-04-07 一种智能短信审核的方法

Country Status (1)

Country Link
CN (1) CN111401075A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114554492A (zh) * 2022-01-29 2022-05-27 重庆华唐云树科技有限公司 一种基于大数据识别短信内容中有害信息的方法
CN116367101A (zh) * 2023-06-01 2023-06-30 北京容大友信科技有限公司 用户权限管理方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102547623A (zh) * 2010-12-08 2012-07-04 中国电信股份有限公司 垃圾短信处理方法和***
CN103347009A (zh) * 2013-06-20 2013-10-09 新浪网技术(中国)有限公司 一种信息过滤方法及装置
CN106161209A (zh) * 2016-07-21 2016-11-23 康佳集团股份有限公司 一种基于深度自学习的垃圾短信过滤方法及***
CN107612893A (zh) * 2017-09-01 2018-01-19 北京百悟科技有限公司 短信的审核***和方法以及构建短信审核模型方法
CN109684639A (zh) * 2018-12-24 2019-04-26 北京奇虎科技有限公司 短信识别方法、装置及电子设备
CN109831751A (zh) * 2019-01-04 2019-05-31 上海创蓝文化传播有限公司 一种基于自然语言处理的短信内容风控***及方法
CN110210484A (zh) * 2019-04-19 2019-09-06 成都三零凯天通信实业有限公司 基于深度学习的视图像不良文本检测识别的***与方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102547623A (zh) * 2010-12-08 2012-07-04 中国电信股份有限公司 垃圾短信处理方法和***
CN103347009A (zh) * 2013-06-20 2013-10-09 新浪网技术(中国)有限公司 一种信息过滤方法及装置
CN106161209A (zh) * 2016-07-21 2016-11-23 康佳集团股份有限公司 一种基于深度自学习的垃圾短信过滤方法及***
CN107612893A (zh) * 2017-09-01 2018-01-19 北京百悟科技有限公司 短信的审核***和方法以及构建短信审核模型方法
CN109684639A (zh) * 2018-12-24 2019-04-26 北京奇虎科技有限公司 短信识别方法、装置及电子设备
CN109831751A (zh) * 2019-01-04 2019-05-31 上海创蓝文化传播有限公司 一种基于自然语言处理的短信内容风控***及方法
CN110210484A (zh) * 2019-04-19 2019-09-06 成都三零凯天通信实业有限公司 基于深度学习的视图像不良文本检测识别的***与方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王爱祥 等: "多Agent智能垃圾邮件过滤***的研究", 《科技创业月刊》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114554492A (zh) * 2022-01-29 2022-05-27 重庆华唐云树科技有限公司 一种基于大数据识别短信内容中有害信息的方法
CN114554492B (zh) * 2022-01-29 2024-02-27 重庆华唐云树科技有限公司 一种基于大数据识别短信内容中有害信息的方法
CN116367101A (zh) * 2023-06-01 2023-06-30 北京容大友信科技有限公司 用户权限管理方法及装置
CN116367101B (zh) * 2023-06-01 2023-08-01 北京容大友信科技有限公司 用户权限管理方法及装置

Similar Documents

Publication Publication Date Title
CN110149266B (zh) 垃圾邮件识别方法及装置
CN109522304B (zh) 异常对象识别方法及装置、存储介质
CN108376151A (zh) 问题分类方法、装置、计算机设备和存储介质
CN110929043B (zh) 业务问题提取方法及装置
CN106376002B (zh) 一种管理方法及装置、垃圾短信监控***
US11238539B1 (en) Intelligent routing control
CN111401075A (zh) 一种智能短信审核的方法
CN111177367B (zh) 案件分类方法、分类模型训练方法及相关产品
CN112686022A (zh) 违规语料的检测方法、装置、计算机设备及存储介质
CN111866004B (zh) 安全评估方法、装置、计算机***和介质
CN110956123B (zh) 一种富媒体内容的审核方法、装置、服务器及存储介质
CN112652295A (zh) 语言模型训练、视频字幕校验方法、装置、设备及介质
CN109558486A (zh) 电力客服客户诉求智能识别方法
CN117688128A (zh) 一种即时通讯敏感消息验证阻隔方法
CN111680120B (zh) 新闻类别检测方法及***
CN115423600B (zh) 数据筛选方法、装置、介质及电子设备
KR102332268B1 (ko) 고객 상담 요약 장치 및 방법
CN114239602A (zh) 会话方法、装置和计算机程序产品
CN114254088A (zh) 自动应答模型的构建方法和自动应答方法
CN113746814A (zh) 邮件处理方法、装置、电子设备及存储介质
CN112966296A (zh) 基于规则配置和机器学习的敏感信息过滤方法和***
CN113645222A (zh) 报文流量检测方法、***、装置及计算机可读存储介质
US20170154035A1 (en) Text processing system, text processing method, and text processing program
CN112380323A (zh) 一种基于中文分词识别技术的垃圾信息剔除***及方法
CN114627881B (zh) 一种基于人工智能的语音呼叫处理方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200710