CN106383862B - 一种违规短信检测方法及*** - Google Patents

一种违规短信检测方法及*** Download PDF

Info

Publication number
CN106383862B
CN106383862B CN201610799866.2A CN201610799866A CN106383862B CN 106383862 B CN106383862 B CN 106383862B CN 201610799866 A CN201610799866 A CN 201610799866A CN 106383862 B CN106383862 B CN 106383862B
Authority
CN
China
Prior art keywords
illegal
webpage
link
short message
judging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610799866.2A
Other languages
English (en)
Other versions
CN106383862A (zh
Inventor
肖耿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Clouds Network Technology Co Ltd
Original Assignee
Hangzhou Clouds Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Clouds Network Technology Co Ltd filed Critical Hangzhou Clouds Network Technology Co Ltd
Priority to CN201610799866.2A priority Critical patent/CN106383862B/zh
Publication of CN106383862A publication Critical patent/CN106383862A/zh
Application granted granted Critical
Publication of CN106383862B publication Critical patent/CN106383862B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种违规短信检测方法,包括获取短信内容中的链接,获取链接指向的网页;根据网页中文字内容的违规关键词过滤结果,判断链接是否为违规链接;如果短信包含违规链接,则判定短信为违规短信。同时提供了一种违规短信检测***,包括链接获取模块,用于获取短信内容中的链接,获取链接指向的网页;违规关键词过滤模块,用于根据链接获取模块获取网页中文字内容的违规关键词过滤结果,判断链接是否为违规链接;判定模块,用于根据违规关键词过滤模块的判断结果,判定短信包含违规链接,则判定短信为违规短信。通过本发明公开的技术方案实现对短信进行链接内容检测,有效提高违规短信拦截成功率。

Description

一种违规短信检测方法及***
技术领域
本发明涉及通讯技术领域,尤其涉及一种违规短信检测方法和实现改方法的***。
背景技术
短信业务是手机通信业务中的重要组成部分,虽然在移动社交应用的冲击下个人使用短信交流的比重有所下降,但是基于群发短信的推广模式还是有其特别的优势而一直沿用。作为推广媒介的群发短信总会包含用户所要传达的信息,比如会有其产品名,或者会有链接,期望短信接收者通过链接查看他们的产品,给他们带来利益。
短信发送平台作为服务方,有责任对群发短信的内容进行审查,保证其短信内容不包含赌博、色情等违法法律法规的相关内容。现有的违规短信的检测和监控方式大致可分为两类:一种是短信发送运营商的检测,通过人工查看或者对短信内容进行违规关键词过滤两种方式,筛选出违规短信并拦截其发送;运营商端检测能够从根本上拦截违规短信发送,但是短信发送商家为了避免被拦截会在短信中加入链接直接指向推广网页,而在文字内容中不出现违规词,轻易地避免被拦截。另一种是在手机端通过应用软件和违规词库,对手机接收到的短信进行关键词过滤,屏蔽包含违规内容的短信。由于手机端和服务端在性能和短信流量方面的巨大差距,该方法很难适用于短信发送平台的违规短信检测。
发明内容
本发明是为了克服现有技术中的短信发送平台难以对短信链接内容进行违规内容检测,而导致不能完全屏蔽违规短信发送的不足,提供了一种能够对发送短信进行链接内容检测,有效提高违规短信拦截成功率的一种违规短信检测方法及***。
为实现上述目的,本发明采用以下技术方案:
本发明的一种违规短信检测方法,具体包括以下步骤:获取短信内容中的链接,获取链接指向的网页;根据网页中文字内容的违规关键词过滤结果,判断链接是否为违规链接;如果短信包含违规链接,则判定短信为违规短信。
作为优选,所述获取短信内容中的链接的步骤,进一步包括:获取短信的全部内容,利用正则表达式匹配方法,提取短信内容中的链接。
作为优选,所述的根据网页中文字内容的违规关键词过滤结果,判断链接是否为违规链接的步骤,进一步包括:解析网页要素并提取文字内容,同时标记各部分文字内容的网页要素来源;对文字内容进行分词处理获得分词词组,将分词词组和预设的违规关键词库内的违规关键词进行匹配,识别分词词组中的违规词组;根据不同网页要素来源赋予违规词组预设的加权系数,加权计算网页的文字内容中违规词组的加权词频;当违规词组的加权词频超过预设的阈值时,判定网页为违规网页;若连接指向的网页为违规网页,判定链接为违规链接。
作为优选,所述的网页要素包括未带超链接文字和带超链接文字,来源为未带超链接文字的违规词组的加权系数小于来源为带超链接文字的违规词组的加权系数。
作为优选,所述的网页要素包括未带超链接图片和带超链接图片,来源为未带超链接图片的违规词组的加权系数小于来源为带超链接图片的违规词组的加权系数;所述的解析网页要素并提取文字内容,同时标记各部分文字内容的网页要素来源的步骤,进一步包括:获取网页中的图片,并区分未带超链接图片和带超链接图片;使用光学字符识别技术识别并提取未带超链接图片中的文字内容,标记这部分文字内容的网页要素来源为未带超链接图片;使用光学字符识别技术识别并提取带超链接图片中的文字内容,标记这部分文字内容的网页要素来源为带超链接图片。
本发明还提供一种违规短信检测***,所述的***包括:
链接获取模块,用于获取短信内容中的链接,获取链接指向的网页;
违规关键词过滤模块,用于根据链接获取模块获取网页中文字内容的违规关键词过滤结果,判断链接是否为违规链接;
判定模块,用于根据违规关键词过滤模块的判断结果,判定短信包含违规链接,则判定短信为违规短信。
作为优选,所述的违规关键词过滤模块具体包括:
文字解析单元,用于解析网页要素并提取文字内容;
来源标记单元,用于标记文字解析单元提取的各部分文字内容的网页要素来源;
分词单元,用于对文字解析单元提取的文字内容进行分词处理获得分词词组;
违规词组识别单元,用于将分词单元获得的分词词组和预设的违规关键词库内的违规关键词进行匹配,识别分词词组中的违规词组;
计算单元,用于根据不同网页要素来源赋予违规词组预设的加权系数,加权计算网页的文字内容中违规词组的加权词频;
链接判定单元,用于当违规词组的加权词频超过预设的阈值时,判定网页为违规网页;若连接指向的网页为违规网页,判定链接为违规链接。
作为优选,所述的网页要素包括未带超链接文字和带超链接文字,来源为未带超链接文字的违规词组的加权系数小于来源为带超链接文字的违规词组的加权系数。
作为优选,所述的网页要素包括未带超链接图片和带超链接图片,来源为未带超链接图片的违规词组的加权系数小于来源为带超链接图片的违规词组的加权系数;所述的文字解析单元包括光学字符识别子单元,用于识别提取网页中未带超链接图片和带超链接图片中的文字内容。
本发明公开了一种违规短信检测方法,通过提取短信中的链接,并***指向的网页,通过对网页的文字内容进行违规关键词过滤,判断该网页是否包含违规内容,从而判定链接是否为违规链接,如果短信包含违规链接则判定该短信为违规短信,并进行相应的拦截等操作。本方法中所述的违规关键词过滤的对象包括网页的纯文字内容和图片中的字符,并且根据内容是否带有链接,赋予不同的加权系数计算违规词组的词频,从而根据用户习惯更为合理地判定链接指向网页的合法性。同时,本发明还公开了一种违规短信检测***,通过链接获取模块,获取短信内容中的链接并获取链接指向的网页,通过违规关键词过滤模块对所述的网页内容进行违规关键词过滤,从而判定网页是否为违规网页,检测并拦截包含违规链接的短信。本技术方案区别于现有技术能够对短信中的链接内容进行检测,从而保证违规短信拦截准确性,商家无法通过加入链接的方式避免违规短信被拦截,谋取不法利益。
附图说明
图1为本发明实施提供的一种违规短信检测***的示意图。
图2为本发明实施提供的违规关键词过滤模块的第一示意图。
图3为本发明实施提供的违规关键词过滤模块的第二示意图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步描述。
本发明公开了一种违规短信检测方法和一种违规短信检测***,通过提取短信中的链接,并***指向的网页;通过对网页的文字内容进行违规关键词过滤,判断该网页是否包含违规内容,从而判定链接是否为违规链接,如果短信包含违规链接则判定该短信为违规短信,并进行相应的拦截等操作。本技术方案区别于现有技术能够对短信中的链接内容进行检测,从而保证违规短信拦截准确性,商家无法通过加入链接的方式避免违规短信被拦截,谋取不法利益。
一种违规短信检测方法具体实施例:
实施例1:一种违规短信检测方法具体包括以下步骤:
S101获取短信内容中的链接,获取链接指向的网页。
该步骤具体包括获取短信的全部内容,利用正则表达式匹配方法,提取短信内容中的链接。正则表达式是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。该步骤将短信内容中的空格和无含义的标点删除后获得短信的文字内容,再通过预设的正则表达式识别其中的链接,这样相比直接方法链接,可以有效避免商家在短信编辑中通过加入空格和无效字符隐藏链接,从而有效提高链接的识别率。
S102根据网页中文字内容的违规关键词过滤结果,判断链接是否为违规链接。
优选的,所述步骤进一步包括:解析网页要素并提取文字内容,同时标记各部分文字内容的网页要素来源;对文字内容进行分词处理获得分词词组,将分词词组和预设的违规关键词库内的违规关键词进行匹配,识别分词词组中的违规词组;根据不同网页要素来源赋予违规词组预设的加权系数,加权计算网页的文字内容中违规词组的加权词频;当违规词组的加权词频超过预设的阈值时,判定网页为违规网页;若连接指向的网页为违规网页,判定链接为违规链接。
S103如果短信包含违规链接,则判定短信为违规短信。收到短信内容的限制,商家在短信中添加的链接一般是其推广的主要内容,因此只需要判定链接为违规链接,就可以判定短信为违规短信。
本发明公开了一种违规短信检测方法,通过提取短信中的链接,并***指向的网页,通过对网页的文字内容进行违规关键词过滤,判断该网页是否包含违规内容,从而判定链接是否为违规链接,如果短信包含违规链接则判定该短信为违规短信,并进行相应的拦截等操作。本方法中所述的违规关键词过滤的对象包括网页的纯文字内容和图片中的字符,并且根据内容是否带有链接,赋予不同的加权系数计算违规词组的词频,从而根据用户习惯更为合理地判定链接指向网页的合法性。
实施例2:一种违规短信检测方法具体包括以下步骤:
S201获取短信的全部内容,利用正则表达式匹配方法,提取短信内容中的链接。
S202解析网页要素并提取文字内容,同时标记各部分文字内容的网页要素来源;所述的网页要素包括未带超链接文字和带超链接文字。
S203对文字内容进行分词处理获得分词词组,将分词词组和预设的违规关键词库内的违规关键词进行匹配,识别分词词组中的违规词组。
S204根据不同网页要素来源赋予违规词组预设的加权系数,加权计算网页的文字内容中违规词组的加权词频;作为优选,来源为未带超链接文字的违规词组的加权系数小于来源为带超链接文字的违规词组的加权系数。
S205当违规词组的加权词频超过预设的阈值时,判定网页为违规网页;
S206若连接指向的网页为违规网页,判定链接为违规链接。
实施例3:一种违规短信检测方法具体包括以下步骤:
S301获取短信的全部内容,利用正则表达式匹配方法,提取短信内容中的链接。
S302解析网页要素并提取文字内容,同时标记各部分文字内容的网页要素来源。
S303获取网页中的图片,并区分未带超链接图片和带超链接图片。
S304使用光学字符识别技术识别并提取未带超链接图片中的文字内容,标记这部分文字内容的网页要素来源为未带超链接图片;使用光学字符识别技术识别并提取带超链接图片中的文字内容,标记这部分文字内容的网页要素来源为带超链接图片。
S305对文字内容进行分词处理获得分词词组,将分词词组和预设的违规关键词库内的违规关键词进行匹配,识别分词词组中的违规词组。
S306根据不同网页要素来源赋予违规词组预设的加权系数,加权计算网页的文字内容中违规词组的加权词频;作为优选,来源为未带超链接文字的违规词组的加权系数小于来源为带超链接文字的违规词组的加权系数。
S307当违规词组的加权词频超过预设的阈值时,判定网页为违规网页;
S308若连接指向的网页为违规网页,判定链接为违规链接。
实施例2,参看图1,为本发明的一种违规短信检测***的第一示意图,如图所示,一种违规短信检测***具体包括:链接获取模块、违规关键词过滤模块和判定模块。
链接获取模块,用于获取短信内容中的链接,获取链接指向的网页;
违规关键词过滤模块,用于根据链接获取模块获取网页中文字内容的违规关键词过滤结果,判断链接是否为违规链接。
优选的,所述的违规关键词过滤模块包括:文字解析单元,用于解析网页要素并提取文字内容;来源标记单元,用于标记文字解析单元提取的各部分文字内容的网页要素来源;分词单元,用于对文字解析单元提取的文字内容进行分词处理获得分词词组;违规词组识别单元,用于将分词单元获得的分词词组和预设的违规关键词库内的违规关键词进行匹配,识别分词词组中的违规词组。计算单元,用于根据不同网页要素来源赋予违规词组预设的加权系数,加权计算网页的文字内容中违规词组的加权词频;链接判定单元,用于当违规词组的加权词频超过预设的阈值时,判定网页为违规网页;若连接指向的网页为违规网页,判定链接为违规链接。
判定模块,用于根据违规关键词过滤模块的判断结果,判定短信包含违规链接,则判定短信为违规短信。
本发明还公开了一种违规短信检测***,通过链接获取模块,获取短信内容中的链接并获取链接指向的网页,通过违规关键词过滤模块对所述的网页内容进行违规关键词过滤,从而判定网页是否为违规网页,检测并拦截包含违规链接的短信。本技术方案区别于现有技术能够对短信中的链接内容进行检测,从而保证违规短信拦截准确性,商家无法通过加入链接的方式避免违规短信被拦截,谋取不法利益。
实施例3:如图1所示,一种违规短信检测***具体包括:链接获取模块、违规关键词过滤模块和判定模块。
链接获取模块,用于获取短信内容中的链接,获取链接指向的网页;
如图2所示,所述的违规关键词过滤模块包括:
文字解析单元,用于解析网页要素并提取文字内容;
来源标记单元,用于标记文字解析单元提取的各部分文字内容的网页要素来源;
分词单元,用于对文字解析单元提取的文字内容进行分词处理获得分词词组;
违规词组识别单元,用于将分词单元获得的分词词组和预设的违规关键词库内的违规关键词进行匹配,识别分词词组中的违规词组;
计算单元,用于根据不同网页要素来源赋予违规词组预设的加权系数,加权计算网页的文字内容中违规词组的加权词频;
链接判定单元,用于当违规词组的加权词频超过预设的阈值时,判定网页为违规网页;若连接指向的网页为违规网页,判定链接为违规链接。
优选的,所述的网页要素包括未带超链接文字和带超链接文字,来源为未带超链接文字的违规词组的加权系数小于来源为带超链接文字的违规词组的加权系数。
判定模块,用于根据违规关键词过滤模块的判断结果,判定短信包含违规链接,则判定短信为违规短信。
本方案对违规短信检测***的违规关键词过滤模块进一步细化,通过来源标记单元标记出提取的网页文字内容的网页要素来源是否是带有链接的,并且由计算单元根据违规词组的网页要素来源赋予不同的加权系数,并加权计算违规关键词的加权词频作为判定网页内容是否违规的参数。由于带有链接的文字其具有点击后跳转页面的功能,因此这部分文字带有违规内容的权重较高,通过加权计算违规词组的加权词频从而大大提高网页中文字内容的违规检测准确性。
实施例6:如图1所示,一种违规短信检测***具体包括:链接获取模块、违规关键词过滤模块和判定模块。
链接获取模块,用于获取短信内容中的链接,获取链接指向的网页;
如图3所示,所述的违规关键词过滤模块进一步包括:
文字解析单元,用于解析网页要素并提取文字内容;所述的文字解析单元包括光学字符识别子单元,用于识别提取网页中未带超链接图片和带超链接图片中的文字内容。
来源标记单元,用于标记文字解析单元提取的各部分文字内容的网页要素来源。
分词单元,用于对文字解析单元提取的文字内容进行分词处理获得分词词组。
违规词组识别单元,用于将分词单元获得的分词词组和预设的违规关键词库内的违规关键词进行匹配,识别分词词组中的违规词组。
计算单元,用于根据不同网页要素来源赋予违规词组预设的加权系数,加权计算网页的文字内容中违规词组的加权词频。
优选的,所述的网页要素包括未带超链接图片和带超链接图片,来源为未带超链接图片的违规词组的加权系数小于来源为带超链接图片的违规词组的加权系数。
链接判定单元,用于当违规词组的加权词频超过预设的阈值时,判定网页为违规网页;若连接指向的网页为违规网页,判定链接为违规链接。
判定模块,用于根据违规关键词过滤模块的判断结果,判定短信包含违规链接,则判定短信为违规短信。
本方案对违规短信检测***的违规关键词过滤模块进一步细化,通过来源标记单元标记出提取的网页文字内容的网页要素来源扩展到网页中的图片,光学字符识别子单元识别提取图片中的字符,同时区分作为网页要素来源的图片否是带有链接的,由计算单元根据违规词组的网页要素来源赋予不同的加权系数,并加权计算违规关键词的加权词频作为判定网页内容是否违规的参数。由于图片在网页中的展示更为直观和具有吸引力因此违规内容出现的概率和影响有较大,分配了较高的权重,而带有链接的图片其具有点击后跳转页面的功能,因此这部分文字带有违规内容的权重最高,通过加权计算违规词组的加权词频从而大大提高网页中文字内容的违规检测准确性。

Claims (7)

1.一种违规短信检测方法,其特征是,包括以下步骤:
获取短信内容中的链接,获取链接指向的网页;
根据网页中文字内容的违规关键词过滤结果,判断链接是否为违规链接,具体包括:解析网页要素并提取文字内容,同时标记各部分文字内容的网页要素来源;对文字内容进行分词处理获得分词词组,将分词词组和预设的违规关键词库内的违规关键词进行匹配,识别分词词组中的违规词组;根据不同网页要素来源赋予违规词组预设的加权系数,加权计算网页的文字内容中违规词组的加权词频;当违规词组的加权词频超过预设的阈值时,判定网页为违规网页;若连接指向的网页为违规网页,判定链接为违规链接;
如果短信包含违规链接,则判定短信为违规短信。
2.根据权利要求1所述的一种违规短信检测方法,其特征是,所述获取短信内容中的链接的步骤,进一步包括:
获取短信的全部内容,利用正则表达式匹配方法,提取短信内容中的链接。
3.根据权利要求1所述的一种违规短信检测方法,其特征是,所述的网页要素包括未带超链接文字和带超链接文字,来源为未带超链接文字的违规词组的加权系数小于来源为带超链接文字的违规词组的加权系数。
4.根据权利要求3所述的一种违规短信检测方法,其特征是,所述的网页要素包括未带超链接图片和带超链接图片,来源为未带超链接图片的违规词组的加权系数小于来源为带超链接图片的违规词组的加权系数;
所述的解析网页要素并提取文字内容,同时标记各部分文字内容的网页要素来源的步骤,进一步包括:
获取网页中的图片,并区分未带超链接图片和带超链接图片;
使用光学字符识别技术识别并提取未带超链接图片中的文字内容,标记这部分文字内容的网页要素来源为未带超链接图片;
使用光学字符识别技术识别并提取带超链接图片中的文字内容,标记这部分文字内容的网页要素来源为带超链接图片。
5.一种违规短信检测***,其特征是,包括:
链接获取模块,用于获取短信内容中的链接,获取链接指向的网页;
违规关键词过滤模块,用于根据链接获取模块获取网页中文字内容的违规关键词过滤结果,判断链接是否为违规链接;
所述的违规关键词过滤模块,包括:文字解析单元,用于解析网页要素并提取文字内容;来源标记单元,用于标记文字解析单元提取的各部分文字内容的网页要素来源;分词单元,用于对文字解析单元提取的文字内容进行分词处理获得分词词组;违规词组识别单元,用于将分词单元获得的分词词组和预设的违规关键词库内的违规关键词进行匹配,识别分词词组中的违规词组;计算单元,用于根据不同网页要素来源赋予违规词组预设的加权系数,加权计算网页的文字内容中违规词组的加权词频;链接判定单元,用于当违规词组的加权词频超过预设的阈值时,判定网页为违规网页;若连接指向的网页为违规网页,判定链接为违规链接;
判定模块,用于根据违规关键词过滤模块的判断结果,判定短信包含违规链接,则判定短信为违规短信。
6.根据权利要求5所述的一种违规短信检测***,其特征是,所述的网页要素包括未带超链接文字和带超链接文字,来源为未带超链接文字的违规词组的加权系数小于来源为带超链接文字的违规词组的加权系数。
7.根据权利要求6所述的一种违规短信检测***,其特征是,所述的网页要素包括未带超链接图片和带超链接图片,来源为未带超链接文字的违规词组的加权系数小于来源为带超链接文字的违规词组的加权系数;所述的文字解析单元包括光学字符识别子单元,用于识别提取网页中未带超链接图片和带超链接图片中的文字内容。
CN201610799866.2A 2016-08-31 2016-08-31 一种违规短信检测方法及*** Active CN106383862B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610799866.2A CN106383862B (zh) 2016-08-31 2016-08-31 一种违规短信检测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610799866.2A CN106383862B (zh) 2016-08-31 2016-08-31 一种违规短信检测方法及***

Publications (2)

Publication Number Publication Date
CN106383862A CN106383862A (zh) 2017-02-08
CN106383862B true CN106383862B (zh) 2019-12-31

Family

ID=57938012

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610799866.2A Active CN106383862B (zh) 2016-08-31 2016-08-31 一种违规短信检测方法及***

Country Status (1)

Country Link
CN (1) CN106383862B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108960952A (zh) * 2017-05-24 2018-12-07 阿里巴巴集团控股有限公司 一种违禁信息的检测方法及装置
CN107992578B (zh) * 2017-12-06 2019-11-22 山西睿信智达传媒科技股份有限公司 敏感视频源的数据库自动检测方法
CN110110577B (zh) * 2019-01-22 2020-11-10 口碑(上海)信息技术有限公司 识别菜名的方法及装置、存储介质、电子装置
CN111597805B (zh) * 2020-05-21 2021-01-05 上海创蓝文化传播有限公司 一种基于深度学习审核短信文本链接的方法及装置
CN115408420B (zh) * 2022-09-02 2023-08-01 自然资源部地图技术审查中心 使用计算机自动过滤地图注记和兴趣点的方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902889A (zh) * 2012-12-26 2014-07-02 腾讯科技(深圳)有限公司 一种恶意消息云检测方法和服务器
US20150310020A1 (en) * 2014-04-28 2015-10-29 Elwha LLC, a limited liability company of the State of Delaware Methods, systems, and devices for outcome prediction of text submission to network based on corpora analysis
KR102150624B1 (ko) * 2014-07-01 2020-09-01 삼성전자 주식회사 스미싱 알림 방법 및 장치
CN105205090A (zh) * 2015-05-29 2015-12-30 湖南大学 基于网页链接分析和支持向量机的网页文本分类算法研究
CN105335354A (zh) * 2015-12-09 2016-02-17 中国联合网络通信集团有限公司 欺诈信息识别方法和装置

Also Published As

Publication number Publication date
CN106383862A (zh) 2017-02-08

Similar Documents

Publication Publication Date Title
CN106383862B (zh) 一种违规短信检测方法及***
CN101504673B (zh) 一种识别疑似仿冒网站的方法与***
CN111107048B (zh) 一种钓鱼网站检测方法、装置和存储介质
US10872270B2 (en) Exploit kit detection system based on the neural network using image
KR102355973B1 (ko) 스미싱 메시지 판별장치 및 스미싱 메시지 판별방법
CN109922065B (zh) 恶意网站快速识别方法
CN103336766A (zh) 短文本垃圾识别以及建模方法和装置
CN104156490A (zh) 基于文字识别检测可疑钓鱼网页的方法及装置
EP3933636A1 (en) Webpage tampering detection method and related apparatus
CN104735074A (zh) 一种恶意url检测方法及其实现***
CN104168293A (zh) 结合本地内容规则库识别可疑钓鱼网页的方法及***
CN107273465A (zh) Sql注入检测方法
CN112541476A (zh) 一种基于语义特征提取的恶意网页识别方法
CN110866108A (zh) 一种敏感数据检测***及其检测方法
CN112328936A (zh) 一种网站识别方法、装置、设备及计算机可读存储介质
CN102646124A (zh) 一种自动识别地址信息的方法
CN108509794A (zh) 一种基于分类学习算法的恶意网页防御检测方法
CN110020161B (zh) 数据处理方法、日志处理方法和终端
JP2023544925A (ja) データ評価方法、トレーニング方法および装置、電子機器、記憶媒体、コンピュータプログラム
CN114978624A (zh) 钓鱼网页检测方法、装置、设备及存储介质
CN106357682A (zh) 一种钓鱼网站检测方法
CN108804501B (zh) 一种检测有效信息的方法及装置
CN114117299A (zh) 一种网站入侵篡改检测方法、装置、设备及存储介质
CN108694325A (zh) 指定类型网站的辨别方法和指定类型网站的辨别装置
CN116089732B (zh) 基于广告点击数据的用户偏好识别方法及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant