CN111241077A - 基于互联网数据的金融欺诈行为的识别方法 - Google Patents

基于互联网数据的金融欺诈行为的识别方法 Download PDF

Info

Publication number
CN111241077A
CN111241077A CN202010003646.0A CN202010003646A CN111241077A CN 111241077 A CN111241077 A CN 111241077A CN 202010003646 A CN202010003646 A CN 202010003646A CN 111241077 A CN111241077 A CN 111241077A
Authority
CN
China
Prior art keywords
data
internet
public
financial
article
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010003646.0A
Other languages
English (en)
Other versions
CN111241077B (zh
Inventor
翟恩荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan XW Bank Co Ltd
Original Assignee
Sichuan XW Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan XW Bank Co Ltd filed Critical Sichuan XW Bank Co Ltd
Priority to CN202010003646.0A priority Critical patent/CN111241077B/zh
Publication of CN111241077A publication Critical patent/CN111241077A/zh
Application granted granted Critical
Publication of CN111241077B publication Critical patent/CN111241077B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及基于互联网数据的金融欺诈行为的识别方法,包括:A.对互联网上的数据进行实时采集,至少包括新闻门户网站、金融论坛和金融社区的数据;B.对采集的数据进行清洗,将异构多源的脏数据进行归一化处理,得到结构化数据;C.通过基于深度学***台进行监控和金融欺诈行为的识别。

Description

基于互联网数据的金融欺诈行为的识别方法
技术领域
本发明涉及金融欺诈行为的识别方法,具体讲是基于互联网数据的金融欺诈行为的识别 方法。
背景技术
在合规监管的当前时期,消费金融从业机构面临着新的机遇与挑战,包括如何实现从野 蛮扩张阶段到稳健发展阶段的平稳过渡,如何面临正常客户消费降级及信贷客户严重多头等, 都是消费金融机构不可回避的难题。基于这种行业背景,需全面把握银行风险,从而构建有 效预警***,以便减小风险,避免危机发生。
现有对金融欺诈识别的方法一般是针对欺诈后进行处理,而这样既不能预防欺诈发生, 相对欺诈发生后的反应也较慢,往往造成重大的损失。也有在金融欺诈发生时,通过识别身 份方面做欺诈行为识别、通过识别用户的指纹等信息,也能有效的识别出部分欺诈行为。但 上述的两种方式都不能对突发的薅羊毛式的黑产进行识别,当***出现突发问题或者其他漏 洞时,不法分子借助***漏洞对***进行攻击,往往会造成很大的损失。
发明内容
本发明提供了一种基于互联网数据的金融欺诈行为的识别方法,通过对互联网上存在的 欺诈行为进行监控,及时的对网络社区或论坛中存在的中介攻击、黑产攻击等进行预警。
本发明基于互联网数据的金融欺诈行为的识别方法,包括:
A.对互联网上的数据进行实时采集,至少包括新闻门户网站、金融论坛和金融社区的 数据;
B.对采集的数据进行清洗,将异构多源的脏数据进行归一化处理,得到结构化数据; 所述的结构化数据即为关系模型数据。
C.通过基于深度学习的情感分析方法,识别出所述结构化数据中的负面舆情。传统的 情感分析技术是使用SVM、CRF等传统机器学习算法根据手工标注情感特征对文本情感进行 分析,但是有监督学习依赖于大量人工标注的数据,使得基于有监督学习的***需要付出很 高的标注代价。而基于深度学习的情感分析方法,是采用递归神经网络来发现与任务相关的 特征,避免依赖于具体任务的人工特征设计,并根据句子词语间前后的关联性引入情感极性 转移模型加强对文本关联性的捕获。基于深度学习的方法在性能上与当前采用手工标注情感 特征的方法相当,但节省了大量人工标注的工作量。在现有技术中,基于深度学习的情感分 析方法已有大量的公开文献,例如专利申请号为201711417352.7、201811617266.5、 201810290094.9等多件公开专利申请文件,并且基于深度学习也是一种成熟的情感分析方式, 该方法不是本发明的创新点所在,在此不做详述。
D.根据配置信息计算舆情指数,实现了不同类型的舆情指数的计算,如欺诈攻击指数、 平台暴雷指数、黑产动态指数等;
E.根据舆情指数识别互联网上的金融欺诈行为,并进行预警,将该金融欺诈行为通知 给相关管理人员,从而采取适当手段,及时制止欺诈行为的发生。
本发明的识别方法是通过对外部爬取公开的互联网数据来进行实时监控,并生成对应的 舆情指数,当舆情指数异常时进行实时预警通知,实现了黑产攻击识别、暴雷舆情监控、欺 诈攻击指数计算等功能。通过实时预警不仅能够提前预知风险,更能够提前采取措施,调整 策略,将损失降至最低。
进一步的,步骤A中在对互联网上的数据进行实时采集时,先对互联网上的动态网页进 行分布式抓取,在抓取时,由分布式架构中的主节点负责调度,从节点负责抓取;然后对抓 取得到的HTML代码进行结构化数据提取,将半结构化的HTML代码转化为需要的结构化 数据。其中半结构化数据为非关系模型的、有基本固定结构模式的数据。通过分布式架构能 够提升抓取速度,并且还支持水平扩展,由此快速定位不同网站的字段信息,根据不同来源 提取不同的信息,最终保存至关系型数据库中。
进一步的,所述的对动态网页分布式抓取是通过JS引擎渲染动态网页,从而获取最终 展现页面的HTML代码。
进一步的,步骤B中在进行数据清洗时,将非结构化数据转化为结构化数据,并进行数 据去重和数据清洗。非结构化数据指的是没有固定模式的数据,如WORD、PDF、PPT、EXL, 各种格式的图片、视频等。
具体的,所述的数据去重是通过基于Bloom Filter(一种二进制向量数据结构)的数据 结构实现基于URL的去重;所述的数据清洗是基于配置,将json格式数据转换为格式化的 数据。json数据是一种按照特定格式组装的数据结构,通过这个数据结构可以很好的将数据 最小化,将有用的数据尽可能的压缩,但是想查看json数据格式需要对数据进行格式化,通 过格式化之后,才可以对数据进行查看。
进一步的,步骤D包括:
D1.设置与金融欺诈相关的关键词列表,当采集的数据中有与关键词列表中的关键词相 同的,标记出该数据对应的文章;
D2.计算当前文章的舆情指数:当前文章的舆情指数=截距+评分,所述的截距为当前 文章通过步骤C的基于深度学习的情感分析方法得到的情感指数,评分为将当前文章的各种 属性经预定的计算方式得到的数值;
D3.计算平台的舆情指数:在设定的时间范围内循环的计算平台的舆情指数,计算该时 间范围内在该平台搜索到的n篇文章各自的舆情指数Ai,i为文章编号,i≤n,舆情指数Ai最高 的文章设置权重为n,舆情指数Ai最低的文章设置权重为1,则平台的舆情指数=sum([n- top(Ai)]×Ai)/(1+2+…+n),其中top(Ai)为当前第i篇文章的舆情指数Ai的排序值。
在此基础上,步骤E中,当单篇文章的舆情指数或平台的舆情指数达到设定阈值后,通 过短信和/或邮件方式通知相关管理人员。
本发明基于互联网数据的金融欺诈行为的识别方法能够在不优化智能化配置的前提下, 对互联网上的公开网站、社区、论坛等进行实时监控,对其中的金融欺诈行为第一时间进行 预警,并且通过配置监控的内容,能够对不同领域、不同平台进行监控和金融欺诈行为的识 别。
以下结合实施例的具体实施方式,对本发明的上述内容再作进一步的详细说明。但不应 将此理解为本发明上述主题的范围仅限于以下的实例。在不脱离本发明上述技术思想情况下, 根据本领域普通技术知识和惯用手段做出的各种替换或变更,均应包括在本发明的范围内。
附图说明
图1为本发明基于互联网数据的金融欺诈行为的识别方法的流程图。
图2为对互联网上的数据进行实时采集的流程图。
具体实施方式
如图1所示本发明基于互联网数据的金融欺诈行为的识别方法,包括:
A.如图2所示,通过网络爬虫算法对互联网上的数据进行实时采集,至少包括新闻门 户网站、金融论坛和金融社区的数据。在对数据采集时,通过JS引擎渲染动态网页来对互联 网上的动态网页进行分布式抓取,从而获取最终展现页面的HTML代码。在抓取时,由分布 式架构中的主节点负责调度,从节点负责抓取。然后对抓取得到的HTML代码进行结构化数 据提取,将半结构化的HTML代码转化为需要的结构化数据,得到Web页面源文件及对应的 URL。通过分布式架构能够提升抓取速度,并且还支持水平扩展,由此快速定位不同网站的 字段信息,根据不同来源提取不同的信息,最终保存至关系型数据库中。
B.对采集的数据进行清洗,将异构多源的脏数据进行归一化处理,将非结构化数据转 化为结构化数据,并进行数据去重和数据清洗。其中数据去重是通过基于BloomFilter(一种 二进制向量数据结构)的数据结构实现基于URL的去重。数据清洗是基于配置将json格式 数据转换为格式化的数据。
C.由于在金融风控领域中,对自然语言处理最重要的应用场景是舆情分析。通过文本 聚类和情感分析等技术对文本进行分析挖掘,实现负面舆情的发现和跟踪。负面舆情分析识 别时需要考虑规模和负面程度两方面,需要找出在一段时间内上升较快,或参与规模较大的 负面舆情。规模可以通过文本聚类后的相关网页数来判断,负面程度通过对文本的情感分析 技术识别。
通过基于深度学习的情感分析方法,识别出所述结构化数据中的负面舆情。基于深度学 习的情感分析方法,是采用递归神经网络来发现与任务相关的特征,避免依赖于具体任务的 人工特征设计,并根据句子词语间前后的关联性引入情感极性转移模型加强对文本关联性的 捕获。基于深度学习的方法在性能上与当前采用手工标注情感特征的方法相当,但节省了大 量人工标注的工作量。在现有技术中,基于深度学习的情感分析方法已有大量的公开文献, 例如专利申请号为201711417352.7、201811617266.5、201810290094.9等多件公开专利申请 文件,并且基于深度学习也是一种成熟的情感分析方式,该方法不是本发明的创新点所在, 在此不做详述。
D.根据配置信息计算舆情指数,实现了不同类型的舆情指数的计算,如欺诈攻击指数、 平台暴雷指数、黑产动态指数等。具体包括:
D1.设置与金融欺诈相关的关键词列表,当采集的数据中有与关键词列表中的关键 词相同的,标记出该数据对应的文章。关键词列表例如为:
“(好人贷||XX银行||全国第三家互联网银行||滴水贷||今日头条||借呗||支付宝||微粒贷 ||趣店大额||来分期||季得利||好事贷)&&(口子||撸||套路||下款||大额借款||盗用||冒用||套现||转让 ||BUG||漏洞||投诉||薅||羊毛||失联||高利贷||撸钱||洗钱||诈骗||中介||挤兑||伪冒||非本人交易||没有借 款||被骗||骗贷||套路贷||诱骗||投诉||丢失身份证||身份证丢失||银行卡丢失||丢失银行卡||被盗||新 型诈骗||被点名||砍头息||714高炮||高额利息||撞库盗号||中介欺诈||赌博洗钱||撞库||密码泄露||破 解密码||密码破解||拖库)”。
D2.计算当前文章的舆情指数:当前文章的舆情指数=截距+评分,所述的截距为当 前文章通过步骤C的基于深度学习的情感分析方法得到的情感指数,评分为将当前文章的各 种属性经预定的计算方式得到的数值。其中属性包括:阅读量、评论量、类型(原创或转载)、 该文章发布距今天数等,以及文章中包含关键词的个数。计算当前文章的舆情指数为:
a.例如,该文中包含关键字“口子”的个数为n,当n<1,“口子”项得分=0;n=1,“口子”项得分=20;n>=2,“口子”项得分=100;
b.是否包含关键字“撸”的个数为n,当n>=1,“撸”项得分=100;n<1,“撸” 项得分=0分。
c.该文的访问量为n,当n<10,该项得分=5分;100>n>=10,该项得分=20分;1000>n>=100,该项得分=50;n>=1000,该项得分=100;
d.该文的评论量为n,当n<10,该项得分=5分;n>=10,该项得分=100分;
e.该文发布距今天数为n,当n<2,该项得分=100分;7>n>=2,该项得分=70;n>=7, 该项得分=20分。
在计算时:
(1)可以定义多个关键词,每定义一个关键词,则需要统计当前文章中包含这个关键 词的个数。
(2)截距限制为(0,30)分,最高分为30分;
(3)评分限制为(0,70)分,最高分为70分;
D3.计算平台的舆情指数:每天每小时生成一个平台的舆情指数。计算每小时内在该平台搜索到的n篇文章各自的舆情指数Ai,i为文章编号,i≤n,舆情指数Ai最高的文章设置 权重为n,舆情指数Ai最低的文章设置权重为1,则平台的舆情指数=sum([n-top(Ai)]× Ai)/(1+2+…+n),其中top(Ai)为当前第i篇文章的舆情指数Ai的排序值。
E.根据舆情指数识别互联网上的金融欺诈行为,当单篇文章的舆情指数、评分、情感 指数其中之一达到设定阈值,或平台的舆情指数达到阈值,或平台的舆情指数异常,如:当 前这小时平台的舆情指数>昨天时平台的舆情指数最大值×1.5;当前这小时平台的舆情指数> 前7日时平台的舆情指数的平均值×1.5,均通过短信和/或邮件方式通知相关管理人员,从而 采取适当手段,及时制止欺诈行为的发生。
针对单篇文章,报警内容包括:时间,报警内容和文章链接,例如:【xx银行】[2019-01-18 12:39:40][金融欺诈攻击提示:金融欺诈攻击指数为80分]https://xx.cc.com。
针对平台,报警内容包括:时间,内容,单篇文章排名前三的链接,例如:【xx银行】[2019-01-18 12:39:40][金融欺诈攻击提示:金融欺诈攻击指数为80分]https://xx.cc.com,https://pp.mm.com, https://gg.uu.com。

Claims (7)

1.基于互联网数据的金融欺诈行为的识别方法,其特征包括:
A.对互联网上的数据进行实时采集,至少包括新闻门户网站、金融论坛和金融社区的数据;
B.对采集的数据进行清洗,将异构多源的脏数据进行归一化处理,得到结构化数据;
C.通过基于深度学习的情感分析方法,识别出所述结构化数据中的负面舆情;
D.根据配置信息计算舆情指数;
E.根据舆情指数识别互联网上的金融欺诈行为,并进行预警。
2.如权利要求1所述的基于互联网数据的金融欺诈行为的识别方法,其特征为:步骤A中在对互联网上的数据进行实时采集时,先对互联网上的动态网页进行分布式抓取,在抓取时,由分布式架构中的主节点负责调度,从节点负责抓取;然后对抓取得到的HTML代码进行结构化数据提取,将半结构化的HTML代码转化为需要的结构化数据。
3.如权利要求2所述的基于互联网数据的金融欺诈行为的识别方法,其特征为:所述的对动态网页分布式抓取是通过JS引擎渲染动态网页,从而获取最终展现页面的HTML代码。
4.如权利要求1所述的基于互联网数据的金融欺诈行为的识别方法,其特征为:步骤B中在进行数据清洗时,将非结构化数据转化为结构化数据,并进行数据去重和数据清洗。
5.如权利要求4所述的基于互联网数据的金融欺诈行为的识别方法,其特征为:所述的数据去重是通过基于Bloom Filter的数据结构实现基于URL的去重;所述的数据清洗是基于配置,将json格式数据转换为格式化的数据。
6.如权利要求1所述的基于互联网数据的金融欺诈行为的识别方法,其特征为:步骤D包括:
D1.设置与金融欺诈相关的关键词列表,当采集的数据中有与关键词列表中的关键词相同的,标记出该数据对应的文章;
D2.计算当前文章的舆情指数:当前文章的舆情指数=截距+评分,所述的截距为当前文章通过步骤C的基于深度学习的情感分析方法得到的情感指数,评分为将当前文章的各种属性经预定的计算方式得到的数值;
D3.计算平台的舆情指数:在设定的时间范围内循环的计算平台的舆情指数,计算该时间范围内在该平台搜索到的n篇文章各自的舆情指数Ai,i为文章编号,i≤n,舆情指数Ai最高的文章设置权重为n,舆情指数Ai最低的文章设置权重为1,则平台的舆情指数=sum([n-top(Ai)]×Ai)/(1+2+…+n),其中top(Ai)为当前第i篇文章的舆情指数Ai的排序值。
7.如权利要求6所述的基于互联网数据的金融欺诈行为的识别方法,其特征为:步骤E中,当单篇文章的舆情指数或平台的舆情指数达到设定阈值后,通过短信和/或邮件方式通知相关管理人员。
CN202010003646.0A 2020-01-03 2020-01-03 基于互联网数据的金融欺诈行为的识别方法 Active CN111241077B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010003646.0A CN111241077B (zh) 2020-01-03 2020-01-03 基于互联网数据的金融欺诈行为的识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010003646.0A CN111241077B (zh) 2020-01-03 2020-01-03 基于互联网数据的金融欺诈行为的识别方法

Publications (2)

Publication Number Publication Date
CN111241077A true CN111241077A (zh) 2020-06-05
CN111241077B CN111241077B (zh) 2023-06-09

Family

ID=70874312

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010003646.0A Active CN111241077B (zh) 2020-01-03 2020-01-03 基于互联网数据的金融欺诈行为的识别方法

Country Status (1)

Country Link
CN (1) CN111241077B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113821794A (zh) * 2021-09-14 2021-12-21 北京八分量信息科技有限公司 一种分布式的可信计算***及方法
CN114021039A (zh) * 2021-11-10 2022-02-08 深圳安巽科技有限公司 一种反诈联防预警方法、***及存储介质

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544255A (zh) * 2013-10-15 2014-01-29 常州大学 基于文本语义相关的网络舆情信息分析方法
US9514133B1 (en) * 2013-06-25 2016-12-06 Jpmorgan Chase Bank, N.A. System and method for customized sentiment signal generation through machine learning based streaming text analytics
CN106960358A (zh) * 2017-01-13 2017-07-18 重庆小富农康农业科技服务有限公司 一种基于农村电子商务大数据深度学习的金融欺诈行为量化检测***
CN108647823A (zh) * 2018-05-10 2018-10-12 北京航空航天大学 基于深度学习的股票数据分析方法和装置
CN108932291A (zh) * 2018-05-23 2018-12-04 福建亿榕信息技术有限公司 电网舆情评价方法、存储介质及计算机
CN108959383A (zh) * 2018-05-31 2018-12-07 平安科技(深圳)有限公司 网络舆情的分析方法、装置及计算机可读存储介质
CN109241199A (zh) * 2018-08-08 2019-01-18 广州初星科技有限公司 一种面向金融知识图谱发现的方法
US20190026840A1 (en) * 2017-07-19 2019-01-24 Zhouyi TANG Method and System for Providing Real-Time Visual Information Based on Financial Flow Data
CN109471965A (zh) * 2018-10-26 2019-03-15 四川才子软件信息网络有限公司 一种基于大数据的网络舆情数据采集、处理方法及监测平台
CN109684460A (zh) * 2018-12-28 2019-04-26 四川新网银行股份有限公司 一种基于深度学习的负面网络舆情指数的计算方法及***
CN110008336A (zh) * 2019-01-14 2019-07-12 阿里巴巴集团控股有限公司 一种基于深度学习的舆情预警方法及***
CN110110156A (zh) * 2019-04-04 2019-08-09 平安科技(深圳)有限公司 行业舆情监控方法、装置、计算机设备及存储介质
CN110134849A (zh) * 2019-05-20 2019-08-16 瑞森网安(福建)信息科技有限公司 一种网络舆情监控方法及***
CN110232109A (zh) * 2019-05-17 2019-09-13 深圳市兴海物联科技有限公司 一种网络舆情分析方法以及***
CN110276679A (zh) * 2019-05-23 2019-09-24 武汉大学 一种面向深度学习的网络个人信贷欺诈行为检测方法
CN110297870A (zh) * 2019-05-30 2019-10-01 南京邮电大学 一种金融领域中文新闻标题情感分类方法
CN110413863A (zh) * 2019-08-01 2019-11-05 信雅达***工程股份有限公司 一种基于深度学习的舆情新闻去重与推送方法
CN110633373A (zh) * 2018-06-20 2019-12-31 上海财经大学 一种基于知识图谱和深度学习的汽车舆情分析方法

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9514133B1 (en) * 2013-06-25 2016-12-06 Jpmorgan Chase Bank, N.A. System and method for customized sentiment signal generation through machine learning based streaming text analytics
CN103544255A (zh) * 2013-10-15 2014-01-29 常州大学 基于文本语义相关的网络舆情信息分析方法
CN106960358A (zh) * 2017-01-13 2017-07-18 重庆小富农康农业科技服务有限公司 一种基于农村电子商务大数据深度学习的金融欺诈行为量化检测***
US20190026840A1 (en) * 2017-07-19 2019-01-24 Zhouyi TANG Method and System for Providing Real-Time Visual Information Based on Financial Flow Data
CN108647823A (zh) * 2018-05-10 2018-10-12 北京航空航天大学 基于深度学习的股票数据分析方法和装置
CN108932291A (zh) * 2018-05-23 2018-12-04 福建亿榕信息技术有限公司 电网舆情评价方法、存储介质及计算机
CN108959383A (zh) * 2018-05-31 2018-12-07 平安科技(深圳)有限公司 网络舆情的分析方法、装置及计算机可读存储介质
CN110633373A (zh) * 2018-06-20 2019-12-31 上海财经大学 一种基于知识图谱和深度学习的汽车舆情分析方法
CN109241199A (zh) * 2018-08-08 2019-01-18 广州初星科技有限公司 一种面向金融知识图谱发现的方法
CN109471965A (zh) * 2018-10-26 2019-03-15 四川才子软件信息网络有限公司 一种基于大数据的网络舆情数据采集、处理方法及监测平台
CN109684460A (zh) * 2018-12-28 2019-04-26 四川新网银行股份有限公司 一种基于深度学习的负面网络舆情指数的计算方法及***
CN110008336A (zh) * 2019-01-14 2019-07-12 阿里巴巴集团控股有限公司 一种基于深度学习的舆情预警方法及***
CN110110156A (zh) * 2019-04-04 2019-08-09 平安科技(深圳)有限公司 行业舆情监控方法、装置、计算机设备及存储介质
CN110232109A (zh) * 2019-05-17 2019-09-13 深圳市兴海物联科技有限公司 一种网络舆情分析方法以及***
CN110134849A (zh) * 2019-05-20 2019-08-16 瑞森网安(福建)信息科技有限公司 一种网络舆情监控方法及***
CN110276679A (zh) * 2019-05-23 2019-09-24 武汉大学 一种面向深度学习的网络个人信贷欺诈行为检测方法
CN110297870A (zh) * 2019-05-30 2019-10-01 南京邮电大学 一种金融领域中文新闻标题情感分类方法
CN110413863A (zh) * 2019-08-01 2019-11-05 信雅达***工程股份有限公司 一种基于深度学习的舆情新闻去重与推送方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
全颖等: "基于AI模式的互联网金融创新创业探究", 《科技创新与生产力》 *
周欣欣: "基于深度学习的网络交易欺诈检测模型的研究", 《中国优秀硕士学位论文全文数据库》 *
张庆庆等: "基于深度信念网络的文本情感分类研究", 《西北工业大学学报(社会科学版)》 *
蒋知义;马王荣;邹凯;李黎;: "基于情感倾向性分析的网络舆情情感演化特征研究" *
邢云菲;王晰巍;王铎;韦雅楠;: "基于信息熵的新媒体环境下负面网络舆情监测指标体系研究" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113821794A (zh) * 2021-09-14 2021-12-21 北京八分量信息科技有限公司 一种分布式的可信计算***及方法
CN113821794B (zh) * 2021-09-14 2023-08-18 北京八分量信息科技有限公司 一种分布式的可信计算***及方法
CN114021039A (zh) * 2021-11-10 2022-02-08 深圳安巽科技有限公司 一种反诈联防预警方法、***及存储介质
CN114021039B (zh) * 2021-11-10 2022-08-23 深圳安巽科技有限公司 一种反诈联防预警方法、***及存储介质

Also Published As

Publication number Publication date
CN111241077B (zh) 2023-06-09

Similar Documents

Publication Publication Date Title
Batra et al. Integrating StockTwits with sentiment analysis for better prediction of stock price movement
US9990356B2 (en) Device and method for analyzing reputation for objects by data mining
AU2022201654A1 (en) System and engine for seeded clustering of news events
US8010524B2 (en) Method of monitoring electronic media
CN108021651B (zh) 一种网络舆情风险评估方法及装置
CN111914087B (zh) 一种舆情分析方法
CN101751458A (zh) 一种网络舆情监控***及方法
KR102105319B1 (ko) Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법
Ghankutkar et al. Modelling machine learning for analysing crime news
CN111241077A (zh) 基于互联网数据的金融欺诈行为的识别方法
CN113723737A (zh) 一种基于企业画像的政策匹配方法、装置、设备及介质
CN111666499A (zh) 一种基于大数据的舆情监测云服务平台
CN115187066A (zh) 风险识别方法、装置、电子设备及存储介质
Bhoir An efficient fake news detector
Sood et al. Review the role of artificial intelligence in detecting and preventing financial fraud using natural language processing
CN112395513A (zh) 一种舆情传播力分析方法
Sumathi et al. Fake review detection of e-commerce electronic products using machine learning techniques
CN116865994A (zh) 一种基于大数据的网络数据安全预测方法
Konagala et al. Fake news detection using deep learning: supervised fake news detection analysis in social media with semantic similarity method
CN113706207B (zh) 基于语义解析的订单成交率分析方法、装置、设备及介质
CN114529383A (zh) 实现税务缴纳追踪和税款流失预警方法及***
Jishag et al. Automated review analyzing system using sentiment analysis
Mascii et al. Sentiment analysis for performance evaluation of maintenance in healthcare
Lee et al. Novel methods for resolving false positives during the detection of fraudulent activities on stock market financial discussion boards
Guha Exploring the Field of Text Mining

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant