CN116796254A - 电信反诈方法、装置、电子设备和存储介质 - Google Patents

电信反诈方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN116796254A
CN116796254A CN202210238944.7A CN202210238944A CN116796254A CN 116796254 A CN116796254 A CN 116796254A CN 202210238944 A CN202210238944 A CN 202210238944A CN 116796254 A CN116796254 A CN 116796254A
Authority
CN
China
Prior art keywords
fraud
determining
model
short message
fitting function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210238944.7A
Other languages
English (en)
Inventor
张政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Xiongan ICT Co Ltd
China Mobile System Integration Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Xiongan ICT Co Ltd
China Mobile System Integration Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Xiongan ICT Co Ltd, China Mobile System Integration Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202210238944.7A priority Critical patent/CN116796254A/zh
Publication of CN116796254A publication Critical patent/CN116796254A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本申请涉及通信技术领域,提供一种电信反诈方法、装置、电子设备和存储介质。所述方法包括:确定训练数据样本的词向量,所述训练数据样本为经打标签处理得到的待识别短信;根据所述词向量和预设反诈模型确定拟合函数;根据所述拟合函数确定所述预设反诈模型的准确率;根据所述准确率以及所述拟合函数构建反诈模型;根据所述反诈模型对所述待识别短信进行诈骗诊断。本申请实施例提供的词向量来代替词语对比,比使用文字进行对比包含的特征多,使得对比结果更加全面和准确,从而提高模型判别诈骗短信的准确率。

Description

电信反诈方法、装置、电子设备和存储介质
技术领域
本申请涉及通信技术领域,具体涉及一种电信反诈方法、装置、电子设备和存储介质。
背景技术
电信诈骗是指通过电话、网络或短信的方式,编造虚假信息,设置骗局,对受害人实施远程、非接触式诈骗,诱使受害人打款或转账的犯罪行为。
目前,诈骗短信的识别方式包括:方式一:提取短信中的关键词,将该关键词与诈骗关键词数据库中的词、句进行对比,如果命中数据库中的敏感词,则判定短信有诈骗嫌疑。方式二:查询下发短信的电话是否在诈骗黑名单中,若在,则判定短信有诈骗嫌疑。上述识别方式存在以下缺点:1、在语言发展的过程中,诈骗人员为了逃避关键词命中,有可能使用同音字,象形字甚至是隐喻方式编写短信,这增加了关键词句对比的难度,因此,仅针对短信中的词语进行对比,会导致诈骗短信判别准确率低;2、诈骗人员会频繁的更换下发的号码来规避黑名单中的电话号码,而诈骗黑名单无法实时更新,从而导致诈骗短信判别准确率低。因此,现有的诈骗短信的识别方式存在诈骗短信的判别准确率低的问题。
发明内容
本申请实施例提供一种电信反诈方法、装置、电子设备和存储介质,用以解决诈骗短信的判别准确率低的技术问题。
第一方面,本申请实施例提供一种电信反诈方法,包括:
确定训练数据样本的词向量,所述训练数据样本为经打标签处理得到的待识别短信;
根据所述词向量和预设反诈模型确定拟合函数;
根据所述拟合函数确定所述预设反诈模型的准确率;
根据所述准确率以及所述拟合函数构建反诈模型;
根据所述反诈模型对所述待识别短信进行诈骗诊断。
在一个实施例中,所述根据所述词向量和预设反诈模型确定拟合函数包括:
确定所述词向量的特征以及特征数量;
根据所述特征、所述特征数量以及所述预设反诈模型,确定所述拟合函数。
在一个实施例中,所述根据所述拟合函数确定所述预设反诈模型的准确率包括:
根据验证数据样本、所述拟合函数以及所述预设反诈模型,确定输出结果;
根据所述输出结果确定判断正确的短信数量;
根据所述验证数据样本的总数量以及所述判断正确的短信数量确定预设指标值;
根据所述预设指标值指标确定所述准确率。
在一个实施例中,所述确定训练数据样本的词向量与所述根据所述词向量和预设反诈模型确定拟合函数之间,包括:
确定所述训练数据样本的词向量与诈骗短信样本的词向量的比对结果;
根据所述比对结果确定所述预设反诈模型的阈值;
根据所述阈值更新所述预设反诈模型。
在一个实施例中,所述根据所述准确率以及所述拟合函数构建反诈模型包括:
确定准确率最高的拟合函数;
根据所述准确率最高的拟合函数构建所述反诈模型。
在一个实施例中,所述方法,还包括:
构建诈骗短信样本模型;
根据所述诈骗短信样本模型更新诈骗短信数据库。
在一个实施例中,所述根据所述反诈模型对所述待识别短信进行诈骗诊断之后,包括:
根据预设评价函数对诊断结果进行评分;
根据评分结果确定诈骗短信;
将所述诈骗短信存储至所述诈骗短信数据库。
第二方面,本申请实施例提供一种电信反诈装置,包括:
第一确定模块,用于确定训练数据样本的词向量,所述训练数据样本为经打标签处理得到的待识别短信;
第二确定模块,用于根据所述词向量和预设反诈模型确定拟合函数;
第三确定模块,用于根据所述拟合函数确定所述预设反诈模型的准确率;
构建模块,用于根据所述准确率以及所述拟合函数构建反诈模型;
诊断模块,用于根据所述反诈模型对所述待识别短信进行诈骗诊断。
第三方面,本申请实施例提供一种电子设备,包括处理器和存储有计算机程序的存储器,所述处理器执行所述程序时实现第一方面所述的电信反诈方法的步骤。
第四方面,本申请实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第一方面所述的电信反诈方法的步骤。
本申请实施例提供的电信反诈方法、装置、电子设备和存储介质,通过确定训练数据样本的词向量,采用训练数据样本的词向量进行模型训练,在训练过程中确定拟合函数,然后根据拟合函数确定模型的准确率,进一步根据准确率和拟合函数构建反诈模型,最后根据反诈模型对待识别短信进行诈骗诊断。通过词向量来代替词语对比,比使用文字进行对比包含的特征多,使得对比结果更加全面和准确,从而提高模型判别诈骗短信的准确率。
附图说明
为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的电信反诈方法的流程示意图之一;
图2是本申请实施例提供的电信反诈方法的流程示意图之二;
图3是本申请实施例提供的电信反诈方法的流程示意图之三;
图4是本申请实施例提供的电信反诈方法的流程示意图之四;
图5是本申请实施例提供的电信反诈装置的结构示意图;
图6是本申请实施例提供的电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1是本申请实施例提供的电信反诈方法的流程示意图之一。参照图1,本申请实施例提供一种电信反诈方法,可以包括:
步骤S10,确定训练数据样本的词向量,所述训练数据样本为经打标签处理得到的待识别短信;
可以理解的是,词向量(Word embedding),是Word嵌入式自然语言处理(NLP)中的一组语言建模和特征学习技术的统称,是来自词汇表的单词或短语被映射到实数的向量,涉及从每个单词一维的空间到具有更低维度的连续向量空间的数学嵌入。
具体地,分别从待识别短信中心和诈骗短信数据库中提取待识别短信样本以及诈骗短信样本,然后对提取的短信样本数据进行预处理,例如对待识别短信样本以及诈骗短信样本进行打标签处理,可以理解的是,打标签处理是指标记每条短信为诈骗短信或者非诈骗短信。
进一步地,从待识别短信中心中查询并匹配与待识别短信样本具有关联信息的短信,对具有关联信息的短信进行打标签处理,然后,将待识别短信样本与具有关联信息的短信构建待识别短信样本数据,同时,将待识别短信样本数据按比例(如3:7)随机划分为训练数据样本和验证数据样本,其中,训练数据样本用于训练模型,验证数据样本用于在模型训练后验证模型准确率。
可以理解的是,从待识别短信中心中查询并匹配与待识别短信样本具有关联信息的短信的目的是为了丰富训练数据,由于诈骗短信的样式比较类似,如果训练数据少,会导致反诈模型的判别准确率低,而丰富训练数据可以提高反诈模型的判别准确率。
进一步地,对训练数据样本和诈骗短信样本进行分词和词向量提取,并将文本转化为向量格式。具体地,分词和词向量提取是指使用分词方法将一条短信分成由名词、动词、助词等短语组成的序列,并对该序列使用的Word2vec网络将短信文本转化为向量格式,即将短信文本对应的内在含义,语序,发音等特征全部转化成词向量,如此,可便于提取向量之间的特征,用于调整模型参数,同时,还可以通过确定一个或几个特征归类和判别短信是否为诈骗短信。
步骤S20,根据所述词向量和预设反诈模型确定拟合函数;
采用具备向量格式的训练数据样本进行模型训练,并在训练过程中确定拟合函数,具体地,将训练数据样本的词向量输入预设反诈模型进行训练,在训练的过程中,获取词向量之间的特征以及特征数量,然后,根据该特征、特征数量以及预设反诈模型设置拟合函数,例如,如果特征数量为1,即单一特征,则拟合函数可以设置为:
f(x)=anXn+an-1Xn-1-1+...+a1X+a0
其中,x词向量之间的特征,即短信特征。
在迭代过程中,使用夹逼定理求拟合函数,以求取拟合函数中的系数an,an-1...等。如果特征数量为多个,那么可将上述的一元n次方程设置为多元n次方程,得到拟合函数。
可以理解的是,预设反诈模型是指基于神经网络模型训练得到模型。
步骤S30,根据所述拟合函数确定所述预设反诈模型的准确率;
具体地,在确定拟合函数的系数后,将该拟合函数作为预设反诈模型的主函数,然后,将短信样本输入该预设反诈模型,得到输出结果,根据该输出结果确定预设反诈模型的准确率,具体如步骤S31至步骤S34所述。
步骤S40,根据所述准确率以及所述拟合函数构建反诈模型;
具体地,将训练数据样本分批输入预设反诈模型,对预设反诈模型进行多次训练,如此,可得到多个拟合函数,然后确定每个拟合函数作为预设反诈模型的主函数使用后对应的准确率,进一步确定准确率最高的拟合函数,将最高的拟合函数作为预设反诈模型的主函数构建模型得到反诈模型。
步骤S50,根据所述反诈模型对所述待识别短信进行诈骗诊断。
具体地,在训练得到反诈模型后,将该反诈模型应用于客户端,如手机,当客户端收到短信时,自动通过反诈模型对该短信进行诊断,以判断该短信是否为诈骗短信,若是诈骗短信,则输出提示信息告知用户。
本实施例通过确定训练数据样本的词向量,采用训练数据样本的词向量进行模型训练,在训练过程中确定拟合函数,然后根据拟合函数确定模型的准确率,进一步根据准确率和拟合函数构建反诈模型,最后根据反诈模型对待识别短信进行诈骗诊断。通过词向量来代替词语对比,比使用文字进行对比包含的特征多,使得对比结果更加全面和准确,从而提高模型判别诈骗短信的准确率。
进一步地,参考图2,图2是本申请实施例提供的电信反诈方法的流程示意图之二,步骤S10与步骤S20之间包括:
步骤S11,确定所述训练数据样本的词向量与诈骗短信样本的词向量的比对结果;
步骤S12,根据所述比对结果确定所述预设反诈模型的阈值;
步骤S13,根据所述阈值更新所述预设反诈模型。
在本实施例中,根据训练数据样本训练模型并调整预设反诈模型的参数,具体地,将具向量格式的训练数据样本作为线性分类器的输入,并使用层次softmax计算训练数据样本属于每个类别的概率并将所有类别按照频率构建哈夫曼二叉树,每次对两个类别进行二分类,例如,使用逻辑回归(Logistic Regression,LR)进行二分类,其中,逻辑回归是一种分类模型,通过逻辑回归确定左子树或右子树,如此,可将模型复杂度由线性降低为对数,从而减少判断次数提高性能。
在训练模型的过程中,还需要调整模型参数,可以理解的是,调整参数的过程是指用一个函数去拟合变化的过程,即调整函数系数的过程。例如,假设调整的函数系数为a,在参数调整过程中,根据使用的框架不同,如卷积神经网络或者深度神经网络,程序自动尝试的参数是不同的。
进一步地,将训练数据样本的词向量与诈骗短信样本的词向量进行比对,得到比对结果,根据比对结果判断反诈模型的稳定性并制定预设反诈模型的阈值,进一步根据阈值更新预设反诈模型。可以理解的是,稳定性主要用于确定模型的拟合是否正确,防止过拟合,使得函数陷入局部最优解。而阈值是对短信检测的严格程度,例如通过预设反诈模型后,发现诈骗短信和模型结果的误差相差5%,那么阈值可设为5%,并替换上一次的阈值,实现阈值更新。
本实施例通训练数据样本与诈骗短信样本之间的词向量的比对结果确定预设反诈模型的阈值,然后基于阈值更新预设反诈模型,通过阈值可进行模型稳定性的判断,防止过拟合,同时,更新模型的阈值可以提高诈骗短信的判别准确率。
进一步地,参考图3,图3是本申请实施例提供的电信反诈方法的流程示意图之三,步骤S31至步骤S34的具体描述如下:
步骤S31,根据验证数据样本、所述拟合函数以及所述预设反诈模型,确定输出结果;
步骤S32,根据所述输出结果确定判断正确的短信数量;
步骤S33,根据所述验证数据样本的总数量以及所述判断正确的短信数量确定预设指标值;
步骤S34,根据所述预设指标值指标确定所述准确率。
具体地,在确定拟合函数后,将该拟合函数作为预设反诈模型的主函数,然后将验证数据样本逐条输入预设反诈模型中,同时获取预设反诈模型的输出结果,进一步根据输出结果统计判断错误的短信数量、判断正确的短信数量以及验证数据样本的总数量,根据验证数据样本的总数量以及判断正确的短信数量确定预设指标值,再根据预设指标值指标确定模型的准确率。可以理解的是,预设指标值是指可以判断模型准确率的指标值,例如召回率和综合评价指标,即f值(F-Measure),其中,召回率和f值越大,说明模型准确率越高。召回率与f值的公式如下所示:
召回率=判断正确条数/总数量;
f值=[(判断正确条数/选中数据条数)*(判断正确条数/总数量)*2]/(判断正确条数/选中数据条数)+(判断正确条数/总数量)。
其中,判断正确条数是指判断正确的短信数量,由于验证数据样本是分批逐条输入预设反诈模型的,因此,选中数据条数是指某一批次输入模型进行判断的短信条数。
本实施例通过根据验证数据样本、拟合函数以及预设反诈模型确定输出结果,然后根据输出结果确定判断正确的短信数量,进一步根据验证数据样本的总数量以及判断正确的短信数量确定预设指标值根据预设指标值指标确定准确率,如此,通过确定预设指标值可以对模型的准确率进行判断,从而提高了预设反诈模型判别诈骗短信的准确率。
进一步地,参考图4,图4是本申请实施例提供的电信反诈方法的流程示意图之四,所述方法,还包括:
步骤S60,构建诈骗短信样本模型;
步骤S70,根据所述诈骗短信样本模型更新诈骗短信数据库。
在训练得到反诈模型后,通过反诈模型可将待识别短信输出为诈骗短信和非诈骗短信两类,进一步地,需要对诈骗短信数据库使用增强学习进行优化,使其可以自动更新数据库中的反诈样本。
需要说明的是,本实施例采用马尔可夫决策过程(Markov Decision Process,MDP)进行模型的增强学习,其中,一个马尔可夫决策过程由一个四元组构成M=(S,A,Psa,R),其中:
S:表示状态集(states),有s∈S,si表示第i步的状态。
A:表示一组动作(actions),有a∈A,ai表示第i步的动作。
Psa:表示状态转移概率。Psa表示在当前s∈S状态下,经过a∈A作用后,会转移到的其他状态的概率分布情况,例如,在状态s下执行动作a,转移到s'的概率可以表示为p(s'|s,a)。
R是回报函数(reward function),有些回报函数状态S的函数,可以简化为/>如果一组(s,a)转移到了下个状态s',那么回报函数可记为r(s'|s,a),如果(s,a)对应的下个状态s'是唯一的,那么回报函数也可以记为r(s,a)。
MDP的动态过程如下:某个智能体(agent)的初始状态为s0,然后从A中挑选一个动作a0执行,执行后,agent按Psa概率随机转移到了下一个s1状态,然后再执行一个动作a1,就转移到了s2,接下来再执行a2,以此类推。
基于增强学习方法构建诈骗短信样本模型,具体地,将每次模型对短信的判断作为行动(Action),将结果作为状态(State),将更新诈骗短信数据库作为奖励(reward),并构建马尔可夫决策模型作为环境(Environment)存储之前判断时使用的模型参数,既行动(Action)从而改变状态(State)获得奖励(Reward)与环境(Environment)发生交互的循环过程,简写为M=<S,A,E,R>。马尔可夫决策求解过程中设置贝尔曼bellman最优方程,使用动态规划求解模型参数,在确定模型参数后,基于该模型参数构建诈骗短信样本模型,以提升模型准确率。
进一步地,根据预设评价函数对诊断结果进行评分,然后根据评分结果确定诈骗短信,再将诈骗短信存储至诈骗短信数据库。例如,设置积分作为评价函数,每一次的模型判断过程会对每一次的短信判断进行打分,判断正确得分,判断错误不得分,每次判断过后会取得分最高的评判标准,并将被判断为诈骗的短信存储至诈骗短信数据库,以丰富诈骗短信数据库中的负样本。同时,获取训练数据样本与诈骗短信样本之间词向量比对结果中筛选出诈骗短信更新入诈骗短信数据库作为下一次对比的负样本。
可以理解的是,由于诈骗短信的形式是多样的,如使用同音字,象形字甚至是隐喻方式编写短信,即诈骗短信的形式在不断变化,因此,反诈模型也需要增强学习才可以提高判别诈骗短信的准确率。例如,假设目前未出现使用隐喻方式编写的诈骗短信,那么采用诈骗短信的形式为同音字和象形字的训练数据样本进行模型训练,得到的反诈模型可以很好地识别诈骗短信形式为同音字和象形字的短信,而对于采用隐喻方式编写的诈骗短信,则识别的准确率比较低,此时,需要采用增强学习方法,使反诈模型可以学习到其他诈骗形式的短信。例如,基于上述的马尔可夫决策过程MDP进行增强学习,对反诈模型判断正确的短信给予奖励,如奖励1分,而对反诈模型判断错误的短信给予负奖励,如奖励-1分,确定诈骗短信后更新至诈骗短信数据库,使反诈模型可以实现自主的模型升级和优化,而不需要重新训练反诈模型,从而提高诈骗短信的判别效率。
本实施例通过构建诈骗短信样本模型,根据诈骗短信样本模型更新诈骗短信数据库,实现诈骗短信数据库的实时更新,同时,通过增加增强学习能力,可通过后期使用过程中收集到的数据进行及时的,自主的模型升级和优化,持续性的保持模型准确率。
下面对本申请实施例提供的电信反诈装置进行描述,下文描述的电信反诈装置与上文描述的电信反诈方法可相互对应参照。
参考图5,图5是本申请实施例提供的电信反诈装置的结构示意图,本实施例提供的电信反诈装置包括第一确定模块501、第二确定模块502、第三确定模块503、构建模块504以及诊断模块505,其中:
第一确定模块501,用于确定训练数据样本的词向量,所述训练数据样本为经打标签处理得到的待识别短信;
第二确定模块502,用于根据所述词向量和预设反诈模型确定拟合函数;
第三确定模块503,用于根据所述拟合函数确定所述预设反诈模型的准确率;
构建模块504,用于根据所述准确率以及所述拟合函数构建反诈模型;
诊断模块505,用于根据所述反诈模型对所述待识别短信进行诈骗诊断。
在一个实施例中,所述第二确定模块502具体用于:
确定所述词向量的特征以及特征数量;
根据所述特征、所述特征数量以及所述预设反诈模型,确定所述拟合函数。
在一个实施例中,所述第三确定模块503具体用于:
根据验证数据样本、所述拟合函数以及所述预设反诈模型,确定输出结果;
根据所述输出结果确定判断正确的短信数量;
根据所述验证数据样本的总数量以及所述判断正确的短信数量确定预设指标值;
根据所述预设指标值指标确定所述准确率。
在一个实施例中,所述第一确定模块501具体用于:
确定所述训练数据样本的词向量与诈骗短信样本的词向量的比对结果;
根据所述比对结果确定所述预设反诈模型的阈值;
根据所述阈值更新所述预设反诈模型。
在一个实施例中,所述构建模块504具体用于:
确定准确率最高的拟合函数;
根据所述准确率最高的拟合函数构建所述反诈模型。
在一个实施例中,所述方法,还包括:
构建诈骗短信样本模型;
根据所述诈骗短信样本模型更新诈骗短信数据库。
在一个实施例中,所述诊断模块505具体用于:
根据预设评价函数对诊断结果进行评分;
根据评分结果确定诈骗短信;
将所述诈骗短信存储至所述诈骗短信数据库。
图6是本申请实施例提供的电子设备的结构示意图,如图6所示,该电子设备可以包括:处理器(processor)610、通信接口(Communication Interface)620、存储器(memory)630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的计算机程序,以执行电信反诈方法的步骤,例如包括:
确定训练数据样本的词向量,所述训练数据样本为经打标签处理得到的待识别短信;
根据所述词向量和预设反诈模型确定拟合函数;
根据所述拟合函数确定所述预设反诈模型的准确率;
根据所述准确率以及所述拟合函数构建反诈模型;
根据所述反诈模型对所述待识别短信进行诈骗诊断。
此外,上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本申请实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序能够执行上述各实施例所提供的电信反诈方法的步骤,例如包括:
确定训练数据样本的词向量,所述训练数据样本为经打标签处理得到的待识别短信;
根据所述词向量和预设反诈模型确定拟合函数;
根据所述拟合函数确定所述预设反诈模型的准确率;
根据所述准确率以及所述拟合函数构建反诈模型;
根据所述反诈模型对所述待识别短信进行诈骗诊断。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种电信反诈方法,其特征在于,包括:
确定训练数据样本的词向量,所述训练数据样本为经打标签处理得到的待识别短信;
根据所述词向量和预设反诈模型确定拟合函数;
根据所述拟合函数确定所述预设反诈模型的准确率;
根据所述准确率以及所述拟合函数构建反诈模型;
根据所述反诈模型对所述待识别短信进行诈骗诊断。
2.根据权利要求1所述的电信反诈方法,其特征在于,所述根据所述词向量和预设反诈模型确定拟合函数包括:
确定所述词向量的特征以及特征数量;
根据所述特征、所述特征数量以及所述预设反诈模型,确定所述拟合函数。
3.根据权利要求1所述的电信反诈方法,其特征在于,所述根据所述拟合函数确定所述预设反诈模型的准确率包括:
根据验证数据样本、所述拟合函数以及所述预设反诈模型,确定输出结果;
根据所述输出结果确定判断正确的短信数量;
根据所述验证数据样本的总数量以及所述判断正确的短信数量确定预设指标值;
根据所述预设指标值指标确定所述准确率。
4.根据权利要求1所述的电信反诈方法,其特征在于,所述确定训练数据样本的词向量与所述根据所述词向量和预设反诈模型确定拟合函数之间,包括:
确定所述训练数据样本的词向量与诈骗短信样本的词向量的比对结果;
根据所述比对结果确定所述预设反诈模型的阈值;
根据所述阈值更新所述预设反诈模型。
5.根据权利要求1所述的电信反诈方法,其特征在于,所述根据所述准确率以及所述拟合函数构建反诈模型包括:
确定准确率最高的拟合函数;
根据所述准确率最高的拟合函数构建所述反诈模型。
6.根据权利要求1所述的电信反诈方法,其特征在于,所述方法,还包括:
构建诈骗短信样本模型;
根据所述诈骗短信样本模型更新诈骗短信数据库。
7.根据权利要求6所述的电信反诈方法,其特征在于,所述根据所述反诈模型对所述待识别短信进行诈骗诊断之后,包括:
根据预设评价函数对诊断结果进行评分;
根据评分结果确定诈骗短信;
将所述诈骗短信存储至所述诈骗短信数据库。
8.一种电信反诈装置,其特征在于,包括:
第一确定模块,用于确定训练数据样本的词向量,所述训练数据样本为经打标签处理得到的待识别短信;
第二确定模块,用于根据所述词向量和预设反诈模型确定拟合函数;
第三确定模块,用于根据所述拟合函数确定所述预设反诈模型的准确率;
构建模块,用于根据所述准确率以及所述拟合函数构建反诈模型;
诊断模块,用于根据所述反诈模型对所述待识别短信进行诈骗诊断。
9.一种电子设备,包括处理器和存储有计算机程序的存储器,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的电信反诈方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述电信反诈方法。
CN202210238944.7A 2022-03-11 2022-03-11 电信反诈方法、装置、电子设备和存储介质 Pending CN116796254A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210238944.7A CN116796254A (zh) 2022-03-11 2022-03-11 电信反诈方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210238944.7A CN116796254A (zh) 2022-03-11 2022-03-11 电信反诈方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN116796254A true CN116796254A (zh) 2023-09-22

Family

ID=88046516

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210238944.7A Pending CN116796254A (zh) 2022-03-11 2022-03-11 电信反诈方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN116796254A (zh)

Similar Documents

Publication Publication Date Title
CN113220886A (zh) 文本分类方法、文本分类模型训练方法及相关设备
CN112016313B (zh) 口语化要素识别方法及装置、警情分析***
CN116127953B (zh) 一种基于对比学习的中文拼写纠错方法、装置和介质
CN111091809B (zh) 一种深度特征融合的地域性口音识别方法及装置
CN116956835B (zh) 一种基于预训练语言模型的文书生成方法
CN115310443A (zh) 模型训练方法、信息分类方法、装置、设备及存储介质
CN116663525A (zh) 一种文档审核方法、装置、设备及存储介质
CN112101042A (zh) 文本情绪识别方法、装置、终端设备和存储介质
CN115062718A (zh) 语言模型训练方法、装置、电子设备及存储介质
CN116542297A (zh) 基于文本数据训练生成对抗网络的方法及装置
CN116662555B (zh) 一种请求文本处理方法、装置、电子设备及存储介质
CN114119191A (zh) 风控方法、逾期预测方法、模型训练方法及相关设备
CN111507849A (zh) 核保方法及相关装置、设备
CN113722477B (zh) 基于多任务学习的网民情绪识别方法、***及电子设备
CN115688789A (zh) 一种基于动态标签的实体关系抽取模型训练方法及***
CN116796254A (zh) 电信反诈方法、装置、电子设备和存储介质
CN115310449A (zh) 一种基于小样本的命名实体识别方法、装置及相关介质
CN111159360B (zh) 获得讯询问话题分类模型、讯询问话题分类的方法和装置
CN116431779B (zh) 法律领域faq问答的匹配方法、装置、存储介质及电子装置
CN113284498B (zh) 客户意图识别方法及装置
CN112434516B (zh) 一种融合正文文本信息的自适应评论情感分析***及方法
CN117436457B (zh) 反讽识别方法、装置、计算设备及存储介质
US11755570B2 (en) Memory-based neural network for question answering
CN113327581B (zh) 一种提升语音识别准确率的识别模型优化方法及***
CN117313943A (zh) 试题正确率的预测方法、***、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination