CN110222339A - 基于改进XGBoost算法的意图识别方法及装置 - Google Patents

基于改进XGBoost算法的意图识别方法及装置 Download PDF

Info

Publication number
CN110222339A
CN110222339A CN201910487948.7A CN201910487948A CN110222339A CN 110222339 A CN110222339 A CN 110222339A CN 201910487948 A CN201910487948 A CN 201910487948A CN 110222339 A CN110222339 A CN 110222339A
Authority
CN
China
Prior art keywords
xgboost
model
training
algorithm
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910487948.7A
Other languages
English (en)
Other versions
CN110222339B (zh
Inventor
姜伟敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Di Di Information Technology Ltd By Share Ltd
Original Assignee
Shenzhen Di Di Information Technology Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Di Di Information Technology Ltd By Share Ltd filed Critical Shenzhen Di Di Information Technology Ltd By Share Ltd
Priority to CN201910487948.7A priority Critical patent/CN110222339B/zh
Publication of CN110222339A publication Critical patent/CN110222339A/zh
Application granted granted Critical
Publication of CN110222339B publication Critical patent/CN110222339B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供了一种基于改进XGBoost算法的意图识别方法,采用Scikit‑learn算法中CountVectorizer和TfidfVectorizer类提取文本特征,然后生成训练集;待对训练样本完成训练之后,保存训练模型参数countVectorizer和tfidfVectorizer,作为中间件存储于本地,然后将训练后的样本信息输送至XGBoost模型进行意图训练,直至达到损失函数条件,终止模型训练,最终将XGBoost训练后模型自动存储于本地;将训练好模型对用户的语句进行意图识别。本发明将训练countVectorizer和tfidfVectorizer中间件存储于本地,便于程序本地化加载运行,根据训练文本数据特征间相互关联关系,直接对用户数据进行处理,从而降低***开销,提高运行效率;将XGBoost训练后模型自动存储于本地,便于运行加载训练好的模型,复用率高。

Description

基于改进XGBoost算法的意图识别方法及装置
技术领域
本发明涉及一种意图识别方法及装置,尤其是指一种基于改进XGBoost算法的意图识别方法及装置。
背景技术
意图识别从解析用户语义信息转化为产品差异化的核心技术,不仅有效加快搜索的速度和准确性,同时提高意图识别的可扩展性能力,因此用户意图识别技术研究是一项具有重要意义和挑战性的工作。
传统XGBoost算法源于Boosting集成学习算法,在演化过程中又融入Bagging集成学习方法的优势,通过Gradient Boosting框架自定义损失函数提高了算法解决通用问题的能力,由此XGBoost算法在学术竞赛和工业界领域使用非常频繁,能有效应用至分类,回归,排序等具体场景。
但是,基于XGBoost算法实现的意图识别分类时,XGBoost算法在迭代之前对节点特征做预排序,遍历选择最优分割点,数据量较大时,内部使用的贪算法耗时严重;另外XGBoost使用level-wise生成决策树,当多叶子节点的***增益较低时,***开销巨大。此外,当对新数据进行意图识别时,传统XGBoost需要重新运行训练过程,过程繁琐不利于工程化应用。
发明内容
本发明所要解决的技术问题是:提供一种基于改进XGBoost算法的意图识别方法及装置,旨在提高意图识别效率,降低***开销。
为了解决上述技术问题,本发明采用的技术方案为:一种基于改进XGBoost算法的意图识别方法,包括以下步骤,
S10、通过自定义词库对原始文本数据进行分词,分词结果通过停用词词库进行过滤,得到初始化数据;
S20、对Scikit-learn算法中的CountVectorizer函数和TfidfVectorizer函数通过输入初始化数据进行训练;
S30、将训练后的特征函数countVectorizer和tfidfVectorizer进行本地化存储,形成本地中间件,保留文本数据特征间相互关联关系,形成XGBoost模型初始数据;
S40、将XGBoost模型初始数据,经过XGBoost模型中梯度增强算法进行模型训练,得到基于XGBoost与Scikit-learn算法意图识别模型;
S50、将训练后的XGBoost模型进行本地化存储;
S60、基于XGBoost与Scikit-learn算法意图识别模型,对用户输入的语句进行意图识别。
进一步的,所述步骤S20具体包括,
S21、通过Scikit-learn算法中的CountVectorizer函数将初始化数据转换词频矩阵;
S22、词频矩阵通过TfidfVectorizer函数计算出每个短语权重分值。
进一步的,所述步骤S40具体包括,将XGBoost模型初始数据,经过XGBoost模型中梯度增强算法进行模型训练,通过收缩比例因子新增加权重防止过拟合情况,训练直至达到损失函数条件,终止模型训练,得到基于XGBoost与Scikit-learn算法意图识别模型。
进一步的,所述步骤S60具体包括,
S61、待对用户输入语句时,对用户输入语句进行初始化操作;
S62、加载特征函数countVectorizer和tfidfVectorizer中间件,对用户输入语句进行特征处理;
S63、通过加载训练过的XGBoost模型,计算出用户输入语句的分类类别,实现用户意图识别分析。
为了解决上述技术问题,本发明采用的另一个技术方案为:一种基于改进XGBoost算法的意图识别装置,包括以下模块,
数据初始化模块,用于通过自定义词库对原始文本数据进行分词,分词结果通过停用词词库进行过滤,得到初始化数据;
特征函数训练模块,用于对Scikit-learn算法中的CountVectorizer函数和TfidfVectorizer函数通过输入初始化数据进行训练;
特征函数存储模块,用于将训练后的特征函数countVectorizer和tfidfVectorizer进行本地化存储,形成本地中间件,保留文本数据特征间相互关联关系,形成XGBoost模型初始数据;
XGBoost算法优化模块,用于将XGBoost模型初始数据,经过XGBoost模型中梯度增强算法进行模型训练,得到基于XGBoost与Scikit-learn算法意图识别模型;
XGBoost模型存储模块,用于将训练后的XGBoost模型进行本地化存储;
用户意图识别模块,用于基于XGBoost与Scikit-learn算法意图识别模型,对用户输入的语句进行意图识别。
进一步的,所述特征函数训练模块包括,
数据转换单元,用于通过Scikit-learn算法中的CountVectorizer函数将初始化数据转换词频矩阵;
短语权重计算单元,用于词频矩阵通过TfidfVectorizer函数计算出每个短语权重分值,形成XGBoost模型初始数据。
进一步的,所述XGBoost算法优化模块具体用于,将XGBoost模型初始数据,经过XGBoost模型中梯度增强算法进行模型训练,通过收缩比例因子新增加权重防止过拟合情况,训练直至达到损失函数条件,终止模型训练,得到基于XGBoost与Scikit-learn算法意图识别模型。
进一步的,所述用户意图识别模块具体包括,
用户输入语句初始化单元,用于待对用户输入语句时,对用户输入语句进行初始化操作;
用户输入语句进行特征处理单元,用于加载特征函数countVectorizer和tfidfVectorizer中间件,对用户输入语句进行特征处理;
用户输入语句分类单元,用于通过加载训练过的XGBoost模型,计算出用户输入语句的分类类别,实现用户意图识别分析。
本发明的有益效果在于:对Scikit-learn算法模型中的countVectorizer和tfidfVectorizer函数通过输入初始化数据进行训练,将训练得到的特征函数countVectorizer和tfidfVectorizer存储于本地,便于程序本地化加载运行,根据训练文本数据特征间相互关联关系,直接对用户数据进行处理,从而降低***开销,提高运行效率;将XGBoost模型初始数据,经过XGBoost模型中梯度增强算法进行模型训练,将XGBoost训练后模型存储于本地,便于运行加载训练好的模型,复用率高。
附图说明
下面结合附图详述本发明的具体结构。
图1为本发明一具体实施例的基于改进XGBoost算法的意图识别方法流程图;
图2为本发明一具体实施例的特征函数训练流程图;
图3为本发明一具体实施例的用户输入语句的意图识别过程图,
图4为本发明一具体实施例的基于改进XGBoost算法的意图识别装置模块框图;
图5为发明一具体实施例的特征函数训练模块框图;
图6为发明一具体实施例的用户意图识别模块框图;
图7为发明的基于改进XGBoost算法的意图识别模型关系图。
具体实施方式
为详细说明本发明的技术内容、构造特征、所实现目的及效果,以下结合实施方式并配合附图详予说明。
参阅图1,图7,本发明的一具体实施例为:一种基于改进XGBoost算法的意图识别方法,包括以下步骤,
S10、通过自定义词库对原始文本数据进行分词,分词结果通过停用词词库进行过滤,得到初始化数据;
本步骤中,自定义词库,停用词词库需要预先配置,自定义词库的词语是用来识别一个语句中的词进分词的依据,停用词词库是用来将不需要的词进行过滤。
S20、对Scikit-learn算法中的CountVectorizer函数和TfidfVectorizer函数通过输入初始化数据进行训练;
S30、将训练后的特征函数countVectorizer和tfidfVectorizer进行本地化存储,形成本地中间件,保留文本数据特征间相互关联关系,形成XGBoost模型初始数据;
本步骤中,提取了文本特征,例如:两个文本分别是“没有你的地方都是他乡”,“没有你的旅行都是流浪”。当停用词设置为“都是”后,第一个文本tf-idf权重:“他乡”:0.631667,“地方”:0.631667,“旅行”:0.0,“没有”:0.449436,“流浪”:0.0;第二个文本tf-idf权重:“他乡”:0.0,“地方”:0.0,“旅行”:0.631667,“没有”:0.449436,“流浪”:0.631667;
S40、将XGBoost模型初始数据,经过XGBoost模型中梯度增强算法进行模型训练,得到基于XGBoost与Scikit-learn算法意图识别模型;
S50、将训练后的XGBoost模型进行本地化存储;
本步骤中,对训练后的XGBoost模型进行本地化存储,便于运行加载训练好的模型,复用率高。
S60、基于XGBoost与Scikit-learn算法意图识别模型,对用户输入的语句进行意图识别。
本步骤中,将训练好的模型用来进行用户输入语句进行识别,计算出用户输入语句对应的分类类别,其中,分类类别是通过对原始数据源进行人工类别标注,标志格式:data=[(number1:data2),(number2:data2),...,(number(n-1):data(n-1)),(number(n):data(n))],(number是数据类别)。
本技术方案中,如图7的基于改进XGBoost算法的意图识别模型关系图,训练countVectorizer和tfidfVectorizer中间件存储于本地,便于程序本地化加载运行,根据训练文本数据特征间相互关联关系,直接对用户数据进行处理,从而降低***开销,提高运行效率;优化XGBoost模型,将XGBoost训练后模型自动存储于本地,便于运行加载训练好的模型,复用率高。
参阅图2,在一具体实施例中,所述步骤S20具体包括,
S21、通过Scikit-learn算法中的CountVectorizer函数将初始化数据转换词频矩阵;
S22、词频矩阵通过TfidfVectorizer函数计算出每个短语权重分值。
在一具体实施例中,所述步骤S40具体包括,将XGBoost模型初始数据,经过XGBoost模型中梯度增强算法进行模型训练,通过收缩比例因子新增加权重防止过拟合情况,训练直至达到损失函数条件,终止模型训练,得到基于XGBoost与Scikit-learn算法意图识别模型。
参阅图3,在一具体实施例中,所述步骤S60具体包括,
S61、待对用户输入语句时,对用户输入语句进行初始化操作;
S62、加载特征函数countVectorizer和tfidfVectorizer中间件,对用户输入语句进行特征处理;
S63、通过加载训练过的XGBoost模型,计算出用户输入语句的分类类别,实现用户意图识别分析。
参阅图4,一种基于改进XGBoost算法的意图识别装置,包括以下模块,
数据初始化模块,用于通过自定义词库对原始文本数据进行分词,分词结果通过停用词词库进行过滤,得到初始化数据;
特征函数训练模块,用于对Scikit-learn算法中的CountVectorizer函数和TfidfVectorizer函数通过输入初始化数据进行训练;
特征函数存储模块,用于将训练后的特征函数countVectorizer和tfidfVectorizer进行本地化存储,形成本地中间件,保留文本数据特征间相互关联关系,形成XGBoost模型初始数据;
XGBoost算法优化模块,用于将XGBoost模型初始数据,经过XGBoost模型中梯度增强算法进行模型训练,得到基于XGBoost与Scikit-learn算法意图识别模型;
XGBoost模型存储模块,用于将训练后的XGBoost模型进行本地化存储;
用户意图识别模块,用于基于XGBoost与Scikit-learn算法意图识别模型,对用户输入的语句进行意图识别。
参阅图5,在一具体实施例中,所述特征函数训练模块包括,
数据转换单元,用于通过Scikit-learn算法中的CountVectorizer函数将初始化数据转换词频矩阵;
短语权重计算单元,用于词频矩阵通过TfidfVectorizer函数计算出每个短语权重分值,形成XGBoost模型初始数据。
在一具体实施例中,所述XGBoost算法优化模块具体用于,将XGBoost模型初始数据,经过XGBoost模型中梯度增强算法进行模型训练,通过收缩比例因子新增加权重防止过拟合情况,训练直至达到损失函数条件,终止模型训练,得到基于XGBoost与Scikit-learn算法意图识别模型。
参阅图6,在一具体实施例中,所述用户意图识别模块具体包括,
用户输入语句初始化单元,用于待对用户输入语句时,对用户输入语句进行初始化操作;
用户输入语句进行特征处理单元,用于加载特征函数countVectorizer和tfidfVectorizer中间件,对用户输入语句进行特征处理;
用户输入语句分类单元,用于通过加载训练过的XGBoost模型,计算出用户输入语句的分类类别,实现用户意图识别分析。
本发明的有益效果在于:对Scikit-learn算法模型中的countVectorizer和tfidfVectorizer函数通过输入初始化数据进行训练,将训练得到的特征函数countVectorizer和tfidfVectorizer存储于本地,便于程序本地化加载运行,根据训练文本数据特征间相互关联关系,直接对用户数据进行处理,从而降低***开销,提高运行效率;将XGBoost模型初始数据,经过XGBoost模型中梯度增强算法进行模型训练,将XGBoost训练后模型存储于本地,便于运行加载训练好的模型,复用率高。
此处第一、第二……只代表其名称的区分,不代表它们的重要程度和位置有什么不同。
此处,上、下、左、右、前、后只代表其相对位置而不表示其绝对位置,以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种基于改进XGBoost算法的意图识别方法,其特征在于:包括以下步骤,
S10、通过自定义词库对原始文本数据进行分词,分词结果通过停用词词库进行过滤,得到初始化数据;
S20、对Scikit-learn算法中的CountVectorizer函数和TfidfVectorizer函数通过输入初始化数据进行训练;
S30、将训练后的特征函数countVectorizer和tfidfVectorizer进行本地化存储,形成本地中间件,保留文本数据特征间相互关联关系,形成XGBoost模型初始数据;
S40、将XGBoost模型初始数据,经过XGBoost模型中梯度增强算法进行模型训练,得到基于XGBoost与Scikit-learn算法意图识别模型;
S50、将训练后的XGBoost模型进行本地化存储;
S60、基于XGBoost与Scikit-learn算法意图识别模型,对用户输入的语句进行意图识别。
2.如权利要求1所述的基于改进XGBoost算法的意图识别方法,其特征在于:所述步骤S20具体包括,
S21、通过Scikit-learn算法中的CountVectorizer函数将初始化数据转换词频矩阵;
S22、词频矩阵通过TfidfVectorizer函数计算出每个短语权重分值。
3.如权利要求1所述的基于改进XGBoost算法的意图识别方法,其特征在于:所述步骤S40具体包括,将XGBoost模型初始数据,经过XGBoost模型中梯度增强算法进行模型训练,通过收缩比例因子新增加权重防止过拟合情况,训练直至达到损失函数条件,终止模型训练,得到基于XGBoost与Scikit-learn算法意图识别模型。
4.如权利要求1所述的基于改进XGBoost算法的意图识别方法,其特征在于:所述步骤S60具体包括,
S61、待对用户输入语句时,对用户输入语句进行初始化操作;
S62、加载特征函数countVectorizer和tfidfVectorizer中间件,对用户输入语句进行特征处理;
S63、通过加载训练过的XGBoost模型,计算出用户输入语句的分类类别,实现用户意图识别分析。
5.一种基于改进XGBoost算法的意图识别装置,其特征在于:包括以下模块,
数据初始化模块,用于通过自定义词库对原始文本数据进行分词,分词结果通过停用词词库进行过滤,得到初始化数据;
特征函数训练模块,用于对Scikit-learn算法中的CountVectorizer函数和TfidfVectorizer函数通过输入初始化数据进行训练;
特征函数存储模块,用于将训练后的特征函数countVectorizer和tfidfVectorizer进行本地化存储,形成本地中间件,保留文本数据特征间相互关联关系,形成XGBoost模型初始数据;
XGBoost算法优化模块,用于将XGBoost模型初始数据,经过XGBoost模型中梯度增强算法进行模型训练,得到基于XGBoost与Scikit-learn算法意图识别模型;
XGBoost模型存储模块,用于将训练后的XGBoost模型进行本地化存储;
用户意图识别模块,用于基于XGBoost与Scikit-learn算法意图识别模型,对用户输入的语句进行意图识别。
6.如权利要求5所述的基于改进XGBoost算法的意图识别装置,其特征在于:所述特征函数训练模块包括,
数据转换单元,用于通过Scikit-learn算法中的CountVectorizer函数将初始化数据转换词频矩阵;
短语权重计算单元,用于词频矩阵通过TfidfVectorizer函数计算出每个短语权重分值,形成XGBoost模型初始数据。
7.如权利要求5所述的基于改进XGBoost算法的意图识别装置,其特征在于:所述XGBoost算法优化模块具体用于,将XGBoost模型初始数据,经过XGBoost模型中梯度增强算法进行模型训练,通过收缩比例因子新增加权重防止过拟合情况,训练直至达到损失函数条件,终止模型训练,得到基于XGBoost与Scikit-learn算法意图识别模型。
8.如权利要求5所述的基于改进XGBoost算法的意图识别装置,其特征在于:所述用户意图识别模块具体包括,
用户输入语句初始化单元,用于待对用户输入语句时,对用户输入语句进行初始化操作;
用户输入语句进行特征处理单元,用于加载特征函数countVectorizer和tfidfVectorizer中间件,对用户输入语句进行特征处理;
用户输入语句分类单元,用于通过加载训练过的XGBoost模型,计算出用户输入语句的分类类别,实现用户意图识别分析。
CN201910487948.7A 2019-06-05 2019-06-05 基于改进XGBoost算法的意图识别方法及装置 Active CN110222339B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910487948.7A CN110222339B (zh) 2019-06-05 2019-06-05 基于改进XGBoost算法的意图识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910487948.7A CN110222339B (zh) 2019-06-05 2019-06-05 基于改进XGBoost算法的意图识别方法及装置

Publications (2)

Publication Number Publication Date
CN110222339A true CN110222339A (zh) 2019-09-10
CN110222339B CN110222339B (zh) 2023-04-28

Family

ID=67819468

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910487948.7A Active CN110222339B (zh) 2019-06-05 2019-06-05 基于改进XGBoost算法的意图识别方法及装置

Country Status (1)

Country Link
CN (1) CN110222339B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110990576A (zh) * 2019-12-24 2020-04-10 用友网络科技股份有限公司 基于主动学习的意图分类方法、计算机设备和存储介质
CN113779267A (zh) * 2021-09-13 2021-12-10 中国人民解放军国防科技大学 一种基于意图的星上智能任务决策方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106548210A (zh) * 2016-10-31 2017-03-29 腾讯科技(深圳)有限公司 机器学习模型训练方法及装置
US20170185904A1 (en) * 2015-12-29 2017-06-29 24/7 Customer, Inc. Method and apparatus for facilitating on-demand building of predictive models
CN108090607A (zh) * 2017-12-13 2018-05-29 中山大学 一种基于多模型堆栈融合的社交媒体用户人口属性预测方法
CN108363714A (zh) * 2017-12-21 2018-08-03 北京至信普林科技有限公司 一种方便数据分析人员使用的集成机器学习的方法及***
CN108920622A (zh) * 2018-06-29 2018-11-30 北京奇艺世纪科技有限公司 一种意图识别的训练方法、训练装置和识别装置
CN109214412A (zh) * 2018-07-12 2019-01-15 北京达佳互联信息技术有限公司 一种分类模型的训练方法和装置
CN109522556A (zh) * 2018-11-16 2019-03-26 北京九狐时代智能科技有限公司 一种意图识别方法及装置
CN109543190A (zh) * 2018-11-29 2019-03-29 北京羽扇智信息科技有限公司 一种意图识别方法、装置、设备及存储介质
CN109582793A (zh) * 2018-11-23 2019-04-05 深圳前海微众银行股份有限公司 模型训练方法、客服***及数据标注***、可读存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170185904A1 (en) * 2015-12-29 2017-06-29 24/7 Customer, Inc. Method and apparatus for facilitating on-demand building of predictive models
CN106548210A (zh) * 2016-10-31 2017-03-29 腾讯科技(深圳)有限公司 机器学习模型训练方法及装置
CN108090607A (zh) * 2017-12-13 2018-05-29 中山大学 一种基于多模型堆栈融合的社交媒体用户人口属性预测方法
CN108363714A (zh) * 2017-12-21 2018-08-03 北京至信普林科技有限公司 一种方便数据分析人员使用的集成机器学习的方法及***
CN108920622A (zh) * 2018-06-29 2018-11-30 北京奇艺世纪科技有限公司 一种意图识别的训练方法、训练装置和识别装置
CN109214412A (zh) * 2018-07-12 2019-01-15 北京达佳互联信息技术有限公司 一种分类模型的训练方法和装置
CN109522556A (zh) * 2018-11-16 2019-03-26 北京九狐时代智能科技有限公司 一种意图识别方法及装置
CN109582793A (zh) * 2018-11-23 2019-04-05 深圳前海微众银行股份有限公司 模型训练方法、客服***及数据标注***、可读存储介质
CN109543190A (zh) * 2018-11-29 2019-03-29 北京羽扇智信息科技有限公司 一种意图识别方法、装置、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
苏兵杰等: "基于XGBoost算法的电商评论文本情感识别模型", 《物联网技术》 *
谷欣: "基于MOOC课程评论的学习行为分析研究", 《中国优秀硕士学位论文全文数据库社会科学Ⅱ辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110990576A (zh) * 2019-12-24 2020-04-10 用友网络科技股份有限公司 基于主动学习的意图分类方法、计算机设备和存储介质
CN110990576B (zh) * 2019-12-24 2023-06-16 用友网络科技股份有限公司 基于主动学习的意图分类方法、计算机设备和存储介质
CN113779267A (zh) * 2021-09-13 2021-12-10 中国人民解放军国防科技大学 一种基于意图的星上智能任务决策方法
CN113779267B (zh) * 2021-09-13 2023-07-11 中国人民解放军国防科技大学 一种基于意图的星上智能任务决策方法

Also Published As

Publication number Publication date
CN110222339B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
CN107239446B (zh) 一种基于神经网络与注意力机制的情报关系提取方法
CN107818164A (zh) 一种智能问答方法及其***
CN109271506A (zh) 一种基于深度学习的电力通信领域知识图谱问答***的构建方法
CN106875014B (zh) 基于半监督学习的软件工程知识库的自动化构建实现方法
CN109255119A (zh) 一种基于分词和命名实体识别的多任务深度神经网络的句子主干分析方法及***
CN104978587B (zh) 一种基于文档类型的实体识别合作学习算法
CN107169035A (zh) 一种混合长短期记忆网络和卷积神经网络的文本分类方法
CN107463607A (zh) 结合词向量和自举学习的领域实体上下位关系获取与组织方法
CN107122349A (zh) 一种基于word2vec‑LDA模型的文本主题词提取方法
CN107679110A (zh) 结合文本分类与图片属性提取完善知识图谱的方法及装置
CN107943784A (zh) 基于生成对抗网络的关系抽取方法
CN108984661A (zh) 一种知识图谱中实体对齐方法和装置
CN106445919A (zh) 一种情感分类方法及装置
CN102662931A (zh) 一种基于协同神经网络的语义角色标注方法
CN102289522A (zh) 一种对于文本智能分类的方法
CN106886580A (zh) 一种基于深度学习的图片情感极性分析方法
CN105022740A (zh) 非结构化数据的处理方法和装置
CN103176963A (zh) 基于crf++汉语句义结构模型自动标注方法
CN109376352A (zh) 一种基于word2vec和语义相似度的专利文本建模方法
CN110297888A (zh) 一种基于前缀树与循环神经网络的领域分类方法
CN107895000A (zh) 一种基于卷积神经网络的跨领域语义信息检索方法
CN110222339A (zh) 基于改进XGBoost算法的意图识别方法及装置
CN110825850A (zh) 一种自然语言主题分类方法及装置
CN112100394A (zh) 一种用于推荐医疗专家的知识图谱构建方法
CN111460145A (zh) 一种学习资源推荐方法、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant