CN112883185A - 基于机器学习的问题推荐方法及装置 - Google Patents

基于机器学习的问题推荐方法及装置 Download PDF

Info

Publication number
CN112883185A
CN112883185A CN202110340033.0A CN202110340033A CN112883185A CN 112883185 A CN112883185 A CN 112883185A CN 202110340033 A CN202110340033 A CN 202110340033A CN 112883185 A CN112883185 A CN 112883185A
Authority
CN
China
Prior art keywords
recommendation
probability
word vector
historical
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110340033.0A
Other languages
English (en)
Inventor
刘唱
刘金山
梁侃
杨洁琼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110340033.0A priority Critical patent/CN112883185A/zh
Publication of CN112883185A publication Critical patent/CN112883185A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种基于机器学习的问题推荐方法及装置,属于人工智能技术领域。该基于机器学习的问题推荐方法包括:获取文本问题,根据文本问题生成当前词向量;将当前词向量输入基于历史词向量创建的问题推荐模型中,得到各推荐单词和各推荐单词的推荐概率;根据预设语法结构、各推荐单词和各推荐单词的推荐概率确定问题推荐文本。本发明可以实时为用户精准推荐问题,大大减少用户的编辑操作,提升手机银行服务效率,优化用户使用体验。

Description

基于机器学习的问题推荐方法及装置
技术领域
本发明涉及人工智能技术领域,具体地,涉及一种基于机器学习的问题推荐方法及装置。
背景技术
随着银行业务向线上迁移,手机银行客服的使用频率在不断提高,目前手机银行客服的服务模式以文字为主,因此手机银行即时通讯***的易用性直接影响了用户的使用体验。手机银行文字客服目前存在输入耗时长、沟通效率低的缺陷,尤其是对不熟悉智能手机的老人很不友好。
发明内容
本发明实施例的主要目的在于提供一种基于机器学习的问题推荐方法及装置,以实时为用户精准推荐问题,大大减少用户的编辑操作,提升手机银行服务效率,优化用户使用体验。
为了实现上述目的,本发明实施例提供一种基于机器学习的问题推荐方法,包括:
获取文本问题,根据文本问题生成当前词向量;
将当前词向量输入基于历史词向量创建的问题推荐模型中,得到各推荐单词和各推荐单词的推荐概率;
根据预设语法结构、各推荐单词和各推荐单词的推荐概率确定问题推荐文本。
本发明实施例还提供一种基于机器学习的问题推荐装置,包括:
词向量生成模块,用于获取文本问题,根据文本问题生成当前词向量;
推荐单词概率模块,用于将当前词向量输入基于历史词向量创建的问题推荐模型中,得到各推荐单词和各推荐单词的推荐概率;
问题推荐文本模块,用于根据预设语法结构、各推荐单词和各推荐单词的推荐概率确定问题推荐文本。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并在处理器上运行的计算机程序,处理器执行计算机程序时实现所述的基于机器学习的问题推荐方法的步骤。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现所述的基于机器学习的问题推荐方法的步骤。
本发明实施例的基于机器学习的问题推荐方法及装置先根据文本问题生成当前词向量,再将当前词向量输入基于历史词向量创建的问题推荐模型中,得到各推荐单词和各推荐单词的推荐概率以确定问题推荐文本,可以实时为用户精准推荐问题,大大减少用户的编辑操作,提升手机银行服务效率,优化用户使用体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中基于机器学习的问题推荐方法的流程图;
图2是本发明实施例中S103的流程图;
图3是本发明实施例中创建问题推荐模型的流程图;
图4是本发明另一实施例中创建问题推荐模型的流程图;
图5是本发明实施例中S301的流程图;
图6是本发明实施例中词向量和特征的示意图;
图7是待推荐文本及推荐概率的示意图;
图8是本发明实施例中根据预设语法结构将推荐单词组成问题推荐文本的示例图;
图9是本发明第一实施例中手机银行的银行推荐功能页面示例图;
图10是本发明第二实施例中手机银行的银行推荐功能页面示例图;
图11是本发明实施例中基于机器学习的问题推荐装置的结构框图;
图12是本发明实施例中计算机设备的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本领域技术人员知道,本发明的实施方式可以实现为一种***、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
鉴于现有技术存在输入耗时长、沟通效率低的缺陷,对不熟悉智能手机的老人很不友好,本发明实施例提供一种基于机器学***、优化用户使用体验有着重要意义。
本发明为使用手机银行进行文字咨询的用户提供快捷语推荐功能,用户在使用文字向客服咨询的过程中,可直接点击推荐的问题一键发送。由于问题推荐需要满足相关性、个性化等需求,因此需要在服务端建立快捷语推荐语料库,在语料库中存储推荐的文本以及文本特征。为了丰富推荐语内容,该语料库以词语的方式对文本进行存储,并根据语料库训练推荐模型,以词语拼接的模式为用户提供精准的问题文本推荐。该语料库及模型也可以用于其他文字沟通渠道,例如网上银行客服、官方公众号、小程序以及常见问题推荐页面等。以下结合附图对本发明进行详细说明。
本发明主要涵盖以下流程:收集用户咨询过程中的文本数据和相关业务数据,将文本数据进行分词处理、梳理、特征提取和存储,构成快捷语推荐语料库,并使用该语料库作为训练数据集,运用机器学习算法生成问题推荐模型以确定问题推荐文本,在用户咨询的过程中实时为其推荐可能需要咨询的问题。
图1是本发明实施例中基于机器学习的问题推荐方法的流程图。如图1所示,基于机器学习的问题推荐方法包括:
S101:获取文本问题,根据文本问题生成当前词向量。
S102:将当前词向量输入基于历史词向量创建的问题推荐模型中,得到各推荐单词和各推荐单词的推荐概率。
S103:根据预设语法结构、各推荐单词和各推荐单词的推荐概率确定问题推荐文本。
图2是本发明实施例中S103的流程图。图7是待推荐文本及推荐概率的示意图。如图2和图7所示,S103包括:
S201:根据预设语法结构和各推荐单词合成待推荐文本。
具体实施时,可以根据预设语法结构和各推荐单词合成最可能被提问的多个待推荐文本。
S202:根据各推荐单词的推荐概率确定待推荐文本的推荐概率。
S203:根据待推荐文本的推荐概率从待推荐文本中选择问题推荐文本。
具体实施时,可以对推荐概率按照从大到小的顺序进行排序,确定排序在预设阈值之前的待推荐文本为问题推荐文本。
图8是本发明实施例中根据预设语法结构将推荐单词组成问题推荐文本的示例图。如图8所示,用户的上一个问题“如何办理***”中的“***”可以关联到和***相关的下一问题,此时通过本发明可以将推荐单词“***”、“种类”和“有哪些”组成“***种类有哪些?”的问题推荐文本,将推荐单词“***”、“年费”和“是多少”组成“***年费是多少?”的问题推荐文本,将推荐单词“***”、“额度”和“是多少”组成“***|额度|是多少?”的问题推荐文本并展示给用户。当用户选择“***年费是多少?”时,“***年费是多少?”中的“年费”可以关联到和年费相关的下一问题,此时通过本发明可以将推荐单词“年费”、“怎样”和“缴纳”组成“年费怎样缴纳?”的问题推荐文本,将推荐单词“年费”、“有什么”和“优惠”组成“年费有什么优惠?”的问题推荐文本并展示给用户。
图1所示的基于机器学习的问题推荐方法的执行主体可以为计算机。由图1所示的流程可知,本发明实施例的基于机器学习的问题推荐方法先根据文本问题生成当前词向量,再将当前词向量输入基于历史词向量创建的问题推荐模型中,得到各推荐单词和各推荐单词的推荐概率以确定问题推荐文本,可以实时为用户精准推荐问题,大大减少用户的编辑操作,提升手机银行服务效率,优化用户使用体验。
图3是本发明实施例中创建问题推荐模型的流程图。图4是本发明另一实施例中创建问题推荐模型的流程图。如图3-图4所示,基于历史词向量创建问题推荐模型包括:
S301:确定历史问题中历史词向量的各特征。
在执行S301之前,还包括:收集咨询过程中用户发送过的历史问题作为初始数据,对其进行分词、去重等操作,生成词库,并将词库中的词转换为历史词向量,得到训练集。
图6是本发明实施例中词向量和特征的示意图,如图6所示,特征包括:训练集概率特征、用户咨询概率特征、业务咨询概率特征、业务阶段概率特征和关联特征。
图5是本发明实施例中S301的流程图。如图5所示,S301包括:
S401:确定各历史词向量在训练集的出现概率为各历史词向量的训练集概率特征。
S402:确定各历史词向量在各用户咨询历史的出现概率为各历史词向量的用户咨询概率特征。
表1是用户咨询概率特征表。如表1所示,具体实施时,可以根据各历史词向量在各用户咨询历史的出现概率生成“用户数×训练集大小”维度的向量。
表1
用户1 用户2 ……
词向量1 0.51 0.22 ……
词向量2 0.1 0.45 ……
…… …… …… ……
S403:确定各历史词向量在各业务咨询历史的出现概率为各历史词向量的业务咨询概率特征。
表2是业务咨询概率特征表。如表2所示,具体实施时,可以根据各历史词向量在各业务咨询历史的出现概率生成“业务数×训练集大小”维度的向量。
表2
***业务 贷款业务 ……
词向量1 0.51 0.22 ……
词向量2 0.1 0.45 ……
…… …… …… ……
S404:确定各历史词向量在各业务阶段的出现概率为各历史词向量的业务阶段概率特征。
表3是业务阶段概率特征表。如表3所示,业务阶段概率特征用于标记该历史词向量属于业务办理过程中的哪个阶段,例如:业务前咨询、审批中和审批完成等。具体实施时,可以根据各历史词向量在各业务阶段的出现概率生成“流程数×训练集大小”维度的向量。
表3
Figure BDA0002998891210000051
Figure BDA0002998891210000061
S405:根据各历史词向量之间的共现概率和顺序标记确定各历史词向量的关联特征。
表4是词向量1的关联特征表。关联特征用于基于用户已发送的文本做出后续推荐判断。如表4所示,词向量1与词向量3之间的共现概率为0.5,代表词向量1与词向量3出现在同一历史问题的概率为0.5;词向量1与词向量3之间的顺序标记为1,代表词向量3出现在词向量1之前;词向量1与词向量4之间的顺序标记为-1,代表词向量3出现在词向量1之后;词向量1与词向量2之间的顺序标记为0,代表词向量2与词向量1不在同一历史问题中出现。
表4
词向量2 词向量3 词向量4 ……
共现概率 0 0.5 0.2 ……
顺序标记 0 1 -1 ……
执行如下迭代处理:
S302:根据历史问题中历史词向量的各特征和各特征的特征权重确定训练集中各历史词向量的推荐概率。
S303:根据训练集中各历史词向量的推荐概率与对应的各实际词向量确定损失函数。
S304:判断损失函数是否小于或等于预设损失函数阈值。
S305:当损失函数小于或等于预设损失函数阈值时,根据各特征的特征权重创建问题推荐模型。
S306:当损失函数大于预设损失函数阈值时,根据损失函数更新各特征的特征权重,继续执行迭代处理。
本发明实施例的具体流程如下:
1、确定各历史词向量在训练集的出现概率为各历史词向量的训练集概率特征,确定各历史词向量在各用户咨询历史的出现概率为各历史词向量的用户咨询概率特征,确定各历史词向量在各业务咨询历史的出现概率为各历史词向量的业务咨询概率特征,确定各历史词向量在各业务阶段的出现概率为各历史词向量的业务阶段概率特征,根据各历史词向量之间的共现概率和顺序标记确定各历史词向量的关联特征。
2、根据历史问题中历史词向量的各特征和各特征的特征权重确定训练集中各历史词向量的推荐概率。
3、根据训练集中各历史词向量的推荐概率与对应的各实际词向量确定损失函数。当损失函数小于或等于预设损失函数阈值时,根据各特征的特征权重创建问题推荐模型,否则根据损失函数更新各特征的特征权重,返回步骤2。
4、获取文本问题,根据文本问题生成当前词向量。
5、将当前词向量输入问题推荐模型中,得到各推荐单词和各推荐单词的推荐概率。
6、根据预设语法结构和各推荐单词合成待推荐文本,根据各推荐单词的推荐概率确定待推荐文本的推荐概率。
7、根据待推荐文本的推荐概率从待推荐文本中选择问题推荐文本。
图9是本发明第一实施例中手机银行的银行推荐功能页面示例图。图10是本发明第二实施例中手机银行的银行推荐功能页面示例图。如图9-图10所示,首先为用户推荐几个最常被咨询的问题,例如:如何办理***、如何办理存款等。用户开始咨询后,本发明根据用户提出的问题推荐下一个问题(问题推荐文本)。例如用户首先咨询如何办理***,本发明将该文本问题输入问题推荐模型,为用户推荐***相关的问题,例如:***额度有多少、怎样使用***分期等。
综上,本发明实施例的基于机器学习的问题推荐方法先根据文本问题生成当前词向量,再将当前词向量输入基于历史词向量创建的问题推荐模型中,得到各推荐单词和各推荐单词的推荐概率以确定问题推荐文本,可以实时为用户精准推荐问题,大大减少用户的编辑操作,提升用户在使用手机银行时的输入体验和手机银行服务效率,优化用户使用体验。
基于同一发明构思,本发明实施例还提供了一种基于机器学习的问题推荐装置,由于该装置解决问题的原理与基于机器学习的问题推荐方法相似,因此该装置的实施可以参见方法的实施,重复之处不再赘述。
图11是本发明实施例中基于机器学习的问题推荐装置的结构框图。如图11所示,基于机器学习的问题推荐装置包括:
词向量生成模块,用于获取文本问题,根据文本问题生成当前词向量;
推荐单词概率模块,用于将当前词向量输入基于历史词向量创建的问题推荐模型中,得到各推荐单词和各推荐单词的推荐概率;
问题推荐文本模块,用于根据预设语法结构、各推荐单词和各推荐单词的推荐概率确定问题推荐文本。
在其中一种实施例中,问题推荐文本模块包括:
待推荐文本合成单元,用于根据预设语法结构和各推荐单词合成待推荐文本;
文本推荐概率单元,用于根据各推荐单词的推荐概率确定待推荐文本的推荐概率;
问题推荐文本单元,用于根据待推荐文本的推荐概率从待推荐文本中选择问题推荐文本。
在其中一种实施例中,还包括:
特征确定模块,用于确定历史问题中历史词向量的各特征;
问题推荐模型创建模块,用于执行如下迭代处理:
根据历史问题中历史词向量的各特征和各特征的特征权重确定训练集中各历史词向量的推荐概率;
根据训练集中各历史词向量的推荐概率与对应的各实际词向量确定损失函数;
当损失函数小于或等于预设损失函数阈值时,根据各特征的特征权重创建问题推荐模型,否则根据损失函数更新各特征的特征权重,继续执行迭代处理。
在其中一种实施例中,特征包括:训练集概率特征、用户咨询概率特征、业务咨询概率特征、业务阶段概率特征和关联特征;
特征确定模块包括:
训练集概率特征单元,用于确定各历史词向量在所述训练集的出现概率为各历史词向量的训练集概率特征;
用户咨询概率特征单元,用于确定各历史词向量在各用户咨询历史的出现概率为各历史词向量的用户咨询概率特征;
业务咨询概率特征单元,用于确定各历史词向量在各业务咨询历史的出现概率为各历史词向量的业务咨询概率特征;
业务阶段概率特征单元,用于确定各历史词向量在各业务阶段的出现概率为各历史词向量的业务阶段概率特征;
关联特征单元,用于根据各历史词向量之间的共现概率和顺序标记确定各历史词向量的关联特征。
综上,本发明实施例的基于机器学习的问题推荐装置先根据文本问题生成当前词向量,再将当前词向量输入基于历史词向量创建的问题推荐模型中,得到各推荐单词和各推荐单词的推荐概率以确定问题推荐文本,可以实时为用户精准推荐问题,大大减少用户的编辑操作,提升用户在使用手机银行时的输入体验和手机银行服务效率,优化用户使用体验。
本发明实施例还提供能够实现上述实施例中的基于机器学习的问题推荐方法中全部步骤的一种计算机设备的具体实施方式。图12是本发明实施例中计算机设备的结构框图,参见图12,所述计算机设备具体包括如下内容:
处理器(processor)1201和存储器(memory)1202。
所述处理器1201用于调用所述存储器1202中的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中的基于机器学习的问题推荐方法中的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
获取文本问题,根据文本问题生成当前词向量;
将当前词向量输入基于历史词向量创建的问题推荐模型中,得到各推荐单词和各推荐单词的推荐概率;
根据预设语法结构、各推荐单词和各推荐单词的推荐概率确定问题推荐文本。
综上,本发明实施例的计算机设备先根据文本问题生成当前词向量,再将当前词向量输入基于历史词向量创建的问题推荐模型中,得到各推荐单词和各推荐单词的推荐概率以确定问题推荐文本,可以实时为用户精准推荐问题,大大减少用户的编辑操作,提升用户在使用手机银行时的输入体验和手机银行服务效率,优化用户使用体验。
本发明实施例还提供能够实现上述实施例中的基于机器学习的问题推荐方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的基于机器学习的问题推荐方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
获取文本问题,根据文本问题生成当前词向量;
将当前词向量输入基于历史词向量创建的问题推荐模型中,得到各推荐单词和各推荐单词的推荐概率;
根据预设语法结构、各推荐单词和各推荐单词的推荐概率确定问题推荐文本。
综上,本发明实施例的计算机可读存储介质先根据文本问题生成当前词向量,再将当前词向量输入基于历史词向量创建的问题推荐模型中,得到各推荐单词和各推荐单词的推荐概率以确定问题推荐文本,可以实时为用户精准推荐问题,大大减少用户的编辑操作,提升用户在使用手机银行时的输入体验和手机银行服务效率,优化用户使用体验。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块(illustrative logical block),单元,和步骤可以通过电子硬件、电脑软件,或两者的结合进行实现。为清楚展示硬件和软件的可替换性(interchangeability),上述的各种说明性部件(illustrative components),单元和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个***的设计要求。本领域技术人员可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为超出本发明实施例保护的范围。
本发明实施例中所描述的各种说明性的逻辑块,或单元,或装置都可以通过通用处理器,数字信号处理器,专用集成电路(ASIC),现场可编程门阵列或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。
本发明实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件模块、或者这两者的结合。软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中,ASIC可以设置于用户终端中。可选地,处理器和存储媒介也可以设置于用户终端中的不同的部件中。
在一个或多个示例性的设计中,本发明实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现,这些功能可以存储与电脑可读的媒介上,或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如,这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置,或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外,任何连接都可以被适当地定义为电脑可读媒介,例如,如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电缆、双绞线、数字用户线(DSL)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、DVD、软盘和蓝光光盘,磁盘通常以磁性复制数据,而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。

Claims (10)

1.一种基于机器学习的问题推荐方法,其特征在于,包括:
获取文本问题,根据所述文本问题生成当前词向量;
将所述当前词向量输入基于历史词向量创建的问题推荐模型中,得到各推荐单词和各推荐单词的推荐概率;
根据预设语法结构、各推荐单词和各推荐单词的推荐概率确定问题推荐文本。
2.根据权利要求1所述的基于机器学习的问题推荐方法,其特征在于,根据预设语法结构、各推荐单词和各推荐单词的推荐概率确定问题推荐文本包括:
根据预设语法结构和各推荐单词合成待推荐文本;
根据各推荐单词的推荐概率确定待推荐文本的推荐概率;
根据所述待推荐文本的推荐概率从待推荐文本中选择问题推荐文本。
3.根据权利要求1所述的基于机器学习的问题推荐方法,其特征在于,基于历史词向量创建问题推荐模型包括:
确定历史问题中历史词向量的各特征;
执行如下迭代处理:
根据历史问题中历史词向量的各特征和各特征的特征权重确定训练集中各历史词向量的推荐概率;
根据训练集中各历史词向量的推荐概率与对应的各实际词向量确定损失函数;
当所述损失函数小于或等于预设损失函数阈值时,根据各特征的特征权重创建所述问题推荐模型,否则根据所述损失函数更新各特征的特征权重,继续执行所述迭代处理。
4.根据权利要求3所述的基于机器学习的问题推荐方法,其特征在于,所述特征包括:训练集概率特征、用户咨询概率特征、业务咨询概率特征、业务阶段概率特征和关联特征;
确定历史问题中历史词向量的各特征包括:
确定各历史词向量在所述训练集的出现概率为各历史词向量的训练集概率特征;
确定各历史词向量在各用户咨询历史的出现概率为各历史词向量的用户咨询概率特征;
确定各历史词向量在各业务咨询历史的出现概率为各历史词向量的业务咨询概率特征;
确定各历史词向量在各业务阶段的出现概率为各历史词向量的业务阶段概率特征;
根据各历史词向量之间的共现概率和顺序标记确定各历史词向量的关联特征。
5.一种基于机器学习的问题推荐装置,其特征在于,包括:
词向量生成模块,用于获取文本问题,根据所述文本问题生成当前词向量;
推荐单词概率模块,用于将所述当前词向量输入基于历史词向量创建的问题推荐模型中,得到各推荐单词和各推荐单词的推荐概率;
问题推荐文本模块,用于根据预设语法结构、各推荐单词和各推荐单词的推荐概率确定问题推荐文本。
6.根据权利要求5所述的基于机器学习的问题推荐装置,其特征在于,问题推荐文本模块包括:
待推荐文本合成单元,用于根据预设语法结构和各推荐单词合成待推荐文本;
文本推荐概率单元,用于根据各推荐单词的推荐概率确定待推荐文本的推荐概率;
问题推荐文本单元,用于根据所述待推荐文本的推荐概率从待推荐文本中选择问题推荐文本。
7.根据权利要求5所述的基于机器学习的问题推荐装置,其特征在于,还包括:
特征确定模块,用于确定历史问题中历史词向量的各特征;
问题推荐模型创建模块,用于执行如下迭代处理:
根据历史问题中历史词向量的各特征和各特征的特征权重确定训练集中各历史词向量的推荐概率;
根据训练集中各历史词向量的推荐概率与对应的各实际词向量确定损失函数;
当所述损失函数小于或等于预设损失函数阈值时,根据各特征的特征权重创建所述问题推荐模型,否则根据所述损失函数更新各特征的特征权重,继续执行所述迭代处理。
8.根据权利要求7所述的基于机器学习的问题推荐装置,其特征在于,所述特征包括:训练集概率特征、用户咨询概率特征、业务咨询概率特征、业务阶段概率特征和关联特征;
所述特征确定模块包括:
训练集概率特征单元,用于确定各历史词向量在所述训练集的出现概率为各历史词向量的训练集概率特征;
用户咨询概率特征单元,用于确定各历史词向量在各用户咨询历史的出现概率为各历史词向量的用户咨询概率特征;
业务咨询概率特征单元,用于确定各历史词向量在各业务咨询历史的出现概率为各历史词向量的业务咨询概率特征;
业务阶段概率特征单元,用于确定各历史词向量在各业务阶段的出现概率为各历史词向量的业务阶段概率特征;
关联特征单元,用于根据各历史词向量之间的共现概率和顺序标记确定各历史词向量的关联特征。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4任一项所述的基于机器学习的问题推荐方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4任一项所述的基于机器学习的问题推荐方法的步骤。
CN202110340033.0A 2021-03-30 2021-03-30 基于机器学习的问题推荐方法及装置 Pending CN112883185A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110340033.0A CN112883185A (zh) 2021-03-30 2021-03-30 基于机器学习的问题推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110340033.0A CN112883185A (zh) 2021-03-30 2021-03-30 基于机器学习的问题推荐方法及装置

Publications (1)

Publication Number Publication Date
CN112883185A true CN112883185A (zh) 2021-06-01

Family

ID=76039990

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110340033.0A Pending CN112883185A (zh) 2021-03-30 2021-03-30 基于机器学习的问题推荐方法及装置

Country Status (1)

Country Link
CN (1) CN112883185A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011053992A (ja) * 2009-09-02 2011-03-17 Nippon Telegr & Teleph Corp <Ntt> 質問推薦装置及び方法及びプログラム
CN102722558A (zh) * 2012-05-29 2012-10-10 百度在线网络技术(北京)有限公司 一种为用户推荐提问的方法和装置
CN104462553A (zh) * 2014-12-25 2015-03-25 北京奇虎科技有限公司 问答页面相关问题推荐方法及装置
CN106557563A (zh) * 2016-11-15 2017-04-05 北京百度网讯科技有限公司 基于人工智能的查询语句推荐方法及装置
WO2020082561A1 (zh) * 2018-10-25 2020-04-30 平安科技(深圳)有限公司 文本输入的预测方法、装置、计算机设备和存储介质
CN111104585A (zh) * 2018-10-25 2020-05-05 北京嘀嘀无限科技发展有限公司 一种问题推荐方法及装置
CN111507366A (zh) * 2019-11-07 2020-08-07 马上消费金融股份有限公司 推荐概率模型的训练方法、智能补全方法及相关装置
CN111737595A (zh) * 2020-06-24 2020-10-02 支付宝(杭州)信息技术有限公司 一种候选词推荐方法、词库排序模型训练方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011053992A (ja) * 2009-09-02 2011-03-17 Nippon Telegr & Teleph Corp <Ntt> 質問推薦装置及び方法及びプログラム
CN102722558A (zh) * 2012-05-29 2012-10-10 百度在线网络技术(北京)有限公司 一种为用户推荐提问的方法和装置
CN104462553A (zh) * 2014-12-25 2015-03-25 北京奇虎科技有限公司 问答页面相关问题推荐方法及装置
CN106557563A (zh) * 2016-11-15 2017-04-05 北京百度网讯科技有限公司 基于人工智能的查询语句推荐方法及装置
WO2020082561A1 (zh) * 2018-10-25 2020-04-30 平安科技(深圳)有限公司 文本输入的预测方法、装置、计算机设备和存储介质
CN111104585A (zh) * 2018-10-25 2020-05-05 北京嘀嘀无限科技发展有限公司 一种问题推荐方法及装置
CN111507366A (zh) * 2019-11-07 2020-08-07 马上消费金融股份有限公司 推荐概率模型的训练方法、智能补全方法及相关装置
CN111737595A (zh) * 2020-06-24 2020-10-02 支付宝(杭州)信息技术有限公司 一种候选词推荐方法、词库排序模型训练方法及装置

Similar Documents

Publication Publication Date Title
US20220337538A1 (en) Customized message suggestion with user embedding vectors
CN111625632A (zh) 一种问答对推荐方法、装置、设备及存储介质
CN112380853B (zh) 业务场景交互方法、装置、终端设备及存储介质
CN112434501B (zh) 工单智能生成的方法、装置、电子设备及介质
CN108256098A (zh) 一种确定用户评论情感倾向的方法及装置
WO2021218027A1 (zh) 智能面试中专业术语的提取方法、装置、设备及介质
CN106095972B (zh) 一种信息分类方法及装置
CN117520503A (zh) 基于llm模型的金融客服对话生成方法、装置、设备及介质
CN114511393B (zh) 财务数据处理方法及***
CN113486166B (zh) 智能客服机器人的构建方法、装置、设备以及存储介质
CN117609444B (zh) 一种基于大模型的搜索问答方法
CN113887202A (zh) 文本纠错方法、装置、计算机设备及存储介质
CN109214640A (zh) 指标结果的确定方法、设备及计算机可读存储介质
CN111309882B (zh) 用于实现智能客服问答的方法和装置
CN117520523A (zh) 数据处理方法、装置、设备及存储介质
CN111709825A (zh) 异常产品识别方法及***
CN112883185A (zh) 基于机器学习的问题推荐方法及装置
CN113505293A (zh) 信息推送方法、装置、电子设备及存储介质
CN112597295A (zh) 摘要提取方法、装置、计算机设备和存储介质
CN110675155A (zh) 风险识别方法和装置
CN113284498B (zh) 客户意图识别方法及装置
CN116151241B (zh) 一种实体识别方法及装置
CN115762470A (zh) 基于ai的模板式话术的实现方法及相关产品
CN111581336A (zh) 信息输出方法、装置、电子设备及存储介质
CN113535805A (zh) 数据挖掘方法及相关装置和电子设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination