CN117056483A - 一种问答方法、装置、电子设备以及存储介质 - Google Patents

一种问答方法、装置、电子设备以及存储介质 Download PDF

Info

Publication number
CN117056483A
CN117056483A CN202311016285.3A CN202311016285A CN117056483A CN 117056483 A CN117056483 A CN 117056483A CN 202311016285 A CN202311016285 A CN 202311016285A CN 117056483 A CN117056483 A CN 117056483A
Authority
CN
China
Prior art keywords
vector
text
processed
determining
question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311016285.3A
Other languages
English (en)
Inventor
汤荷
杨沛
侯波
张新晓
蒋生平
张蒙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Iss Technology Co ltd
Original Assignee
Iss Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Iss Technology Co ltd filed Critical Iss Technology Co ltd
Priority to CN202311016285.3A priority Critical patent/CN117056483A/zh
Publication of CN117056483A publication Critical patent/CN117056483A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种问答方法、装置、电子设备以及存储介质。该方法包括:确定与待处理问题匹配的问题向量;在预先设置的向量数据库的各文本向量中,确定与所述问题向量匹配的至少一个目标文本向量;将所述待处理问题和所述目标文本向量对应的文本输入至预先训练得到的大语言模型中,得到所述大语言模型输出的与待处理问题匹配的答案。本发明能够准确、高效的解答用户提出的问题。

Description

一种问答方法、装置、电子设备以及存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种问答方法、装置、电子设备以及存储介质。
背景技术
随着自然语言处理技术的发展和进步,自动问答***在辅助用户学习方面起到了越来越重要的作用。
现有的自动问答***,通常是基于文本的相似度,检索得到问题的答案。但是,用户输入的问题可能存在输入错误、缺词少句等情况,对于问题输入存在错误,或者较为复杂的问题,现有的自动问答***的准确率表现欠佳。
发明内容
本发明提供了一种问答方法、装置、电子设备以及存储介质,以实现准确、高效的解答用户提出的问题。
第一方面,本发明实施例提供了一种问答方法,该方法包括:
确定与待处理问题匹配的问题向量;
在预先设置的向量数据库的各文本向量中,确定与所述问题向量匹配的至少一个目标文本向量;
将所述待处理问题和所述目标文本向量对应的文本输入至预先训练得到的大语言模型中,得到所述大语言模型输出的与待处理问题匹配的答案。
第二方面,本发明实施例还提供了一种问答装置,该装置包括:
问题向量确定模块,用于确定与待处理问题匹配的问题向量;
目标文本向量确定模块,用于在预先设置的向量数据库的各文本向量中,确定与所述问题向量匹配的至少一个目标文本向量;
答案确定模块,用于将所述待处理问题和所述目标文本向量对应的文本输入至预先训练得到的大语言模型中,得到所述大语言模型输出的与待处理问题匹配的答案。
第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例中任一所述的问答方法。
第四方面,本发明实施例还提供了一种存储计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明实施例中任一所述的问答方法。
本发明实施例的技术方案,通过将待处理问题转换为问题向量,并在预先设置的向量数据库中确定与问题向量匹配的目标文本向量,将待处理问题和目标文本向量对应的文本输入至预先训练的大语言模型中,得到待处理问题的答案。解决了现有技术在问题输入存在错误或者问题较为复杂的情况下,现有的自动问答***的准确率不高的问题,能够准确、高效的解答用户提出的问题。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的一种问答方法的流程图;
图2为本发明实施例二提供的另一种问答方法的流程图;
图3为本发明实施例三提供的一种问答装置的结构示意图;
图4为本发明实施例四提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1为本发明实施例一提供了一种问答方法的流程图,本实施例可适用于自动解答用户提出问题的情况。该方法可以由问答装置来执行,该问答装置可以采用硬件和/或软件的形式实现,该问答装置可配置于电子设备中。
如图1所示,该方法包括:
S110、确定与待处理问题匹配的问题向量。
其中,待处理问题可以为用户通过用户交互界面输入的问题信息,问题信息可以为文字、图片或者语音,其中,文字可以为通过输入法输入的字母、数字或者拼音等转换得到的文字。例如,用户可以在用户交互界面通过输入法输入拼音“yuandemianjigongshi”,并选择输入法根据拼音转换得到的文字“圆的面积公式”。待处理问题也可以为用户通过电子设备中的语音模块输入的语音信息,待处理问题还可以为通过对题目进行拍照得到的图片。进一步的,用户输入的文字可以是多语种的文本,本实施例支持多语种环境下的问题解答。本实施例对待处理问题的具体表现形式不进行限制。
进一步的,S110又可以包括:确定待处理问题;若确定所述待处理问题为非文本数据,则将所述待处理问题转换为文本数据;确定与文本数据形式的待处理问题匹配的问题向量。
非文本数据指用户在用户交互界面输入的语音信息及图片信息。
当待处理问题为非文本数据,需要将非文本数据转化为文本数据,具体的,若待处理问题为语音,则通过语音转文字方法将语音转换为文字,语音转文字可以通过循环神经网络语言模型(Recurrent neural network based language model,RNNLM)、隐马尔可夫模型(Hidden Markov Model,HMM)、深度置信网络(Deep Belief Network,DBN)等实现,但是本实施例对语音转文字的具体方式不进行限制。若待处理问题为图片,则通过文字识别方法将图片转换为文字,文字识别方法可以为OCR(Optical Character Recognition,光学字符识别)、端到端文本识别网络(Convolutional Recurrent Neural Network,CRNN)等,同样的,本实施例对文字识别方法不进行限制。
根据用户在用户交互界面输入的待处理问题,若用户输入的待处理问题为文本数据,则确定该待处理问题匹配的问题向量,若为非文本数据,则先将非文本数据转化为文本数据,再确定该待处理问题匹配的问题向量。确定待处理问题匹配的问题向量,可以将输入的文本数据或者转化后的文本数据输入到预先训练的向量转化模型中,将文本数据转换为问题向量,也可以通过向量转换算法,将输入的文本数据或者转化后的文本数据转换为问题向量,本实施例对向量转换的具体方式不进行限制。其中,问题向量可以为能够表示与文本数据对应的待处理问题的唯一标识。
进一步的,所述向量转化模型可以为LLaMA模型(Large Language Model MetaAI,Meta AI大语言模型),LLaMA模型使用Transformer构架,通过多层的自注意力层和前馈神经网络层,能够有效地学习待处理问题与问题向量之间的关系,Transformer构架是一个利用注意力机制来提高模型训练速度的模型。
所述向量转化模型还可以为ChatGPT(Chat Generative Pre-TrainedTransformer,聊天生成式预训练Transformer)是一种基于互联网可用数据训练的文本生成深度学习模型。它用于问答、文本摘要生成、机器翻译、分类、代码生成和对话AI。
上述步骤,通过将待处理问题转化为向量,能够便于问题的储存和检索。
S120、在预先设置的向量数据库的各文本向量中,确定与所述问题向量匹配的至少一个目标文本向量。
向量数据库为预先存储的若干标准知识文本及其对应的文本向量所组成的数据库。目标文本向量可以为向量数据库中与问题向量相似或者相关的文本向量。将待处理问题的问题向量与预先设置的向量数据库中的各个文本向量进行对比,将相关或者相似的文本向量作为目标文本向量。
进一步的,所述向量数据库的设置过程包括:确定标准知识文本,以及与所述标准知识文本匹配的文本向量;将标准知识文本和与所述标准知识文本匹配的文本向量存储到向量数据库中。
标准知识文本来源可以包括但不限于网络内容、书籍、新闻文章、试卷等。同样的,与标准知识文本匹配的文本向量可以为将标准知识文本输入至预先训练得到的向量转化模型而得到,或者根据向量转换算法对标准知识文本进行处理而得到。
进一步的,标准知识文本和与标准知识文本匹配的文本向量可以通过索引或者字典的形式存储到数据库中。例如,以布尔数组的形式,如标准知识文本={“标准知识文本1”,“标准知识文本2”,“标准知识文本3”,……},文本向量={“文本向量1”,“文本向量2”,“文本向量3”,……};也可以以字典的形式,如dic={文本向量1:标准知识文本1,文本向量2:标准知识文本2,……}。
进一步的,确定标准知识文本,包括:确定标准知识数据;若确定所述标准知识数据为非文本数据,则将所述标准知识数据转换为标准知识文本。
标准知识数据可以为用户在用户交互界面输入的内容。若标准知识数据为非文本数据,即为语音或图片数据,则将非文本数据转换为标准知识文本。
采用上述步骤,将非文本数据转化为标准知识文本,能够提高后续大语言模型的计算效率,也能够保证存储在向量数据库中时,占用较小的内存,采用统一的形式进行保存,方便检索,提高了检索的效率。
进一步的,S120又可以包括:确定所述问题向量与预先设置的向量数据库中各文本向量的相似度;将相似度满足预设相似度条件的文本向量作为目标文本向量。
相似度用于表征两个事物的相似性,可采用百分比的形式进行表示。预设相似度条件为预先设定的能够筛选向量数据库中文本向量与问题向量是否相关的标准。示例性的,可以预先设置相似度阈值,若文本向量与问题向量的相似度大于或等于相似度阈值,则确定该文本向量的相似度满足预设相似度条件,将该文本向量作为目标文本向量。进一步的,还可以预先设置第一预设数量,若相似度满足预设相似度条件的文本向量的数量大于或等于第一预设数量,则将相似度满足预设相似度条件的各文本向量按照相似度由大到小的顺序进行排序,选择前第一预设数量个文本向量作为目标文本向量。进一步的,还可以预先设置第二预设数量,第一预设数量和第二预设数量可以相同或者不同。若向量数据库中不存在相似度满足预设相似度条件的文本向量,则对各文本向量,根据其与问题向量的相似度大小进行排序,选择前第二预设数量个文本向量作为目标文本向量。
需要进行说明的是,上述说明仅为在向量数据库的各文本向量中确定目标文本向量的方式的示例,本实施例对确定目标文本向量的具体方式不进行限制。
S130、将所述待处理问题和所述目标文本向量对应的文本输入至预先训练得到的大语言模型中,得到所述大语言模型输出的与待处理问题匹配的答案。
大语言模型(Large Language Model,LLM)是一种人工智能模型,旨在理解和生成人类语言,大语言模型基于大量的文本数据进行模型训练得到。
在本实施例中,基于大语言模型训练得到与待处理问题匹配的答案,由于大语言模型使用深度学习和神经网络技术,通过对大规模待处理问题及其匹配的答案进行训练,能够找到问题和答案之间潜在关联。因此,本实施例通过预先训练得到的大语言模型对用户提出的问题进行解答,可以学习和解答用户提出的问题,提供更加准确的答案。并且,由于大语言模型具有上下文理解能力,因此,在用户输入错误、拼写错误等情况下能够有效纠错。
进一步的,大语言模型可以预先根据样本问答以及样本文本进行训练。具体的,将样本问题和样本文本输入至大语言模型中,根据大语言模型输出的预测答案和样本问题对应的答案,确定大语言模型的准确率,对大语言模型进行迭代训练,直至大语言模型的准确率大于或等于预设准确率阈值,停止大语言模型的训练,训练得到的大语言模型用于根据输入的待处理问题和目标文本向量对应的文本,确定待处理问题对应的答案。本发明实施例的技术方案,通过将待处理问题转换为问题向量,并在预先设置的向量数据库中确定与问题向量匹配的目标文本向量,将待处理问题和目标文本向量对应的文本输入至预先训练的大语言模型中,得到待处理问题的答案。解决了现有技术在问题输入存在错误或者问题较为复杂的情况下,现有的自动问答***的准确率不高的问题,能够准确、高效的解答用户提出的问题。
实施例二
图2为本发明实施例二提供的另一种问答方法的流程图,本发明实施例在上述实施例的基础上,对确定与待处理问题匹配的问题向量的过程、向量数据库的设置过程、确定问题向量对应的目标文本向量的过程进行了进一步的具体化,并加入了提供变种问题、以及根据变种问题的答案评分确定复习时间的过程。
如图2所示,该方法包括:
S210、确定待处理问题。
从用户交互界面获取输入的待处理问题。
S220、判断所述待处理问题是否为非文本数据,若是,则执行S230,否则执行S240。
判断通过用户交互界面得到的待处理问题是否是非文本数据,若是非文本数据则对非文本数据进行转换。若是文本数据则直接确定待处理问题匹配的问题向量。
S230、将所述待处理问题转换为文本数据。执行S240。
将获得的待处理问题采用不同的算法转换为文本数据,如待处理问题为语音数据,则采用语音转文字的算法将语音转化为文字;若待处理问题为图片数据,则采用文字识别算法将图片转化为文字。
S240、确定与文本数据形式的待处理问题匹配的问题向量。
示例性的,可以将文本数据形式的待处理问题通过向量转化模型或向量转化算法转化为与之匹配的问题向量。
S250、确定所述问题向量与预先设置的向量数据库中各文本向量的相似度。
根据转化得到的问题向量,计算其与预设的向量数据库中的各文本向量的相似度,根据相似度对文本向量进行筛选。
S260、将相似度满足预设相似度条件的文本向量作为目标文本向量。
根据相似度确定目标文本向量的过程已在上述实施例中进行了说明,本实施例在此不再赘述。
S270、将所述待处理问题和所述目标文本向量对应的文本输入至预先训练得到的大语言模型中,得到所述大语言模型输出的与待处理问题匹配的答案。
将待处理问题和待处理问题确定的目标文本向量输入到预先训练好的大语言模型中,通过大语言模型确定与待处理问题匹配的答案。
进一步的,将与待处理问题匹配的答案在用户交互界面进行展示。
S280、确定与所述待处理问题匹配的变种问题,并将所述变种问题提供给用户交互界面进行展示。
其中,所述待处理问题匹配的变种问题为对待处理问题变换提问方式,或者在具体的适用场景中以题目的形式进行提问的问题,如待处理问题为“圆的面积计算公式”,其变种问题可以为“已知圆的面积为9πcm^2(平方厘米),求圆的半径”。
S290、获取用户通过用户交互界面提交的待处理答案。
将变种问题展示到用户交互界面之后,通过用户交互界面获取变种问题的待处理答案。
S2100、根据所述待处理答案和所述变种问题的标准答案,确定用户评分。
其中,用户评分是***对变种问题的待处理答案进行判断得到的用于表征待处理答案准确度的评分。
将待处理答案和变种问题的标准答案进行比对,并确认该待处理答案是否正确,以及根据待处理答案的正确率进行评分。若变种问题的标准答案为唯一性的、确定的答案,如“根据圆的直径6cm,求圆的面积”,则用户评分的结果只存在两种情况,若待处理答案与标准答案相同,则用户评分为满分,若待处理答案与标准答案不同,则用户评分为0分。若变种问题为分解步骤的题目或者没有标准答案的问题,那么变种问题的标准答案也不唯一,根据待处理答案的步骤或者知识点进行评分。
上述步骤,对变种问题的答案进行评分,可以直观的体现待处理问题的学习情况,提高了用户的学习效率。
S2110、根据所述用户评分和间隔重复算法,确定用户的复习时间。
其中,间隔复习算法是一种利用心理学间隔效应,通过不断复习所学内容并逐步增加相邻两次复习间的时间间隔来提升效率的学习技巧。
可选的,所述间隔重复算法可以为费曼学习法,费曼学习法是一个高效的深入学习的技能,其主要由四部分组成,分别是概念、教给别人、评价及简化,旨在通过对知识的理解和回顾实现对知识的掌握。
根据对变种问题的待处理答案进行评价得到的用户评分配合费曼学习法,确定用户复习该知识的时间。
根据用户对变种问题回答答案的评分,确认用户未掌握的部分知识为哪些,根据未掌握的知识以及用户对该部分知识的历史评分结合费曼学习法的技巧,确定用户需要回顾知识的时间,并提醒用户学习。
进一步的,提醒的方式可通过振动、响铃的方式或者通过提示的方式进行提醒。
上述步骤,通过费曼学习法及用户评分确认学习时间,保证了用户采用科学的方式对未掌握的知识进行复习,提高了用户学习效率以及对知识的掌握能力。
本发明实施例技术方案,根据用户输入的待处理问题的数据形式,对非文本数据进行转化,转化为文本数据,将文本数据输入到向量转化模型中,得到与之对应的问题向量,并将问题向量和待处理问题存储到向量数据库中,该步骤实现了数据的高效处理以及能够根据问题向量对大量的数据进行,提高了检索的效率。根据问题向量从向量数据库中获取相似的文本向量,将文本向量及待处理问题输入到训练好的大语言模型中,确定与待处理问题对应的答案,将得到的答案在用户交互界面中显示,并根据待处理问题生成变种问题,对用户进行提问,该步骤解决了现有技术中,对问题搜索单一,得到的结果多样的问题,采用大语言模型对知识进行转化,实现了将知识从高层次到低层次的转化,并同时生成变种问题,符合问答教育的理念,提供了个性化的学习体验,从易到难,帮助用户跨越学习中问答难点。用户对变种问题进行回答,并根据用户的回答进行评分,根据用户所得的评分以及间隔重复算法,确定下一次用户复习该问题的时间,该步骤能够帮助用户规划学习路径,提高用户记忆效率。
实施例三
图3为本发明实施例三提供的一种问答装置的结构示意图。如图3所示,该装置包括:问题向量确定模块310、目标文本向量确定模块320以及答案确定模块330。其中:
问题向量确定模块310,用于确定与待处理问题匹配的问题向量;
目标文本向量确定模块320,用于在预先设置的向量数据库的各文本向量中,确定与所述问题向量匹配的至少一个目标文本向量;
答案确定模块330,用于将所述待处理问题和所述目标文本向量对应的文本输入至预先训练得到的大语言模型中,得到所述大语言模型输出的与待处理问题匹配的答案。
本发明实施例的技术方案,通过将待处理问题转换为问题向量,并在预先设置的向量数据库中确定与问题向量匹配的目标文本向量,将待处理问题和目标文本向量对应的文本输入至预先训练的大语言模型中,得到待处理问题的答案。解决了现有技术在问题输入存在错误或者问题较为复杂的情况下,现有的自动问答***的准确率不高的问题,能够准确、高效的解答用户提出的问题。
在上述实施例的基础上,问题向量确定模块310,包括:
待处理问题确定单元,用于确定待处理问题;
文本转换单元,用于若确定所述待处理问题为非文本数据,则将所述待处理问题转换为文本数据;
问题向量确定单元,用于确定与文本数据形式的待处理问题匹配的问题向量。
在上述实施例的基础上,所述装置,还包括:
标准知识文本确定模块,用于确定标准知识文本,以及与所述标准知识文本匹配的文本向量;
文本向量存储模块,用于将标准知识文本和与所述标准知识文本匹配的文本向量存储到向量数据库中。
在上述实施例的基础上,标准知识文本确定模块,包括:
标准知识数据确定单元,用于确定标准知识数据;
标准知识数据转换单元,用于若确定所述标准知识数据为非文本数据,则将所述标准知识数据转换为标准知识文本。
在上述实施例的基础上,目标文本向量确定模块320,包括:
相似度确定单元,用于确定所述问题向量与预先设置的向量数据库中各文本向量的相似度;
目标文本向量确定单元,用于将相似度满足预设相似度条件的文本向量作为目标文本向量。
在上述实施例的基础上,所述装置,还包括:
变种问题确定模块,用于确定与所述待处理问题匹配的变种问题,并将所述变种问题提供给用户交互界面进行展示。
在上述实施例的基础上,所述装置,还包括:
待处理答案获取模块,用于获取用户通过用户交互界面提交的待处理答案;
用户评分确定模块,用于根据所述待处理答案和所述变种问题的标准答案,确定用户评分;
复习时间确定模块,用于根据所述用户评分和间隔重复算法,确定用户的复习时间。
本发明实施例所提供的问答装置可执行本发明任意实施例所提供的问答方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4为本发明实施例四提供的一种电子设备的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(中央处理器)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如问答方法。
在一些实施例中,问答方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的问答方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行问答方法。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的***和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种问答方法,其特征在于,包括:
确定与待处理问题匹配的问题向量;
在预先设置的向量数据库的各文本向量中,确定与所述问题向量匹配的至少一个目标文本向量;
将所述待处理问题和所述目标文本向量对应的文本输入至预先训练得到的大语言模型中,得到所述大语言模型输出的与待处理问题匹配的答案。
2.根据权利要求1所述的方法,其特征在于,确定与待处理问题匹配的问题向量,包括:
确定待处理问题;
若确定所述待处理问题为非文本数据,则将所述待处理问题转换为文本数据;
确定与文本数据形式的待处理问题匹配的问题向量。
3.根据权利要求1所述的方法,其特征在于,所述向量数据库的设置过程包括:
确定标准知识文本,以及与所述标准知识文本匹配的文本向量;
将标准知识文本和与所述标准知识文本匹配的文本向量存储到向量数据库中。
4.根据权利要求3所述的方法,其特征在于,确定标准知识文本,包括:
确定标准知识数据;
若确定所述标准知识数据为非文本数据,则将所述标准知识数据转换为标准知识文本。
5.根据权利要求1所述的方法,其特征在于,在预先设置的向量数据库的各文本向量中,确定与所述问题向量匹配的至少一个目标文本向量,包括:
确定所述问题向量与预先设置的向量数据库中各文本向量的相似度;
将相似度满足预设相似度条件的文本向量作为目标文本向量。
6.根据权利要求1所述的方法,其特征在于,在得到所述大语言模型输出的与待处理问题匹配的答案之后,还包括:
确定与所述待处理问题匹配的变种问题,并将所述变种问题提供给用户交互界面进行展示。
7.根据权利要求6所述的方法,其特征在于,在将所述变种问题提供给用户交互界面进行展示之后,还包括:
获取用户通过用户交互界面提交的待处理答案;
根据所述待处理答案和所述变种问题的标准答案,确定用户评分;
根据所述用户评分和间隔重复算法,确定用户的复习时间。
8.一种问答装置,其特征在于,包括:
问题向量确定模块,用于确定与待处理问题匹配的问题向量;
目标文本向量确定模块,用于在预先设置的向量数据库的各文本向量中,确定与所述问题向量匹配的至少一个目标文本向量;
答案确定模块,用于将所述待处理问题和所述目标文本向量对应的文本输入至预先训练得到的大语言模型中,得到所述大语言模型输出的与待处理问题匹配的答案。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一所述的问答方法。
10.一种存储计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的问答方法。
CN202311016285.3A 2023-08-11 2023-08-11 一种问答方法、装置、电子设备以及存储介质 Pending CN117056483A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311016285.3A CN117056483A (zh) 2023-08-11 2023-08-11 一种问答方法、装置、电子设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311016285.3A CN117056483A (zh) 2023-08-11 2023-08-11 一种问答方法、装置、电子设备以及存储介质

Publications (1)

Publication Number Publication Date
CN117056483A true CN117056483A (zh) 2023-11-14

Family

ID=88652944

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311016285.3A Pending CN117056483A (zh) 2023-08-11 2023-08-11 一种问答方法、装置、电子设备以及存储介质

Country Status (1)

Country Link
CN (1) CN117056483A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118093841A (zh) * 2024-04-25 2024-05-28 浙江大学 一种用于问答***的模型训练方法和问答方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118093841A (zh) * 2024-04-25 2024-05-28 浙江大学 一种用于问答***的模型训练方法和问答方法

Similar Documents

Publication Publication Date Title
JP7127106B2 (ja) 質問応答処理、言語モデルの訓練方法、装置、機器および記憶媒体
CN110442718B (zh) 语句处理方法、装置及服务器和存储介质
CN112417102B (zh) 一种语音查询方法、装置、服务器和可读存储介质
CN112100354B (zh) 人机对话方法、装置、设备及存储介质
KR102565673B1 (ko) 시멘틱 표현 모델의 생성 방법, 장치, 전자 기기 및 저장 매체
CN111428010B (zh) 人机智能问答的方法和装置
CN111833853B (zh) 语音处理方法及装置、电子设备、计算机可读存储介质
CN112487173B (zh) 人机对话方法、设备和存储介质
CN116737908A (zh) 知识问答方法、装置、设备和存储介质
US11947920B2 (en) Man-machine dialogue method and system, computer device and medium
CN117149984B (zh) 一种基于大模型思维链的定制化培训方法及装置
WO2020052061A1 (zh) 用于处理信息的方法和装置
CN112632242A (zh) 智能对话方法及装置、电子设备
CN117056483A (zh) 一种问答方法、装置、电子设备以及存储介质
US20230013796A1 (en) Method and apparatus for acquiring pre-trained model, electronic device and storage medium
CN115062718A (zh) 语言模型训练方法、装置、电子设备及存储介质
CN117807204A (zh) 工程机械故障问题的问答诊断方法、装置、设备和介质
CN117421403A (zh) 智能对话方法、装置及电子设备
CN114970666B (zh) 一种口语处理方法、装置、电子设备及存储介质
CN112784599B (zh) 诗句的生成方法、装置、电子设备和存储介质
Korpusik et al. Dialogue state tracking with convolutional semantic taggers
CN113470625A (zh) 语音对话处理方法、装置、设备及存储介质
CN112560431A (zh) 用于生成试题辅导信息的方法、装置、设备、存储介质以及计算机程序产品
CN116737888B (zh) 对话生成模型的训练方法和答复文本的确定方法、装置
CN113343668B (zh) 选择题解题方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination