CN112765981A - 一种文本信息的生成方法和装置 - Google Patents
一种文本信息的生成方法和装置 Download PDFInfo
- Publication number
- CN112765981A CN112765981A CN202110178820.XA CN202110178820A CN112765981A CN 112765981 A CN112765981 A CN 112765981A CN 202110178820 A CN202110178820 A CN 202110178820A CN 112765981 A CN112765981 A CN 112765981A
- Authority
- CN
- China
- Prior art keywords
- target
- text information
- information
- text
- voice instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000012549 training Methods 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims description 46
- 230000011218 segmentation Effects 0.000 claims description 38
- 230000015654 memory Effects 0.000 claims description 19
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Machine Translation (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请涉及一种文本信息的生成方法和装置,其中,该方法包括:获取语音指令中的目标关键词,其中,语音指令用于控制智能家居设备执行目标操作;根据智能家居设备的状态信息使用目标生成模型生成与目标关键词对应的目标回复信息,其中,目标生成模型是使用训练数据集对初始生成模型进行训练得到的,训练数据集包括参考关键词以及与参考关键词对应的参考信息。本申请解决了目标回复信息的生成质量较低的技术问题。
Description
技术领域
本申请涉及计算机应用领域,尤其涉及一种文本信息的生成方法和装置。
背景技术
随着人工智能领域相关技术的发展,回复语句的生成逐渐成为研究热点,目前的回复语的生成大都是采用模板生成法,通过将词汇在模板库中进行匹配,匹配后将词汇和短语填入固定模板,从而生成回复语,这种生成方法虽然思路简单,但不能适应复杂的自然语言生成环境,生成文本单一且易出现语句不通顺等问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请提供了一种文本信息的生成方法和装置,以至少解决相关技术中目标回复信息的生成质量较低的技术问题。
根据本申请实施例的一个方面,提供了一种文本信息的生成方法,包括:获取语音指令中的目标关键词,其中,所述语音指令用于控制智能家居设备执行目标操作;根据所述智能家居设备的状态信息使用目标生成模型生成与所述目标关键词对应的目标回复信息,其中,所述目标生成模型是使用训练数据集对初始生成模型进行训练得到的,所述训练数据集包括参考关键词以及与参考关键词对应的参考信息。
可选地,获取所述语音指令中的所述目标关键词包括:获取所述语音指令;对所述语音指令进行文字转换处理,以得到文本信息;对所述文本信息进行文本处理,以得到所述目标关键词。
可选地,对所述文本信息进行所述文本处理,以得到所述目标关键词包括:对所述文本信息进行分词处理,以得到第一词语列表;筛除所述第一词语列表中的停用词,以得到第二词语列表;将所述第一词语列表以及所述第二词语列表确定为所述目标关键词。
可选地,对所述文本信息进行所述分词处理,以得到所述第一词语列表包括:获取预设分词集合,其中,所述预设分词集合中保存有与所述智能家居相关联的词语;基于所述预设分词集合使用结巴分词法对所述文本信息进行分词处理,以得到所述第一词语列表。
可选地,对所述语音指令进行文字转换处理,以得到所述文本信息之后,所述方法还包括:对所述文本信息进行语义识别,以得到识别结果;基于所述识别结果生成控制指令,其中,所述控制指令用于控制所述智能家居设备执行对应的目标操作;将所述控制指令发送至所述智能家居设备。
可选地,根据所述智能家居设备的所述状态信息使用所述目标生成模型生成与所述目标关键词对应的所述目标回复信息之前,所述方法还包括:获取所述智能家居设备的状态码,其中,所述状态码用于指示所述智能家居设备对所述目标操作的执行情况;基于所述状态码确定所述状态信息。
根据本申请实施例的另一方面,还提供了一种文本信息的生成装置,包括:第一获取模块,用于获取语音指令中的目标关键词,其中,所述语音指令用于控制智能家居设备执行目标操作;第一生成模块,用于根据所述智能家居设备的状态信息使用目标生成模型生成与所述目标关键词对应的目标回复信息,其中,所述目标生成模型是使用训练数据集对初始生成模型进行训练得到的,所述训练数据集包括参考关键词以及与参考关键词对应的参考信息。
可选地,所述第一获取模块包括:获取单元,用于获取所述语音指令;第一处理单元,用于对所述语音指令进行文字转换处理,以得到文本信息;第二处理单元,用于对所述文本信息进行文本处理,以得到所述目标关键词。
根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的方法。
根据本申请实施例的另一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器通过计算机程序执行上述的方法。
在本申请实施例中,采用获取语音指令中的目标关键词,其中,语音指令用于控制智能家居设备执行目标操作;根据智能家居设备的状态信息使用目标生成模型生成与目标关键词对应的目标回复信息,其中,目标生成模型是使用训练数据集对初始生成模型进行训练得到的,训练数据集包括参考关键词以及与参考关键词对应的参考信息的方式,通过获取用于控制智能家居设备的语音指令中的目标关键词,并根据智能家居设备的状态信息,使用训练数据训练过的目标生成模型生成与目标关键词对应的目标回复信息,达到了根据语音指令中的关键词使用目标生成模型生成对应的目标回复信息的目的,从而实现了提高目标回复信息的生成质量的技术效果,进而解决了目标回复信息的生成质量较低的技术问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例的文本信息的生成方法的硬件环境的示意图;
图2是根据本申请实施例的一种可选的文本信息的生成方法的流程图;
图3是根据本申请实施例的一种可选地初始生成模型训练示意图;
图4是根据本申请实施例的一种可选地回复语生成流程图;
图5是根据本申请实施例的一种可选的文本信息的生成装置的示意图;
图6是根据本申请实施例的一种电子装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例的一方面,提供了一种文本信息的生成方法实施例。
可选地,在本实施例中,上述文本信息的生成方法可以应用于如图1所示的由终端101和服务器103所构成的硬件环境中。图1是根据本申请实施例的文本信息的生成方法的硬件环境的示意图,如图1所示,服务器103通过网络与终端101进行连接,可用于为终端或终端上安装的客户端提供服务(如分词服务、数据计算服务等),可在服务器上或独立于服务器设置数据库,用于为服务器103提供数据存储服务,上述网络包括但不限于:广域网、城域网或局域网,终端101并不限定于PC、手机、平板电脑等。本申请实施例的文本信息的生成方法可以由服务器103来执行,也可以由终端101来执行,还可以是由服务器103和终端101共同执行。其中,终端101执行本申请实施例的文本信息的生成方法也可以是由安装在其上的客户端来执行。
图2是根据本申请实施例的一种可选文本信息的生成方法的流程图,如图2所示,该方法可以包括以下步骤:
步骤S202,获取语音指令中的目标关键词,其中,所述语音指令用于控制智能家居设备执行目标操作;
步骤S204,根据所述智能家居设备的状态信息使用目标生成模型生成与所述目标关键词对应的目标回复信息,其中,所述目标生成模型是使用训练数据集对初始生成模型进行训练得到的,所述训练数据集包括参考关键词以及与参考关键词对应的参考信息。
通过上述步骤S202至步骤S204,通过获取用于控制智能家居设备的语音指令中的目标关键词,并根据智能家居设备的状态信息,使用训练数据训练过的目标生成模型生成与目标关键词对应的目标回复信息,达到了根据语音指令中的关键词使用目标生成模型生成对应的目标回复信息的目的,从而实现了提高目标回复信息的生成质量的技术效果,进而解决了目标回复信息的生成质量较低的技术问题。
在步骤S202提供的技术方案中,获取目标关键词的方法可以是对获取到的语音指令进行处理后得到的目标关键词,还可以是获取的其他设备对语音质量进行处理后得到的目标关键词。
可选地,在本实施例中,智能家居设备可以但不限于是智能电视、智能空调、智能冰箱、智能洗衣机、智能音箱等等,本方案对此不做限定。
在步骤S204提供的技术方案中,状态信息可以是智能家居设备的工作状态信息、操作指令执行状态信息等等。
可选地,在本实施例中,初始生成模型可以是构建好的神经网络模型,通过使用训练数据集对初始生成模型进行训练得到训练好的目标生成模型。
可选地,在本实施例中,目标恢复信息可以但不限于包括文字信息、语音信息等等,本方案对此不作限定。
图3是根据本申请实施例的一种可选地初始生成模型训练示意图,如图3所示:
通过对语音请求进行文字处理得到与语音请求对应的文本信息,并对文本信息进行分词得到分词后的分词文本,提取分词文本中的关键词作为骨架关键词,并将请求文本和骨架关键词作为输入,输入至初始生产模型,模型输出的回复语和预设的回复语进行比较,根据模型输出的回复语与预设回复语的差异修正初始生成模型中的模型参数,从而实现对初始生成模型的训练过程,得到目标生成模型。
作为一种可选的实施例,获取所述语音指令中的所述目标关键词包括:
S11,获取所述语音指令;
S12,对所述语音指令进行文字转换处理,以得到文本信息;
S13,对所述文本信息进行文本处理,以得到所述目标关键词。
可选地,在本实施例中,文本处理可以但不限于包括对文本信息进行分割、筛选、排列等等。
通过以上步骤,通过对语音指令进行文字转换处理,并对转换后的文本信息进行文本处理从而得到了文本信息中的目标关键词。
作为一种可选的实施例,对所述文本信息进行所述文本处理,以得到所述目标关键词包括:
S21,对所述文本信息进行分词处理,以得到第一词语列表;
S22,筛除所述第一词语列表中的停用词,以得到第二词语列表;
S23,将所述第一词语列表以及所述第二词语列表确定为所述目标关键词。
可选地,在本实施例中,分词处理可以但不限于使用结巴分词法、CRF(Conditional Random Field,条件随机场)算法、HMM(Hidden Markov Model,隐马尔可夫模型)算法等等。
可选地,在本实施例中,筛除的停用词可以但不限于是筛除的根据历史数据或者相关专业信息确定的停用词。
作为一种可选的实施例,对所述文本信息进行所述分词处理,以得到所述第一词语列表包括:
S31,获取预设分词集合,其中,所述预设分词集合中保存有与所述智能家居相关联的词语;
S32,基于所述预设分词集合使用结巴分词法对所述文本信息进行分词处理,以得到所述第一词语列表。
可选地,在本实施例中,分词集合可以但不限与是根据历史数据确定的,还可以是根据家居行业的相关信息确定的。
通过以上步骤,通过预先设置的预设分词集合,在使用结巴分词对文本信息进行分词处理时,参考预设分词集合进行分词处理,从而提高了分词处理的准确率。
作为一种可选的实施例,对所述语音指令进行文字转换处理,以得到所述文本信息之后,所述方法还包括:
S41,对所述文本信息进行语义识别,以得到识别结果;
S42,基于所述识别结果生成控制指令,其中,所述控制指令用于控制所述智能家居设备执行对应的目标操作;
S43,将所述控制指令发送至所述智能家居设备。
可选地,在本实施例中,将控制指令发送至智能家居设备可以但不限于与通过蓝牙、局域网、WiFi(无线通信技术)等方式。
作为一种可选的实施例,根据所述智能家居设备的所述状态信息使用所述目标生成模型生成与所述目标关键词对应的所述目标回复信息之前,所述方法还包括:
S51,获取所述智能家居设备的状态码,其中,所述状态码用于指示所述智能家居设备对所述目标操作的执行情况;
S52,基于所述状态码确定所述状态信息。
通过以上步骤,通过获取智能家居设备在接收到控制指令后的状态码,并根据状态码确定智能家居设备的状态信息,从而提高了确定智能家居设备状态信息的准确率。
图4是根据本申请实施例的一种可选地回复语生成流程图,如图4所示:
S401,获取用户说出的语音指令,该语音指令可以是请求智能家居设备执行某种操作,比如:请帮我打开空调的制热模式。
S402,对该语音指令进行语音识别,从而得到语音指令对应的文本信息。
S403,对识别后的文本信息进行语义理解,根据语义理解后的结果生成对应的控制指令,并将该控制指令发送至空调设备。
S404,空调在接收到控制指令后执行与该指令对应的目标操作,比如空调正常执行与控制指令对应的目标操作的情况下生成空调正产指令目标操作的状态码,并将状态码上传至目标生成模型。
S405,对文本信息利用结巴分词法进行分词,分词时需注意导入自定义的分词词典进行分词,从而得到分词文本,筛除分词文本中的停用词,从而得到关键词,将关键词以及分词文本一同输入至目标生成模型,执行步骤S406。
S406,目标生成模型在接收到关键词以及分词文本后根据接收到的空调返回的状态码,确定空调的运行状态,从而生成对应的回复语。
S407,输出生成的回复语。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台电子设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
根据本申请实施例的另一个方面,还提供了一种用于实施上述文本信息的生成方法的文本信息的生成装置。图5是根据本申请实施例的一种可选的文本信息的生成装置的示意图,如图5所示,该装置可以包括:
第一获取模块52,用于获取语音指令中的目标关键词,其中,所述语音指令用于控制智能家居设备执行目标操作;
第一生成模块54,用于根据所述智能家居设备的状态信息使用目标生成模型生成与所述目标关键词对应的目标回复信息,其中,所述目标生成模型是使用训练数据集对初始生成模型进行训练得到的,所述训练数据集包括参考关键词以及与参考关键词对应的参考信息。
需要说明的是,该实施例中的第一获取模块52可以用于执行本申请实施例中的步骤S202,该实施例中的第一生成模块54可以用于执行本申请实施例中的步骤S204。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
通过上述模块,可以解决了目标回复信息的生成质量较低的技术问题,进而达到提高目标回复信息的生成质量的技术效果。
可选地,所述第一获取模块包括:获取单元,用于获取所述语音指令;第一处理单元,用于对所述语音指令进行文字转换处理,以得到文本信息;第二处理单元,用于对所述文本信息进行文本处理,以得到所述目标关键词。
可选地,所述第二处理单元用于:对所述文本信息进行分词处理,以得到第一词语列表;筛除所述第一词语列表中的停用词,以得到第二词语列表;将所述第一词语列表以及所述第二词语列表确定为所述目标关键词。
可选地,所述第二处理单元用于:获取预设分词集合,其中,所述预设分词集合中保存有与所述智能家居相关联的词语;基于所述预设分词集合使用结巴分词法对所述文本信息进行分词处理,以得到所述第一词语列表。
可选地,所述装置还包括:识别模块,用于在对所述语音指令进行文字转换处理,以得到所述文本信息之后,对所述文本信息进行语义识别,以得到识别结果;第二生成模块,用于基于所述识别结果生成控制指令,其中,所述控制指令用于控制所述智能家居设备执行对应的目标操作;发送模块,用于将所述控制指令发送至所述智能家居设备。
可选地,所述装置还包括:第二获取模块,用于在根据所述智能家居设备的所述状态信息使用所述目标生成模型生成与所述目标关键词对应的所述目标回复信息之前,获取所述智能家居设备的状态码,其中,所述状态码用于指示所述智能家居设备对所述目标操作的执行情况;确定模块,用于基于所述状态码确定所述状态信息。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。
根据本申请实施例的另一个方面,还提供了一种用于实施上述文本信息的生成方法的电子装置。
图6是根据本申请实施例的一种电子装置的结构框图,如图6所示,该电子装置可以包括:一个或多个(图中仅示出一个)处理器601、存储器603、以及传输装置605,如图6所示,该电子装置还可以包括输入输出设备607。
其中,存储器603可用于存储软件程序以及模块,如本申请实施例中的文本信息的生成方法和装置对应的程序指令/模块,处理器601通过运行存储在存储器603内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的文本信息的生成方法。存储器603可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器603可进一步包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至电子装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置605用于经由一个网络接收或者发送数据,还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置605包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置605为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器603用于存储应用程序。
处理器601可以通过传输装置605调用存储器603存储的应用程序,以执行下述步骤:获取语音指令中的目标关键词,其中,所述语音指令用于控制智能家居设备执行目标操作;根据所述智能家居设备的状态信息使用目标生成模型生成与所述目标关键词对应的目标回复信息,其中,所述目标生成模型是使用训练数据集对初始生成模型进行训练得到的,所述训练数据集包括参考关键词以及与参考关键词对应的参考信息。
采用本申请实施例,提供了一种文本信息的生成方法和装置的方案。通过获取用于控制智能家居设备的语音指令中的目标关键词,并根据智能家居设备的状态信息,使用训练数据训练过的目标生成模型生成与目标关键词对应的目标回复信息,达到了根据语音指令中的关键词使用目标生成模型生成对应的目标回复信息的目的,从而实现了提高目标回复信息的生成质量的技术效果,进而解决了目标回复信息的生成质量较低的技术问题。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本领域普通技术人员可以理解,图6所示的结构仅为示意,电子装置可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等电子设备。图6其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图6中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图6所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令电子设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行文本信息的生成方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取语音指令中的目标关键词,其中,所述语音指令用于控制智能家居设备执行目标操作;根据所述智能家居设备的状态信息使用目标生成模型生成与所述目标关键词对应的目标回复信息,其中,所述目标生成模型是使用训练数据集对初始生成模型进行训练得到的,所述训练数据集包括参考关键词以及与参考关键词对应的参考信息。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种文本信息的生成方法,其特征在于,包括:
获取语音指令中的目标关键词,其中,所述语音指令用于控制智能家居设备执行目标操作;
根据所述智能家居设备的状态信息使用目标生成模型生成与所述目标关键词对应的目标回复信息,其中,所述目标生成模型是使用训练数据集对初始生成模型进行训练得到的,所述训练数据集包括参考关键词以及与参考关键词对应的参考信息。
2.根据权利要求1所述的方法,其特征在于,获取所述语音指令中的所述目标关键词包括:
获取所述语音指令;
对所述语音指令进行文字转换处理,以得到文本信息;
对所述文本信息进行文本处理,以得到所述目标关键词。
3.根据权利要求2所述的方法,其特征在于,对所述文本信息进行所述文本处理,以得到所述目标关键词包括:
对所述文本信息进行分词处理,以得到第一词语列表;
筛除所述第一词语列表中的停用词,以得到第二词语列表;
将所述第一词语列表以及所述第二词语列表确定为所述目标关键词。
4.根据权利要求3所述的方法,其特征在于,对所述文本信息进行所述分词处理,以得到所述第一词语列表包括:
获取预设分词集合,其中,所述预设分词集合中保存有与所述智能家居相关联的词语;
基于所述预设分词集合使用结巴分词法对所述文本信息进行分词处理,以得到所述第一词语列表。
5.根据权利要求2所述的方法,其特征在于,对所述语音指令进行文字转换处理,以得到所述文本信息之后,所述方法还包括:
对所述文本信息进行语义识别,以得到识别结果;
基于所述识别结果生成控制指令,其中,所述控制指令用于控制所述智能家居设备执行对应的目标操作;
将所述控制指令发送至所述智能家居设备。
6.根据权利要求5所述的方法,其特征在于,根据所述智能家居设备的所述状态信息使用所述目标生成模型生成与所述目标关键词对应的所述目标回复信息之前,所述方法还包括:
获取所述智能家居设备的状态码,其中,所述状态码用于指示所述智能家居设备对所述目标操作的执行情况;
基于所述状态码确定所述状态信息。
7.一种文本信息的生成装置,其特征在于,包括:
第一获取模块,用于获取语音指令中的目标关键词,其中,所述语音指令用于控制智能家居设备执行目标操作;
第一生成模块,用于根据所述智能家居设备的状态信息使用目标生成模型生成与所述目标关键词对应的目标回复信息,其中,所述目标生成模型是使用训练数据集对初始生成模型进行训练得到的,所述训练数据集包括参考关键词以及与参考关键词对应的参考信息。
8.根据权利要求7所述的装置,其特征在于,所述第一获取模块包括:
获取单元,用于获取所述语音指令;
第一处理单元,用于对所述语音指令进行文字转换处理,以得到文本信息;
第二处理单元,用于对所述文本信息进行文本处理,以得到所述目标关键词。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至6任一项中所述的方法。
10.一种电子装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器通过所述计算机程序执行上述权利要求1至6任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110178820.XA CN112765981A (zh) | 2021-02-09 | 2021-02-09 | 一种文本信息的生成方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110178820.XA CN112765981A (zh) | 2021-02-09 | 2021-02-09 | 一种文本信息的生成方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112765981A true CN112765981A (zh) | 2021-05-07 |
Family
ID=75705497
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110178820.XA Pending CN112765981A (zh) | 2021-02-09 | 2021-02-09 | 一种文本信息的生成方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112765981A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113759869A (zh) * | 2021-08-16 | 2021-12-07 | 深圳Tcl新技术有限公司 | 智能家电测试方法及装置 |
CN116842169A (zh) * | 2023-09-01 | 2023-10-03 | 国网山东省电力公司聊城供电公司 | 电力网格会话管理方法、***、终端及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105929700A (zh) * | 2016-04-26 | 2016-09-07 | 海信(山东)空调有限公司 | 智能控制方法和装置 |
CN105955035A (zh) * | 2016-02-29 | 2016-09-21 | 青岛克路德机器人有限公司 | 一种家居智能管理控制*** |
CN110597082A (zh) * | 2019-10-23 | 2019-12-20 | 北京声智科技有限公司 | 智能家居设备控制方法、装置、计算机设备及存储介质 |
CN112185389A (zh) * | 2020-09-22 | 2021-01-05 | 北京小米松果电子有限公司 | 语音生成方法、装置、存储介质和电子设备 |
-
2021
- 2021-02-09 CN CN202110178820.XA patent/CN112765981A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105955035A (zh) * | 2016-02-29 | 2016-09-21 | 青岛克路德机器人有限公司 | 一种家居智能管理控制*** |
CN105929700A (zh) * | 2016-04-26 | 2016-09-07 | 海信(山东)空调有限公司 | 智能控制方法和装置 |
CN110597082A (zh) * | 2019-10-23 | 2019-12-20 | 北京声智科技有限公司 | 智能家居设备控制方法、装置、计算机设备及存储介质 |
CN112185389A (zh) * | 2020-09-22 | 2021-01-05 | 北京小米松果电子有限公司 | 语音生成方法、装置、存储介质和电子设备 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113759869A (zh) * | 2021-08-16 | 2021-12-07 | 深圳Tcl新技术有限公司 | 智能家电测试方法及装置 |
CN113759869B (zh) * | 2021-08-16 | 2024-04-02 | 深圳Tcl新技术有限公司 | 智能家电测试方法及装置 |
CN116842169A (zh) * | 2023-09-01 | 2023-10-03 | 国网山东省电力公司聊城供电公司 | 电力网格会话管理方法、***、终端及存储介质 |
CN116842169B (zh) * | 2023-09-01 | 2024-01-12 | 国网山东省电力公司聊城供电公司 | 电力网格会话管理方法、***、终端及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6828001B2 (ja) | 音声ウェイクアップ方法及び装置 | |
CN108305641B (zh) | 情感信息的确定方法和装置 | |
US20200301954A1 (en) | Reply information obtaining method and apparatus | |
CN107644638B (zh) | 语音识别方法、装置、终端和计算机可读存储介质 | |
CN112397057B (zh) | 基于生成对抗网络的语音处理方法、装置、设备及介质 | |
CN111310440A (zh) | 文本的纠错方法、装置和*** | |
CN112765981A (zh) | 一种文本信息的生成方法和装置 | |
CN108304376B (zh) | 文本向量的确定方法、装置、存储介质及电子装置 | |
CN110942763A (zh) | 语音识别方法及装置 | |
CN110795939A (zh) | 文本处理方法、装置 | |
CN112116910A (zh) | 语音指令的识别方法和装置、存储介质、电子装置 | |
CN109766422A (zh) | 信息处理方法、装置及***、存储介质、终端 | |
CN113901837A (zh) | 一种意图理解方法、装置、设备及存储介质 | |
CN110489519B (zh) | 基于会话预测模型的会话方法及相关产品 | |
CN115312034A (zh) | 基于自动机和字典树处理语音信号的方法、装置和设备 | |
CN111062211A (zh) | 信息提取方法、装置、电子设备及存储介质 | |
CN110895936B (zh) | 基于家用电器的语音处理方法和装置 | |
CN112447168A (zh) | 语音识别***、方法、音箱、显示设备和交互平台 | |
CN110246494A (zh) | 基于语音识别的服务请求方法、装置及计算机设备 | |
CN112417874A (zh) | 命名实体的识别方法和装置、存储介质、电子装置 | |
CN113836944A (zh) | 用于智能设备的控制方法、***及其装置、电子设备 | |
CN111128127A (zh) | 一种语音识别处理方法及装置 | |
CN117332062A (zh) | 一种数据处理方法和相关装置 | |
CN108847236A (zh) | 语音信息的接收方法及装置、语音信息的解析方法及装置 | |
CN109145124B (zh) | 信息的存储方法、装置、存储介质及电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210507 |
|
RJ01 | Rejection of invention patent application after publication |