CN111061857A - 菜谱生成方法、装置、电子设备及存储介质 - Google Patents

菜谱生成方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111061857A
CN111061857A CN201911260664.0A CN201911260664A CN111061857A CN 111061857 A CN111061857 A CN 111061857A CN 201911260664 A CN201911260664 A CN 201911260664A CN 111061857 A CN111061857 A CN 111061857A
Authority
CN
China
Prior art keywords
voice data
data
obtaining
text
text data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911260664.0A
Other languages
English (en)
Inventor
宋德超
贾巨涛
赵文静
李立辉
林跃杭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Zhuhai Lianyun Technology Co Ltd
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Zhuhai Lianyun Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai, Zhuhai Lianyun Technology Co Ltd filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN201911260664.0A priority Critical patent/CN111061857A/zh
Publication of CN111061857A publication Critical patent/CN111061857A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/027Syllables being the recognition units

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)

Abstract

本申请涉及信息处理领域,具体涉及一种菜谱生成方法、装置、电子设备及存储介质,解决了现有技术中不能将菜品烹饪过程中的语音数据整理为文本菜谱的问题。方法包括:将获得的多条语音数据转换为对应的多条文本数据,并记录获得多条语音数据的先后顺序,从每条文本数据中提取出包括烹饪词汇的目标文本数据,根据获得多条语音数据的先后顺序对多条目标文本数据进行排序汇总,以生成文本菜谱。

Description

菜谱生成方法、装置、电子设备及存储介质
技术领域
本申请涉及信息处理领域,具体而言,涉及一种菜谱生成方法、装置、电子设备及存储介质。
背景技术
随着科学技术的高速发展和社会生产力水平的快速提高,人们对于生活品质的需求也更加多样化,对于相同的食材,不同的人会采用不同的制作方法进行制作,不同的制作方法导致不同的人根据相同的食材制作出的菜品的口味也各不相同,而根据相同的食材制作出的不同口味的菜品是每个家庭的特有的情感记忆,根据网络上流传的大众化的制作方法不能制作出这样口味的菜品。然而,由于用户受教育程度的不同,且菜品制作方法通常包括对多种食材进行不同处理的多个步骤,让用户直接用文字书写文本菜谱很可能会造成食材信息或步骤信息的遗误,与用文字书写文本菜谱相比,录制用户在菜品的烹饪过程中口述的菜品烹饪的每个步骤以得到语音数据,并将语音数据整理为语音菜谱是较简便的菜谱生成方法,但与文本菜谱相比,语音菜谱既不便于编辑也不便于保存。基于此,现有技术中存在不能将菜品烹饪过程中的语音数据整理为文本菜谱的问题。
发明内容
针对上述问题,本申请提供了一种菜谱生成方法、装置、电子设备及存储介质,解决了不能将菜品烹饪过程中的语音数据整理为文本菜谱的问题。
第一方面,本申请提供了一种菜谱生成方法,包括:
将获得的多条语音数据转换为对应的多条文本数据,并记录获得多条所述语音数据的先后顺序;
从每条所述文本数据中提取出包括烹饪词汇的目标文本数据;
根据获得多条所述语音数据的先后顺序对多条所述目标文本数据进行排序汇总,以生成文本菜谱。
根据本申请的实施例,优选地,在上述菜谱生成方法中,将获得的多条语音数据转换为对应的多条文本数据包括:
获得多条语音数据和每条所述语音数据的获得时刻,其中,每条所述语音数据的最后一个音节的结束时刻与该语音数据相邻的下一条语音数据的连续音节的起始音节的起始时刻之间的差值大于预设时间阈值,且每条语音数据包括的多个连续音节中任意相邻两个音节的结束时刻之间的时间间隔不大于所述预设时间阈值,每条所述语音数据的最后一个音节的结束时刻为该语音数据的获得时刻;
将每条所述语音数据分别转换为与该条语音数据对应的文本数据。
根据本申请的实施例,优选地,在上述菜谱生成方法中,将获得的多条语音数据转换为对应的多条文本数据包括:
在识别到连续音节的最后一个音节的结束时刻之后的预设时间阈值内未再次识别到音节时,获取该最后一个音节和与该最后一个音节对应的起始音节之间的语音数据,并将该结束时刻作为该语音数据的获得时刻,其中,所述连续音节中任意两个相邻音节的结束时刻之间的时间间隔不大于所述预设时间阈值;
将所述语音数据转换为文本数据,从而得到多条语音数据分别对应的多条文本数据。
根据本申请的实施例,优选地,在上述菜谱生成方法中,记录获得多条语音数据的先后顺序包括:
根据多条所述语音数据的获得时刻,得到多条所述语音数据的先后顺序,其中,在先获得的语音数据的获得时刻早于在后获得的语音数据的获得时刻。
根据本申请的实施例,优选地,在上述菜谱生成方法中,所述方法还包括:
采用文本关键词提取算法对所述目标文本数据进行词性标注处理,以得到所述目标文本数据中的动词;
将所述动词与数据库中的预设烹饪动词进行对比,以判断是否存在所述预设烹饪动词与所述动词一致;
当存在所述预设烹饪动词与所述动词一致时,将与该动词所属的目标文本数据对应的语音数据的获得时刻作为第一获得时刻,将与该动词所属的目标文本数据相邻的下一条目标文本数据对应的语音数据的获得时刻作为第二获得时刻,并得到所述第一获得时刻与所述第二获得时刻之间的时间间隔;
将所述时间间隔添加至所述动词之后,以将该时间间隔的时长作为该动词的执行时长。
根据本申请的实施例,优选地,在上述菜谱生成方法中,所述方法还包括:
采用文本关键词提取算法对所述目标文本数据进行词性标注处理,以得到所述目标文本数据中的名词;
将所述名词与数据库中的预设烹饪食材名词进行对比,以判断是否存在所述预设烹饪食材名词与所述名词一致;
当存在所述预设烹饪食材名词与所述名词一致时,将该名词存储至所述文本菜谱中的食材列表。
根据本申请的实施例,优选地,在上述菜谱生成方法中,所述方法还包括:
将所述食材列表中的名词作为烹饪食材名词;
采用语义分析算法,判断所述目标文本数据中各所述烹饪食材名词的上下文中是否存在数词和与该数词对应的量词;
当存在时,将所述数词和与该数词对应的量词添加至所述食材列表中的烹饪食材名词之前。
根据本申请的实施例,优选地,在上述菜谱生成方法中,所述方法还包括:
采用文本关键词提取算法对所述文本菜谱进行词性标注处理,以得到所述文本菜谱中的停用词;
删除所述文本菜谱中的停用词。
第二方面,本申请提供了一种菜谱生成装置,包括:处理器和存储器,其中,所述处理器用于执行存储在存储器中的以下程序模块:
获得模块,用于将获得的多条语音数据转换为对应的多条文本数据,并记录获得多条所述语音数据的先后顺序;
提取模块,用于从每条所述文本数据中提取出包括烹饪词汇的目标文本数据;
排序模块,用于根据获得多条所述语音数据的先后顺序对多条所述目标文本数据进行排序汇总,以生成文本菜谱。
第三方面,本申请提供了一种存储介质,该存储介质存储的计算机程序,可被一个或多个处理器执行,可用来实现上述第一方面中任意一项的菜谱生成方法。
第四方面,本申请提供了一种电子设备,包括存储器和处理器,所述存储器上存储有能够被所述处理器执行的存储介质,该存储介质被所述处理器执行时实现上述第一方面中任意一项的菜谱生成方法。
与现有技术相比,上述方案中的一个或多个实施例可以具有如下优点或有益效果:通过将获得的多条语音数据转换为对应的多条文本数据,并记录获得多条所述语音数据的先后顺序;从每条所述文本数据中提取出包括烹饪词汇的目标文本数据;根据获得多条所述语音数据的先后顺序对多条所述目标文本数据进行排序汇总,以生成文本菜谱,从而解决了不能将菜品烹饪过程中的语音数据整理为文本菜谱的问题。
附图说明
通过结合附图阅读下文示例性实施例的详细描述可更好地理解本申请公开的范围。其中所包括的附图是:
图1为本申请实施例一提供的菜谱生成方法的流程图;
图2为本申请实施例二提供的菜谱生成方法的流程图。
在附图中,相同的部件使用相同的附图标记,附图并未按照实际的比例绘制。
具体实施方式
以下将结合附图及实施例来详细说明本申请的实施方式,借此对本申请如何应用技术手段来解决技术问题,并达到相应技术效果的实现过程能充分理解并据以实施。本申请实施例以及实施例中的各个特征,在不相冲突前提下可以相互结合,所形成的技术方案均在本申请的保护范围之内。
实施例一
请参阅图1,本申请实施例提供了一种菜谱生成方法,该方法包括步骤S110至步骤S130。
步骤S110,将获得的多条语音数据转换为对应的多条文本数据,并记录获得多条所述语音数据的先后顺序。
为了保证根据所述语音数据转换得到的文字数据的上下文的连贯性在本实施例中,可以是将获得的所有的语音数据进行汇总,并将所有所述语音数据一次性转换为文本数据:获得多条语音数据和每条所述语音数据的获得时刻,其中,每条所述语音数据的最后一个音节的结束时刻与该语音数据相邻的下一条语音数据的连续音节的起始音节的起始时刻之间的差值大于预设时间阈值,且每条语音数据包括的多个连续音节中任意相邻两个音节的结束时刻之间的时间间隔不大于所述预设时间阈值,每条所述语音数据的最后一个音节的结束时刻为该语音数据的获得时刻;将每条所述语音数据分别转换为与该条语音数据对应的文本数据。
可以理解,构成所述语音数据的最小单位为音节,每条所述语音数据由至少一个音节构成,在本实施例中,两个所述音节之间的时间间隔长度决定了两个所述音节是否属于同一条语音数据,即当两个所述音节之间的时间间隔长度小于或等于预设时间阈值时,所述两个音节属于同一条语音数据;当两个所述音节之间的时间间隔长度大于预设时间阈值时,所述两个音节不属于同一条语音数据,基于此,能够在获得的多个连续音节中任意两个相邻音节的结束时刻之间的时间间隔不大于所述预设时间阈值时,将所述连续音节视为一条语音数据。
为了提高将所述语音数据转换为文本数据的转换速度,在本实施例中,还可以是在每获得一条语音数据时,就将该语音数据转换为文本数据:在识别到连续音节的最后一个音节的结束时刻之后的预设时间阈值内未再次识别到音节时,获取该最后一个音节和与该最后一个音节对应的起始音节之间的语音数据,并将该结束时刻作为该语音数据的获得时刻,其中,所述连续音节中任意两个相邻音节的结束时刻之间的时间间隔不大于所述预设时间阈值;将所述语音数据转换为文本数据,从而得到多条语音数据分别对应的多条文本数据。
可以理解,在识别到连续音节的最后一个音节的结束时刻之后的预设时间阈值内未再次识别到音节时,表示该最后一个音节和与该最后一个音节对应的起始音节之间的语音数据为一条完整的语音数据,该结束时刻为该完整的语音数据的获得时刻。
具体的,当录制豆豉炒肉的语音数据时,当获得的语音数据“先放油”中的最后一个音节的结束时刻和相邻的下一条语音数据“然后把肉导进去炒一下”的起始音节的起始时刻之间的差值不大于所述预设时间阈值时,将语音数据“先放油”和语音数据“然后把肉导进去炒一下”合并为一句:先放油,然后把肉导进去炒一下;当获得的语音数据“然后放点盐,出锅”中的最后一个音节的结束时刻和相邻的下一条语音数据“把豆豉倒进去炒一下”的起始音节的起始时刻之间的差值大于所述预设时间阈值时,将语音数据“然后放点盐,出锅”和语音数据“把豆豉倒进去炒一下”分别视为两条语音数据。
在本实施例中,记录获得多条语音数据的先后顺序包括:根据多条所述语音数据的获得时刻,得到多条所述语音数据的先后顺序,其中,在先获得的语音数据的获得时刻早于在后获得的语音数据的获得时刻。
步骤S120,从每条所述文本数据中提取出包括烹饪词汇的目标文本数据。
可以理解,为了排除在录制语音菜谱的过程中混入与烹饪无关的其他语音数据,在本实施例中,只保留包括烹饪词汇的语音数据,并在包括烹饪词汇的语音数据转换得到的文本数据的基础上进行处理以得到最终的文本菜谱,其中,所述烹饪词汇包括烹饪动词和烹饪食材名词,所述预设烹饪动词包括但不限于:煎、炒、炸、煮、熬、炝、爆、氽、涮、焖、蒸以及炖,所述烹饪食材名词包括但不限于:调料名词、素类食材名词以及肉类食材名词。
为了在用户未明确阐述烹饪动词的执行时长时自动获得所述文本菜谱中烹饪动词的执行时长,在本实施例中,采用文本关键词提取算法对所述目标文本数据进行词性标注处理,以得到所述目标文本数据中的动词;将所述动词与数据库中的预设烹饪动词进行对比,以判断是否存在所述预设烹饪动词与所述动词一致;当存在所述预设烹饪动词与所述动词一致时,将与该动词所属的目标文本数据对应的语音数据的获得时刻作为第一获得时刻,将与该动词所属的目标文本数据相邻的下一条目标文本数据对应的语音数据的获得时刻作为第二获得时刻,并得到所述第一获得时刻与所述第二获得时刻之间的时间间隔;将所述时间间隔添加至所述动词之后,以将该时间间隔的时长作为该动词的执行时长。
可以理解,在录制语音数据的过程中,很有可能由于用户忙于手动操作而没有说明每个烹饪动作的执行时间长度,通常来说,用户在描述烹饪过程时,提及的烹饪动词的执行时间长度约等于包括烹饪动词的相邻语句之间的时间间隔,因此,能够在获得与所述烹饪动词所属的目标文本数据对应的语音数据的第一获得时刻,以及与该烹饪动词所属的目标文本数据相邻的下一条目标文本数据对应的语音数据的第二获得时刻后,将所述第一获得时刻与所述第二获得时刻之间的时间间隔的时长作为该烹饪动词的执行时长。
具体的,当获得的语音数据“先放油,然后把肉导进去炒一下”的第一获得时刻与相邻的下一条语音数据“然后放点盐,出锅”的第二获得时刻之间的时间间隔为30秒时,语音数据中与所述预设烹饪动词一致的动词为“炒”,根据本实施例中的方法,能够得知该动词“炒”的执行时长为所述第一获得时刻和所述第二获得时刻之间的时间间隔,即“炒”的执行时长为30秒。
应当说明的是,每条所述文本数据中包括的动词不一定都属于烹饪动词,当数据库中不存在所述预设烹饪动词与所述文本数据中包括的某个动词一致时,表示该动词不属于烹饪动词,因此不对该动词做处理。
为了提醒阅读和使用所述文本菜谱的用户在进行烹饪操作前将食材准备齐全,从而为用户带来良好的使用体验,在本实施例中,采用文本关键词提取算法对所述目标文本数据进行词性标注处理,以得到所述目标文本数据中的名词;将所述名词与数据库中的预设烹饪食材名词进行对比,以判断是否存在所述预设烹饪食材名词与所述名词一致;当存在所述预设烹饪食材名词与所述名词一致时,将该名词存储至所述文本菜谱中的食材列表。
可以理解,在录制语音数据时,用户可能会首先对烹饪过程中需要用到的食材进行总体介绍,也可能不会对烹饪过程中需要用到的食材进行总体介绍而直接开始烹饪,还可能在对烹饪过程中需要用到的食材进行总体介绍时遗漏了一些食材。因此,在本实施例中,当录制结束之后,本实施例中的菜谱生成方法会对所述目标文本数据中的名词进行词义判断,以确定所述名词是否属于烹饪食材名词,并在所述名词属于烹饪食材名词时,将该名词存储至所述文本菜谱中的食材列表,其中,所述食材列表为在首次查找到所述目标文本数据中的烹饪食材名词时创建的。
应当说明的是,每条所述文本数据中包括的动词不一定都属于烹饪食材名词,当数据库中不存在所述预设烹饪食材名词与所述文本数据中包括的某个名词一致时,表示该名词不属于烹饪食材名词,因此不对该名词进行处理。
为了明确所述食材列表中各烹饪食材的用量,从而引导使用所述文本菜谱的用户烹饪出理想口味的菜肴,在本实施例中,将所述食材列表中的名词作为烹饪食材名词;采用语义分析算法,判断所述目标文本数据中各所述烹饪食材名词的上下文中是否存在数词和与该数词对应的量词;当存在时,将所述数词和与该数词对应的量词添加至所述食材列表中的烹饪食材名词之前。
应当说明的是,当所述目标文本数据中各所述烹饪食材名词的上下文中不存在数词和与该数词对应的量词时,将预设词汇添加至所述食材列表中的名词之前,所述预设词汇包括但不限于:适量。
步骤S130,根据获得多条所述语音数据的先后顺序对多条所述目标文本数据进行排序汇总,以生成文本菜谱。
可以理解,为了保证文本菜谱的逻辑性以及烹饪过程的时序性,按照所述目标文本数据分别对应的语音数据的获得时刻的先后顺序对多条所述目标文本数据进行排序,并在每条所述目标文本数据前增加编号,以使阅读所述文本菜谱的用户能够按照可靠的顺序有条不紊地完成烹饪过程,其中,与在先获得的语音数据对应的目标文本数据的编号小于与在后获得的语音数据对应的目标文本数据的编号。
为了保证文本菜谱的可读性,在本实施例中,在生成文本菜谱之后,还可以采用文本关键词提取算法对所述文本菜谱进行词性标注处理,以得到所述文本菜谱中的停用词,并删除所述文本菜谱中的停用词。
可以理解,在录制语音数据的过程中,很有可能由于用户一边进行手动操作一边对操作步骤进行描述,导致获得的语音数据中存在很多口语化的词汇,所述口语化的词汇会降低所述语音数据转换得到的文本数据的可读性,其中,所述口语化的词汇包括但不限于:一下、两下、这以及那,通常来说,所述口语化的词汇多为停用词,因此,需要删除所述文本菜谱中的停用词。
为了进一步保证所述文本菜谱中内容的准确性,在本实施例中,在生成文本菜谱之后,将所述文本菜谱进行展示。
可以理解,对所述文本菜谱进行展示,以使录制与所述文本菜谱对应的语音数据的用户能够对该文本菜谱的内容进行手动编辑,从而确保所述文本菜谱能够展示出用户期望表达的烹饪过程。
实施例二
请参阅图2,本申请实施例提供了一种菜谱生成方法,该方法包括步骤S210至步骤S290。
步骤S210,接收用户发送的语音菜谱录制启动指令。
可以理解,可以将语音录制设备嵌入油烟机或者燃气灶等厨房内用品,从而在用户发出启动话术时启动菜谱的语音录制过程,其中,所述启动话术包括:开始录菜谱。在本实施例中,以生成豆豉炒肉的菜谱为例进行说明。
步骤S220,记录语音数据和每条语音数据的接收时刻。
可以理解,所述语音数据的接收时刻是指在识别到连续音节的最后一个音节的结束时刻之后的预设时间阈值内未再次识别到音节时,获取该最后一个音节和与该最后一个音节对应的起始音节之间的语音数据,并将该结束时刻作为该语音数据的接收时刻。
步骤S230,判断相邻的两条语音数据中在先接收的语音数据的接收时刻与在后接收的语音数据的接收时刻之间的差值是否大于预设时间阈值。
当小于或等于所述预设时间阈值时,执行步骤S231;当大于所述预设时间阈值时,执行步骤S240。
步骤S231,将两条语音数据合并为一句,并将所述语音数据转换为文本数据。
可以理解,当接收到的相邻的两条语音数据的获得时刻之间的差值较小时,表示这两条语音数据之间仅存在较短的停顿,可以将两条所述语音数据合并为一条语音数据,优选的,在本实施例中,所述预设时间阈值为10秒。
步骤S240,为两条语音数据按照接收时刻的先后顺序分别添加序号,并将两条所述语音数据分别转换为两条文本数据。
其中,在先接收到的语音数据的序号小于在后接收到的语音数据的序号。
可以理解,由两条所述语音数据转换得到的两条文本数据中也保留了所述语音数据的序号。
步骤S250,判断所述文本数据中是否包括首次出现的烹饪食材名词。
当所述文本数据中包括首次出现的烹饪食材名词时,执行步骤S260;当所述文本数据中的烹饪食材名词不是首次出现时,不作处理。
可以理解,由于在首次接收到烹饪食材名词时已经对该烹饪食材名词进行了存储,因此当再次接收到相同的烹饪食材名词时,不作处理。
步骤S260,将所述烹饪食材名词添加至食材列表。
可以理解,接收到用户发送的语音数据:先放油,然后把肉倒进去炒一下。记录该语音数据以及该语音数据的获得时刻,并将根据文本关键词提取算法将识别出的“油”和“肉”添加至食材列表,所述食材列表在首次识别到烹饪食材名词时创建,当后续再次识别到烹饪食材名词时,将再次识别到的烹饪食材名词添加至所述食材列表。
步骤S270,判断所述文本数据中所述烹饪食材名词的附近是否存在量词。
当所述文本数据中所述食材信息或调料信息的附近存在量词时,执行步骤S280;当所述文本数据中所述食材信息或调料信息的附近不存在量词时,执行步骤S271。
步骤S271,将预设词汇添加至所述食材列表中的烹饪食材名词之前。
可以理解,接收到用户发送的语音数据:然后把辣椒和蒜放进去炒一下,吃辣就多放点辣椒,蒜一颗差不多了,炒香了放点盐。根据文本关键词提取算法将识别出的“辣椒”,“多放点辣椒”整理为“适量辣椒”作为辣椒的用量,将识别出的“盐”,“放点盐”整理为“适量盐”作为盐的用量。
步骤S280,将所述数词和与该数词对应的量词添加至所述食材列表中的烹饪食材名词之前。
可以理解,接收到用户发送的语音数据:然后把辣椒和蒜放进去炒一下,吃辣就多放点辣椒,蒜一颗差不多了,炒香了放点盐。根据文本关键词提取算法将识别出的“蒜”,“蒜一颗”整理为“一颗蒜”作为该菜谱中蒜的用量。
步骤S290,将所述食材列表和所述文本数据合成为文本菜谱。
应当说明的是,在本实施例中,在获得所述文本菜谱之后,还可以继续对所述文本菜谱进行优化处理,例如删除所述文本菜谱中的停用词,所述停用词包括但不限于:一下、看看以及然后。
具体的,记录的语音数据对应的文本数据为:
启动话术:开始录制豆豉炒肉。
1.先放油,然后把肉倒进去炒一下。
2.然后放点盐,出锅。
3.把豆豉倒进去炒一下。
4.然后把辣椒和蒜放进去炒一下,吃辣就多放点辣椒,蒜一颗差不多了,炒香了放点盐。
5.看着差不多了就倒肉进去炒匀,放一勺辣椒粉。
6.然后你看看倒点开水,差不多把肉没过,开小火收汁。
7.出锅。
结束话术:录制结束。
根据本实施例的菜谱生成方法、获得的语音数据以及与该语音数据对应的文本数据,计算出“先放油,然后把肉倒进去炒一下”的获得时刻与相邻的下一条语音数据“.然后放点盐,出锅”之间的时间间隔为30秒,从而得出“炒”的执行时长为30秒;“把豆豉倒进去炒一下”的获得时刻与相邻的下一条语音数据“然后把辣椒和蒜放进去炒一下,吃辣就多放点辣椒,蒜一颗差不多了,炒香了放点盐”之间的时间间隔为12秒,从而得出“把豆豉倒进去炒一下”中的“炒”的执行时长为12秒;“然后把辣椒和蒜放进去炒一下,吃辣就多放点辣椒,蒜一颗差不多了,炒香了放点盐”的获得时刻与相邻的下一条语音数据“看着差不多了就倒肉进去炒匀,放一勺辣椒粉”之间的时间间隔为15秒,从而得出“然后把辣椒和蒜放进去炒一下,吃辣就多放点辣椒,蒜一颗差不多了,炒香了放点盐”中“炒”的执行时长为15秒,“然后你看看倒点开水,差不多把肉没过,开小火收汁”的获得时刻与相邻的下一条语音数据“出锅”之间的时间间隔为60秒,从而得出“收汁”的执行时长为60秒,最后合成的文本菜谱为:
食材列表:油、肉、盐、豆豉、辣椒、一颗蒜、一勺辣椒粉。
执行步骤:
1.放油,把肉倒进去炒30秒。
2.放适量盐,出锅。
3.把豆豉倒进去炒12秒。
4.把适量辣椒和一颗蒜放进去炒香,放适量盐炒15秒。
5.倒肉炒匀,放一勺辣椒粉。
6.倒开水把肉没过,小火收汁60秒。
7.出锅。
实施例三
本申请实施例还提供了一种菜谱生成装置,所述装置包括处理器,其中,所述处理器用于执行存储在存储器中的以下程序模块:
获得模块、提取模块以及排序模块,所述处理器可用于调用和执行所述存储器中的各模块,以将菜品烹饪过程中的语音数据整理为文本菜谱。
实施例四
本实施例还提供了一种存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,所述计算机程序被处理器执行时可以实现如实施例一或实施例二中的方法步骤。
上述方法步骤的具体实施例过程可参见实施例一或实施例二,本实施例在此不再赘述。
实施例五
本申请实施例还提供了一种电子设备,包括存储器和处理器,所述存储器上存储有能够被所述处理器执行的存储介质,该存储介质被所述处理器执行时实现如实施例一或实施例二中所述的菜谱生成方法。
其中,处理器用于执行如实施例一或实施例二中的菜谱生成方法中的全部或部分步骤。存储器用于存储各种类型的数据,这些数据例如可以包括电子设备中的任何应用程序或方法的指令,以及应用程序相关的数据。
综上所述,本申请提供的菜谱生成方法、装置、电子设备及存储介质,通过将获得的多条语音数据转换为对应的多条文本数据,并记录获得多条所述语音数据的先后顺序;从每条所述文本数据中提取出包括烹饪词汇的目标文本数据;根据获得多条所述语音数据的先后顺序对多条所述目标文本数据进行排序汇总,以生成文本菜谱,能够解决现有技术中存在的不能将菜品烹饪过程中的语音数据整理为文本菜谱的问题。
进一步地,通过采用文本关键词提取算法对所述目标文本数据进行词性标注处理,以得到所述目标文本数据中的动词;当所述动词为预设烹饪动词时,将与该动词所属的目标文本数据对应的语音数据的获得时刻作为第一获得时刻,将与该动词所属的目标文本数据相邻的下一条目标文本数据对应的语音数据的获得时刻作为第二获得时刻,并得到所述第一获得时刻与所述第二获得时刻之间的时间间隔;将所述时间间隔添加至所述动词之后,以将该时间间隔的时长作为该动词的执行时长,能够在用户未明确阐述烹饪动词的执行时长时自动获得所述文本菜谱中的烹饪动词的执行时长,从而提升了用户体验。
进一步地,通过采用文本关键词提取算法对所述目标文本数据进行词性标注处理,以得到所述目标文本数据中的多个名词;当所述名词为预设烹饪名词时,将该名词存储至所述文本菜谱中的食材列表,能够提醒阅读和使用所述文本菜谱的用户在进行烹饪操作前将食材准备齐全,从而为用户带来良好的使用体验。
在本申请实施例所提供的几个实施例中,应该理解到,所揭露的***和方法,也可以通过其它的方式实现。以上所描述的***和方法实施例仅仅是示意性的。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
虽然本申请所揭露的实施方式如上,但所述的内容只是为了便于理解本申请而采用的实施方式,并非用以限定本申请。任何本申请所属技术领域内的技术人员,在不脱离本申请所揭露的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本申请的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (11)

1.一种菜谱生成方法,其特征在于,所述方法包括:
将获得的多条语音数据转换为对应的多条文本数据,并记录获得多条所述语音数据的先后顺序;
从每条所述文本数据中提取出包括烹饪词汇的目标文本数据;
根据获得多条所述语音数据的先后顺序对多条所述目标文本数据进行排序汇总,以生成文本菜谱。
2.根据权利要求1所述的菜谱生成方法,其特征在于,将获得的多条语音数据转换为对应的多条文本数据包括:
获得多条语音数据和每条所述语音数据的获得时刻,其中,每条所述语音数据的最后一个音节的结束时刻与该语音数据相邻的下一条语音数据的连续音节的起始音节的起始时刻之间的差值大于预设时间阈值,且每条语音数据包括的多个连续音节中任意相邻两个音节的结束时刻之间的时间间隔不大于所述预设时间阈值,每条所述语音数据的最后一个音节的结束时刻为该语音数据的获得时刻;
将每条所述语音数据分别转换为与该条语音数据对应的文本数据。
3.根据权利要求1所述的菜谱生成方法,其特征在于,将获得的多条语音数据转换为对应的多条文本数据包括:
在识别到连续音节的最后一个音节的结束时刻之后的预设时间阈值内未再次识别到音节时,获取该最后一个音节和与该最后一个音节对应的起始音节之间的语音数据,并将该结束时刻作为该语音数据的获得时刻,其中,所述连续音节中任意两个相邻音节的结束时刻之间的时间间隔不大于所述预设时间阈值;
将所述语音数据转换为文本数据,从而得到多条语音数据分别对应的多条文本数据。
4.根据权利要求2或权利要求3所述的菜谱生成方法,其特征在于,记录获得多条语音数据的先后顺序包括:
根据多条所述语音数据的获得时刻,得到多条所述语音数据的先后顺序,其中,在先获得的语音数据的获得时刻早于在后获得的语音数据的获得时刻。
5.根据权利要求1所述的菜谱生成方法,其特征在于,所述方法还包括:
采用文本关键词提取算法对所述目标文本数据进行词性标注处理,以得到所述目标文本数据中的动词;
将所述动词与数据库中的预设烹饪动词进行对比,以判断是否存在所述预设烹饪动词与所述动词一致;
当存在所述预设烹饪动词与所述动词一致时,将与该动词所属的目标文本数据对应的语音数据的获得时刻作为第一获得时刻,将与该动词所属的目标文本数据相邻的下一条目标文本数据对应的语音数据的获得时刻作为第二获得时刻,并得到所述第一获得时刻与所述第二获得时刻之间的时间间隔;
将所述时间间隔添加至所述动词之后,以将该时间间隔的时长作为该动词的执行时长。
6.根据权利要求1所述的菜谱生成方法,其特征在于,所述方法还包括:
采用文本关键词提取算法对所述目标文本数据进行词性标注处理,以得到所述目标文本数据中的名词;
将所述名词与数据库中的预设烹饪食材名词进行对比,以判断是否存在所述预设烹饪食材名词与所述名词一致;
当存在所述预设烹饪食材名词与所述名词一致时,将该名词存储至所述文本菜谱中的食材列表。
7.根据权利要求6所述的菜谱生成方法,其特征在于,所述方法还包括:
将所述食材列表中的名词作为烹饪食材名词;
采用语义分析算法,判断所述目标文本数据中各所述烹饪食材名词的上下文中是否存在数词和与该数词对应的量词;
当存在时,将所述数词和与该数词对应的量词添加至所述食材列表中的烹饪食材名词之前。
8.根据权利要求1所述的菜谱生成方法,其特征在于,所述方法还包括:
采用文本关键词提取算法对所述文本菜谱进行词性标注处理,以得到所述文本菜谱中的停用词;
删除所述文本菜谱中的停用词。
9.一种菜谱生成装置,其特征在于,包括:处理器和存储器,其中,所述处理器用于执行存储在存储器中的以下程序模块:
获得模块,用于将获得的多条语音数据转换为对应的多条文本数据,并记录获得多条所述语音数据的先后顺序;
提取模块,用于从每条所述文本数据中提取出包括烹饪词汇的目标文本数据;
排序模块,用于根据获得多条所述语音数据的先后顺序对多条所述目标文本数据进行排序汇总,以生成文本菜谱。
10.一种存储介质,其特征在于,该存储介质存储的计算机程序,所述计算机程序被一个或多个处理器执行时,实现如权利要求1至8中任意一项中的菜谱生成方法。
11.一种电子设备,其特征在于,包括存储器和处理器,所述存储器上存储有计算机程序,该计算机程序被所述处理器执行时,执行如权利要求1至8中任意一项中的菜谱生成方法。
CN201911260664.0A 2019-12-10 2019-12-10 菜谱生成方法、装置、电子设备及存储介质 Pending CN111061857A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911260664.0A CN111061857A (zh) 2019-12-10 2019-12-10 菜谱生成方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911260664.0A CN111061857A (zh) 2019-12-10 2019-12-10 菜谱生成方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN111061857A true CN111061857A (zh) 2020-04-24

Family

ID=70300390

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911260664.0A Pending CN111061857A (zh) 2019-12-10 2019-12-10 菜谱生成方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111061857A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103413549A (zh) * 2013-07-31 2013-11-27 深圳创维-Rgb电子有限公司 语音交互的方法、***以及交互终端
CN105488339A (zh) * 2015-11-25 2016-04-13 珠海优特电力科技股份有限公司 数字菜谱生成方法和***
CN107077529A (zh) * 2014-11-05 2017-08-18 皇家飞利浦有限公司 用于食谱管理的方法和***
CN109213777A (zh) * 2017-06-29 2019-01-15 杭州九阳小家电有限公司 一种基于语音的食谱处理方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103413549A (zh) * 2013-07-31 2013-11-27 深圳创维-Rgb电子有限公司 语音交互的方法、***以及交互终端
CN107077529A (zh) * 2014-11-05 2017-08-18 皇家飞利浦有限公司 用于食谱管理的方法和***
CN105488339A (zh) * 2015-11-25 2016-04-13 珠海优特电力科技股份有限公司 数字菜谱生成方法和***
CN109213777A (zh) * 2017-06-29 2019-01-15 杭州九阳小家电有限公司 一种基于语音的食谱处理方法及***

Similar Documents

Publication Publication Date Title
Taft Recognition of affixed words and the word frequency effect
CN101840414B (zh) 从网络文本创建动画的设备和方法
CN106485052A (zh) 一种智能烹饪***及方法
CN114938360A (zh) 一种基于即时通讯应用的数据处理方法和装置
CN104473556A (zh) 烹饪设备的控制方法及装置以及烹饪设备
JP5043209B2 (ja) 集合拡張処理装置、集合拡張処理方法、プログラム、及び、記録媒体
KR101874604B1 (ko) 창작 레시피 생성방법
CN111061857A (zh) 菜谱生成方法、装置、电子设备及存储介质
CN109213777A (zh) 一种基于语音的食谱处理方法及***
CN114373444A (zh) 一种基于蒙太奇的语音合成方法、***及设备
CN109191225A (zh) 订单生成方法、装置、订单处理方法和服务器
CN108846028A (zh) 文章投放方法、介质、装置和计算设备
CN107851094A (zh) 菜单生成***
CN111145048A (zh) 一种菜谱的制作方法和装置
CN110968748A (zh) 一种电子菜谱的处理方法、装置及***
Guggenheim The Proof Is In the Pudding. On'Truth to Materials' in STS, Followed by an Attempt to Improve It
CN110738051A (zh) 菜名实体识别方法、装置、电子设备及存储介质
CN109903757A (zh) 语音处理方法、装置、计算机可读存储介质和服务器
CN110610753A (zh) 一种食谱推荐方法、设备、***及计算机可读存储介质
JP6918695B2 (ja) 情報処理装置及びプログラム
CN112581954A (zh) 一种高匹配性语音交互方法和智能设备
CN111414450A (zh) 标准化菜谱生成方法、装置、存储介质及程序模块构架
CN110569348A (zh) 一种食谱调整方法、设备及可读存储介质
CN111414396A (zh) 菜品推送方法、装置、存储介质和烹饪设备
CN106547757B (zh) 匹配关键词与创意内容的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200424

RJ01 Rejection of invention patent application after publication