CN112116905A - 一种将备忘录信息转化为闹钟播放的方法及装置 - Google Patents

一种将备忘录信息转化为闹钟播放的方法及装置 Download PDF

Info

Publication number
CN112116905A
CN112116905A CN202010974410.1A CN202010974410A CN112116905A CN 112116905 A CN112116905 A CN 112116905A CN 202010974410 A CN202010974410 A CN 202010974410A CN 112116905 A CN112116905 A CN 112116905A
Authority
CN
China
Prior art keywords
memo information
alarm clock
text
information
converting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010974410.1A
Other languages
English (en)
Other versions
CN112116905B (zh
Inventor
李梦瑶
贾巨涛
韩林峄
王彬
李�瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Zhuhai Lianyun Technology Co Ltd
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Zhuhai Lianyun Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai, Zhuhai Lianyun Technology Co Ltd filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN202010974410.1A priority Critical patent/CN112116905B/zh
Publication of CN112116905A publication Critical patent/CN112116905A/zh
Application granted granted Critical
Publication of CN112116905B publication Critical patent/CN112116905B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • G08B21/18Status alarms
    • G08B21/24Reminder alarms, e.g. anti-loss alarms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Acoustics & Sound (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Emergency Management (AREA)
  • Electric Clocks (AREA)

Abstract

本发明提供一种将备忘录信息转化为闹钟播放的方法及装置,其中该方法包括如下步骤:S01、获取备忘录信息。S02、对备忘录信息进行处理并整理成可播报文本。S03、将可播报文本通过TTS合成语音进行播报。本发明提供的将备忘录信息转化为闹钟播放的方法及装置,能够将备忘录内记录的每日任务信息制作成闹钟播报的内容,在每天起床闹钟中播报出来,将会是对一天任务的提醒,同时也是起床的动力。另外,在闹钟设置中结合时间、天气等其他因素改变播放的声音风格,可以根据实际场景自动变换,也可满足用户个性化的需求。

Description

一种将备忘录信息转化为闹钟播放的方法及装置
技术领域
本发明涉及计算机应用技术领域,具体涉及一种将备忘录信息转化为闹钟播放的方法及装置。
背景技术
随着当代人生活越来越急促,人们使用闹钟提醒的功能也越来越频繁。目前市面上的关于闹钟播报的内容无非就是播放音乐、播放时间、播放天气情况等相关信息。而目前的工作者已经习惯于将每天的任务记录在备忘录或者便签之类的软件上,方便每日任务规划和对每日任务有一个清晰的获取。因此,现有技术中的闹钟的提醒功能和备忘录的提醒功能互相分离,不能满足日益增加的用户体验需求和个性化需求。
发明内容
本发明要解决的技术问题是克服现有技术的不足,提供一种将备忘录信息转化为闹钟播放的方法及装置,能够将备忘录内记录的每日任务信息制作成闹钟播报的内容,在每天起床闹钟中播报出来,将会是对一天任务的提醒,同时也是起床的动力。另外,在闹钟设置中结合时间、天气等其他因素改变播放的声音风格,可以根据实际场景自动变换,也可满足用户个性化的需求。
为了解决上述技术问题,本发明提出的技术方案为:
一种将备忘录信息转化为闹钟播放的方法,包括如下步骤:S01、获取备忘录信息。S02、对备忘录信息进行处理并整理成可播报文本。S03、将可播报文本通过TTS合成语音进行播报。
根据本发明的将备忘录信息转化为闹钟播放的方法,能够将备忘录内记录的每日任务信息制作成闹钟播报的呢绒,在每天起床闹钟中播报出来,完成对用户一天任务的提醒,同时也是起床的动力,从而能够满足日益增加的用户体验需求和个性化需求。
对于上述技术方案,还可进行如下所述的进一步的改进。
根据本发明的将备忘录信息转化为闹钟播放的方法,在一个优选的实施方式中,备忘录信息包括文本类信息、图像和音频。
将备忘录信息的多样化,能够更进一步地满足日益增加的用户体验需求和个性化需求。
进一步地,在一个优选的实施方式中,步骤S02包括如下子步骤:S021、采用自然语言理解(NLU)和自然语言合成(NLG)对备忘录信息中的文本进行自然语言处理,采用数字图像处理技术和音频处理技术对备忘录信息中的图像和音频进行处理,并整理成用于容易理解和符合用户特性的文本。
由于备忘录中的信息,要么过于繁琐,内容较多,长篇大论,要么过于简单,只是记录关键词句,逻辑混乱,不成篇章,通过上述处理,能够有效对备忘录信息进行处理并整理成人们容易理解且复合用户特性的文本句子。
进一步地,在一个优选的实施方式中,步骤S02还包括如下子步骤:S022、对经过S021处理后的文本进行情感倾向分析。
在获取到处理后的文本之后,可根据文本内容进行情感倾向分析,获得较为精确的情感倾向分析结果。
具体地,在一个优选的实施方式中,步骤S03包括如下子步骤:S031、制定情感定义规则。S032、分配影响情感情绪的客观因素和经过所述子步骤S022获取的情感倾向分析结果的占比,得到一个情感系数。S033、根据情感系数和情感定义规则确定情感具体类型。S034、根据情感类型选择声音风格,使用TTS合成相应的语音进行播报。
通过上述步骤,能够很好地实现在闹钟设置中结合时间、天气等其他因素改变播放的声音风格,可以根据实际场景自动变换,也可满足用户个性化的需求。
具体地,在一个优选的实施方式中,影响情感情绪的客观因素至少包括天气、时间和日期。
天气、时间和日期等影响情感情绪的客观因素能够对情感分析结果的精确性起到辅助作用。
具体地,在一个优选的实施方式中,影响情感情绪的客观因素的占比为10%~30%,情感倾向分析的占比分别为70%~90%。
因为客观因素较多,且不确定因素较多,比较难以控制和定量分析,因此所占比重适当减少,而文本的情感倾向分析技术相对较好,因此比重适当增加,天气等其他因素只能起到辅助作用,这样能够得到一个更加精确的情感系数。
根据本发明第二方面的将备忘录信息转化为闹钟播放的装置,包括:读取模块,用于获取备忘录信息。处理模块,用于对备忘录信息进行处理并整理成可播报文本。转换模块,用于将可播报文本转换成语音进行播报。
显然,根据本发明的将备忘录信息转化为闹钟播放的装置,能够很好地实施上述所述方法,能够将备忘录内记录的每日任务信息制作成闹钟播报的内容,在每天起床闹钟中播报出来,将会是对一天任务的提醒,同时也是起床的动力。另外,在闹钟设置中结合时间、天气等其他因素改变播放的声音风格,可以根据实际场景自动变换,也可满足用户个性化的需求。
对于上述技术方案,还可进行如下所述的进一步的改进。
具体地,在一个优选的实施方式中,处理模块包括:自然语言处理模块,用于对备忘录信息中的文本进行自然语言处理。数字图像处理模块,用于对备忘录信息中的图像转化为文本信息。音频处理模块,用于对对备忘录信息中的音频转化为文本信息。
进一步地,在一个优选的实施方式中,本发明的将备忘录信息转化为闹钟播放的装置还包括:情感倾向分析模块,用于对可播报文本进行情感倾向分析。情感定义模块,用于制定情感定义规则、获取情感系数、根据情感系数和情感定义规则确定情感具体类型和根据情感类型选择声音风格。
相比现有技术,本发明的优点在于:能够将备忘录内记录的每日任务信息制作成闹钟播报的内容,在每天起床闹钟中播报出来,将会是对一天任务的提醒,同时也是起床的动力。另外,在闹钟设置中结合时间、天气等其他因素改变播放的声音风格,可以根据实际场景自动变换,也可满足用户个性化的需求。
附图说明
在下文中将基于实施例并参考附图来对本发明进行更详细的描述。其中:
图1示意性显示了本发明实施例的将备忘录信息转化为闹钟播放的方法的框架原理。
在附图中,相同的部件使用相同的附图标记。附图并未按照实际的比例绘制。
具体实施方式
下面将结合附图和具体实施例对本发明作进一步详细说明,但并不因此而限制本发明的保护范围。
图1示意性显示了本发明实施例的将备忘录信息转化为闹钟播放的方法的框架原理。
实施例1
如图1所示,本发明实施例的将备忘录信息转化为闹钟播放的方法,包括如下步骤:S01、获取备忘录信息。S02、对备忘录信息进行处理并整理成可播报文本。S03、将可播报文本通过TTS合成语音进行播报。
根据本发明的将备忘录信息转化为闹钟播放的方法,能够将备忘录内记录的每日任务信息制作成闹钟播报的呢绒,在每天起床闹钟中播报出来,完成对用户一天任务的提醒,同时也是起床的动力,从而能够满足日益增加的用户体验需求和个性化需求。
具体地,在本实施例中,备忘录信息包括文本类信息、图像和音频。将备忘录信息的多样化,能够更进一步地满足日益增加的用户体验需求和个性化需求。进一步地,在本实施例中,如图1所示,步骤S02包括如下子步骤:S021、采用自然语言理解(NLU)和自然语言合成(NLG)对备忘录信息中的文本进行自然语言处理(NLP),采用数字图像处理技术和音频处理技术对备忘录信息中的图像和音频进行处理,并整理成用于容易理解和符合用户特性的文本。由于备忘录中的信息,要么过于繁琐,内容较多,长篇大论,要么过于简单,只是记录关键词句,逻辑混乱,不成篇章,通过上述处理,能够有效对备忘录信息进行处理并整理成人们容易理解且复合用户特性的文本句子。
如图1所示,进一步地,在本实施例中,步骤S02还包括如下子步骤:S022、对经过S021处理后的文本进行情感倾向分析。在获取到处理后的文本之后,可根据文本内容进行情感倾向分析,获得较为精确的情感倾向分析结果。具体地,在本实施例中,步骤S03包括如下子步骤:S031、制定情感定义规则:根据客观因素和情感倾向分析结果确定各种情感的情感系数范围。S032、分配影响情感情绪的客观因素和经过所述子步骤S022获取的情感倾向分析结果的占比,得到一个情感系数。S033、根据情感系数和情感定义规则确定情感具体类型。S034、根据情感类型选择声音风格,使用TTS(Text To Speech)合成相应的语音进行播报。通过上述步骤,能够很好地实现在闹钟设置中结合时间、天气和日期和可播报文本等相关信息,确定此时需要播报的声音风格,通过不通过的风格,将所需播报文本合成个性化语音进行播报,可以根据实际场景自动变换,也可满足用户个性化的需求。
具体地,在本实施例中,影响情感情绪的客观因素至少包括天气、时间和日期。天气、时间和日期等影响情感情绪的客观因素能够对情感分析结果的精确性起到辅助作用。优选地,在本实施例中,影响情感情绪的客观因素的占比为30%,情感倾向分析的占比分别为70%。因为客观因素较多,且不确定因素较多,比较难以控制和定量分析,因此所占比重适当减少,而文本的情感倾向分析技术相对较好,因此比重适当增加,天气等其他因素只能起到辅助作用,这样能够得到一个更加精确的情感系数。
实施例2
本发明实施例的将备忘录信息转化为闹钟播放的装置,包括:读取模块,用于获取备忘录信息。处理模块,用于对备忘录信息进行处理并整理成可播报文本。转换模块,用于将可播报文本转换成语音进行播报。
显然,根据本发明的将备忘录信息转化为闹钟播放的装置,能够很好地实施上述所述方法,能够将备忘录内记录的每日任务信息制作成闹钟播报的内容,在每天起床闹钟中播报出来,将会是对一天任务的提醒,同时也是起床的动力。另外,在闹钟设置中结合时间、天气等其他因素改变播放的声音风格,可以根据实际场景自动变换,也可满足用户个性化的需求。
具体地,在本实施例中,处理模块包括:自然语言处理模块,用于对备忘录信息中的文本进行自然语言处理。数字图像处理模块,用于对备忘录信息中的图像转化为文本信息。音频处理模块,用于对对备忘录信息中的音频转化为文本信息。
进一步地,在本实施例中,将备忘录信息转化为闹钟播放的装置还包括:情感倾向分析模块,用于对可播报文本进行情感倾向分析。情感定义模块,用于制定情感定义规则、获取情感系数、根据情感系数和情感定义规则确定情感具体类型和根据情感类型选择声音风格。
根据上述实施例,可见,本发明涉及的将备忘录信息转化为闹钟播放的方法及装置,能够将备忘录内记录的每日任务信息制作成闹钟播报的内容,在每天起床闹钟中播报出来,将会是对一天任务的提醒,同时也是起床的动力。另外,在闹钟设置中结合时间、天气等其他因素改变播放的声音风格,可以根据实际场景自动变换,也可满足用户个性化的需求。
虽然已经参考优选实施例对本发明进行了描述,但在不脱离本发明的范围的情况下,可以对其进行各种改进并且可以用等效物替换其中的部件。尤其是,只要不存在结构冲突,各个实施例中所提到的各项技术特征均可以任意方式组合起来。本发明并不局限于文中公开的特定实施例,而是包括落入权利要求的范围内的所有技术方案。

Claims (10)

1.一种将备忘录信息转化为闹钟播放的方法,其特征在于,包括如下步骤:
S01、获取备忘录信息;
S02、对备忘录信息进行处理并整理成可播报文本;
S03、将可播报文本通过TTS合成语音进行播报。
2.根据权利要求1所述的将备忘录信息转化为闹钟播放的方法,其特征在于,所述备忘录信息包括文本类信息、图像和音频。
3.根据权利要求2所述的将备忘录信息转化为闹钟播放的方法,其特征在于,所述步骤S02包括如下子步骤:
S021、采用NLU和NLG对备忘录信息中的文本进行自然语言处理,采用数字图像处理技术和音频处理技术对备忘录信息中的图像和音频进行处理,并整理成用于容易理解和符合用户特性的文本。
4.根据权利要求3所述的将备忘录信息转化为闹钟播放的方法,其特征在于,所述步骤S02还包括如下子步骤:
S022、对经过S021处理后的文本进行情感倾向分析。
5.根据权利要求4所述的将备忘录信息转化为闹钟播放的方法,其特征在于,所述步骤S03包括如下子步骤:
S031、制定情感定义规则;
S032、分配影响情感情绪的客观因素和经过所述子步骤S022获取的情感倾向分析结果的占比,得到一个情感系数;
S033、根据情感系数和情感定义规则确定情感具体类型;
S034、根据情感类型选择声音风格,使用TTS合成相应的语音进行播报。
6.根据权利要求5所述的将备忘录信息转化为闹钟播放的方法,其特征在于,影响情感情绪的客观因素至少包括天气、时间和日期。
7.根据权利要求5所述的将备忘录信息转化为闹钟播放的方法,其特征在于,影响情感情绪的客观因素的占比为10%~30%,情感倾向分析的占比分别为70%~90%。
8.一种将备忘录信息转化为闹钟播放的装置,其特征在于,包括:
读取模块,用于获取备忘录信息;
处理模块,用于对备忘录信息进行处理并整理成可播报文本;
转换模块,用于将可播报文本转换成语音进行播报。
9.根据权利要求8所述的将备忘录信息转化为闹钟播放的装置,其特征在于,所述处理模块包括:
自然语言处理模块,用于对备忘录信息中的文本进行自然语言处理;
数字图像处理模块,用于对备忘录信息中的图像转化为文本信息;
音频处理模块,用于对对备忘录信息中的音频转化为文本信息。
10.根据权利要求8或9所述的将备忘录信息转化为闹钟播放的装置,其特征在于,还包括:
情感倾向分析模块,用于对可播报文本进行情感倾向分析;
情感定义模块,用于制定情感定义规则、获取情感系数、根据情感系数和情感定义规则确定情感具体类型和根据情感类型选择声音风格。
CN202010974410.1A 2020-09-16 2020-09-16 一种将备忘录信息转化为闹钟播放的方法及装置 Active CN112116905B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010974410.1A CN112116905B (zh) 2020-09-16 2020-09-16 一种将备忘录信息转化为闹钟播放的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010974410.1A CN112116905B (zh) 2020-09-16 2020-09-16 一种将备忘录信息转化为闹钟播放的方法及装置

Publications (2)

Publication Number Publication Date
CN112116905A true CN112116905A (zh) 2020-12-22
CN112116905B CN112116905B (zh) 2023-04-07

Family

ID=73803646

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010974410.1A Active CN112116905B (zh) 2020-09-16 2020-09-16 一种将备忘录信息转化为闹钟播放的方法及装置

Country Status (1)

Country Link
CN (1) CN112116905B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113850083A (zh) * 2021-08-17 2021-12-28 北京百度网讯科技有限公司 确定播报风格的方法、装置、设备和计算机存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006023592A (ja) * 2004-07-08 2006-01-26 Sony Corp 音声合成装置及び音声合成方法
CN101471988A (zh) * 2007-12-24 2009-07-01 康佳集团股份有限公司 一种移动终端中的闹钟提醒装置及闹钟提醒的实现方法
CN103079003A (zh) * 2012-12-28 2013-05-01 广东欧珀移动通信有限公司 一种移动终端的闹钟提醒方法及装置
WO2016106574A1 (zh) * 2014-12-30 2016-07-07 深圳市柔宇科技有限公司 语音备忘录***及语音备忘录的生成方法及电子装置
CN108962217A (zh) * 2018-07-28 2018-12-07 华为技术有限公司 语音合成方法及相关设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006023592A (ja) * 2004-07-08 2006-01-26 Sony Corp 音声合成装置及び音声合成方法
CN101471988A (zh) * 2007-12-24 2009-07-01 康佳集团股份有限公司 一种移动终端中的闹钟提醒装置及闹钟提醒的实现方法
CN103079003A (zh) * 2012-12-28 2013-05-01 广东欧珀移动通信有限公司 一种移动终端的闹钟提醒方法及装置
WO2016106574A1 (zh) * 2014-12-30 2016-07-07 深圳市柔宇科技有限公司 语音备忘录***及语音备忘录的生成方法及电子装置
CN108962217A (zh) * 2018-07-28 2018-12-07 华为技术有限公司 语音合成方法及相关设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113850083A (zh) * 2021-08-17 2021-12-28 北京百度网讯科技有限公司 确定播报风格的方法、装置、设备和计算机存储介质

Also Published As

Publication number Publication date
CN112116905B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN105845125B (zh) 语音合成方法和语音合成装置
US11159597B2 (en) Systems and methods for artificial dubbing
He et al. Open-source multi-speaker speech corpora for building Gujarati, Kannada, Malayalam, Marathi, Tamil and Telugu speech synthesis systems
US10891928B2 (en) Automatic song generation
Schultz et al. Multilingual speech processing
CN107516509B (zh) 用于新闻播报语音合成的语音库构建方法及***
Hay et al. Oprah and/ay: Lexical frequency, referee design and style
US20100324909A1 (en) Method and system for processing messages within the framework of an integrated message system
US20200166670A1 (en) Personalizing weather forecast
CN110534088A (zh) 语音合成方法、电子装置及存储介质
Campbell On the use of nonverbal speech sounds in human communication
Minutella (Re) Creating Language Identities in Animated Films: Dubbing Linguistic Variation
CN110149548A (zh) 视频配音方法、电子装置和可读存储介质
Yaeger-Dror Linguistic analysis of dialect “correction” and its interaction with cognitive salience.
JP2014222290A (ja) 議事録記録装置、議事録記録方法及びプログラム
CN112116905B (zh) 一种将备忘录信息转化为闹钟播放的方法及装置
CN108986785B (zh) 一种文本改编方法及装置
CN116312471A (zh) 语音迁移、语音交互方法、装置、电子设备及存储介质
Coleman et al. Mining a year of speech
CN116129868A (zh) 一种结构化画本的生成方法和生成***
Van-Mol Arabic oral media and corpus linguistics: A first methodological outline
Vella et al. What can a corpus tell us about phonetic and phonological variation?
Schaefer Narrative storyline marking in Safaliba: Determining the meaning and discourse function of a typologically-suspect pronoun set
O’Connell et al. Where do interjections come from? A psycholinguistic analysis of Shaw’s Pygmalion
GoÑl-Alsúa Two Translations of a Cockney Girl in Shaw’s Pygmalion: The Works of Julio Broutá and Floreal Mazía

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant