CN109040211A - 一种基于语音识别的内容推送方法及*** - Google Patents

一种基于语音识别的内容推送方法及*** Download PDF

Info

Publication number
CN109040211A
CN109040211A CN201810817481.3A CN201810817481A CN109040211A CN 109040211 A CN109040211 A CN 109040211A CN 201810817481 A CN201810817481 A CN 201810817481A CN 109040211 A CN109040211 A CN 109040211A
Authority
CN
China
Prior art keywords
user
content
speech recognition
mode
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810817481.3A
Other languages
English (en)
Inventor
林依柳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN201810817481.3A priority Critical patent/CN109040211A/zh
Publication of CN109040211A publication Critical patent/CN109040211A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/66Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明提供一种基于语音识别的内容推送方法及***。该方法包括:获取用户的语音信息,识别用户的特征;根据用户的特征,向用户推送内容。该***包括:语音获取模块、语音识别模块和推送模块。本发明的方法解放了用户双手触摸点击屏幕的步骤,减少了进入更深层次操作的自定义设置,能够依据声音识别用户的性别、年龄段和情绪,并智能推送以及调整合适的内容和切换使用模式。

Description

一种基于语音识别的内容推送方法及***
技术领域
本发明涉及一种基于语音识别的内容推送方法及***。
背景技术
目前,一些商店的广告机可以先通过人脸检测技术获取顾客的脸部特征信息,然后将用户群体划分为不同的性别和年龄段,按照不同的客户类型智能推送相关的商品广告。该方法可以迎合不同人群的喜好和需求,提高了广告的推送效果,但是由于人脸检测技术存在不确定性,顾客面部的表情、遮挡物以及光照条件等都能影响到人脸识别结果的准确性。
随着语音识别技术的发展,已经广泛应用于消费者设备、安全***、交通工具、电话和各种技术中。语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文档或命令的高技术。如专利“一种移动终端问候语的输出方法”,该方法根据用户的语音信息中的基因频率获取用户的性别,然后根据预先存储的对应关系,获取与用户的性别对应的问候语及对应的声音类型,最后输出该对应的问候语。这种方案提高了问候语的多样性及适应性,但是只解决了移动终端问候语固定的问题,输出内容单一,智能化程度不能满足用户的需求。而且该方法中只能识别用户的性别,没有对用户的其他特征,如年龄、情绪等进行识别归类,用户体验差。
另外,目前在同一个移动终端上可以由不同的用户选择自己的使用模式,但是都必须要通过一些特殊设定的解锁或者进入条件才可以,操作复杂,且容易误选择为其他人的模式。
发明内容
为了解决上述现有技术中存在的技术缺陷,本发明的目的在于提供一种基于语音识别的内容推送方法及***。
本发明方法采用的技术方案如下:
一种基于语音识别的内容推送方法,包括:获取用户的语音信息,识别用户的特征;根据用户的特征,向用户推送内容。
进一步地,用户的特征包括性别和/或年龄段。
进一步地,用户的特征还包括情绪。
进一步地,用户的类型具体包括:成年男性、成年女性、儿童和/或老人。
进一步地,当用户的类型为儿童时,推送的内容中不包含不良的内容以及游戏。
进一步地,根据用户的特征,切换用户的使用模式。
进一步地,用户的使用模式包括成年男性模式、成年女性模式、儿童模式和/或老人模式。
进一步地,当用户的使用模式为老人模式时,调节显示的字体、音量以及显示亮度。
本发明一种基于语音识别的内容推送***,包括:语音获取模块,用于获取语音信息;语音识别模块,用于识别用户的特征;推送模块,用于向用户推送内容。
进一步地,内容推送***还包括模式切换模块,用于切换用户的使用模式。
本发明的方法解放了用户双手触摸点击屏幕的步骤,减少了进入更深层次操作的自定义设置,能够依据声音识别用户的性别、年龄段和情绪,并智能推送以及调整合适的内容和切换使用模式。相比现有技术,本发明具有以下有益效果:
(1)能够提高效率。***自动推送用户感兴趣的内容,让智能移动终端更懂用户,提高了用户的体验效果。
(2)更加智能。可以为不同年龄段的用户提供更智能合适的场景使用模式,减少了现有选择模式的特殊、复杂的设定。
(3)更加贴心。针对老人群体,可以为用户调节好字体大小、音量及显示亮度。
(4)更加专业。为用户打造和推送合适的应用APP,全方位地读懂用户和提升用户体验,且智能推送的为大多数用户可能会使用的APP。
附图说明
图1是本发明方法的流程图。
图2是本发明实施例中方法的流程图。
图3是本发明实施例的***框架图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
如图1所示,本发明一种基于语音识别的内容推送方法,包括:获取用户的语音信息,根据语音信息识别用户的特征,针对用户的特征向用户自动推送相关内容及自动切换用户的使用模式。
实施例1
本实施例通过辨别说话声音的音色、音量和语气智能识别出性别、年龄段和情绪,***给用户智能推荐相关内容和内置APP,如给女生推送居家的、化妆品、美颜APP等内容,给男生推送数码产品和汽车男人装等内容和APP,若是老人自动调整手机字体大小,若是小孩则屏蔽相关不良内容,还可以依据情绪的起伏推送搞笑的内容,以更加人性化的了解使用者,为用户提供一个量身定制的***。
本实施例的方法流程图如图2所示,具体实现过程为:
用户与智能终端进行语音对话,或者通过语音进行解锁,使得智能终端获取到用户的声音。然后通过辨别声音的音色、音量和语气,识别出用户的性别(男或女)、年龄段(如儿童、成年人和老人)以及情绪(如愉快、伤心、烦躁等)。根据识别的结果,智能切换到符合用户特点的使用模式,以及向用户推荐适合的内容和应用APP。
其中,推荐的内容为用户平时比较关注和感兴趣的,推送方式可以通过网页的形式,也可以通过短信或微信的方式。APP可以推荐一些使用频率较高的、评分较高的APP。
本实施例中,智能识别出用户的性别、年龄段和情绪,是通过提取语音信息中的基音周期来实现的。以语音信号的基音检测为研究对象,采用变换法,将语音信号变换到频域或者倒谱域来估计基音周期,利用同态分析方法将声道的影响消除,得到属于激励部分的信息,进一步求取基音周期。将获得的基音周期分类,分别对应不同的人群。
本实施例几种识别结果的具体示例如下:
(1)当识别的语音信号的基音周期为0-200hz时,将用户的性别和年龄段判定为:成年男性。此时,可自动切换至成年男性模式,该模式下可以采用一些炫酷的界面等。
根据该识别的结果,自动向用户智能推送一些有关高科技的数码产品、汽车信息、金融类内容、股票内容、逻辑思维、健身知识、时事新闻和男人装杂志等等符合现代男性气质的和感兴趣的内容和APP。
(2)当识别的语音信号的基音周期为200—500hz,将用户的性别和年龄段判定为:成年女性。此时,可自动切换至成年女性模式,该模式下可以加载一些轻柔的音乐背景,或者采用色彩绚丽的页面等。
根据该识别的结果,向用户智能推送一些有关情感、时尚、潮流类、人生哲学、居家家具电器和化妆品、新鲜事物、影视作品、日常生活、饮食方面的健身减肥等等相关女生感兴趣的内容和APP。
(3)当识别的语音信号的基音周期为260-880hz,将用户所属群体判定为:儿童。此时,可自动切换至儿童模式,内置各类帮助提高效率的学习内容和APP供用户使用。
根据该识别的结果,向用户智能推送一些学习相关信息,并且屏蔽相关不良网站的内容和各种游戏,给孩子营造一个良好的上网环境。
(4)当识别的语音信号的基音周期为80hz-160hz,将用户所属群体判定为:老人。此时,可自动切换至老人模式,智能调大智能终端的字体,调高智能终端的音量,调节智能终端上适宜的显示亮度,并且简化相关功能,方便老人的正常使用。
根据该识别的结果,向用户智能推送一些具有年代感的歌曲和影视剧、国学国粹、时事新闻、养生类的内容和APP。
(5)当识别出用户处于不开心或者情绪低落时,则自动推送一些积极向上正能量的内容和能让人解压和简单的小游戏,并适时地推送一些幽默的笑话、影视或者小视频,争取与用户进行对话,让用户开心;或者采用显示语调欢快的音乐歌单,提醒用户去外面散心等方式。
实施例2
如图3所示,本实施例提供一种基于语音识别的内容推送***,可应用在智能终端上。该***包括:语音获取模块,用于获取用户输入的语音信息;语音识别模块,用于根据语音信息识别用户的特征,如;性别、年龄段或者情绪;推送模块,根据用户的特征,向用户推送符合用户特点的内容;模式切换模块,用于切换用户的使用模式,如:成年男性模式、成年女性模式、儿童模式或者老人模式。

Claims (10)

1.一种基于语音识别的内容推送方法,其特征在于,包括:
获取用户的语音信息,识别用户的特征;根据用户的特征,向用户推送内容。
2.根据权利要求1所述的一种基于语音识别的内容推送方法,其特征在于,用户的特征包括性别和/或年龄段。
3.根据权利要求2所述的一种基于语音识别的内容推送方法,其特征在于,用户的特征还包括情绪。
4.根据权利要求2所述的一种基于语音识别的内容推送方法,其特征在于,根据用户的特征,用户的类型具体包括:成年男性、成年女性、儿童和/或老人。
5.根据权利要求4所述的一种基于语音识别的内容推送方法,其特征在于,当用户的类型为儿童时,推送的内容中不包含不良的内容以及游戏。
6.根据权利要求1至5之一所述的一种基于语音识别的内容推送方法,其特征在于,根据用户的特征,切换用户的使用模式。
7.根据权利要求6所述的一种基于语音识别的内容推送方法,其特征在于,用户的使用模式包括成年男性模式、成年女性模式、儿童模式和/或老人模式。
8.根据权利要求7所述的一种基于语音识别的内容推送方法,其特征在于,当用户的使用模式为老人模式时,调节显示的字体、音量以及显示亮度。
9.一种基于语音识别的内容推送***,其特征在于,包括:
语音获取模块,用于获取语音信息;
语音识别模块,用于识别用户的特征;
推送模块,用于向用户推送内容。
10.根据权利要求9所述的一种基于语音识别的内容推送***,其特征在于,内容推送***还包括模式切换模块,用于切换用户的使用模式。
CN201810817481.3A 2018-07-24 2018-07-24 一种基于语音识别的内容推送方法及*** Pending CN109040211A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810817481.3A CN109040211A (zh) 2018-07-24 2018-07-24 一种基于语音识别的内容推送方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810817481.3A CN109040211A (zh) 2018-07-24 2018-07-24 一种基于语音识别的内容推送方法及***

Publications (1)

Publication Number Publication Date
CN109040211A true CN109040211A (zh) 2018-12-18

Family

ID=64645440

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810817481.3A Pending CN109040211A (zh) 2018-07-24 2018-07-24 一种基于语音识别的内容推送方法及***

Country Status (1)

Country Link
CN (1) CN109040211A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108900641A (zh) * 2018-08-16 2018-11-27 安徽大尺度网络传媒有限公司 一种互联网内容的推送方法及装置
CN109947984A (zh) * 2019-02-28 2019-06-28 北京奇艺世纪科技有限公司 一种针对儿童的内容推送方法及推送装置
CN112151064A (zh) * 2020-09-25 2020-12-29 北京捷通华声科技股份有限公司 话术播报方法、装置、计算机可读存储介质和处理器

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102300163A (zh) * 2011-09-22 2011-12-28 宇龙计算机通信科技(深圳)有限公司 信息推送方法、移动终端和***
CN102930454A (zh) * 2012-10-07 2013-02-13 乐配(天津)科技有限公司 基于多感知技术的智能3d广告推荐方法
CN105245609A (zh) * 2015-10-23 2016-01-13 小米科技有限责任公司 推送信息的方法、装置、设备及***
CN105700682A (zh) * 2016-01-08 2016-06-22 北京乐驾科技有限公司 基于视觉和语音的智能性别、情绪识别检测***及方法
CN105895096A (zh) * 2016-03-30 2016-08-24 乐视控股(北京)有限公司 一种身份识别与语音交互操作的方法及装置
CN107274892A (zh) * 2017-04-24 2017-10-20 乐视控股(北京)有限公司 说话人识别方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102300163A (zh) * 2011-09-22 2011-12-28 宇龙计算机通信科技(深圳)有限公司 信息推送方法、移动终端和***
CN102930454A (zh) * 2012-10-07 2013-02-13 乐配(天津)科技有限公司 基于多感知技术的智能3d广告推荐方法
CN105245609A (zh) * 2015-10-23 2016-01-13 小米科技有限责任公司 推送信息的方法、装置、设备及***
CN105700682A (zh) * 2016-01-08 2016-06-22 北京乐驾科技有限公司 基于视觉和语音的智能性别、情绪识别检测***及方法
CN105895096A (zh) * 2016-03-30 2016-08-24 乐视控股(北京)有限公司 一种身份识别与语音交互操作的方法及装置
CN107274892A (zh) * 2017-04-24 2017-10-20 乐视控股(北京)有限公司 说话人识别方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108900641A (zh) * 2018-08-16 2018-11-27 安徽大尺度网络传媒有限公司 一种互联网内容的推送方法及装置
CN109947984A (zh) * 2019-02-28 2019-06-28 北京奇艺世纪科技有限公司 一种针对儿童的内容推送方法及推送装置
CN112151064A (zh) * 2020-09-25 2020-12-29 北京捷通华声科技股份有限公司 话术播报方法、装置、计算机可读存储介质和处理器

Similar Documents

Publication Publication Date Title
Martin Mixing English in French advertising
US5982853A (en) Telephone for the deaf and method of using same
CN109189980A (zh) 与用户进行语音交互的方法和电子设备
EP3259754B1 (en) Method and device for providing information
CN110519636A (zh) 语音信息播放方法、装置、计算机设备及存储介质
CN104540275B (zh) 一种调节现场照明装置的方法、设备及***
US20170214962A1 (en) Information processing apparatus, information processing method, and program
CN109040211A (zh) 一种基于语音识别的内容推送方法及***
CN109147800A (zh) 应答方法和装置
CN110147467A (zh) 一种文本描述的生成方法、装置、移动终端及存储介质
CN113010138B (zh) 文章的语音播放方法、装置、设备及计算机可读存储介质
US20240079011A1 (en) Interpreting words prior to vocalization
CN113238654A (zh) 基于多模态的反应式响应生成
Bowles Representation
CN113556603A (zh) 调整视频播放效果的方法及装置、电子设备
CN112185344A (zh) 语音交互方法、装置、计算机可读存储介质和处理器
CN110719521B (zh) 一种基于用户画像的个性化显示方法及装置
CN110781327B (zh) 图像搜索方法、装置、终端设备及存储介质
CN113593582B (zh) 智能设备的控制方法和装置、存储介质及电子设备
WO2024018400A2 (en) Detecting and utilizing facial micromovements
CN110162710A (zh) 输入场景下信息推荐方法及装置
CN116088675A (zh) 虚拟形象交互方法及相关装置、设备、***和介质
CN114339418A (zh) 电视节目的广告播放方法、装置、计算机设备及存储介质
Horton Non‐standard language in translation: Roddy goes to Germany
CN111160051B (zh) 数据处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181218