CN109660672A - 语音类型的转换方法、设备及计算机可读存储介质 - Google Patents

语音类型的转换方法、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN109660672A
CN109660672A CN201910021502.5A CN201910021502A CN109660672A CN 109660672 A CN109660672 A CN 109660672A CN 201910021502 A CN201910021502 A CN 201910021502A CN 109660672 A CN109660672 A CN 109660672A
Authority
CN
China
Prior art keywords
type
sound
output
terminal
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910021502.5A
Other languages
English (en)
Inventor
韩璧丞
阿迪斯
郜小建
张胜男
于翔
席晶晶
李晓
吴迪
胡彦涛
覃真真
俞雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Qiangnao Technology Co Ltd
Original Assignee
Zhejiang Qiangnao Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Qiangnao Technology Co Ltd filed Critical Zhejiang Qiangnao Technology Co Ltd
Priority to CN201910021502.5A priority Critical patent/CN109660672A/zh
Publication of CN109660672A publication Critical patent/CN109660672A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72433User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L13/086Detection of language
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72454User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72457User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to geographic location
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72484User interfaces specially adapted for cordless or mobile telephones wherein functions are triggered by incoming communication events

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Environmental & Geological Engineering (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种语音类型的转换方法、设备及计算机可读存储介质,该方法包括步骤:当第一终端处于通话状态时,接收与所述第一终端连接的第二终端发送的待输出语音;若所述待输出语音的输出语音类型与所述第一终端中预设语音类型不一致,则将所述输出语音类型转换成所述预设语音类型,得到转换后的所述待输出语音;在所述第一终端中输出转换后的所述待输出语音,以供所述第一终端对应的第一用户接听。本发明实现了第一终端用户和第二终端用户通话过程中,当通话双方所用语音类型不一致时,智能地转换对方的语音类型,避免了通话一方或者双方听不懂对方所讲的内容的情况出现,提高了通话双方的沟通效率,缩短了通话双方的通话时间。

Description

语音类型的转换方法、设备及计算机可读存储介质
技术领域
本发明涉及通信技术领域,尤其涉及一种语音类型的转换方法、设备及计算机可读存储介质。
背景技术
每个地区都有自己独特的语言发音,不同地区的人互相之间听不懂对方的方言。因此,在通话过程中,经常会出现对方讲方言,接听电话这一边的用户听不懂对方在讲什么,从而导致沟通效率低下,浪费通话双方的时间。
发明内容
本发明的主要目的在于提供一种语音类型的转换方法、设备及计算机可读存储介质,旨在解决现有的由于通话一方或者双方听不懂对方所讲的内容,导致通话双方沟通效率低下,通话时间长的技术问题。
为实现上述目的,本发明提供一种语音类型的转换方法,所述语音类型的转换方法包括步骤:
当第一终端处于通话状态时,接收与所述第一终端连接的第二终端发送的待输出语音;
若所述待输出语音的输出语音类型与所述第一终端中预设语音类型不一致,则将所述输出语音类型转换成所述预设语音类型,得到转换后的所述待输出语音;
在所述第一终端中输出转换后的所述待输出语音,以供所述第一终端对应的第一用户接听。
优选地,所述若所述待输出语音的输出语音类型与所述第一终端中预设语音类型不一致,则将所述输出语音类型转换成所述预设语音类型,得到转换后的所述待输出语音的步骤包括:
若所述待输出语音的输出语音类型与所述预设语音类型不一致,则确定所述第一终端中各个预设语音类型的优先级;
按照所述预设语音类型的优先级从高到低转换所述输出语音类型,直到成功将所述输出语音类型转换成所述预设语音类型,得到转换后的所述待输出语音。
优选地,所述若所述待输出语音的输出语音类型与所述第一终端中预设语音类型不一致,则将所述输出语音类型转换成所述预设语音类型,得到转换后的所述待输出语音的步骤之前,还包括:
检测是否存储有所述第二终端对应的默认语音类型;
若存储有所述默认语音类型,则确定所述默认语音类型为所述待输出语音的输出语音类型。
优选地,所述检测是否存储有所述第二终端对应的默认语音类型的步骤之后,还包括:
若未存储有所述默认语音类型,则检测所述第一终端对应的第一用户与所述第二终端对应的第二用户是否是首次进行通话;
若所述第一用户与所述第二用户是首次进行通话,则发送提示信息给所述第二终端,以供所述第二终端根据所述提示信息提示所述第二用户触发确认指令,并返回所述确认指令,其中,所述确认指令用于确认所述待输出语音的输出语音类型;
当接收到所述确认指令后,根据所述确认指令确定所述待输出语音的输出语音类型。
优选地,所述若未存储有所述默认语音类型,则检测所述第一终端对应的第一用户与所述第二终端对应的第二用户是否是首次进行通话的步骤之后,还包括:
若所述第一用户与所述第二用户不是首次进行通话,则根据所述第一用户对应的电话号码和所述第二用户对应的电话号码在云平台中获取所述第一用户与所述第二用户的通话记录;
根据所述通话记录确定所述待输出语音的输出语音类型。
优选地,所述当接收到所述确认指令后,根据所述确认指令确定所述待输出语音的输出语音类型的步骤之后,还包括:
将根据所述确认指令确定的所述输出语音类型存储为所述第二终端对应的默认语音类型。
优选地,所述检测是否存储有所述第二终端对应的默认语音类型的步骤之后,还包括:
若未存储有所述第二终端对应的默认语音类型,检测所述第一终端中是否预先存储有所述第二终端对应的第二用户的户籍所在地;
若所述第一终端存储有所述户籍所在地,则根据所述户籍所在地确定所述待输出语音的输出语音类型。
优选地,所述当第一终端处于通话状态时,接收与所述第一终端连接的第二终端发送的待输出语音的步骤之后,还包括:
检测所述待输出语音的输出语音类型与所述第一终端中预设语音类型是否一致;
若所述输出语音类型与所述第一终端中预设语音类型一致,则直接输出所述待输出语音。
此外,为实现上述目的,本发明还提供一种语音类型的转换设备,所述语音类型的转换设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的语音类型的转换程序,所述语音类型的转换程序被所述处理器执行时实现如上所述的语音类型的转换方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有语音类型的转换程序,所述语音类型的转换程序被处理器执行时实现如上所述的语音类型的转换方法的步骤。
本发明通过在第一终端和第二终端进行通话过程中,在确定第二终端发送给第一终端的待输出语音的输出语音类型与第一终端中预设语音类型不一致时,将输出语音类型转换成预设语音类型,得到转换后的待输出语音,并输出该转换后的待输出语音。实现了第一终端用户和第二终端用户通话过程中,当通话双方所用语音类型不一致时,智能地转换对方的语音类型,避免了通话一方或者双方听不懂对方所讲的内容的情况出现,提高了通话双方的沟通效率,缩短了通话双方的通话时间。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的结构示意图;
图2为本发明语音类型的转换方法第一实施例的流程示意图;
图3为本发明语音类型的转换方法第三实施例的流程示意图;
图4为本发明语音类型的转换方法第四实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的结构示意图。
需要说明的是,图1即可为语音类型的转换设备的硬件运行环境的结构示意图。本发明实施例语音类型的转换设备可以是PC,便携计算机等终端设备。
如图1所示,该语音类型的转换设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的语音类型的转换设备结构并不构成对语音类型的转换设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作***、网络通信模块、用户接口模块以及语音类型的转换程序。其中,操作***是管理和控制语音类型的转换设备硬件和软件资源的程序,支持语音类型的转换程序以及其它软件或程序的运行。
在本实施例中,语音类型的转换设备为第一终端,在图1所示的语音类型的转换设备中,用户接口1003主要用于连接第二终端,与第二终端进行数据通信;网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;而处理器1001可以用于调用存储器1005中存储的语音类型的转换程序,并执行以下操作:
当第一终端处于通话状态时,接收与所述第一终端连接的第二终端发送的待输出语音;
若所述待输出语音的输出语音类型与所述第一终端中预设语音类型不一致,则将所述输出语音类型转换成所述预设语音类型,得到转换后的所述待输出语音;
在所述第一终端中输出转换后的所述待输出语音,以供所述第一终端对应的第一用户接听。
进一步地,所述若所述待输出语音的输出语音类型与所述第一终端中预设语音类型不一致,则将所述输出语音类型转换成所述预设语音类型,得到转换后的所述待输出语音的步骤包括:
若所述待输出语音的输出语音类型与所述预设语音类型不一致,则确定所述第一终端中各个预设语音类型的优先级;
按照所述预设语音类型的优先级从高到低转换所述输出语音类型,直到成功将所述输出语音类型转换成所述预设语音类型,得到转换后的所述待输出语音。
进一步地,所述若所述待输出语音的输出语音类型与所述第一终端中预设语音类型不一致,则将所述输出语音类型转换成所述预设语音类型,得到转换后的所述待输出语音的步骤之前,处理器1001还可以用于调用存储器1005中存储的语音类型的转换程序,并执行以下步骤:
检测是否存储有所述第二终端对应的默认语音类型;
若存储有所述默认语音类型,则确定所述默认语音类型为所述待输出语音的输出语音类型。
进一步地,所述检测是否存储有所述第二终端对应的默认语音类型的步骤之后,处理器1001还可以用于调用存储器1005中存储的语音类型的转换程序,并执行以下步骤:
若未存储有所述默认语音类型,则检测所述第一终端对应的第一用户与所述第二终端对应的第二用户是否是首次进行通话;
若所述第一用户与所述第二用户是首次进行通话,则发送提示信息给所述第二终端,以供所述第二终端根据所述提示信息提示所述第二用户触发确认指令,并返回所述确认指令,其中,所述确认指令用于确认所述待输出语音的输出语音类型;
当接收到所述确认指令后,根据所述确认指令确定所述待输出语音的输出语音类型。
进一步地,所述若未存储有所述默认语音类型,则检测所述第一终端对应的第一用户与所述第二终端对应的第二用户是否是首次进行通话的步骤之后,处理器1001还可以用于调用存储器1005中存储的语音类型的转换程序,并执行以下步骤:
若所述第一用户与所述第二用户不是首次进行通话,则根据所述第一用户对应的电话号码和所述第二用户对应的电话号码在云平台中获取所述第一用户与所述第二用户的通话记录;
根据所述通话记录确定所述待输出语音的输出语音类型。
进一步地,所述当接收到所述确认指令后,根据所述确认指令确定所述待输出语音的输出语音类型的步骤之后,处理器1001还可以用于调用存储器1005中存储的语音类型的转换程序,并执行以下步骤:
将根据所述确认指令确定的所述输出语音类型存储为所述第二终端对应的默认语音类型。
进一步地,所述检测是否存储有所述第二终端对应的默认语音类型的步骤之后,处理器1001还可以用于调用存储器1005中存储的语音类型的转换程序,并执行以下步骤:
若未存储有所述第二终端对应的默认语音类型,检测所述第一终端中是否预先存储有所述第二终端对应的第二用户的户籍所在地;
若所述第一终端存储有所述户籍所在地,则根据所述户籍所在地确定所述待输出语音的输出语音类型。
进一步地,所述当第一终端处于通话状态时,接收与所述第一终端连接的第二终端发送的待输出语音的步骤之后,处理器1001还可以用于调用存储器1005中存储的语音类型的转换程序,并执行以下步骤:
检测所述待输出语音的输出语音类型与所述第一终端中预设语音类型是否一致;
若所述输出语音类型与所述第一终端中预设语音类型一致,则直接输出所述待输出语音。
基于上述的结构,提出语音类型的转换方法的各个实施例。
参照图2,图2为本发明语音类型的转换方法第一实施例的流程示意图。
本发明实施例提供了语音类型的转换方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
语音类型的转换方法可应用于终端中,该终端为可以实现语音通话的终端,语音类型的转换方法的各个实施例中,为了便于描述,以第一终端为执行主体进行阐述各个实施例。
语音类型的转换方法包括:
步骤S10,当第一终端处于通话状态时,接收与所述第一终端连接的第二终端发送的待输出语音。
当第一终端处于通话状态时,第一终端接收与其通信连接的第二终端发送的待输出语音。在本实施例中,为了区分第一终端对应的用户和第二终端对应的用户,将第一终端对应用户记为第一用户,将第二终端对应用户记为第二用户。当第一终端处于通话状态时,即在第一终端的第一用户与第二终端的第二用户进行通话过程中,此时,第一终端可作为接听电话的接听端,也可作为发起通话的发起端。当第一终端接收到第二终端发送的待输出语音时,第一终端检测待输出语音的输出语音类型是否与第一终端中预设语音类型是否一致。具体地,待输出语音的输出语音类型可为第二用户在与第一用户通话之前,第二用户在第二终端中确定的。如第二终端与第一终端成功建立连接,即第二用户拨通第一用户的手机号码后,第二用户在第二终端的屏幕中输入输出语音类型对应类型编码。当第二终端接收到输出语音类型的类型编码后,第二终端将该类型编码发送给第一终端。当第一终端接收到第二终端发送的类型编码后,第一终端根据该类型编码即可确定待输出语音的输出语音类型。
需要说明的是,一种输出语音类型为一种方言,该方言包括了粤语、客家话和潮汕话等地方方言,也包括了普通话、英语和法语等各个国家的通用性语言。在第一终端和第二终端,已经预先存储了各个方言对应类型编码,每一种方言对应一个类型编码,第一终端和第二终端中相同方言的类型编码是一致的。如在第一终端和第二终端中,可将普通话对应的类型编码设置为001,将粤语对应的类型编码设置为002,将客家话对应的类型编码设置为003。
步骤S20,若所述待输出语音的输出语音类型与所述第一终端中预设语音类型不一致,则将所述输出语音类型转换成所述预设语音类型,得到转换后的所述待输出语音。
若第一终端检测到待输出语音的输出语音类型与其预设语音类型不一致,第一终端则将输出语音类型转换成预设语音类型,得到转换后的待输出语音。在第一终端中,可存在一种或者多种预设语音类型,即第一终端可预先设置一种或者多种方言。在本实施例中,当存在多种预设语音类型时,若第一终端检测到输出语音类型对应的类型编码与其预设语音类型的类型编码都不一致,第一终端则确定输出语音类型与预设语音类型不一致。
第一终端将待输出语音的输出语音类型转换成预设语音类型的过程为:在第一终端中,预先存储有训练好的语音转换模型,当需要转换语音类型时,第一终端将输出语音类型的类型编码、待输出语音以及所需转换的预设语音类型的类型编码输入语音转换模型中,以得到转换后的待输出语音。如当待输出语音的输出语音类型为粤语,预设语音类型为客家话时,第一终端则将待输出语音、粤语对应的类型编码和客家话的类型编码输入语音转换模型中,以得到转换后的待输出语音。可以理解的是,语音转换模型的输出即为转换后的待输出语音。
第一终端将待输出语音的输出语音类型转换成预设语音类型的过程还可为:在第一终端预先存储了各种方言语音信息与通用方言文字信息之间的转换关系,在本实施例中,通用方言为普通话。第一终端通过该转换关系,将待输出语音转换成通用方言对应文字信息,然后再通过该转换关系,将转换所得的文字信息转换成预设语音类型的语音信息,得到转换后的待输出语音。
步骤S30,在所述第一终端中输出转换后的所述待输出语音,以供所述第一终端对应的第一用户接听。
当第一终端得到转换后的待输出语音后,第一终端通过其喇叭输出该转换后的待输出语音,以供第一用户通过第一终端的听筒接听该转换后的待输出语音,实现与第二终端对应第二用户之间的通话。
进一步地,语音类型的转换方法还包括:
步骤a,检测所述待输出语音的输出语音类型与所述第一终端中预设语音类型是否一致。
步骤b,若所述输出语音类型与所述第一终端中预设语音类型一致,则直接输出所述待输出语音。
第一终端检测待输出语音的输出语音类型与其预设语音类型是否一致,即检测输出语音类型对应的类型编码是否与预设语音类型对应的类型编码一致。可以理解的是,当第一终端中存在多种预设语音类型时,只要输出语音类型的类型编码与预设语音类型对应的其中一个类型编码一致,第一终端即可确定输出语音类型与其预设语音类型一致。当确定输出语音类型与第一终端中预设语音类型一致时,第一终端直接通过其喇叭输出该待输出语音,以供第一用户通过听筒接听待输出语音。
本实施例通过在第一终端和第二终端进行通话过程中,在确定第二终端发送给第一终端的待输出语音的输出语音类型与第一终端中预设语音类型不一致时,将输出语音类型转换成预设语音类型,得到转换后的待输出语音,并输出该转换后的待输出语音。实现了第一终端用户和第二终端用户通话过程中,当通话双方所用语音类型不一致时,智能地转换对方的语音类型,避免了通话一方或者双方听不懂对方所讲的内容的情况出现,提高了通话双方的沟通效率,缩短了通话双方的通话时间。
进一步地,提出本发明语音类型的转换方法第二实施例。
所述语音类型的转换方法第二实施例与所述语音类型的转换方法第一实施例的区别在于,步骤S20包括:
步骤c,若所述待输出语音的输出语音类型与所述预设语音类型不一致,则确定所述第一终端中各个预设语音类型的优先级。
当第一终端中存在至少两种预设语音类型,且第一终端检测到待输出语音的输出语音类型与预设语音类型不一致时,第一终端确定其预先存储的各个预设语音类型的优先级。其中,第一终端中各个预设语音类型的优先级是第一用户根据需要设置的。
步骤d,按照所述预设语音类型的优先级从高到低转换所述输出语音类型,直到成功将所述输出语音类型转换成所述预设语音类型,得到转换后的所述待输出语音。
当第一终端确定各个预设语音类型的优先级后,第一终端按照预设语音类型的优先级从高到低转换待输出语音的输出语音类型,直到成功将待输出语音的输出语音类型转换成预设语音类型,得到转换后的待输出语音。具体地,当第一终端未能成功将输出语音类型转换成处于第一优先级的预设语音类型时,第一终端将输出语音类型转换成处于第二优先级的预设语音类型。若第一终端未能成功将输出语音类型转换成处于第二优先级的预设语音类型,第一终端则将待输出语音的输出语音类型转换成处于第三优先级的预设语音类型,直到成功将待输出语音的输出语音类型转换成预设语音类型。其中,第一优先级高于第二优先级,第二优先级高于第三优先级。
进一步地,当第一终端未能成功转换待输出语音的输出语音类型,即第一终端未能成功将待输出语音的输出语音类型转换成预设语音类型时,第一终端直接以输出语音类型的方式输出待输出语音。
第一终端判断待输出语音的输出语音类型是否成功转换成预设语音类型的过程为:第一终端检测在接收到待输出语音的预设时长后是否得到转换后的待输出语音。若在预设时长内未得到转换后的待输出语音,第一终端则确定待输出语音的输出语音类型未能成功转换为预设语音类型;若在预设时长内得到转换后的待输出语音,第一终端则确定待输出语音的输出语音类型已成功转换为预设语音类型。其中,预设时长可根据具体需要而设置,如可将预设时长设置为30us(微秒)或者20us等。
本实施例通过当第一终端中存在至少两种预设语音类型时,按照预设语音类型的优先级从高到低转换输出语音类型,直到成功将输出语音类型转换成预设语音类型,得到转换后的待输出语音,使转换语音类型后的待输出语音符合用户需求,提高了通话过程中,语音类型转换的智能性。
进一步地,提出本发明语音类型的转换方法第三实施例。
所述语音类型的转换方法第三实施例与所述语音类型的转换方法第一或第二实施例的区别在于,参照图3,语音类型的转换方法还包括:
步骤S40,检测是否存储有所述第二终端对应的默认语音类型。
当第一终端接收到待输出语音后,第一终端获取第二终端对应第二用户的电话号码,根据第二用户的电话号码检测其是否存储有第二终端对应的默认语音类型。在本实施例中,若第二用户在第一终端中已经存在了默认语音类型,则在第一终端中,该默认语音类型是与第二用户对应的电话号码关联存储的。其中,该默认语音类型为第一用户预先为第二用户设置好的。在第一终端中,若某个电话号码存在对应的默认语音类型,则该电话号码会存在对应默认语音标识;若某个电话号码未存在默认语音标识,则确定该电话号码不存在对应的默认语音类型。默认语音标识可通过特定字符、数字、和/或字母等表示。
步骤S50,若存储有所述默认语音类型,则确定所述默认语音类型为所述待输出语音的输出语音类型。
当第一终端确定存储有第二终端对应的默认语音类型后,第一终端确定该默认语音类型为待输出语音的输出语音类型。进一步地,若第二用户在拨打电话过程中,有在第二终端的屏幕中输入待输出语音对应的类型编码,即第二用户在第二终端的屏幕中输入了待输出语音对应的输出语音类型,第一终端则优先以第二用户在第二终端屏幕中输入的类型编码对应的语音类型作为待输出语音的输出语音类型。若第二用户未在第二终端的屏幕中输入待输出语音对应的类型编码,第一终端则将该默认语音类型确定为待输出语音的输出语音类型。
本实施例通过当检测到第一终端中存储有第二终端对应的默认语音类型时,将该默认语音类型确定为待输出语音的输出语音类型,提高了通话过程中,语音类型转换的转换效率。
进一步地,语音类型的转换方法还包括:
步骤e,若未存储有所述默认语音类型,则检测所述第一终端对应的第一用户与所述第二终端对应的第二用户是否是首次进行通话。
进一步地,为了快速准确地确定待输出语音的输出语音类型,当第一终端确定未存储有第二终端对应的默认语音类型时,第一终端检测其对应的第一用户与第二终端对应的第二用户是否是首次进行通话。具体地,第一终端检测其通话记录中是否存储有第一用户与第二用户的通话记录。若第一终端的通话记录中未存储有第一用户与第二用户之间的通话记录,第一终端则确定第一用户与第二用户是首次进行通话;若第一终端的通话记录中存储有第一用户与第二用户之间的通话记录,第一终端则确定第一用户与第二用户不是首次进行通话。
步骤f,若所述第一用户与所述第二用户是首次进行通话,则发送提示信息给所述第二终端,以供所述第二终端根据所述提示信息提示所述第二用户触发确认指令,并返回所述确认指令,其中,所述确认指令用于确认所述待输出语音的输出语音类型。
步骤g,当接收到所述确认指令后,根据所述确认指令确定所述待输出语音的输出语音类型。
若确定第一用户与第二用户是首次进行通话,第一终端则生成提示信息,并将该提示信息发送给第二终端。当第二终端接收到该提示信息,输出该提示信息,根据该提示信息提示第二用户触发确认指令。当第二终端侦测到第二用户触发的确认指令后,将该确认指令发送给第一终端。其中,确认指令用于确认第二用户与第一用户通话对应的输出语音类型,即确认待输出语音的输出语音类型。具体地,第二用户可在第二终端的屏幕中输入语音类型对应的类型编码以触发该确认指令。
当第一终端接收到第二终端发送的确认指令后,第一终端根据确认指令确定待输出语音的输出语音类型,具体地,第一终端在接收到确认指令后,提取确认指令所携带的类型编码,根据该类型编码确定待输出语音的输出语音类型。
进一步地,语音类型的转换方法还包括:
步骤h,将根据所述确认指令确定的所述输出语音类型存储为所述第二终端对应的默认语音类型。
为了避免第二用户在与第一用户通话过程中,第二用户每次都要触发确认指令,简化第二用户与第一用户通话过程中第二用户的操作流程,当第一终端接收到第二终端发送的确认指令后,第一终端将根据确认指令确定的输出语音类型确定为第二终端对应的默认语音类型,并将第二终端对应的默认语音类型与第二用户的手机号码关系存储。
进一步地,语音类型的转换方法还包括:
步骤i,若所述第一用户与所述第二用户不是首次进行通话,则根据所述第一用户对应的电话号码和所述第二用户对应的电话号码在云平台中获取所述第一用户与所述第二用户的通话记录。
为了提高确定待输出语音的输出语音类型的准确率,若确定第一用户与第二用户不是首次进行通话,第一终端则获取第一用户对应的电话号码,即获取本机号码,以及获取第二用户对应的电话号码,根据本机号码和第二用户对应的电话号码在云平台中获取第一用户与第二用户的通话记录。具体地,第一终端可先根据本机号码和第二用户对应的电话号码在其数据库中查找第一用户和第二用户之间的通话记录。若第一终端在其数据库中未查找到第一用户和第二用户之间的通话记录,第一终端则将本机号码和第二用户对应的电话号码发送给云平台。当云平台接收到第一终端发送的本机号码和第二用户对应的电话号码后,云平台根据本机号码和第二用户对应的电话号码获取第一用户和第二用户的通话记录,并将所获取的通话记录发送给第一终端。需要说明的是,云平台中所存储的通话记录的数据量大于第一终端数据库中所存储通话记录的数据量。
步骤j,根据所述通话记录确定所述待输出语音的输出语音类型。
当第一终端接收到云平台发送的通话记录后,第一终端提取该通话记录中第二用户对应的输出语音类型的类型编码,根据该类型编码确定待输出语音的输出语音类型,即该类型编码对应的语音类型为待输出语音的输出语音类型。若第一终端在其数据库中查找到第一用户和第二用户之间的通话记录,第一终端则提取该通话记录中第二用户对应的输出语音类型的类型编码,根据该类型编码确定待输出语音的输出语音类型。进一步地,若第一终端未接收到云平台发送的第一用户和第二用户之间的通话记录,第一终端则直接输出待输出语音,以供第一用户接听。
进一步地,提出本发明语音类型的转换方法第四实施例。
所述语音类型的转换方法第四实施例与所述语音类型的转换方法第三实施例的区别在于,参照图4,语音类型的转换方法还包括:
步骤S60,若未存储有所述第二终端对应的默认语音类型,检测所述第一终端中是否预先存储有所述第二终端对应的第二用户的户籍所在地。
当第一终端确定其未存储有第二终端对应的默认语音类型后,第一终端检测其是否存储有第二终端对应第二用户的户籍所在地。在本实施例中,第二用户的户籍所在地与第二用户的手机号码是关联存储的,通过第二用户对应的手机号码即可检测到第一终端是否存储有第二用户的户籍所在地。
步骤S70,若所述第一终端存储有所述户籍所在地,则根据所述户籍所在地确定所述待输出语音的输出语音类型。
若第一终端存储有第二用户的户籍所在地,第一终端则获取预先存储的第二用户的户籍所在地,并获取户籍所在地与类型编码之间的映射关系,基于该映射关系,根据所获取的户籍所在地确定待输出语音的输出语音类型。其中,户籍所在地与类型编码之间的映射关系是预先存储在第一终端中的。
进一步地,当确定第一终端未存储有第二终端对应的默认语音类型,且未接收到云平台发送的第一用户与第二用户的通话记录后,第一终端检测其是否存储有第二用户的户籍所在地。
本实施例通过当确定第一终端未存储有第二终端对应的默认语音类型后,第一终端根据第二用户的户籍所在地确定待输出语音的输出语音类型,提高了确定待输出语音对应输出语音类型的准确率。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有语音类型的转换程序,所述语音类型的转换程序被处理器执行时实现如上所述的语音类型的转换方式的各个步骤。
本发明计算机可读存储介质具体实施方式与上述语音类型的转换方法各实施例基本相同,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种语音类型的转换方法,其特征在于,所述语音类型的转换方法包括以下步骤:
当第一终端处于通话状态时,接收与所述第一终端连接的第二终端发送的待输出语音;
若所述待输出语音的输出语音类型与所述第一终端中预设语音类型不一致,则将所述输出语音类型转换成所述预设语音类型,得到转换后的所述待输出语音;
在所述第一终端中输出转换后的所述待输出语音,以供所述第一终端对应的第一用户接听。
2.如权利要求1所述的语音类型的转换方法,其特征在于,所述若所述待输出语音的输出语音类型与所述第一终端中预设语音类型不一致,则将所述输出语音类型转换成所述预设语音类型,得到转换后的所述待输出语音的步骤包括:
若所述待输出语音的输出语音类型与所述预设语音类型不一致,则确定所述第一终端中各个预设语音类型的优先级;
按照所述预设语音类型的优先级从高到低转换所述输出语音类型,直到成功将所述输出语音类型转换成所述预设语音类型,得到转换后的所述待输出语音。
3.如权利要求1所述的语音类型的转换方法,其特征在于,所述若所述待输出语音的输出语音类型与所述第一终端中预设语音类型不一致,则将所述输出语音类型转换成所述预设语音类型,得到转换后的所述待输出语音的步骤之前,还包括:
检测是否存储有所述第二终端对应的默认语音类型;
若存储有所述默认语音类型,则确定所述默认语音类型为所述待输出语音的输出语音类型。
4.如权利要求3所述的语音类型的转换方法,其特征在于,所述检测是否存储有所述第二终端对应的默认语音类型的步骤之后,还包括:
若未存储有所述默认语音类型,则检测所述第一终端对应的第一用户与所述第二终端对应的第二用户是否是首次进行通话;
若所述第一用户与所述第二用户是首次进行通话,则发送提示信息给所述第二终端,以供所述第二终端根据所述提示信息提示所述第二用户触发确认指令,并返回所述确认指令,其中,所述确认指令用于确认所述待输出语音的输出语音类型;
当接收到所述确认指令后,根据所述确认指令确定所述待输出语音的输出语音类型。
5.如权利要求4所述的语音类型的转换方法,其特征在于,所述若未存储有所述默认语音类型,则检测所述第一终端对应的第一用户与所述第二终端对应的第二用户是否是首次进行通话的步骤之后,还包括:
若所述第一用户与所述第二用户不是首次进行通话,则根据所述第一用户对应的电话号码和所述第二用户对应的电话号码在云平台中获取所述第一用户与所述第二用户的通话记录;
根据所述通话记录确定所述待输出语音的输出语音类型。
6.如权利要求4所述的语音类型的转换方法,其特征在于,所述当接收到所述确认指令后,根据所述确认指令确定所述待输出语音的输出语音类型的步骤之后,还包括:
将根据所述确认指令确定的所述输出语音类型存储为所述第二终端对应的默认语音类型。
7.如权利要求3所述的语音类型的转换方法,其特征在于,所述检测是否存储有所述第二终端对应的默认语音类型的步骤之后,还包括:
若未存储有所述第二终端对应的默认语音类型,检测所述第一终端中是否预先存储有所述第二终端对应的第二用户的户籍所在地;
若所述第一终端存储有所述户籍所在地,则根据所述户籍所在地确定所述待输出语音的输出语音类型。
8.如权利要求1至7任一项所述的语音类型的转换方法,其特征在于,所述当第一终端处于通话状态时,接收与所述第一终端连接的第二终端发送的待输出语音的步骤之后,还包括:
检测所述待输出语音的输出语音类型与所述第一终端中预设语音类型是否一致;
若所述输出语音类型与所述第一终端中预设语音类型一致,则直接输出所述待输出语音。
9.一种语音类型的转换设备,其特征在于,所述语音类型的转换设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的语音类型的转换程序,所述语音类型的转换程序被所述处理器执行时实现如权利要求1至8中任一项所述的语音类型的转换方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有语音类型的转换程序,所述语音类型的转换程序被处理器执行时实现如权利要求1至8中任一项所述的语音类型的转换方法的步骤。
CN201910021502.5A 2019-01-09 2019-01-09 语音类型的转换方法、设备及计算机可读存储介质 Pending CN109660672A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910021502.5A CN109660672A (zh) 2019-01-09 2019-01-09 语音类型的转换方法、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910021502.5A CN109660672A (zh) 2019-01-09 2019-01-09 语音类型的转换方法、设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN109660672A true CN109660672A (zh) 2019-04-19

Family

ID=66119596

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910021502.5A Pending CN109660672A (zh) 2019-01-09 2019-01-09 语音类型的转换方法、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN109660672A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110570837A (zh) * 2019-08-28 2019-12-13 卓尔智联(武汉)研究院有限公司 一种语音交互方法、装置及存储介质
CN110767233A (zh) * 2019-10-30 2020-02-07 合肥名阳信息技术有限公司 一种语音转换***及方法
CN114760273A (zh) * 2022-04-14 2022-07-15 深圳震有科技股份有限公司 语音转发方法、***、服务器及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104754536A (zh) * 2013-12-27 2015-07-01 ***通信集团公司 一种不同语言间实现通信的方法和***
CN106804031A (zh) * 2015-11-26 2017-06-06 ***通信集团公司 一种话音转换方法及装置
CN109088995A (zh) * 2018-10-17 2018-12-25 永德利硅橡胶科技(深圳)有限公司 支持全球语言翻译的方法及手机

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104754536A (zh) * 2013-12-27 2015-07-01 ***通信集团公司 一种不同语言间实现通信的方法和***
CN106804031A (zh) * 2015-11-26 2017-06-06 ***通信集团公司 一种话音转换方法及装置
CN109088995A (zh) * 2018-10-17 2018-12-25 永德利硅橡胶科技(深圳)有限公司 支持全球语言翻译的方法及手机

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110570837A (zh) * 2019-08-28 2019-12-13 卓尔智联(武汉)研究院有限公司 一种语音交互方法、装置及存储介质
CN110767233A (zh) * 2019-10-30 2020-02-07 合肥名阳信息技术有限公司 一种语音转换***及方法
CN114760273A (zh) * 2022-04-14 2022-07-15 深圳震有科技股份有限公司 语音转发方法、***、服务器及存储介质

Similar Documents

Publication Publication Date Title
CN104050966B (zh) 终端设备的语音交互方法和使用该方法的终端设备
US8024194B2 (en) Dynamic switching between local and remote speech rendering
CN107018228B (zh) 一种语音控制***、语音处理方法及终端设备
CN106302933B (zh) 通话语音信息处理方法及终端
CN106156009A (zh) 语音翻译方法及装置
JP2001222294A (ja) 無線通信装置のためのユーザインターフェースに基づく音声認識
CN108391020A (zh) 一种通话控制方法、装置、设备及存储介质
CN103491257A (zh) 一种在通话过程中发送联系人信息的方法及***
CN103177724A (zh) 语音控制文本操作的方法、装置及终端
CN101923401A (zh) 一种电子设备输入方法
CN109360565A (zh) 一种通过建立资源库提高语音识别精度的方法
CN109660672A (zh) 语音类型的转换方法、设备及计算机可读存储介质
CN102694896A (zh) 用以存储通信号码的方法、终端及***
KR102357620B1 (ko) 챗봇 채널연계 통합을 위한 챗봇 통합 에이전트 플랫폼 시스템 및 그 서비스 방법
CN108595412A (zh) 纠错处理方法及装置、计算机设备及可读介质
CN107808662B (zh) 更新语音识别用的语法规则库的方法及装置
CN105278928A (zh) Ivr对外接口配置方法及装置
CN103559242A (zh) 语音输入信息的方法及终端设备
CN106453582A (zh) 异步消息推送方法及***
CN105007365A (zh) 一种分机号拨打方法及装置
CN105991825A (zh) 一种语音控制方法、装置及***
CN111756935A (zh) 智能***的信息处理方法和智能***
CN105120116A (zh) 一种建立语言识别菜单方法及移动终端
JP2023510518A (ja) 音声端末機の音声検証及び制限方法
CN111274828A (zh) 基于留言的语言翻译方法、***、计算机程序和手持终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190419

RJ01 Rejection of invention patent application after publication