CN109599108A - 一种听写辅助方法及听写辅助装置 - Google Patents

一种听写辅助方法及听写辅助装置 Download PDF

Info

Publication number
CN109599108A
CN109599108A CN201811539708.9A CN201811539708A CN109599108A CN 109599108 A CN109599108 A CN 109599108A CN 201811539708 A CN201811539708 A CN 201811539708A CN 109599108 A CN109599108 A CN 109599108A
Authority
CN
China
Prior art keywords
content
dictation
object content
target
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811539708.9A
Other languages
English (en)
Inventor
崔颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201811539708.9A priority Critical patent/CN109599108A/zh
Publication of CN109599108A publication Critical patent/CN109599108A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/04Electrically-operated educational appliances with audible presentation of the material to be studied
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例涉及电子设备技术领域,公开了一种听写辅助方法及听写辅助装置,该方法包括:在报读目标听写内容过程中或者报读目标听写内容结束后,判断是否检测到用户的语音信息;若检测到语音信息,分析语音信息以得到分析结果;若分析结果指示用户需要再次报读听写内容,根据分析结果在目标听写内容中确定出需要再次报读的目标内容;报读目标内容。实施上述方法,能够提高用户在使用听写应用程序听写时的效率。

Description

一种听写辅助方法及听写辅助装置
技术领域
本发明涉及电子设备技术领域,具体涉及一种听写辅助方法及听写辅助装置。
背景技术
目前的听写应用程序在报读完听写内容之后,就结束报读环节,并输出正确答案以让用户自行检查。在实践中发现,用户在听写过程中经常会碰到一时半会想不起听写应用程序所报读的字或词语,或者由于听写应用程序的报读语速太快,导致写字的速度跟不上报读速度等情况。
目前碰到上述情况,若用户想要再听一遍听写内容中自己不清楚的部分,需要用户重头再听一遍完整的听写内容。也就是说,用户每次对听写内容的部分内容不清楚时,都需要重新听一遍完整的听写内容报读,才能再次听到自己不清楚的部分,导致用户在使用听写应用程序听写时的效率很低。
发明内容
本发明实施例公开了一种听写辅助方法及听写辅助装置,能够提高用户在使用听写应用程序听写时的效率。
本发明实施例第一方面公开一种听写辅助方法,包括:
在报读目标听写内容过程中或者报读所述目标听写内容结束后,判断是否检测到用户的语音信息;
若检测到所述语音信息,分析所述语音信息以得到分析结果;
若所述分析结果指示所述用户需要再次报读听写内容,根据所述分析结果在所述目标听写内容中确定出需要再次报读的目标内容;
报读所述目标内容。
作为一种可选的实施方式,在本发明实施例第一方面中,所述若检测到所述语音信息,分析所述语音信息以得到分析结果,包括:
若检测到所述语音信息,判断当前是否处于报读所述目标听写内容的过程中;
若当前处于报读所述目标听写内容的过程中,暂停报读所述目标听写内容,记录当前的目标听写内容报读进度,并分析所述语音信息以得到分析结果。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
在报读完所述目标内容并等待预设时长之后,判断是否检测到恢复报读所述目标听写内容的指令;
若未检测到所述恢复报读所述目标听写内容的指令,则再次报读所述目标内容;
若检测到恢复报读所述目标听写内容的指令,则根据所述目标听写内容报读进度继续报读所述目标听写内容。
作为一种可选的实施方式,在本发明实施例第一方面中,在报读所述目标内容之后,所述方法还包括:
检测所述用户输入的用于跟读所述目标内容的跟读语音;
判断所述跟读语音对应的待检测目标内容与所述目标内容是否匹配;
若匹配,输出确认提示信息;其中,所述确认提示信息用于提示所述用户所述待检测目标内容与所述目标内容匹配。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
若判断出所述跟读语音对应的待检测目标内容与所述目标内容不匹配或者检测到用户的目标内容解释请求时,在所述目标内容中确定出与所述待检测目标内容对应的同音异义词;
结合所述目标听写内容确定出所述同音异义词的词义解释信息;
输出所述同音异义词的词义解释信息。
本发明实施例第二方面公开一种听写辅助装置,包括:
第一判断单元,用于在报读目标听写内容过程中或者报读所述目标听写内容结束后,判断是否检测到用户的语音信息;
分析单元,用于在检测到所述语音信息时,分析所述语音信息以得到分析结果;
第一确定单元,用于在所述分析结果指示所述用户需要再次报读听写内容时,根据所述分析结果在所述目标听写内容中确定出需要再次报读的目标内容;
第一报读单元,用于报读所述目标内容。
作为一种可选的实施方式,在本发明实施例第二方面中,所述分析单元用于在检测到所述语音信息时,分析所述语音信息以得到分析结果的方式具体为:
所述分析单元,用于在检测到所述语音信息,判断当前是否处于报读所述目标听写内容的过程中;以及,若当前处于报读所述目标听写内容的过程中,暂停报读所述目标听写内容,记录当前的目标听写内容报读进度,并分析所述语音信息以得到分析结果。
作为一种可选的实施方式,在本发明实施例第二方面中,所述装置还包括:
第二判断单元,用于在所述第一报读单元报读完所述目标内容并等待预设时长之后,判断是否检测到恢复报读所述目标听写内容的指令;
第二报读单元,用于在所述第二判断单元等待预设时长之后,未检测到所述恢复报读所述目标听写内容的指令时,再次报读所述目标内容;
第三报读单元,用于在所述第二判断单元等待预设时长之后,检测到恢复报读所述目标听写内容的指令时,根据所述目标听写内容报读进度继续报读所述目标听写内容。
作为一种可选的实施方式,在本发明实施例第二方面中,所述装置还包括:
检测单元,用于在所述第一报读单元报读所述目标内容之后,检测所述用户输入的用于跟读所述目标内容的跟读语音;
第三判断单元,用于判断所述跟读语音对应的待检测目标内容与所述目标内容是否匹配;
提示单元,用于在所述第三判断单元判断出所述跟读语音对应的待检测目标内容与所述目标内容匹配时,输出确认提示信息;其中,所述确认提示信息用于提示所述用户所述待检测目标内容与所述目标内容匹配。
作为一种可选的实施方式,在本发明实施例第二方面中,所述装置还包括:
第二确定单元,用于在检测到用户的目标内容解释请求时或者在所述第三判断单元判断出所述跟读语音对应的待检测目标内容与所述目标内容不匹配时,在所述目标内容中确定出与所述待检测目标内容对应的同音异义词;
第三确定单元,用于结合所述目标听写内容确定出所述同音异义词的词义解释信息;
输出单元,用于输出所述同音异义词的词义解释信息。
本发明实施例第三方面公开一种听写辅助装置,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面公开的一种听写辅助方法。
本发明实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本发明实施例第一方面公开的一种听写辅助方法。
本发明实施例第五方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本发明实施例第一方面的任意一种方法的部分或全部步骤。
本发明实施例第六方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本发明实施例第一方面的任意一种方法的部分或全部步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,听写辅助装置可以在听写过程中或者听写结束后,判断是否检测到用户的语音信息;若检测到用户的语音信息则分析该语音信息以得到分析结果;若分析结果指示用户需要再次报读听写内容,则进一步根据分析结果在听写内容中确定出目标内容,该目标内容可以是某一个字或者词语,并再次报读该字或者词语。实施上述方法,听写辅助装置可以根据用户的语音信息在听写内容中截取用户需要再次报读的字或者词,并再次报读这些字或者词语,以辅助用户在听写时查漏补缺;而不需要用户每次对听写内容的部分内容不清楚时,都需要重新听一遍完整的听写内容报读,才能获取到自己需要再次报读的字或者词语,提高了用户在使用听写应用程序听写时的效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种听写辅助方法的流程示意图;
图2是本发明实施例公开的另一种听写辅助方法的流程示意图;
图3是本发明实施例公开的另一种听写辅助方法的流程示意图;
图4是本发明实施例公开的一种听写辅助装置的结构示意图;
图5是本发明实施例公开的另一种听写辅助装置的结构示意图;
图6是本发明实施例公开的另一种听写辅助装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书中的术语“第一”、“第二”和“第三”等是用于区别不同的对象,而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开了一种听写辅助方法及听写辅助装置,能够提高用户在使用听写应用程序听写时的效率。
下面将结合具体实施例对本发明技术方案进行详细说明。
实施例一
请参阅图1,图1是本发明实施例公开的一种听写辅助方法的流程示意图。如图1所示,该听写辅助方法可以包括以下步骤:
101、听写辅助装置在报读目标听写内容过程中或者报读目标听写内容结束后,判断是否检测到用户的语音信息;若检测到,执行步骤102;若未检测到,结束本流程。
本发明实施例中,听写辅助装置可以内置有语音识别模块,其中,该语音识别模块可以包括麦克风,用于采集声音信息。当语音识别模块的麦克风采集到用户的声音信息时,可以执行步骤102。
102、听写辅助装置分析语音信息以得到分析结果。
本发明实施例中,听写辅助装置可以内置有语音识别模块,其可以用于将用户输入的语音信息中的词汇内容转换为计算机可读的输入信息,例如按键、二进制编码或者字符序列等。当语音识别模块将用户的语音信息转换成计算机可读的输入的信息时,听写辅助装置可以利用自然语言处理(Natural Language Processing,NLP)技术识别计算机可读的输入的信息以得到分析结果。
103、听写辅助装置在分析结果指示用户需要再次报读听写内容时,根据分析结果在目标听写内容中确定出需要再次报读的目标内容。
本发明实施例中,分析结果可以包括用户是否需要再次报读听写内容,需要再次报读的听写内容是什么等信息。当听写辅助装置根据分析结果判读出用户需要再次报读听写内容时,可以根据分析结果在目标听写内容中进一步确定出需要再次报读的目标内容。
举例来说,语音识别模块检测到用户输入的语音的信息为“第一句话的第3个字是什么”,通过自然语言处理技术可以分析出用户需要再次报读听写内容,并可以确定出需要再次报读的内容是第一句话中的第3个字。
104、听写辅助装置报读目标内容。
本发明实施例中,听写辅助装置可以根据目标内容在目标听写内容的音频资料中截取出目标内容对应的目标音频资料,并通过内置的音响装置播放该目标内容对应的目标音频资料。
作为一种可选的实施方式,听写辅助装置在报读目标内容之后,可以输出目标听写内容的正确答案,并将目标听写内容的正确答案中,目标内容对应的正确答案以高亮显示提醒用户。可以让用户在正确答案中快速确定出目标内容对应的正确答案,提高了答案的查询速度,进而提高了用户的使用体验度。
作为另一种可选的实施方式,听写辅助装置可以获取目标内容中听写难度大于预设难度阈值的内容,并在报读听写难度大于预设难度阈值的内容时可以提高报读的音量至预设的音量阈值,以让用户可以听得更清楚,提高用户的使用体验度。
作为一种可选的实施方式,听写辅助装置可以内置有拍摄模组,用于在检测到用户输入的答案验证请求时,控制拍摄模组拍摄用户所写的答案信息,并利用光学字符识别(Optical Character Recognition,OCR)技术识别所拍摄到的包含用户答案信息的图像以得到听写辅助装置可以读取答案的信息;判断答案信息与目标内容是否匹配,若不匹配,输出包含目标内容的图像。
举例来说,用户可以在写下答案之后,通过输入答案验证请求的语音信息,以询问听写辅助装置自己写的答案是否正确,在检测到用户输入的答案验证请求时,听写辅助装置可以输出提示信息以提示用户利用拍摄装置拍摄用户所写的答案,进而听写辅助装置可以获取到用户的答案并判断是否用户的答案与目标内容是否匹配,若不匹配,输出包含目标内容的图像以辅助用户修改。实施上述方法,提高了用户的使用体验度。
可见,实施图1所描述的方法,听写辅助装置可以在听写过程中或者听写结束后,判断是否检测到用户的语音信息;若检测到用户的语音信息则分析该语音信息以得到分析结果;若分析结果指示用户需要再次报读听写内容,则进一步根据分析结果在听写内容中确定出目标内容,该目标内容可以是某一个字或者词语,并再次报读该字或者词语。实施上述方法,听写辅助装置可以根据用户的语音信息在听写内容中截取用户需要再次报读的字或者词,并再次报读这些字或者词语,以辅助用户在听写时查漏补缺;而不需要用户每次对听写内容的部分内容不清楚时,都需要重新听一遍完整的听写内容报读,才能获取到自己需要再次报读的字或者词语,提高了用户在使用听写应用程序听写时的效率。
实施例二
请参阅图2,图2是本发明实施例公开的另一种听写辅助方法的流程示意图。如图2所示,该听写辅助方法可以包括以下步骤:
201、听写辅助装置在报读目标听写内容过程中或者报读目标听写内容结束后,判断是否检测到用户的语音信息;若检测到,执行步骤202;若未检测到,结束本流程。
202、听写辅助装置在检测到语音信息时,判断当前是否处于报读目标听写内容的过程中;如果是,执行步骤203;如果否,结束本流程。
203、听写辅助装置暂停报读目标听写内容,记录当前的目标听写内容报读进度,并分析语音信息以得到分析结果。
本发明实施例中,听写辅助装置在报读目标听写内容的过程中,若检测到语音信息,听写辅助装置可以暂停目标听写内容的音频资料的播放,并获取暂停播放音频资料时的暂停播放时间点(例如:1分06秒)储存至缓存中。
作为一种可选的实施方式,听写辅助装置可以在报读完目标内容并等待预设时长之后,判断是否检测到恢复报读目标听写内容的指令;若未检测到恢复报读目标听写内容的指令,则再次报读目标内容;若检测到恢复报读目标听写内容的指令,则根据目标听写内容报读进度继续报读目标听写内容。其中,预设时长可以是开发人员根据多次实验结果设定的,也可以是用户自行设定的,本发明实施例不作限定。
实施上述方法,听写辅助装置在报读完目标内容后等待预设的时长,让用户可以在预设的时长内进行查漏补缺;另外,在等待预设时长之后,若未检测到恢复报读目标听写内容的指令,则表示用户可能还未能完全听清楚目标内容,则听写辅助装置可以再次播报目标内容以让用户查漏补缺,提高了用户的使用体验度;以及,若检测到恢复报读目标听写内容的指令,则根据目标听写内容报读进度继续报读目标听写内容,可以不用再重头听一遍听写内容,提高听写的效率。
作为另一种可选的实施方式,听写辅助装置可以预设有用于指示暂停报读听写内容的指令,例如,听写辅助装置可以有一个虚拟的名称“小布”,之后只有在检测到用户呼叫“小布,小布”时,才暂停报读目标听写内容并记录当前的目标听写内容报读进度;而检测到其他语音信息不暂停报读目标听写内容。相应的,听写辅助装置还可以内置有声纹库,声纹库可以与听写辅助装置的语音识别模块相关联,用户可以提前输入自己的身份验证语音信息,声纹库提取用户所输入的身份验证语音信息中的声纹特征并储存至声纹库中,之后,听写辅助装置检测到“小布,小布”的待检测语音信息时,可以提取待检测语音信息中的声纹特征,并与声纹库中储存的声纹特征进行匹配,若匹配,才暂停报读目标听写内容并记录当前的目标听写内容报读进度。
实施上述方法,预设有用于指示暂停报读听写内容的指令可以避免杂音让听写辅助装置出现误判,进而暂停报读目标听写内容;另外内置声纹库,可以让听写辅助装置只识别用户的语音信息,避免其他用户的语音信息让听写辅助装置出现误判,提高听写辅助装置的识别准确率,进而提高了用户的使用体验度。
204-205;其中,步骤204-步骤205与实施例一中的步骤103-步骤104相同,在此不再赘述。
可见,与实施图1所描述的方法相比较,实施图2所描述的方法,还可以在报读目标听写内容的过程中,若检测到用户的语音信息,则暂停报读目标听写内容并记录当前的目标听写内容报读进度,进而后续在检测到恢复报读目标听写内容的指令时,可以根据目标听写内容报读进度继续报读目标听写内容,让用户可以不用再重头听一遍听写内容,提高了听写的效率。
实施例三
请参阅图3,图3是本发明实施例公开的另一种听写辅助方法的流程示意图。如图3所示,该听写辅助方法可以包括以下步骤:
301、听写辅助装置在报读目标听写内容过程中或者报读目标听写内容结束后,判断是否检测到用户的语音信息;若检测到,执行步骤302;若未检测到,结束本流程。
302-304;其中,步骤302-步骤304与实施例一中的步骤102-步骤104相同,在此不再赘述。
305、听写辅助装置检测用户输入的用于跟读目标内容的跟读语音。
本发明实施例中,听写辅助装置可以在输出目标内容之后检测用户的跟读语音。其中,听写辅助装置可以通过检测用户所选择的菜单,当用户选择的菜单表示用户想要输入跟读语音时,启用内置的麦克风采集用户的跟读语音。
306、听写辅助装置判断跟读语音对应的待检测目标内容与目标内容是否匹配;若匹配,执行步骤307;若不匹配,结束本流程。
听写辅助装置可以将目标内容的音频资料与用户输入的语音信息进行匹配,如果匹配,执行步骤307。
作为一种可选的实施方式,若判断出跟读语音对应的待检测目标内容与目标内容不匹配或者检测到用户的目标内容解释请求时,听写辅助装置可以在目标内容中确定出与待检测目标内容对应的同音异义词;结合目标听写内容确定出同音异义词的词义解释信息;输出同音异义词的词义解释信息。
举例来说,例如再次报读的目标内容为“抱负”,而用户的跟读语音是“包袱”,则跟读语音对应的待检测目标内容与目标内容不匹配;或者,再次报读的目标内容还是为“抱负”,而用户的跟读语音是“报复”,“报复”与“抱负”同音异义词,当用户在答案中写下“报复”时,总被判定为错误,则用户可以输入目标内容解释请求。碰到上述情况,听写装置可以结合目标听写内容(例如,我有一个远大的抱负),确定出目标内容是“抱负”,结合词义解释可以输出“抱负,表示的是志向的意思”以辅助用户理解。
在实践中发现,同音异义词是听写过程中的难点,实施上述方法,可以结合目标听写内容,确定出目标内容是同音异义词中的哪一个,并输出词义解释,以辅助用户确定目标内容的意思,即提高了听写的效率,还提高了用户的使用体验度。
307、听写辅助装置输出确认提示信息。
本发明实施例中,听写辅助装置可以以悬浮窗口的方式来输出确认提示信息。其中,确认提示信息用于提示用户待检测目标内容与目标内容匹配。
可见,与实施图1所描述的方法相比较,实施图3所描述的方法,还可以为用户提供一种跟读目标内容的方式,以让用户确定自己所认为的目标内容的是否正确,提高了用户的使用体验度。
实施例四
请参阅图4,图4是本发明实施例公开的一种听写辅助装置的结构示意图。如图4所示,该听写辅助装置可以包括:
第一判断单元401,用于在报读目标听写内容过程中或者报读目标听写内容结束后,判断是否检测到用户的语音信息;
分析单元402,用于在检测到语音信息时,分析语音信息以得到分析结果;
第一确定单元403,用于在分析结果指示用户需要再次报读听写内容时,根据分析结果在目标听写内容中确定出需要再次报读的目标内容;
第一报读单元404,用于报读目标内容。
作为一种可选的实施方式,第一报读单元404在报读目标内容之后,可以输出目标听写内容的正确答案,并将目标听写内容的正确答案中,目标内容对应的正确答案以高亮显示提醒用户。可以让用户在正确答案中快速确定出目标内容对应的正确答案,提高了答案的查询速度,进而提高了用户的使用体验度。
作为另一种可选的实施方式,第一报读单元404可以获取目标内容中的听写难度大于预设难度阈值的内容,并在报读该听写难度大于预设难度阈值的内容时,提高报读的音量至预设的音量阈值,以让用户可以听得更清楚,提高用户的使用体验度。
作为一种可选的实施方式,听写辅助装置可以内置有拍摄模组,第一报读单元404可以关联着听写辅助装置内置的拍摄模组。第一报读单元404在检测到用户输入的答案验证请求时,可以控制拍摄模组拍摄用户所写的答案信息,并利用光学字符识别(OpticalCharacter Recognition,OCR)技术识别所拍摄到的包含用户答案信息的图像以得到听写辅助装置可以读取答案的信息;判断答案信息与目标内容是否匹配,若不匹配,输出包含目标内容的图像。
实施上述方法,可以提高用户的使用体验度。
可见,实施图4所描述的听写辅助装置,听写辅助装置可以根据用户的语音信息在听写内容中截取用户需要再次报读的字或者词,并再次报读这些字或者词语,以辅助用户在听写时查漏补缺;而不需要用户每次对听写内容的部分内容不清楚时,都需要重新听一遍完整的听写内容报读,才能获取到自己需要再次报读的字或者词语,提高了用户在使用听写应用程序听写时的效率。
实施例五
请参阅图5,图5是本发明实施例公开的另一种听写辅助装置的结构示意图。其中,图5所示的听写辅助装置是由图4所示的听写辅助装置进行优化得到的。与图4所示的听写辅助装置相比较,图5所示的听写辅助装置还可以包括:
第二判断单元405,用于在第一报读单元404报读完目标内容并等待预设时长之后,判断是否检测到恢复报读目标听写内容的指令;
第二报读单元406,用于在第二判断单元405等待预设时长之后,未检测到恢复报读目标听写内容的指令时,再次报读目标内容;
第三报读单元407,用于在第二判断单元405等待预设时长之后,检测到恢复报读目标听写内容的指令时,根据目标听写内容报读进度继续报读目标听写内容。
作为一种可选的实施方式,分析单元402用于在检测到语音信息时,分析语音信息以得到分析结果的方式具体为:
分析单元402,用于在检测到语音信息,判断当前是否处于报读目标听写内容的过程中;以及,若当前处于报读目标听写内容的过程中,暂停报读目标听写内容,记录当前的目标听写内容报读进度,并分析语音信息以得到分析结果。
实施上所述方法,可以在报读目标听写内容的过程中,若检测到用户的语音信息,则暂停报读目标听写内容并记录当前的目标听写内容报读进度,后续在检测到恢复报读目标听写内容的指令,根据目标听写内容报读进度继续报读目标听写内容,可以不用再重头听一遍听写内容,提高了听写的效率。
作为另一种可选的实施方式,分析单元402可以预设有用于指示暂停报读听写内容的指令,例如,听写辅助装置可以有一个虚拟的名称“小布”,之后只有在检测到用户呼叫“小布,小布”时,才暂停报读目标听写内容并记录当前的目标听写内容报读进度;而检测到其他语音信息不暂停报读目标听写内容。相应的,分析单元402还可以内置有声纹库,声纹库可以与语音识别模块相关联,用户可以提前输入自己的身份验证语音信息,声纹库提取用户所输入的身份验证语音信息中的声纹特征并储存至声纹库中,之后,听写辅助装置检测到“小布,小布”的待检测语音信息时,可以提取待检测语音信息中的声纹特征,并与声纹库中储存的声纹特征进行匹配,若匹配,才暂停报读目标听写内容并记录当前的目标听写内容报读进度。
实施上述方法,预设有用于指示暂停报读听写内容的指令可以避免杂音让分析单元402出现误判,进而暂停报读目标听写内容;另外内置声纹库,可以让分析单元402只识别用户的语音信息,避免其他用户的语音信息让分析单元402出现误判,提高听写辅助装置的识别准确率,进而提高了用户的使用体验度。
作为另一种可选的实施方式,图5所示的听写辅助装置还可以包括:
检测单元408,用于在第一报读单元404报读目标内容之后,检测用户输入的用于跟读目标内容的跟读语音;
第三判断单元409,用于判断跟读语音对应的待检测目标内容与目标内容是否匹配;
提示单元410,用于在第三判断单元409判断出跟读语音对应的待检测目标内容与目标内容匹配时,输出确认提示信息;其中,确认提示信息用于提示用户待检测目标内容与目标内容匹配。
实施上述方法,可以为用户提供一种跟读目标内容的方式,以让用户确定自己所认为的目标内容的是否正确,提高了用户的使用体验度。
作为另一种可选的实施方式,图5所示的听写辅助装置还可以包括:
第二确定单元411,用于在检测到用户的目标内容解释请求时或者在第三判断单元409判断出跟读语音对应的待检测目标内容与目标内容不匹配时,在目标内容中确定出与待检测目标内容对应的同音异义词;
第三确定单元412,用于结合目标听写内容确定出同音异义词的词义解释信息;
输出单元413,用于输出同音异义词的词义解释信息。
在实践中发现,同音异义词是听写过程中的难点,实施上述方法,可以结合目标听写内容,确定出目标内容是同音异义词中的哪一个,并输出词义解释,以辅助用户确定目标内容的意思,即提高了听写的效率,还提高了用户的使用体验度。
可见,与实施图4所描述的听写辅助装置相比较,实施图5所描述的听写辅助装置,还可以在报读完目标内容后等待预设的时长,以让用户可以在预设的时长内进行查漏补缺;另外,在等待预设时长之后,若未检测到恢复报读目标听写内容的指令,则表示用户可能还未能完全听清楚目标内容,则听写辅助装置可以再次播报目标内容以让用户查漏补缺,提高了用户的使用体验度;以及,若检测到恢复报读目标听写内容的指令,则根据目标听写内容报读进度继续报读目标听写内容,可以不用再重新听一遍听写内容,提高听写的效率。
实施例六
请参阅图6,图6是本发明实施例公开的另一种听写辅助装置的结构示意图。如图6所示,该听写辅助装置可以包括:
存储有可执行程序代码的存储器601;
与存储器601耦合的处理器602;
其中,处理器602调用存储器601中存储的可执行程序代码,执行图1~图3任意一种听写辅助方法。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行图1~图3任意一种听写辅助方法。
本发明实施例还公开一种应用发布平台,其中,应用发布平台用于发布计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。
在本发明的各种实施例中,应理解,上述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物单元,即可位于一个地方,或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例上述方法的部分或全部步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种听写辅助方法及听写辅助装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种听写辅助方法,其特征在于,所述方法包括:
在报读目标听写内容过程中或者报读所述目标听写内容结束后,判断是否检测到用户的语音信息;
若检测到所述语音信息,分析所述语音信息以得到分析结果;
若所述分析结果指示所述用户需要再次报读听写内容,根据所述分析结果在所述目标听写内容中确定出需要再次报读的目标内容;
报读所述目标内容。
2.根据权利要求1所述的方法,其特征在于,所述若检测到所述语音信息,分析所述语音信息以得到分析结果,包括:
若检测到所述语音信息,判断当前是否处于报读所述目标听写内容的过程中;
若当前处于报读所述目标听写内容的过程中,暂停报读所述目标听写内容,记录当前的目标听写内容报读进度,并分析所述语音信息以得到分析结果。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在报读完所述目标内容并等待预设时长之后,判断是否检测到恢复报读所述目标听写内容的指令;
若未检测到所述恢复报读所述目标听写内容的指令,则再次报读所述目标内容;
若检测到恢复报读所述目标听写内容的指令,则根据所述目标听写内容报读进度继续报读所述目标听写内容。
4.根据权利要求1所述的方法,其特征在于,在报读所述目标内容之后,所述方法还包括:
检测所述用户输入的用于跟读所述目标内容的跟读语音;
判断所述跟读语音对应的待检测目标内容与所述目标内容是否匹配;
若匹配,输出确认提示信息;其中,所述确认提示信息用于提示所述用户所述待检测目标内容与所述目标内容匹配。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
若判断出所述跟读语音对应的待检测目标内容与所述目标内容不匹配或者检测到用户的目标内容解释请求时,在所述目标内容中确定出与所述待检测目标内容对应的同音异义词;
结合所述目标听写内容确定出所述同音异义词的词义解释信息;
输出所述同音异义词的词义解释信息。
6.一种听写辅助装置,其特征在于,所述装置包括:
第一判断单元,用于在报读目标听写内容过程中或者报读所述目标听写内容结束后,判断是否检测到用户的语音信息;
分析单元,用于在检测到所述语音信息时,分析所述语音信息以得到分析结果;
第一确定单元,用于在所述分析结果指示所述用户需要再次报读听写内容时,根据所述分析结果在所述目标听写内容中确定出需要再次报读的目标内容;
第一报读单元,用于报读所述目标内容。
7.根据权利要求6所述的装置,其特征在于,所述分析单元用于在检测到所述语音信息时,分析所述语音信息以得到分析结果的方式具体为:
所述分析单元,用于在检测到所述语音信息,判断当前是否处于报读所述目标听写内容的过程中;以及,若当前处于报读所述目标听写内容的过程中,暂停报读所述目标听写内容,记录当前的目标听写内容报读进度,并分析所述语音信息以得到分析结果。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第二判断单元,用于在所述第一报读单元报读完所述目标内容并等待预设时长之后,判断是否检测到恢复报读所述目标听写内容的指令;
第二报读单元,用于在所述第二判断单元等待预设时长之后,未检测到所述恢复报读所述目标听写内容的指令时,再次报读所述目标内容;
第三报读单元,用于在所述第二判断单元等待预设时长之后,检测到恢复报读所述目标听写内容的指令时,根据所述目标听写内容报读进度继续报读所述目标听写内容。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
检测单元,用于在所述第一报读单元报读所述目标内容之后,检测所述用户输入的用于跟读所述目标内容的跟读语音;
第三判断单元,用于判断所述跟读语音对应的待检测目标内容与所述目标内容是否匹配;
提示单元,用于在所述第三判断单元判断出所述跟读语音对应的待检测目标内容与所述目标内容匹配时,输出确认提示信息;其中,所述确认提示信息用于提示所述用户所述待检测目标内容与所述目标内容匹配。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第二确定单元,用于在检测到用户的目标内容解释请求时或者在所述第三判断单元判断出所述跟读语音对应的待检测目标内容与所述目标内容不匹配时,在所述目标内容中确定出与所述待检测目标内容对应的同音异义词;
第三确定单元,用于结合所述目标听写内容确定出所述同音异义词的词义解释信息;
输出单元,用于输出所述同音异义词的词义解释信息。
CN201811539708.9A 2018-12-17 2018-12-17 一种听写辅助方法及听写辅助装置 Pending CN109599108A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811539708.9A CN109599108A (zh) 2018-12-17 2018-12-17 一种听写辅助方法及听写辅助装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811539708.9A CN109599108A (zh) 2018-12-17 2018-12-17 一种听写辅助方法及听写辅助装置

Publications (1)

Publication Number Publication Date
CN109599108A true CN109599108A (zh) 2019-04-09

Family

ID=65962615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811539708.9A Pending CN109599108A (zh) 2018-12-17 2018-12-17 一种听写辅助方法及听写辅助装置

Country Status (1)

Country Link
CN (1) CN109599108A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111028843A (zh) * 2019-04-11 2020-04-17 广东小天才科技有限公司 一种听写方法及电子设备
CN111031232A (zh) * 2019-04-24 2020-04-17 广东小天才科技有限公司 一种听写实时检测的方法及电子设备
CN111027317A (zh) * 2019-04-28 2020-04-17 广东小天才科技有限公司 一种听写报读进度的控制方法及电子设备
CN111079484A (zh) * 2019-05-17 2020-04-28 广东小天才科技有限公司 一种书写内容的识别方法及电子设备
CN111081089A (zh) * 2019-05-10 2020-04-28 广东小天才科技有限公司 一种基于面部特征信息的听写控制方法及装置
CN111078936A (zh) * 2019-07-11 2020-04-28 广东小天才科技有限公司 一种听写内容确定方法及终端设备
CN111083600A (zh) * 2019-10-18 2020-04-28 广东小天才科技有限公司 一种听写内容的投屏显示方法及智能音箱
CN111081227A (zh) * 2019-07-29 2020-04-28 广东小天才科技有限公司 一种听写内容的识别方法及电子设备
CN111081082A (zh) * 2019-07-11 2020-04-28 广东小天才科技有限公司 一种基于用户意图的听写智能控制方法及电子设备
CN111081081A (zh) * 2019-07-02 2020-04-28 广东小天才科技有限公司 一种听写报读方法及电子设备
CN111078098A (zh) * 2019-05-10 2020-04-28 广东小天才科技有限公司 一种听写控制方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079189A (zh) * 2007-03-20 2007-11-28 无敌科技(西安)有限公司 一种汉语读音修正的听写学习方法及其***
US20110054895A1 (en) * 2007-03-07 2011-03-03 Phillips Michael S Utilizing user transmitted text to improve language model in mobile dictation application
CN102163379A (zh) * 2010-02-24 2011-08-24 英业达股份有限公司 听写文章之校正语音的定位与播放***及其方法
CN204496731U (zh) * 2015-01-19 2015-07-22 王功成 一种语音控制听写装置
CN106603479A (zh) * 2015-10-20 2017-04-26 金诚洙 带有数字化英语学习应用的终端
CN108648545A (zh) * 2018-07-16 2018-10-12 广东小天才科技有限公司 一种应用于家教设备的生字复习方法及家教设备
CN108986564A (zh) * 2018-06-21 2018-12-11 广东小天才科技有限公司 一种基于智能交互的报读控制方法及电子设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110054895A1 (en) * 2007-03-07 2011-03-03 Phillips Michael S Utilizing user transmitted text to improve language model in mobile dictation application
CN101079189A (zh) * 2007-03-20 2007-11-28 无敌科技(西安)有限公司 一种汉语读音修正的听写学习方法及其***
CN102163379A (zh) * 2010-02-24 2011-08-24 英业达股份有限公司 听写文章之校正语音的定位与播放***及其方法
CN204496731U (zh) * 2015-01-19 2015-07-22 王功成 一种语音控制听写装置
CN106603479A (zh) * 2015-10-20 2017-04-26 金诚洙 带有数字化英语学习应用的终端
CN108986564A (zh) * 2018-06-21 2018-12-11 广东小天才科技有限公司 一种基于智能交互的报读控制方法及电子设备
CN108648545A (zh) * 2018-07-16 2018-10-12 广东小天才科技有限公司 一种应用于家教设备的生字复习方法及家教设备

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111028843A (zh) * 2019-04-11 2020-04-17 广东小天才科技有限公司 一种听写方法及电子设备
CN111031232A (zh) * 2019-04-24 2020-04-17 广东小天才科技有限公司 一种听写实时检测的方法及电子设备
CN111027317A (zh) * 2019-04-28 2020-04-17 广东小天才科技有限公司 一种听写报读进度的控制方法及电子设备
CN111081089A (zh) * 2019-05-10 2020-04-28 广东小天才科技有限公司 一种基于面部特征信息的听写控制方法及装置
CN111078098A (zh) * 2019-05-10 2020-04-28 广东小天才科技有限公司 一种听写控制方法及装置
CN111079484A (zh) * 2019-05-17 2020-04-28 广东小天才科技有限公司 一种书写内容的识别方法及电子设备
CN111079484B (zh) * 2019-05-17 2023-11-24 广东小天才科技有限公司 一种书写内容的识别方法及电子设备
CN111081081A (zh) * 2019-07-02 2020-04-28 广东小天才科技有限公司 一种听写报读方法及电子设备
CN111081081B (zh) * 2019-07-02 2021-12-21 广东小天才科技有限公司 一种听写报读方法及电子设备
CN111081082A (zh) * 2019-07-11 2020-04-28 广东小天才科技有限公司 一种基于用户意图的听写智能控制方法及电子设备
CN111081082B (zh) * 2019-07-11 2022-04-29 广东小天才科技有限公司 一种基于用户意图的听写智能控制方法及电子设备
CN111078936A (zh) * 2019-07-11 2020-04-28 广东小天才科技有限公司 一种听写内容确定方法及终端设备
CN111081227A (zh) * 2019-07-29 2020-04-28 广东小天才科技有限公司 一种听写内容的识别方法及电子设备
CN111083600A (zh) * 2019-10-18 2020-04-28 广东小天才科技有限公司 一种听写内容的投屏显示方法及智能音箱

Similar Documents

Publication Publication Date Title
CN109599108A (zh) 一种听写辅助方法及听写辅助装置
JP6857581B2 (ja) 成長型対話装置
CN107274916B (zh) 基于声纹信息对音频/视频文件进行操作的方法及装置
CN104424094B (zh) 一种异常信息获取方法、装置及智能终端设备
CN104143326B (zh) 一种语音命令识别方法和装置
WO2017197953A1 (zh) 基于声纹的身份识别方法及装置
CN109686383B (zh) 一种语音分析方法、装置及存储介质
CN108305632A (zh) 一种会议的语音摘要形成方法及***
CN109003602A (zh) 语音产品的测试方法、装置、设备及计算机可读介质
WO2019148586A1 (zh) 多人发言中发言人识别方法以及装置
CN107305541A (zh) 语音识别文本分段方法及装置
CN109360550A (zh) 语音交互***的测试方法、装置、设备和存储介质
US20140075570A1 (en) Method, electronic device, and machine readable storage medium for protecting information security
CN109192194A (zh) 语音数据标注方法、装置、计算机设备及存储介质
CN110675862A (zh) 语料获取方法、电子装置及存储介质
CN110047481A (zh) 用于语音识别的方法和装置
CN107193914A (zh) 一种语音输入方法及移动终端
US10269352B2 (en) System and method for detecting phonetically similar imposter phrases
CN107808674A (zh) 一种测评语音的方法、介质、装置及电子设备
JP2002132287A (ja) 音声収録方法および音声収録装置および記憶媒体
CN109671309A (zh) 一种错误读音识别方法及电子设备
CN109658776A (zh) 一种背诵流畅度的检测方法及电子设备
CN112309406A (zh) 声纹注册方法、装置和计算机可读存储介质
CN117636872A (zh) 音频处理方法、装置、电子设备和可读存储介质
CN113516994B (zh) 实时语音识别方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190409