CN107342086A - 语音处理方法及装置 - Google Patents
语音处理方法及装置 Download PDFInfo
- Publication number
- CN107342086A CN107342086A CN201710458436.9A CN201710458436A CN107342086A CN 107342086 A CN107342086 A CN 107342086A CN 201710458436 A CN201710458436 A CN 201710458436A CN 107342086 A CN107342086 A CN 107342086A
- Authority
- CN
- China
- Prior art keywords
- case
- text message
- text
- speech recognition
- default case
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000009466 transformation Effects 0.000 claims description 8
- 238000002372 labelling Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 12
- 238000004590 computer program Methods 0.000 description 7
- 230000009471 action Effects 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明是关于一种语音处理方法及装置,其中,方法包括:从预设数据库中获取预设案件的文本信息;对所述文本信息进行文本识别,并进行专有名词标注,以得到关键词列表;根据所述文本信息和所述关键词列表生成所述预设案件对应的语音识别模型;获取关于所述预设案件的语音信息,根据所述语音识别模型对所述语音信息进行识别,以得到所述语音信息对应的识别文本信息。通过该技术方案,可以在识别庭审录音等语音信息时,提高识别结果的准确性和识别率,提升用户体验。
Description
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音处理方法及装置。
背景技术
相关技术中,当对案件的庭审录音等进行语音识别时,由于其中存在大量专业词汇,如人名、地名等,识别起来存在一定困难,因此,导致识别结果不准确。
发明内容
本发明实施例提供一种语音处理方法及装置,用以实现在识别庭审录音等语音信息时,提高识别结果的准确性和识别率,提升用户体验。
根据本发明实施例的第一方面,提供一种语音处理方法,包括:
从预设数据库中获取预设案件的文本信息;
对所述文本信息进行文本识别,并进行专有名词标注,以得到关键词列表;
根据所述文本信息和所述关键词列表生成所述预设案件对应的语音识别模型;
获取关于所述预设案件的语音信息,根据所述语音识别模型对所述语音信息进行识别,以得到所述语音信息对应的识别文本信息。
在一个实施例中,所述关于预设案件的语音信息包括所述预设案件的庭审录音。
在该实施例中,对预设案件的文本信息进行文本识别,标注出至少一个专有名词,组成关键词列表,进而根据关键词列表和案件的文本信息生成该案件对应的语音识别模型,这样,在识别该案件的庭审录音时,可以根据语音识别模型进行识别,从而提高识别结果的准确性和识别率,提升用户的使用体验。
例如,当法院里做一次庭审的语音转文字处理时,可在开庭前将包含本次案件关键人物名称、地点、时间的文本上传到数据库中,这样,可以事先生成语音识别模块,再做庭审录音的语音识别,则能有效提升此过程中对关键人物名称、地点的识别率。
在一个实施例中,从预设数据库中获取预设案件的文本信息,包括:
根据所述预设案件的案件标识获取所述预设案件的文本信息。
在该实施例中,为了便于对案件进行区分和便于用户查找,可以为每个案件设置案件标识,进而方便根据案件标识获取该案件的文本信息。
在一个实施例中,所述案件标识包括以下任一项:用户身份标识、用户设备标识和案件编号。
在该实施例中,在将案件文本输入数据库时,可以携带用户身份标识,以标记最终的庭审文本记录。该方案适用于单一设备实现,如庭审时书记员的设备。
当然,还可以在将案件文本输入数据库时,带上案件编号。这样可预先将多个案子的文本提前输入数据库,形成每个案件对应的语音识别模型。当开庭时,输入案件编号,即可加载相应的语音识别模型对庭审记录进行识别。当然,还可以利用设备标识作为案件标识。
在一个实施例中,在获取预设案件的文本信息之后,所述方法还包括:
对所述文本信息进行过滤,以将所述文本信息中的非文本内容转换成文本内容。
在该实施例中,可以对案件的文本信息进行过滤,从而将非文本内容转换成文本内容。如案件文本可能是文本、也可能含图、语音、视频等。文本过滤一种方式是只保留文本,丢弃图、语音、视频等;另一种方式是将图、语音、视频等都转换成文字。
在一个实施例中,所述方法还包括:
接收输入的预设案件对应的语音识别模型删除命令;
根据所述语音识别模型删除命令,删除所述语音识别模型。
在该实施例中,为了避免占用过多的存储空间,当对庭审案件识别结束后,可以将语音识别模型删除。
根据本发明实施例的第二方面,提供一种语音处理装置,包括:
获取模块,用于从预设数据库中获取预设案件的文本信息;
标注模块,用于对所述文本信息进行文本识别,并进行专有名词标注,以得到关键词列表;
生成模块,用于根据所述文本信息和所述关键词列表生成所述预设案件对应的语音识别模型;
识别模块,用于获取关于所述预设案件的语音信息,根据所述语音识别模型对所述语音信息进行识别,以得到所述语音信息对应的识别文本信息。
在一个实施例中,所述获取模块用于:
根据所述预设案件的案件标识获取所述预设案件的文本信息。
在一个实施例中,所述案件标识包括以下任一项:用户身份标识、用户设备标识和案件编号。
在一个实施例中,所述装置还包括:
转换模块,用于在获取预设案件的文本信息之后,对所述文本信息进行过滤,以将所述文本信息中的非文本内容转换成文本内容。
在一个实施例中,所述装置还包括:
接收模块,用于接收输入的预设案件对应的语音识别模型删除命令;
删除模块,用于根据所述语音识别模型删除命令,删除所述语音识别模型。
在一个实施例中,所述关于预设案件的语音信息包括所述预设案件的庭审录音。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种语音处理方法的流程图。
图2是根据一示例性实施例示出的另一种语音处理方法的流程图。
图3是根据一示例性实施例示出的又一种语音处理方法的流程图。
图4是根据一示例性实施例示出的一种语音处理装置的框图。
图5是根据一示例性实施例示出的另一种语音处理装置的框图。
图6是根据一示例性实施例示出的又一种语音处理装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种语音处理方法的流程图。该语音处理方法应用于服务器中。如图1所示,该方法包括步骤S101-S104:
在步骤S101中,从预设数据库中获取预设案件的文本信息;用户可以预先将预设案件的文本信息存储至预设数据库中。
在步骤S102中,对所述文本信息进行文本识别,并进行专有名词标注,以得到关键词列表;其中,专有名词包括人名、地名等。
在步骤S103中,根据所述文本信息和所述关键词列表生成所述预设案件对应的语音识别模型;即利用文本信息和关键词列表进行训练,生成语音识别模块。
在步骤S104中,获取关于所述预设案件的语音信息,根据所述语音识别模型对所述语音信息进行识别,以得到所述语音信息对应的识别文本信息。
在一个实施例中,所述关于预设案件的语音信息包括所述预设案件的庭审录音。
在该实施例中,对预设案件的文本信息进行文本识别,标注出至少一个专有名词,组成关键词列表,进而根据关键词列表和案件的文本信息生成该案件对应的语音识别模型,这样,在识别该案件的庭审录音时,可以根据语音识别模型进行识别,从而提高识别结果的准确性和识别率,提升用户的使用体验。
例如,当法院里做一次庭审的语音转文字处理时,可在开庭前将包含本次案件关键人物名称、地点、时间的文本上传到数据库中,这样,可以事先生成语音识别模块,再做庭审录音的语音识别,则能有效提升此过程中对关键人物名称、地点的识别率。
在一个实施例中,从预设数据库中获取预设案件的文本信息,包括:
根据所述预设案件的案件标识获取所述预设案件的文本信息。
在该实施例中,为了便于对案件进行区分和便于用户查找,可以为每个案件设置案件标识,进而方便根据案件标识获取该案件的文本信息。
在一个实施例中,所述案件标识包括以下任一项:用户身份标识、用户设备标识和案件编号。
在该实施例中,在将案件文本输入数据库时,可以携带用户身份标识,以标记最终的庭审文本记录。该方案适用于单一设备实现,如庭审时书记员的设备。
当然,还可以在将案件文本输入数据库时,带上案件编号。这样可预先将多个案子的文本提前输入数据库,形成每个案件对应的语音识别模型。当开庭时,输入案件编号,即可加载相应的语音识别模型对庭审记录进行识别。
图2是根据一示例性实施例示出的另一种语音处理方法的流程图。
如图2所示,在一个实施例中,在获取预设案件的文本信息之后,上述方法还包括步骤S201:
在步骤S201中,对所述文本信息进行过滤,以将所述文本信息中的非文本内容转换成文本内容。
在该实施例中,可以对案件的文本信息进行过滤,从而将非文本内容转换成文本内容。如案件文本可能是文本、也可能含图、语音、视频等。文本过滤一种方式是只保留文本,丢弃图、语音、视频等;另一种方式是将图、语音、视频等都转换成文字。
图3是根据一示例性实施例示出的又一种语音处理方法的流程图。
如图3所示,在一个实施例中,上述方法还包括步骤S301-S302:
在步骤S301中,接收输入的预设案件对应的语音识别模型删除命令;
在步骤S302中,根据所述语音识别模型删除命令,删除所述语音识别模型。
在该实施例中,为了避免占用过多的存储空间,当对庭审案件识别结束后,可以将语音识别模型删除。
下述为本发明装置实施例,可以用于执行本发明方法实施例。
图4是根据一示例性实施例示出的一种语音处理装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为服务器的部分或者全部。如图4所示,该语音处理装置包括:
获取模块41,用于从预设数据库中获取预设案件的文本信息;
标注模块42,用于对所述文本信息进行文本识别,并进行专有名词标注,以得到关键词列表;
生成模块43,用于根据所述文本信息和所述关键词列表生成所述预设案件对应的语音识别模型;
识别模块44,用于获取关于所述预设案件的语音信息,根据所述语音识别模型对所述语音信息进行识别,以得到所述语音信息对应的识别文本信息。
在一个实施例中,所述关于预设案件的语音信息包括所述预设案件的庭审录音。
在该实施例中,对预设案件的文本信息进行文本识别,标注出至少一个专有名词,组成关键词列表,进而根据关键词列表和案件的文本信息生成该案件对应的语音识别模型,这样,在识别该案件的庭审录音时,可以根据语音识别模型进行识别,从而提高识别结果的准确性和识别率,提升用户的使用体验。
例如,当法院里做一次庭审的语音转文字处理时,可在开庭前将包含本次案件关键人物名称、地点、时间的文本上传到数据库中,这样,可以事先生成语音识别模块,再做庭审录音的语音识别,则能有效提升此过程中对关键人物名称、地点的识别率。
在一个实施例中,所述获取模块41用于:
根据所述预设案件的案件标识获取所述预设案件的文本信息。
在该实施例中,为了便于对案件进行区分和便于用户查找,可以为每个案件设置案件标识,进而方便根据案件标识获取该案件的文本信息。
在一个实施例中,所述案件标识包括以下任一项:用户身份标识、用户设备标识和案件编号。
在该实施例中,在将案件文本输入数据库时,可以携带用户身份标识,以标记最终的庭审文本记录。该方案适用于单一设备实现,如庭审时书记员的设备。
当然,还可以在将案件文本输入数据库时,带上案件编号。这样可预先将多个案子的文本提前输入数据库,形成每个案件对应的语音识别模型。当开庭时,输入案件编号,即可加载相应的语音识别模型对庭审记录进行识别。
图5是根据一示例性实施例示出的另一种语音处理装置的框图。
如图5所示,在一个实施例中,上述装置还包括:
转换模块51,用于在获取预设案件的文本信息之后,对所述文本信息进行过滤,以将所述文本信息中的非文本内容转换成文本内容。
在该实施例中,可以对案件的文本信息进行过滤,从而将非文本内容转换成文本内容。如案件文本可能是文本、也可能含图、语音、视频等。文本过滤一种方式是只保留文本,丢弃图、语音、视频等;另一种方式是将图、语音、视频等都转换成文字。
图6是根据一示例性实施例示出的又一种语音处理装置的框图。
如图6所示,在一个实施例中,上述装置还包括:
接收模块61,用于接收输入的预设案件对应的语音识别模型删除命令;
删除模块62,用于根据所述语音识别模型删除命令,删除所述语音识别模型。
在该实施例中,为了避免占用过多的存储空间,当对庭审案件识别结束后,可以将语音识别模型删除。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (12)
1.一种语音处理方法,用于服务器,其特征在于,包括:
从预设数据库中获取预设案件的文本信息;
对所述文本信息进行文本识别,并进行专有名词标注,以得到关键词列表;
根据所述文本信息和所述关键词列表生成所述预设案件对应的语音识别模型;
获取关于所述预设案件的语音信息,根据所述语音识别模型对所述语音信息进行识别,以得到所述语音信息对应的识别文本信息。
2.根据权利要求1所述的方法,其特征在于,从预设数据库中获取预设案件的文本信息,包括:
根据所述预设案件的案件标识获取所述预设案件的文本信息。
3.根据权利要求2所述的方法,其特征在于,所述案件标识包括以下任一项:用户身份标识、用户设备标识和案件编号。
4.根据权利要求1所述的方法,其特征在于,在获取预设案件的文本信息之后,所述方法还包括:
对所述文本信息进行过滤,以将所述文本信息中的非文本内容转换成文本内容。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收输入的预设案件对应的语音识别模型删除命令;
根据所述语音识别模型删除命令,删除所述语音识别模型。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述关于预设案件的语音信息包括所述预设案件的庭审录音。
7.一种语音处理装置,用于服务器,其特征在于,包括:
获取模块,用于从预设数据库中获取预设案件的文本信息;
标注模块,用于对所述文本信息进行文本识别,并进行专有名词标注,以得到关键词列表;
生成模块,用于根据所述文本信息和所述关键词列表生成所述预设案件对应的语音识别模型;
识别模块,用于获取关于所述预设案件的语音信息,根据所述语音识别模型对所述语音信息进行识别,以得到所述语音信息对应的识别文本信息。
8.根据权利要求7所述的装置,其特征在于,所述获取模块用于:
根据所述预设案件的案件标识获取所述预设案件的文本信息。
9.根据权利要求8所述的装置,其特征在于,所述案件标识包括以下任一项:用户身份标识、用户设备标识和案件编号。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
转换模块,用于在获取预设案件的文本信息之后,对所述文本信息进行过滤,以将所述文本信息中的非文本内容转换成文本内容。
11.根据权利要求7所述的装置,其特征在于,所述装置还包括:
接收模块,用于接收输入的预设案件对应的语音识别模型删除命令;
删除模块,用于根据所述语音识别模型删除命令,删除所述语音识别模型。
12.根据权利要求7至12中任一项所述的装置,其特征在于,所述关于预设案件的语音信息包括所述预设案件的庭审录音。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710458436.9A CN107342086A (zh) | 2017-06-16 | 2017-06-16 | 语音处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710458436.9A CN107342086A (zh) | 2017-06-16 | 2017-06-16 | 语音处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107342086A true CN107342086A (zh) | 2017-11-10 |
Family
ID=60219987
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710458436.9A Pending CN107342086A (zh) | 2017-06-16 | 2017-06-16 | 语音处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107342086A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113808582A (zh) * | 2020-06-17 | 2021-12-17 | 北京字节跳动网络技术有限公司 | 语音识别方法、装置、设备及存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101388078A (zh) * | 2008-09-27 | 2009-03-18 | 腾讯科技(深圳)有限公司 | 基于验证的文本识别的方法及装置 |
CN101465960A (zh) * | 2007-12-19 | 2009-06-24 | 深圳富泰宏精密工业有限公司 | 具有语音控制功能的摄像装置及其使用方法 |
CN101763508A (zh) * | 2008-12-24 | 2010-06-30 | 新奥特硅谷视频技术有限责任公司 | 一种语音信息的获取、转换和标识的方法和装置 |
CN102915731A (zh) * | 2012-10-10 | 2013-02-06 | 百度在线网络技术(北京)有限公司 | 一种个性化的语音识别的方法及装置 |
US20130151252A1 (en) * | 2009-11-13 | 2013-06-13 | At&T Intellectual Property I, L.P. | System and method for standardized speech recognition |
CN103165129A (zh) * | 2011-12-13 | 2013-06-19 | 北京百度网讯科技有限公司 | 一种优化语音识别声学模型的方法及*** |
CN103365988A (zh) * | 2013-07-05 | 2013-10-23 | 百度在线网络技术(北京)有限公司 | 对移动终端的图片文字朗读的方法、装置和移动终端 |
CN104464423A (zh) * | 2014-12-19 | 2015-03-25 | 科大讯飞股份有限公司 | 一种口语考试评测的校标优化方法及*** |
CN105609104A (zh) * | 2016-01-22 | 2016-05-25 | 北京云知声信息技术有限公司 | 一种信息处理方法、装置及智能语音路由控制器 |
CN105913838A (zh) * | 2016-05-19 | 2016-08-31 | 努比亚技术有限公司 | 音频管理装置和方法 |
CN106448675A (zh) * | 2016-10-21 | 2017-02-22 | 科大讯飞股份有限公司 | 识别文本修正方法及*** |
CN106601236A (zh) * | 2016-12-22 | 2017-04-26 | 北京云知声信息技术有限公司 | 语音识别方法及装置 |
-
2017
- 2017-06-16 CN CN201710458436.9A patent/CN107342086A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101465960A (zh) * | 2007-12-19 | 2009-06-24 | 深圳富泰宏精密工业有限公司 | 具有语音控制功能的摄像装置及其使用方法 |
CN101388078A (zh) * | 2008-09-27 | 2009-03-18 | 腾讯科技(深圳)有限公司 | 基于验证的文本识别的方法及装置 |
CN101763508A (zh) * | 2008-12-24 | 2010-06-30 | 新奥特硅谷视频技术有限责任公司 | 一种语音信息的获取、转换和标识的方法和装置 |
US20130151252A1 (en) * | 2009-11-13 | 2013-06-13 | At&T Intellectual Property I, L.P. | System and method for standardized speech recognition |
CN103165129A (zh) * | 2011-12-13 | 2013-06-19 | 北京百度网讯科技有限公司 | 一种优化语音识别声学模型的方法及*** |
CN102915731A (zh) * | 2012-10-10 | 2013-02-06 | 百度在线网络技术(北京)有限公司 | 一种个性化的语音识别的方法及装置 |
CN103365988A (zh) * | 2013-07-05 | 2013-10-23 | 百度在线网络技术(北京)有限公司 | 对移动终端的图片文字朗读的方法、装置和移动终端 |
CN104464423A (zh) * | 2014-12-19 | 2015-03-25 | 科大讯飞股份有限公司 | 一种口语考试评测的校标优化方法及*** |
CN105609104A (zh) * | 2016-01-22 | 2016-05-25 | 北京云知声信息技术有限公司 | 一种信息处理方法、装置及智能语音路由控制器 |
CN105913838A (zh) * | 2016-05-19 | 2016-08-31 | 努比亚技术有限公司 | 音频管理装置和方法 |
CN106448675A (zh) * | 2016-10-21 | 2017-02-22 | 科大讯飞股份有限公司 | 识别文本修正方法及*** |
CN106601236A (zh) * | 2016-12-22 | 2017-04-26 | 北京云知声信息技术有限公司 | 语音识别方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113808582A (zh) * | 2020-06-17 | 2021-12-17 | 北京字节跳动网络技术有限公司 | 语音识别方法、装置、设备及存储介质 |
CN113808582B (zh) * | 2020-06-17 | 2024-04-09 | 抖音视界有限公司 | 语音识别方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107452405B (zh) | 一种根据语音内容进行数据评价的方法及装置 | |
CN106570496B (zh) | 情绪识别方法和装置以及智能交互方法和设备 | |
CN111666746B (zh) | 会议纪要的生成方法及装置、电子设备及存储介质 | |
Baur et al. | eXplainable cooperative machine learning with NOVA | |
CN109361825A (zh) | 会议纪要记录方法、终端及计算机存储介质 | |
CN104951433A (zh) | 基于上下文进行意图识别的方法和*** | |
CN110148400A (zh) | 发音类型的识别方法、模型的训练方法、装置及设备 | |
TW201113870A (en) | Method for analyzing sentence emotion, sentence emotion analyzing system, computer readable and writable recording medium and multimedia device | |
CN107038154A (zh) | 一种文本情感识别方法和装置 | |
CN108470188B (zh) | 基于图像分析的交互方法及电子设备 | |
CN111144097B (zh) | 一种对话文本的情感倾向分类模型的建模方法和装置 | |
CN107291775A (zh) | 错误样本的修复语料生成方法和装置 | |
Rao et al. | Sentiment analysis on user-generated video, audio and text | |
CN110059178A (zh) | 问题派发方法及装置 | |
CN110992988A (zh) | 一种基于领域对抗的语音情感识别方法及装置 | |
CN113342942B (zh) | 语料自动化获取方法、装置、计算机设备及存储介质 | |
CN108810625A (zh) | 一种多媒体数据的播放控制方法、装置及终端 | |
CN116227463A (zh) | 一种富媒体文稿辅助生成装置 | |
CN112560811B (zh) | 端到端的音视频抑郁症自动检测研究方法 | |
TWI771632B (zh) | 學習支援裝置、學習支援方法及記錄媒體 | |
CN107342086A (zh) | 语音处理方法及装置 | |
CN104504104A (zh) | 用于搜索引擎的图片物料处理方法、装置和搜索引擎 | |
CN110459296A (zh) | 信息推送方法及相关产品 | |
JP2006236037A (ja) | 音声対話コンテンツ作成方法、装置、プログラム、記録媒体 | |
WO2022084851A1 (en) | Embedded dictation detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171110 |