WO2023273578A1

WO2023273578A1 - Procédé et appareil de reconnaissance vocale, support et dispositif

Info

Publication number: WO2023273578A1
Application number: PCT/CN2022/089595
Authority: WO
Inventors: 董林昊; 韩明伦; 马泽君
Original assignee: 北京有竹居网络技术有限公司
Priority date: 2021-06-30
Filing date: 2022-04-27
Publication date: 2023-01-05
Also published as: CN113470619A; CN113470619B

Abstract

L'invention concerne un procédé et un appareil de reconnaissance vocale, ainsi qu'un support lisible par ordinateur et un dispositif. Le procédé comprend les étapes consistant : à recevoir des données vocales devant être reconnues (11) ; et selon lesdites données de parole, des informations de mot réveil et un modèle de reconnaissance vocale, obtenir un texte cible correspondant auxdites données de parole (12), les informations de mot réveil comprenant des séquences de texte et des séquences de symboles phonétiques correspondant à une pluralité de mots réveil, le modèle de reconnaissance vocale comprenant un sous-modèle de reconnaissance vocale et un sous-modèle de reconnaissance de contexte, et le sous-modèle de reconnaissance de contexte étant entrainé sur la base d'un mot d'entrainement et d'une séquence de symboles phonétiques, d'une séquence de texte et d'une étiquette d'entrainement du mot d'entrainement. Par conséquent, lorsqu'un sous-modèle de reconnaissance de contexte est entrainé, un entrainement est effectué en vue d'une caractéristique de prononciation et d'une caractéristique de texte de données d'entrainement, de sorte que des mots réveil qui sont similaires à l'orthographe ou à la prononciation peuvent être distingués avec précision sur la base de la caractéristique de prononciation, ce qui permet d'éviter une reconnaissance confondue des mots réveil lorsque les mots réveil sont reconnus, et d'améliorer, en outre, la précision de la reconnaissance de la parole.