CN1460245A - 编辑期间使音频光标与文本光标同步 - Google Patents

编辑期间使音频光标与文本光标同步 Download PDF

Info

Publication number
CN1460245A
CN1460245A CN02800829A CN02800829A CN1460245A CN 1460245 A CN1460245 A CN 1460245A CN 02800829 A CN02800829 A CN 02800829A CN 02800829 A CN02800829 A CN 02800829A CN 1460245 A CN1460245 A CN 1460245A
Authority
CN
China
Prior art keywords
cursor
speech
text message
eti
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN02800829A
Other languages
English (en)
Other versions
CN1225721C (zh
Inventor
W·格施温德特纳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuance Communications Inc
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=8185105&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN1460245(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1460245A publication Critical patent/CN1460245A/zh
Application granted granted Critical
Publication of CN1225721C publication Critical patent/CN1225721C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Document Processing Apparatus (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Machine Translation (AREA)

Abstract

语音识别装置(1)处理口述的语音数据(SD),由此创建口述的识别文本信息(ETI)和链接信息(LI)。在语音识别装置(1)的同步重放模式下,在口述的声音重放期间,校对装置(10)同步地标记识别文本信息(ETI)中与刚刚重放的语音数据(SD)相关并被链接信息(LI)标记的词,而刚刚标记的词反映音频光标(AC)的位置。当该语音识别装置(1)的用户识别出错词时,他将文本光标(TC)定位于该错词处并校正它。光标同步装置(15)现在可以使文本光标(TC)与音频光标(AC)同步,或者使音频光标(AC)与文本光标(TC)同步,使得各个光标(AC,TC)的定位明显简化。

Description

编辑期间使音频光标与文本光标同步
本发明涉及一种校对装置,用于校对由语音识别装置从语音信息中识别的文本信息中的错词。
本发明还涉及一种校对方法,用于校对由语音识别装置从语音信息中识别的文本信息中的错词。
本发明还涉及一种语音识别装置,用于从接收的语音信息中识别文本信息。
本发明还涉及一种计算机程序产品,它包括由计算机执行的字处理软件的校对软件。
从文件US-A-6173259中已知这样一种校对装置和这样一种校对方法,其形式为抄录服务公司的校对员的计算机执行的字处理软件。校对员是抄录服务公司的雇员,以人工方式校对利用语音识别程序自动识别的文本信息。
口述的作者可以将他口述的语音信息通过计算机网络发送到已知的抄录服务公司的服务器。服务器将接收到的口述语音信息分发到各个执行语音识别软件并且在此情况中构成语音识别装置的各种计算机。
已知的语音识别装置从作者发送给它的口述语音信息中识别文本信息,同时还创建链接信息。该链接信息为所识别的文本信息的每个词标明语音信息中语音识别装置为之识别该词的部分。口述的语音信息、已识别的文本信息和链接信息从语音识别装置传送到校对员的计算机,以便校对所识别的文本信息中的错词。
已知的校对装置包括用来实现同步重放模式的同步重放装置。当校对装置中同步重放模式激活时,口述语音信息被重放,同时,与语音信息的以声音方式重放的每个词同步,语音识别***从重放的词中识别的词被标记上音频光标。音频光标由此标明刚刚以声音方式重放的词在所识别的文本信息中的位置。
如果同步重放模式期间,校对员在文本信息中识别出错词,则他会分别中断或去活同步重放模式,通过计算机键盘将文本光标定位于错词处并对其进行编辑。然后,他重新激活同步重放模式,由此语音信息从已校正的词处继续向前重放。
抄录服务提供商根据校对员在文本信息中校对的词数对其付酬。抄录服务公司的质量控制员对校对员校对的文本信息进行抽样,而校对员遗漏的错词还会影响校对员的报酬。因此,校对员的主要兴趣在于字处理软件,通过该软件,他可以在同步反馈模式激活时用最节省时间和最低可能人工工作量校正他识别出来的错词。因此,校对员会设法使用计算机键盘而不用鼠标来输入校正错词所需的所有编辑信息,因为伸出手去抓鼠标是耗时的。
在已知的校对装置和已知的校对方法的情况中,校正激活的同步显示模式下校对员识别为错误的词需要校对员一方相对较多的人工操作,而这些校正操作会耗费校对员很多时间,这是不利的。
本发明的目的是提供一种根据第一段所提及的类型的校对装置,一种根据第二段所提及的类型的校对方法,一种根据第三段所提及的类型的语音识别装置以及根据第四段所提及的类型的计算机程序产品,通过它们避免了上述缺点。
为了实现上述目的,在这种校对装置中,提供根据本发明的特征,使得该校对装置可以如下方式构成其特征。
一种校对装置,用于校对由语音识别装置从语音信息中识别的文本信息中的错词,它包括:接收装置,用于接收语音信息、相关的识别文本信息以及链接信息,该链接信息在识别文本信息的每个词处标记语音信息中由语音识别装置识别出词的部分;编辑装置,用于将文本光标定位于识别文本信息的错词处并且根据用户输入的编辑信息编辑该错词;同步重放装置,它允许同步重放模式,其中在以声音方式重放语音信息期间,刚被重放且被链接信息标记的识别文本信息的词被同步地标记,而刚被标记的词反映音频光标的位置;以及光标同步装置,用于使文本光标与音频光标同步或者使音频光标与文本光标同步。
为了实现上述目的,根据本发明的特征被设想在这种校对方法中,使得该校对方法可以如下方式构成其特征。
一种校对方法,用于校对由语音识别装置从语音信息中识别的文本信息中的错词,其中执行了以下方法步骤:
接收语音信息、相关的识别文本信息以及链接信息,该链接信息为识别文本信息的每个词标记语音信息中由语音识别装置识别出该词的部分;
根据用户输入的编辑信息利用文本光标编辑错词;
允许同步重放模式,其中,在语音信息的声音重放期间,识别文本信息的词(链接信息为刚刚重放的语音信息标记的词)被同步地标记,而刚刚标记的词反映音频光标的位置;
使文本光标与音频光标同步或者使音频光标与文本光标同步。
为了实现上述目的,根据本发明的特征在这种语音识别装置中被设想,使得该语音识别装置可以如下方式构成其特征。
一种语音识别装置,用于从接收的语音信息中识别文本信息,它包括:接收装置,用于接收语音信息;语音识别装置,用于识别所识别的文本信息和要分配给所接收的语音信息的链接信息,同时关于所识别的文本信息的每个词的链接信息标记语音信息中由语音识别装置识别出的词所在的部分;以及上述校对装置,以便校对所识别的文本信息中含有的错词。
为了实现上述目的,这种计算机程序产品包括根据本发明的特征,使得该计算机程序产品可以如下方式构成其特征。
一种计算机程序产品,它可以直接装入数字计算机的内存并且包括软件代码部分,如果所述产品在计算机上运行,则所述计算机执行上述校对方法的步骤。
由于具有激活的同步重放模式的校对装置的用户通常检查刚刚由同步重放装置用音频光标标记的词以进行校对,所以他每次在音频光标的当前位置附近识别出所识别的文本信息中的错词。此时,文本光标通常位于完全不同的位置,即处于文本信息中校正上一个错词所在的位置。
根据本发明,用户可以例如通过操作键盘上的按键使文本光标与音频光标同步,使得文本光标定位于同步重放期间最后被高亮显示的词的位置。因为要校正的错词一般位于根据本发明定位的文本光标的附近,所以随后校正错词所涉及的工作量和耗时量会非常少。
根据本发明,当同步重放模式激活时,文本光标还可以继续且自动地与音频光标同步。这样,可以有利地完全省去为定位文本光标而进行的键盘按键操作。根据应用,它可以有利地使音频光标与文本光标同步,从而使音频光标定位在文本光标的位置上。
根据权利要求2和权利要求9所述的措施,获得如下优点:不必中断或去活同步重放模式来编辑错词。这样,富有经验的校对员可以有利地节省大量时间。
根据权利要求3、4和10所述的措施,已经证明以下是有利的:如果用户在识别出错词时,只需按“右箭头”键即可使所识别的文本信息中位于音频光标之前的文本光标与音频光标同步。在本实例中,通过按下“左箭头”键将使音频光标与文本光标同步,从而定位于文本光标的位置。“左箭头”键和“右箭头”键的动态指定特别对用户友好。
根据权利要求5和11的措施,已经证明以下是有利的:既然由于用户反应时间的原因,在所识别的文本信息中,发现错词通常在音频光标之前N个词处,则在所识别的文本信息中,使文本光标自动定位于音频光标的位置之前N个词处。
根据权利要求6和12的措施,已经证明,如果用户可以根据他的通常反应时间来调整数量N,则这是有利的。
根据权利要求7的措施,已经证明,如果当同步重放模式激活时这两个光标自动同步,直到用户分开它们来编辑错词为止,则这是有利的。这样,有利地实现了校正错词的特别简单的操作。
下面参考图中所示的实施例的实例描述本发明,但这并不表示对本发明的限制。
图1说明具有用于校对语音识别装置所识别的文本中的错词的校对装置的语音识别装置。
图2说明一种处理口述内容的方法,同时还执行用于校正语音识别装置所识别的文本中的错词的方法。
图1表示一种语音识别装置1,它包括用于执行语音识别软件和文本处理软件的计算机。语音识别装置1具有与之连接的麦克风2、键盘3、脚踏开关4、扬声器5和显示屏6。
语音识别装置1的用户可以口述到麦克风1,由此包含口述语音信息的语音信号SS被传送到语音识别装置1。语音识别装置1包含A/D转换器7,用于将语音信号SS数字化,由此,A/D转换器7将数字语音数据SD传送到语音识别装置8。
语音识别装置8被设计成识别为接收的语音数据SD指定的文本信息,下文称为识别文本信息ETI。语音识别装置8还被设计成建立链接信息LI,它为识别文本ETI的每个词标记语音数据SD中语音识别装置8识别出该词所在的部分。这种语音识别装置8可见于例如文件US-A-5031113,其公开被认为通过引用结合在本文件的公开之中。
语音识别装置1还具有存储装置9,用于存储语音识别装置8传送的语音数据SD以及识别文本信息ETI和口述的链接信息LI。如上所述,识别为口述语音信息指定的识别文本信息ETI的语音识别方法早已是众所周知,所以此处不作进一步详细讨论。
语音识别装置1还具有校对装置10,用于校正识别文本信息ETI的错词。校对装置10包括执行文本编辑软件的计算机,其中文本编辑软件包含了特殊的校对软件。校对装置10包括编辑装置11和同步重放装置12。
编辑装置11被设计成将文本光标TC定位在识别文本信息ETI的错词处,并根据用户输入的编辑信息EI编辑错词。在此情况中,按照常见方式,由用户使用键盘3的按键输入编辑信息EI。
同步重放装置12提供语音检测装置1的同步重放模式,其中在以声音方式重放口述的语音信息期间,与刚刚重放的语音信息相关的链接信息LI所标记的识别文本信息ETI的词被同步地标记。还见于文件US-A-5031113的这种已知的同步重放模式非常受语音识别装置的用户欢迎,因为它使错词的校正效率高。
当语音识别装置1中同步重放模式激活时,其中音频光标AC从识别文本信息ETI的一个词变化到另一个词,以声音方式重放的每个词均准确地被标记。例如,可以如下方式显示光标:对光标位置处表示的字符加下划线或倒置处理,还已知许多其它显示光标的可能方式。
正如可从监视器6所示的文本信息TI看到的,当同步重放模式激活时,文本光标TC和音频光标AC均是可见的,且文本光标TC通常标记一个字符而音频光标AC总是标记整个词。当同步重放模式激活时,文本光标TC在所显示的文本信息TI中上次使用编辑装置11校正错词的位置保持静止,而音频光标AC逐个词地变动。
当同步重放模式激活时,同步重放装置12可以读出存储装置9中存储的口述的音频数据AD,并不断地将其传送到D/A转换器13。然后D/A转换器13可以将包含口述的语音信号SS的语音信息SI传送到用于口述的声音重放的扬声器5。
为了激活同步重放模式,语音识别装置1的用户可以将他的脚放在脚踏开关4的两个开关之一上,由此,控制信息SI被传送到同步重放装置12。然后,同步重放装置12除口述的语音数据SD之外,还读出对应于口述存储在存储媒体9中的链接信息LI。
当同步重放模式激活时,同步重放装置12被设计成产生音频光标信息ACI并将其传送到编辑装置11。音频光标信息ACI逐个标记刚刚以声音方式重放的词,从而标记音频光标AC应该显示在所显示的文本信息TI中的位置。
在激活同步重放模式之后,就立即将编辑装置11设计成从存储装置9读出识别文本信息ETI,并临时将其作为要显示的文本信息TI存储。此临时存储的要显示的文本信息TI对应于识别文本信息ETI,用户通过校正错词来校对它,以便最终获得无错文本信息。
临时存储在编辑装置11中的文本信息TI从编辑装置11传送到图像处理装置14。图像处理装置14处理要显示的文本信息TI并将可呈现的显示信息DI传送到监视器6,其中显示信息DI包含要显示的文本信息TI。编辑装置11还将文本光标信息TCI传送到图像处理装置14,其中文本光标信息TCI标记文本光标TC在所显示的文本信息TI中的位置。当同步重放模式激活时,编辑装置11还将用于显示音频光标AC的音频光标信息ACI传送到图像处理装置14。
校对装置10的编辑装置11还包括光标同步装置15,用于使文本光标TC与音频光标AC同步或者使音频光标AC与文本光标TC同步。这样,使得用户为校正所识别的错词而进行的文本光标TC的定位明显更加容易,详细情况在下文中用语音识别装置1的应用实例给出。
编辑装置11还设计成在校对装置10中当同步重放模式激活时定位文本光标TC并由用户编辑识别为错误的词。这样,对校对熟练的用户可以校正错词,而不用先去活同步重放模式,然后在校正之后重新激活它,使得用户可以有利地节省很多时间。下文将通过语音识别装置1的应用实例给出进一步的细节。
现在利用图2的流程图16来说明语音识别装置1的下列应用实例。根据该应用实例,假定一位医生正在试用新的语音识别装置,并将“THIS IS A TEXT THAT...ERRORS WITHIN THIS TEXT HAVETO THE CORRECTED WITH A TEXT EDITOR”口述到麦克风2中,此后在方框17,口述的数字语音数据SD被传送到语音识别装置8。在方框18,语音识别装置8识别出相关的识别文本信息ETI和链接信息LI,并在方框19将其存储在存储装置9。因为该医生没有对口述的某些词清晰地发音,所以语音识别装置8将词“IS”识别成词“MISS”,以及将词“TEXT”识别成“PEST”。
此后,在方框20,医生的秘书激活语音识别装置1的同步重放模式,以便校正识别文本信息的错词。然后编辑装置11从存储装置9中读出识别文本信息ETI,而同步重放装置12读出口述的语音数据SD和链接信息LI。文本信息TI通过监视器6显示,而且开始口述的声音重放,由此音频光标AC从“THIS”这个词开始,逐个单词地标记口述。
秘书立即识别出词“MISS”是错词,并使用键盘3输入相应的输入信息EI来校正它。校正词“MISS”之后,文本光标TC停留在词“IS”中字符“I”的位置,而音频光标AC继续逐个词地标记文本信息TI。在音频光标AC标记到词“PEST”时,在方框21,秘书识别出这个词是错词,并在方框22按键盘上的“Alt+右箭头”组合键。结果,同步信息SIY被发送到编辑装置11,使文本光标TC与音频光标AC同步。结果,文本光标TC被定位于错词“PEST”的第一个字母“P”处,而在方框23,秘书可立即开始校正错词。
这种方法的优点在于,秘书不必经过数次“箭头”键的按键操作、以便将文本光标TC定位于错词的位置,这会非常节省时间。同样,为了定位文本光标TC,秘书不必伸手去拿图1中未示出的计算机鼠标,这也会节省时间。
在校正错词“PEST”期间,同步重放模式一直是激活的,因为校正此词期间秘书已经有足够经验来跟随口述的最后一些词的继续同步重放。仅在口述结束时,在方框24,秘书通过操作脚踏开关4的第二开关来去活同步重放模式。流程图16的方框19至24说明了在此情况下的校对过程。
因为秘书还可以在同步重放模式激活时进行错词“MISS”和“PEST”的校正,所以她不用多次操作脚踏开关,并且能够明显更快地完成她的工作,这是很大的优点。
可以看到,通过按下键组合“ALT+右箭头”,任何一个相对于另一个光标而言更靠近文本信息TI开头的光标将与这另一个光标同步。此外,通过按下键组合“ALT+左箭头”,相对于另一个光标而言更靠近文本信息TI结尾的光标将与这另一个光标同步。
已经证明,这种键组合的功能的动态分配特别对用户友好。显然例如“Ctrl”键或“Alt Gr”键可以替代“Alt”键用于键组合中。另外,在激活的同步重放模式中,可以免除任何键组合,而只将“左箭头”键和“右箭头”键与动态分配结合使用。
可以看到,还可以通过操作脚踏开关或计算机鼠标来使光标同步。同样,可以使文本光标TC持续和自动地与音频光标AC同步,以便在输入编辑信息EI时,音频光标AC的当前位置也会与文本光标TC的位置相同。
可以看到,根据应用,使音频光标AC与文本光标TC同步也可能是有利的,使得音频光标AC被定位于文本光标TC的位置。口述的同步重放则会从文本光标的位置继续进行,从而可以容易地重复口述重放的部分。
可以看到,同步之后的这两个光标不一定需要位于同一位置。所以,例如,任何一个光标可以位于另一个光标之前N=3个词处。由此,用户可以平衡其识别错词的反应时间,使得在同步之后,将文本光标TC分别定位于音频光标AC之前3个词处。反应快的用户可以选择N=1而反应慢的用户可以选择N=10,使得同步之后,文本光标TC总是已经定位于错词上,这是相当有利的。
此外,在同步重放模式下与音频光标AC按N个词的移位相配对的文本光标TC可以持续地显示,使得识别出错词之后,通常反应较慢的用户仍能用与文本光标TC直接定位于错词上的时间相同的时间输入编辑信息EI。这也使错词的校正非常有效率。
可以看出,本发明的校对装置对于花费其大部分工作时间来校对识别文本信息ETI并因而对此很熟练的用户来说是特别有利的。这种用户被雇为抄录服务公司的所谓的校对员等,例如文件US-A-6173259中所述,其公开被认为通过引用结合于本文件的公开中。
应该提及的是,根据本发明的校对装置主要是文本编辑器程序的一部分,但是并非一定如此。
应该提及的是,同步重放模式可以通过输入同步数据SYI自动地中断,并在输入编辑数据EI之后继续。对于不熟悉校对装置的用户来说,这种变型特别有用,因为他们就不必与进行校正并行地搜索已转换的文本信息ETI中的下一个错词。
可以看出,如果计算机1不包括再现口述内容所需的硬件,则计算机1可能不具有在同步重放期间再现口述内容的功能。在这种情况中,同步重放期间,存储口述的语音数据的数字口述装置可以声音形式再现口述的音频,此外还可以将位置信息提供给计算机。该位置信息标记音频重放的实际再现位置,该计算机可以根据位置信息标记相应的识别出的词。

Claims (15)

1.一种校对装置(10),用于校正语音识别装置(1)从语音信息(SD)中识别出的文本信息(ETI)中的错词,它包括:接收装置,用于接收所述语音信息(SD)、相关的识别文本信息(ETI)和链接信息(LI),其中链接信息在识别文本信息(ETI)的每个词处标记语音信息(SD)中由所述语音识别装置(1)识别出该词的部分;编辑装置(11),用于将文本光标(TC)定位于所述识别文本信息(ETI)的错词处并根据用户输入的编辑信息(EI)编辑所述错词;同步重放装置(12),允许同步重放模式,其中在所述语音信息(SD)的声音重放期间,同步地标记所述识别文本信息(ETI)中刚刚重放而且由链接信息(LI)所标记的词,而刚刚标记的词反映了音频光标(AC)的位置;以及光标同步装置(15),用于使所述文本光标(TC)与所述音频光标(AC)同步或者使所述音频光标(AC)与所述文本光标(TC)同步。
2.如权利要求1所述的校对装置(10),其特征在于包括光标同步装置(15),用于在所述校对装置(10)中激活的同步显示模式下使光标(AC,TC)同步。
3.如权利要求1所述的校对装置(10),其特征在于,所述光标同步装置(15)包括键盘(3),并且可以通过人工操作至少一个键来使所述光标(AC,TC)同步。
4.如权利要求3所述的校对装置(10),其特征在于,所述至少一个键包括“右箭头”键或“左箭头”键,并且当操作“右箭头”键时,可以使相对于另一个光标(TC,AC)显示出更靠近识别文本信息(ETI)的开头的光标(AC,TC)与这另一个光标(TC,AC)同步;可以使相对于另一个光标(TC,AC)显示出更靠近识别文本信息(ETI)的结尾的光标(AC,TC)与这另一个光标(TC,AC)同步。
5.如权利要求1所述的校对装置(10),其特征在于,当所述同步重放模式激活时,所述光标同步装置(15)使所述文本光标(TC)定位于识别文本信息(ETI)中超前所述音频光标(AC)预定数目N的词之处。
6.如权利要求5所述的校对装置(10),其特征在于,所述词的预定数目N可以根据用户信息(EI)来设置。
7.如权利要求2所述的校对装置(10),其特征在于,所述光标同步装置(15)在激活的同步重放模式下持续自动地使光标(AC,TC)同步,而且为了编辑错词,可以通过人工操作至少一个按键来使所述文本光标(TC)与音频光标(AC)分开,直到通过再次操作至少一个按键使所述文本光标(TC)与所述音频光标(AC)再同步。
8.一种校对方法(16),用于校对由语音识别装置(1)从语音信息(SD)中识别的文本信息(ETI)中的错词,其中执行以下方法步骤:
接收语音信息(SD)、相关的识别文本信息(ETI)以及链接信息(LI),所述链接信息为识别文本信息(ETI)的每个词标记所述语音信息(SD)中由所述语音识别装置(1)识别出该词的部分;
允许同步重放模式,其中,在所述语音信息(SD)的声音重放期间,识别文本信息(ETI)的词、即链接信息(LI)对应于刚刚重放的语音信息(SD)标记的词被同步地标记,而刚刚标记的词反映了音频光标(AC)的位置;
根据用户输入的编辑信息(EI)利用文本光标(TC)编辑所述错词,可以在所述校对装置(10)中激活的同步重放模式下编辑所述错词。
9.如权利要求8所述的校对方法(16),其特征在于,根据所述输入的编辑信息(EI),使所述文本光标(TC)与所述音频光标(AC)同步,或者使所述音频光标(AC)与所述文本光标(TC)同步。
10.如权利要求8所述的校对方法(16),其特征在于,所述光标(AC,TC)是通过人工操作至少一个按键而同步的。
11.如权利要求8所述的校对方法(16),其特征在于,所述文本光标(TC)被定位于所述识别文本信息(ETI)中超前所述音频光标(AC)预定数目N的词之处。
12.如权利要求11所述的校对方法(16),其特征在于,所述词的预定数目N是根据用户信息(EI)来设置的。
13.一种用于识别所接收的语音信息(SD)中的文本信息(ETI)的语音识别装置(1),它包括:接收装置,用于接收语音信息(SD);语音识别装置(8),用于识别出识别文本信息(ETI)和为所述接收的语音信息(SD)指定的链接信息(LI),其中,对应于识别文本信息(ETI)的每个词的链接信息(LI)反映所述语音信息(SD)中被所述语音识别装置(8)识别的词所对应的部分;以及如权利要求1所述的校对装置(10),校正包含在所述识别文本信息(ETI)中的错词。
14.一种计算机程序产品,它可以直接装入数字计算机的内存储器,而且包括软件代码部分,若所述产品在计算机上运行,则利用所述计算机执行权利要求8所述的校对方法(16)的步骤。
15.如权利要求14所述的计算机程序产品,其特征在于,它被存储在计算机可读的媒体中。
CNB028008294A 2001-03-29 2002-03-25 校对文本信息中错词的校对装置及其方法和语音识别装置 Expired - Fee Related CN1225721C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP01890104 2001-03-29
EP01890104.1 2001-03-29

Publications (2)

Publication Number Publication Date
CN1460245A true CN1460245A (zh) 2003-12-03
CN1225721C CN1225721C (zh) 2005-11-02

Family

ID=8185105

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB028008294A Expired - Fee Related CN1225721C (zh) 2001-03-29 2002-03-25 校对文本信息中错词的校对装置及其方法和语音识别装置

Country Status (7)

Country Link
US (3) US8117034B2 (zh)
EP (1) EP1374225B1 (zh)
JP (1) JP5093966B2 (zh)
CN (1) CN1225721C (zh)
AT (1) ATE286294T1 (zh)
DE (1) DE60202453T2 (zh)
WO (1) WO2002080143A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106448675A (zh) * 2016-10-21 2017-02-22 科大讯飞股份有限公司 识别文本修正方法及***
CN107025906A (zh) * 2015-12-09 2017-08-08 联想(新加坡)私人有限公司 扩展语音识别的周期的方法和产品以及信息处理设备
CN111079760A (zh) * 2019-08-02 2020-04-28 广东小天才科技有限公司 一种文字识别方法及电子设备
WO2022001579A1 (zh) * 2020-06-29 2022-01-06 腾讯科技(深圳)有限公司 音频处理方法、装置、设备及存储介质

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7263484B1 (en) 2000-03-04 2007-08-28 Georgia Tech Research Corporation Phonetic searching
JP5093966B2 (ja) 2001-03-29 2012-12-12 ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー 編集中における音声カーソルとテキストカーソルの位置合わせ
US7231351B1 (en) 2002-05-10 2007-06-12 Nexidia, Inc. Transcript alignment
US7380203B2 (en) * 2002-05-14 2008-05-27 Microsoft Corporation Natural input recognition tool
AU2003274592A1 (en) 2002-11-28 2004-06-18 Koninklijke Philips Electronics N.V. Method to assign word class information
US7774694B2 (en) * 2002-12-06 2010-08-10 3M Innovation Properties Company Method and system for server-based sequential insertion processing of speech recognition results
US20050096910A1 (en) * 2002-12-06 2005-05-05 Watson Kirk L. Formed document templates and related methods and systems for automated sequential insertion of speech recognition results
US7444285B2 (en) * 2002-12-06 2008-10-28 3M Innovative Properties Company Method and system for sequential insertion of speech recognition results to facilitate deferred transcription services
KR100668297B1 (ko) * 2002-12-31 2007-01-12 삼성전자주식회사 음성인식방법 및 장치
US7263483B2 (en) * 2003-04-28 2007-08-28 Dictaphone Corporation USB dictation device
US7346506B2 (en) * 2003-10-08 2008-03-18 Agfa Inc. System and method for synchronized text display and audio playback
US20050144015A1 (en) * 2003-12-08 2005-06-30 International Business Machines Corporation Automatic identification of optimal audio segments for speech applications
US7629989B2 (en) * 2004-04-02 2009-12-08 K-Nfb Reading Technology, Inc. Reducing processing latency in optical character recognition for portable reading machine
US8504369B1 (en) 2004-06-02 2013-08-06 Nuance Communications, Inc. Multi-cursor transcription editing
US7836412B1 (en) 2004-12-03 2010-11-16 Escription, Inc. Transcription editing
JP2007133033A (ja) 2005-11-08 2007-05-31 Nec Corp 音声テキスト化システム、音声テキスト化方法および音声テキスト化用プログラム
US8521510B2 (en) 2006-08-31 2013-08-27 At&T Intellectual Property Ii, L.P. Method and system for providing an automated web transcription service
US8959433B2 (en) * 2007-08-19 2015-02-17 Multimodal Technologies, Llc Document editing using anchors
US8954328B2 (en) * 2009-01-15 2015-02-10 K-Nfb Reading Technology, Inc. Systems and methods for document narration with multiple characters having multiple moods
US20100299131A1 (en) * 2009-05-21 2010-11-25 Nexidia Inc. Transcript alignment
US20100332225A1 (en) * 2009-06-29 2010-12-30 Nexidia Inc. Transcript alignment
US9292161B2 (en) * 2010-03-24 2016-03-22 Microsoft Technology Licensing, Llc Pointer tool with touch-enabled precise placement
US8392186B2 (en) 2010-05-18 2013-03-05 K-Nfb Reading Technology, Inc. Audio synchronization for document narration with user-selected playback
CN101887346A (zh) * 2010-06-22 2010-11-17 宇龙计算机通信科技(深圳)有限公司 一种信息输入控制方法、装置及通信终端
CN102314874A (zh) * 2010-06-29 2012-01-11 鸿富锦精密工业(深圳)有限公司 文本到语音转换***与方法
US9904768B2 (en) 2011-02-18 2018-02-27 Nuance Communications, Inc. Methods and apparatus for presenting alternative hypotheses for medical facts
US10032127B2 (en) 2011-02-18 2018-07-24 Nuance Communications, Inc. Methods and apparatus for determining a clinician's intent to order an item
US8768723B2 (en) 2011-02-18 2014-07-01 Nuance Communications, Inc. Methods and apparatus for formatting text for clinical fact extraction
US10460288B2 (en) 2011-02-18 2019-10-29 Nuance Communications, Inc. Methods and apparatus for identifying unspecified diagnoses in clinical documentation
CN102682763B (zh) * 2011-03-10 2014-07-16 北京三星通信技术研究有限公司 修正语音输入文本中命名实体词汇的方法、装置及终端
US9361282B2 (en) * 2011-05-24 2016-06-07 Lg Electronics Inc. Method and device for user interface
JP2013025299A (ja) * 2011-07-26 2013-02-04 Toshiba Corp 書き起こし支援システムおよび書き起こし支援方法
US20130035936A1 (en) * 2011-08-02 2013-02-07 Nexidia Inc. Language transcription
US9317196B2 (en) 2011-08-10 2016-04-19 Microsoft Technology Licensing, Llc Automatic zooming for text selection/cursor placement
US9318110B2 (en) * 2011-09-09 2016-04-19 Roe Mobile Development Llc Audio transcription generator and editor
KR101921203B1 (ko) * 2012-03-02 2018-11-22 삼성전자 주식회사 녹음 기능이 연동된 메모 기능 운용 방법 및 장치
US9569594B2 (en) 2012-03-08 2017-02-14 Nuance Communications, Inc. Methods and apparatus for generating clinical reports
US9805118B2 (en) 2012-06-29 2017-10-31 Change Healthcare Llc Transcription method, apparatus and computer program product
US9064492B2 (en) 2012-07-09 2015-06-23 Nuance Communications, Inc. Detecting potential significant errors in speech recognition results
KR20140008835A (ko) * 2012-07-12 2014-01-22 삼성전자주식회사 음성 인식 오류 수정 방법 및 이를 적용한 방송 수신 장치
JP2014142501A (ja) * 2013-01-24 2014-08-07 Toshiba Corp テキスト再生装置、方法、及びプログラム
US11024406B2 (en) 2013-03-12 2021-06-01 Nuance Communications, Inc. Systems and methods for identifying errors and/or critical results in medical reports
US10496743B2 (en) 2013-06-26 2019-12-03 Nuance Communications, Inc. Methods and apparatus for extracting facts from a medical text
CN103885596B (zh) * 2014-03-24 2017-05-24 联想(北京)有限公司 一种信息处理方法及电子设备
US9953646B2 (en) 2014-09-02 2018-04-24 Belleau Technologies Method and system for dynamic speech recognition and tracking of prewritten script
CN106098060B (zh) * 2016-05-19 2020-01-31 北京搜狗科技发展有限公司 语音的纠错处理方法和装置、用于语音的纠错处理的装置
US10529330B2 (en) * 2017-11-24 2020-01-07 Sorizava Co., Ltd. Speech recognition apparatus and system
CN108366182B (zh) * 2018-02-13 2020-07-07 京东方科技集团股份有限公司 文字语音同步播报的校准方法及装置、计算机存储介质
CN110265031A (zh) * 2019-07-25 2019-09-20 秒针信息技术有限公司 一种语音处理方法及装置
CN110534112B (zh) * 2019-08-23 2021-09-10 王晓佳 基于位置与时间的分布式语音识别纠错方法
KR102153668B1 (ko) 2019-10-29 2020-09-09 주식회사 퍼즐에이아이 키보드 매크로 기능을 활용한 자동 음성 인식기 및 음성 인식 방법
US11947894B2 (en) 2021-04-28 2024-04-02 International Business Machines Corporation Contextual real-time content highlighting on shared screens

Family Cites Families (90)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3676856A (en) * 1970-08-11 1972-07-11 Ron Manly Automatic editing system and method
US3648249A (en) 1970-12-08 1972-03-07 Ibm Audio-responsive visual display system incorporating audio and digital information segmentation and coordination
JPS6184771A (ja) 1984-10-03 1986-04-30 Hitachi Ltd 音声入力装置
US4637797A (en) 1985-01-11 1987-01-20 Access Learning Technology Corporation Software training system
US4701130A (en) 1985-01-11 1987-10-20 Access Learning Technology Corporation Software training system
JPS62212870A (ja) 1986-03-14 1987-09-18 Fujitsu Ltd 文章読み上げ校正装置
AT390685B (de) 1988-10-25 1990-06-11 Philips Nv System zur textverarbeitung
US5146439A (en) 1989-01-04 1992-09-08 Pitney Bowes Inc. Records management system having dictation/transcription capability
JPH05108608A (ja) 1991-10-18 1993-04-30 Olympus Optical Co Ltd 情報信号処理装置
US5553289A (en) * 1991-12-26 1996-09-03 International Business Machines Corporation System for automatically assigning attributes to objects of multimedia distribution when the objects being within a predetermined relationship
US5519808A (en) 1993-03-10 1996-05-21 Lanier Worldwide, Inc. Transcription interface for a word processing station
US5369704A (en) 1993-03-24 1994-11-29 Engate Incorporated Down-line transcription system for manipulating real-time testimony
US5602982A (en) 1994-09-23 1997-02-11 Kelly Properties, Inc. Universal automated training and testing software system
US5664227A (en) * 1994-10-14 1997-09-02 Carnegie Mellon University System and method for skimming digital audio/video data
US5812882A (en) 1994-10-18 1998-09-22 Lanier Worldwide, Inc. Digital dictation system having a central station that includes component cards for interfacing to dictation stations and transcription stations and for processing and storing digitized dictation segments
US5616876A (en) * 1995-04-19 1997-04-01 Microsoft Corporation System and methods for selecting music on the basis of subjective content
US5857212A (en) 1995-07-06 1999-01-05 Sun Microsystems, Inc. System and method for horizontal alignment of tokens in a structural representation program editor
US5960447A (en) * 1995-11-13 1999-09-28 Holt; Douglas Word tagging and editing system for speech recognition
JP3416007B2 (ja) * 1995-12-06 2003-06-16 インターナショナル・ビジネス・マシーンズ・コーポレーション オーディオビジュアル・マテリアルをスクリーニングする装置及び方法
US5911485A (en) 1995-12-11 1999-06-15 Unwired Planet, Inc. Predictive data entry method for a keypad
US5898830A (en) 1996-10-17 1999-04-27 Network Engineering Software Firewall providing enhanced network security and user transparency
US5983176A (en) * 1996-05-24 1999-11-09 Magnifi, Inc. Evaluation of media content in media files
US5748888A (en) 1996-05-29 1998-05-05 Compaq Computer Corporation Method and apparatus for providing secure and private keyboard communications in computer systems
DE69629667T2 (de) * 1996-06-07 2004-06-24 Hewlett-Packard Co. (N.D.Ges.D.Staates Delaware), Palo Alto Sprachsegmentierung
US5664896A (en) 1996-08-29 1997-09-09 Blumberg; Marvin R. Speed typing apparatus and method
GB2302199B (en) * 1996-09-24 1997-05-14 Allvoice Computing Plc Data processing method and apparatus
US5875448A (en) 1996-10-08 1999-02-23 Boys; Donald R. Data stream editing system including a hand-held voice-editing apparatus having a position-finding enunciator
EP0840287A3 (en) * 1996-10-31 1999-04-07 Microsoft Corporation Method and system for selecting recognized words when correcting recognized speech
US6173259B1 (en) 1997-03-27 2001-01-09 Speech Machines Plc Speech to text conversion
US5875429A (en) 1997-05-20 1999-02-23 Applied Voice Recognition, Inc. Method and apparatus for editing documents through voice recognition
US5974413A (en) 1997-07-03 1999-10-26 Activeword Systems, Inc. Semantic user interface
US6141011A (en) 1997-08-04 2000-10-31 Starfish Software, Inc. User interface methodology supporting light data entry for microprocessor device having limited user input
US6076059A (en) 1997-08-29 2000-06-13 Digital Equipment Corporation Method for aligning text with audio signals
WO1999015952A2 (en) 1997-09-25 1999-04-01 Tegic Communications, Inc. Reduced keyboard disambiguating system
US6363380B1 (en) * 1998-01-13 2002-03-26 U.S. Philips Corporation Multimedia computer system with story segmentation capability and operating program therefor including finite automation video parser
US6195637B1 (en) * 1998-03-25 2001-02-27 International Business Machines Corp. Marking and deferring correction of misrecognition errors
US6457031B1 (en) * 1998-09-02 2002-09-24 International Business Machines Corp. Method of marking previously dictated text for deferred correction in a speech recognition proofreader
US6338038B1 (en) * 1998-09-02 2002-01-08 International Business Machines Corp. Variable speed audio playback in speech recognition proofreader
US6064965A (en) * 1998-09-02 2000-05-16 International Business Machines Corporation Combined audio playback in speech recognition proofreader
US6374225B1 (en) 1998-10-09 2002-04-16 Enounce, Incorporated Method and apparatus to prepare listener-interest-filtered works
US6122614A (en) 1998-11-20 2000-09-19 Custom Speech Usa, Inc. System and method for automating transcription services
US6363342B2 (en) 1998-12-18 2002-03-26 Matsushita Electric Industrial Co., Ltd. System for developing word-pronunciation pairs
US6802041B1 (en) 1999-01-20 2004-10-05 Perfectnotes Corporation Multimedia word processor
US20030004724A1 (en) 1999-02-05 2003-01-02 Jonathan Kahn Speech recognition program mapping tool to align an audio file to verbatim text
US6434523B1 (en) 1999-04-23 2002-08-13 Nuance Communications Creating and editing grammars for speech recognition graphically
US6611802B2 (en) * 1999-06-11 2003-08-26 International Business Machines Corporation Method and system for proofreading and correcting dictated text
US6370503B1 (en) 1999-06-30 2002-04-09 International Business Machines Corp. Method and apparatus for improving speech recognition accuracy
JP2001043062A (ja) 1999-07-27 2001-02-16 Nec Corp パーソナルコンピュータ、その音量調整方法及び記録媒体
US6865258B1 (en) 1999-08-13 2005-03-08 Intervoice Limited Partnership Method and system for enhanced transcription
US6542091B1 (en) 1999-10-01 2003-04-01 Wayne Allen Rasanen Method for encoding key assignments for a data input device
EP1169678B1 (en) * 1999-12-20 2015-01-21 Nuance Communications Austria GmbH Audio playback for text edition in a speech recognition system
US7082615B1 (en) 2000-03-31 2006-07-25 Intel Corporation Protecting software environment in isolated execution
WO2001084535A2 (en) 2000-05-02 2001-11-08 Dragon Systems, Inc. Error correction in speech recognition
ATE480100T1 (de) 2000-06-09 2010-09-15 British Broadcasting Corp Erzeugung von untertiteln für bewegte bilder
US7624356B1 (en) 2000-06-21 2009-11-24 Microsoft Corporation Task-sensitive methods and systems for displaying command sets
US6950994B2 (en) 2000-08-31 2005-09-27 Yahoo! Inc. Data list transmutation and input mapping
US6993246B1 (en) * 2000-09-15 2006-01-31 Hewlett-Packard Development Company, L.P. Method and system for correlating data streams
US6975985B2 (en) 2000-11-29 2005-12-13 International Business Machines Corporation Method and system for the automatic amendment of speech recognition vocabularies
CA2328566A1 (en) 2000-12-15 2002-06-15 Ibm Canada Limited - Ibm Canada Limitee System and method for providing language-specific extensions to the compare facility in an edit system
US7735021B2 (en) 2001-02-16 2010-06-08 Microsoft Corporation Shortcut system for use in a mobile electronic device and method thereof
CN1215458C (zh) * 2001-03-29 2005-08-17 皇家菲利浦电子有限公司 在同步回放的过程中文本编辑所识别的语音
JP5093966B2 (ja) 2001-03-29 2012-12-12 ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー 編集中における音声カーソルとテキストカーソルの位置合わせ
US20030007018A1 (en) 2001-07-09 2003-01-09 Giovanni Seni Handwriting user interface for personal digital assistants and the like
US7152213B2 (en) 2001-10-04 2006-12-19 Infogation Corporation System and method for dynamic key assignment in enhanced user interface
JP4145796B2 (ja) * 2001-10-31 2008-09-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ テキストファイルのディクテーションを筆記するための及びテキストを修正するための方法及びシステム
US7196691B1 (en) 2001-11-14 2007-03-27 Bruce Martin Zweig Multi-key macros to speed data input
US7292975B2 (en) 2002-05-01 2007-11-06 Nuance Communications, Inc. Systems and methods for evaluating speaker suitability for automatic speech recognition aided transcription
US7236931B2 (en) 2002-05-01 2007-06-26 Usb Ag, Stamford Branch Systems and methods for automatic acoustic speaker adaptation in computer-assisted transcription systems
US6986106B2 (en) 2002-05-13 2006-01-10 Microsoft Corporation Correction widget
US7300285B2 (en) 2002-05-24 2007-11-27 Smtm Technologies Llc Method and system for skills-based testing and training
US7260529B1 (en) 2002-06-25 2007-08-21 Lengen Nicholas D Command insertion system and method for voice recognition applications
US7137076B2 (en) 2002-07-30 2006-11-14 Microsoft Corporation Correcting recognition results associated with user input
US6763320B2 (en) 2002-08-15 2004-07-13 International Business Machines Corporation Data input device for individuals with limited hand function
WO2004028121A2 (en) * 2002-09-23 2004-04-01 Wimetrics Corporation System and method for wireless local area network monitoring and intrusion detection
US20080034218A1 (en) 2002-09-24 2008-02-07 Bender Steven L Key sequence rhythm guidance recognition system and method
US7206938B2 (en) 2002-09-24 2007-04-17 Imagic Software, Inc. Key sequence rhythm recognition system and method
US7016844B2 (en) 2002-09-26 2006-03-21 Core Mobility, Inc. System and method for online transcription services
US7515903B1 (en) 2002-10-28 2009-04-07 At&T Mobility Ii Llc Speech to message processing
US7580838B2 (en) 2002-11-22 2009-08-25 Scansoft, Inc. Automatic insertion of non-verbalized punctuation
US7107397B2 (en) 2003-05-29 2006-09-12 International Business Machines Corporation Magnetic tape data storage system buffer management
GB2405728A (en) 2003-09-03 2005-03-09 Business Integrity Ltd Punctuation of automated documents
US8397026B2 (en) 2004-03-05 2013-03-12 Secure Systems Limited Partition access control system and method for controlling partition access
US7382359B2 (en) 2004-06-07 2008-06-03 Research In Motion Limited Smart multi-tap text input
US7508324B2 (en) 2004-08-06 2009-03-24 Daniel Suraqui Finger activated reduced keyboard and a method for performing text input
US20060176283A1 (en) 2004-08-06 2006-08-10 Daniel Suraqui Finger activated reduced keyboard and a method for performing text input
KR100713128B1 (ko) 2004-11-08 2007-05-02 주식회사 비젯 바이러스 방역 장치 및 시스템
EP1864455A2 (en) 2005-03-29 2007-12-12 Glowpoint, Inc. Video communication call authorization
FI20050561A0 (fi) 2005-05-26 2005-05-26 Nokia Corp Pakettidatan käsittely viestintäjärjestelmässä
US20070143857A1 (en) 2005-12-19 2007-06-21 Hazim Ansari Method and System for Enabling Computer Systems to Be Responsive to Environmental Changes
US9904809B2 (en) 2006-02-27 2018-02-27 Avago Technologies General Ip (Singapore) Pte. Ltd. Method and system for multi-level security initialization and configuration

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107025906A (zh) * 2015-12-09 2017-08-08 联想(新加坡)私人有限公司 扩展语音识别的周期的方法和产品以及信息处理设备
CN107025906B (zh) * 2015-12-09 2020-10-02 联想(新加坡)私人有限公司 扩展语音识别的周期的方法和产品以及信息处理设备
CN106448675A (zh) * 2016-10-21 2017-02-22 科大讯飞股份有限公司 识别文本修正方法及***
CN106448675B (zh) * 2016-10-21 2020-05-01 科大讯飞股份有限公司 识别文本修正方法及***
CN111079760A (zh) * 2019-08-02 2020-04-28 广东小天才科技有限公司 一种文字识别方法及电子设备
CN111079760B (zh) * 2019-08-02 2023-11-28 广东小天才科技有限公司 一种文字识别方法及电子设备
WO2022001579A1 (zh) * 2020-06-29 2022-01-06 腾讯科技(深圳)有限公司 音频处理方法、装置、设备及存储介质
CN113936699A (zh) * 2020-06-29 2022-01-14 腾讯科技(深圳)有限公司 音频处理方法、装置、设备及存储介质
CN113936699B (zh) * 2020-06-29 2023-05-26 腾讯科技(深圳)有限公司 音频处理方法、装置、设备及存储介质

Also Published As

Publication number Publication date
US8380509B2 (en) 2013-02-19
EP1374225B1 (en) 2004-12-29
ATE286294T1 (de) 2005-01-15
JP5093966B2 (ja) 2012-12-12
DE60202453T2 (de) 2006-01-19
US8706495B2 (en) 2014-04-22
US20120158405A1 (en) 2012-06-21
WO2002080143A1 (en) 2002-10-10
CN1225721C (zh) 2005-11-02
JP2004530205A (ja) 2004-09-30
US8117034B2 (en) 2012-02-14
US20020143544A1 (en) 2002-10-03
US20130166304A1 (en) 2013-06-27
EP1374225A1 (en) 2004-01-02
DE60202453D1 (de) 2005-02-03

Similar Documents

Publication Publication Date Title
CN1225721C (zh) 校对文本信息中错词的校对装置及其方法和语音识别装置
CN1215458C (zh) 在同步回放的过程中文本编辑所识别的语音
CN1144176C (zh) 使用两次语音转换和计算机辅助校正的自动转录***及方法
US8364489B2 (en) Method and system for speech based document history tracking
CN102024013A (zh) 启动包括第一功能和第二功能的多个功能的***和方法
EP1611570B1 (en) System for correction of speech recognition results with confidence level indication
CN1801322A (zh) 使用转录门户组件随需转录语音的方法和***
JP7176272B2 (ja) 情報処理装置およびプログラム
US20080140417A1 (en) Image processing apparatus and image processing method
JP4080965B2 (ja) 情報提示装置及び情報提示方法
CN113544772A (zh) 编辑支持程序、编辑支持方法和编辑支持装置
JP7304269B2 (ja) 書き起こし支援方法及び書き起こし支援装置
JP2007299233A (ja) カスタマイズ装置、カスタマイズ方法、カスタマイズプログラム
JP2005242720A (ja) データベース検索方法、データベース検索装置およびデータベース検索プログラム
JPH11327587A (ja) 作業支援装置及び作業支援システム
JPH11134325A (ja) 文書作成装置
JPH06282677A (ja) 光学式文字読取装置における候補文字修正方式
JPH11175217A (ja) コンピュ−タによるデ−タの登録処理方法及び装置並びにコンピュ−タによるデ−タの登録処理プログラムを記録した記録媒体
JP2000105797A (ja) 文字読み取りシステムおよび同システムにおける読み取り制御情報管理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: DIFFERENTIAL COMMUNICATION AUSTRIA ROMPLAST-14

Free format text: FORMER OWNER: ROYAL PHILIPS ELECTRONICS CO., LTD.

Effective date: 20090731

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20090731

Address after: Austria Vienna

Patentee after: Koninkl Philips Electronics NV

Address before: Holland Ian Deho Finn

Patentee before: Koninklike Philips Electronics N. V.

ASS Succession or assignment of patent right

Owner name: NUANCE COMMUNICATION INC.

Free format text: FORMER OWNER: NUANCE COMMUNICATION AUSTRIA CO., LTD.

Effective date: 20131023

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20131023

Address after: Massachusetts, USA

Patentee after: Nuance Communications Inc.

Address before: Austria Vienna

Patentee before: Koninkl Philips Electronics NV

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20051102

Termination date: 20170325

CF01 Termination of patent right due to non-payment of annual fee