CN110263313A - 一种用于会议速记的人机协同编辑方法 - Google Patents
一种用于会议速记的人机协同编辑方法 Download PDFInfo
- Publication number
- CN110263313A CN110263313A CN201910533479.8A CN201910533479A CN110263313A CN 110263313 A CN110263313 A CN 110263313A CN 201910533479 A CN201910533479 A CN 201910533479A CN 110263313 A CN110263313 A CN 110263313A
- Authority
- CN
- China
- Prior art keywords
- audio
- text
- meeting
- audio section
- terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000012937 correction Methods 0.000 claims abstract description 4
- 238000003058 natural language processing Methods 0.000 claims description 23
- 238000005520 cutting process Methods 0.000 claims description 12
- 238000005516 engineering process Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 3
- 230000003362 replicative effect Effects 0.000 claims 1
- 238000006243 chemical reaction Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000009466 transformation Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C7/00—Arrangements for writing information into, or reading information out from, a digital store
- G11C7/16—Storage of analogue signals in digital stores using an arrangement comprising analogue/digital [A/D] converters, digital memories and digital/analogue [D/A] converters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Acoustics & Sound (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Telephonic Communication Services (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种用于会议速记的人机协同编辑方法,包括以下步骤:1.会议速记终端按照自然句对音频流进行切割,并将音频段发送至第三方服务器,第三方服务器将音频段转换为与其对应的文本;2.会议速记终端在切割音频流时,对每一音频段的开始时间、结束时间、音频代码进行记录,并结合第三方服务器返回的该音频段对应的文本生成日志文件;3.会议速记终端将音频段、文本和日志文件发送至协同编辑服务器;4.协同编辑服务器根据日志文件将音频段和文本进行一一对应;5.人工编辑终端用于根据一一对应的音频段和文本进行会议记录的人工修正。本发明能够简单方便地根据会议音频对动态生成的会议记录的实时修正。
Description
技术领域
本发明涉及语音速记技术领域,尤其是一种用于会议速记的人机协同编辑方法。
背景技术
在会议过程中,由记录人员把会议的组织情况和具体内容记录下来,就形成了会议记录。最传统的形式是由记录人员现场速记并在会议结束之后根据会议录音整理核对会议记录。
随着语音识别技术(ASR)和自然语言处理技术(NLP)的发展,会议中产生的音频能够在会议现场直接实时转换成文字并生成会议记录,极大地减少了记录人员的工作量。
语音识别技术是将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列;自然语言处理技术研究的是如何实现人与计算机之间用自然语言进行有效通信;两者相结合,就能够将人类语音转换为人类语言的书面表达形式——文本。但是,这个转换过程不能保证百分百精准,尤其对于一些没有录入***中的术语、人物姓名等,***没有办法判断具体应该是何字。例如输入语音“章子怡”,***对于这个明星的姓名能够予以识别并转换成正确的文字;输入语音“张二雷”,对于这个陌生的词组,***只能逐字音译并选择***设置的默认选项,如***默认“zhang”优先“章”时,语音“张二雷”可能就会被转换成文字“章二雷”,这就导致了错误的存在。当然,实际的错误不仅限于此。
现有的用于会议速记的人机协同编辑方法的准确率基本在90-95%左右,对于文本中存在的错误,有必要进行修正。目前,采用的修正方式,主要还是会议结束之后,记录人员根据会议录音对会议记录进行整理核对,使得会议记录成稿的生成存在一定的延时性,存在一定的不便之处。随之容易想到的,最优的修正方式,当然是对音频转换而成的文本进行实时修改,但是存在的技术障碍是,如何实现一边音频正在录入,一边文本正在生成的同时,对文本进行及时、快速地修正, 也就是如何对正在动态生成的文本进行及时、快速地修正。
发明内容
针对上述问题,本发明提供一种用于会议速记的人机协同编辑方法。
一种用于会议速记的人机协同编辑方法,包括以下步骤:1.会议进行时,会议速记终端按照自然句对音频流进行切割形成音频段,并将音频段发送至第三方服务器,第三方服务器通过语音识别技术和自然语言处理技术将音频段转换为与其对应的文本;2.会议速记终端在切割音频流时,对每一音频段的开始时间、结束时间、音频代码进行记录,并结合第三方服务器返回的该音频段对应的文本生成日志文件;3.会议速记终端将音频段、文本和日志文件发送至协同编辑服务器;4.协同编辑服务器根据日志文件将音频段和文本进行一一对应;5.人工编辑终端用于根据一一对应的音频段和文本进行会议记录的人工修正。
进一步的,第三方服务器包括ASR服务器和NLP服务器。
进一步的,音频段时长限制在60s以内,切割音频段之间的时间间隔为0.00001ms。
进一步的,会议速记终端对每一段音频和文本进行编号;若音频段没有对应的文本,会议速记终端在日志文件中予以标记。
进一步的,当会议速记终端检测到网络中断时,停止向第三方服务器发送数据,并将数据暂时存放于内存中,当网络再次连接时,通过内存将数据有序发送给第三方服务器。
进一步的,会议速记终端切割音频流的同时,复制音频流并发送至协同编辑服务器。
进一步的,人工编辑终端具有查找、替换功能,可以直接修改某个文字或词组,也可以通过查找和替换对文本中的相同的错误进行一次性修正,并会对当前修正的内容进行特殊显示,以供记录人员查看。
本发明的有益效果:1.会议速记终端将音频以音频段的形式传输,短小的音频段传输结束、文本转换结束后,即可对转换后的文本进行修正,从而实现了对动态生成的会议记录的实时修正;2.实现音频与文本按照自然句为单位的一一对应,使得记录人员直接点击某一段文本,该段文本对应的音频就能播放出来,协助记录人员进行判断和文本修正;3.应对断网时的处理机制,能够很好地解决网络重连后的音频发送问题。
附图说明
图1为会议速记***框图;
图2为音频波形示意图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细的说明。本发明的实施例是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显而易见的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。
实施例1
一种用于会议速记的人机协同编辑方法,提及到的硬件设备有会议速记终端、第三方服务器、协同编辑服务器、人工编辑终端。在本实施例中,第三方服务器包括ASR服务器和NLP服务器。硬件设备直接的连接关系如图1所示。
会议速记终端是放置于会议现场,对会议音频进行收录和预处理的独立设备;人工编辑终端是安装了特定软件的台式机、笔记本等设备,所述特定软件指的是能够实现其必备功能的软件。
所述人工编辑终端与所述会议速记终端可以位于不同地点,例如会议开在北京,记录人员在上海进行会议记录的修正。
会议速记终端、ASR服务器、NLP服务器、人工编辑终端之间的连接方式可以采用但不限于有线网络、WiFi网络、4G网络。
本实施例公开的人机协同编辑方法,包括以下步骤:
一、会议进行时,会议速记终端按照自然句对音频流进行切割形成音频段,并将音频段发送至第三方服务器,第三方服务器通过语音识别技术和自然语言处理技术将音频段转换为与其对应的文本。
第三方服务器包括ASR服务器和NLP服务器,会议速记终端将音频段发送至ASR服务器,ASR服务器将音频段内容转换成一次文本并返回至会议速记终端,会议速记终端再将ASR服务器返回的一次文本发送至NLP服务器,NLP服务器用于将ASR服务器生成的一次文本按照自然语言进行自动修正,并将修正后的二次文本返回至会议速记终端。
ASR服务器将音频段内容转换成一次文本,这个转换过程中是机械式的转换,其中存在为数不少的错别字(多为同音字错误);NLP服务器对一次文本按照自然语言进行自动修正,这个转换过程就是基于人类自然语言的习惯,对一次文本进行自动纠错的过程。NLP服务器返回至会议速记终端的二次文本,正确率可达90-95%,但是仍存在一定的错误率。
人在正常说话时是有停顿的,本实施例中的自然句指的是相邻停顿之间的这句话,如图2中的“我那黄河一样粗狂的声音”、“不光响在***的大厦里”。按照自然句进行音频流切割,一是可以保证音频信息地完整性,防止音频数据丢失的情况发生;二是减少音频发送过程中占用的带宽,便于音频快速到达语音文本转换服务器,减少因网络塞车导致音频堵塞于发往语音文本转换服务器的路途当中,这就好比在一条拥堵的马路上,自行车、电瓶车,尤其是行人,可以从汽车缝隙中穿梭,网络传输同理。
当检测到一段时间内没有音频波动,就对音频流进行切割,然后在0.00001ms后继续开始处理。将音频段之间的间隔设置为0.00001ms,是为了尽可能减少音频的丢失和错位。例如,5s音频中间包含一个音频段间隔,若音频段间隔为0.1ms,则平均下来,1h音频会产生72ms偏差,4h音频产生的偏差达288ms;若音频段间隔为0.00001ms,则平均下来,1h音频仅产生0.0072ms偏差,4h音频产生的偏差也仅为0.0288ms。
如果在60s内都没有检测到足够长时间的停顿,那么强行对音频流进行切割,避免音频段过长,影响音频段的传输速度以及ASR服务器和NLP服务器的响应速度。
当音频流被切割形成音频段时,它与正在生成的音频流就独立开来,意味着这段音频的结束,也意味着可以对这段音频进行回放,便于对其对应的文本进行修正。
二、会议速记终端在切割音频流时,对每一音频段的开始时间、结束时间、音频代码进行记录,并结合第三方服务器返回的该音频段对应的文本生成日志文件。这里该音频段对应的文本指的是NLP服务器自动修正后的文本。
音频段的开始时间、结束时间均以北京时间为准。音频段的开始时间、结束时间、及其对应的音频代码是会议速记终端在音频切割过程中就能够获取的信息,但是音频段对应的文本是NLP服务器返回的二次文本。
理想情况下,一段音频对应一段文字,按照顺序进行对应即可,但是可能存在一段音频没有对应文字的可能性,如现场播放歌曲等情况。这就涉及到如何将NLP服务器返回的二次文本与音频段一一对应的问题。本实施例中,解决这一问题的方法是,若音频段没有与之对应的文本,会议速记终端在日志文件中予以标记,协同编辑服务器根据日志文件将音频段和二次文本进行一一对应,如果遇到某个音频段存在标记,就将其跳过,以免出现文本与音频段对应错误的问题出现。会议速记终端如何知晓哪一段音频段没有对应的文本,这是通过ASR服务器返回的数据判断,例如将开始时间、结束时间、音频编号其中的一种信息或多种信息进行融合形成特征信息连通音频段一起发送给ASR服务器,ASR服务器返回携带该特征信息的一次文本,会议速记终端就可以知晓此音频段有没有对应文本发送过来。
三、会议速记终端将音频段、文本和日志文件发送至协同编辑服务器,协同编辑服务器根据日志文件将音频段和文本进行一一对应。
在音频段和文本的传输过程中,音频段大而文本小,因此文本往往比音频段更早地传输到协同编辑服务器,即音频段和文本并非同时传输到协同编辑服务器,协同编辑服务器如何知晓哪一段文本要对应哪一段音频。在本实施例中,通过会议速记终端对每一段音频和文本进行编号来解决这一问题。
四、人工编辑终端用于根据一一对应的音频段和文本进行会议记录的人工修正。
为了便于操作,可以按照音频段对文本进行分段显示,即一个音频段对应的文本显示为一段。记录人员手动点击某段文本时,人工编辑终端对该段文本对应的音频波形予以框选显示并播放,协助记录人员进行判断和文本修正。例如,当点击“大声高喊着中国得分”,则该段文字对应的音频波形被框选显示并播放。
与此同时,人工编辑终端具有查找、替换功能,可以直接修改某个文字或词组,也可以通过查找和替换对文本中的相同的错误进行一次性修正,并会对当前修正的内容进行特殊显示,以供记录人员查看。
由于会议速记终端、ASR服务器、NLP服务器、协同编辑服务器、人工编辑终端都是通过网络连接,会议进行过程中,可能发生网络中断的情况。当会议速记终端检测到网络中断时,停止向ASR服务器/NLP服务器发送数据,并将数据暂时存放于内存中,当网络再次连接时,通过内存将数据有序发送给ASR服务器/NLP服务器,避免网络重连后,ASR服务器/NLP服务器集中接收到音频数据,误认为遭受到攻击,而关闭会议速记终端与其之间的连接。为防止会议速记终端与协同编辑服务器之间出现断网情况,协同编辑服务器内存有备份的会议音频。备份的会议音频,可以用于会议结束后,人工编辑终端再调取会议音频对会议记录进行修正,而不是必须在会议过程中对会议记录进行修正;同时,也可以防止会议速记终端与协同编辑服务器之间存在传输障碍时,人工编辑终端无法获取音频信息的问题发生。
显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域及相关领域的普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
Claims (8)
1.一种用于会议速记的人机协同编辑方法,其特征在于,包括以下步骤:
步骤1,会议进行时,会议速记终端按照自然句对音频流进行切割形成音频段,并将音频段发送至第三方服务器,第三方服务器通过语音识别技术和自然语言处理技术将音频段转换为与其对应的文本;
步骤2,会议速记终端在切割音频流时,对每一音频段的开始时间、结束时间、音频代码进行记录,并结合第三方服务器返回的该音频段对应的文本生成日志文件;
步骤3,会议速记终端将音频段、文本和日志文件发送至协同编辑服务器;
步骤4,协同编辑服务器根据日志文件将音频段和文本进行一一对应;
步骤5,人工编辑终端用于根据一一对应的音频段和文本进行会议记录的人工修正。
2.根据权利要求1所述的人机协同编辑方法,其特征在于,第三方服务器包括ASR服务器和NLP服务器。
3.根据权利要求1或2所述的人机协同编辑方法,其特征在于,音频段时长限制在60s以内,切割音频段之间的时间间隔为0.00001ms。
4.根据权利要求3所述的人机协同编辑方法,其特征在于,会议速记终端对每一段音频和文本进行编号。
5.根据权利要求3所述的人机协同编辑方法,其特征在于,若音频段没有对应的文本,会议速记终端在日志文件中予以标记。
6.根据权利要求1、2、4、5任一项所述的人机协同编辑方法,其特征在于,当会议速记终端检测到网络中断时,停止向第三方服务器发送数据,并将数据暂时存放于内存中,当网络再次连接时,通过内存将数据有序发送给第三方服务器。
7.根据权利要求6所述的人机协同编辑方法,其特征在于,会议速记终端切割音频流的同时,复制音频流并发送至协同编辑服务器。
8.根据权利要求1所述的人机协同编辑方法,其特征在于,人工编辑终端具有查找、替换功能,可以直接修改某个文字或词组,也可以通过查找和替换对文本中的相同的错误进行一次性修正,并会对当前修正的内容进行特殊显示,以供记录人员查看。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910533479.8A CN110263313B (zh) | 2019-06-19 | 2019-06-19 | 一种用于会议速记的人机协同编辑方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910533479.8A CN110263313B (zh) | 2019-06-19 | 2019-06-19 | 一种用于会议速记的人机协同编辑方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110263313A true CN110263313A (zh) | 2019-09-20 |
CN110263313B CN110263313B (zh) | 2021-08-24 |
Family
ID=67919636
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910533479.8A Active CN110263313B (zh) | 2019-06-19 | 2019-06-19 | 一种用于会议速记的人机协同编辑方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110263313B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113421572A (zh) * | 2021-06-23 | 2021-09-21 | 平安科技(深圳)有限公司 | 实时音频对话报告生成方法、装置、电子设备及存储介质 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101101590A (zh) * | 2006-07-04 | 2008-01-09 | 王建波 | 一种声音与文字对应关系表生成方法及定位方法 |
US20090150139A1 (en) * | 2007-12-10 | 2009-06-11 | Kabushiki Kaisha Toshiba | Method and apparatus for translating a speech |
CN105159870A (zh) * | 2015-06-26 | 2015-12-16 | 徐信 | 一种精准完成连续自然语音文本化的处理***及方法 |
US20160189713A1 (en) * | 2014-12-30 | 2016-06-30 | Hon Hai Precision Industry Co., Ltd. | Apparatus and method for automatically creating and recording minutes of meeting |
CN105827417A (zh) * | 2016-05-31 | 2016-08-03 | 安徽声讯信息技术有限公司 | 一种用于会议记录并可随时修改的语音速记装置 |
CN105845129A (zh) * | 2016-03-25 | 2016-08-10 | 乐视控股(北京)有限公司 | 一种在音频中切分句子的方法和***及视频文件的字幕自动生成方法和*** |
CN106057193A (zh) * | 2016-07-13 | 2016-10-26 | 深圳市沃特沃德股份有限公司 | 基于电话会议的会议记录生成方法和装置 |
CN106802885A (zh) * | 2016-12-06 | 2017-06-06 | 乐视控股(北京)有限公司 | 一种会议纪要自动记录方法、装置和电子设备 |
CN106941000A (zh) * | 2017-03-21 | 2017-07-11 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音交互方法和装置 |
CN106971723A (zh) * | 2017-03-29 | 2017-07-21 | 北京搜狗科技发展有限公司 | 语音处理方法和装置、用于语音处理的装置 |
CN107451110A (zh) * | 2017-07-10 | 2017-12-08 | 珠海格力电器股份有限公司 | 一种生成会议纪要的方法、装置及服务器 |
CN108008824A (zh) * | 2017-12-26 | 2018-05-08 | 安徽声讯信息技术有限公司 | 公文速记本多链路数据采集的方法 |
CN108335697A (zh) * | 2018-01-29 | 2018-07-27 | 北京百度网讯科技有限公司 | 会议记录方法、装置、设备及计算机可读介质 |
-
2019
- 2019-06-19 CN CN201910533479.8A patent/CN110263313B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101101590A (zh) * | 2006-07-04 | 2008-01-09 | 王建波 | 一种声音与文字对应关系表生成方法及定位方法 |
US20090150139A1 (en) * | 2007-12-10 | 2009-06-11 | Kabushiki Kaisha Toshiba | Method and apparatus for translating a speech |
US20160189713A1 (en) * | 2014-12-30 | 2016-06-30 | Hon Hai Precision Industry Co., Ltd. | Apparatus and method for automatically creating and recording minutes of meeting |
CN105159870A (zh) * | 2015-06-26 | 2015-12-16 | 徐信 | 一种精准完成连续自然语音文本化的处理***及方法 |
CN105845129A (zh) * | 2016-03-25 | 2016-08-10 | 乐视控股(北京)有限公司 | 一种在音频中切分句子的方法和***及视频文件的字幕自动生成方法和*** |
CN105827417A (zh) * | 2016-05-31 | 2016-08-03 | 安徽声讯信息技术有限公司 | 一种用于会议记录并可随时修改的语音速记装置 |
CN106057193A (zh) * | 2016-07-13 | 2016-10-26 | 深圳市沃特沃德股份有限公司 | 基于电话会议的会议记录生成方法和装置 |
CN106802885A (zh) * | 2016-12-06 | 2017-06-06 | 乐视控股(北京)有限公司 | 一种会议纪要自动记录方法、装置和电子设备 |
CN106941000A (zh) * | 2017-03-21 | 2017-07-11 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音交互方法和装置 |
CN106971723A (zh) * | 2017-03-29 | 2017-07-21 | 北京搜狗科技发展有限公司 | 语音处理方法和装置、用于语音处理的装置 |
CN107451110A (zh) * | 2017-07-10 | 2017-12-08 | 珠海格力电器股份有限公司 | 一种生成会议纪要的方法、装置及服务器 |
CN108008824A (zh) * | 2017-12-26 | 2018-05-08 | 安徽声讯信息技术有限公司 | 公文速记本多链路数据采集的方法 |
CN108335697A (zh) * | 2018-01-29 | 2018-07-27 | 北京百度网讯科技有限公司 | 会议记录方法、装置、设备及计算机可读介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113421572A (zh) * | 2021-06-23 | 2021-09-21 | 平安科技(深圳)有限公司 | 实时音频对话报告生成方法、装置、电子设备及存储介质 |
CN113421572B (zh) * | 2021-06-23 | 2024-02-02 | 平安科技(深圳)有限公司 | 实时音频对话报告生成方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110263313B (zh) | 2021-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10614173B2 (en) | Auto-translation for multi user audio and video | |
US10885318B2 (en) | Performing artificial intelligence sign language translation services in a video relay service environment | |
WO2018201964A1 (zh) | 一种会话信息的处理方法、服务器及计算机可读存储介质 | |
US9710819B2 (en) | Real-time transcription system utilizing divided audio chunks | |
CN105512228B (zh) | 一种基于智能机器人的双向问答数据处理方法和*** | |
EP3120259B1 (en) | In-call translation | |
US8140634B2 (en) | Interactive text communication system | |
CN106409283B (zh) | 基于音频的人机混合交互***及方法 | |
US10217466B2 (en) | Voice data compensation with machine learning | |
CN109147779A (zh) | 语音数据处理方法和装置 | |
CN110392168B (zh) | 呼叫处理方法、装置、服务器、存储介质和*** | |
US20150347399A1 (en) | In-Call Translation | |
US20120072845A1 (en) | System and method for classifying live media tags into types | |
CN104010267A (zh) | 支持基于翻译的通信服务方法和***和支持该服务的终端 | |
US20120259924A1 (en) | Method and apparatus for providing summary information in a live media session | |
CN109671429B (zh) | 语音交互方法及设备 | |
CN109327609A (zh) | 基于手机呼叫转移和微信、公众号或小程序的来电智能处理办法和*** | |
CN110265026A (zh) | 一种会议速记***以及会议速记方法 | |
US20220262366A1 (en) | Automated Audio-to-Text Transcription in Multi-Device Teleconferences | |
CN110263313A (zh) | 一种用于会议速记的人机协同编辑方法 | |
US20080205279A1 (en) | Method, Apparatus and System for Accomplishing the Function of Text-to-Speech Conversion | |
US8195457B1 (en) | System and method for automatically sending text of spoken messages in voice conversations with voice over IP software | |
US11580954B2 (en) | Systems and methods of handling speech audio stream interruptions | |
CN110264998A (zh) | 一种用于会议速记***的音频定位方法 | |
CN111400467B (zh) | 一种机器人聊天方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |