CN110197656A - 一种可快速记录会议内容并转换成文字的设备 - Google Patents
一种可快速记录会议内容并转换成文字的设备 Download PDFInfo
- Publication number
- CN110197656A CN110197656A CN201810192331.8A CN201810192331A CN110197656A CN 110197656 A CN110197656 A CN 110197656A CN 201810192331 A CN201810192331 A CN 201810192331A CN 110197656 A CN110197656 A CN 110197656A
- Authority
- CN
- China
- Prior art keywords
- audio
- analysis
- text
- converted
- conference content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000012550 audit Methods 0.000 claims abstract description 3
- 238000006243 chemical reaction Methods 0.000 claims abstract description 3
- 238000012986 modification Methods 0.000 claims abstract description 3
- 230000004048 modification Effects 0.000 claims abstract description 3
- 238000000034 method Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 2
- 238000005194 fractionation Methods 0.000 claims description 2
- 230000014509 gene expression Effects 0.000 claims description 2
- 239000000203 mixture Substances 0.000 claims description 2
- 230000005611 electricity Effects 0.000 claims 1
- 238000012797 qualification Methods 0.000 claims 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/263—Language identification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Machine Translation (AREA)
Abstract
一种可快速记录会议内容并转换成文字的设备主要是通过对会议现场声音的实时收集,音频分析软件实时分析收集到的声音内容,将分析的结果转换成文字,经参会人员或会议记录人员修改、审核、整理后会议内容记录确定下来。由音频收集部分、音频分析部分、文字处理部分三个主要部分组成。音频收集部分主要是对会议现场的声音进行完整收集,音频分析部分主要是对收集到的音频数据进行分析并转换成文字。文字处理部分是对转换后的会议内容文字进行格式、内容的统一和校核。
Description
会议是沟通信息、传达任务、总结工作的重要载体。在会议召开过程中,如何实时记录会议内容,并将会议内容转换成文字成为一项当前没有***解决的问题。
一、技术领域
一种可快速记录会议内容并转换成文字的设备主要应用于会议的记录。现在的会议记录主要是人工记录和录音整理,时效性较差。会议内容的记录和整理费时费力,人工成本较高。会议内容的还原性也较差,对会议召开的全过程可追溯性不强。人工记录只能对要点和重要部分记录,录音整理没有全面开展。
二、背景技术
随着当前信息化、智能化的发展,音频采集、声音分析、文字处理等都有较大进步。通过对这几种技术的整合,形成独立的可快速记录会议内容并转换成文字的设备在技术上是可行的。
三、发明内容
一种可快速记录会议内容并转换成文字的设备主要是通过对会议现场声音的实时收集,音频分析软件实时分析收集到的声音内容,将分析的结果转换成文字,经参会人员或会议记录人员修改、审核、整理后会议内容记录确定下来。由音频收集部分、音频分析部分、文字处理部分三个主要部分组成。
1、音频收集部分,该部分主要作用就是对会议现场的声音进行完整收集。从会议开始到结束的全过程都要实时收集。音频收集以声音录制为主要形式,为独立的部分,考虑会议现场的嘈杂性、会议发言声音的重叠性、发言人员的音量大小等问题,尽量将会议现场的声音收集完整。音频收集后要及时(或2分钟或5分钟)通过无法或有线传输至计算机等待下一步处理。
2、音频分析部分。计算机接收到会议现场的音频数据后,首先通过音频处理软件对音频数据进行处理。主要是降噪、还原、拆分等内容。通过音频软件处理合格后将音频数据传输到音频分析软件中,音频分析软件逐句对音频数据进行分析,主要是通过对音频分析数据库的比对、以往发言人的说话习惯、地方方言数据库的比对、模糊字句的判断等初步就音频数据转换成文字形式。引入分析准确性评价,对软件分析评价准确性不高的部分要人工分析。
3、文字处理部分。音频数据转换成文字形式后将转换后的文字传输至专门的文字处理软件。文字处理就会议内容的格式、记录时间、发言人等内容整理。对语句语法、明显错误单独标示。人工校准会议内容,对音频软件分析准确性较差、文字处理软件提示的要重点校准,尽量保证会议记录的准确性、完整性和实时性。经校准后输出会议记录的文字稿并做好会议内容电子数据的整理。
四、附图说明 无。
Claims (1)
1.一种可快速记录会议内容并转换成文字的设备主要是通过对会议现场声音的实时收集,音频分析软件实时分析收集到的声音内容,将分析的结果转换成文字,经参会人员或会议记录人员修改、审核、整理后会议内容记录确定下来。由音频收集部分、音频分析部分、文字处理部分三个主要部分组成。音频收集部分,是对会议现场的声音进行完整收集。从会议开始到结束的全过程都要实时收集。音频分析部分。是通过音频处理软件对音频数据进行处理。主要是降噪、还原、拆分等内容。通过音频软件处理合格后将音频数据传输到音频分析软件中,音频分析软件逐句对音频数据进行分析,主要是通过对音频分析数据库的比对、以往发言人的说话习惯、地方方言数据库的比对、模糊字句的判断等初步就音频数据转换成文字形式。引入分析准确性评价,对软件分析评价准确性不高的部分要人工分析。文字处理部分。音频数据转换成文字形式后将转换后的文字传输至专门的文字处理软件。文字处理就会议内容的格式、记录时间、发言人等内容整理。对语句语法、明显错误单独标示。人工校准会议内容,对音频软件分析准确性较差、文字处理软件提示的要重点校准,尽量保证会议记录的准确性、完整性和实时性。经校准后输出会议记录的文字稿并做好会议内容电子数据的整理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810192331.8A CN110197656A (zh) | 2018-02-26 | 2018-02-26 | 一种可快速记录会议内容并转换成文字的设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810192331.8A CN110197656A (zh) | 2018-02-26 | 2018-02-26 | 一种可快速记录会议内容并转换成文字的设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110197656A true CN110197656A (zh) | 2019-09-03 |
Family
ID=67751314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810192331.8A Pending CN110197656A (zh) | 2018-02-26 | 2018-02-26 | 一种可快速记录会议内容并转换成文字的设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110197656A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117221016A (zh) * | 2023-11-09 | 2023-12-12 | 北京亚康万玮信息技术股份有限公司 | 一种远程连接过程中数据安全传输方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103578464A (zh) * | 2013-10-18 | 2014-02-12 | 威盛电子股份有限公司 | 语言模型的建立方法、语音辨识方法及电子装置 |
CN104252864A (zh) * | 2013-06-28 | 2014-12-31 | 国际商业机器公司 | 实时语音分析方法和*** |
CN106057193A (zh) * | 2016-07-13 | 2016-10-26 | 深圳市沃特沃德股份有限公司 | 基于电话会议的会议记录生成方法和装置 |
CN106356065A (zh) * | 2016-10-31 | 2017-01-25 | 努比亚技术有限公司 | 一种移动终端及语音转换方法 |
CN107068144A (zh) * | 2016-01-08 | 2017-08-18 | 王道平 | 一种语音识别中便于人工修改文字的方法 |
-
2018
- 2018-02-26 CN CN201810192331.8A patent/CN110197656A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104252864A (zh) * | 2013-06-28 | 2014-12-31 | 国际商业机器公司 | 实时语音分析方法和*** |
CN103578464A (zh) * | 2013-10-18 | 2014-02-12 | 威盛电子股份有限公司 | 语言模型的建立方法、语音辨识方法及电子装置 |
CN107068144A (zh) * | 2016-01-08 | 2017-08-18 | 王道平 | 一种语音识别中便于人工修改文字的方法 |
CN106057193A (zh) * | 2016-07-13 | 2016-10-26 | 深圳市沃特沃德股份有限公司 | 基于电话会议的会议记录生成方法和装置 |
CN106356065A (zh) * | 2016-10-31 | 2017-01-25 | 努比亚技术有限公司 | 一种移动终端及语音转换方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117221016A (zh) * | 2023-11-09 | 2023-12-12 | 北京亚康万玮信息技术股份有限公司 | 一种远程连接过程中数据安全传输方法 |
CN117221016B (zh) * | 2023-11-09 | 2024-01-12 | 北京亚康万玮信息技术股份有限公司 | 一种远程连接过程中数据安全传输方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Morrison et al. | INTERPOL survey of the use of speaker identification by law enforcement agencies | |
CN103745731B (zh) | 一种语音识别效果自动化测试***及测试方法 | |
US9230562B2 (en) | System and method using feedback speech analysis for improving speaking ability | |
Ferrer et al. | Promoting robustness for speaker modeling in the community: the PRISM evaluation set | |
Green et al. | Automatic speech recognition with sparse training data for dysarthric speakers. | |
EP2026329A1 (en) | Speech situation data creating device, speech situation visualizing device, speech situation data editing device, speech data reproducing device, and speech communication system | |
CN109147765A (zh) | 音频质量综合评测方法及*** | |
Gibbon et al. | Spoken language system and corpus design | |
JP2010060850A (ja) | 議事録作成支援装置、議事録作成支援方法、議事録作成支援用プログラム及び議事録作成支援システム | |
Michael | Retico: An incremental framework for spoken dialogue systems | |
CA2417926C (en) | Method of and system for improving accuracy in a speech recognition system | |
CN110197656A (zh) | 一种可快速记录会议内容并转换成文字的设备 | |
Spreafico et al. | The sociophonetic variation of/r/in Bozen: Modelling linguistic and social variation | |
Cord-Landwehr et al. | MMS-MSG: A multi-purpose multi-speaker mixture signal generator | |
Coleman et al. | Mining a year of speech | |
Pęzik | Increasing the accessibility of time-aligned speech corpora with spokes Mix | |
Johnson et al. | Automatic speech semantic recognition and verification in Air Traffic Control | |
Heggie et al. | The practicalities of soundscape data collection by systematic approach according to ISO 12913-2 | |
Fiebig | Soundscape standardization dares the impossible-Case studies valuing current soundscape standards | |
US11778090B1 (en) | Communication monitoring systems and methods | |
Vinnikov et al. | Notsofar-1 challenge: New datasets, baseline, and tasks for distant meeting transcription | |
Baker et al. | Speech recognition performance assessments and available databases | |
Zergat et al. | The voice as a material clue: a new forensic Algerian Corpus | |
Yang et al. | Comparison of Automatic Speech Recognition System for School-aged Children’s Narratives: Naver Clova Speech and Google Speech-to-Text | |
Duah et al. | The combination of indefinite and definite determiners in Akan |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190903 |