CN110197656A - 一种可快速记录会议内容并转换成文字的设备 - Google Patents

一种可快速记录会议内容并转换成文字的设备 Download PDF

Info

Publication number
CN110197656A
CN110197656A CN201810192331.8A CN201810192331A CN110197656A CN 110197656 A CN110197656 A CN 110197656A CN 201810192331 A CN201810192331 A CN 201810192331A CN 110197656 A CN110197656 A CN 110197656A
Authority
CN
China
Prior art keywords
audio
analysis
text
converted
conference content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810192331.8A
Other languages
English (en)
Inventor
付明涛
代蔚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201810192331.8A priority Critical patent/CN110197656A/zh
Publication of CN110197656A publication Critical patent/CN110197656A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Machine Translation (AREA)

Abstract

一种可快速记录会议内容并转换成文字的设备主要是通过对会议现场声音的实时收集,音频分析软件实时分析收集到的声音内容,将分析的结果转换成文字,经参会人员或会议记录人员修改、审核、整理后会议内容记录确定下来。由音频收集部分、音频分析部分、文字处理部分三个主要部分组成。音频收集部分主要是对会议现场的声音进行完整收集,音频分析部分主要是对收集到的音频数据进行分析并转换成文字。文字处理部分是对转换后的会议内容文字进行格式、内容的统一和校核。

Description

一种可快速记录会议内容并转换成文字的设备
会议是沟通信息、传达任务、总结工作的重要载体。在会议召开过程中,如何实时记录会议内容,并将会议内容转换成文字成为一项当前没有***解决的问题。
一、技术领域
一种可快速记录会议内容并转换成文字的设备主要应用于会议的记录。现在的会议记录主要是人工记录和录音整理,时效性较差。会议内容的记录和整理费时费力,人工成本较高。会议内容的还原性也较差,对会议召开的全过程可追溯性不强。人工记录只能对要点和重要部分记录,录音整理没有全面开展。
二、背景技术
随着当前信息化、智能化的发展,音频采集、声音分析、文字处理等都有较大进步。通过对这几种技术的整合,形成独立的可快速记录会议内容并转换成文字的设备在技术上是可行的。
三、发明内容
一种可快速记录会议内容并转换成文字的设备主要是通过对会议现场声音的实时收集,音频分析软件实时分析收集到的声音内容,将分析的结果转换成文字,经参会人员或会议记录人员修改、审核、整理后会议内容记录确定下来。由音频收集部分、音频分析部分、文字处理部分三个主要部分组成。
1、音频收集部分,该部分主要作用就是对会议现场的声音进行完整收集。从会议开始到结束的全过程都要实时收集。音频收集以声音录制为主要形式,为独立的部分,考虑会议现场的嘈杂性、会议发言声音的重叠性、发言人员的音量大小等问题,尽量将会议现场的声音收集完整。音频收集后要及时(或2分钟或5分钟)通过无法或有线传输至计算机等待下一步处理。
2、音频分析部分。计算机接收到会议现场的音频数据后,首先通过音频处理软件对音频数据进行处理。主要是降噪、还原、拆分等内容。通过音频软件处理合格后将音频数据传输到音频分析软件中,音频分析软件逐句对音频数据进行分析,主要是通过对音频分析数据库的比对、以往发言人的说话习惯、地方方言数据库的比对、模糊字句的判断等初步就音频数据转换成文字形式。引入分析准确性评价,对软件分析评价准确性不高的部分要人工分析。
3、文字处理部分。音频数据转换成文字形式后将转换后的文字传输至专门的文字处理软件。文字处理就会议内容的格式、记录时间、发言人等内容整理。对语句语法、明显错误单独标示。人工校准会议内容,对音频软件分析准确性较差、文字处理软件提示的要重点校准,尽量保证会议记录的准确性、完整性和实时性。经校准后输出会议记录的文字稿并做好会议内容电子数据的整理。
四、附图说明 无。

Claims (1)

1.一种可快速记录会议内容并转换成文字的设备主要是通过对会议现场声音的实时收集,音频分析软件实时分析收集到的声音内容,将分析的结果转换成文字,经参会人员或会议记录人员修改、审核、整理后会议内容记录确定下来。由音频收集部分、音频分析部分、文字处理部分三个主要部分组成。音频收集部分,是对会议现场的声音进行完整收集。从会议开始到结束的全过程都要实时收集。音频分析部分。是通过音频处理软件对音频数据进行处理。主要是降噪、还原、拆分等内容。通过音频软件处理合格后将音频数据传输到音频分析软件中,音频分析软件逐句对音频数据进行分析,主要是通过对音频分析数据库的比对、以往发言人的说话习惯、地方方言数据库的比对、模糊字句的判断等初步就音频数据转换成文字形式。引入分析准确性评价,对软件分析评价准确性不高的部分要人工分析。文字处理部分。音频数据转换成文字形式后将转换后的文字传输至专门的文字处理软件。文字处理就会议内容的格式、记录时间、发言人等内容整理。对语句语法、明显错误单独标示。人工校准会议内容,对音频软件分析准确性较差、文字处理软件提示的要重点校准,尽量保证会议记录的准确性、完整性和实时性。经校准后输出会议记录的文字稿并做好会议内容电子数据的整理。
CN201810192331.8A 2018-02-26 2018-02-26 一种可快速记录会议内容并转换成文字的设备 Pending CN110197656A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810192331.8A CN110197656A (zh) 2018-02-26 2018-02-26 一种可快速记录会议内容并转换成文字的设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810192331.8A CN110197656A (zh) 2018-02-26 2018-02-26 一种可快速记录会议内容并转换成文字的设备

Publications (1)

Publication Number Publication Date
CN110197656A true CN110197656A (zh) 2019-09-03

Family

ID=67751314

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810192331.8A Pending CN110197656A (zh) 2018-02-26 2018-02-26 一种可快速记录会议内容并转换成文字的设备

Country Status (1)

Country Link
CN (1) CN110197656A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117221016A (zh) * 2023-11-09 2023-12-12 北京亚康万玮信息技术股份有限公司 一种远程连接过程中数据安全传输方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103578464A (zh) * 2013-10-18 2014-02-12 威盛电子股份有限公司 语言模型的建立方法、语音辨识方法及电子装置
CN104252864A (zh) * 2013-06-28 2014-12-31 国际商业机器公司 实时语音分析方法和***
CN106057193A (zh) * 2016-07-13 2016-10-26 深圳市沃特沃德股份有限公司 基于电话会议的会议记录生成方法和装置
CN106356065A (zh) * 2016-10-31 2017-01-25 努比亚技术有限公司 一种移动终端及语音转换方法
CN107068144A (zh) * 2016-01-08 2017-08-18 王道平 一种语音识别中便于人工修改文字的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104252864A (zh) * 2013-06-28 2014-12-31 国际商业机器公司 实时语音分析方法和***
CN103578464A (zh) * 2013-10-18 2014-02-12 威盛电子股份有限公司 语言模型的建立方法、语音辨识方法及电子装置
CN107068144A (zh) * 2016-01-08 2017-08-18 王道平 一种语音识别中便于人工修改文字的方法
CN106057193A (zh) * 2016-07-13 2016-10-26 深圳市沃特沃德股份有限公司 基于电话会议的会议记录生成方法和装置
CN106356065A (zh) * 2016-10-31 2017-01-25 努比亚技术有限公司 一种移动终端及语音转换方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117221016A (zh) * 2023-11-09 2023-12-12 北京亚康万玮信息技术股份有限公司 一种远程连接过程中数据安全传输方法
CN117221016B (zh) * 2023-11-09 2024-01-12 北京亚康万玮信息技术股份有限公司 一种远程连接过程中数据安全传输方法

Similar Documents

Publication Publication Date Title
Morrison et al. INTERPOL survey of the use of speaker identification by law enforcement agencies
CN103745731B (zh) 一种语音识别效果自动化测试***及测试方法
US9230562B2 (en) System and method using feedback speech analysis for improving speaking ability
Ferrer et al. Promoting robustness for speaker modeling in the community: the PRISM evaluation set
Green et al. Automatic speech recognition with sparse training data for dysarthric speakers.
EP2026329A1 (en) Speech situation data creating device, speech situation visualizing device, speech situation data editing device, speech data reproducing device, and speech communication system
CN109147765A (zh) 音频质量综合评测方法及***
Gibbon et al. Spoken language system and corpus design
JP2010060850A (ja) 議事録作成支援装置、議事録作成支援方法、議事録作成支援用プログラム及び議事録作成支援システム
Michael Retico: An incremental framework for spoken dialogue systems
CA2417926C (en) Method of and system for improving accuracy in a speech recognition system
CN110197656A (zh) 一种可快速记录会议内容并转换成文字的设备
Spreafico et al. The sociophonetic variation of/r/in Bozen: Modelling linguistic and social variation
Cord-Landwehr et al. MMS-MSG: A multi-purpose multi-speaker mixture signal generator
Coleman et al. Mining a year of speech
Pęzik Increasing the accessibility of time-aligned speech corpora with spokes Mix
Johnson et al. Automatic speech semantic recognition and verification in Air Traffic Control
Heggie et al. The practicalities of soundscape data collection by systematic approach according to ISO 12913-2
Fiebig Soundscape standardization dares the impossible-Case studies valuing current soundscape standards
US11778090B1 (en) Communication monitoring systems and methods
Vinnikov et al. Notsofar-1 challenge: New datasets, baseline, and tasks for distant meeting transcription
Baker et al. Speech recognition performance assessments and available databases
Zergat et al. The voice as a material clue: a new forensic Algerian Corpus
Yang et al. Comparison of Automatic Speech Recognition System for School-aged Children’s Narratives: Naver Clova Speech and Google Speech-to-Text
Duah et al. The combination of indefinite and definite determiners in Akan

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190903