KR102262421B1 - 모바일 기기를 이용한 음성인식 시스템 - Google Patents

모바일 기기를 이용한 음성인식 시스템 Download PDF

Info

Publication number
KR102262421B1
KR102262421B1 KR1020140162396A KR20140162396A KR102262421B1 KR 102262421 B1 KR102262421 B1 KR 102262421B1 KR 1020140162396 A KR1020140162396 A KR 1020140162396A KR 20140162396 A KR20140162396 A KR 20140162396A KR 102262421 B1 KR102262421 B1 KR 102262421B1
Authority
KR
South Korea
Prior art keywords
voice recognition
mobile device
microphone
voice
computer device
Prior art date
Application number
KR1020140162396A
Other languages
English (en)
Other versions
KR20160004886A (ko
Inventor
전형배
이윤근
박전규
오유리
이윤경
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Publication of KR20160004886A publication Critical patent/KR20160004886A/ko
Application granted granted Critical
Publication of KR102262421B1 publication Critical patent/KR102262421B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

모바일 단말의 마이크로폰을 이용한 PC환경에서 동작하는 음성인식 시스템이 개시된다. 본 발명의 일 면에 따른 모바일 기기를 이용한 음성인식 시스템은, 마이크로폰을 내장하고, 상기 마이크로폰에 입력된 음성신호를 유/무선 네트워크로 연결된 컴퓨터 장치로 전달하는 모바일 기기와; 및 음성인식을 위한 응용프로그램이 설치되고, 유/무선 네트워크로 연결된 상기 모바일 기기를 음성입력 장치로 자동으로 인식하고, 상기 모바일 기기로부터 전달된 음성신호를 처리하여 음성인식을 수행하는 컴퓨터 장치를 포함한다.

Description

모바일 기기를 이용한 음성인식 시스템 {VOICE RECOGNITION SYSTEM USING MICROPHONE OF MOBILE TERMINAL}
본 발명은 음성인식 시스템에 관한 것으로서, 보다 상세하게는 모바일 단말의 마이크로폰을 이용한 PC환경에서 동작하는 음성인식 시스템에 관한 것이다.
마이크로폰은 음성인식을 위한 가장 중요한 입력장치이나, 일반 사용자가 마이크로폰 설정을 음서인식에 적합하도록 하는 것은 매우 어려운 일이다.
예컨대, 컴퓨터 장치에 음성인식 응용프로그램이 설치된 경우, 음성인식을 위한 음성신호는 내장 마이크 입력, 마이크 외부입력, USB 장치 마이크 입력 등 다양한 오디오 입력장치로부터 입력될 수 있으며, 사용자는 연결된 마이크를 녹음장치로서 선택해야 한다.
또한, 사용자가 특정 마이크로폰을 녹음장치로 선택한 경우에도 적절한 마이크 설정이 필요하다. 예컨대, 마이크 게인(Gain) 설정 및 마이크 잡음 처리(Nosie Processing) 설정 등이 필요하다. 특히, 화상채팅 등에 적합하도록 잡음처리가 강제로 기본 설정으로 된 경우, 이를 다른 모드의 음성 입력에 적합하도록 변경하는 것은 사용자에게 익숙하지 않고, 별도의 고가 사운드 카드가 컴퓨터 장치에 장착된 경우, 마이크 설정은 더욱 복잡해진다.
마이크로폰의 적절한 설정은 음성인식 성능에 직접적인 영향을 끼친다는 점에서 사용자의 설정이 없더라도 일정 수준 이상의 품질을 갖는 음성입력을 확보하는 방안이 마련되어야 한다.
도 1은 종래 기술에 따른 음성인식 시스템을 도시한 예시도이다.
도 1을 참조하면, 음성인식 응용프로그램이 설치된 컴퓨터 장치(103)는 직접적으로 연결된 마이크로폰(102)으로 음성신호를 입력 받는다. 원활한 음성인식을 위하여 사용자는 마이크로폰 녹음장치 설정을 통해 적절한 마이크로폰 장치를 선택하고, 적절한 입력 증폭을 설정해야 한다. 또한, 컴퓨터 장치의 사운드카드, 마이크로폰의 품질에 따라 녹음되는 음성신호의 품질이 저하되는 경우가 발생한다.
또한, 마이크로폰 자체의 성능이 우수하다고 하여도 사운드카드의 품질이 나쁜 경우에는 전원 잡음과 같은 부가적인 잡음이 음성 신호에 더해지는 문제가 있다.
본 발명이 해결하고자 하는 기술적 과제는, 모바일 기기의 마이크로폰을 사용하기 때문에 고품질이며, 일관되는 채널특성을 보이는 음성신호를 음성인식의 입력신호로 사용할 수 있어 음성인식 성능 향상을 기대할 수 있는 모바일 기기를 이용한 음성인식 시스템을 제공하는 것이다.
본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상술한 본 발명의 목적을 달성하기 위한 본 발명의 일 면에 따른 모바일 기기를 이용한 음성인식 시스템은, 마이크로폰을 내장하고, 상기 마이크로폰에 입력된 음성신호를 유/무선 네트워크로 연결된 컴퓨터 장치로 전달하는 모바일 기기와; 및 음성인식을 위한 응용프로그램이 설치되고, 유/무선 네트워크로 연결된 상기 모바일 기기를 음성입력 장치로 자동으로 인식하고, 상기 모바일 기기로부터 전달된 음성신호를 처리하여 음성인식을 수행하는 컴퓨터 장치를 포함한다.
상기 모바일 기기와 상기 컴퓨터 장치는 블루투스 프로토콜로 연결되고, 상기 모바일 기기는 상기 컴퓨터 장치에서 블루투스 연결 가능한 기기로 자동 인식되는 것을 특징으로 한다.
상기 모바일 기기와 상기 컴퓨터 장치는 무선공유기를 이용한 내부 무선망 연결 방식으로 연결되는 것을 특징으로 한다.
상기 모바일 기기와 상기 컴퓨터 장치는 인터넷 망을 통해 간접적으로 연결되는 것을 특징으로 한다.
상기 모바일 기기와 상기 컴퓨터 장치는 USB 케이블을 이용하여 직접 연결되는 것을 특징으로 한다.
이상 상술한 바와 같은 본 발명에 따르면, 음성인식 응용프로그램이 설치된 컴퓨터 장치와의 거리에 무관하게 모바일 기기를 마이크로폰으로 사용하여 음성신호를 입력할 수 있다. 또한, 모바일 기기의 마이크로폰을 사용하기 때문에 고품질이며, 일관되는 채널특성을 보이는 음성신호를 음성인식의 입력신호로 사용할 수 있어 음성인식 성능 향상을 기대할 수 있다.
도 1은 종래 기술에 따른 음성인식 시스템을 도시한 예시도.
도 2는 본 발명의 제1 실시예에 따른 음성인식 시스템을 도시한 구성도.
도 3은 본 발명의 제2 실시예에 따른 음성인식 시스템을 도시한 구성도.
도 4는 본 발명의 제3 실시예에 따른 음성인식 시스템을 도시한 구성도.
도 5는 본 발명의 제4 실시예에 따른 음성인식 시스템을 도시한 구성도.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 기재에 의해 정의된다. 한편, 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 또는 "포함하는(comprising)"은 언급된 구성요소, 단계, 동작 및/또는 소자 이외의 하나 이상의 다른 구성요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
이하, 본 발명의 바람직한 실시예를 첨부된 도면들을 참조하여 상세히 설명한다. 우선 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가급적 동일한 부호를 부여하고 또한 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있는 경우에는 그 상세한 설명은 생략한다.
본 발명의 실시예에 따른 음성인식 시스템은 마이크로폰을 내장하고, 상기 마이크로폰에 입력된 음성신호를 유/무선 네트워크로 연결된 컴퓨터 장치로 전달하는 모바일 기기와; 및 음성인식을 위한 응용프로그램이 설치되고, 유/무선 네트워크로 연결된 상기 모바일 기기를 음성입력 장치로 자동으로 인식하고, 상기 모바일 기기로부터 전달된 음성신호를 처리하여 음성인식을 수행하는 컴퓨터 장치를 포함하여 구성된다.
상기 모바일 기기와 상기 컴퓨터 장치는 다양한 방식의 유/무선 네트워크로 연결될 수 있으며, 네트워크 연결방식에 따라 모바일 기기 혹은 컴퓨터 장치에서의 동작은 달라지게 된다. 이하에서는 도 2 내지 도 5를 참조하여 다양한 네트워크 연결 방식에 따른 음성인식 시스템에 대해 살펴보도록 한다.
제1 실시예 - 블루투스 연결
도 2는 본 발명의 제1 실시예에 따른 음성인식 시스템을 도시한 구성도이다.
도 2를 참조하면, 본 발명의 제1 실시예에 따른 음성인식 시스템은 모바일 기기(202)와 컴퓨터 장치(203)를 포함하여 구성되고, 상기 모바일 기기(202)와 상기 컴퓨터 장치(203)는 블루투스 프로토콜에 의해 무선 연결된다.
상기 모바일 기기(202)는 마이크로폰을 내장하고 있으며, 사용자로부터의 음성입력(201)을 녹음하고, 이를 블루투스 프로토콜로 통신 가능한 음성신호로 변환한다. 변환된 음성신호는 특정 버퍼 크기로 상기 컴퓨터 장치(203)로 전달된다.
여기서, 모바일 기기(202)는 블루투스 통신 프로세서가 내장된 스마트폰, 스마트 패드 등에 해당될 수 있다. 이러한 모바일 기기(202)의 운영체제가 구글 안드로이드 OS인 경우, 구글 서치, 보이스 키보드 등의 어플리케이션 실행을 위해 음성인식을 위한 마이크로폰 설정이 최적화되어 있다. 또한, 운영체제가 애플 ios인 경우, 시리 등의 음성인식 어플리케이션 실행을 위해 음성인식을 위한 마이크로폰 설정이 최적화되어 있음은 당연하다.
상기 컴퓨터 장치(203)에는 음성인식 관련 응용프로그램이 설치되어 있으며, 블루투스 통신을 위한 프로세스가 내장되어 블루투스 연결 가능한 모바일 기기(202)를 자동으로 인식한다.
상기 컴퓨터 장치(203)는 블루투스 통신 연결된 상기 모바일 기기(202)를 음성입력 장치로 자동으로 설정하고, 상기 모바일 기기(202)로부터 전달된 음성신호를 처리하여 음성인식을 수행한다.
제2 실시예 - 내부 무선망 연결
도 3은 본 발명의 제2 실시예에 따른 음성인식 시스템을 도시한 구성도이다.
도 3을 참조하면, 본 발명의 제2 실시예에 따른 음성인식 시스템은 모바일 기기(302)와 컴퓨터 장치(303)와 무선공유기(304)를 포함하여 구성되고, 상기 모바일 기기(302)와 상기 컴퓨터 장치(303)는 무선공유기(304)를 통한 내부 무선망으로 연결된다.
상기 모바일 기기(302)와 상기 컴퓨터 장치(303)는 모두 무선공유기(304)에 Wi-Fi로 연결되어 있는 경우, 외부 인터넷 망을 통하지 않고 무선공유기를 통한 내부망으로 2개 장치의 직접적인 연결이 가능하다. 이와 같은 Wi-Fi 환경에서의 내부 무선망 연결 방식으로 WiFi-Direct, DLNA, 미러링 등의 방법이 사용될 수 있다.
상기 모바일 기기(302)는 마이크로폰을 내장하고 있으며, 사용자로부터의 음성입력(301)을 녹음하고, 이를 WiFi 프로토콜로 통신 가능한 음성신호로 변환한다. 변환된 음성신호는 특정 버퍼 크기로 상기 컴퓨터 장치(303)로 전달된다.
상기 컴퓨터 장치(303)에는 음성인식 관련 응용프로그램이 설치되어 있으며, Wi-Fi 통신을 위한 프로세스가 내장되어 무선공유기(304)를 통해 모바일 기기(302)와 내부 무선망으로 연결된다.
상기 컴퓨터 장치(303)는 내부 무선 무선망으로 연결된 상기 모바일 기기(302)를 음성입력 장치로 자동으로 설정하고, 상기 모바일 기기(302)로부터 전달된 음성신호를 처리하여 음성인식을 수행한다.
제3 실시예 - 인터넷 망 연결
도 4는 본 발명의 제3 실시예에 따른 음성인식 시스템을 도시한 구성도이다.
도 4를 참조하면, 본 발명의 제3 실시예에 따른 음성인식 시스템은 모바일 기기(402)와 컴퓨터 장치(403)와 인터넷망(404)를 포함하여 구성되고, 상기 모바일 기기(402)와 상기 컴퓨터 장치(403)는 인터넷망(404)에 무선 데이터 통신(3G, LTE 등)으로 연결된다.
상기 컴퓨터 장치(403)는 유선 랜 환경 또는 무선 랜 환경을 통해 인터넷망에 연결된다. 인터넷망을 통해 상기 모바일 기기(402)와 상기 컴퓨터 장치(403)를 연결하기 위해서는 상기 모바일 기기(402)와 상기 컴퓨터 장치(403) 각각에 네트워크 연동을 위한 응용프로그램이 설치되어 동작하고 있어야 한다.
상기 모바일 기기(402)와 상기 컴퓨터 장치(403)는 설치된 응용프로그램을 통해 인터넷망에서 보안 연결을 수행한다.
상기 컴퓨터 장치(403)는 인터넷망으로 연결된 상기 모바일 기기(402)를 음성입력 장치로 자동으로 설정하고, 상기 모바일 기기(402)로부터 전달된 음성신호를 처리하여 음성인식을 수행한다.
제4 실시예 - USB 케이블 연결
도 5는 본 발명의 제4 실시예에 따른 음성인식 시스템을 도시한 구성도이다.
도 5를 참조하면, 본 발명의 제4 실시예에 따른 음성인식 시스템은 모바일 기기(502)와 컴퓨터 장치(503)를 포함하여 구성되고, 상기 모바일 기기(502)와 상기 컴퓨터 장치(503)는 USB 케이블을 통해 직접 연결된다.
상기 모바일 기기(502)가 USB 케이블을 통해 상기 컴퓨터 장치(503)에 연결되면, 상기 컴퓨터 장치(503)에서 상기 모바일 기기(502)는 인식되어 음성입력 장치로 자동으로 설정된다.
상기 모바일 기기(502)에 녹음된 사용자의 음성입력은 상기 컴퓨터 장치(503)로 전달되고, 이를 처리하여 음성인식을 수행한다.
스마트폰과 같은 모바일 기기의 마이크로폰은 고품질의 음성통화를 목적으로 최적화가 이루어져 있다. 최근 모바일 환경 음성인식을 위해 녹음 품질의 일관성 또한 향상되었다. 이와 같은 고품질의 모바일 기기의 마이크로폰을 음성인식을 위한 응용프로그램에서 녹음장치로 사용함으로써, 사용자들이 각 컴퓨터 장치의 녹음장치 설정 실수로 인한 음성인식 성능 저하를 방지할 수 있게 된다.
본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 보호범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구의 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (5)

  1. 마이크로폰을 내장하고, 상기 마이크로폰에 입력된 음성신호를 블루투스 프로토콜, 무선연결 방식의 무선 공유기, 직접 연결된 인터넷 망 및 USB 케이블 중 어느 하나의 유/무선 네트워크로 연결된 컴퓨터 장치로 전달하되, 상기 블루투스 프로토콜 및 무선 공유기를 이용한 무선연결 방식으로 연결되는 경우, 특정 버퍼 크기로 변환하여 음성신호를 상기 컴퓨터 장치로 전달하고, 직접 연결된 인터넷 망 및 USB 케이블을 통해 연결되는 경우 특정 버퍼 크기로 변환하지 않고 입력된 음성신호를 연결된 상기 컴퓨터 장치로 전달하는 모바일 기기와; 및
    음성인식을 위한 응용프로그램이 설치되고, 유/무선 네트워크로 연결된 상기 모바일 기기를 음성입력 장치로 자동으로 인식하고, 상기 모바일 기기로부터 전달된 음성신호를 처리하여 음성인식을 수행하는 컴퓨터 장치
    를 포함하는 모바일 기기를 이용한 음성인식 시스템.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
KR1020140162396A 2014-07-04 2014-11-20 모바일 기기를 이용한 음성인식 시스템 KR102262421B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020140083828 2014-07-04
KR20140083828 2014-07-04

Publications (2)

Publication Number Publication Date
KR20160004886A KR20160004886A (ko) 2016-01-13
KR102262421B1 true KR102262421B1 (ko) 2021-06-08

Family

ID=55172751

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140162396A KR102262421B1 (ko) 2014-07-04 2014-11-20 모바일 기기를 이용한 음성인식 시스템

Country Status (1)

Country Link
KR (1) KR102262421B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003316375A (ja) * 2002-04-26 2003-11-07 Ricoh Co Ltd 分散ディクテーションシステム、プログラム及び記憶媒体
JP2004287447A (ja) * 2003-03-24 2004-10-14 Microsoft Corp モバイル通信デバイスのための分散音声認識

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060073338A (ko) * 2004-12-24 2006-06-28 주식회사 팬택 음원 장치의 스피커로 기능하는 이동통신 단말기 및 그 방법
US20120059655A1 (en) * 2010-09-08 2012-03-08 Nuance Communications, Inc. Methods and apparatus for providing input to a speech-enabled application program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003316375A (ja) * 2002-04-26 2003-11-07 Ricoh Co Ltd 分散ディクテーションシステム、プログラム及び記憶媒体
JP2004287447A (ja) * 2003-03-24 2004-10-14 Microsoft Corp モバイル通信デバイスのための分散音声認識

Also Published As

Publication number Publication date
KR20160004886A (ko) 2016-01-13

Similar Documents

Publication Publication Date Title
JP7023990B2 (ja) 構成可能ビーム障害事象設計
US10764024B2 (en) Multi-beam listen before talk
US10165613B2 (en) Control method for bluetooth communication and bluetooth low energy communication
CN106936987B (zh) 一种可识别蓝牙耳机语音来源的方法及设备
US11627507B2 (en) Network handover method and apparatus
CN103561480A (zh) 数据传输方法
CN104105053A (zh) 利用nfc技术和蓝牙技术实现文件共享的方法及***
US20160353173A1 (en) Voice processing method and system for smart tvs
CN103781190A (zh) 电子装置及其控制方法
WO2018049892A1 (zh) 数据传输方法、装置及终端
US10312874B2 (en) Volume control methods and devices, and multimedia playback control methods and devices
CN113170383A (zh) 用于无线通信的移动设备和电子设备及其操作方法
MX350426B (es) Metodo y aparato para tener acceso a red wi-fi.
WO2016134587A1 (zh) Wifi连接验证方法、wifi热点设备及终端
JP6381062B2 (ja) 通信デバイスのための音声信号を処理するための方法及びデバイス
US11201849B2 (en) Natural language connectivity
CN105517111A (zh) 一种设备连接网络的方法及装置
CN104954078A (zh) 基于声波通信的控制及响应方法和装置
WO2017185339A1 (zh) 无线连接方法、装置及***
JP2015162903A (ja) 監視システム及びその運用方法
KR102262421B1 (ko) 모바일 기기를 이용한 음성인식 시스템
JP2013191909A (ja) 無線通信システム、及び干渉抑制方法
US8447030B2 (en) Dual mode communication device and method for managing voice communication
JP2014517580A (ja) 伝送モードの設定方法、ユーザ機器及び基地局
KR102361009B1 (ko) 단말과 셋탑 박스의 연동을 위한 장치 및 방법

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant