KR20030078388A - 음성대화 인터페이스를 이용한 정보제공장치 및 그 방법 - Google Patents

음성대화 인터페이스를 이용한 정보제공장치 및 그 방법 Download PDF

Info

Publication number
KR20030078388A
KR20030078388A KR1020020017413A KR20020017413A KR20030078388A KR 20030078388 A KR20030078388 A KR 20030078388A KR 1020020017413 A KR1020020017413 A KR 1020020017413A KR 20020017413 A KR20020017413 A KR 20020017413A KR 20030078388 A KR20030078388 A KR 20030078388A
Authority
KR
South Korea
Prior art keywords
information
sentence
intention
user
speech
Prior art date
Application number
KR1020020017413A
Other languages
English (en)
Other versions
KR100446627B1 (ko
Inventor
김정수
이영범
이재원
이혜정
박찬민
서희경
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR10-2002-0017413A priority Critical patent/KR100446627B1/ko
Priority to DE60317130T priority patent/DE60317130T2/de
Priority to EP03251975A priority patent/EP1349145B1/en
Priority to JP2003093220A priority patent/JP2004005530A/ja
Priority to US10/401,695 priority patent/US7225128B2/en
Publication of KR20030078388A publication Critical patent/KR20030078388A/ko
Application granted granted Critical
Publication of KR100446627B1 publication Critical patent/KR100446627B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

본 발명은 음성대화 인터페이스를 이용한 정보제공장치 및 그 방법에 관한 것으로, 음성신호를 문장으로 변환하는 음성인식부; 문장을 의미구조로 분석하는 문장분석부; 분석된 의미구조로부터 화행 또는 의도정보를 추출하고, 추출된 화행 또는 의도정보로부터 응답을 위한 화행 또는 의도를 생성하는 대화관리부; 화행과 의도정보로부터 응답을 위한 문장을 생성하는 문장생성부; 생성한 문장을 음성으로 합성하는 음성합성부; 응답에 필요한 정보를 인터넷으로부터 실시간으로 추출하는 정보추출부; 사용자의 성향을 분석하고 분류하는 사용자모델링부를 포함하므로, 사용자가 원하는 정보를 실시간으로 검색하여 사용자의 특성에 맞추어 다양한 대화를 음성인터페이스로 제공할 수 있다.

Description

음성대화 인터페이스를 이용한 정보제공장치 및 그 방법 {Apparatus for providing information using voice dialogue interface and method thereof}
본 발명은 사람과 기계간의 인터페이스를 위한 대화 에이전트에 관한 것으로, 특히 인터넷으로부터 원하는 정보를 실시간 추출하고, 대화 사용자의 대화 이력과 성향, 대량의 대화 예문(case)을 저장한 지식데이터베이스를 이용함으로써 다양한 대화가 가능하도록 하는 음성신호에 의한 정보제공시스템 및 그 방법에 관한 것이다.
종래의 음성신호에 의한 정보제공방법들은 키워드 검색(keyword detection)을 기반으로 사용자의 상태 및 시스템의 상태간의 상태천이(state transition)제어를 통한 대화관리를 하거나 시스템의 행위를 결정하는 스크립트를 사용하고 정보를 기반으로 다이얼로그 매니저에 의해서 대화관리를 하는 방식으로 이루어지므로, 오프라인으로 지식데이터베이스를 구축함으로써 정보의 변화를 실시간으로 갱신하지 못하고 정보 제공에 제한을 갖는다. 또한 short-term 대화 이력만을 이용함으로써 동일한 대화를 반복하게 하여 친밀감을 상실하게 되어 응용분야의 폭을 좁게 하는 단점이 있다.
본 발명이 이루고자 하는 기술적 과제는, 상기 문제점들을 해결하기 위해서 사용자 음성신호를 분석하여 그 신호에 응답하는 음성신호에 의한 정보제공시스템 및 그 방법을 제공하는 데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는, 상기 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 있다.
도 1은 본 발명에 따른 음성대화 인터페이스를 이용한 정보제공장치에 대한 블록도를 나타내는 도면이다.
도 2는 본 발명에 따른 음성대화 인터페이스를 이용한 정보제공장치에 대한 흐름을 나타내는 도면이다.
도 3은 본 발명에 따른 의도생성부에 대한 블록도를 나타내는 도면이다.
도 4는 본 발명에 따른 의도생성부에 대한 흐름을 나타내는 도면이다.
상기의 과제를 이루기 위한 본 발명에 따른 음성대화 인터페이스를 이용한 정보제공장치는, 음성신호를 문장으로 변환하는 음성인식부; 상기 문장을 의미구조로 분석하는 문장분석부; 상기 분석된 의미구조로부터 화행 또는 의도정보를 추출하고, 상기 추출된 화행 또는 의도정보로부터 응답을 위한 시스템의 화행 또는 의도를 생성하는 대화관리부; 상기 응답을 위한 화행 또는 의도정보로부터 문장을 생성하는 문장생성부; 상기 생성한 문장을 음성으로 합성하는 음성합성부; 응답에 필요한 정보를 인터넷으로부터 실시간으로 추출하는 정보추출부; 사용자의 성향을 분석하고 분류하는 사용자모델링부를 포함한다.
상기의 과제를 이루기 위한 본 발명에 따른 음성대화 인터페이스를 이용한 정보제공방법은, (a) 음성신호를 문장으로 변환하는 단계;(b) 상기 문장을 의미구조로 분석하는 단계;(c) 상기 분석된 의미구조로부터 화행 또는 의도정보를 추출하고, 상기 추출된 화행 또는 의도정보로부터 응답을 위한 시스템의 화행 또는 의도를 생성하는 단계;(d) 상기 응답을 위한 화행 또는 의도정보로부터 응답을 위한 문장을 생성하는 단계;(e) 상기 생성한 문장을 음성으로 합성하는 단계를 포함한다.
이하에서, 첨부된 도면을 참조하여 본 발명의 바람직한 실시 예에 대하여 상세히 설명한다.
도 1은 본 발명에 따른 음성대화 인터페이스를 이용한 정보제공장치에 대한 블록도를 나타내는 도면이다.
도 2는 본 발명에 따른 음성대화 인터페이스를 이용한 정보제공장치에 대한 흐름을 나타내는 도면이다.
이하 도 1 및 도 2를 함께 설명하기로 한다.
사용자가 음성신호를 보내오면, 음성인식부(110)는 음성신호를 입력받아 소리를 인식하여 음성신호를 문장으로 변환(210단계)한다. 문장생성부(120)는 음성인식부(110)에서 변환된 문장 또는 키보드 등과 같은 입력장치에 의해서 입력되는 문장을 입력으로 하여 그 문장을 의미구조로 분석(220단계)하는 기능을 수행하고, 입력된 문장을 형태소들로 분리하고 분리된 형태소들을 태깅하는 형태소분석부(121), 각 형태소간에 의존관계를 분석하여 문장구성성분을 분석하는 구문분석부(123) 및 문장구성성분의 의미를 결정하고 의미구조로 변환하는 의미분석부(125)로 구성된다.
대화관리부(130)는 의도분석부(131) 및 의도생성부(133)로 이루어지고, 의도분석부(131)는 의미구조를 입력으로 하여 사용자의 음성신호가 질문, 요구, 제안 또는 부탁 등 어떠한 화행 또는 의도인 지를 분석하고(230단계) 의도생성부(133)는 상기 분석된 사용자의 화행 또는 의도에 대한 시스템의 응답을 위하여 응답, 거절 또는 승락 등의 화행 또는 의도를 생성한다(240단계). 정보추출부(140)는 쿼리정보를 입력으로 하여 인터넷 등의 온라인 정보와 지식데이터베이스부(145)의 오프라인 정보를 검색하여 쿼리정보에 해당하는 정보를 의도생성부(133)에 제공한다. 사용자모델링부(150)는 의도분석부(131)로부터 사용자의 대화에 대한 정보를 입력받아 사용자의 성향을 분석한 후 의도생성부(133)에 제공한다. 지식데이터베이스부(145)는 사용자와 시스템간의 대화이력 및 사용성향 등을 저장한다.
문장생성부(160)는 시스템의 화행 또는 의도 정보를 입력받아 문장으로 변환하는 기능을 수행하고(250단계), 시스템의 화행과 의도에 대한 의미구조로부터 구문구조를 생성하여 문장을 구성하는 구문생성부(161), 상기 구문구조를 입력받아 문장으로 변환하기 위해서 형태소들을 생성하는 형태소생성부(163)로 구성된다. 음성합성부(171)는 문장을 입력받아 음성합성을 하여 출력하고(260단계) 캐릭터 에니메이션부(173)는 문장을 입력받아 동영상을 출력하여 사용자가 동영상 속의 인물과대화하듯이 진행하여 정보를 제공받을 수 있게 한다.
이하에서는 의도생성부(133)의 바람직한 실시 예에 대하여 상세히 설명한다.
도 3은 본 발명에 따른 의도생성부(133)에 대한 블록도를 나타내는 도면이다.
도 4는 본 발명에 따른 의도생성부(133)에 대한 흐름을 나타내는 도면이다.
이하 도 3 및 도 4를 함께 설명하기로 한다.
의도생성부(133)는 대화예문검색부(133-1), 의도유형결정부(133-3) 및 의도내용결정부(133-5)로 이루어지고, 대화예문검색부(133-1)는 사용자의 화행 또는 의도를 입력으로 하여 대화예문 데이터베이스로부터 다중의 대화예문을 검색하고(410단계), 의도유형결정부(133-3)는 사용자의 화행 또는 의도 정보와 사용자의 성향 정보를 이용하여 검색된 대화 예문들과의 유사도를 계산하여(420단계), 가장 유사한 하나의 대화예문을 선정하여 시스템이 응답할 화행 또는 의도유형을 결정한다(430단계). 의도내용결정부(133-5)는 선택된 의도유형의 내용부분을 완성하기 위하여 쿼리정보를 작성하고(440단계), 정보추출부(140)로부터 얻어진 검색결과를 이용하여 시스템의 화행 또는 의도를 완성한다(450단계). 대화예문 데이터베이스는 사용자의 의도와 이에 응답하는 시스템의 의도가 쌍으로 이루어진 형태이며, 대량의 대화예문을 저장하고 있다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다.컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 하드디스크, 플로피디스크, 플래쉬 메모리, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
이상에서 설명한 바와 같이, 본 발명에 의하면, 사용자가 원하는 정보를 실시간으로 검색하여 사용자의 성향에 맞추어 다양하고 친밀한 대화를 음성인터페이스로 제공할 수 있다. 즉, 사용자와의 대화이력을 저장하여 질문, 요구 등에 대해서 응답을 하기 때문에 동일한 대화를 반복하지 않아 친밀감을 유지할 수 있고 실시간으로 지식데이터베이스를 구축함으로써 정보의 변화를 실시간으로 갱신하여 정보제공을 한다.

Claims (15)

  1. 음성신호를 문장으로 변환하는 음성인식부;
    상기 문장을 의미구조로 분석하는 문장분석부;
    상기 분석된 의미구조로부터 화행 또는 의도정보를 추출하고, 상기 추출된 화행 또는 의도 정보로부터 시스템 응답을 위한 화행과 의도를 생성하는 대화관리부;
    상기 시스템 화행 또는 의도정보로부터 상기 음성신호에 대한 응답을 위한문장을 생성하는 문장생성부; 및
    상기 생성한 문장을 음성으로 합성하는 음성합성부를 포함하는 것을 특징으로 하는 음성대화 인터페이스를 이용한 정보제공장치.
  2. 제 1항에 있어서, 상기 문장분석부는
    상기 문장을 형태소들로 분리하고 분리된 형태소들을 태깅하는 형태소분석부; 및
    상기 형태소들간의 의존관계에 따라서 문장구성성분으로 나누는 구문분석부를 포함하는 것을 특징으로 하는 음성대화 인터페이스를 이용한 정보제공장치.
  3. 제 1항에 있어서, 상기 문장분석부는
    상기 음성신호에서 변환된 문장에 대한 의미구조로 변환하는 의미분석부를 더 포함하는 것을 특징으로 하는 음성대화 인터페이스를 이용한 정보제공장치.
  4. 제 1항에 있어서, 상기 대화관리부는
    상기 의미구조로부터 화행 또는 의도를 결정하는 의도분석부; 및
    상기 화행 또는 의도에 따라서 시스템의 응답을 위한 화행 또는 의도를 생성하는 의도생성부를 포함하는 것을 특징으로 하는 음성대화 인터페이스를 이용한 정보제공장치.
  5. 제 1항에 있어서,
    상기 화행 또는 의도 정보에 의해서 쿼리정보를 생성하는 쿼리생성부를 더 포함하는 것을 특징으로 하는 음성대화 인터페이스를 이용한 정보제공장치.
  6. 제 5항에 있어서,
    상기 쿼리정보를 검색으로 하여 관련정보를 추출하는 정보추출부; 및
    상기 사용자의 대화로부터 사용자의 성향을 모델링하는 사용자모델링부를 더 포함하는 것을 특징으로 하는 음성대화 인터페이스를 이용한 정보제공장치.
  7. 제 1항에 있어서,
    상기 의미구조로부터 추출한 사용자의 화행 또는 의도정보, 시스템의 화행 또는 의도를 저장하는 지식데이터베이스부를 더 포함하는 것을 특징으로 하는 음성대화 인터페이스를 이용한 정보제공장치.
  8. 제 1항에 있어서, 상기 문장생성부는
    상기 시스템의 화행 또는 의도를 입력으로 받아 문장구문구조를 생성하는 구문생성부; 및
    상기 문장구문구조를 입력으로 받아 형태소를 생성하는 형태소생성부를 포함하는 것을 특징으로 하는 음성대화 인터페이스를 이용한 정보제공장치.
  9. (a) 음성신호를 문장으로 변환하는 단계;
    (b) 상기 문장을 의미구조로 분석하는 단계;
    (c) 상기 분석된 의미구조로부터 화행 또는 의도정보를 추출하고, 시스템의 화행 또는 의도정보를 생성하는 단계;
    (d) 상기 시스템의 화행 또는 의도정보로부터 상기 음성신호에 대한 응답을 위한 문장을 생성하는 단계; 및
    (e) 상기 생성한 문장을 음성으로 합성하는 단계를 포함하는 것을 특징으로 하는 음성대화 인터페이스를 이용한 정보제공방법
  10. 제 9항에 있어서, 상기 (b)단계는
    (b1) 상기 입력된 문장을 형태소들로 분리하고 분리된 형태소들을 태깅하는 단계; 및
    (b2) 상기 형태소간에 의존관계를 분석하여 문장구성성분을 분석하는 단계를 포함하는 것을 특징으로 하는 음성대화 인터페이스를 이용한 정보제공방법.
  11. 제 9항에 있어서, 상기 (c)단계는
    (c1) 상기 의미구조에 대해 화행과 의도를 결정하는 단계;
    (c2) 상기 화행 또는 의도정보로부터 대화예문 데이터베이스를 검색하는 단계;
    (c3) 상기 검색된 대화예문들에 대해 사용자의 화행 또는 의도와 성향정보를이용하여 유사도를 계산하는 단계;
    (c4) 상기 유사도 정보를 이용하여 가장 유사한 대화예문을 선정하여 시스템이 응답할 화행 또는 의도를 결정하는 단계;
    (c5) 응답 내용을 위한 쿼리정보를 작성하는 단계;
    (c6) 상기 쿼리정보를 통해 얻어진 검색결과를 입력받아 시스템의 화행 또는 의도를 완성하는 단계를 포함하는 것을 특징으로 하는 음성대화 인터페이스를 이용한 정보제공방법.
  12. 제 9항에 있어서, 상기 (b)단계는
    상기 음성신호에서 변환된 문장에 대해 의미구조로 변환하는 단계를 더 포함하는 것을 특징으로 하는 음성대화 인터페이스를 이용한 정보제공방법.
  13. 제 8항에 있어서, 상기 (c)단계는
    상기 의미구조로부터 추출한 화행 또는 의도정보를 저장하는 단계를 더 포함하는 것을 특징으로 하는 음성대화 인터페이스를 이용한 정보제공방법.
  14. 제 9항에 있어서, 상기 (d)단계는
    (d1) 상기 화행 또는 의도에 따라서 문장의 구문구조를 생성하는 단계; 및
    (d2) 응답을 위한 형태소를 생성하는 단계를 포함하는 것을 특징으로 하는 음성대화 인터페이스를 이용한 정보제공방법.
  15. 제 9항 내지 제 14항 중 어느 한 항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
KR10-2002-0017413A 2002-03-29 2002-03-29 음성대화 인터페이스를 이용한 정보제공장치 및 그 방법 KR100446627B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR10-2002-0017413A KR100446627B1 (ko) 2002-03-29 2002-03-29 음성대화 인터페이스를 이용한 정보제공장치 및 그 방법
DE60317130T DE60317130T2 (de) 2002-03-29 2003-03-28 Vorrichtung und Verfahren zur Bereitstellung von Informationen mittels einer Sprachdialogschnittstelle
EP03251975A EP1349145B1 (en) 2002-03-29 2003-03-28 System and method for providing information using spoken dialogue interface
JP2003093220A JP2004005530A (ja) 2002-03-29 2003-03-31 音声対話インターフェースを利用した情報提供装置及びその方法
US10/401,695 US7225128B2 (en) 2002-03-29 2003-03-31 System and method for providing information using spoken dialogue interface

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2002-0017413A KR100446627B1 (ko) 2002-03-29 2002-03-29 음성대화 인터페이스를 이용한 정보제공장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR20030078388A true KR20030078388A (ko) 2003-10-08
KR100446627B1 KR100446627B1 (ko) 2004-09-04

Family

ID=27800696

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2002-0017413A KR100446627B1 (ko) 2002-03-29 2002-03-29 음성대화 인터페이스를 이용한 정보제공장치 및 그 방법

Country Status (5)

Country Link
US (1) US7225128B2 (ko)
EP (1) EP1349145B1 (ko)
JP (1) JP2004005530A (ko)
KR (1) KR100446627B1 (ko)
DE (1) DE60317130T2 (ko)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100690151B1 (ko) * 2004-10-01 2007-03-08 (주)다음소프트 대화형 에이전트를 이용한 서비스 방법 및 시스템
KR100764174B1 (ko) * 2006-03-03 2007-10-08 삼성전자주식회사 음성 대화 서비스 장치 및 방법
KR100806287B1 (ko) * 2006-08-01 2008-02-22 한국전자통신연구원 문말 억양 예측 방법 및 이를 기반으로 하는 음성합성 방법및 시스템
KR100807307B1 (ko) * 2006-07-10 2008-02-28 한국전자통신연구원 대화형 음성 인터페이스 시스템 및 그 응답 방법
KR100810500B1 (ko) * 2005-12-08 2008-03-07 한국전자통신연구원 대화형 음성 인터페이스 시스템에서의 사용자 편의성증대 방법
KR100814641B1 (ko) * 2006-10-23 2008-03-18 성균관대학교산학협력단 사용자 주도형 음성 서비스 시스템 및 그 서비스 방법
KR100908445B1 (ko) * 2006-09-04 2009-07-21 한국전자통신연구원 응답 문장 생성 장치 및 방법
KR101122844B1 (ko) * 2004-03-01 2012-06-12 마이크로소프트 코포레이션 데이터의 의도를 판정하고 의도에 기초하여 데이터에 응답하는 시스템 및 방법
KR101322486B1 (ko) * 2007-06-28 2013-10-25 주식회사 케이티 범용 대화서비스 장치 및 그 방법
US10510342B2 (en) 2015-09-16 2019-12-17 Samsung Electronics Co., Ltd. Voice recognition server and control method thereof
WO2022131805A1 (ko) * 2020-12-16 2022-06-23 삼성전자 주식회사 음성 입력의 응답 제공 방법 및 이를 지원하는 전자 장치

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3962763B2 (ja) * 2004-04-12 2007-08-22 松下電器産業株式会社 対話支援装置
KR100669241B1 (ko) * 2004-12-15 2007-01-15 한국전자통신연구원 화행 정보를 이용한 대화체 음성합성 시스템 및 방법
US20060141426A1 (en) * 2004-12-23 2006-06-29 Inventec Corporation Virtual scene interactive language learning system and method
US8751240B2 (en) * 2005-05-13 2014-06-10 At&T Intellectual Property Ii, L.P. Apparatus and method for forming search engine queries based on spoken utterances
JP2007328283A (ja) * 2006-06-09 2007-12-20 Kenwood Corp 対話装置、プログラム、及び対話方法
US8117022B2 (en) * 2006-12-07 2012-02-14 Linker Sheldon O Method and system for machine understanding, knowledge, and conversation
US8874443B2 (en) * 2008-08-27 2014-10-28 Robert Bosch Gmbh System and method for generating natural language phrases from user utterances in dialog systems
KR101253104B1 (ko) * 2009-09-01 2013-04-10 한국전자통신연구원 패턴 데이터베이스화 장치 및 그 방법, 이를 이용한 음성 이해 장치 및 그 방법
KR20110072847A (ko) * 2009-12-23 2011-06-29 삼성전자주식회사 열려진 사용자 의도 처리를 위한 대화관리 시스템 및 방법
KR101212795B1 (ko) 2009-12-28 2012-12-14 주식회사 케이티 다중 목적 영역의 통계적 대화 정책 추론 방법
US9634855B2 (en) 2010-05-13 2017-04-25 Alexander Poltorak Electronic personal interactive device that determines topics of interest using a conversational agent
CN103458126A (zh) * 2013-09-10 2013-12-18 深圳市明日空间信息技术有限公司 通话设备信息智能搜索的方法及装置
US10333995B2 (en) 2014-01-23 2019-06-25 International Business Machines Corporation Providing of recommendations determined from a collaboration session system and method
SG11201702029PA (en) 2014-09-14 2017-04-27 Speaktoit Inc Platform for creating customizable dialog system engines
US10460034B2 (en) * 2015-01-28 2019-10-29 Mitsubishi Electric Corporation Intention inference system and intention inference method
KR101777392B1 (ko) 2016-07-04 2017-09-11 주식회사 케이티 중앙 서버 및 이에 의한 사용자 음성 처리 방법
US10726836B2 (en) 2016-08-12 2020-07-28 Kt Corporation Providing audio and video feedback with character based on voice command
CN106486121B (zh) * 2016-10-28 2020-01-14 北京光年无限科技有限公司 应用于智能机器人的语音优化方法及装置
KR101889280B1 (ko) * 2017-01-16 2018-08-21 주식회사 케이티 음성 명령에 기반하여 서비스를 제공하는 서버 및 단말
KR101889279B1 (ko) 2017-01-16 2018-08-21 주식회사 케이티 음성 명령에 기반하여 서비스를 제공하는 시스템 및 방법
US10395658B2 (en) * 2017-05-22 2019-08-27 International Business Machines Corporation Pre-processing partial inputs for accelerating automatic dialog response
KR20190061706A (ko) * 2017-11-28 2019-06-05 현대자동차주식회사 복수의도를 포함하는 명령어를 분석하는 음성 인식 시스템 및 방법
CN108231061A (zh) * 2017-12-29 2018-06-29 江苏名通信息科技有限公司 一种基于文本解析和语音合成的网络人机交互方法
CN109033265B (zh) * 2018-07-09 2020-10-16 苏州浪潮智能软件有限公司 一种人机交互方法及装置
CN113643696B (zh) * 2021-08-10 2024-06-21 阿波罗智联(北京)科技有限公司 语音处理方法、装置、设备、存储介质及程序

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0769709B2 (ja) * 1993-01-08 1995-07-31 株式会社エイ・ティ・アール自動翻訳電話研究所 対話音声認識装置
CA2119397C (en) * 1993-03-19 2007-10-02 Kim E.A. Silverman Improved automated voice synthesis employing enhanced prosodic treatment of text, spelling of text and rate of annunciation
JP3397372B2 (ja) * 1993-06-16 2003-04-14 キヤノン株式会社 音声認識方法及び装置
US5615296A (en) * 1993-11-12 1997-03-25 International Business Machines Corporation Continuous speech recognition and voice response system and method to enable conversational dialogues with microprocessors
US5577164A (en) * 1994-01-28 1996-11-19 Canon Kabushiki Kaisha Incorrect voice command recognition prevention and recovery processing method and apparatus
JPH07219590A (ja) * 1994-01-31 1995-08-18 Canon Inc 音声情報検索装置及び方法
JPH07239694A (ja) * 1994-03-02 1995-09-12 Oki Electric Ind Co Ltd 音声対話装置
JP3377290B2 (ja) * 1994-04-27 2003-02-17 シャープ株式会社 イディオム処理機能を持つ機械翻訳装置
JP3350293B2 (ja) * 1994-08-09 2002-11-25 株式会社東芝 対話処理装置及び対話処理方法
US5682539A (en) * 1994-09-29 1997-10-28 Conrad; Donovan Anticipated meaning natural language interface
JPH11237971A (ja) * 1998-02-23 1999-08-31 Nippon Telegr & Teleph Corp <Ntt> 音声応答装置
EP1044416A1 (en) * 1998-10-09 2000-10-18 Scansoft, Inc. Automatic inquiry method and system
KR100277690B1 (ko) * 1998-12-01 2001-01-15 정선종 화행 정보를 이용한 음성 인식 방법
US6442524B1 (en) * 1999-01-29 2002-08-27 Sony Corporation Analyzing inflectional morphology in a spoken language translation system
US6282507B1 (en) * 1999-01-29 2001-08-28 Sony Corporation Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US20020032564A1 (en) * 2000-04-19 2002-03-14 Farzad Ehsani Phrase-based dialogue modeling with particular application to creating a recognition grammar for a voice-controlled user interface
US6601026B2 (en) * 1999-09-17 2003-07-29 Discern Communications, Inc. Information retrieval by natural language querying
JP2001188784A (ja) * 1999-12-28 2001-07-10 Sony Corp 会話処理装置および方法、並びに記録媒体
JP2001188783A (ja) * 1999-12-28 2001-07-10 Sony Corp 情報処理装置および方法、並びに記録媒体
JP2001290493A (ja) * 2000-04-06 2001-10-19 Asahi Kasei Corp 自動対話方法
TW472232B (en) * 2000-08-11 2002-01-11 Ind Tech Res Inst Probability-base fault-tolerance natural language understanding method

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101122844B1 (ko) * 2004-03-01 2012-06-12 마이크로소프트 코포레이션 데이터의 의도를 판정하고 의도에 기초하여 데이터에 응답하는 시스템 및 방법
KR100690151B1 (ko) * 2004-10-01 2007-03-08 (주)다음소프트 대화형 에이전트를 이용한 서비스 방법 및 시스템
KR100810500B1 (ko) * 2005-12-08 2008-03-07 한국전자통신연구원 대화형 음성 인터페이스 시스템에서의 사용자 편의성증대 방법
KR100764174B1 (ko) * 2006-03-03 2007-10-08 삼성전자주식회사 음성 대화 서비스 장치 및 방법
KR100807307B1 (ko) * 2006-07-10 2008-02-28 한국전자통신연구원 대화형 음성 인터페이스 시스템 및 그 응답 방법
KR100806287B1 (ko) * 2006-08-01 2008-02-22 한국전자통신연구원 문말 억양 예측 방법 및 이를 기반으로 하는 음성합성 방법및 시스템
KR100908445B1 (ko) * 2006-09-04 2009-07-21 한국전자통신연구원 응답 문장 생성 장치 및 방법
KR100814641B1 (ko) * 2006-10-23 2008-03-18 성균관대학교산학협력단 사용자 주도형 음성 서비스 시스템 및 그 서비스 방법
KR101322486B1 (ko) * 2007-06-28 2013-10-25 주식회사 케이티 범용 대화서비스 장치 및 그 방법
US10510342B2 (en) 2015-09-16 2019-12-17 Samsung Electronics Co., Ltd. Voice recognition server and control method thereof
WO2022131805A1 (ko) * 2020-12-16 2022-06-23 삼성전자 주식회사 음성 입력의 응답 제공 방법 및 이를 지원하는 전자 장치

Also Published As

Publication number Publication date
EP1349145A2 (en) 2003-10-01
DE60317130D1 (de) 2007-12-13
US20030220799A1 (en) 2003-11-27
KR100446627B1 (ko) 2004-09-04
EP1349145A3 (en) 2005-03-09
EP1349145B1 (en) 2007-10-31
US7225128B2 (en) 2007-05-29
JP2004005530A (ja) 2004-01-08
DE60317130T2 (de) 2008-07-31

Similar Documents

Publication Publication Date Title
KR100446627B1 (ko) 음성대화 인터페이스를 이용한 정보제공장치 및 그 방법
CN111933129B (zh) 音频处理方法、语言模型的训练方法、装置及计算机设备
KR100772660B1 (ko) 대화 관리 장치 및 그를 위한 대화 예제 기반의 대화모델링기법을 통한 대화 관리 방법
US10304444B2 (en) Fine-grained natural language understanding
US6961705B2 (en) Information processing apparatus, information processing method, and storage medium
CA2437620C (en) Hierarchichal language models
JP5142720B2 (ja) デバイスの認知的に過負荷なユーザのインタラクティブ会話型対話
US11016968B1 (en) Mutation architecture for contextual data aggregator
Ostendorf et al. Human language technology: Opportunities and challenges
KR20010108413A (ko) 상보적인 언어 모델들을 이용한 인식 엔진들
JP5753769B2 (ja) 音声データ検索システムおよびそのためのプログラム
Moyal et al. Phonetic search methods for large speech databases
KR20060100646A (ko) 영상물의 특정 위치를 검색하는 방법 및 영상 검색 시스템
US20190088258A1 (en) Voice recognition device, voice recognition method, and computer program product
JP4653598B2 (ja) 構文・意味解析装置、音声認識装置、及び構文・意味解析プログラム
WO2020121638A1 (ja) 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム
JP2004347732A (ja) 言語自動識別方法及び装置
CN113066473A (zh) 一种语音合成方法、装置、存储介质及电子设备
JP2003099089A (ja) 音声認識・合成装置および方法
JP2003162524A (ja) 言語処理装置
Khan et al. Robust Feature Extraction Techniques in Speech Recognition: A Comparative Analysis
CN112017647B (zh) 一种结合语义的语音识别方法、装置和***
US11468897B2 (en) Systems and methods related to automated transcription of voice communications
Cerisara Automatic discovery of topics and acoustic morphemes from speech
JPWO2002067244A1 (ja) 音声対話のための音声認識方法、音声認識システム及び音声認識プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120730

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20130730

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20140730

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20150730

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20160728

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20170728

Year of fee payment: 14