KR20030012877A - 음성 대화 시스템의 화자 확인 - Google Patents

음성 대화 시스템의 화자 확인 Download PDF

Info

Publication number
KR20030012877A
KR20030012877A KR1020027016825A KR20027016825A KR20030012877A KR 20030012877 A KR20030012877 A KR 20030012877A KR 1020027016825 A KR1020027016825 A KR 1020027016825A KR 20027016825 A KR20027016825 A KR 20027016825A KR 20030012877 A KR20030012877 A KR 20030012877A
Authority
KR
South Korea
Prior art keywords
user
computer
target device
communication
information
Prior art date
Application number
KR1020027016825A
Other languages
English (en)
Inventor
마르틴 홀리
카린 휴베르
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20030012877A publication Critical patent/KR20030012877A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • G07C9/30Individual registration on entry or exit not involving the use of a pass
    • G07C9/32Individual registration on entry or exit not involving the use of a pass in combination with an identity check
    • G07C9/33Individual registration on entry or exit not involving the use of a pass in combination with an identity check by means of a password
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • G07C9/30Individual registration on entry or exit not involving the use of a pass
    • G07C9/32Individual registration on entry or exit not involving the use of a pass in combination with an identity check
    • G07C9/37Individual registration on entry or exit not involving the use of a pass in combination with an identity check using biometric data, e.g. fingerprints, iris scans or voice recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Computational Linguistics (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 목표 디바이스가 유저와 목표 디바이스 사이의 통신을 지원하기 위해 정보를 편집하기 위한 컴퓨터와 유저와 목표 디바이스 사이의 대화를 지원하는 방법에 관한 것이며, 또한 본 방법에 따른 단계가 실시될 수 있는 수단인 컴퓨터 프로그램 제품에 관한 것이다. 유저와 목표 디바이스와 단지 인터넷 상의 컴퓨터로 제한되지 않는 넓은 응용 사이의 간단한 대화가 달성될 수 있는, 이러한 방법 및 컴퓨터를 제공하기 위해서, 유저는 식별되며 목표 디바이스에 대한 정보를 편집할 때 이용되는 유저-지정 데이터는 데이터베이스에 저장되는 것이 의도된다(envisaged). 목표 디바이스(2)가 유저와 목표 디바이스(2) 사이의 통신을 지원하기 위한 정보를 편집하기 위한 컴퓨터(4)는, 유저와 목표 디바이스(2) 사이의 통신을 위한 통신 수단(1), 컴퓨터(4)와 목표 디바이스(2) 사이의 인터페이스(5) 및 컴퓨터(4)와 통신 수단(1) 사이의 링크를 구비하며, 데이터베이스(6)는 유저의 식별을 위한 식별 수단(7)뿐만 아니라 유저-지정 데이터의 저장을 위한 컴퓨터(4)에 링크되어 있다.

Description

음성 대화 시스템의 화자 확인{SPEAKER VERIFICATION IN A SPOKEN DIALOGUE SYSTEM}
전자 무역의 중요성은 세계적인 데이터 네트워크, 특히 인터넷 또는 유사한 통신 매체 때문에 엄청난 속도로 증가하고 있다. 용어 e-상업(e-commerce)에 의해알려진, 현대 전자 무역은 소비자의 행태(behavior)를 점점 변화시키고 있다. 소비자는 더 이상 비즈니스 또는 서비스 회사로부터 인편으로(in person) 상품을 구입하거나 서비스를 받을 필요가 없기 때문에, 판매되는(on offer) 상품 및 서비스의 수는 상당히 증가될 수 있다. 컴퓨터 단말기 상에서 버튼을 누름으로서, 전세계로부터의 가장 다채로운 제품 또는 서비스의 공급자(supplier)가 고객에게 도달될 수 있다. 그러나, 이런 풍부한 제공 때문에, 예컨대 인터넷 상에서 올바른 주소를 찾는데 또한 어려움이 있다.
그러나, 가전 제품 또는 산업 설비의 동작과 같은, 일상 생활의 다른 영역에서도, 현대 생활의 속도에 의해 더 증폭되는 문제는 기술에서의 급격한 변화 때문에 항상 일어난다. 더 나아가, 이동 무선 네트워크와 같은 현대 통신 매체 또는 인터넷과 같은 데이터 네트워크는 이동 전화와 같은 간단한 통신 수단을 이용하여 사실상 어느 곳으로부터이든 이러한 디바이스를 동작시키는 가능성을 열어 놓았다.
그래서, 유저와 목표 디바이스사이의 대화를 지원하기 위한 방법 또는 디바이스에 대한 필요성이 더 커졌다.
문제가 되는 유형의 방법이, 예컨대 특허 제 WO 00/63837 A1 호에 설명되어 있는데, 여기서 유저-지정 데이터는 인터넷 상의 웹사이트를 더 효율적으로 검색하기 위해 평가된다. 음성 처리기(speech processor)에 의해 동작이 간략화된다. 신경 네트워크(neural network)는 적응성 시스템을 제공한다.
특허 제 WO 00/51050 A1 호는 전자 무역에서 인터넷상의 올바른 주소 발견을 지원하는 방법을 설명한다. 여기서 해당 홈페이지가 검색될 때, 유저 또는 고객의개인적 필요성이 고려된다. 이는, 의복의 사이즈, 음악, 스포츠, 엔터테인먼트, 영화나 책에 관한 특정 취향 또는 생일과 같은 유저에 관한 정보의 저장뿐만 아니라 각 제품에 대한 적어도 하나의 선호 기준과 함께 데이터베이스에 다수의 제품을 저장함으로서 일어난다. 이 시스템은 유저 프로파일에 따라서 생성되는 특정 제품 등에 대한 추천을 제공한다.
미국 특허 제 US 5 970 469 호는 구매자의 과거 구매 행태가 처리과정에서 이용될 수 있는 인터넷 판매를 지원하는 방법을 설명한다. 이 시스템을 통해 구매자에 관한 정보는 다른 데이터 및 고객에게 이루어진 해당 제안과 결합된다.
알려진 방법은, 인터넷과의 통신이 단지 불충분하게 지원되거나 가전 제품등과 같은 다른 목표 디바이스와의 대화가 전혀 지원되지 않는 단점을 가지는 것으로 입증되었다. 더 나아가, 입력이 단순화되는 방식으로, 예컨대 전자 판매 절차가 지원될 수 있고, 또한 예컨대 이동 전화 또는 팜-탑 컴퓨터(palm-top computer)와 같은 다른 핸드-헬드 디바이스를 이용해서, 주문이 신속하며 간단한 방식으로 인터넷상에 위치될 수 있는 방법은 존재하지 않는다.
본 발명은 유저와 목표 디바이스(target device) 사이의 대화를 지원하기 위한 방법에 관한 것이다. 목표 디바이스는, 예컨대 유저 또는 고객이 특정 제품이나 특정 서비스를 획득할 수 있는 통로가 되는 인터넷상의 제공자(provider)의 컴퓨터를 의미하는 것으로 이해된다. 용어 목표 디바이스는 또한, 활성화하거나 제어하기 위해서 유저로부터의 입력을 요구하는, 비디오 레코더, 주방 가전(kitchen appliance) 또는 가열 시스템과 같은 가전 제품을 커버한다. 개인의 섹터에 있는 이러한 디바이스들 외에도, 산업 설비 또한 용어 목표 디바이스 하에 포함될 수 있다.
본 발명은, 또한 목표 디바이스가 유저와 목표 디바이스사이의 통신을 지원하기 위한 정보를 편집하기 위한 컴퓨터에 관한 것이다.
본 발명은, 또한 디지털 컴퓨터의 내부 메모리 안으로 직접 로딩될 수 있으며 소프트웨어 코드의 섹션을 포함하는 컴퓨터 프로그램 제품에 관한 것이다.
도 1은 유저와 인터넷상의 컴퓨터 사이의 대화 동안 본 발명에 따른 방법을 실시하기 위한 성분을 개략적인 방법으로 도시하는 도면.
도 2는 유저와 가전 제품 사이의 대화를 지원하기 위해 본 발명에 따른 방법을 실시하기 위한 성분을 도시하는 도면.
도 3은 본 발명에 따른 방법의 기능적 시퀀스를 예시하기 위한 흐름도를 도시하는 도면.
따라서, 본 발명의 목적은 유저와 목표 디바이스 사이의 통신을 목표 디바이스가 지원하기 위한 정보를 편집하기 위한 컴퓨터뿐만 아니라 목표 디바이스와 유저 사이의 대화를 지원하는 방법을 제공하는 것인데, 이를 통해서, 유저와 목표 디바이스 및 인터넷상의 컴퓨터에만 제한되지 않는 확장 응용 사이의 더 간단한 대화가 달성될 수 있다. 특히, 이 방법 및 컴퓨터는 적응성이어야(adaptive) 하며, 이는 유저와 목표 디바이스 사이의 대화를 순환시키기(recurring) 위해서 방법의 해당 단계 또는 시간상의 전제 조건(precondition over time)을 학습할(learn) 수 있고 필요한만큼 이들을 적용할 수 있어서, 그 결과 유저와 목표 디바이스 사이의 대화를 수행하기 위해 필요한 단계가 단순화된다는 것을 의미한다.
본 방법의 관점에서 이 목적을 달성하기 위해서, 유저는 식별될 것이며 데이터베이스에 저장된 유저-지정 데이터는 목표 디바이스에 대한 정보가 편집될 때 호출될(called up) 것이라는 것을 규정한다. 유저가 처음으로 시스템을 액세스할 때, 후자는 이를 검출하고 데이터베이스에 특정 유저-지정 데이터를 저장한다. 이렇게 저장된 데이터는, 유저와 목표 디바이스 사이의 대화동안 정상적으로 발생하는 것일 수 있거나, 또한 이름 또는 주소와 같은 특정 유저-지정 데이터가 유저에 대해 설정되어 데이터베이스에 저장될 수 있다. 인터넷 상의 컴퓨터 상에서 주문 양식(order form)을 완성하는데 필요한 정보와 같은, 목표 디바이스에 대해 필요한 정보가 편집될 때, 데이터베이스에 저장된 유저-지정 데이터가 이용된다. 임의의 분실된 데이터(missing data)가 유저와의 대화를 통해 설정되어 데이터베이스에 저장되고 또한 목표 디바이스에 전달된다.
유리하게, 유저는 그의 음성 입력에 의해 식별된다. 이는, 유저로부터의 수동 입력을 필요로 하지 않는데, 이것은 특히 이동 전화와 같은, 작은 동작 디바이스를 통해서 상당한 단순화를 나타낸다. 이와 같이 키를 귀찮게 이용하여(laborious use) 식별 목적을 위해 특정 패스워드 등을 입력할 필요가 없다. 음성 분석을 위해 요구되는 디바이스는, 예컨대 유저의 실제 통신 수단에 제공될 수 있거나 목표 디바이스에 대한 정보를 편집하기 위한 컴퓨터에 제공될 수 있다. 유저의 식별은 임의의 음성 입력 분석 또는 코드 워드 등과 같은 지정된 음성 입력 분석에 의해 일어날 수 있다.
음성 입력에 의한 식별에 대해 대안적으로 또는 추가적으로, 이동 전화를 통한 유저와 목표 디바이스 사이의 통신의 경우에, 전자는(former) 그의 이동 전화 번호에 의해 자동적으로 또한 식별될 수 있다. GSM(Global System for Mobile Communication) 이동 전화 네트워크에서, 이러한 기능은, 착신 가입자(called subscriber)에서 발신 가입자(calling subscriber)의 번호를 디스플레이하게 하는, 표준으로서 구현된다. 그러므로, 이 기능을 통해서, 유저의 추가적인 또는 대안적인 식별이, 이동 전화가 이용될 때 발생할 수 있다.
더 나아가 또는 진술된 가능성에 대안으로서, 패스워드, 식별자, PIN 코드 등과 같은 것을 입력함으로서 또한 일어날 수 있다. 이를 위해서, 유저의 신용 카드 번호, 사회보장 번호(social security number) 또는 다른 명확한 식별자가 이용될 수 있다.
응용에 따라, 유저와 목표 디바이스 사이의 대화가 암호화되는 점이 유리할 수 있다. 이 목적을 위해서, 정상적인 암호화 및 암호해독 방법이 이용될 수 있다.
목표 디바이스에 의해 요구되는 정보가 데이터베이스에서 모두 이용가능하지 않는 경우에, 이 정보는 유저와의 대화를 통해서 설정된다는 것이다. 이를 위해서, 통신이 예컨대 컴퓨터에 의해 설정되며, 유저에게는, 유저가 이동 전화와 같은 그의 통신 수단에 의해 바람직하게는 음성 입력으로 대답하는 해당 질문이 질의된다.이용되는 통신 수단에 따라, 키 등과 같은 수동 입력이 또한 일어날 수 있다.
바람직하게 유저-지정 데이터가 정기적으로 업데이트되고 확장되며, 한편 유저로부터의 확인이 올바르지 못한 엔트리(entry)를 피하거나 적어도 줄이기 위해서 임의의 업데이트 이전에 요구된다.
목표 디바이스와 유저 사이의 통신을 단순화하기 위해서, 목표 디바이스로부터 유저에게로 음향상의 형식으로(in acoustic form) 정보를 반환하는 합성 음성 출력이 제공될 수 있다. 이 가능성은 이동 전화가 유저와 목표 디바이스 사이의 통신 수단으로서 이용될 때 특히 유리하다.
목표 디바이스로 유저에 의해 전송된 정보가 유저 관련요소로서 제한된다면, 가능한 거래(transaction)의 제한이 달성될 수 있는데, 이는, 예컨대 본 발명에 따른 방법이 아이들에 의해서, 또한 다른 영역에서 이용될 때 바람직하다(advisable).
본 발명에 따른 목적을 달성하기 위해서, 컴퓨터는 목표 디바이스가 유저와 목표 디바이스 사이의 통신을 지원하기 위한 정보를 편집하기 위해 이용되며, 이 컴퓨터는 유저와 목표 디바이스 사이의 통신을 위한 통신 수단, 컴퓨터와 목표 디바이스 사이의 인터페이스 및 컴퓨터와 통신 수단 사이의 링크를 포함하며, 데이터베이스는 유저-지정 데이터의 저장을 위한 컴퓨터 및 유저의 식별을 위한 식별 수단에 링크되어 있다. 예컨대 컴퓨터와 목표 디바이스 사이의 인터페이스는 인터넷과 같은 데이터 네트워크로의 각각의 링크일 수 있거나 비디오 레코더, 가열 시스템 또는 주방 가전과 같은 디바이스로의 표준화된 또는 개별적으로 디자인된 링크일 수도 있다. 유저와 목표 디바이스 사이의 통신 또는 대화, 각각은 컴퓨터에 의해 그리고 데이터베이스의 규칙적인 질문(regular querying)을 통해서 중단될(interrupted) 수 있으며 유저와 목표 디바이스 사이의 대화는, 존재하며 목표 디바이스가 필요로 하는 그 데이터로 지원되며, 데이터베이스로부터 취해지므로 통신 수단을 통해서 유저에 의해 입력될 필요가 없다. 더 나아가 본 발명의 방법은, 유저-지정 데이터가 데이터베이스에서 정기적으로 업데이트되며 확장되어서 그 결과 유저의 데이터 파일이 연속적으로 업데이트되며 확장된다는 점에서, 적응성 시스템으로서 구성된다. 이름, 주소, 생일 또한 특정 선호도와 같은 유저-지정 데이터가 목표 유닛과의 대화를 지원하기 위해 호출될 수 있다.
식별 수단은 바람직하게는 음성 인식 유닛의 형태로 된다. 유저에 의한 적절한 음성 입력으로, 이는 데이터베이스의 해당 유저-지정 데이터에 즉시 할당되며 이로 인해 목표 유닛과의 추가 대화가 지원된다.
본 발명의 다른 특성에 따라서, 유저와 컴퓨터 사이의 통신 및/또는 컴퓨터와 목표 디바이스 사이의 통신을 암호화하기 위한 암호화 수단 및 암호해독하기 위한 암호해독 수단이 제공된다. 이러한 암호화는 개인 데이터를 보호하는데 중요하며 그러므로 유저의 프라이버시를 보호한다. 특히 금용 거래(financial transaction)에 대해서, 이러한 암호화는 또한 다른 사람에 의한 악용에 대한 보호책이다.
음성 인식에 대한 음향상의 기준(acoustic reference) 및/또는 유저의 구매 행태 등에 관한 정보가 데이터베이스에 제공되면, 대화 및 유저의 식별에 대한 해당 지원이 더 향상된다.
더 나아가, 통신 수단의 인식을 위한 인식 디바이스가 또한 제공될 수 있다. 예컨대, 통신 수단으로서 이동 전화를 이용하는 경우에, 이러한 인식 디바이스는 항상 통화를 수행하는 이동 전화 번호에 의해서 달성될 수 있다.
본 발명의 다른 특성에 따라서, 컴퓨터와 목표 디바이스 사이의 인터페이스는 데이터 네트워크, 특히 인터넷에 의해 형성된다.
각 응용 필드에서, 통신 수단은 컴퓨터와 통합될 수 있다. 예컨대, 가정용 컴퓨터는 통신 수단으로서 그리고 목표 디바이스에 대한 정보를 편집하기 위한 컴퓨터로서 역할을 할 수 있다.
이것은 또한 컴퓨터와 통합될 수 있는 유저-지정 데이터에 대한 데이터베이스에 적용된다.
유저를 향한 정보의 음향 출력에 대해서, 음성 합성 디바이스가 제공될 수 있다. 음향 출력을 통해서, 유저와 목표 디바이스 사이의 대화가, 디스플레이 등의 판독이 불필요함으로, 더 향상된다.
유저에 의해 목표 디바이스로 전송된 정보의 유저-지정 제한에 대해서, 해당 디바이스 또는 데이터베이스의 엔트리가 제공될 수 있다. 이런 식으로, 예로서, 부모의 제어(parental control) 또는 다른 액세스 제한이 생성될 수 있다.
통신 수단은, 목표 디바이스가 사실상 어느 곳으로부터이든지 도달될 수 있는 수단인, 이동 전화의 형태일 수 있다.
본 발명에 따른 목적을 달성하기 위해서, 디지털 컴퓨터의 내부 메모리로 직접적으로 로딩될 수 있으며 소프트웨어 코드의 섹션을 포함하는 컴퓨터 프로그램 제품이 이용되는데, 여기서 컴퓨터는 이 제품이 컴퓨터 상에서 동작하고 있는 중이라면 위에서 설명되는 방법의 단계를 처리하기 위해 이용된다.
이 목적을 위해서, 컴퓨터 프로그램 제품은 바람직하게는 컴퓨터에 의해 판독될 수 있는 매체 상에 저장된다.
본 발명은 실시예의 바람직한 예를 이용하여서 그리고 도면을 참조하여 이후 설명된다.
도 1은 통신 수단(1)을 유저가 목표 디바이스(2)와의 대화를 설정하는 수단인, 이동 전화의 형태로 도시하며, 본 경우에서 상기 목표 디바이스(2)는 데이터네트워크, 특히 인터넷(3)에 연결된 컴퓨터를 포함한다. 통신 수단(1)으로서 이동 전화를 이용하는 대신에, 개인용 컴퓨터, 팜-탑 컴퓨터 등이 제공될 수 있다. 컴퓨터 형태의 목표 디바이스(2)는 예컨대 인터넷(3)상의 특정 제품의 제공자의 서버일 수있다. 본 발명에 따라서, 목표 디바이스(2)를 위한 유저와 목표 디바이스(2) 사이의 통신을 지원하기 위한 정보를 편집하는 역할을 하는 컴퓨터(4)가 제공된다.
컴퓨터(4)는, 예컨대 모뎀 링크에 의한 인터넷(3)으로의 해당 링크를 포함할 수 있는 목표 디바이스(2)와의 인터페이스(5)를 가진다. 인터페이스(5)은 또한 컴퓨터(4)의 표준 인터페이스로 이루어질 수 있다. 마찬가지로, 컴퓨터(4) 및, 예로서 해당 이동 무선 네트워크와 컴퓨터(4)상의 (미도시된) 해당 수신기를 포함할 수 있는 통신 수단(1) 사이의 링크가 존재한다.
본 발명에 따라서, 바람직하게는 컴퓨터(4)와 통합되는, 데이터베이스(6)가 유저-지정 데이터의 저장을 위해 또한 제공된다. 응용에 따라서, 통신 수단(1), 컴퓨터(4) 및 데이터베이스(6)가 또한 단일 디바이스에 결합될 수 있다. 본 발명에 따라서, 유저와 목표 디바이스(2) 사이의 대화 동안, 유저-지정 데이터가 데이터베이스(6)에서 검색되며 이러한 데이터는 요구되는 바대로 목표 디바이스(2)에 대한 정보를 위해 이용된다. 유저로부터의 첫 통신의 경우에, 가장 중요한 유저-지정 데이터는, 통신 수단(1)을 통해 요구되어져서 유저에 의해 입력되어 컴퓨터(4)를 통해서 데이터베이스(6)에 저장된다. 식별 수단(7)은 유저를 식별하기 위해 이용되며, 예컨대 음성 인식 유닛을 포함할 수 있으며, 이를 통해서, 각 유저로의 자동적인 할당이 통신 수단(1)을 통한 유저의 해당 음성 입력을 통해서 일어난다. 식별은 패스워드, 식별자, PIN 코드 등의 엔트리까지 또한 확장될 수 있거나 통신 수단(1)으로서 이동 전화의 이동 전화 번호를 통해서 자동적으로 일어날 수 있다. 악용을 예방하며 데이터 보호를 보장하기 위해서, 이동 전화(1)와 컴퓨터(4) 사이의 통신및/또는 컴퓨터와 목표 디바이스(2) 사이의 통신이 해당 암호화 및 암호해독 디바이스(8,9)를 통해서 또한 일어날 수 있다. 바람직하게 이러한 암호화 및 암호해독 디바이스(8,9)는 당연히 컴퓨터(4) 또는 목표 디바이스(2)와 통합된다. 목표 디바이스(2) 또는 컴퓨터(4)로부터 유저 또는 통신 수단(1)으로 음향 형태로 전송된 데이터의 출력을 위해서, 음성 합성 디바이스(10)가 또한 제공될 수 있다.
도 2는, 예컨대 비디오 레코더와 같은 가정용 가전의 형태에서 유저와 목표 디바이스(2) 사이의 대화를 지원하는 본 발명에 따른 방법의 실현을 도시한다. 이 경우에, 유저의 통신 수단(1)은, 컴퓨터(4)의 기능을 또한 포함하는 개인용 컴퓨터에 의해 형성된다. 해당 인터페이스(5)를 통해서, 목표 디바이스 또는 비디오 레코더는 컴퓨터(4)에 연결된다. 유저의 해당 식별을 통해서, 예컨대 패스워드의 엔트리에 의해서, 데이터베이스(6)에 저장된 유저-지정 정보가 비디오 레코더를 프로그래밍하기 위해 이용되며 이로 인해 프로그래밍 처리를 지원한다. 이런 식으로 가족 구성원의 다른 행태가 비디오 레코더를 프로그래밍할 때 고려될 수 있으며 이용될 수 있다.
그러나, 본 발명에 따른 방법 또는 컴퓨터의 응용 또는 본 발명에 따른 컴퓨터 프로그램 제품은 설명된 두 개의 예에 제한되지 않는다. 오히려, 본 발명은 가장 다양한 분야에서 매우 넓은 범위의 응용을 허용한다. 예컨대, 유저와 가열 시스템 또는 주방 가전과의 대화가 지원될 수 있으며 단순화될 수 있다. 더 나아가, 본 발명에 따른 방법이, 예컨대 인터넷상에서 인증(authority)으로부터 양식의 완성을 지원하는 것을 생각할 수 있다.
도 3은 본 발명에 따른 방법의 가장 중요한 기능적 시퀀스의 흐름도를 도시한다. 본 발명에 따른 방법은 단계(101)에서 시작한다. 단계(102)에서 유저의 식별이 예컨대 음성 입력의 분석에 의해 발생한다. 단계(103)에서, 식별된 유저에 대한 데이터가 데이터베이스에 존재하는지에 관한 질문이 발생한다. 이것이 그런 경우라면, 시퀀스는 단계(105)로부터 계속된다. 유저가 새로운 유저라면, 따라서 어떠한 유저 데이터도 데이터베이스에 존재하지 않는다면, 단계(104)에 따라서 특정 유저 데이터가 유저로부터 요구되어 데이터베이스에 저장된다. 단계(105)에 따라, 목표 디바이스에게 원하는 데이터가 요구되어지며, 그 후에, 단계(106)에 따라, 이러한 데이터가 데이터베이스에 존재하는지 알기 위해서 검색이 이루어진다. 목표 디바이스에 의해 요구되는 데이터가 데이터베이스에 저장되어 있다면, 단계(107)에서 데이터베이스로부터 이러한 데이터가 호출되어 목표 디바이스로 전송된다. 원하는 데이터가 데이터베이스에 저장되어 있지 않은 경우에, 이 데이터는 단계(108)에서 유저로부터 설정되어 목표 디바이스로 전달되며, 단계(109)에 따라 데이터베이스에 저장된다. 절차는 단계(110)에 따라서 추가 데이터가 목표 디바이스에 대해 요구되어지는지에 관한 질문으로 계속되며 긍정인 경우 이는 단계(105)로 계속된다. 단계(110)와 단계(105) 사이의 이 루프는 필요한 만큼 자주 반복된다. 목표 디바이스에 대해 요구되는 모든 데이터가 존재하면, 절차는 단계(111)에 따라 종결된다.
컴퓨터에 의해 식별되는 유저는 음성 입력에 의해 매우 일반적인 질문 또는 구매 절차에서 질문을 또한 질의할 수 있다는 사실이 언급될 수 있다. 예컨대, 유저는 언제 목표 디바이스로부터 주문된 책이 배달될 것인지를 질문할 수 있다. 컴퓨터는 질문의 콘텐트를 인식하며 이를, 컴퓨터로 질문에 응답하는, 목표 디바이스에 의해 응답될 수 있는 질문으로 전환한다. 컴퓨터의 음성 합성 수단으로, 컴퓨터는 유저의 질문에 응답한다.
상술한 바와 같이, 본 발명은 유저와 목표 디바이스 사이의 대화를 지원하기 위한 방법에 이용가능하다.

Claims (23)

  1. 유저와 목표 디바이스(2) 사이의 대화를 지원하는 방법으로서, 상기 유저가 식별되며, 상기 목표 디바이스(2)에 대해 정보가 편집될 때 유저-지정 데이터(user-specific data)는 이용되는 데이터베이스(6)에 저장되는, 유저와 목표 디바이스 사이의 대화를 지원하는 방법.
  2. 제 1 항에 있어서, 상기 유저는 그의 음성 입력에 기초하여 식별되는, 유저와 목표 디바이스 사이의 대화를 지원하는 방법.
  3. 제 1 항에 있어서, 상기 유저는 이동 전화(1)를 통해서 상기 목표 디바이스(2)와 통신하며 상기 유저는 그의 이동 전화 번호에 기초하여 식별되는, 유저와 목표 디바이스 사이의 대화를 지원하는 방법.
  4. 제 1 항에 있어서, 상기 유저는 패스워드 또는 식별자, PIN 코드 등의 입력에 기초하여 식별되는, 유저와 목표 디바이스 사이의 대화를 지원하는 방법.
  5. 제 1 항에 있어서, 상기 유저와 상기 목표 디바이스(2) 사이의 대화는 암호화되는, 유저와 목표 디바이스 사이의 대화를 지원하는 방법.
  6. 제 1 항에 있어서, 상기 목표 디바이스(2)에 대해 분실된(missing) 정보는 상기 유저와의 대화를 통해 결정되는, 유저와 목표 디바이스 사이의 대화를 지원하는 방법.
  7. 제 1 항에 있어서, 상기 유저-지정 데이터는 업데이트되며 확장되는, 유저와 목표 디바이스 사이의 대화를 지원하는 방법.
  8. 제 1 항에 있어서, 다른 유저-지정 데이터가 상기 유저에 의해 입력되어 상기 데이터베이스에 저장되는 경우에, 상기 유저의 확인(confirmation)이 상기 유저-지정 데이터를 업데이트하는데 요구되는, 유저와 목표 디바이스 사이의 대화를 지원하는 방법.
  9. 제 1 항에 있어서, 상기 목표 디바이스(2)와 상기 유저 사이의 통신이 합성 음성 출력(synthetic voice output)을 통해서 일어나는, 유저와 목표 디바이스 사이의 대화를 지원하는 방법.
  10. 제 1 항에 있어서, 상지 유저에 의해 상기 목표 디바이스로 전송되는 정보는 상기 유저에 따라 제한되는, 유저와 목표 디바이스 사이의 대화를 지원하는 방법.
  11. 유저와 목표 디바이스(2) 사이의 통신을 지원하기 위해 상기 목표디바이스(2)에 대해 정보를 편집하기 위한 컴퓨터(4)로서, 상기 유저와 상기 목표 디바이스(2) 사이의 통신을 위한 통신 수단, 상기 컴퓨터(4)와 상기 목표 디바이스(2) 사이의 인터페이스(5) 및 상기 컴퓨터(4)와 상기 통신 수단(1) 사이의 링크를 포함하며, 데이터베이스가 유저-지정 데이터의 저장을 위해 컴퓨터(4)에 링크되어 있으며 상기 유저의 식별을 위한 식별 수단(7)에 링크되어 있는, 정보를 편집하기 위한 컴퓨터.
  12. 제 11 항에 있어서, 상기 식별 수단은 음성 인식 유닛에 의해 형성되는, 정보를 편집하기 위한 컴퓨터.
  13. 제 11 항에 있어서, 상기 유저와 상기 컴퓨터(4) 사이의 상기 통신 및/또는 상기 컴퓨터(4)와 상기 목표 디바이스(2) 사이의 통신을 암호화하기 위한 암호화 수단(8) 및 암호해독하기 위한 암호해독 수단(9)이 제공되는, 정보를 편집하기 위한 컴퓨터.
  14. 제 11 항에 있어서, 음성 인식을 위한 음향 기준(acoustic reference) 및/또는 상기 유저의 구매 행태 등에 관한 정보가 상기 데이터베이스(6)에 포함되는, 정보를 편집하기 위한 컴퓨터.
  15. 제 11 항에 있어서, 상기 통신 수단을 인식하기 위한 인식 디바이스가 제공되는, 정보를 편집하기 위한 컴퓨터.
  16. 제 11 항에 있어서, 상기 컴퓨터(4)와 상기 목표 디바이스(2) 사이의 상기 인터페이스(5)가 데이터 네트워크(3), 특히 인터넷에 의해 형성되는, 정보를 편집하기 위한 컴퓨터.
  17. 제 11 항에 있어서, 상기 통신 수단(1)이 상기 컴퓨터(4)와 통합되는, 정보를 편집하기 위한 컴퓨터.
  18. 제 11 항에 있어서, 상기 유저-지정 데이터에 대한 상기 데이터베이스(6)가 상기 컴퓨터(4)와 통합되는, 정보를 편집하기 위한 컴퓨터.
  19. 제 11 항에 있어서, 음성 인식 디바이스(10)가 상기 정보의 음향 출력을 위해 제공되는, 정보를 편집하기 위한 컴퓨터.
  20. 제 11 항에 있어서, 상기 유저에 따라 상기 유저에 의해 상기 목표 디바이스로 전송되는 상기 정보를 제한하기 위한 디바이스가 제공되는, 정보를 편집하기 위한 컴퓨터.
  21. 제 11 항에 있어서, 상기 통신 수단(1)은 이동 전화에 형성되는, 정보를 편집하기 위한 컴퓨터.
  22. 디지털 컴퓨터의 내부 메모리 안으로 직접 로딩될 수 있으며 소프트웨어 코드의 섹션을 포함하는, 컴퓨터 프로그램 제품으로서, 제 1 항 내지 제 10 항 중 어느 한 항에 따른 방법의 단계는 상기 제품이 상기 컴퓨터 상에서 동작중이라면 상기 컴퓨터로 실행되는, 컴퓨터 프로그램 제품.
  23. 제 22 항에 있어서, 컴퓨터 프로그램 제품은 상기 컴퓨터에 의해 판독될 수 있는 매체 상에 저장되는, 컴퓨터 프로그램 제품.
KR1020027016825A 2001-04-13 2002-04-09 음성 대화 시스템의 화자 확인 KR20030012877A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP01890115.7 2001-04-13
EP01890115 2001-04-13

Publications (1)

Publication Number Publication Date
KR20030012877A true KR20030012877A (ko) 2003-02-12

Family

ID=8185107

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020027016825A KR20030012877A (ko) 2001-04-13 2002-04-09 음성 대화 시스템의 화자 확인

Country Status (6)

Country Link
US (1) US20020152300A1 (ko)
EP (1) EP1382033A1 (ko)
JP (1) JP2004533752A (ko)
KR (1) KR20030012877A (ko)
CN (1) CN1302455C (ko)
WO (1) WO2002086865A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050023941A (ko) * 2003-09-03 2005-03-10 삼성전자주식회사 음성 인식 및 화자 인식을 통한 개별화된 서비스를제공하는 a/v 장치 및 그 방법
CN104601832A (zh) * 2008-04-29 2015-05-06 台达电子工业股份有限公司 对话***与语音对话处理方法
CN102479396A (zh) * 2010-11-25 2012-05-30 *** 目标装置选择方法、***及装置
US20130066634A1 (en) * 2011-03-16 2013-03-14 Qualcomm Incorporated Automated Conversation Assistance
CN103738295B (zh) * 2013-12-25 2016-03-02 科大讯飞股份有限公司 一种基于语音识别的被盗机动车辆的主动式报警与跟踪***及方法
CN105489218A (zh) * 2015-11-24 2016-04-13 江苏惠通集团有限责任公司 一种语音控制的***、遥控器及服务器

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5517558A (en) * 1990-05-15 1996-05-14 Voice Control Systems, Inc. Voice-controlled account access over a telephone network
US5629981A (en) * 1994-07-29 1997-05-13 Texas Instruments Incorporated Information management and security system
US6292782B1 (en) * 1996-09-09 2001-09-18 Philips Electronics North America Corp. Speech recognition and verification system enabling authorized data transmission over networked computer systems
WO1999000719A1 (en) * 1997-06-27 1999-01-07 Lernout & Hauspie Speech Products N.V. Access-controlled computer system with automatic speech recognition
US6138100A (en) * 1998-04-14 2000-10-24 At&T Corp. Interface for a voice-activated connection system
US6304864B1 (en) * 1999-04-20 2001-10-16 Textwise Llc System for retrieving multimedia information from the internet using multiple evolving intelligent agents
US6314402B1 (en) * 1999-04-23 2001-11-06 Nuance Communications Method and apparatus for creating modifiable and combinable speech objects for acquiring information from a speaker in an interactive voice response system
US7146505B1 (en) * 1999-06-01 2006-12-05 America Online, Inc. Secure data exchange between date processing systems
US6393305B1 (en) * 1999-06-07 2002-05-21 Nokia Mobile Phones Limited Secure wireless communication user identification by voice recognition
WO2001080133A2 (en) * 2000-04-17 2001-10-25 Emtera Corporation System and method for wireless purchases of goods and services
US20040078276A1 (en) * 2000-12-22 2004-04-22 Kotaro Shimogori System for electronic merchandising and shopping

Also Published As

Publication number Publication date
EP1382033A1 (en) 2004-01-21
JP2004533752A (ja) 2004-11-04
US20020152300A1 (en) 2002-10-17
CN1461465A (zh) 2003-12-10
CN1302455C (zh) 2007-02-28
WO2002086865A1 (en) 2002-10-31

Similar Documents

Publication Publication Date Title
US7062339B2 (en) Method and apparatus for communicating between a portable device and a server
JP2004533692A (ja) ポイントオブセールス(pos)音声認証取引システム
CN105554324B (zh) 支持将语音呼叫转换成数据对话的蜂窝电话***
JP2002074188A (ja) 会員情報登録方法および装置、会員認証方法および装置、サーバコンピュータ
US20120278236A1 (en) System and method for presentment of nonconfidential transaction token identifier
US20130333055A1 (en) System and method for transference of rights to digital media via physical tokens
WO2007080629A1 (ja) 携帯型端末装置、アドレス帳転送装置、携帯型端末装置における情報の表示方法、アドレス帳転送方法、およびコンピュータプログラム
JP2005513649A (ja) 音声対応消費者トランザクションシステム
EP1537517A1 (en) Device for directing the operation of a user s personal comm unication apparatus
US20140302814A1 (en) Centralized caller profile and payment system and methods for processing telephone payments
JPH1021305A (ja) 電子商品取引システム
US20190347441A1 (en) Patient privacy de-identification in firewall switches forming VLAN segregation
KR20030012877A (ko) 음성 대화 시스템의 화자 확인
US20100063905A1 (en) Method and system for performing banking transactions by simulating a virtual atm by means of a mobile telecommunications device
KR20080030723A (ko) 통신 단말기를 이용한 신용카드 관련 서비스 수행 방법
KR20020033588A (ko) 모바일 전자 상거래용 인증/결제 장치 및 이를 이용한전자 상거래 시스템 및 그 방법
GB2419970A (en) Application Generation System and Method
JP4525966B2 (ja) サービス提供システム、サービス提供サーバ、およびプログラム
JP2008134935A (ja) 決済システム、認証決済装置および携帯端末
JP2002133198A (ja) コンテンツ利用管理システム、コンテンツ利用管理サーバ、通信端末、及びコンテンツ利用管理方法
WO2006018892A1 (ja) 個人情報が漏えいしても成りすましを防げる電話認証システム
KR100734841B1 (ko) 팬시 스티커 타입의 rfid 태그, 및 그를 이용한보안(프라이버시) 강화된 온/오프라인 연계 방법 및 그단말기 장치
KR20070097773A (ko) Rfid와 단말 전자지갑을 이용한 모바일서비스 구현장치및 그 방법
KR100592706B1 (ko) Web 연동된 ars 기반의 모바일 음악 컨텐츠제공시스템
KR20050003720A (ko) 무선 음반 컨텐츠 서비스 시스템 및 무선 음반 컨텐츠이용하는 방법

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid