KR20170053127A - 필드 기재사항의 오디오 입력 - Google Patents

필드 기재사항의 오디오 입력 Download PDF

Info

Publication number
KR20170053127A
KR20170053127A KR1020160145904A KR20160145904A KR20170053127A KR 20170053127 A KR20170053127 A KR 20170053127A KR 1020160145904 A KR1020160145904 A KR 1020160145904A KR 20160145904 A KR20160145904 A KR 20160145904A KR 20170053127 A KR20170053127 A KR 20170053127A
Authority
KR
South Korea
Prior art keywords
audio input
field
input
fill field
processor
Prior art date
Application number
KR1020160145904A
Other languages
English (en)
Inventor
저스틴 마이클 링구에트
Original Assignee
레노보 (싱가포르) 피티이. 엘티디.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 레노보 (싱가포르) 피티이. 엘티디. filed Critical 레노보 (싱가포르) 피티이. 엘티디.
Publication of KR20170053127A publication Critical patent/KR20170053127A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • G06F17/243
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

일 실시형태는 프로세서를 이용하여 적어도 하나의 채움 필드를 포함한 서식에 접근하는 단계와; 사용자로부터의 오디오 입력을 오디오 입력 장치로부터 수신하는 단계와; 상기 오디오 입력과 연관된 채움 필드를 프로세서를 이용하여 식별하는 단계와; 상기 오디오 입력에 기초하여 상기 오디오 입력과 연관된 채움 필드에 입력을 제공하는 단계를 포함한 방법을 제공한다. 다른 양태들이 설명 및 청구된다.

Description

필드 기재사항의 오디오 입력{AUDIO INPUT OF FIELD ENTRIES}
본 발명은 필드 기재사항의 오디오 입력에 관한 것이다.
정보 취급 장치(이하 "장치"라 함), 예를 들면 셀폰, 스마트콘, 태블릿 장치, 랩톱 컴퓨터, 퍼스널 컴퓨터 등은 사용자가 각종 소스를 통하여 입력을 제공할 수 있게 한다. 사용자는 다양한 입력 방법(예를 들면, 표준 키보드, 소프트 키 입력, 행동 입력, 오디오 입력 등)을 이용하여 애플리케이션에 입력을 제공할 수 있다. 장치의 형태에 따라서, 이러한 입력 방법들 중의 일부는 다른 것보다 더 편리할 수 있다. 예를 들어서 만일 사용자가 스마트폰에 입력을 제공하고 있으면, 스마트폰의 작은 폼팩터 때문에 오디오 입력이 더 편리할 수 있다. 그러나 일부 경우에는 장치의 폼팩터에 기초한 가장 편리한 입력 방법이 사용자가 하고자 하는 기재사항(entry)에 기초한 가장 편리한 입력 방법이 아닐 수 있다.
요약하자면, 하나의 양태는 프로세서를 이용하여 적어도 하나의 채움 필드(fillable field)를 포함한 서식(form)에 접근하는 단계와; 사용자로부터의 오디오 입력을 오디오 입력 장치로부터 수신하는 단계와; 상기 오디오 입력과 연관된 채움 필드를 프로세서를 이용하여 식별하는 단계와; 상기 오디오 입력에 기초하여 상기 오디오 입력과 연관된 채움 필드에 입력을 제공하는 단계를 포함한 방법을 제공한다.
다른 양태는 오디오 입력 장치와; 상기 오디오 입력 장치에 작용적으로 결합된 프로세서와; 상기 프로세서에 의해 실행 가능한 명령어를 저장하는 메모리 장치를 포함한 정보 취급 장치를 제공하고, 상기 명령어는 상기 프로세서에 의해 실행된 때 상기 프로세서로 하여금 적어도 하나의 채움 필드를 포함한 서식에 접근하고; 사용자로부터의 오디오 입력을 오디오 입력 장치로부터 수신하고; 상기 오디오 입력과 연관된 채움 필드를 식별하고; 상기 오디오 입력에 기초하여 상기 오디오 입력과 연관된 채움 필드에 입력을 제공하게 한다.
추가의 양태는 프로세서에 의해 실행 가능한 코드를 저장하는 기억 장치를 포함한 제품을 제공하고, 상기 코드는 적어도 하나의 채움 필드를 포함한 서식에 접근하는 코드와; 사용자로부터의 오디오 입력을 오디오 입력 장치로부터 수신하는 코드와; 상기 오디오 입력과 연관된 채움 필드를 식별하는 코드와; 상기 오디오 입력에 기초하여 상기 오디오 입력과 연관된 채움 필드에 입력을 제공하는 코드를 포함한다.
전술한 사항은 요약이고 따라서 세부의 단순화, 일반화 및 생략을 내포할 수 있으며; 당업자라면 이 요약이 단지 예시하는 것이고 어떤 식으로든 제한하는 것으로 의도되지 않는다는 것을 이해할 것이다.
본 발명을 그 다른 추가적인 특징 및 장점들과 함께 더 잘 이해할 수 있도록, 첨부 도면과 함께하는 이하의 상세한 설명을 참조하기로 한다. 발명의 범위는 첨부된 특허 청구범위에 의해 규정된다.
도 1은 예시적인 정보 취급 장치의 회로도이다.
도 2는 다른 예시적인 정보 취급 장치의 회로도이다.
도 3은 필드 기재사항의 오디오 입력의 예시적인 방법을 보인 흐름도이다.
도면에 개략적으로 도시된 실시형태의 컴포넌트들은 여기에서 설명하는 예시적인 실시형태 외에 다양한 다른 구성으로 배열 및 설계될 수 있다는 것을 쉽게 이해할 것이다. 따라서, 도면에 도시된 예시적인 실시형태에 관한 이하의 상세한 설명은 발명의 범위를 제한하는 것으로 의도되지 않고 단지 예시적인 실시형태를 대표할 뿐이다.
본 명세서 전반에 걸쳐 사용하는 용어 "일 실시형태" 또는 "실시형태" 등은 실시형태와 관련하여 설명하는 특정의 특징, 구조 또는 특성이 적어도 하나의 실시형태에 포함된다는 것을 의미한다. 따라서, 본 명세서의 전반에 걸쳐 여러 곳에서 나오는 "일 실시형태에 있어서" 또는 "실시형태에 있어서" 등의 구의 출현은 반드시 모두가 동일한 실시형태를 인용하는 것이 아니다.
또한, 여기에서 설명하는 특징, 구조 또는 특성들은 하나 이상의 실시형태에서 임의의 적당한 방식으로 결합될 수 있다. 이하의 설명에서, 실시형태의 완전한 이해를 제공하기 위해 많은 특정의 세부들이 제공된다. 그러나 당업자라면 각종 실시형태가 하나 이상의 그 특정 세부 없이, 또는 다른 방법, 컴포넌트, 재료 등과 함께 실시될 수 있다는 것을 이해할 것이다. 다른 예에 있어서, 잘 알려져 있는 구조, 재료 또는 동작은 혼란스러움을 피하기 위해 자세히 도시하거나 설명하지 않는다.
임의의 입력 방법이 특정 장치에서 더 편리할 수 있다. 예를 들면, 랩톱 컴퓨터를 이용할 때는 표준형의 키보드를 이용하는 것이 편리할 수 있다. 그러나 더 작은 장치 또는 관습적인 키보드가 부착되어 있지 않은 장치, 예컨대 태블릿, 스마트폰 등에서는 덜 관습적인 입력 방법, 예를 들면, 오디오 입력, 행동 입력 등을 이용하는 것이 더 편리할 수 있다. 이러한 덜 관습적인 입력 방법의 한가지 문제점은 사용자가 하려고 하는 기재사항이 이러한 입력 방법을 염두에 두고 설계되지 않을 수 있다는 것이다. 예를 들어서 만일 사용자가 서식에 기재사항을 제공하고 있으면, 오디오 입력의 제공은 짜증나는 데이터 기재가 될 수 있다. 관습적인 필드 기재에 있어서, 사용자는 선택된 또는 강조된 필드에 대하여 오디오 입력을 제공하고, 그 다음에 사용자가 입력을 제공하고자 하는 다음 필드를 수동으로(예를 들면, 키보드, 마우스, 소프트 키 입력 등을 이용해서) 선택해야 한다. 텍스트 기재사항을 제공하기 위해 장치에 제공된 소프트 키보드를 이용하는 것도 또한 매우 짜증날 수 있고, 예를 들면 사용자에게 장애가 있는 경우, 핸즈프리 환경 등에서 모든 사용자에게 가능하지 않을 수 있다.
다른 하나의 해법은 기재 서식을 음성만의 기재 서식으로 교체하는 것에 의존한다. 예를 들면, 표준 연락처 리스트 대신에, 시스템은 연락처 리스트를 음성 기재 연락처 리스트로 교체한다. 그 다음에 사용자는 사용자에 의한 명령에 기초하여 필드를 통해 이동하는 오디오 입력을 제공할 수 있다. 이 시스템의 한가지 문제점은 서식을 통해 내비게이트하도록 사용자가 특정 명령을 제공해야 한다는 점이다. 사용자는 명령을 잊어버릴 수 있고, 이 경우 사용자를 좌절시킨다. 게다가 사용자는 필드를 독특하게 식별할 수 없고, 그래서 사용자는 종종 버튼 또는 라디알 버튼과 같은 모든 대화형 페이지 요소들을 포함한 전체 필드를 통해 순차적으로 내비게이트해야 한다. 그 결과, 시스템은 에러가 발생하기 쉽고 부정확하게 된다. 이 접근법의 다른 문제점은 전체 시스템이 순전히 말(speech)로 되도록 목적 코드화되는 시스템으로 교체된다는 점이다. 만일 사용자가 음성 입력이 아닌 다른 입력을 제공하기 원하면, 사용자는 이 방법을 이용하여 그렇게 할 수 없다. 게다가 사용자가 채워넣기 원하는 모든 서식 또는 필드 기재사항이 이러한 시스템을 이용하여 교체되어야 한다. 다시 말해서, 임의의 애플리케이션과 인터페이스하는 시스템을 갖는 대신에, 각 애플리케이션이 새로운 목적 코드화 애플리케이션으로 완전히 교체되어야 한다.
이러한 기술적 이슈들은 필드에 핸즈프리 입력을 제공하고 필드들 간의 내비게이션을 제공할 때 문제가 된다. 전형적인 애플리케이션은 사용자가 2개의 다른 유형의 입력을 제공할 것을 요구하는데, 하나는 필드에 입력을 제공하기 위한 것이고 다른 하나는 다른 필드에 내비게이트하기 위한 것이며, 이러한 유형의 데이터 기재는 짜증나고 불편하게 한다. 일부 애플리케이션은 음성 입력과 내비게이션을 허용하지만, 애플리케이션이 그 목적으로 목적 코드화될 것을 요구하고 다른 애플리케이션과 인터페이스하지 않을 것이다. 게다가, 전형적인 음성 기반 애플리케이션에서는 사용자가 서식의 다른 필드를 통해 내비게이트하기 위해 특수한 명령을 제공해야 하는데, 이것은 자연스럽지 않은 오디오 입력 제공 방법을 야기할 수 있다.
따라서, 실시형태는 사용자에 대하여 더 자연스러운 방법으로 말하여질 수 있는 사용자로부터의 오디오 입력을 수신하는 방법을 제공한다. 시스템은 서식 내의 채움 필드를 식별하고 그 필드에 오디오 입력에 기반하여 입력을 제공할 수 있으며, 이것은 사용자가 서식 내의 필드와 상호작용하는 끊김 없는 더 편리한 방법을 제공한다. 예를 들면, 사용자는 "존 도(John Doe), (123)555-6789"라고 말함으로써 새로운 연락처를 추가하기 위한 오디오 입력을 제공할 수 있다. 일 실시형태는 상기 오디오 입력을 분석하여 "존 도"가 "연락처명" 필드에 맞는지 식별하고, 그 필드를 정확한 이름으로 채운다. 실시형태는 추가로 "(123)555-6789"가 "전화번호" 필드에 맞는지 식별하고 그에 따라서 그 필드를 채울 수 있다.
오디오 입력과 연관된 필드를 식별함에 있어서, 일 실시형태는 오디오 입력을 서식 내의 채움 필드와 비교할 수 있다. 예를 들어서, 만일 사용자가 사회 보장 번호를 제공하면, 실시형태는 어떤 필드에 입력이 제공되어야 하는지 식별하기 위해 필드들의 기대치에 오디오 입력의 형식(format)을 비교할 수 있다. 일 실시형태는 필드를 식별하기 위해 다른 데이터에 접근할 수 있다. 예를 들면, 일 실시형태는 필드를 식별하기 위해 필드 식별자, 서식 또는 필드와 연관된 소스 코드 등에 접근할 수 있다. 추가로, 일 실시형태는 어떤 필드에 입력이 제공되어야 하는지 식별하기 위해 오디오 입력 또는 서식 내의 콘텍스트 데이터를 이용할 수 있다.
제시된 예시적인 실시형태는 도면을 참조함으로써 최상으로 이해될 것이다. 이하의 설명은 단지 예로서만 의도되고 임의의 예시적인 실시형태를 단순히 설명한다.
각종의 다른 회선, 회로 또는 컴포넌트가 스마트폰 및/또는 태블릿 회로(100)와 관련하여 정보 취급 장치에서 사용될 수 있지만, 도 1에 도시된 예는 예컨대 태블릿 또는 다른 모바일 컴퓨팅 플랫폼에서 사용되는 시스템 온 칩 설계를 포함한다. 소프트웨어와 프로세서는 단일 칩(110)으로 결합된다. 프로세서는 업계에 잘 알려져 있는 바와 같이 내부 산술 유닛, 레지스터, 캐시 메모리, 버스, I/O 포트 등을 포함한다. 내부 버스 등은 다른 판매자에 의존하지만, 본질적으로 모든 주변 장치(120)는 단일 칩(110)에 부착할 수 있다. 회로(100)는 프로세서, 메모리 제어 및 I/O 제어기 허브를 모두 단일 칩(110)에 결합한다. 또한, 이 유형의 시스템(100)은 전형적으로 SATA 또는 PCI 또는 LPC를 사용하지 않는다. 공통 인터페이스는 예를 들면 SDIO 및 I2C를 포함한다.
예를 들면 전원(도시 생략됨)에 접속함으로써 재충전될 수 있는 충전식 배터리(140)를 통해 공급되는 전력을 관리하는 전력 관리 칩(130), 예를 들면 배터리 관리 유닛(BMU)이 있다. 적어도 하나의 설계에 있어서, 110과 같은 단일 칩이 BIOS형 기능 및 DRAM 메모리를 공급하기 위해 사용된다.
시스템(100)은 전형적으로 전기통신망 및 무선 인터넷 장치, 예를 들면, 액세스 포인트와 같은 각종 네트워크에 접속하기 위해 WWAN 트랜시버(150)와 WLAN 트랜시버(160) 중의 하나 이상을 포함한다. 추가로, 마이크로폰과 같은 오디오 입력 장치인 장치(120)가 일반적으로 포함된다. 시스템(100)은 가끔 데이터 입력 및 디스플레이/렌더링을 위해 터치스크린(170)를 포함한다. 시스템(100)은 또한 전형적으로 각종 메모리 장치, 예를 들면 플래시 메모리(180)와 SDRAM(190)을 포함한다.
도 2는 정보 취급 장치 회선, 회로 또는 컴포넌트의 다른 예의 블록도이다. 도 2에 도시된 예는 노스캐롤라이나 모리스빌에 소재하는 레노버(US)사(Lenovo(US) Inc.)에서 판매하는 싱크패드(THINKPAD) 계열의 퍼스널 컴퓨터와 같은 컴퓨팅 시스템 또는 다른 장치에 대응할 수 있다. 여기에서의 설명에 의해 명백해지는 바와 같이, 실시형태는 다른 특징들 또는 도 2에 도시된 예의 특징들 중 일부만을 포함할 수 있다.
도 2의 예는 제조사(예를 들면, INTEL, AMD, ARM 등)에 따라 다를 수 있는 구조를 가진 소위 칩셋(210)(함께 동작하는 집적회로 또는 칩의 그룹, 칩셋)을 포함한다. INTEL은 미국 및 다른 나라에 있는 인텔 코포레이션의 등록 상표이다. AMD는 미국 및 다른 나라에 있는 어드반스드 마이크로 디바이시즈, 인크의 등록 상표이다. ARM은 미국 및 다른 나라에 있는 ARM 홀딩스 피엘씨의 미등록 상표이다. 칩셋(210)의 구조는 직접 관리 인터페이스(DMI)(242) 또는 링크 제어기(244)를 통해 정보(예를 들면, 데이터, 신호, 커맨드 등)를 교환하는 코어 및 메모리 제어 그룹(220)과 I/O 제어기 허브(250)를 포함한다. 도 2에서 DMI(242)는 칩 대 칩 인터페이스(가끔은 "노스브리지"와 "사우스브리지" 간의 링크라고 부른다)이다. 코어 및 메모리 제어 그룹(220)은 프론트 사이드 버스(FSB)(224)를 통해 정보를 교환하는 하나 이상의 프로세서(222)(예를 들면, 단일 또는 다중 코어)와 메모리 제어기 허브(226)를 포함하고; 코어 및 메모리 제어 그룹(220)의 컴포넌트들은 종래의 "노스브리지"형 구조를 대신하는 칩으로 집적될 수 있다는 점에 주목한다. 하나 이상의 프로세서(222)는 업계에 잘 알려져 있는 바와 같이 내부 산술 유닛, 레지스터, 캐시 메모리, 버스, I/O 포트 등을 포함한다.
도 2에서, 메모리 제어기 허브(226)는 메모리(240)와 인터페이스한다(예를 들면, "시스템 메모리" 또는 "메모리"라고 부르는 소정 유형의 RAM에 대한 지원을 제공하기 위해). 메모리 제어기 허브(226)는 디스플레이 장치(292)(예를 들면, CRT, 플랫 패널, 터치스크린 등)를 위한 저전압 차분 시그널링(LVDS) 인터페이스(232)를 또한 포함한다. 블록(238)은 LVDS 인터페이스(232)를 통해 지원될 수 있는 몇 가지 기술들을 포함한다(예를 들면, 직렬 디지털 비디오(SDVO), HDMI/DVI, 디스플레이 포트). 메모리 제어기 허브(226)는 이산 그래픽(236)을 지원하는 PCI-익스프레스 인터페이스(PCI-E)(234)를 또한 포함한다.
도 2에서, I/O 허브 제어기(250)는 SATA 인터페이스(251)(예를 들면, HDD, SDD 등(280)의 용도), PCI-E 인터페이스(252)(예를 들면, 무선 접속(282) 용도), USB 인터페이스(253)(예를 들면, 디지타이저, 키보드, 마우스, 카메라, 폰, 마이크로폰, 스토리지, 다른 접속 장치 등과 같은 장치(284) 용도), 네트워크 인터페이스(254)(예를 들면, LAN), GPIO 인터페이스(255), LPC 인터페이스(270)(ASIC(271), TPM(272), 수퍼 I/O(273), 펌웨어 허브(274), BIOS 지원(275)뿐만 아니라, ROM(277), 플래시(278) 및 NVRAM(279)과 같은 각종 유형의 메모리 용도), 전력 관리 인터페이스(261), 클럭 발생기 인터페이스(262), 오디오 인터페이스(263)(예를 들면, 스피커(294) 용도), TCO 인터페이스(264), 시스템 관리 버스 인터페이스(265), 및 BIOS(268)와 부트 코드(290)를 포함할 수 있는 SPI 플래시(266)를 포함한다. I/O 허브 제어기(250)는 기가비트 이더넷 지원을 포함할 수 있다.
시스템은 전력이 투입된 때 SPI 플래시(266)에 저장되어 있는 BIOS(268)용의 부트 코드(290)를 실행하고 그 다음에 하나 이상의 운영체제 및 응용 소프트웨어(예를 들면 시스템 메모리(240)에 저장되어 있음)의 제어하에 데이터를 처리하도록 구성될 수 있다. 운영체제는 다양한 위치 중 임의 위치에 저장되고 예를 들면 BIOS(268)의 명령어에 따라 액세스될 수 있다. 여기에서 설명하는 것처럼, 장치는 도 2의 시스템에 도시된 것보다 더 적은 또는 더 많은 특징들을 포함할 수 있다.
예를 들면 도 1 또는 도 2에 도시된 것과 같은 정보 취급 장치 회로는 예를 들면 태블릿, 스마트폰, 퍼스널 컴퓨터 장치와 같은 장치에서, 및/또는 채움 필드에 입력을 제공하기 위해 사용자가 사용할 수 있는 전자 장치에서 사용될 수 있다. 예를 들면, 도 1에 도시된 회로는 태블릿 또는 스마트폰 실시형태에서 구현되고, 도 2에 도시된 회로는 퍼스널 컴퓨터 실시형태에서 구현될 수 있다.
이제, 도 3을 참조하면, 실시형태는 적어도 하나의 채움 필드를 포함한 서식에 접근할 수 있다(301). 서식에 접근하는 것은 서식을 다운로드하고 여는 것, 사용자가 사용자 기재를 위한 필드를 가진 애플리케이션을 여는 것, 다른 소스로부터 서식을 수신하는 것, 채움 필드를 가진 웹 페이지를 여는 것 등을 포함할 수 있다. 일 예로서, 사용자는 사용자 기재를 요구하는 필드를 가진 장치에 내포된 애플리케이션에 접근할 수 있다. 일부 예시적인 서식은 연락처 리스트, 대화식의 채움 서식(예를 들면, 직업 애플리케이션, 세금 서식, 보증 서식, 등록 서식 등), 필드를 가진 웹 페이지, 사용자 기재를 요구하는 필드를 가진 애플리케이션 등을 포함할 수 있다. 채움 필드는 사용자가 입력을 제공할 수 있는 임의의 필드를 포함할 수 있다.
302에서, 실시형태는 오디오 입력 장치로부터 사용자로부터의 오디오 입력을 수신할 수 있다. 이 오디오 입력은 서식 내의 필드에 대응하는 입력을 포함할 수 있다. 사용자는 필드 지정을 포함한 입력을 제공할 수 있다. 예를 들면, 사용자는 "이름: 플럼버 죠(Plumber Joe), 직장 번호: (555)999-8888"이라고 말할 수 있다. 대안적으로, 사용자는 서식의 필드 지정과 맞지 않는 필드 지정을 제공할 수 있다. 예를 들면, 사용자는 "필드 1: 잭(Jack), 필드 2: 1234-5678-9101-1121"이라고 말할 수 있다. 일 실시형태에 있어서, 사용자는 필드 지정 없이 입력을 제공할 수 있다. 일 예로서, 사용자는 입력을 제공하기 위해 말하는 자연스런 언어를 이용하여 "제인 디. 스미쓰(Jane D. Smith), 555-55-5555, 1234 W, 5th Street, New York, 99999"라고 말할 수 있다.
오디오 입력을 수신한 때, 실시형태는 303에서 채움 필드가 오디오 입력과 연관될 수 있는지 식별할 수 있다. 일 실시형태에 있어서, 식별은 입력의 다른 부분들을 식별하기 위해 오디오 입력을 분석하는 단계를 포함할 수 있다. 예를 들면, 시스템은 오디오를 분석하고 입력이 필드 식별자(예를 들면, 필드의 이름, 필드의 지정자, 필드와 연관된 텍스트, 필드의 식별 번호 등)를 포함하는지 식별할 수 있다. 오디오 필드 식별자는 그 다음에 필드 식별자와 일치하는 서식 내의 필드 식별자를 찾기 위해 사용될 수 있다. 이 필드는 그 다음에, 제공된 오디오 입력과 연관될 수 있다. 만일 사용자가 2개 이상의 채움 필드에 대하여 입력을 제공하면, 실시형태는 오디오 입력의 각 부분과 연관되는 필드를 식별할 수 있다. 대안적으로, 사용자는 필드 식별자의 이름을 포함하지 않지만 필드의 번호(예를 들면, "필드 1", "필드 2" 등), 자연스런 언어 스피치(예를 들면, "제인 스미쓰, 1700 2nd street" 등), 필드 식별자에 대한 유사성(예를 들면, 필드 식별자는 "모바일 번호"를 표시하고, 사용자는 "셀: (777)777-7777"을 말한다), 부분적 필드 식별자(예를 들면, 필드 식별자는 "전체 이름"이고, 사용자는 "이름: 재키 존스"를 말한다), 또는 다른 유형의 지정을 포함하는 입력을 제공할 수 있다.
일 실시형태는 오디오 입력을 적어도 하나의 채움 필드와 비교할 수 있다. 일 예로서, 실시형태는 필드 식별자, 기대치, 필드 형식 등을 식별하기 위해 서식과 연관된 소스 코드에 접근할 수 있다. 이 정보에 기초해서, 실시형태는 제공된 입력을 필드와 비교하여 오디오 입력과 일치하거나 오디오 입력과 가장 밀접하게 관계되는 필드를 찾을 수 있다. 예를 들어서 만일 사용자가 번호를 포함한 입력을 제공하면, 실시형태는 수신된 번호를 필드의 예상 기재사항과 비교할 수 있다. 일 예로서, 만일 사용자가 10 디지트를 가진 전화번호를 제공하면, 실시형태는 번호를 기대하면서 10개의 번호를 또한 기대하는 필드를 식별할 수 있다. 이 정보를 이용해서, 실시형태는 입력과 그 필드를 연관시킬 수 있다.
일 실시형태는 채움 필드가 오디오 입력에 대한 유사성을 갖는지 식별할 수 있다. 예를 들어서 만일 사용자가 중간 이니셜을 제공하면, 실시형태는 수치 값이 아닌 텍스트 값을 기대하는 필드만을 식별할 수 있다. 이 필드들은 오디오 입력에 대한 유사성을 갖는 것으로 고려될 것이다. 실시형태는 또한 단일 문자를 기대하는 필드를 식별할 수 있다. 이 필드들은 그 다음에 오디오 입력에 대하여 더 큰 유사성을 가질 것이다. 일 실시형태에 있어서, 유사성은 값을 이용하여 측정될 수 있다. 예를 들면, 1 필드는 다른 필드보다 입력에 대한 유사성이 더 클 수 있고, 이것은 더 높은 값을 야기할 수 있다. 만일 이 값이 특정 역치에 도달하면, 실시형태는 이 필드가 오디오 입력과 연관되어야 하는 필드라고 결정할 수 있다. 연관성은 또한 신뢰 점수에 기초를 둘 수 있다. 각각의 연관된 필드는 이것이 올바른 필드라는 것을 시스템이 어떻게 신뢰하는지를 표시하는 것과 연관된 신뢰 점수를 가질 수 있다. 특정 역치 미만의 신뢰 점수를 가진 필드는 입력이 올바르게 연관되었는지를 사용자가 확인할 것을 요구할 수 있다.
실시형태는 사용자가 어떤 입력을 제공하고 있는지 식별하기 위해 오디오 입력의 콘텍스트를 사용할 수 있다. 예를 들어서 만일 사용자가 단어와 함께 숫자를 제공하고 있으면, 실시형태는 그 콘텍스트를 이용하여 그 입력을 도로명 주소로서 식별할 수 있다. 또한, 실시형태는 서식의 콘텍스트를 이용하여 오디와 입력이 연관되어야 하는 정확한 필드를 식별할 수 있다. 일 예로서, 실시형태는 광학 문자 인식(OCR)을 사용함으로써, 서식의 형식을 이용해서, 예시적인 서식을 이용해서, 서식을 미리 식별된 서식의 라이브러리와 비교함으로써 등에 의해 서식이 세금 서식임을 식별할 수 있다. 서식을 세금 서식으로 식별한 것에 기초하여, 실시형태는 오디오 입력을 서식 내의 올바른 필드에 더 잘 연관시키기 위해 상기 콘텍스트를 이용할 수 있다.
만일 실시형태가 303에서 채움 필드를 식별할 수 없으면, 실시형태는 아무런 동작을 취하지 않을 수 있다(305). 게다가, 실시형태는 사용자로부터 추가의 오디오 입력이 수신되기를 기다릴 수 있다(302). 대안 예로서, 실시형태는 오디오 입력이 채움 필드와 연관될 수 없고 사용자로부터 추가의 입력이 필요하다고 사용자에게 표시할 수 있다. 예를 들면, 실시형태는 사용자가 오디오 입력을 반복하고, 오디오 입력의 일부를 반복하고, 필드가 올바른 필드인지 확인하는 것 등을 요구할 수 있다. 사용자는 비오디오 입력을 또한 제공할 수 있다. 예를 들면, 사용자는 소프트 키를 이용하여 올바른 필드를 선택 또는 표시할 수 있다.
그러나 만일 실시형태가 303에서 연관된 채움 필드를 식별할 수 있으면, 실시형태는 304에서 오디오 입력에 기초하여 입력을 채움 필드에 제공할 수 있다. 입력은 제공된 오디오 입력의 전부 또는 일부만을 포함할 수 있다. 예를 들어서 만일 실시형태가 오디오 입력이 2개 이상의 필드에 대한 입력을 내포하고 있다고 식별하였으면, 실시형태는 특정 필드에 대응하는 오디오 입력 부분만을 제공할 수 있다. 그 다음에 실시형태는 다른 필드와 연관되는 입력을 올바른 필드에 제공할 수 있다. 일 실시형태에 있어서, 제공된 입력은 기계 텍스트를 포함할 수 있다. 예를 들면, 시스템은 마치 사용자가 서식 내에 입력을 타이프한 것처럼 오디오 입력을 기계 텍스트로 변환할 수 있다.
따라서, 여기에서 설명하는 각종 실시형태는 장치에서 핸즈프리 내비게이션에 대한 기술적 개선을 나타낸다. 여기에서 설명한 기술들을 이용해서, 사용자는 단일 입력 소스를 이용하여 채움 필드에 입력을 제공하고 채움 필드를 통하여 내비게이트할 수 있다. 게다가, 사용자는 특정 명령의 필요성 없이 더 자연스러운 방법으로 입력을 제공할 수 있다. 이 기술들은 시스템 전체를 교체하기보다는 시스템에 이미 존재하는 애플리케이션을 통하여 내비게이트하는 대안적인 방법을 제공한다. 시스템은 모든 애플리케이션으로부터 독립적일 수 있고, 이것에 의해 임의의 애플리케이션과 인터페이스할 수 있다. 게다가, 시스템은 오디오 입력과 서식 필드 간의 연관성을 이용하여 실제 서식에 대한 임의의 지식 없이 다른 필드들을 통하여 내비게이트할 수 있다.
당업자라면 이해하고 있는 바와 같이, 각종 양태는 시스템, 방법 또는 장치 프로그램 제품으로서 구체화될 수 있다. 따라서, 양태는 전적으로 하드웨어 실시형태의 형태를 취할 수도 있고, 또는 일반적으로 여기에서 모두 "회선", "모듈" 또는 "시스템"이라고 부르는 소프트웨어를 포함한 실시형태의 형태를 취할 수도 있다. 더 나아가, 양태는 장치 판독가능 프로그램 코드에 의해 구체화된 하나 이상의 장치 판독가능 매체로 구체화된 장치 프로그램 제품의 형태를 취할 수 있다.
여기에서 설명한 각종 기능들은 프로세서에 의해 실행되는 비신호 기억 장치와 같은 장치 판독가능 기억 매체에 저장된 명령어를 이용하여 구현될 수 있다는 점에 주목하여야 한다. 기억 장치는 예를 들면 전자, 자기, 광학, 전자기, 적외선 또는 반도체 시스템, 장치 또는 디바이스, 또는 이들의 임의의 적당한 조합일 수 있다. 기억 매체의 더 구체적인 예로는 휴대용 컴퓨터 디스켓, 하드 디스크, 랜덤 액세스 메모리(RAM), 읽기 전용 메모리(ROM), 소거 가능한 프로그래머블 읽기 전용 메모리(EPROM 또는 플래시 메모리), 광섬유, 휴대용 콤팩트 디스크 읽기 전용 메모리(CD-ROM), 광학 기억 장치, 자기 기억 장치 또는 이들의 임의의 적당한 조합이 있다. 이 문서와 관련하여, 기억 장치는 신호가 아니고, "비일시적"은 신호 매체를 제외한 모든 매체를 포함한다.
기억 매체에서 구체화되는 프로그램 코드는 비제한적인 예를 들자면 무선, 유선, 광섬유 케이블, RF 등 또는 이들의 임의의 적당한 조합을 포함한 임의의 적당한 매체를 이용하여 전송될 수 있다.
동작을 수행하기 위한 프로그램 코드는 하나 이상의 프로그래밍 언어의 임의 조합으로 작성될 수 있다. 프로그램 코드는 전적으로 단일 장치에서, 부분적으로 단일 장치에서, 독립형 소프트웨어 패키지로서, 부분적으로 단일 장치에서 및 부분적으로 다른 장치에서, 또는 전적으로 다른 장치에서 실행할 수 있다. 일부 경우에, 장치는 근거리 통신망(LAN) 또는 광역 통신망(WAN)을 포함한 임의 유형의 접속 또는 네트워크를 통하여 접속될 수 있고, 또는 접속은 다른 장치를 통해서(예를 들면, 인터넷 서비스 공급자를 이용한 인터넷을 통해서), 무선 접속, 예를 들면 근거리 무선 통신을 통해서, 또는 USB 접속에 의한 것과 같은 하드 와이어 접속을 통해서 이루어질 수 있다.
예시적인 실시형태는 각종 예시적인 실시형태에 따른 예시적인 방법, 장치 및 프로그램 제품을 나타내는 도면을 참조하여 여기에서 설명되었다. 각종 동작 및 기능은 프로그램 명령어에 의해 적어도 부분적으로 구현될 수 있다는 것을 이해할 것이다. 이러한 프로그램 명령어는 장치의 프로세서, 특수 용도 정보 취급 장치, 또는 기계를 생성하기 위한 다른 프로그래밍 데이터 처리 장치에 제공되어 장치의 프로세서에 의해 실행하는 명령어들이 특정의 기능/동작을 구현하게 할 수 있다.
비록 특정의 블록들이 도면에서 사용되고 블록들의 특정 순서가 예시되었지만, 이들은 비제한적인 예임을 주목하여야 한다. 명시적으로 예시된 실시예들은 단지 설명 목적이고 제한하는 것으로 해석되지 않기 때문에, 일부 실시형태에서는 2개 이상의 블록들이 결합될 수 있고, 하나의 블록이 2개 이상의 블록으로 나누어질 수 있으며, 또는 어떤 블록들은 적절히 재배치 또는 재조직될 수 있다.
여기에서 사용하는 단수의 표현들은 명확히 다르게 표시되지 않는 한 복수의 표현 "하나 이상"을 포함하는 것으로 해석될 수 있다.
여기에서의 설명은 예시 목적으로 제시된 것이고 설명은 총망라적이라거나 제한하는 것으로 의도되지 않는다. 당업자에게는 많은 수정 및 변형이 가능할 것이다. 예시적인 실시형태는 원리 및 실제 응용을 설명하기 위하여, 및 다른 당업자가 예상되는 특수 용도에 적합한 각종 수정을 가한 각종 실시형태에 대하여 본 발명을 이해할 수 있게 하기 위하여 선택 및 개시되었다.
따라서, 비록 예시적인 실시형태가 첨부 도면과 관련하여 여기에서 설명되었지만, 이 설명은 제한하는 것이 아니고, 발명의 범위 또는 정신으로부터 벗어나지 않고 당업자에 의해 각종의 다른 변경 및 수정이 이루어질 수 있다는 것을 이해하여야 한다.

Claims (20)

  1. 프로세서를 이용하여 적어도 하나의 채움 필드(fillable field)를 포함한 서식(form)에 접근하는 단계와,
    사용자로부터의 오디오 입력을 오디오 입력 장치로부터 수신하는 단계와,
    상기 오디오 입력과 연관된 채움 필드를 프로세서를 이용하여 식별하는 단계와,
    상기 오디오 입력에 기초하여, 상기 오디오 입력과 연관된 상기 채움 필드에 입력을 제공하는 단계를 포함하는 방법.
  2. 제1항에 있어서, 상기 오디오 입력을 상기 적어도 하나의 채움 필드와 비교하는 단계를 더 포함하는 방법.
  3. 제2항에 있어서, 상기 식별하는 단계는, 상기 오디오 입력에 대한 유사성을 가진 채움 필드에 기초하여 상기 채움 필드를 식별하는 단계를 포함하는 것인 방법.
  4. 제1항에 있어서, 상기 입력을 제공하는 단계는, 상기 오디오 입력의 적어도 일부를 상기 채움 필드에 제공하는 단계를 포함하는 것인 방법.
  5. 제1항에 있어서, 상기 오디오 입력을 분석하는 단계를 더 포함하는 방법.
  6. 제1항에 있어서, 상기 오디오 입력은 필드 식별자를 포함하고, 상기 입력을 제공하는 단계는, 상기 필드 식별자와 연관된 채움 필드에 입력을 제공하는 단계를 포함하는 것인 방법.
  7. 제1항에 있어서, 상기 오디오 입력과 연관된 콘텍스트 데이터에 접근하는 단계를 더 포함하는 방법.
  8. 제7항에 있어서, 상기 식별하는 단계는 상기 콘텍스트 데이터에 기초하여 상기 채움 필드를 식별하는 단계를 포함한 것인 방법.
  9. 제1항에 있어서, 서식의 소스 코드에 접근하는 단계를 더 포함하고, 상기 식별하는 단계는, 상기 소스 코드에 기초하여 상기 채움 필드를 식별하는 단계를 포함하는 것인 방법.
  10. 제1항에 있어서, 상기 입력을 제공하는 단계는, 상기 채움 필드에 기계 텍스트(machine text)를 제공하는 단계를 포함하는 것인 방법.
  11. 정보 취급(handling) 장치에 있어서,
    오디오 입력 장치와,
    상기 오디오 입력 장치에 작용적으로 결합된 프로세서와,
    상기 프로세서에 의해 실행가능한 명령어를 저장하는 메모리 장치를 포함하고, 상기 명령어는 상기 프로세서에 의해 실행될 때 상기 프로세서로 하여금,
    적어도 하나의 채움 필드를 포함한 서식에 접근하게 하고,
    사용자로부터의 오디오 입력을 상기 오디오 입력 장치로부터 수신하게 하고,
    상기 오디오 입력과 연관된 채움 필드를 식별하게 하고,
    상기 오디오 입력에 기초하여 상기 오디오 입력과 연관된 채움 필드에 입력을 제공하게 하는 것인 정보 취급 장치.
  12. 제11항에 있어서, 상기 명령어는 또한, 상기 오디오 입력을 상기 적어도 하나의 채움 필드와 비교하도록 상기 프로세서에 의해 실행 가능한 것인 정보 취급 장치.
  13. 제12항에 있어서, 상기 식별하는 것은 상기 오디오 입력에 대한 유사성을 가진 채움 필드에 기초하여 상기 채움 필드를 식별하는 것을 포함하는 것인 정보 취급 장치.
  14. 제11항에 있어서, 상기 입력을 제공하는 것은 상기 오디오 입력의 적어도 일부를 상기 채움 필드에 제공하는 것을 포함하는 것인 정보 취급 장치.
  15. 제11항에 있어서, 상기 명령어는 또한, 상기 오디오 입력을 분석하도록 상기 프로세서에 의해 실행 가능한 것인 정보 취급 장치.
  16. 제11항에 있어서, 상기 오디오 입력은 필드 식별자를 포함하고, 상기 입력을 제공하는 것은 상기 필드 식별자와 연관된 채움 필드에 입력을 제공하는 것을 포함한 것인 정보 취급 장치.
  17. 제11항에 있어서, 상기 명령어는 또한, 상기 오디오 입력과 연관된 콘텍스트 데이터에 접근하도록 상기 프로세서에 의해 실행 가능한 것인 정보 취급 장치.
  18. 제17항에 있어서, 상기 식별하는 것은 상기 콘텍스트 데이터에 기초하여 상기 채움 필드를 식별하는 것을 포함하는 것인 정보 취급 장치.
  19. 제11항에 있어서, 상기 명령어는 또한 서식의 소스 코드에 접근하도록 상기 프로세서에 의해 실행 가능한 것이고, 상기 식별하는 것은 상기 소스 코드에 기초하여 상기 채움 필드를 식별하는 것을 포함한 것인 정보 취급 장치.
  20. 프로세서에 의해 실행가능한 코드를 저장하는 기억 장치를 포함한 제품에 있어서,
    상기 코드는, 상기 프로세서에 의해 실행될 수 있으며,
    적어도 하나의 채움 필드를 포함한 서식에 접근하는 코드와,
    사용자로부터의 오디오 입력을 오디오 입력 장치로부터 수신하는 코드와,
    상기 오디오 입력과 연관된 채움 필드를 식별하는 코드와,
    상기 오디오 입력에 기초하여 상기 오디오 입력과 연관된 채움 필드에 입력을 제공하는 코드
    를 포함하는 것인 제품.
KR1020160145904A 2015-11-05 2016-11-03 필드 기재사항의 오디오 입력 KR20170053127A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/933,796 US9996517B2 (en) 2015-11-05 2015-11-05 Audio input of field entries
US14/933,796 2015-11-05

Publications (1)

Publication Number Publication Date
KR20170053127A true KR20170053127A (ko) 2017-05-15

Family

ID=57286232

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160145904A KR20170053127A (ko) 2015-11-05 2016-11-03 필드 기재사항의 오디오 입력

Country Status (7)

Country Link
US (1) US9996517B2 (ko)
EP (1) EP3166012A1 (ko)
KR (1) KR20170053127A (ko)
CN (1) CN107066226A (ko)
DE (1) DE102016120744A1 (ko)
GB (1) GB2545320B (ko)
TW (1) TWI668629B (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10657200B2 (en) 2016-01-05 2020-05-19 Adobe Inc. Proactive form guidance for interacting with electronic forms
US10460024B2 (en) * 2016-01-05 2019-10-29 Adobe Inc. Interactive electronic form workflow assistant that guides interactions with electronic forms in a conversational manner
CN109656510B (zh) * 2017-10-11 2021-12-07 腾讯科技(深圳)有限公司 一种网页中语音输入的方法及终端
CN109840318B (zh) * 2019-01-04 2023-12-01 上海上湖信息技术有限公司 一种表单项的填写方法及***
US11594218B2 (en) * 2020-09-18 2023-02-28 Servicenow, Inc. Enabling speech interactions on web-based user interfaces
CN113380234B (zh) * 2021-08-12 2021-12-17 明品云(北京)数据科技有限公司 基于语音识别生成表单的方法、装置、设备及介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1122636A3 (en) 2000-02-03 2007-11-14 Siemens Corporate Research, Inc. System and method for analysis, description and voice-driven interactive input to html forms
US6587824B1 (en) 2000-05-04 2003-07-01 Visteon Global Technologies, Inc. Selective speaker adaptation for an in-vehicle speech recognition system
US7406657B1 (en) 2000-09-22 2008-07-29 International Business Machines Corporation Audible presentation and verbal interaction of HTML-like form constructs
US6834264B2 (en) 2001-03-29 2004-12-21 Provox Technologies Corporation Method and apparatus for voice dictation and document production
US6996528B2 (en) * 2001-08-03 2006-02-07 Matsushita Electric Industrial Co., Ltd. Method for efficient, safe and reliable data entry by voice under adverse conditions
US6882974B2 (en) * 2002-02-15 2005-04-19 Sap Aktiengesellschaft Voice-control for a user interface
WO2004072846A2 (en) 2003-02-13 2004-08-26 Koninklijke Philips Electronics N.V. Automatic processing of templates with speech recognition
US8301436B2 (en) * 2003-05-29 2012-10-30 Microsoft Corporation Semantic object synchronous understanding for highly interactive interface
US7389236B2 (en) 2003-09-29 2008-06-17 Sap Aktiengesellschaft Navigation and data entry for open interaction elements
US7870000B2 (en) * 2007-03-28 2011-01-11 Nuance Communications, Inc. Partially filling mixed-initiative forms from utterances having sub-threshold confidence scores based upon word-level confidence data
US9047869B2 (en) 2008-04-07 2015-06-02 Nuance Communications, Inc. Free form input field support for automated voice enablement of a web page
JP5754177B2 (ja) 2011-03-03 2015-07-29 日本電気株式会社 音声認識装置、音声認識システム、音声認識方法及びプログラム
US20120323574A1 (en) * 2011-06-17 2012-12-20 Microsoft Corporation Speech to text medical forms
US8255218B1 (en) 2011-09-26 2012-08-28 Google Inc. Directing dictation into input fields
US8909536B2 (en) * 2012-04-20 2014-12-09 Nuance Communications, Inc. Methods and systems for speech-enabling a human-to-machine interface
US9406089B2 (en) * 2013-04-30 2016-08-02 Intuit Inc. Video-voice preparation of electronic tax return
US20150149354A1 (en) 2013-11-27 2015-05-28 Bank Of America Corporation Real-Time Data Recognition and User Interface Field Updating During Voice Entry

Also Published As

Publication number Publication date
US9996517B2 (en) 2018-06-12
TWI668629B (zh) 2019-08-11
GB2545320B (en) 2020-08-05
US20170132191A1 (en) 2017-05-11
GB2545320A (en) 2017-06-14
EP3166012A1 (en) 2017-05-10
TW201716987A (zh) 2017-05-16
GB201618332D0 (en) 2016-12-14
CN107066226A (zh) 2017-08-18
DE102016120744A1 (de) 2017-05-11

Similar Documents

Publication Publication Date Title
US11138971B2 (en) Using context to interpret natural language speech recognition commands
KR20170053127A (ko) 필드 기재사항의 오디오 입력
US9524428B2 (en) Automated handwriting input for entry fields
US10770060B2 (en) Adaptively learning vocabulary for completing speech recognition commands
US20150149163A1 (en) Voice input correction
US10649635B2 (en) Multi-modal fusion engine
GB2541297B (en) Insertion of characters in speech recognition
US20160110327A1 (en) Text correction based on context
CN107643909B (zh) 用于协调多个本地设备上的输入的方法和电子设备
CN108073275B (zh) 信息处理方法、信息处理设备及程序产品
US10896287B2 (en) Identifying and modifying specific user input
US20150169214A1 (en) Graphical input-friendly function selection
US10032071B2 (en) Candidate handwriting words using optical character recognition and spell check
US10592096B2 (en) Cursor indicator for overlay input applications
US10510350B2 (en) Increasing activation cue uniqueness
US9613263B2 (en) Ink stroke grouping based on stroke attributes
US20170116174A1 (en) Electronic word identification techniques based on input context
US20190050391A1 (en) Text suggestion based on user context
US20150205518A1 (en) Contextual data for note taking applications
US9606973B2 (en) Input correction enhancement
US9298692B2 (en) Real time data tagging in text-based documents
US20180364809A1 (en) Perform function during interactive session
US11741951B2 (en) Context enabled voice commands
US20160147407A1 (en) Modifying content with single modifier key

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal