KR20080083290A - 디지털 파일의 컬렉션에서 디지털 파일을 액세스하기 위한방법 및 장치 - Google Patents

디지털 파일의 컬렉션에서 디지털 파일을 액세스하기 위한방법 및 장치 Download PDF

Info

Publication number
KR20080083290A
KR20080083290A KR1020087015673A KR20087015673A KR20080083290A KR 20080083290 A KR20080083290 A KR 20080083290A KR 1020087015673 A KR1020087015673 A KR 1020087015673A KR 20087015673 A KR20087015673 A KR 20087015673A KR 20080083290 A KR20080083290 A KR 20080083290A
Authority
KR
South Korea
Prior art keywords
file
information
digital
metadata
language
Prior art date
Application number
KR1020087015673A
Other languages
English (en)
Inventor
치 파이 츄
힝 파이 루이스 총
칭 와이 지미 리
홍 충 륭
데니스 치 와이 위
웨이 토 윌리엄 왕
Original Assignee
크리에이티브 테크놀로지 엘티디
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 크리에이티브 테크놀로지 엘티디 filed Critical 크리에이티브 테크놀로지 엘티디
Publication of KR20080083290A publication Critical patent/KR20080083290A/ko

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/433Query formulation using audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

전자 장치에서, 둘 이상의 디지털 파일을 포함하는 컬렉션으로부터 하나 이상의 디지털 파일을 액세스하기 위한 방법이 존재하며, 상기 방법은, 상기 컬렉션의 둘 이상의 디지털 파일 각각으로부터 획득된 정보 엔트리(information entry)를 포함하는 하나의 인덱스를 생성하는 단계(이때, 컬렉션의 각각의 디지털 파일의 정보가 하나 이상의 정보 엔트리로 링크된다)와, 음성 수신 모드(speech reception mode) 동안, 하나 이상의 언어로 존재하는, 말하는 사람(speaker)에 독립적인 음성 입력(speech input)을 수신하는 단계와, 상기 음성 입력의 언어를 판단하는 단계와, 음성 수신 모드를 음성 입력의 언어로 설정하는 단계와, 상기 음성 수신 모드 동안 수신된 음성 입력을 상기 인덱스의 엔트리와 비교하는 단계를 포함하며, 이때, 상기 음성 입력이 상기 인덱스의 정보 엔트리 중 하나 이상과 일치할 때, 파일이 액세스된다. 이러한 방법을 수행할 수 있는 장치가 또한 제시된다.

Description

디지털 파일의 컬렉션에서 디지털 파일을 액세스하기 위한 방법 및 장치{A METHOD AND APPARATUS FOR ACCESSING A DIGITAL FILE FROM A COLLECTION OF DIGITAL FILES}
본 발명은 디지털 파일들의 컬렉션으로부터 하나의 디지털 파일을 액세스하기 위한 방법 및 장치에 관한 것이며, 세부적으로는 음성 입력(speech input)을 이용하여, 파일을 액세스하는 것에 관련된 것이다.
음성에 의해 활성화되는 제어 메커니즘을 갖는 장치의 인기가 꾸준히 증가하고 있다. “목소리 다이얼(voice dial)”을 갖는 모바일 폰과 음성에 의해 활성화되는 장난감이 오늘날 사용자가 쉽게 찾을 수 있는 이들 장치 중 일부이다.
그러나 이러한 장치는 보통, 음성 입력을 특정한 엔트리(모바일 폰에서, 엔트리는 특정 개체의 접속 번호이다)와 연계하기 위한 선-프로그래밍(pre-programming)을 필요로 한다. 이는, 많은 수의 개체, 예를 들면, 주소록 및 미디어 파일의 컬렉션에 속한 개체를 포함할 때 장황한 프로세스가 될 수 있다. 이는 이러한 특징을 불편함으로 인해 사용자에게 바람직하지 않게 할 수 있다.
오늘날은 선-프로그래밍이 필요 없는 일부 장치에 내장되는 음성 인식 기능이 존재한다. 그러나 강한 악센트의, 또는 우물거리는 영어를 인지하는 어려움을 극복하기에는 기술이 충분히 발달되어 있지 못하다. 덧붙이자면, 영어가 오늘날의 디지털 시대의 상호 연결된 글로벌 마을을 위해 선택된 언어이지만, 사용될 수 있는 유일한 언어는 아니다. 세계에서 인구가 많은 국가, 가령, 중국과 인도에는 우세하게 영어를 말하는 인구가 존재하지 않으며, 스마트 음성 인식 기능을 갖는 이들 장치는 이들 국가에서는 널리 적용되지 않을 수 있다. 그들의 욕구가 특정하게 충족되지 않는다면, 이 거대한 소비 시장은 기업에 있어서는 기회 상실을 나타낸다.
현재, 이러한 “스마트(smart)”장치는 다수의 언어 인식 능력을 갖지 않는다. 마찬가지로, 이러한 장치의 제조업자는 동일한 제품의 여러 다른 버전을, 영어가 아닌 다른 언어 능력을 갖는 시장을 위해 만들 것을 요구당하며, 이는 각각의 장치를 제조하는 비용을 증가시키는데, 왜냐하면 전용 제품 라인/설비가 필요하기 때문에, 또는 다른 버전을 생산하는 것이 요구될 때, 영어 버전을 위한 제품 라인/설비가 수정될 필요가 있기 때문이다.
복수개의 언어 인식 능력을 갖는 “스마트” 장치가 서로 다른 문자 코드 세트(가령, 앵글로 알파벳 기반의 언어를 위한 ASCII, 번자체(한자)를 위한 Big-5, 간자체(한자)를 위한 GB, 일본어를 위한 JIS 등)를 적정하게 관리하고, 통제하는 것이 또한 도전 과제이다.
본 발명의 첫 번째 양태에서, 전자 장치에서, 둘 이상의 디지털 파일을 포함하는 컬렉션으로부터 하나 이상의 디지털 파일을 액세스하기 위한 방법이 존재하며, 상기 방법은, 상기 컬렉션의 둘 이상의 디지털 파일 각각으로부터 획득된 정보 엔트리(information entry)를 포함하는 하나의 인덱스를 생성하는 단계(이때, 컬렉션의 각각의 디지털 파일의 정보가 하나 이상의 정보 엔트리로 링크된다)와, 음성 수신 모드(speech reception mode) 동안, 하나 이상의 언어로 존재하는, 말하는 사람(speaker)에 독립적인 음성 입력(speech input)을 수신하는 단계와, 상기 음성 입력의 언어를 판단하는 단계와, 음성 수신 모드를 음성 입력의 언어로 설정하는 단계와, 상기 음성 수신 모드 동안 수신된 음성 입력을 상기 인덱스의 엔트리와 비교하는 단계를 포함하며, 이때, 상기 음성 입력이 상기 인덱스의 정보 엔트리 중 하나 이상과 일치할 때, 파일이 액세스된다. 상기 디지털 파일은 전자 장치, 또는 상기 전자 장치로 기능적으로 연결되는 임의의 장치, 또는 이들의 조합으로 저장될 수 있다. 하나 이상의 디지털 파일이 소스로부터 수신될 수 있으며, 상기 소스는 메모리 장치, 또는 유선 컴퓨터 네트워크, 또는 무선 컴퓨터 네트워크 중에서 선택될 수 있다.
바람직하게는, 상기 디지털 파일은 문서, 스프레드쉬트, 재생목록, 폴더, 음악 파일, 이미지 파일 및 비디오 파일일 수 있다. 또한, 상기 정보 엔트리가 하나 이상의 단어를 포함하고, 디지털 파일의 정보, 가령, 파일 이름, 파일 확장자, 파일의 메타데이터 중 노래 제목, 파일의 메타데이터 중 아티스트 이름, 파일의 메타데이터 중 축약된 노래 제목(truncated song title), 파일의 메타데이터 중 축약된 아티스트 이름, 축약된 노래 제목, 대안적 노래 제목(alternative song title)를 획득할 수 있다. 상기 정보 엔트리는 임의의 언어로 존재할 수 있다.
음성 입력은 하나의 언어로 존재하거나, 하나 이상의 언어의 구로 존재할 수 있다. 음성 수신 모드는 수동, 또는 자동으로 설정될 수 있다.
바람직하게는, 전자 장치는 데스크탑 컴퓨터, 노트북 컴퓨터, PDA, 휴대용 미디어 재생기, 또는 모바일 폰일 수 있다. 전자 장치에서의 하나 이상의 디지털 파일을 액세스하기 위한 기능은 미리 지정된 버튼을 1회 이상 누름에 의한 것일 수 있다.
본 발명의 두 번째 양태에서, 둘 이상의 디지털 파일을 포함하는 컬렉션의 하나 이상의 디지털 파일을 액세스하기 위한 장치가 존재하며, 이때 상기 컬렉션은 상기 장치 내에 저장되어 있다. 상기 장치는, 상기 컬렉션의 둘 이상의 디지털 파일 각각으로부터 얻어진 정보 엔트리(information entry)를 포함하는 하나의 인덱스를 생성하기 위한 인덱서(indexer)(이때, 상기 컬렉션의 각각의 디지털 파일의 정보는 하나 이상의 정보 엔트리로 링크된다)와, 음성 수신 모드(speech reception mode) 동안, 하나 이상의 언어로 존재하는, 말하는 사람(speaker)에 독립적인 음성 입력을 수신하기 위한 음성 수신 수단(speech reception mean)과, 음성 입력의 언어를 판단하기 위한 프로세서를 포함하며, 이때, 상기 프로세서가 음성 수신 모드 동안 수신된 음성 입력을 상기 인덱스의 엔트리와 비교한다. 바람직하게는, 상기 음성 입력이 상기 인덱스의 정보 엔트리 중 하나 이상과 일치할 때, 파일이 액세스된다. 상기 장치는, 데스크탑 컴퓨터, 노트북 컴퓨터, PDA, 휴대용 미디어 재생기 및 모바일 폰일 수 있다.
상기 음성 수신 수단이 마이크로폰인 것이 바람직하다. 음성 입력의 언어는 자동으로, 또는 수동으로 선택될 수 있다. 상기 음성 입력은 임의의 언어, 또는 하나 이상의 언어의 구일 수 있다.
상기 정보 엔트리는 임의의 언어로 존재하는 하나 이상의 단어를 포함하는 것이 바람직하다. 상기 정보 엔트리는 디지털 파일의 정보, 예를 들면, 파일 이름, 파일 확장자, 파일의 메타데이터 중 노래 제목, 파일의 메타데이터 중 아티스트 이름, 파일의 메타데이터 중 축약된 노래 제목(truncated song title), 파일의 메타데이터 중 축약된 아티스트 이름, 축약된 노래 제목, 대안적 노래 제목(alternative song title)를 획득할 수 있다.
상기 장치는 1회 이상 누름으로써, 디지털 파일을 액세스하기 위한 기능을 활성화시키기 위한 하나 이상의 버튼을 포함할 수 있다. 상기 장치는 디스플레이를 포함하는 것이 바람직하다.
도 1은 본 발명의 바람직한 실시예의 절차의 흐름도이다.
도 2는 본 발명의 바람직한 실시예의 장치의 개념도이다.
도 3은 도 1의 음성 처리 절차(36)를 확대한 것이다.
다음은 본 발명이 구현될 수 있는 적합한 컴퓨팅 환경에 대한 간략하고 포괄적인 기재를 제공하기 위한 의도를 갖는다. 요청되지 않을지라도, 본 발명은 컴퓨터에 의해 실행될 수 있는 인스트럭션, 가령 개인용 컴퓨터에 의해 실행되는 프로그램 모듈의 일반적인 맥락으로 설명될 것이다. 일반적으로, 프로그램 모듈은 특정 작업을 수행하거나 특정한 추상 데이터 타입을 구현하기 위한 루틴, 프로그램, 문자(character), 컴포넌트, 데이터 구조를 포함한다. 당해업계 종사자라면, 본 발명이 그 밖의 다른 컴퓨터 시스템 구성(예를 들어, 핸드-헬드 장치, 멀티프로세서 시스템, 마이크로프로세서 기반 전자장치, 또는 프로그램가능한 소비자 전자장치, 네트워크 PC, 미니컴퓨터, 메인프레임 컴퓨터 등)을 이용하여 실시될 수 있음을 인지할 것이다. 또한 본 발명은 통신 네트워크를 통해 링크되어 있는 원격 프로세싱 장치에 의해 작업이 수행되는 분산 컴퓨팅 환경에서 실시될 수 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈은 로컬 메모리 저장 장치와 원격 메모리 저장 장치 모두에 위치할 수 있다.
도 1을 참조하여, 전자 장치에서, 둘 이상의 디지털 파일을 포함하는 컬렉션 중에서 하나 이상의 디지털 파일을 액세스하기 위한 방법의 바람직한 실시예를 나타내는 흐름도가 도시되어 있다. 상기 전자 장치는 예를 들어, 데스크톱 컴퓨터, 노트북 컴퓨터, PDA, 휴대용 미디어 플레이어, 또는 모바일 폰일 수 있다. 컬렉션의 디지털 파일은 문서, 스프레드시트, 재생목록(playlist), 폴더, 음악 파일 및 비디오 파일을 포함할 수 있다. 도 1에서 도시된 실시예에서, 컬렉션에 저장된 디지털 파일은 미디어 파일(이미지, 음악 및 비디오 파일)이다. 하나 이상의 디지털 파일이 예를 들어, 메모리 장치, 유선 컴퓨터 네트워크, 또는 무선 컴퓨터 네트워크 등의 소스로부터 수신될 수 있다. 전자 장치 내의 메모리 장치에, 또는 상기 전자 장치로 연결될 수 있는 메모리 장치에 디지털 파일의 컬렉션이 존재할 수 있다. 메모리 장치는 비-휘발성 메모리일 수 있고, 플래시 메모리, 또는 하드 디스크 드 라이브 중 하나일 수 있다.
첫째, 음성 수신 모드(speech reception mode)를 활성화할 수 있는 기능부가 전자 장치에서 활성화된다(20). 상기 전자 장치는 메뉴를 보여주는 디스플레이를 가질 수 있으며, 상기 메뉴로부터 이 기능부가 선택될 수 있다. 또는 상기 장치는 음성 수신 모드를 활성화하기 위해 1회 이상 눌러지는 바로가기 스위치/버튼을 가질 수 있다. 이때, 사용자는 음성 입력을 위해 하나의 특정 언어, 또는 다수의 언어들을 수동으로 선택할 수 있다(22). 이는 음성 입력을 처리함에 있어, 장치를 보조한다. 특정 언어의 각각의 사투리, 예를 들자면, 광둥어, 테오추(Teochew) 및 호키엔(Hokkien)의 중국어 사투리가 그 밖의 다른 언어들 사이에서 구별되는 언어이도록 고려되어질 수 있다.
음성 수신 모드를 활성화시키는 것에 이어서, 전자 장치에서, 컬렉션의 파일을 액세스하기 위한 음성 입력이 들어오기에 앞서서, 컬렉션의 디지털 파일을 액세스하기 위한 시스템이 설치된다(24). 설치 프로세스 동안, 컬렉션의 파일의 정보를 이용하여, 임의의 정보 인덱스의 존재를 확인하기 위한 체크가 있다(26).
어떠한 인덱스도 발견되지 않는 경우, 또는 더 적은 디지털 파일이 검출된 경우(파일이 삭제된 경우), 또는 새로운 디지털 파일이 검출된 경우, 전자 장치의 미디어 파일 및 임의의 연결된 메모리 장치의 미디어 파일이 검색되어진다(28). 각각의 파일로부터 추출되어지고(25) 인덱싱된 정보는, 파일 이름, 파일 확장자, 파일 메타데이터 중 노래 제목, 파일 메타데이터 중 아티스트 이름, 파일 메타데이터 중 축약된 노래 제목(truncated song title), 파일 메타데이터 중 축약된 아티스트 이름, 대안적 노래 제목(alternative song title)을 포함할 수 있다. 또한 앞서 언급된 정보는 대안적인 소스, 예를 들면, 인터넷, 또는 (상기 전자 장치가 대안적 소스로 연결되는 경우) 호스트로부터 얻어질 수 있다. 각각의 정보 엔트리는 하나 이상의 단어를 포함하여야 한다. 추출된 정보는 임의의 언어로 존재할 수 있으며, 앵글로 알파벳 기반일 필요는 없다. 중국 문자의 다양한 형태(간자체 및 번자체), 일본 문자의 다양한 형태(한자, 히라가나 및 가타카나), 한국 문자, 이슬람 문자 등이 모두 정보 인덱스에서 추출될 수 있고, 저장될 수 있다. 또한 앞서 언급된 비-영어 문자의 영어로의 음역이 상기 정보 인덱스에 저장될 수 있다. 또한 앞서 언급된 비-영어 문자의 영어로의 번역이 또한, 상기 번역 정보가 파일 메타데이터에 포함되는 경우, 정보 인덱스에 저장될 수 있다. 다양한 경로를 통해(가령, 아티스트 이름, 노래 제목, 파일 이름 등에 의해) 파일이 액세스될 수 있도록, 각각의 디지털 파일이 정보 인덱스에서 다수의 정보 엔트리를 갖는 것이 가능할 수 있다. 더 적은 개수의 파일이 검출되는 경우, 인덱스를 생성할 때, 존재하지 않는 파일의 정보 엔트리는 제거된다. 또한 사용자는 특정 노래에게 대안적 제목(alternative title)을 부여할 수 있고, 이러한 대안적 제목이 또한 인덱스에 포함될 수 있다. 미디어 파일에 대한 모든 정보가 수집된 후, 문자 코드셋 식별 기능(27)이 각각의 미디어 파일의 정보를 분석하고, 각각의 파일에서 사용되는 하나 이상의 코드셋을 식별한다.
그 후, 전자 장치 및 기능적으로 연결되는 메모리 장치의 각각의 디지털 파일로부터의 모든 정보 엔트리의 인덱스가, 문자 코드셋 정보와 함께, 전자 장치에 서 형성되며(30), 인덱스의 구축이 뒤따르고, 상기 인덱스의 정보 엔트리가 액세스 가능하도록, 상기 인덱스는 전자 장치로 로딩된다(32). 또한 어떠한 새로운 디지털 파일도 검출되지 않는 경우와, 정보 인덱스가 구축된 때 어떠한 디지털 파일도 삭제되지 않은 경우, 정보 인덱스의 존재가 확인 된 후(26), 상기 정보 인덱스가 로딩될 수 있다(32).
앞서 언급된 단계에 대하여 요구되는 지속시간은 데이터 프로세싱 속도, 메모리 I/O 속도 및 네트워크/원격 서버 대기시간(latency)에 따라 좌우된다. 디지털 파일이 커질수록, 처리해야할 데이터의 크기 때문에, 앞서 언급된 단계들에 대하여 요구되는 시간이 더 길어진다.
이 시점에서, 전자 장치는 음성 입력을 수신하도록 준비가 된다. 사용자에게 소리 수신 모드(sound reception mode)로 음성 입력을 수신할 준비가 되었음을 알려주기 위해, 상기 전자 장치는 들을 수 있는 경보를 내거나, 시각적인 경보를 보여줄 수 있다. 상기 음성 입력은 말하는 사람에 독립적이다. 어떠한 선-녹음(pre-recording)이 요구되지 않으며, 상기 전자 장치는 기본적으로 “픽-앤-유즈(pick-and-use)”이다. 본 방법의 음성 처리(speech processing)는 임의의 특정한 액센트, 또는 우물거림에도 불구하고, 음성 입력을 구별할 수 있기에 충분히 강력(robust)하다. 상기 음성은 전자 장치로 입력된다(34). 음성 입력은 하나의 언어로 존재할 수 있다. 또한 상기 음성 입력은 둘 이상의 언어를 포함하는 구일 수 있다. 예를 들어, “帝女 flower”와 같은 노래 제목이 허용될 수 있고, 처리될 수 있다. 자신의 메타데이터에서 번역된 제목을 갖는 디지털 파일에 대하여, 원래의 제목과 번역된 제목 중 하나를 사용함으로써, 동일한 디지털 파일로의 액세스를 허용할 수 있다. 예를 들어, “愛是不保留”, 또는 “No Reserve In Love”에 의해, 동일한 디지털 파일을 액세스할 수 있다.
음성이 전자 장치로 입력된 후, 상기 음성이 처리된다(36). 미리 수동으로 언어 선택(22)이 이뤄지지 않았으면, 음성 입력의 언어가 결정되며, 음성 입력의 언어와 관련되는 적절한 음성 수신 모드가 자동으로 설정된다. 언어 선택이 수동으로 설정되는 경우, 이에 상응하여 사용자에 의해 특정되는 언어 모델이 로딩될 것이다. 이로 인해서, 음성 입력에 대한 정확한 판단이 가능해진다. 도 3을 참조하면, 음성이 자동으로 처리되는 시퀀스가 설명된다. 단계(25)에서 획득된 미디어 헤더 정보(media header information, 361)와, 단계(27)에서 획득된 문자 코드셋(362)과, 단계(29)에서 원격 소스로부터 수집되는 미디어 정보(363)가 언어 인식 식별 기능(language recognition identification function)으로 입력되어(364), 가장 적절한 음성 인식 언어 모델이 로딩된다(365). 예를 들어, 언어 인식 식별 기능이 미디어 파일에서 사용되는 코드셋이, 원본의 국가가 USA(United State of America)와 PRC(Peoples' Republic of China)인 ASCII 및 GB라고 판단한 경우, 음성 인식을 위해, USA 영어 언어 모델과 PRC 북경어 모델이 모두 로딩될 것이다. 그 후, 음성 입력이 추가로 “필터링”되며(366), 여기서, 중요한 미디어 정보, 예를 들면, 노래 제목, 아티스트 및 앨범이 상기 음성 입력으로부터 추출되어, 음성 인식의 대상으로서 음성 인식기(speech recognizer)로 제공되어질 수 있다. 예를 들어, “Sharon Lau의 愛是不保留를 재생하라”라는 음성 입력을 이용하여, “愛是不 保留”가 노래 제목 정보로서 추출되고, 지능적이게도 “Sharon Lau”는 아티스트 정보로서 추출될 것이다. 그 후, 이렇게 추출된 정보가 음성 인식 풀(speech recognition pool)로 추가된다(367). 또한 상기 음성 입력에 대하여 필터링이 행해져서, 언어의 수동 선택(22)이 이뤄질 때, 인식된 음성 풀로의 엔트리가 판단될 수 있다.
음성 입력을 처리하고, 인식된 음성 풀로의 엔트리를 확인하는 것에 이어서, 상기 입력이 인덱스의 정보 엔트리와 비교된다(38). 입력과 하나 이상의 정보 엔트리 간의 일치가 이뤄질 때, 정보 엔트리로 링크되는 하나 이상의 디지털 파일이 사용자의 선택을 위해 디스플레이된다(40). 보여지는 하나 이상의 디지털 파일은 결과 리스트일 수 있고, 사용자가 원하는 노래를 선택하거나(42), 원하는 재생목록을 선택하거나(44), 또는 원하는 아티스트로부터 선택할 수 있다(46). 이들 옵션은 설명을 위한 목적만 가질 뿐이며, 제한하기 위한 것이 아니다. 도 2를 참조하면, 상기 장치(50) 내에 저장된 둘 이상의 디지털 파일을 포함하는 컬렉션으로부터 하나 이상의 디지털 파일을 액세스하기 위한 장치(50)가 도시된다. 상기 장치(50)는, 예를 들어, 데스크탑 컴퓨터, 노트북 컴퓨터, PDA, 휴대용 미디어 재생기, 또는 모바일 폰일 수 있다. 상기 디지털 파일은, 예를 들어, 문서, 스프레드시트(spreadsheet), 재생목록(playlist), 폴더, 음악 파일, 또는 비디오 파일일 수 있다. 하나 이상의 디지털 파일이 소스(source)로부터 수신될 수 있으며, 상기 소스는 예를 들어, 메모리 장치, 유선 컴퓨터 네트워크, 또는 무선 컴퓨터 네트워크일 수 있다. 디지털 파일의 컬렉션은 장치(50)에 포함되는 메모리 장치(58) 안에 존재할 수 있거나, 또는 디지털 파일은 상기 장치(50)로 연결될 수 있는 별도의 메모리 장치 안에 존재할 수 있다. 메모리 장치는 비-휘발성 메모리일 수 있고, 플래시 메모리, 또는 하드 디스크 드라이브일 수 있다. 디지털 파일을 액세스하는 기능을 활성화시키기 위해, 상기 장치(50)는 이러한 기능을 활성화시킬 수 있는 메뉴를 보여주는 디스플레이(54)를 가질 수 있다. 또는 장치(50)는 상기 기능을 활성화시키기 위해 한 번 이상 눌러지는 바로가기 스위치/버튼(도면상 도시되지 않음)을 가질 수 있다.
장치(50)는 다양한 구성요소를 포함하기 위한 하우징(52)을 가질 수 있다. 상기 장치(50)는 상기 장치(50)의 정보(예를 들어, 장치(50)에 저장된 파일에 대한 정보, 또는 장치(50)로 액세스할 수 있는 파일에 대한 정보)를 디스플레이하기 위한 디스플레이(54)를 가질 수 있다. 컬렉션의 둘 이상의 디지털 파일 각각으로부터 획득되는 정보 엔트리를 포함하는 인덱스를 발생시키기 위한 인덱서(56)가 존재할 수 있다. 상기 정보 엔트리는 하나 이상의 단어를 포함할 수 있고, 임의의 언어로 존재할 수 있다. 각각의 파일로부터 추출되고 인덱싱된 정보는, 파일 이름, 파일 확장자, 파일 메타데이터 중 노래 제목, 파일 메타데이터 중 아티스트 이름, 파일 메타데이터 중 축약된 노래 제목(truncated song title), 파일 메타데이터 중 축약된 아티스트 이름, 대안적 노래 제목(alternative song title) 중 하나 이상을 포함할 수 있다. 각각의 정보 엔트리는 하나 이상의 단어를 포함해야 한다. 추출된 정보는 임의의 언어로 존재할 수 있으며, 앵글로 알파벳 기반일 필요는 없다. 중국 문자의 다양한 형태(간자체 및 번자체), 일본 문자의 다양한 형태(한자, 히라가나 및 가타카나), 한국 문자, 이슬람 문자 등이 모두 정보 인덱스에서 추출될 수 있고, 저장될 수 있다. 또한 앞서 언급된 비-영어 문자의 영어로의 음역이 상기 정보 인덱스에 저장될 수 있다. 또한 앞서 언급된 비-영어 문자의 영어로의 번역이 또한, 상기 번역 정보가 파일 메타데이터에 포함되는 경우, 정보 인덱스에 저장될 수 있다. 다양한 경로를 통해(가령, 아티스트 이름, 노래 제목, 파일 이름 등에 의해) 파일이 액세스될 수 있도록, 각각의 디지털 파일이 정보 인덱스에서 다수의 정보 엔트리를 갖는 것이 가능할 수 있다. 또한 사용자는 특정 노래에게 대안적 제목(alternative title)을 부여할 수 있고, 이러한 대안적 제목이 또한 인덱스에 포함될 수 있다.
덧붙이자면, 장치(50)는, 음성 수신 모드 동안 하나 이상의 언어로 된 음성 입력을 수신하기 위한 음성 수신 수단(60)을 포함할 수 있다. 음성 수신 수단은 마이크로폰, 또는 오디오 신호의 입력을 가능하게 하는 그 밖의 다른 임의의 장치일 수 있다. 상기 음성 수신 수단(60)은 음성 입력을 프로세서(62)에게 전달한다. 상기 음성 입력은 하나의 언어로 존재할 수 있다. 또한 상기 음성 입력은 둘 이상의 언어를 포함하는 구일 수 있다. 예를 들어, “帝女 flower”가 이해될 수 있다. 자신의 메타데이터에 번역된 제목을 갖는 디지털 파일에 대하여 원래의 제목과 번역된 제목 중 하나를 사용함으로써, 동일한 디지털 파일로의 액세스를 허용할 수 있다. 예를 들어, “愛是不保留”, 또는 “No Reserve In Love”에 의해, 동일한 디지털 파일을 액세스할 수 있다. 상기 프로세서(62)는 음성 입력의 언어를 자동으로 결정할 수 있다. 또한 프로세서(62)가 작업을 자동으로 수행할 필요가 없도록, 상 기 장치(50)가 음성 입력의 언어를 수동으로 설정할 수 있다. 또한 상기 프로세서(62)는 음성 수신 모드 동안 수신된 음성 입력을 인덱스의 엔트리와 비교하기 위해 사용될 수 있다. 상기 음성 입력은 말하는 사람에 독립적이다. 어떠한 선-녹음(pre-recording)이 요구되지 않으며, 상기 전자 장치는 기본적으로 “픽-앤-유즈(pick-and-use)”이다. 본 방법의 음성 처리(speech processing)는 임의의 특정한 액센트, 또는 우물거림에도 불구하고, 음성 입력을 구별할 수 있기에 충분히 강력(robust)하다. 입력과 하나 이상의 정보 엔트리 간의 일치가 이뤄질 때, 정보 엔트리로 링크되는 하나 이상의 디지털 파일이 사용자의 선택을 위해 디스플레이(54) 상에서 보여진다. 보여지는 디지털 파일은 결과 리스트일 수 있고, 사용자는 원하는 노래를 선택할 수 있으며, 원하는 재생목록, 또는 원하는 아티스트의 노래를 선택할 수 있다. 이들 옵션은 설명을 위한 목적만 가질 뿐이며, 제한하기 위한 것이 아니다.
도 2의 화살표는 장치(50)의 다양한 구성요소 간의 데이터 흐름의 방향을 나타낸다.

Claims (23)

  1. 전자 장치에서, 둘 이상의 디지털 파일을 포함하는 컬렉션으로부터 하나 이상의 디지털 파일을 액세스하기 위한 방법에 있어서, 상기 방법은
    - 상기 컬렉션의 둘 이상의 디지털 파일 각각으로부터 획득된 정보 엔트리(information entry)를 포함하는 하나의 인덱스를 생성하는 단계로서, 이때, 컬렉션의 각각의 디지털 파일의 정보가 하나 이상의 정보 엔트리로 링크되는 단계,
    - 음성 수신 모드(speech reception mode) 동안, 하나 이상의 언어로 존재하는, 말하는 사람(speaker)에 독립적인 음성 입력(speech input)을 수신하는 단계,
    - 상기 음성 입력의 언어를 판단하는 단계,
    - 음성 수신 모드를 음성 입력의 언어로 설정하는 단계, 그리고
    - 상기 음성 수신 모드 동안 수신된 음성 입력을 상기 인덱스의 엔트리와 비교하는 단계
    를 포함하며, 이때, 상기 음성 입력이 상기 인덱스의 정보 엔트리 중 하나 이상과 일치할 때, 파일이 액세스되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 방법.
  2. 제 1 항에 있어서, 상기 디지털 파일은 문서, 또는 스프레드시트(spreadsheet), 또는 재생목록(playlist), 또는 폴더, 또는 음악 파일, 또는 이미지 파일, 또는 비디오 파일 중에서 선택되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 방법.
  3. 제 1 항에 있어서, 상기 정보 엔트리는 하나 이상의 단어를 포함하는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 방법.
  4. 제 1 항에 있어서, 상기 정보 엔트리는 정보를 획득할 수 있으며, 상기 정보는
    디지털 파일로부터의 파일 이름, 파일 확장자, 파일의 메타데이터 중 노래 제목, 파일의 메타데이터 중 아티스트 이름, 파일의 메타데이터 중 축약된 노래 제목(truncated song title), 파일의 메타데이터 중 축약된 아티스트 이름, 축약된 노래 제목, 대안적 노래 제목(alternative song title)과,
    원격 소스(remote source)로부터의 파일 이름, 파일 확장자, 파일의 메타데이터 중 노래 제목, 파일의 메타데이터 중 아티스트 이름, 파일의 메타데이터 중 축약된 노래 제목(truncated song title), 파일의 메타데이터 중 축약된 아티스트 이름, 축약된 노래 제목, 대안적 노래 제목(alternative song title)
    중에서 선택되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 방법.
  5. 제 1 항에 있어서, 상기 정보 엔트리는 임의의 언어로 존재하며, 하나 이상의 문자 코드셋(character codeset)에 따르는 것을 늑징으로 하는 디지털 파일을 액세스하기 위한 방법.
  6. 제 1 항에 있어서, 상기 음성 입력은 하나의 언어로 존재하거나, 하나 이상의 언어의 구(phrase)로 존재하는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 방법.
  7. 제 1 항에 있어서, 상기 디지털 파일은 전자 장치, 또는 상기 전자 장치로 기능적으로 연결되는 임의의 장치, 또는 이들의 조합 중에서 선택된 소스(source)에 저장되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 방법.
  8. 제 1 항에 있어서, 수동 선택(manual selection), 또는 자동 선택(automatic selection) 중에서 선택되는 수단에 의해, 상기 음성 수신 모드의 언어가 설정되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 방법.
  9. 제 1 항에 있어서, 상기 하나 이상의 디지털 파일은, 메모리 장치, 또는 유선 컴퓨터 네트워크, 또는 무선 컴퓨터 네트워크 중에서 선택되는 소스로부터 수신되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 방법.
  10. 제 1 항에 있어서, 상기 전자 장치는, 데스크탑 컴퓨터, 또는 노트북 컴퓨터, 또는 PDA, 또는 휴대용 미디어 재생기, 또는 모바일 폰 중에서 선택되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 방법.
  11. 제 1 항에 있어서, 상기 음성 입력은 필터링되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 방법.
  12. 둘 이상의 디지털 파일을 포함하는 컬렉션의 하나 이상의 디지털 파일을 액세스하기 위한 장치에 있어서, 이때 상기 컬렉션은 상기 장치 내에 저장되어 있고, 상기 장치는
    - 상기 컬렉션의 둘 이상의 디지털 파일 각각으로부터 얻어진 정보 엔트리(information entry)를 포함하는 하나의 인덱스를 생성하기 위한 인덱서(indexer)로서, 이때, 상기 컬렉션의 각각의 디지털 파일의 정보는 하나 이상의 정보 엔트리로 링크되는 상기 인덱서(indexer),
    - 음성 수신 모드(speech reception mode) 동안, 하나 이상의 언어로 존재하는, 말하는 사람(speaker)에 독립적인 음성 입력을 수신하기 위한 음성 수신 수단(speech reception mean),
    - 음성 입력의 언어를 판단하기 위한 프로세서
    를 포함하며, 이때, 상기 프로세서가 음성 수신 모드 동안 수신된 음성 입력을 상기 인덱스의 엔트리와 비교하고,
    상기 음성 입력이 상기 인덱스의 정보 엔트리 중 하나 이상과 일치할 때, 파일이 액세스되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
  13. 제 12 항에 있어서, 상기 장치는, 데스크탑 컴퓨터, 또는 노트북 컴퓨터, 또는 PDA, 또는 휴대용 미디어 재생기, 또는 모바일 폰 중에서 선택되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
  14. 제 12 항에 있어서, 상기 음성 수신 수단은 마이크로폰인 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
  15. 제 12 항에 있어서, 상기 음성 입력의 언어를 결정하기 위한 수단은, 자동 수단, 또는 수동 수단 중에서 선택되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
  16. 제 12 항에 있어서, 상기 디지털 파일은, 문서, 또는 스프레드시트(spreadsheet), 또는 재생목록(playlist), 또는 폴더, 또는 음악 파일, 또는 이미지 파일, 또는 비디오 파일 중에서 선택되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
  17. 제 12 항에 있어서, 상기 정보 엔트리는 하나 이상의 단어를 포함하는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
  18. 제 12 항에 있어서, 상기 정보 엔트리는 정보를 획득할 수 있으며, 상기 정 보는
    디지털 파일로부터의 파일 이름, 파일 확장자, 파일의 메타데이터 중 노래 제목, 파일의 메타데이터 중 아티스트 이름, 파일의 메타데이터 중 축약된 노래 제목(truncated song title), 파일의 메타데이터 중 축약된 아티스트 이름, 축약된 노래 제목, 대안적 노래 제목(alternative song title)과,
    원격 소스(remote source)로부터의 파일 이름, 파일 확장자, 파일의 메타데이터 중 노래 제목, 파일의 메타데이터 중 아티스트 이름, 파일의 메타데이터 중 축약된 노래 제목(truncated song title), 파일의 메타데이터 중 축약된 아티스트 이름, 축약된 노래 제목, 대안적 노래 제목(alternative song title)
    중에서 선택되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
  19. 제 12 항에 있어서, 상기 정보 엔트리는 임의의 언어로 존재하며, 하나 이상의 문자 코드셋(character codeset)을 따르는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
  20. 제 16 항에 있어서, 상기 음성 입력은 하나의 언어로 존재하거나, 하나 이상의 언어의 구(phrase)로 존재하는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
  21. 제 12 항에 있어서, 상기 하나 이상의 디지털 파일은, 메모리 장치, 또는 유 선 컴퓨터 네트워크, 또는 무선 컴퓨터 네트워크 중에서 선택되는 소스로부터 수신되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
  22. 제 12 항에 있어서,
    - 디스플레이
    를 더 포함하는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
  23. 제 12 항에 있어서, 상기 음성 입력은 필터링되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
KR1020087015673A 2005-12-12 2006-12-11 디지털 파일의 컬렉션에서 디지털 파일을 액세스하기 위한방법 및 장치 KR20080083290A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SG200508000-7A SG133419A1 (en) 2005-12-12 2005-12-12 A method and apparatus for accessing a digital file from a collection of digital files
SG200508000-7 2005-12-12

Publications (1)

Publication Number Publication Date
KR20080083290A true KR20080083290A (ko) 2008-09-17

Family

ID=38140537

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087015673A KR20080083290A (ko) 2005-12-12 2006-12-11 디지털 파일의 컬렉션에서 디지털 파일을 액세스하기 위한방법 및 장치

Country Status (15)

Country Link
US (1) US8015013B2 (ko)
EP (1) EP1969590A4 (ko)
JP (1) JP2009519538A (ko)
KR (1) KR20080083290A (ko)
CN (1) CN101341531A (ko)
AU (1) AU2006325555B2 (ko)
BR (1) BRPI0619607A2 (ko)
CA (1) CA2633505A1 (ko)
NO (1) NO20083087L (ko)
NZ (1) NZ569291A (ko)
RU (1) RU2008128440A (ko)
SG (1) SG133419A1 (ko)
TW (1) TW200805251A (ko)
WO (1) WO2007070013A1 (ko)
ZA (1) ZA200805567B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9804766B2 (en) 2013-04-01 2017-10-31 Samsung Electronics Co., Ltd. Electronic device and method of displaying playlist thereof

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100197255A1 (en) * 2009-02-05 2010-08-05 Panasonic Automotive Systems Company Of America, Division Of Panasonic Corporation Of North America Method and apparatus for dynamic station preset configuration in a radio
US20120221319A1 (en) * 2011-02-28 2012-08-30 Andrew Trese Systems, Methods and Media for Translating Informational Content
US10140320B2 (en) 2011-02-28 2018-11-27 Sdl Inc. Systems, methods, and media for generating analytical data
US20120284276A1 (en) * 2011-05-02 2012-11-08 Barry Fernando Access to Annotated Digital File Via a Network
US8983963B2 (en) * 2011-07-07 2015-03-17 Software Ag Techniques for comparing and clustering documents
US9984054B2 (en) 2011-08-24 2018-05-29 Sdl Inc. Web interface including the review and manipulation of a web document and utilizing permission based control
KR102081925B1 (ko) * 2012-08-29 2020-02-26 엘지전자 주식회사 디스플레이 디바이스 및 스피치 검색 방법
US9916306B2 (en) 2012-10-19 2018-03-13 Sdl Inc. Statistical linguistic analysis of source content

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4833714A (en) * 1983-09-30 1989-05-23 Mitsubishi Denki Kabushiki Kaisha Speech recognition apparatus
JPH0594512A (ja) * 1991-10-02 1993-04-16 Kobe Nippon Denki Software Kk 電子フアイリング装置
CA2115088A1 (en) 1993-02-08 1994-08-09 David Michael Boyle Multi-lingual voice response unit
CA2091658A1 (en) * 1993-03-15 1994-09-16 Matthew Lennig Method and apparatus for automation of directory assistance using speech recognition
US6081774A (en) * 1997-08-22 2000-06-27 Novell, Inc. Natural language information retrieval system and method
JP4036528B2 (ja) * 1998-04-27 2008-01-23 富士通株式会社 意味認識システム
US20020193989A1 (en) * 1999-05-21 2002-12-19 Michael Geilhufe Method and apparatus for identifying voice controlled devices
JP4292646B2 (ja) * 1999-09-16 2009-07-08 株式会社デンソー ユーザインタフェース装置、ナビゲーションシステム、情報処理装置及び記録媒体
US7725307B2 (en) * 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
JP2001285759A (ja) * 2000-03-28 2001-10-12 Pioneer Electronic Corp Av情報処理装置及びav情報処理用プログラムがコンピュータで読取り可能に記録された情報記録媒体
US20020099533A1 (en) * 2001-01-23 2002-07-25 Evan Jaqua Data processing system for searching and communication
FI20010644A (fi) * 2001-03-28 2002-09-29 Nokia Corp Merkkisekvenssin kielen määrittäminen
US7043431B2 (en) * 2001-08-31 2006-05-09 Nokia Corporation Multilingual speech recognition system using text derived recognition models
US7974843B2 (en) * 2002-01-17 2011-07-05 Siemens Aktiengesellschaft Operating method for an automated language recognizer intended for the speaker-independent language recognition of words in different languages and automated language recognizer
US6952691B2 (en) * 2002-02-01 2005-10-04 International Business Machines Corporation Method and system for searching a multi-lingual database
US7188066B2 (en) * 2002-02-04 2007-03-06 Microsoft Corporation Speech controls for use with a speech system
US6907397B2 (en) * 2002-09-16 2005-06-14 Matsushita Electric Industrial Co., Ltd. System and method of media file access and retrieval using speech recognition
US7046984B2 (en) * 2002-11-28 2006-05-16 Inventec Appliances Corp. Method for retrieving vocabulary entries in a mobile phone
US7321852B2 (en) * 2003-10-28 2008-01-22 International Business Machines Corporation System and method for transcribing audio files of various languages
US7725318B2 (en) * 2004-07-30 2010-05-25 Nice Systems Inc. System and method for improving the accuracy of audio searching
US7711542B2 (en) * 2004-08-31 2010-05-04 Research In Motion Limited System and method for multilanguage text input in a handheld electronic device
US7376648B2 (en) * 2004-10-20 2008-05-20 Oracle International Corporation Computer-implemented methods and systems for entering and searching for non-Roman-alphabet characters and related search systems
TWI258087B (en) * 2004-12-31 2006-07-11 Delta Electronics Inc Voice input method and system for portable device
ATE385024T1 (de) * 2005-02-21 2008-02-15 Harman Becker Automotive Sys Multilinguale spracherkennung
US7840399B2 (en) * 2005-04-07 2010-11-23 Nokia Corporation Method, device, and computer program product for multi-lingual speech recognition

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9804766B2 (en) 2013-04-01 2017-10-31 Samsung Electronics Co., Ltd. Electronic device and method of displaying playlist thereof

Also Published As

Publication number Publication date
US20070136065A1 (en) 2007-06-14
CA2633505A1 (en) 2007-06-21
AU2006325555A1 (en) 2007-06-21
NO20083087L (no) 2008-09-01
EP1969590A4 (en) 2010-01-06
US8015013B2 (en) 2011-09-06
JP2009519538A (ja) 2009-05-14
EP1969590A1 (en) 2008-09-17
AU2006325555B2 (en) 2012-03-08
SG133419A1 (en) 2007-07-30
RU2008128440A (ru) 2010-01-20
TW200805251A (en) 2008-01-16
BRPI0619607A2 (pt) 2011-10-11
WO2007070013A1 (en) 2007-06-21
ZA200805567B (en) 2009-06-24
NZ569291A (en) 2010-03-26
CN101341531A (zh) 2009-01-07

Similar Documents

Publication Publication Date Title
AU2006325555B2 (en) A method and apparatus for accessing a digital file from a collection of digital files
US8355919B2 (en) Systems and methods for text normalization for text to speech synthesis
US8396714B2 (en) Systems and methods for concatenation of words in text to speech synthesis
US8712776B2 (en) Systems and methods for selective text to speech synthesis
US8583418B2 (en) Systems and methods of detecting language and natural language strings for text to speech synthesis
US9378739B2 (en) Identifying corresponding positions in different representations of a textual work
KR100735820B1 (ko) 휴대 단말기에서 음성 인식에 의한 멀티미디어 데이터 검색방법 및 그 장치
US20160328205A1 (en) Method and Apparatus for Voice Operation of Mobile Applications Having Unnamed View Elements
US20100082344A1 (en) Systems and methods for selective rate of speech and speech preferences for text to speech synthesis
US20100082328A1 (en) Systems and methods for speech preprocessing in text to speech synthesis
US20100082327A1 (en) Systems and methods for mapping phonemes for text to speech synthesis
US20100082346A1 (en) Systems and methods for text to speech synthesis
KR20080000203A (ko) 음성인식을 이용한 음악 파일 검색 방법
CN101415259A (zh) 嵌入式设备上基于双语语音查询的信息检索***及方法
WO1999063425A1 (fr) Procede et appareil de traitement d'informations et support de fourniture d'informations
US20110119590A1 (en) System and method for providing a speech controlled personal electronic book system
US20070276668A1 (en) Method and apparatus for accessing an audio file from a collection of audio files using tonal matching
EP2682931B1 (en) Method and apparatus for recording and playing user voice in mobile terminal
KR101567449B1 (ko) 음성인식에 기반한 애니메이션 재생이 가능한 전자책 단말기 및 그 방법
WO2019214628A1 (zh) 一种语音识别的方法、文件处理方法及终端设备
CN112133295B (zh) 语音识别方法、装置及存储介质
CN110010131B (zh) 一种语音信息处理的方法和装置
JP7297266B2 (ja) 検索支援サーバ、検索支援方法及びコンピュータプログラム
JP7257010B2 (ja) 検索支援サーバ、検索支援方法及びコンピュータプログラム
KR20090054616A (ko) 시각장애인을 위한 음성낭독 단말기용 색인어 검색방법

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid