KR20080083290A

KR20080083290A - 디지털 파일의 컬렉션에서 디지털 파일을 액세스하기 위한방법 및 장치

Info

Publication number: KR20080083290A
Application number: KR1020087015673A
Authority: KR
Inventors: 치 파이 츄; 힝 파이 루이스 총; 칭 와이 지미 리; 홍 충 륭; 데니스 치 와이 위; 웨이 토 윌리엄 왕
Original assignee: 크리에이티브 테크놀로지 엘티디
Priority date: 2005-12-12
Filing date: 2006-12-11
Publication date: 2008-09-17
Also published as: US20070136065A1; CA2633505A1; AU2006325555A1; NO20083087L; EP1969590A4; US8015013B2; JP2009519538A; EP1969590A1; AU2006325555B2; SG133419A1; RU2008128440A; TW200805251A; BRPI0619607A2; WO2007070013A1; ZA200805567B; NZ569291A; CN101341531A

Abstract

전자 장치에서, 둘 이상의 디지털 파일을 포함하는 컬렉션으로부터 하나 이상의 디지털 파일을 액세스하기 위한 방법이 존재하며, 상기 방법은, 상기 컬렉션의 둘 이상의 디지털 파일 각각으로부터 획득된 정보 엔트리(information entry)를 포함하는 하나의 인덱스를 생성하는 단계(이때, 컬렉션의 각각의 디지털 파일의 정보가 하나 이상의 정보 엔트리로 링크된다)와, 음성 수신 모드(speech reception mode) 동안, 하나 이상의 언어로 존재하는, 말하는 사람(speaker)에 독립적인 음성 입력(speech input)을 수신하는 단계와, 상기 음성 입력의 언어를 판단하는 단계와, 음성 수신 모드를 음성 입력의 언어로 설정하는 단계와, 상기 음성 수신 모드 동안 수신된 음성 입력을 상기 인덱스의 엔트리와 비교하는 단계를 포함하며, 이때, 상기 음성 입력이 상기 인덱스의 정보 엔트리 중 하나 이상과 일치할 때, 파일이 액세스된다. 이러한 방법을 수행할 수 있는 장치가 또한 제시된다.

Description

디지털 파일의 컬렉션에서 디지털 파일을 액세스하기 위한 방법 및 장치{A METHOD AND APPARATUS FOR ACCESSING A DIGITAL FILE FROM A COLLECTION OF DIGITAL FILES}

본 발명은 디지털 파일들의 컬렉션으로부터 하나의 디지털 파일을 액세스하기 위한 방법 및 장치에 관한 것이며, 세부적으로는 음성 입력(speech input)을 이용하여, 파일을 액세스하는 것에 관련된 것이다.

음성에 의해 활성화되는 제어 메커니즘을 갖는 장치의 인기가 꾸준히 증가하고 있다. “목소리 다이얼(voice dial)”을 갖는 모바일 폰과 음성에 의해 활성화되는 장난감이 오늘날 사용자가 쉽게 찾을 수 있는 이들 장치 중 일부이다.

그러나 이러한 장치는 보통, 음성 입력을 특정한 엔트리(모바일 폰에서, 엔트리는 특정 개체의 접속 번호이다)와 연계하기 위한 선-프로그래밍(pre-programming)을 필요로 한다. 이는, 많은 수의 개체, 예를 들면, 주소록 및 미디어 파일의 컬렉션에 속한 개체를 포함할 때 장황한 프로세스가 될 수 있다. 이는 이러한 특징을 불편함으로 인해 사용자에게 바람직하지 않게 할 수 있다.

오늘날은 선-프로그래밍이 필요 없는 일부 장치에 내장되는 음성 인식 기능이 존재한다. 그러나 강한 악센트의, 또는 우물거리는 영어를 인지하는 어려움을 극복하기에는 기술이 충분히 발달되어 있지 못하다. 덧붙이자면, 영어가 오늘날의 디지털 시대의 상호 연결된 글로벌 마을을 위해 선택된 언어이지만, 사용될 수 있는 유일한 언어는 아니다. 세계에서 인구가 많은 국가, 가령, 중국과 인도에는 우세하게 영어를 말하는 인구가 존재하지 않으며, 스마트 음성 인식 기능을 갖는 이들 장치는 이들 국가에서는 널리 적용되지 않을 수 있다. 그들의 욕구가 특정하게 충족되지 않는다면, 이 거대한 소비 시장은 기업에 있어서는 기회 상실을 나타낸다.

현재, 이러한 “스마트(smart)”장치는 다수의 언어 인식 능력을 갖지 않는다. 마찬가지로, 이러한 장치의 제조업자는 동일한 제품의 여러 다른 버전을, 영어가 아닌 다른 언어 능력을 갖는 시장을 위해 만들 것을 요구당하며, 이는 각각의 장치를 제조하는 비용을 증가시키는데, 왜냐하면 전용 제품 라인/설비가 필요하기 때문에, 또는 다른 버전을 생산하는 것이 요구될 때, 영어 버전을 위한 제품 라인/설비가 수정될 필요가 있기 때문이다.

복수개의 언어 인식 능력을 갖는 “스마트” 장치가 서로 다른 문자 코드 세트(가령, 앵글로 알파벳 기반의 언어를 위한 ASCII, 번자체(한자)를 위한 Big-5, 간자체(한자)를 위한 GB, 일본어를 위한 JIS 등)를 적정하게 관리하고, 통제하는 것이 또한 도전 과제이다.

본 발명의 첫 번째 양태에서, 전자 장치에서, 둘 이상의 디지털 파일을 포함하는 컬렉션으로부터 하나 이상의 디지털 파일을 액세스하기 위한 방법이 존재하며, 상기 방법은, 상기 컬렉션의 둘 이상의 디지털 파일 각각으로부터 획득된 정보 엔트리(information entry)를 포함하는 하나의 인덱스를 생성하는 단계(이때, 컬렉션의 각각의 디지털 파일의 정보가 하나 이상의 정보 엔트리로 링크된다)와, 음성 수신 모드(speech reception mode) 동안, 하나 이상의 언어로 존재하는, 말하는 사람(speaker)에 독립적인 음성 입력(speech input)을 수신하는 단계와, 상기 음성 입력의 언어를 판단하는 단계와, 음성 수신 모드를 음성 입력의 언어로 설정하는 단계와, 상기 음성 수신 모드 동안 수신된 음성 입력을 상기 인덱스의 엔트리와 비교하는 단계를 포함하며, 이때, 상기 음성 입력이 상기 인덱스의 정보 엔트리 중 하나 이상과 일치할 때, 파일이 액세스된다. 상기 디지털 파일은 전자 장치, 또는 상기 전자 장치로 기능적으로 연결되는 임의의 장치, 또는 이들의 조합으로 저장될 수 있다. 하나 이상의 디지털 파일이 소스로부터 수신될 수 있으며, 상기 소스는 메모리 장치, 또는 유선 컴퓨터 네트워크, 또는 무선 컴퓨터 네트워크 중에서 선택될 수 있다.

바람직하게는, 상기 디지털 파일은 문서, 스프레드쉬트, 재생목록, 폴더, 음악 파일, 이미지 파일 및 비디오 파일일 수 있다. 또한, 상기 정보 엔트리가 하나 이상의 단어를 포함하고, 디지털 파일의 정보, 가령, 파일 이름, 파일 확장자, 파일의 메타데이터 중 노래 제목, 파일의 메타데이터 중 아티스트 이름, 파일의 메타데이터 중 축약된 노래 제목(truncated song title), 파일의 메타데이터 중 축약된 아티스트 이름, 축약된 노래 제목, 대안적 노래 제목(alternative song title)를 획득할 수 있다. 상기 정보 엔트리는 임의의 언어로 존재할 수 있다.

음성 입력은 하나의 언어로 존재하거나, 하나 이상의 언어의 구로 존재할 수 있다. 음성 수신 모드는 수동, 또는 자동으로 설정될 수 있다.

바람직하게는, 전자 장치는 데스크탑 컴퓨터, 노트북 컴퓨터, PDA, 휴대용 미디어 재생기, 또는 모바일 폰일 수 있다. 전자 장치에서의 하나 이상의 디지털 파일을 액세스하기 위한 기능은 미리 지정된 버튼을 1회 이상 누름에 의한 것일 수 있다.

본 발명의 두 번째 양태에서, 둘 이상의 디지털 파일을 포함하는 컬렉션의 하나 이상의 디지털 파일을 액세스하기 위한 장치가 존재하며, 이때 상기 컬렉션은 상기 장치 내에 저장되어 있다. 상기 장치는, 상기 컬렉션의 둘 이상의 디지털 파일 각각으로부터 얻어진 정보 엔트리(information entry)를 포함하는 하나의 인덱스를 생성하기 위한 인덱서(indexer)(이때, 상기 컬렉션의 각각의 디지털 파일의 정보는 하나 이상의 정보 엔트리로 링크된다)와, 음성 수신 모드(speech reception mode) 동안, 하나 이상의 언어로 존재하는, 말하는 사람(speaker)에 독립적인 음성 입력을 수신하기 위한 음성 수신 수단(speech reception mean)과, 음성 입력의 언어를 판단하기 위한 프로세서를 포함하며, 이때, 상기 프로세서가 음성 수신 모드 동안 수신된 음성 입력을 상기 인덱스의 엔트리와 비교한다. 바람직하게는, 상기 음성 입력이 상기 인덱스의 정보 엔트리 중 하나 이상과 일치할 때, 파일이 액세스된다. 상기 장치는, 데스크탑 컴퓨터, 노트북 컴퓨터, PDA, 휴대용 미디어 재생기 및 모바일 폰일 수 있다.

상기 음성 수신 수단이 마이크로폰인 것이 바람직하다. 음성 입력의 언어는 자동으로, 또는 수동으로 선택될 수 있다. 상기 음성 입력은 임의의 언어, 또는 하나 이상의 언어의 구일 수 있다.

상기 정보 엔트리는 임의의 언어로 존재하는 하나 이상의 단어를 포함하는 것이 바람직하다. 상기 정보 엔트리는 디지털 파일의 정보, 예를 들면, 파일 이름, 파일 확장자, 파일의 메타데이터 중 노래 제목, 파일의 메타데이터 중 아티스트 이름, 파일의 메타데이터 중 축약된 노래 제목(truncated song title), 파일의 메타데이터 중 축약된 아티스트 이름, 축약된 노래 제목, 대안적 노래 제목(alternative song title)를 획득할 수 있다.

상기 장치는 1회 이상 누름으로써, 디지털 파일을 액세스하기 위한 기능을 활성화시키기 위한 하나 이상의 버튼을 포함할 수 있다. 상기 장치는 디스플레이를 포함하는 것이 바람직하다.

도 1은 본 발명의 바람직한 실시예의 절차의 흐름도이다.

도 2는 본 발명의 바람직한 실시예의 장치의 개념도이다.

도 3은 도 1의 음성 처리 절차(36)를 확대한 것이다.

다음은 본 발명이 구현될 수 있는 적합한 컴퓨팅 환경에 대한 간략하고 포괄적인 기재를 제공하기 위한 의도를 갖는다. 요청되지 않을지라도, 본 발명은 컴퓨터에 의해 실행될 수 있는 인스트럭션, 가령 개인용 컴퓨터에 의해 실행되는 프로그램 모듈의 일반적인 맥락으로 설명될 것이다. 일반적으로, 프로그램 모듈은 특정 작업을 수행하거나 특정한 추상 데이터 타입을 구현하기 위한 루틴, 프로그램, 문자(character), 컴포넌트, 데이터 구조를 포함한다. 당해업계 종사자라면, 본 발명이 그 밖의 다른 컴퓨터 시스템 구성(예를 들어, 핸드-헬드 장치, 멀티프로세서 시스템, 마이크로프로세서 기반 전자장치, 또는 프로그램가능한 소비자 전자장치, 네트워크 PC, 미니컴퓨터, 메인프레임 컴퓨터 등)을 이용하여 실시될 수 있음을 인지할 것이다. 또한 본 발명은 통신 네트워크를 통해 링크되어 있는 원격 프로세싱 장치에 의해 작업이 수행되는 분산 컴퓨팅 환경에서 실시될 수 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈은 로컬 메모리 저장 장치와 원격 메모리 저장 장치 모두에 위치할 수 있다.

도 1을 참조하여, 전자 장치에서, 둘 이상의 디지털 파일을 포함하는 컬렉션 중에서 하나 이상의 디지털 파일을 액세스하기 위한 방법의 바람직한 실시예를 나타내는 흐름도가 도시되어 있다. 상기 전자 장치는 예를 들어, 데스크톱 컴퓨터, 노트북 컴퓨터, PDA, 휴대용 미디어 플레이어, 또는 모바일 폰일 수 있다. 컬렉션의 디지털 파일은 문서, 스프레드시트, 재생목록(playlist), 폴더, 음악 파일 및 비디오 파일을 포함할 수 있다. 도 1에서 도시된 실시예에서, 컬렉션에 저장된 디지털 파일은 미디어 파일(이미지, 음악 및 비디오 파일)이다. 하나 이상의 디지털 파일이 예를 들어, 메모리 장치, 유선 컴퓨터 네트워크, 또는 무선 컴퓨터 네트워크 등의 소스로부터 수신될 수 있다. 전자 장치 내의 메모리 장치에, 또는 상기 전자 장치로 연결될 수 있는 메모리 장치에 디지털 파일의 컬렉션이 존재할 수 있다. 메모리 장치는 비-휘발성 메모리일 수 있고, 플래시 메모리, 또는 하드 디스크 드 라이브 중 하나일 수 있다.

첫째, 음성 수신 모드(speech reception mode)를 활성화할 수 있는 기능부가 전자 장치에서 활성화된다(20). 상기 전자 장치는 메뉴를 보여주는 디스플레이를 가질 수 있으며, 상기 메뉴로부터 이 기능부가 선택될 수 있다. 또는 상기 장치는 음성 수신 모드를 활성화하기 위해 1회 이상 눌러지는 바로가기 스위치/버튼을 가질 수 있다. 이때, 사용자는 음성 입력을 위해 하나의 특정 언어, 또는 다수의 언어들을 수동으로 선택할 수 있다(22). 이는 음성 입력을 처리함에 있어, 장치를 보조한다. 특정 언어의 각각의 사투리, 예를 들자면, 광둥어, 테오추(Teochew) 및 호키엔(Hokkien)의 중국어 사투리가 그 밖의 다른 언어들 사이에서 구별되는 언어이도록 고려되어질 수 있다.

음성 수신 모드를 활성화시키는 것에 이어서, 전자 장치에서, 컬렉션의 파일을 액세스하기 위한 음성 입력이 들어오기에 앞서서, 컬렉션의 디지털 파일을 액세스하기 위한 시스템이 설치된다(24). 설치 프로세스 동안, 컬렉션의 파일의 정보를 이용하여, 임의의 정보 인덱스의 존재를 확인하기 위한 체크가 있다(26).

어떠한 인덱스도 발견되지 않는 경우, 또는 더 적은 디지털 파일이 검출된 경우(파일이 삭제된 경우), 또는 새로운 디지털 파일이 검출된 경우, 전자 장치의 미디어 파일 및 임의의 연결된 메모리 장치의 미디어 파일이 검색되어진다(28). 각각의 파일로부터 추출되어지고(25) 인덱싱된 정보는, 파일 이름, 파일 확장자, 파일 메타데이터 중 노래 제목, 파일 메타데이터 중 아티스트 이름, 파일 메타데이터 중 축약된 노래 제목(truncated song title), 파일 메타데이터 중 축약된 아티스트 이름, 대안적 노래 제목(alternative song title)을 포함할 수 있다. 또한 앞서 언급된 정보는 대안적인 소스, 예를 들면, 인터넷, 또는 (상기 전자 장치가 대안적 소스로 연결되는 경우) 호스트로부터 얻어질 수 있다. 각각의 정보 엔트리는 하나 이상의 단어를 포함하여야 한다. 추출된 정보는 임의의 언어로 존재할 수 있으며, 앵글로 알파벳 기반일 필요는 없다. 중국 문자의 다양한 형태(간자체 및 번자체), 일본 문자의 다양한 형태(한자, 히라가나 및 가타카나), 한국 문자, 이슬람 문자 등이 모두 정보 인덱스에서 추출될 수 있고, 저장될 수 있다. 또한 앞서 언급된 비-영어 문자의 영어로의 음역이 상기 정보 인덱스에 저장될 수 있다. 또한 앞서 언급된 비-영어 문자의 영어로의 번역이 또한, 상기 번역 정보가 파일 메타데이터에 포함되는 경우, 정보 인덱스에 저장될 수 있다. 다양한 경로를 통해(가령, 아티스트 이름, 노래 제목, 파일 이름 등에 의해) 파일이 액세스될 수 있도록, 각각의 디지털 파일이 정보 인덱스에서 다수의 정보 엔트리를 갖는 것이 가능할 수 있다. 더 적은 개수의 파일이 검출되는 경우, 인덱스를 생성할 때, 존재하지 않는 파일의 정보 엔트리는 제거된다. 또한 사용자는 특정 노래에게 대안적 제목(alternative title)을 부여할 수 있고, 이러한 대안적 제목이 또한 인덱스에 포함될 수 있다. 미디어 파일에 대한 모든 정보가 수집된 후, 문자 코드셋 식별 기능(27)이 각각의 미디어 파일의 정보를 분석하고, 각각의 파일에서 사용되는 하나 이상의 코드셋을 식별한다.

그 후, 전자 장치 및 기능적으로 연결되는 메모리 장치의 각각의 디지털 파일로부터의 모든 정보 엔트리의 인덱스가, 문자 코드셋 정보와 함께, 전자 장치에 서 형성되며(30), 인덱스의 구축이 뒤따르고, 상기 인덱스의 정보 엔트리가 액세스 가능하도록, 상기 인덱스는 전자 장치로 로딩된다(32). 또한 어떠한 새로운 디지털 파일도 검출되지 않는 경우와, 정보 인덱스가 구축된 때 어떠한 디지털 파일도 삭제되지 않은 경우, 정보 인덱스의 존재가 확인 된 후(26), 상기 정보 인덱스가 로딩될 수 있다(32).

앞서 언급된 단계에 대하여 요구되는 지속시간은 데이터 프로세싱 속도, 메모리 I/O 속도 및 네트워크/원격 서버 대기시간(latency)에 따라 좌우된다. 디지털 파일이 커질수록, 처리해야할 데이터의 크기 때문에, 앞서 언급된 단계들에 대하여 요구되는 시간이 더 길어진다.

이 시점에서, 전자 장치는 음성 입력을 수신하도록 준비가 된다. 사용자에게 소리 수신 모드(sound reception mode)로 음성 입력을 수신할 준비가 되었음을 알려주기 위해, 상기 전자 장치는 들을 수 있는 경보를 내거나, 시각적인 경보를 보여줄 수 있다. 상기 음성 입력은 말하는 사람에 독립적이다. 어떠한 선-녹음(pre-recording)이 요구되지 않으며, 상기 전자 장치는 기본적으로 “픽-앤-유즈(pick-and-use)”이다. 본 방법의 음성 처리(speech processing)는 임의의 특정한 액센트, 또는 우물거림에도 불구하고, 음성 입력을 구별할 수 있기에 충분히 강력(robust)하다. 상기 음성은 전자 장치로 입력된다(34). 음성 입력은 하나의 언어로 존재할 수 있다. 또한 상기 음성 입력은 둘 이상의 언어를 포함하는 구일 수 있다. 예를 들어, “帝女 flower”와 같은 노래 제목이 허용될 수 있고, 처리될 수 있다. 자신의 메타데이터에서 번역된 제목을 갖는 디지털 파일에 대하여, 원래의 제목과 번역된 제목 중 하나를 사용함으로써, 동일한 디지털 파일로의 액세스를 허용할 수 있다. 예를 들어, “愛是不保留”, 또는 “No Reserve In Love”에 의해, 동일한 디지털 파일을 액세스할 수 있다.

음성이 전자 장치로 입력된 후, 상기 음성이 처리된다(36). 미리 수동으로 언어 선택(22)이 이뤄지지 않았으면, 음성 입력의 언어가 결정되며, 음성 입력의 언어와 관련되는 적절한 음성 수신 모드가 자동으로 설정된다. 언어 선택이 수동으로 설정되는 경우, 이에 상응하여 사용자에 의해 특정되는 언어 모델이 로딩될 것이다. 이로 인해서, 음성 입력에 대한 정확한 판단이 가능해진다. 도 3을 참조하면, 음성이 자동으로 처리되는 시퀀스가 설명된다. 단계(25)에서 획득된 미디어 헤더 정보(media header information, 361)와, 단계(27)에서 획득된 문자 코드셋(362)과, 단계(29)에서 원격 소스로부터 수집되는 미디어 정보(363)가 언어 인식 식별 기능(language recognition identification function)으로 입력되어(364), 가장 적절한 음성 인식 언어 모델이 로딩된다(365). 예를 들어, 언어 인식 식별 기능이 미디어 파일에서 사용되는 코드셋이, 원본의 국가가 USA(United State of America)와 PRC(Peoples' Republic of China)인 ASCII 및 GB라고 판단한 경우, 음성 인식을 위해, USA 영어 언어 모델과 PRC 북경어 모델이 모두 로딩될 것이다. 그 후, 음성 입력이 추가로 “필터링”되며(366), 여기서, 중요한 미디어 정보, 예를 들면, 노래 제목, 아티스트 및 앨범이 상기 음성 입력으로부터 추출되어, 음성 인식의 대상으로서 음성 인식기(speech recognizer)로 제공되어질 수 있다. 예를 들어, “Sharon Lau의 愛是不保留를 재생하라”라는 음성 입력을 이용하여, “愛是不保留”가 노래 제목 정보로서 추출되고, 지능적이게도 “Sharon Lau”는 아티스트 정보로서 추출될 것이다. 그 후, 이렇게 추출된 정보가 음성 인식 풀(speech recognition pool)로 추가된다(367). 또한 상기 음성 입력에 대하여 필터링이 행해져서, 언어의 수동 선택(22)이 이뤄질 때, 인식된 음성 풀로의 엔트리가 판단될 수 있다.

음성 입력을 처리하고, 인식된 음성 풀로의 엔트리를 확인하는 것에 이어서, 상기 입력이 인덱스의 정보 엔트리와 비교된다(38). 입력과 하나 이상의 정보 엔트리 간의 일치가 이뤄질 때, 정보 엔트리로 링크되는 하나 이상의 디지털 파일이 사용자의 선택을 위해 디스플레이된다(40). 보여지는 하나 이상의 디지털 파일은 결과 리스트일 수 있고, 사용자가 원하는 노래를 선택하거나(42), 원하는 재생목록을 선택하거나(44), 또는 원하는 아티스트로부터 선택할 수 있다(46). 이들 옵션은 설명을 위한 목적만 가질 뿐이며, 제한하기 위한 것이 아니다. 도 2를 참조하면, 상기 장치(50) 내에 저장된 둘 이상의 디지털 파일을 포함하는 컬렉션으로부터 하나 이상의 디지털 파일을 액세스하기 위한 장치(50)가 도시된다. 상기 장치(50)는, 예를 들어, 데스크탑 컴퓨터, 노트북 컴퓨터, PDA, 휴대용 미디어 재생기, 또는 모바일 폰일 수 있다. 상기 디지털 파일은, 예를 들어, 문서, 스프레드시트(spreadsheet), 재생목록(playlist), 폴더, 음악 파일, 또는 비디오 파일일 수 있다. 하나 이상의 디지털 파일이 소스(source)로부터 수신될 수 있으며, 상기 소스는 예를 들어, 메모리 장치, 유선 컴퓨터 네트워크, 또는 무선 컴퓨터 네트워크일 수 있다. 디지털 파일의 컬렉션은 장치(50)에 포함되는 메모리 장치(58) 안에 존재할 수 있거나, 또는 디지털 파일은 상기 장치(50)로 연결될 수 있는 별도의 메모리 장치 안에 존재할 수 있다. 메모리 장치는 비-휘발성 메모리일 수 있고, 플래시 메모리, 또는 하드 디스크 드라이브일 수 있다. 디지털 파일을 액세스하는 기능을 활성화시키기 위해, 상기 장치(50)는 이러한 기능을 활성화시킬 수 있는 메뉴를 보여주는 디스플레이(54)를 가질 수 있다. 또는 장치(50)는 상기 기능을 활성화시키기 위해 한 번 이상 눌러지는 바로가기 스위치/버튼(도면상 도시되지 않음)을 가질 수 있다.

장치(50)는 다양한 구성요소를 포함하기 위한 하우징(52)을 가질 수 있다. 상기 장치(50)는 상기 장치(50)의 정보(예를 들어, 장치(50)에 저장된 파일에 대한 정보, 또는 장치(50)로 액세스할 수 있는 파일에 대한 정보)를 디스플레이하기 위한 디스플레이(54)를 가질 수 있다. 컬렉션의 둘 이상의 디지털 파일 각각으로부터 획득되는 정보 엔트리를 포함하는 인덱스를 발생시키기 위한 인덱서(56)가 존재할 수 있다. 상기 정보 엔트리는 하나 이상의 단어를 포함할 수 있고, 임의의 언어로 존재할 수 있다. 각각의 파일로부터 추출되고 인덱싱된 정보는, 파일 이름, 파일 확장자, 파일 메타데이터 중 노래 제목, 파일 메타데이터 중 아티스트 이름, 파일 메타데이터 중 축약된 노래 제목(truncated song title), 파일 메타데이터 중 축약된 아티스트 이름, 대안적 노래 제목(alternative song title) 중 하나 이상을 포함할 수 있다. 각각의 정보 엔트리는 하나 이상의 단어를 포함해야 한다. 추출된 정보는 임의의 언어로 존재할 수 있으며, 앵글로 알파벳 기반일 필요는 없다. 중국 문자의 다양한 형태(간자체 및 번자체), 일본 문자의 다양한 형태(한자, 히라가나 및 가타카나), 한국 문자, 이슬람 문자 등이 모두 정보 인덱스에서 추출될 수 있고, 저장될 수 있다. 또한 앞서 언급된 비-영어 문자의 영어로의 음역이 상기 정보 인덱스에 저장될 수 있다. 또한 앞서 언급된 비-영어 문자의 영어로의 번역이 또한, 상기 번역 정보가 파일 메타데이터에 포함되는 경우, 정보 인덱스에 저장될 수 있다. 다양한 경로를 통해(가령, 아티스트 이름, 노래 제목, 파일 이름 등에 의해) 파일이 액세스될 수 있도록, 각각의 디지털 파일이 정보 인덱스에서 다수의 정보 엔트리를 갖는 것이 가능할 수 있다. 또한 사용자는 특정 노래에게 대안적 제목(alternative title)을 부여할 수 있고, 이러한 대안적 제목이 또한 인덱스에 포함될 수 있다.

덧붙이자면, 장치(50)는, 음성 수신 모드 동안 하나 이상의 언어로 된 음성 입력을 수신하기 위한 음성 수신 수단(60)을 포함할 수 있다. 음성 수신 수단은 마이크로폰, 또는 오디오 신호의 입력을 가능하게 하는 그 밖의 다른 임의의 장치일 수 있다. 상기 음성 수신 수단(60)은 음성 입력을 프로세서(62)에게 전달한다. 상기 음성 입력은 하나의 언어로 존재할 수 있다. 또한 상기 음성 입력은 둘 이상의 언어를 포함하는 구일 수 있다. 예를 들어, “帝女 flower”가 이해될 수 있다. 자신의 메타데이터에 번역된 제목을 갖는 디지털 파일에 대하여 원래의 제목과 번역된 제목 중 하나를 사용함으로써, 동일한 디지털 파일로의 액세스를 허용할 수 있다. 예를 들어, “愛是不保留”, 또는 “No Reserve In Love”에 의해, 동일한 디지털 파일을 액세스할 수 있다. 상기 프로세서(62)는 음성 입력의 언어를 자동으로 결정할 수 있다. 또한 프로세서(62)가 작업을 자동으로 수행할 필요가 없도록, 상 기 장치(50)가 음성 입력의 언어를 수동으로 설정할 수 있다. 또한 상기 프로세서(62)는 음성 수신 모드 동안 수신된 음성 입력을 인덱스의 엔트리와 비교하기 위해 사용될 수 있다. 상기 음성 입력은 말하는 사람에 독립적이다. 어떠한 선-녹음(pre-recording)이 요구되지 않으며, 상기 전자 장치는 기본적으로 “픽-앤-유즈(pick-and-use)”이다. 본 방법의 음성 처리(speech processing)는 임의의 특정한 액센트, 또는 우물거림에도 불구하고, 음성 입력을 구별할 수 있기에 충분히 강력(robust)하다. 입력과 하나 이상의 정보 엔트리 간의 일치가 이뤄질 때, 정보 엔트리로 링크되는 하나 이상의 디지털 파일이 사용자의 선택을 위해 디스플레이(54) 상에서 보여진다. 보여지는 디지털 파일은 결과 리스트일 수 있고, 사용자는 원하는 노래를 선택할 수 있으며, 원하는 재생목록, 또는 원하는 아티스트의 노래를 선택할 수 있다. 이들 옵션은 설명을 위한 목적만 가질 뿐이며, 제한하기 위한 것이 아니다.

도 2의 화살표는 장치(50)의 다양한 구성요소 간의 데이터 흐름의 방향을 나타낸다.

Claims

전자 장치에서, 둘 이상의 디지털 파일을 포함하는 컬렉션으로부터 하나 이상의 디지털 파일을 액세스하기 위한 방법에 있어서, 상기 방법은

- 상기 컬렉션의 둘 이상의 디지털 파일 각각으로부터 획득된 정보 엔트리(information entry)를 포함하는 하나의 인덱스를 생성하는 단계로서, 이때, 컬렉션의 각각의 디지털 파일의 정보가 하나 이상의 정보 엔트리로 링크되는 단계,

- 음성 수신 모드(speech reception mode) 동안, 하나 이상의 언어로 존재하는, 말하는 사람(speaker)에 독립적인 음성 입력(speech input)을 수신하는 단계,

- 상기 음성 입력의 언어를 판단하는 단계,

- 음성 수신 모드를 음성 입력의 언어로 설정하는 단계, 그리고

- 상기 음성 수신 모드 동안 수신된 음성 입력을 상기 인덱스의 엔트리와 비교하는 단계

를 포함하며, 이때, 상기 음성 입력이 상기 인덱스의 정보 엔트리 중 하나 이상과 일치할 때, 파일이 액세스되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 방법.
제 1 항에 있어서, 상기 디지털 파일은 문서, 또는 스프레드시트(spreadsheet), 또는 재생목록(playlist), 또는 폴더, 또는 음악 파일, 또는 이미지 파일, 또는 비디오 파일 중에서 선택되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 방법.
제 1 항에 있어서, 상기 정보 엔트리는 하나 이상의 단어를 포함하는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 방법.
제 1 항에 있어서, 상기 정보 엔트리는 정보를 획득할 수 있으며, 상기 정보는

디지털 파일로부터의 파일 이름, 파일 확장자, 파일의 메타데이터 중 노래 제목, 파일의 메타데이터 중 아티스트 이름, 파일의 메타데이터 중 축약된 노래 제목(truncated song title), 파일의 메타데이터 중 축약된 아티스트 이름, 축약된 노래 제목, 대안적 노래 제목(alternative song title)과,

원격 소스(remote source)로부터의 파일 이름, 파일 확장자, 파일의 메타데이터 중 노래 제목, 파일의 메타데이터 중 아티스트 이름, 파일의 메타데이터 중 축약된 노래 제목(truncated song title), 파일의 메타데이터 중 축약된 아티스트 이름, 축약된 노래 제목, 대안적 노래 제목(alternative song title)

중에서 선택되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 방법.
제 1 항에 있어서, 상기 정보 엔트리는 임의의 언어로 존재하며, 하나 이상의 문자 코드셋(character codeset)에 따르는 것을 늑징으로 하는 디지털 파일을 액세스하기 위한 방법.
제 1 항에 있어서, 상기 음성 입력은 하나의 언어로 존재하거나, 하나 이상의 언어의 구(phrase)로 존재하는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 방법.
제 1 항에 있어서, 상기 디지털 파일은 전자 장치, 또는 상기 전자 장치로 기능적으로 연결되는 임의의 장치, 또는 이들의 조합 중에서 선택된 소스(source)에 저장되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 방법.
제 1 항에 있어서, 수동 선택(manual selection), 또는 자동 선택(automatic selection) 중에서 선택되는 수단에 의해, 상기 음성 수신 모드의 언어가 설정되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 방법.
제 1 항에 있어서, 상기 하나 이상의 디지털 파일은, 메모리 장치, 또는 유선 컴퓨터 네트워크, 또는 무선 컴퓨터 네트워크 중에서 선택되는 소스로부터 수신되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 방법.
제 1 항에 있어서, 상기 전자 장치는, 데스크탑 컴퓨터, 또는 노트북 컴퓨터, 또는 PDA, 또는 휴대용 미디어 재생기, 또는 모바일 폰 중에서 선택되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 방법.
제 1 항에 있어서, 상기 음성 입력은 필터링되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 방법.
둘 이상의 디지털 파일을 포함하는 컬렉션의 하나 이상의 디지털 파일을 액세스하기 위한 장치에 있어서, 이때 상기 컬렉션은 상기 장치 내에 저장되어 있고, 상기 장치는

- 상기 컬렉션의 둘 이상의 디지털 파일 각각으로부터 얻어진 정보 엔트리(information entry)를 포함하는 하나의 인덱스를 생성하기 위한 인덱서(indexer)로서, 이때, 상기 컬렉션의 각각의 디지털 파일의 정보는 하나 이상의 정보 엔트리로 링크되는 상기 인덱서(indexer),

- 음성 수신 모드(speech reception mode) 동안, 하나 이상의 언어로 존재하는, 말하는 사람(speaker)에 독립적인 음성 입력을 수신하기 위한 음성 수신 수단(speech reception mean),

- 음성 입력의 언어를 판단하기 위한 프로세서

를 포함하며, 이때, 상기 프로세서가 음성 수신 모드 동안 수신된 음성 입력을 상기 인덱스의 엔트리와 비교하고,

상기 음성 입력이 상기 인덱스의 정보 엔트리 중 하나 이상과 일치할 때, 파일이 액세스되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
제 12 항에 있어서, 상기 장치는, 데스크탑 컴퓨터, 또는 노트북 컴퓨터, 또는 PDA, 또는 휴대용 미디어 재생기, 또는 모바일 폰 중에서 선택되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
제 12 항에 있어서, 상기 음성 수신 수단은 마이크로폰인 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
제 12 항에 있어서, 상기 음성 입력의 언어를 결정하기 위한 수단은, 자동 수단, 또는 수동 수단 중에서 선택되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
제 12 항에 있어서, 상기 디지털 파일은, 문서, 또는 스프레드시트(spreadsheet), 또는 재생목록(playlist), 또는 폴더, 또는 음악 파일, 또는 이미지 파일, 또는 비디오 파일 중에서 선택되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
제 12 항에 있어서, 상기 정보 엔트리는 하나 이상의 단어를 포함하는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
제 12 항에 있어서, 상기 정보 엔트리는 정보를 획득할 수 있으며, 상기 정 보는

디지털 파일로부터의 파일 이름, 파일 확장자, 파일의 메타데이터 중 노래 제목, 파일의 메타데이터 중 아티스트 이름, 파일의 메타데이터 중 축약된 노래 제목(truncated song title), 파일의 메타데이터 중 축약된 아티스트 이름, 축약된 노래 제목, 대안적 노래 제목(alternative song title)과,

원격 소스(remote source)로부터의 파일 이름, 파일 확장자, 파일의 메타데이터 중 노래 제목, 파일의 메타데이터 중 아티스트 이름, 파일의 메타데이터 중 축약된 노래 제목(truncated song title), 파일의 메타데이터 중 축약된 아티스트 이름, 축약된 노래 제목, 대안적 노래 제목(alternative song title)

중에서 선택되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
제 12 항에 있어서, 상기 정보 엔트리는 임의의 언어로 존재하며, 하나 이상의 문자 코드셋(character codeset)을 따르는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
제 16 항에 있어서, 상기 음성 입력은 하나의 언어로 존재하거나, 하나 이상의 언어의 구(phrase)로 존재하는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
제 12 항에 있어서, 상기 하나 이상의 디지털 파일은, 메모리 장치, 또는 유 선 컴퓨터 네트워크, 또는 무선 컴퓨터 네트워크 중에서 선택되는 소스로부터 수신되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
제 12 항에 있어서,

- 디스플레이

를 더 포함하는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.
제 12 항에 있어서, 상기 음성 입력은 필터링되는 것을 특징으로 하는 디지털 파일을 액세스하기 위한 장치.