KR20090099069A

KR20090099069A - 플렉시블 텍스트 기반 언어 식별을 제공하는 방법, 장치 및 컴퓨터 판독가능 저장 매체

Info

Publication number: KR20090099069A
Application number: KR1020097014832A
Authority: KR
Inventors: 보그단 바리가; 미코 에이 하주; 주하 아이소-시필라
Original assignee: 노키아 코포레이션
Priority date: 2006-12-18
Filing date: 2007-12-12
Publication date: 2009-09-21
Also published as: WO2008075161A3; RU2009127102A; WO2008075161A2; US7552045B2; US20080147380A1; CN101563683A; EP2095266A2

Abstract

플렉시블 텍스트 기반 언어 식별을 제공하는 장치는 알파벳 스코어링 구성요소, n-그램 빈도 구성요소 및 처리 구성요소를 포함한다. 알파벳 스코어링 구성요소는 컴퓨터 판독가능 텍스트 포맷으로 엔트리를 수신하고 복수의 언어 중 각각의 언어마다 엔트리의 알파벳 스코어를 계산하도록 구성된다. n-그램 빈도 구성요소는 복수의 언어 중 각각의 언어마다 엔트리의 n-그램 빈도 스코어를 계산하도록 구성된다. 처리 구성요소는 n-그램 빈도 구성요소 및 알파벳 스코어링 구성요소와 통신할 수 있다. 처리 구성요소는 또한 알파벳 스코어와 n-그램 빈도 스코어의 조합에 기초하여 엔트리와 관련된 언어를 결정하도록 구성될 수 있다.

Description

플렉시블 텍스트 기반 언어 식별을 제공하는 방법, 장치 및 컴퓨터 프로그램 제품{METHOD, APPARATUS AND COMPUTER PROGRAM PRODUCT FOR PROVIDING FLEXIBLE TEXT BASED LANGUAGE IDENTIFICATION}

본 발명의 실시예는 일반적으로 음성 처리 기술에 관한 것으로, 보다 구체적으로는, 플렉시블 텍스트 기반 언어 식별을 제공하는 방법, 장치 및 컴퓨터 프로그램 제품에 관한 것이다.

현대의 통신 시대는 유선 및 무선 네트워크의 거대한 확장을 초래해 왔다. 컴퓨터 네트워크, 텔레비전 네트워크 및 전화 네트워크는 소비자 요구에 의해 야기된 공전의 기술 발전을 겪고 있다. 무선 및 이동 네트워킹 기술은 더 많은 정보 전송의 융통성 및 즉시성을 제공하면서 관련된 소비자 요구를 처리해 왔다.

현재 및 미래의 네트워킹 기술은 계속해서 사용자에게 정보 전송의 용이함 및 편의를 촉진한다. 정보 전송의 용이함을 증가시키기 위한 요구가 존재하는 일 영역은 이동 단말기의 사용자로의 서비스의 전달과 관련된다. 서비스는 사용자가 원하는 특정 매체 또는 통신 애플리케이션, 예컨대, 음악 플레이어, 게임 플레이 어, 전자 책, 단문 메시지, 이메일 등의 형태일 수 있다. 서비스는 또한 사용자가 태스크를 수행하고, 게임을 하거나 목표를 달성하기 위해 네트워크 장치에 응답할 수 있는 양방향 애플리케이션의 형태일 수 있다. 서비스는 네트워크 서버 또는 다른 네트워크 장치로부터, 또는 이동 단말기, 예컨대, 이동 전화기, 이동 텔레비전, 이동 컴퓨터, 이동 게임 시스템 등으로부터도 제공될 수 있다.

다수의 애플리케이션에서, 사용자가 네트워크 또는 이동 단말기로부터 구두(oral) 피드백 또는 인스트럭션과 같은 오디오 정보를 수신하거나, 사용자가 네트워크 또는 이동 단말기에 구두 인스트럭션 또는 피드백을 주는 것이 필요하다. 이러한 애플리케이션은 실질적인 수동 사용자 활동에 의존하지 않는 사용자 인터페이스에 제공될 수 있다. 바꾸어 말하면, 사용자는 핸즈 프리 또는 반 핸즈 프리 환경에서 애플리케이션과 상호작용할 수 있다. 이러한 애플리케이션의 예는 요금 지불, 프로그램 순서화, 구동 인스트럭션 요청 및 수신 등일 수 있다. 다른 애플리케이션은 구두 음성을 텍스트로 변환하거나 인지된 음성에 기초하여 몇몇 다른 기능, 예컨대, SMS 또는 이메일 받아쓰기 등을 수행할 수 있다. 이들 및 다른 애플리케이션을 지원하기 위해, 음성 인식 애플리케이션, 텍스트로부터 음성을 산출하는 애플리케이션 및 다른 음성 처리 장치가 보다 일반화되고 있다.

컴퓨터 판독가능 텍스트로부터 음성을 산출하는 장치, 예컨대, 텍스트-음성(TTS) 장치는 전형적으로 텍스트를 분석하고 음성 및 운율 분석을 수행하여, 출력의 음소를 원문의 콘텐츠에 관한 합성 음성으로서 생성한다. 그러나, 이러한 장치가 전 세계적으로 사용되고 또한 다수의 지리적 위치는 로컬 주소에 의해 말해진 언어의 표현으로 점점 다양해질 수 있으므로, 다양한 언어를 포함하는 텍스트가 충돌될 수 있다. 이와 같이, 텍스트의 음소에서 합성 음성으로의 직접 변환은 부정확성으로 인해 나빠지거나 자연적으로 소리를 낼 수 없다. 이상의 결함을 해결하도록 지시된 현재의 메커니즘은 적절히 기능하기 위해 대량의 텍스트를 필요로 할 수 있으므로, 융통성이 없다.

따라서, 텍스트-음성 변환을 수행할 때 적합한 언어 모델이 이용됨을 보장하기 위해 입력 데이터에 플렉시블 언어 식별을 제공하는 것이 바람직할 수 있다.

따라서 플렉시블 텍스트 기반 언어 식별을 제공하는 방법, 장치 및 컴퓨터 프로그램 제품이 제공된다. 본 발명의 예시적인 실시예에 따르면, 단일 단어만큼 짧은 텍스트도 언어 식별을 위해 정확히 분석될 수 있다. 따라서, 크게 구성가능한 다언어 시스템을 지원하기 위해 플렉시블 언어 식별이 제공될 수 있다.

일 예시적인 실시예에서, 플렉시블 텍스트 기반 언어 식별을 제공하는 방법이 제공된다. 방법은 컴퓨터 판독가능 텍스트 포맷으로 엔트리를 수신하는 단계와, 복수의 언어 중 각각의 언어마다 엔트리의 알파벳 스코어를 결정하는 단계와, 복수의 언어 중 각각의 언어마다 엔트리의 n-그램 빈도 스코어를 결정하는 단계와, 알파벳 스코어와 n-그램 빈도 스코어의 조합에 기초하여 엔트리와 관련된 언어를 결정하는 단계를 포함한다.

다른 예시적인 실시예에서, 플렉시블 텍스트 기반 언어 식별을 제공하는 컴퓨터 프로그램 제품이 제공된다. 컴퓨터 프로그램 제품은 컴퓨터 판독가능 프로그램 코드 부분이 저장된 적어도 하나의 컴퓨터 판독가능 저장 매체를 포함한다. 컴퓨터 판독가능 프로그램 코드 부분은 제 1, 제 2, 제 3 및 제 4 실행가능 부분을 포함한다. 제 1 실행가능 부분은 컴퓨터 판독가능 텍스트 포맷으로 엔트리를 수신한다. 제 2 실행가능 부분은 복수의 언어 중 각각의 언어마다 엔트리의 알파벳 스코어를 결정한다. 제 3 실행가능 부분은 복수의 언어 중 각각의 언어마다 엔트리의 n-그램 빈도 스코어를 결정한다. 제 4 실행가능 부분은 알파벳 스코어와 n-그램 빈도 스코어의 조합에 기초하여 엔트리와 관련된 언어를 결정한다.

다른 예시적인 실시예에서, 플렉시블 텍스트 기반 언어 식별을 제공하는 장치가 제공된다. 장치는 알파벳 스코어링 구성요소, n-그램 빈도 구성요소 및 처리 구성요소를 포함할 수 있다. 알파벳 스코어링 구성요소는 컴퓨터 판독가능 텍스트 포맷으로 엔트리를 수신하고 복수의 언어 중 각각의 언어마다 엔트리의 알파벳 스코어를 계산하도록 구성될 수 있다. n-그램 빈도 구성요소는 복수의 언어 중 각각의 언어마다 엔트리의 n-그램 빈도 스코어를 계산하도록 구성될 수 있다. 처리 구성요소는 n-그램 빈도 구성요소 및 알파벳 스코어링 구성요소와 통신할 수 있다. 처리 구성요소는 또한 알파벳 스코어와 n-그램 빈도 스코어의 조합에 기초하여 엔트리와 관련된 언어를 결정하도록 구성될 수 있다.

다른 예시적인 실시예에서, 플렉시블 텍스트 기반 언어 식별을 제공하는 장치가 제공된다. 장치는 컴퓨터 판독가능 텍스트 포맷으로 엔트리를 수신하는 수단과, 복수의 언어 중 각각의 언어마다 엔트리의 알파벳 스코어를 결정하는 수단과, 복수의 언어 중 각각의 언어마다 엔트리의 n-그램 빈도 스코어를 결정하는 수단과, 알파벳 스코어와 n-그램 빈도 스코어의 조합에 기초하여 엔트리와 관련된 언어를 결정하는 수단을 포함한다.

본 발명의 실시예는 음성 처리를 강화하기 위해 시스템에서 이용할 방법, 장치 및 컴퓨터 프로그램 제품을 제공할 수 있다. 그 결과, 예컨대, 이동 단말기 및 다른 전자 장치는 정확히 그리고 분석할 대량의 텍스트 기반 데이터 없이 다수의 언어에 대해 음성 처리를 수행하는 능력으로부터 이익을 얻을 수 있다. 따라서, 비교적 소량의 리소스를 사용하여 정확한 단어 인식 및 재생이 수행될 수 있다.

따라서, 본 발명의 실시예는 일반적인 용어로 설명되었으며, 이제 반드시 실제 크기대로 도시된 것은 아닌 첨부 도면을 참조할 것이다.

도 1은 본 발명의 예시적인 실시예에 따른 이동 단말기의 개략적인 블록도이다.

도 2는 본 발명의 예시적인 실시예에 따른 무선 통신 시스템의 개략적인 블록도이다.

도 3은 본 발명의 예시적인 실시예에 따른 플렉시블 텍스트 기반 언어 식별을 제공하는 시스템의 블록도를 도시한다.

도 4는 본 발명의 예시적인 실시예에 따른 플렉시블 텍스트 기반 언어 식별을 제공하는 예시적인 방법에 따른 순서도이다.

이제 첨부 도면을 참조하여 본 발명의 실시예가 보다 완전히 후술될 것이되, 본 발명의 몇몇 실시예가 도시되지만 본 발명의 모든 실시예가 도시되는 것은 아니다. 게다가, 본 발명은 다수의 상이한 형태로 구현될 수 있고, 본 명세서에 전술된 실시예로 한정되도록 해석되어서는 안 되며, 오히려, 이들 실시예는 이 개시가 적용가능한 법적 요구를 충족시키도록 제공된다. 도면 전체에서 동일한 참조 번호는 동일한 구성요소를 지칭한다.

도 1은 본 발명의 실시예로 이익을 얻는 이동 단말기(10)의 블록도를 도시한다. 그러나, 도시되고 후술되는 이동 전화기는 본 발명의 실시예로 이익을 얻는 예시적인 일 유형의 이동 전화기일 뿐임을 알아야 하며, 따라서, 본 발명의 실시예의 범위를 제한하도록 해석되어서는 안 된다. 이동 단말기(10)의 일 실시예가 도시되고 예시를 위해 후술될 것이지만, 다른 유형의 이동 단말기, 예컨대, PDA, 페이저, 이동 컴퓨터, 이동 텔레비전, 게임 장치, 랩탑 컴퓨터, 카메라, 비디오 녹화기, GPS 장치 및 다른 유형의 음성 및 텍스트 통신 시스템이 본 발명의 실시예를 쉽게 이용할 수 있다. 또한, 이동할 수 없는 장치도 본 발명의 실시예를 쉽게 이용할 수 있다.

본 발명의 시스템 및 방법은 주로 이동 통신 애플리케이션에 관련하여 후술될 것이다. 그러나, 이동 통신 산업의 내부와 이동 통신 산업의 외부 양자 모두에서, 본 발명의 실시예의 시스템 및 방법이 여러 가지 다른 애플리케이션에 관련하여 이용될 수 있음을 알아야 한다.

이동 단말기(10)는 송신기(14) 및 수신기(16)와 동작가능하게 통신하는 안테나(12)(또는 다수의 안테나)를 포함한다. 이동 단말기(10)는 제어기(20) 또는 각각 송신기(14) 및 수신기(16)로 신호를 제공하고 이들로부터 신호를 수신하는 다른 처리 구성요소를 더 포함한다. 신호는 적용가능한 셀룰러 시스템의 무선 인터페이스 표준에 따라 시그널링 정보, 및 사용자 음성, 수신된 데이터 및/또는 사용자 생성 데이터도 포함한다. 이 점에 있어서, 이동 단말기(10)는 하나 이상의 무선 인터페이스 표준, 통신 프로토콜, 변조 유형 및 액세스 유형을 사용하여 작동할 수 있다. 예로써, 이동 단말기(10)는 다수의 제 1, 제 2, 제 3 및/또는 제 4 세대 통신 프로토콜 등 중 임의의 것에 따라 작동할 수 있다. 예컨대, 이동 단말기(10)는 제 2 세대(2G) 무선 통신 프로토콜 IS-136(TDMA), GSM, IS-95(CDMA) 및 제 3 세대 무선 통신 프로토콜, 예컨대, UMTS, CDMA2000, WCDMA 및 TD-SCDMA 및 제 4 세대(4G) 무선 통신 프로토콜 등에 따라 작동할 수 있다.

제어기(20)는 이동 단말기(10)의 오디오 및 로직 기능을 구현하기에 바람직한 회로를 포함함을 알아야 한다. 예컨대, 제어기(20)는 디지털 신호 프로세서 장치, 마이크로프로세서 장치 및 다양한 아날로그-디지털 변환기, 디지털-아날로그 변환기 및 다른 지원 회로로 구성될 수 있다. 이동 단말기(10)의 제어 및 신호 처리 기능은 저마다의 능력에 따라 이들 장치 사이에 할당된다. 따라서 제어기(20)는 컨볼루션 인코딩하고 변조 및 전송 이전에 메시지와 데이터를 인터리빙하는 기능도 포함할 수 있다. 제어기(20)는 부가적으로 내부 음성 코더를 포함할 수 있고, 내부 데이터 모뎀을 포함할 수 있다. 또한, 제어기(20)는 메모리에 저장될 수 있는 하나 이상의 소프트웨어 프로그램을 실행하는 기능을 포함할 수 있다. 예컨대, 제어기(20)는 종래의 웹 브라우저와 같은 접속성 프로그램을 실행할 수 있다. 이어서 접속성 프로그램은 이동 단말기(10)가 예컨대, 무선 애플리케이션 프로토콜(WAP), 하이퍼텍스트 전송 프로토콜(HTTP) 등에 따라, 위치 기반 콘텐츠 및/또는 다른 웹 페이지 콘텐츠와 같은 웹 콘덴츠를 송신하고 수신하게 할 수 있다.

이동 단말기(10)는 종래의 이어폰 또는 스피커(24), 링거(ringer)(22), 마이크로폰(26), 디스플레이(28)와 같은 출력 장치 및 사용자 입력 인터페이스를 포함하는 사용자 인터페이스도 포함할 수 있으며, 이들 모두 제어기(20)에 결합된다. 이동 단말기(10)가 데이터를 수신하게 하는 사용자 입력 인터페이스는 이동 단말기(10)가 데이터를 수신하게 하는 다수의 장치 중 임의의 것, 예컨대, 키패드(30), 터치 디스플레이(도시 생략) 또는 다른 입력 장치를 포함할 수 있다. 키패드(30)를 포함하는 실시예에서, 키패드(30)는 종래의 숫자(0 내지 9) 및 관련 키(#,*) 및 이동 단말기(10)를 작동시키기 위해 사용된 다른 키를 포함할 수 있다. 이와 달리, 키패드(30)는 종래의 QWERTY 키패드 구성을 포함할 수 있다. 키패드(30)는 관련 기능을 가진 다양한 소프트 키도 포함할 수 있다. 게다가 또는 그 대신에, 이동 단말기(10)는 조이스틱 또는 다른 사용자 입력 인터페이스와 같은 인터페이스 장치를 포함할 수 있다. 이동 단말기(10)는 이동 단말기(10)를 작동시키는 데 필요한 다양한 회로에 전력을 공급할 뿐만 아니라, 검출가능한 출력으로서 기계적 진동도 선택적으로 제공하는 진동 배터리 팩과 같은 배터리(34)를 더 포함한다.

이동 단말기(10)는 사용자 식별 모듈(UIM)(38)을 더 포함한다. UIM(318)은 전형적으로 프로세서가 내장된 메모리 장치이다. UIM(38)은 예컨대, 가입자 식별 모듈(SIM), 범용 집적 회로 카드(UICC), 범용 가입자 식별 모듈(USIM), 분리형 사용자 식별 모듈(R-UIM) 등을 포함할 수 있다. UIM(38)은 전형적으로 이동 가입자에 관련된 정보 요소를 저장한다. UIM(38) 외에, 이동 단말기(10)는 메모리를 구비할 수 있다. 예컨대, 이동 단말기(10)는 예컨대, 데이터의 임시 저장을 위한 캐시 영역을 포함하는 휘발성 RAM과 같은 휘발성 메모리(40)를 포함할 수 있다. 이동 단말기(10)는 내장 및/또는 분리될 수 있는 다른 비휘발성 메모리(42)도 포함할 수 있다. 비휘발성 메모리(42)는 부가적으로 또는 그 대신에 예컨대, 캘리포니아주 서니베일의 샌디스크사 또는 캘리포니아주 프리몬트의 렉사 미디어사로부터 이용가능한 EEPROM, 플래시 메모리 등을 포함할 수 있다. 메모리는 이동 단말기(10)의 기능을 구현하기 위해 이동 단말기(10)에 의해 사용된 다수의 정보 조각 및 데이터 중 임의의 것을 저장할 수 있다. 예컨대, 메모리는 이동 단말기(10)를 고유하게 식별할 수 있는 식별자, 예를 들어, 국제 이동 단말기 식별 번호(IMEI) 코드를 포함할 수 있다.

도 2는 본 발명의 예시적인 실시예에 따른 무선 통신 시스템의 블록도를 도시한다. 이제 도 2를 참조하면, 본 발명의 실시예로 이익을 얻는 일 유형의 시스템의 예시가 제공된다. 시스템은 복수의 네트워크 장치를 포함한다. 도시된 바와 같이, 하나 이상의 이동 단말기(10)는 각각 기지국(BS)(44)으로 신호를 송신하고 이로부터 신호를 수신하는 안테나(12)를 포함할 수 있다. 기지국(44)은 하나 이상의 셀룰러 또는 이동 네트워크의 일부일 수 있는데, 각각은 네트워크를 작동시키는 데 필요한 구성요소, 예컨대, 이동 전화 교환국(MSC)(46)을 포함한다. 당업자에게 잘 알려져 있는 바와 같이, 이동 네트워크는 기지국/MSC/상호작용 기능부(BMI)로도 지칭될 수 있다. 작동시에, MSC(46)는 이동 단말기(10)가 호출하고 호출을 수신할 때 이동 단말기(10)로 및 이동 단말기로부터 호출을 라우팅할 수 있다. MSC(46)는 또한 이동 단말기(10)가 호출에 수반될 때 랜드라인 트렁크(landline trunk)에 접속을 제공할 수 있다. 또한, MSC(46)는 이동 단말기(10)로 및 이동 단말기로부터 메시지의 전송을 제어할 수 있고, 메시징 센터로 및 메시징 센터로부터 이동 단말기를 향한 메시지의 전송도 제어할 수 있다. MSC(46)가 도 2의 시스템에 도시되었지만, MSC(46)는 예시적인 네트워크 장치일 뿐이며 본 발명의 실시예가 MSC를 이용하는 네트워크에서 사용하는 것으로 제한되지 않음을 알아야 한다.

MSC(46)는 데이터 네트워크, 예컨대, LAN, MAN 및/또는 WAN에 결합될 수 있다. MSC(46)는 데이터 네트워크에 직접 결합될 수 있다. 그러나, 전형적인 일 실시예에서, MSC(46)는 게이트웨이 장치(GTW)(48)에 결합되고, GTW(48)는 WAN, 예컨대, 인터넷(50)에 결합된다. 차례로, 처리 구성요소(예컨대, 개인용 컴퓨터, 서버 컴퓨터 등)와 같은 장치는 인터넷(50)을 통해 이동 단말기(10)에 결합될 수 있다. 후술되는 바와 같이, 예컨대, 처리 구성요소는 후술되는 컴퓨팅 시스템(52)(도 2에 도시된 2 개), 원 서버(54)(도 2에 도시된 1 개) 등과 결합된 하나 이상의 처리 구성요소를 포함할 수 있다.

BS(44)는 또한 시그널링 GPRS 지원 노드(SGSN)(56)에 결합될 수 있다. 당업자에게 알려진 바와 같이, SGSN(56)은 전형적으로 패킷 교환 서비스에 대해 MSC(46)와 유사한 기능을 수행할 수 있다. MSC(46)처럼, SGSN(56)은 인터넷(50)과 같은 데이터 네트워크에 결합될 수 있다. SGSN(56)은 데이터 네트워크에 직접 결합될 수 있다. 그러나, 보다 전형적인 실시예에서, SGSN(56)은 패킷 교환 코어 네트워크, 예컨대, GPRS 코어 네트워크(58)에 결합된다. 이어서 패킷 교환 코어 네트워크는 다른 GTW(48), 예컨대, GTW GPRS 지원 노드(GCSN)(60)에 결합되고, GGSN(60)은 인터넷(50)에 결합된다. GGSN(60) 외에, 패킷 교환 코어 네트워크도 GTW(48)에 결합될 수 있다. 또한, GGSN(60)은 메시징 센터에 결합될 수 있다. 이 점에 있어서, MSC(46)처럼, GGSN(60) 및 SGSN(56)은 메시지, 예컨대, MMS 메시지의 전송을 제어할 수 있다. GGSN(60) 및 SGSN(56)은 메시징 센터로 및 메시징 센터로부터 이동 단말기(10)를 향한 메시지의 전송도 제어할 수 있다.

또한, GPRS 코어 네트워크(58) 및 GGSN(60)에 SGSN(56)을 결합함으로써, 컴퓨팅 시스템(52) 및/또는 원 서버(54)와 같은 장치는 인터넷(50)을 통해 이동 단말기(10)에 결합될 수 있다. 이 점에 있어서, 컴퓨팅 시스템(52) 및/또는 원 서버(54)와 같은 장치는 SGSN(56), GPRS 코어 네트워크(58) 및 GGSN(60)을 통해 이동 단말기(10)와 통신할 수 있다. 이동 단말기(10) 및 다른 장치(예컨대, 컴퓨팅 시스템(52), 원 서버(54) 등)를 인터넷(50)에 직접 또는 간접적으로 접속함으로써, 이동 단말기(10)는 예컨대, 하이퍼텍스트 전송 프로토콜(HTTP) 등에 따라 다른 장치와 그리고 서로 통신할 수 있으며, 이로써 이동 단말기(10)의 다양한 기능을 수행할 수 있다.

가능한 모든 이동 네트워크의 모든 구성요소가 본 명세서에 도시되고 설명되 지는 않았지만, 이동 단말기(10)는 BS(44)를 통해 다수의 상이한 네트워크 중 하나 이상에 결합될 수 있음을 알아야 한다. 이 점에 있어서, 네트워크(들)는 다수의 제 1 세대(1G), 제 2 세대(2G), 2.5G, 제 3 세대(3G), 3.9G, 제 4 세대(4G) 이동 통신 프로토콜 등 중 어느 하나 또는 그 이상에 따라 통신을 지원할 수 있다. 예컨대, 하나 이상의 네트워크(들)는 2G 무선 통신 프로토콜 IS-136(TDMA), GSM 및 IS-95(CDMA)에 따라 통신을 지원할 수 있다. 또한, 예컨대, 하나 이상의 네트워크(들)는 2.5G 무선 통신 프로토콜(GPRS), EDGE 등에 따라 통신을 지원할 수 있다. 또한, 예컨대, 하나 이상의 네트워크(들)는 3G 무선 통신 프로토콜, 예컨대, WCDMA 무선 액세스 기술을 이용하는 UMTS 네트워크에 따라 통신을 지원할 수 있다. 듀얼 또는 고차 모드 이동국(예컨대, 디지털/아날로그 또는 TDMA/CDMA/아날로그 전화기)이어야 하는 몇몇 협대역 AMPS(NAMPS) 및 TACS 네트워크(들)도 본 발명의 실시예로 이익을 얻을 수 있다.

이동 단말기(10)는 또한 하나 이상의 무선 액세스 포인트(AP)(62)에 결합될 수 있다. AP(62)는 예컨대, 무선 주파수(RF), 블루투스(BT), 적외선(IrDA) 또는 IEEE 802.11(예컨대, 802.11a, 802.11b, 802.11g, 802.11n 등)과 같은 무선 LAN(WLAN) 기술, IEEE 802.16과 같은 WiMAX 기술, 및/또는 IEEE 802.15와 같은 UWB 기술을 포함하는 다수의 상이한 무선 네트워킹 기술 중 임의의 것과 같은 기술에 따라 이동 단말기(10)와 통신하도록 구성된 액세스 포인트를 포함할 수 있다. AP(62)는 인터넷(50)에 결합될 수 있다. MSC(46)와 마찬가지로, AP(62)는 인터넷(50)에 직접 결합될 수 있다. 그러나, 일 실시예에서, AP(62)는 GTW(48)를 통해 인터넷(50)에 간접적으로 결합된다. 또한, 일 실시예에서, BS(44)는 다른 AP(62)로 간주할 수 있다. 알 게 되듯이, 이동 단말기(10), 컴퓨팅 시스템(52), 원 서버(54) 및/또는 다수의 다른 장치 중 임의의 장치를 인터넷(50)에 직접 또는 간접적으로 접속함으로써, 이동 단말기(10)는 서로, 컴퓨팅 시스템 등과 통신할 수 있으며, 이로써 이동 단말기(10)의 다양한 기능을 수행하는데, 예컨대, 컴퓨팅 시스템(52)에 대해 데이터, 콘텐츠 등을 전송하고/하거나 콘텐츠, 데이터 등을 수신한다. 본 명세서에 사용된 바와 같이, 용어 "데이터", "콘텐츠", "정보" 및 유사한 용어는 본 발명의 실시예에 따라 전송, 수신 및/또는 저장될 수 있는 데이터를 지칭하는 데 상호교환적으로 사용될 수 있다. 따라서, 임의의 이러한 용어의 사용은 본 발명의 실시예의 사상 및 범위를 제한하도록 해석되어서는 안 된다.

도 2에 도시되지 않았지만, 인터넷(50)을 통해 컴퓨팅 시스템(52)에 이동 단말기(10)를 결합하는 것 외에 또는 대신에, 이동 단말기(10) 및 컴퓨팅 시스템(52)은 서로에 결합될 수 있고, 예컨대, RF, BT, IrDA 또는 LAN, WLAN, WiMAX, UWB 기술 및/또는 기타 등등을 포함하는 다수의 상이한 유선 또는 무선 통신 기술 중 임의의 기술에 따라 통신할 수 있다. 하나 이상의 컴퓨팅 시스템(52)은 이후에 이동 단말기(10)로 전송될 수 있는 콘텐츠를 저장할 수 있는 분리형 메모리를 부가적으로 또는 그 대신에 포함할 수 있다. 또한, 이동 단말기(10)는 프린터, 디지털 프로젝터 및/또는 다른 멀티미디어 캡처, 생성 및/또는 저장 장치(예컨대, 다른 단말기)와 같은 하나 이상의 전자 장치에 결합될 수 있다. 컴퓨팅 시스템(52)과 마찬가지로, 이동 단말기(10)는 예컨대, RF, BT, IrDA 또는 USB, LAN, WLAN, WiMAX, UWB 기술 및/또는 기타 등등을 포함하는 다수의 상이한 유선 또는 무선 통신 기술 중 임의의 기술에 따라 휴대용 전자 장치와 통신하도록 구성될 수 있다.

예시적인 실시예에서, 음성 언어 인터페이스와 관련된 데이터는 도 1의 이동 단말기(10)와 유사할 수 있는 이동 단말기와 도 2의 시스템의 네트워크 장치 사이의 또는 이동 단말기들 사이에서 도 2의 시스템을 통해 전달될 수 있다. 이와 같이, 서버와 이동 단말기 사이의 통신에 도 2의 시스템이 이용될 필요가 없으며, 오히려 도 2는 예시만을 위해 제공된 것임을 알아야 한다. 또한, 본 발명의 실시예는 이동 단말기(10)와 같은 통신 장치 상에 존재할 수 있고, 통신 장치에 액세스 가능한 네트워크 장치 또는 다른 장치 상에 존재할 수 있음을 알아야 한다.

도 3은 본 발명의 예시적인 실시예에 따른 플렉시블 언어 식별을 제공하는 시스템의 블록도를 도시한다. 이제 플렉시블 언어 식별을 제공하는 시스템의 특정 구성요소가 표시되는 도 3과 관련하여 본 발명의 예시적인 실시예가 설명될 것이다. 도 3의 시스템은 예시를 위해 도 1의 이동 단말기(10)와 관련하여 설명될 것이다. 그러나, 도 3의 시스템이 여러 가지 다른 장치 -이동식 및 고정식 양자 모두- 와 관련하여 이용될 수도 있음을 알아야 하며, 따라서 본 발명의 실시예는 도 1의 이동 단말기(10)와 같은 장치에 대한 응용으로 한정되어서는 안 된다. 도 3은 플렉시블 언어 식별을 제공하는 시스템의 구성의 일례를 도시하지만, 본 발명의 실시예를 구현하는 데 다수의 다른 구성도 사용될 수 있음을 또한 알아야 한다.

이제 도 3을 참조하면, 플렉시블 언어 식별을 제공하는 시스템(68)이 제공된다. 시스템(68)은 제 1 유형의 음성 처리 구성요소, 예컨대, 언어 식별(LID) 구성 요소(72)와 통신하는 텍스트-음성(TTS) 구성요소(70)를 포함한다. 도 3은 TTS 구성요소(72)를 포함하는 음성 처리 구성요소의 측면에서 설명될 것이지만, 그 대신에 또는 부가적으로 다른 음성 처리 구성요소가 이용될 수 있다. 예컨대, 자동 음성 인식(ASR) 구성요소는 텍스트 데이터를 인식에 사용될 일련의 음소로 변환하기 위해 정확한 언어에 대응하는 적합한 룰을 선택하도록 LID 구성요소(72)를 사용할 수 있다. 보통 텍스트-음소 변환용 룰 세트는 언어마다 다르다. 부가적으로, LID 구성요소(72)는 TTS 구성요소(70)보다 앞서는 것으로 도시되지만, 이러한 구성이 필수적인 것은 아니다. 오히려, 본 발명의 실시예에 따른 LID 구성요소(72)는 텍스트가 분석될 수 있는 시스템(68)의 임의의 위치에 배치될 수 있다. 바꾸어 말하면, LID 구성요소(72)는 음성 처리 구성요소와 관련하여 또는 음성 처리 구성요소의 조합과 관련하여 사용되어, 입력 데이터, 출력 데이터 또는 중간 데이터를 텍스트 형태로 처리할 수 있다. 또한, 도 3이 TTS 구성요소(70)에 입력 텍스트를 제공하는 LID 구성요소(72)를 사용하여 도시되지만, 이와 달리 TTS 구성요소(70)는 임의의 다른 소스로부터 입력 텍스트를 수신할 수 있다.

도 3에 도시된 바와 같이, 일 실시예에서, TTS 구성요소(70)는 컴퓨터 판독가능 텍스트로부터 합성 음성을 산출할 수 있는 하드웨어, 소프트웨어 또는 하드웨어와 소프트웨어의 조합으로 구현된 임의의 장치 또는 수단일 수 있다. 이와 같이, 도 3의 TTS 구성요소의 구성요소들은 예시적일 뿐이며 후술되는 설명은 명확성을 위해 TTS 구성요소(70)의 동작을 일반적인 용어로 설명하기 위한 것일 뿐이다. TTS 구성요소(70)는 예컨대, 텍스트 프로세서(76), 운율 프로세서(78) 및 음향 합 성기(80)를 포함할 수 있다.

텍스트 프로세서(76)는 처리된 텍스트를 운율 프로세서(78)로 전달하기 전에 입력 텍스트(82)와 같은 미디어 입력을 수신하고 입력 텍스트(82)를 처리하기 시작할 수 있다. 텍스트 프로세서(76)는 당해 기술에 알려져 있는 다수의 처리 동작 중 임의의 것을 수행하도록 구성될 수 있다. 텍스트 프로세서(76)는 특정 텍스트 단어 또는 문자열을 발음에 관한 특정 규격 또는 룰을 사용하여 상관시키는 표 또는 다른 메커니즘을 포함할 수 있다. 예시적인 실시예에서, 텍스트 프로세서(76)는 숫자 및 약어와 같은 비문자 표현에서 대응하는 문자 단어 표현으로 변환하도록 구성될 수 있다.

운율 프로세서(78)는 처리된 텍스트를 분석하여 텍스트가 어떻게 발음되어야 하는지, 강조할 음절이 무엇인지, 사용할 음조가 무엇인지, 얼마나 빨리 소리를 전달하는지 등에 대한 규격을 결정할 수 있다. 예시적인 실시예에서, 운율 프로세서(78)는 텍스트를 나누고 텍스트의 세그먼트를 구, 절 및 문장과 같은 다양한 운율 단위로 마킹하도록 구성될 수 있다. 운율 프로세서(78)는 입력 텍스트(82)의 발음 표기를 수행하는 텍스트-음소(TTP) 변환 모델 또는 맵도 이용할 수 있다. 발음 표기와 운율 정보의 조합은 음향 합성기(80)로 입력될 수 있는 음소의 기호 언어 표현을 구성한다.

음향 합성기(80)는 음소의 입력 시퀀스에 응답하여 합성적으로 생성된 오디오 출력을 컴퓨터 생성 음성의 형태로 산출하도록 구성될 수 있다. 음향 합성기(80)는 저장된 룰(rules) 또는 모델을 운율 프로세서(78)로부터의 입력에 적용하 여, 운율 프로세서(78)에 의해 결정된 규격을 따르는 방법으로 컴퓨터 텍스트를 들리도록 재생하는 합성 음성(84)을 생성할 수 있다. 이어서 합성 음성(84)은 출력 장치, 예컨대, 오디오 믹서 또는 다른 출력 장치, 예컨대, 스피커(22)로 전달될 수 있다.

TTS 구성요소(70)가 다언어 시스템에서 사용하기에 바람직한 예시적인 실시예에서, 각각 상이한 언어에 대응하는 다수의 모델은 음향 합성기(80)와 관련하여 저장될 수 있다. 따라서, 각각의 특정 언어 모델은 트레이닝되어, 특정 언어에 대응하는 일련의 음소에 응답하여 자연 소리 및 정확한 합성 음성을 생성할 수 있다. 따라서, 만일 TTS 구성요소(70)가 입력 텍스트(82)의 정확한 언어(또는 사리에 맞는 분석에 기초하여 가장 정확할 수 있는 언어)를 통지받으면, TTS 구성요소(70)는 대응하는 언어 모델을 선택하고 입력 텍스트(82)의 자연 및 정확한 소리 표현을 합성 음성(84)의 형태로 생성할 수 있다.

이점에 있어서, LID 구성요소(72)는 크기가 단일 단어만큼 작을 수 있는 입력 텍스트(82)를 분석하고 입력 텍스트(82)와 관련될 가능성이 가장 높은 언어(예컨대, 최상의 언어)의 정확한 추정을 생성하기 위해 동작하도록 구성될 수 있다. LID 구성요소(72)는 입력 텍스트(82)를 수신할 수 있고 입력 텍스트(82)와 관련될 가능성이 가장 높은 언어를 결정할 수 있는 하드웨어, 소프트웨어 또는 하드웨어와 소프트웨어의 조합으로 구현된 임의의 장치 또는 수단일 수 있다. 예시적인 실시예에서, LID 구성요소(72)는 LID 구성요소(72)의 동작을 제어하거나 다른 구성요소와 통신할 수 있는 처리 구성요소(90)를 포함할 수 있다. 처리 구성요소(90)는 다 수의 방법으로 구현될 수 있다. 예컨대, 처리 구성요소(90)는 집적 회로, 가령, ASIC을 포함하는 프로세서, 코프로세서, 제어기 또는 여러 가지 다른 처리 수단 또는 장치로서 구현될 수 있다. 후술되는 동작에 따라 가장 가능성이 있는 언어의 리스트를 결정한 후에, LID 구성요소(72)는 TTS 구성요소(70)로 언어 식별 정보(91)를 전달할 수 있다. 언어 식별 정보(91)는 최상의 언어의 식별 또는 입력 텍스트(82)와 관련된 n 개의 최상의 언어의 리스팅을 포함할 수 있다.

예시적인 실시예에서, LID 구성요소(72)의 다른 구성요소는 입력 텍스트(82) 내의 단어(또는 엔트리)마다 알파벳 스코어를 할당하도록 구성된 알파벳 스코어링 구성요소(92) 및 입력 텍스트(82) 내의 단어마다 n-그램(n-gram) 빈도 스코어를 제공하도록 구성된 n-그램 빈도 분석 구성요소(94)를 포함할 수 있다. 이와 달리, 처리 구성요소(90) 또는 다수의 처리 구성요소는 알파벳 스코어링 구성요소(92) 및/또는 n-그램 빈도 분석 구성요소(94)와 관련된 기능 전부를 수행할 수 있다. 예시적인 실시예에서, 처리 구성요소(90)는 단어마다 조합 스코어를 결정하도록 또한 구성될 수 있는데, 그 조합 스코어는 단어마다 알파벳 스코어와 n-그램 빈도를 포함한다. 예시적인 실시예에서, 처리 구성요소(90)는 또한 입력 텍스트(82) 내의 단어 중 각각의 조합 스코어에 기초하여 입력 텍스트(82)에 대한 누적 조합 스코어를 결정하도록 구성될 수 있다. 누적 조합 스코어에 기초하여, 처리 구성요소(90)는 입력 텍스트(82)와 관련된 최상의 언어(예컨대, 가장 가능성 있는 언어)를 결정하도록 구성될 수 있다. 일 실시예에서, 최저 스코어를 가진 특정 언어는 최상의 언어를 나타낼 수 있다. 그러나, 다른 실시예는 스코어 계산에 사용된 알고리즘 및 이용된 스코어링 패러다임에 따라 최고 스코어를 가진 언어를 선택할 수 있다.

일 실시예에서, LID 구성요소(72)는 조합 스코어 및/또는 누적 조합 스코어가 최상의 언어 결정에 관해서 명확한 결과를 제공하지 않는 경우에 사용하기 위해 최상의 언어 결정을 위한 사전정의된 언어 선호 정보를 가진 패키지 순서화 구성요소(96)를 포함할 수 있다. 조합 스코어의 각각을 조합함으로써 또는 우선 입력 텍스트(82) 내의 각각의 단어의 알파벳 스코어 전부를 조합하고 그 결과적인 조합 알파벳 스코어와 입력 텍스트(82) 내의 각각의 단어의 n-그램 빈도 스코어 전부를 조합한 결과를 조합함으로써 누적 조합 스코어가 결정될 수 있음을 알아야 한다.

알파벳 스코어링 구성요소(92)는 복수의 언어 중 각각의 언어에 대한 입력 텍스트(82)의 단어마다 알파벳 스코어를 제공하도록 구성될 수 있다. 알파벳 스코어링 구성요소(92)는 해독될 단어의 각각의 문자(또는 글자)를 시험할 수 있고, 단어의 각각의 문자(또는 글자)를 복수의 언어의 각각의 알파벳과 비교할 수 있는 하드웨어, 소프트웨어 또는 하드웨어와 소프트웨어의 조합으로 구현된 임의의 장치 또는 수단일 수 있다. 그 비교에 기초하여, 알파벳 스코어링 구성요소(92)는 복수의 언어 각각의 단어에 대한 알파벳 스코어를 생성하도록 구성될 수 있다. 복수의 언어 각각에 대한 알파벳 스코어는 스코어링되는 복수의 언어 중 각각의 언어의 대응하는 알파벳으로 표현될 단어의 문자들 중 하나 이상의 실패(failure)에 적어도 일부분 기초할 수 있다. 바꾸어 말하면, 만일 단어의 모든 문자가 특정 언어로 표현할 수 있으면, 특정 언어 내의 단어에 대한 알파벳 스코어는 최대 가능 스코어(선택된 스코어링 패러다임에 의존하는 높거나 낮은 숫자 값일 수 있음)일 수 있지 만, 일부 문자를 표현할 수 없는 다른 언어에 대한 알파벳 스코어는 다른 언어로 표현할 수 없는 문자의 수에 의해 결정된 양만큼 최대 가능 스코어보다 낮을 것이다.

예시적인 실시예에서, 알파벳 스코어링 구성요소(92)는 단어의 "알파벳 외(out-of-alphabet)" 문자의 수에 기초하여 단어마다 알파벳 스코어를 할당하도록 구성될 수 있다. 단어마다 알파벳 스코어를 계산하거나 결정한 후에, 알파벳 스코어링 구성요소(92)는 알파벳 스코어를 임계치와 비교하여 단어가 통과(passing) 또는 실패(failing) 알파벳 스코어를 갖는지 여부를 결정할 수 있다. 예시적인 실시예에서, 임계치는, 만일 만족되지 않으면, 단어가 알파벳 스코어가 계산되었던 언어와 관련되지 않을 가능성이 높음을 나타내는 사전결정된 값일 수 있다. 바꾸어 말하면, 실패 알파벳 스코어는 단어가 실패 알파벳 스코어가 계산되었던 언어로 표현할 수 없음을 나타낸다. 이와 달리, 실패 알파벳 스코어는 문자 중 어느 것도 알파벳 스코어가 계산되었던 언어로 표현할 수 없는 단어에 간단히 할당될 수 있다.

복수의 언어 각각의 단어마다 알파벳 스코어를 계산한 후에, 본 발명의 예시적인 일 실시예의 알파벳 스코어링 구성요소(92)는 n-그램 빈도 구성요소(94)에 의해 더 처리하기 위해 후보 언어로서 실패 알파벳 스코어를 가진 각각의 언어를 제거한다. 바꾸어 말하면, 만일 단어가 특정 언어에 대한 실패 알파벳 스코어를 수신하면, 단어는 특정 언어에 대한 n-그램 빈도 스코어를 수신하지 못할 수도 있다. 다른 예시적인 실시예에서, 단어가 실패 알파벳 스코어를 수신하는 언어의 단어에 대한 n-그램 빈도 스코어를 단순히 계산하지 않는 것 보다, 알파벳 스코어링 구성요소(92)는 나쁜(예컨대, 최저 비실패 알파벳 스코어보다 낮음) 또는 심지어 최저 가능 스코어를 단어에 할당하도록 구성될 수 있다. 이어서 n-그램 빈도 구성요소(94)는 단어가 실패 알파벳 스코어를 수신하였던 언어로 단어를 처리할 수 있다.

예시적인 실시예에서, 알파벳 스코어링 구성요소(92)는 복수의 언어마다 누적 알파벳 스코어를 계산하거나 결정하도록 또한 구성될 수 있다. 누적 알파벳 스코어는 복수의 언어 중 대응하는 언어의 입력 텍스트(82)의 각각의 단어의 알파벳 스코어의 조합을 나타낼 수 있다. 누적 알파벳 스코어는 또한 임계치와 비교될 수 있고 단일 단어에 관하여 전술한 바와 같이 처리될 수 있다.

n-그램 빈도 구성요소(94)는 복수의 언어 중 각각의 언어에 대한 입력 텍스트(82)의 단어마다 n-그램 빈도 스코어를 제공하도록 구성될 수 있다. n-그램 빈도 구성요소(94)는 복수의 언어 각각에 대한 알려진 정보에 기초하여 복수의 언어 중 각각의 언어에 대응하는 단어의 가능성과 관련된 확률 및 단어의 각각의 문자(또는 글자)를 시험할 수 있는 하드웨어, 소프트웨어 또는 하드웨어와 소프트웨어의 조합으로 구현된 임의의 장치 또는 수단일 수 있다. 이점에 있어서, 모델은 복수의 언어 중 각각에 대해 이용될 수 있다. 각 모델은 n-1 개의 문자가 선행한다는 가정하에 각 단어(또는 엔트리)의 n 번째 문자의 조건부 확률을 나타낼 수 있는 누적 n-그램 통계를 포함할 수 있다. 예컨대, 트라이그램(trigram) "abc"에 있어서, n-그램 확률은 이전 2 개의 문자가 "ab"라는 가정하에 문자 "c"의 조건부 확률을 나타낼 수 있다. 예시적인 실시예에서, n-그램 빈도 스코어는 단어와 관련된 n-그램의 n-그램 확률의 로그의 누적을 나타낼 수 있다. 본 명세서의 설명은 단어 레벨 분석에 기초하여 제공되었지만, 분석이 음절, 구, 문장 등의 레벨에 기초하여 임의의 문자에 대해 수행될 수 있음도 알아야 한다. 이와 달리, n-그램 빈도 구성요소(94)는 입력 텍스트(82)의 각 단어(또는 음절, 구, 문장 등)의 n-그램 빈도 스코어를 조합함으로써 누적 n-그램 빈도 스코어를 결정하도록 구성될 수 있다.

예시적인 실시예에서, 각 모델은 복수의 언어마다의 통계치를 수집함으로써 생성될 수 있다. 복수의 언어의 개수에 대해 어떠한 한계도 존재하지 않을 수 있다. 이와 같이, 복수의 언어를 구성하는 언어의 선택은 임의의 바람직한 요인에 기초하여 이루어질 수 있다. 각 모델은 복수의 언어 중 한 언어에 대응하고, 각 모델과 관련된 언어에 관하여 수집된 트레이닝 데이터에 기초하여 생성된다. 각 모델은 대응하는 모델과 관련된 언어에 대한 n-그램 빈도 및/또는 대응하는 n-그램 확률을 포함하는 파일로서 구현될 수 있다. 예시적인 실시예에서, 트레이닝 데이터의 각 단어는 시작 및 끝 문자에 할당될 수 있다. 이점에 있어서, 시작 문자(예컨대, [)는 각 단어보다 앞설 수 있고, 끝 문자(예컨대, ])는 각 단어의 다음에 올 수 있으며, 그 결과 시작 n-그램(예컨대, 시작 문자 바로 뒤에 오는 n-그램), 끝 n-그램(예컨대, 끝 문자 바로 앞에 있는 n-그램) 및 내부 n-그램(예컨대, 시작 문자 또는 끝 문자에 바로 가깝지 않은 그램)이 구별될 수 있다.

예시적인 실시예에서, 언어의 알파벳은 문자 또는 글자의 리스트로서 또는 알파벳이 점유하는 유니코드 범위로서 또는 양자 모두로서 설명될 수 있다. 따라서, 큰 알파벳(예컨대, Mandarin)은 콤팩트한 기계 판독가능 형태로 다른 알파벳과 함께 설명될 수 있다. 일 실시예에 따르면, 각 모델은 알파벳의 각 글자에 고유 인덱스를 할당하는 알파벳 기술 정보로 구성될 수 있다. n-그램 빈도 데이터는 인덱스로 표현될 수 있다. 따라서 n-그램 빈도 데이터는 모델의 파일 크기를 감소시키도록 간결한 방법으로 표현될 수 있다.

복수의 언어에 대응하는 모델 파일 각각을 이용하면, 모델 파일을 단일 2진 파일로 조합함으로써 LID 구성요소(72)와 관련된 패키지가 생성될 수 있다. 따라서 패키지는 단일 2진 파일에 어떤 모델이 포함되는지에 기초하여 지원된 언어를 정의할 수 있다(즉, 2진 파일의 모델은 어떤 특정 언어가 지원되는 지에 대응한다). 예시적인 일 실시예에서, 2진 파일의 크기를 감소시키기 위해, n-그램 빈도 데이터는 트리 구조에 저장될 수 있다. 트리 구조는, 노드가 너비 우선(breath-first) 순회 순서로 순차적으로 저장되므로 빠른 트리 파싱(parsing)을 가능하게 할 수 있다.

패키지 순서화 구성요소(96)는 조합 스코어 및/또는 누적 조합 스코어가 최상의 언어 결정에 관해서 명확한 결과를 제공하지 않는 경우에 최상의 언어 결정을 수행하도록 구성될 수 있다. 패키지 순서화 구성요소(96)는 최상의 언어 결정 시에 언어들 사이의 균형을 깨는 사전정의된 언어 선호 정보를 가질 수 있는 하드웨어, 소프트웨어, 또는 하드웨어와 소프트웨어의 조합으로 구현된 임의의 장치 또는 수단일 수 있다. 이점에 있어서, 전술한 바와 같이, 패키지는 지원된 언어를 정의할 수 있다. 따라서 패키지 순서화 구성요소(96)는 패키지를 저장할 수 있고/있거나 패키지에 의해 지원된 언어의 선호 또는 순서화에 관련된 정보를 저장할 수 있 다. 이점에 있어서, 선호 정보는 지리적 정보(예컨대, 보통 특정 지리적 위치에서 만난 언어) 또는 임의의 다른 적합한 정보에 기초하여 결정될 수 있다. 어떤 경우에 패키지 순서화 구성요소(96)는 단어 또는 입력 텍스트(82)가 실패한 알파벳 스코어링을 가지거나 n-그램 빈도 스코어를 생성할 수 없는 경우에만 이용될 수 있으므로, 이러한 결과를 생성할 것 같은 언어에 관한 정보 및 이러한 언어와 만날 빈도는 선호 정보를 결정할 때 이용될 수 있다.

동작 동안에, 엔트리(예컨대, 음절, 단어, 구, 문장 등)가 분석될 때, 엔트리는 알파벳 스코어링 구성요소(92)에서 스코어링된 알파벳일 수 있다. 이점에 있어서, 일 실시예에서, 엔트리는 현재 언어에 대한 알파벳의 인덱스의 어레이로 변환될 수 있다. 만일 엔트리가 그 언어에서 지원되지 않으면, 언어는 엔트리에 대한 알파벳 스코어링에 실패한다. 그 동안에, 언어의 문자와 상관하는 적어도 몇몇 문자를 가진 엔트리에 있어서, 알파벳 스코어는 언어에 할당된다. 언어마다 프로세스가 완료되고, 언어마다 알파벳 스코어가 할당된다. 실패 언어는 최저 통과 스코어보다 낮은 스코어로 주어지거나, 전술한 바와 같이 후보자로서 제거될 수 있다. 이어서 n-그램 빈도 구성요소(94)는 엔트리에 대한 n-그램 빈도 스코어를 계산할 수 있다. 엔트리는 각각 앞 및 뒤에 추가된 시작 및 끝 문자 인덱스를 가질 수 있다.

본 발명의 실시예는 다수의 방법으로 이용될 수 있다. 예컨대, 실시예는 주어진 단어, 이름 또는 엔트리에 대한 몇몇 후보 언어의 순서화 리스트를 생성하도록 이용될 수 있다. 따라서, 본 발명의 실시예는 정확한 언어에 대한 정밀한 정보 가 이용가능하지 않은 경우에 음성 인식에서 사용하기에 유용할 수 있다(예컨대, 스피커 독립 이름 다이얼링(speaker independent name dialing)). 실시예는 타깃 TTS 언어와 주어진 단어의 언어 사이에 스크립트 부정합이 관찰되는 경우에 TTS 합성에도 유용할 수 있다(예컨대, 중국어에서 영어로의 합성). 이와 같이, 언어 조합 또는 변환의 넓은 범위에 대해 언어 지원이 제공될 수 있다.

도 4는 본 발명의 예시적인 실시예에 따른 시스템, 방법 및 프로그램 제품의 순서도이다. 순서도의 각 블록 또는 단계 및 순서도 내의 블록의 조합이 다양한 수단, 예컨대, 하드웨어, 펌웨어 및/또는 하나 이상의 컴퓨터 프로그램 인스트럭션을 포함하는 소프트웨어에 의해 구현될 수 있음을 알아야 한다. 예컨대, 전술한 절차 중 하나 이상은 컴퓨터 프로그램 인스트럭션에 의해 실행될 수 있다. 이점에 있어서, 전술한 절차를 실행하는 컴퓨터 프로그램 인스트럭션은 이동 단말기의 메모리 장치에 의해 저장될 수 있고 이동 단말기 내의 내장형 프로세서에 의해 실행될 수 있다. 알게 되듯이, 임의의 이러한 컴퓨터 프로그램 인스트럭션은 컴퓨터 또는 다른 프로그램가능 장치(즉, 하드웨어)로 로딩되어 기계를 생성할 수 있으며, 그 결과 컴퓨터 또는 다른 프로그램가능 장치 상에서 실행하는 인스트럭션은 순서도 블록(들) 또는 단계(들) 내에 지정된 기능을 구현하는 수단을 생성한다. 이들 컴퓨터 프로그램 인스트럭션은 컴퓨터 또는 다른 프로그램가능 장치를 특정 방식으로 기능으로 지시할 수 있는 컴퓨터 판독가능 메모리에도 저장될 수 있으며, 그 결과 컴퓨터 판독가능 메모리에 저장된 인스트럭션은 순서도 블록(들) 또는 단계(들) 내에 지정된 기능을 구현하는 인스트럭션 수단을 포함하는 제조물을 생성할 수 있 다. 컴퓨터 프로그램 인스트럭션은 또한 컴퓨터 또는 다른 프로그램가능 장치로 로딩되어 컴퓨터 구현 프로세스를 생성하도록 일련의 동작 단계가 컴퓨터 또는 다른 프로그램가능 장치 상에서 수행되게 할 수 있으며, 그 결과 컴퓨터 또는 다른 프로그램가능 장치 상에서 실행하는 인스트럭션이 순서도 블록(들) 또는 단계(들) 내에 지정된 기능을 구현하는 단계를 제공한다.

따라서, 순서도의 블록 또는 단계는 지정된 기능을 수행하는 수단의 조합, 지정된 기능을 수행하는 단계의 조합 및 지정된 기능을 수행하는 프로그램 인스트럭션 수단을 지원한다. 또한 순서도의 하나 이상의 블록 또는 단계, 및 순서도 내의 블록 또는 단계의 조합이 지정된 기능 또는 단계를 수행하는 특정 용도의 하드웨어 기반 컴퓨터 시스템에 의해 또는 특정 용도의 하드웨어 및 컴퓨터 인스트럭션의 조합에 의해 구현될 수 있음을 알아야 한다.

이점에 있어서, 플렉시블 텍스트 기반 언어 식별을 제공하는 방법의 일 실시예는 동작(200)에서 컴퓨터 판독가능 텍스트 포맷으로 엔트리를 수신하는 단계를 포함할 수 있다. 동작(210)에서 엔트리의 알파벳 스코어가 계산되거나 결정될 수 있다. 동작(220)에서, 복수의 언어마다 엔트리의 n-그램 빈도 스코어가 계산되거나 결정될 수 있다. 방법은 동작(230)에서 알파벳 스코어와 n-그램 빈도 스코어의 조합에 기초하여 엔트리와 관련된 언어를 결정하는 단계도 포함할 수 있다.

전술한 기능은 다수의 방법으로 수행될 수 있다. 예컨대, 전술한 기능 각각을 수행하는 임의의 적합한 수단은 본 발명의 실시예를 수행하는 데 이용될 수 있다. 일 실시예에서, 본 발명의 구성요소의 전부 또는 일부는 일반적으로 컴퓨터 프로그램 제품의 제어 하에서 동작할 수 있다. 본 발명의 실시예의 방법을 수행하는 컴퓨터 프로그램 제품은 비휘발성 저장 매체와 같은 컴퓨터 판독가능 저장 매체 및 컴퓨터 판독가능 저장 매체 내에 구현된 일련의 컴퓨터 인스트럭션과 같은 컴퓨터 판독가능 프로그램 코드 부분을 포함한다.

전술한 기술 및 관련 도면에 나타난 교시의 이점을 가진 이들 발명이 속하는 당업자에게 본 명세서에 설명된 본 발명의 다수의 변경 및 다른 실시예가 발생할 것이다. 따라서, 본 발명의 실시예가 개시된 특정 실시예로 제한되지 않으며 변경 및 다른 실시예가 부가된 특허청구범위의 범주 내에 포함되도록 의도됨을 알아야 한다. 본 명세서에서 특정 용어가 이용되지만, 포괄적이고 기술적인 의미로만 사용되며 제한하기 위한 것은 아니다.

Claims

컴퓨터 판독가능 텍스트 포맷으로 엔트리를 수신하는 단계와,

복수의 언어 중 각각의 언어마다 상기 엔트리의 알파벳 스코어(alphabet score)를 결정하는 단계와,

상기 복수의 언어 중 각각의 언어마다 상기 엔트리의 n-그램 빈도 스코어(n-gram frequency score)를 결정하는 단계와,

상기 알파벳 스코어와 상기 n-그램 빈도 스코어의 조합에 기초하여 상기 엔트리와 관련된 언어를 결정하는 단계를 포함하는

방법.
제 1 항에 있어서,

상기 알파벳 스코어를 결정하는 단계는, 상기 엔트리와 관련된 문자를 상기 복수의 언어 각각의 알파벳과 비교하는 단계와 상기 복수의 언어 각각에 대한 스코어를 생성하는 단계를 포함하되,

상기 복수의 언어 각각에 대한 스코어는 스코어링되는 복수의 언어 중 각각의 언어의 대응하는 알파벳으로 표현될 문자들 중 하나 이상의 실패에 적어도 일부분 기초하는

방법.
제 1 항에 있어서,

상기 n-그램 빈도 스코어를 결정하는 단계는, 상기 복수의 언어 중 각각의 언어마다, 상기 엔트리를 상기 복수의 언어 중 상기 언어에 대한 n-그램 통계치와 비교하는 단계를 포함하는

방법.
제 3 항에 있어서,

상기 엔트리는 n 개의 문자를 포함하고,

상기 엔트리를 n-그램 통계치와 비교하는 단계는, n-1 개의 문자가 선행한다는 가정하에 상기 엔트리의 n 번째 문자의 조건부 확률을 결정하는 단계를 포함하는

방법.
제 3 항에 있어서,

상기 n-그램 통계치의 각각의 n-그램 확률과 관련된 대응하는 시작 문자 및 끝 문자와 상관하여 사용하기 위해, 상기 엔트리의 첫 번째 문자 및 마지막 문자에 시작 문자 및 끝 문자를 각각 할당하는 단계를 더 포함하는

방법.
제 1 항에 있어서,

상기 복수의 언어 중 각각의 언어마다 상기 알파벳 스코어를 임계치와 비교하는 단계를 더 포함하는

방법.
제 6 항에 있어서,

상기 n-그램 빈도 스코어를 결정하는 단계는 상기 알파벳 스코어가 상기 임계치를 만족시키는 상기 복수의 언어 중 몇몇 언어에 대해서만 수행되는

방법.
제 6 항에 있어서,

상기 알파벳 스코어가 상기 임계치를 만족시키지 못함에 응답하여 상기 엔트리를 사전결정된 알파벳 스코어에 할당하는 단계를 더 포함하는

방법.
제 1 항에 있어서,

상기 엔트리와 관련된 언어를 결정하는 단계는, 상기 엔트리와 관련된 언어에 관하여 불확정한 결과를 제공하면 상기 알파벳 스코어와 상기 n-그램 빈도 스코어의 조합에 응답하여 언어의 사전정의된 순서에 기초해서 상기 엔트리와 관련된 언어를 선택하는 단계를 포함하는

방법.
제 1 항에 있어서,

상기 엔트리는 입력 텍스트를 포함하는 복수의 세그먼트 중 하나이고,

상기 언어를 결정하는 단계는, 상기 복수의 세그먼트 중 각각의 세그먼트의 알파벳 스코어와 n-그램 빈도 스코어의 누적 조합에 기초하여 상기 입력 텍스트와 관련된 언어를 결정하는 단계를 더 포함하는

방법.
컴퓨터 판독가능 프로그램 코드 부분이 저장된 적어도 하나의 컴퓨터 판독가능 저장 매체를 포함하는 컴퓨터 프로그램 제품에 있어서,

상기 컴퓨터 판독가능 프로그램 코드 부분은,

컴퓨터 판독가능 텍스트 포맷으로 엔트리를 수신하는 제 1 실행가능 부분과,

복수의 언어 중 각각의 언어마다 상기 엔트리의 알파벳 스코어를 결정하는 제 2 실행가능 부분과,

상기 복수의 언어 중 각각의 언어마다 상기 엔트리의 n-그램 빈도 스코어를 결정하는 제 3 실행가능 부분과,

상기 알파벳 스코어와 상기 n-그램 빈도 스코어의 조합에 기초하여 상기 엔트리와 관련된 언어를 결정하는 제 4 실행가능 부분을 포함하는

컴퓨터 프로그램 제품.
제 11 항에 있어서,

상기 제 2 실행가능 부분은 상기 엔트리와 관련된 문자를 상기 복수의 언어 각각의 알파벳과 비교하는 단계와 상기 복수의 언어 각각에 대한 스코어를 생성하는 인스트럭션을 포함하되,

상기 복수의 언어 각각에 대한 스코어는 스코어링되는 복수의 언어 중 각각의 언어의 대응하는 알파벳으로 표현될 문자들 중 하나 이상의 실패에 적어도 일부분 기초하는

컴퓨터 프로그램 제품.
제 11 항에 있어서,

상기 제 3 실행가능 부분은 상기 복수의 언어 중 각각의 언어마다 상기 엔트리를 상기 복수의 언어 중 상기 언어에 대한 n-그램 통계치와 비교하는 인스트럭션을 포함하는

컴퓨터 프로그램 제품.
제 13 항에 있어서,

상기 엔트리는 n 개의 문자를 포함하고,

상기 제 3 실행가능 부분은, n-1 개의 문자가 선행한다는 가정하에 상기 엔트리의 n 번째 문자의 조건부 확률을 결정하는 인스트럭션을 더 포함하는

컴퓨터 프로그램 제품.
제 13 항에 있어서,

상기 n-그램 통계치의 각각의 n-그램 확률과 관련된 대응하는 시작 문자 및 끝 문자와 상관하여 사용하기 위해, 상기 엔트리의 첫 번째 문자 및 마지막 문자에 시작 문자 및 끝 문자를 각각 할당하는 제 5 실행가능 부분을 더 포함하는

컴퓨터 프로그램 제품.
제 11 항에 있어서,

상기 복수의 언어 중 각각의 언어마다 상기 알파벳 스코어를 임계치와 비교하는 제 5 실행가능 부분을 더 포함하는

컴퓨터 프로그램 제품.
제 16 항에 있어서,

상기 제 3 실행가능 부분은 상기 알파벳 스코어가 상기 임계치를 만족시키는 상기 복수의 언어 중 몇몇 언어에 대해서만 실행되는

컴퓨터 프로그램 제품.
제 16 항에 있어서,

상기 알파벳 스코어가 상기 임계치를 만족시키지 못함에 응답하여 상기 엔트리를 사전결정된 알파벳 스코어에 할당하는 제 6 실행가능 부분을 더 포함하는

컴퓨터 프로그램 제품.
제 11 항에 있어서,

상기 제 4 실행가능 부분은, 상기 엔트리와 관련된 언어에 관하여 불확정한 결과를 제공하면 상기 알파벳 스코어와 상기 n-그램 빈도 스코어의 조합에 응답하여 언어의 사전정의된 순서에 기초해서 상기 엔트리와 관련된 언어를 선택하는 인스트럭션을 포함하는

컴퓨터 프로그램 제품.
제 11 항에 있어서,

상기 엔트리는 입력 텍스트를 포함하는 복수의 세그먼트 중 하나이고,

상기 제 4 실행가능 부분은 상기 복수의 세그먼트 중 각각의 세그먼트의 알파벳 스코어와 n-그램 빈도 스코어의 누적 조합에 기초하여 상기 입력 텍스트와 관련된 언어를 결정하는 인스트럭션을 포함하는

컴퓨터 프로그램 제품.
컴퓨터 판독가능 텍스트 포맷으로 엔트리를 수신하고 복수의 언어 중 각각의 언어마다 상기 엔트리의 알파벳 스코어를 계산하도록 구성된 알파벳 스코어링 구성요소와,

상기 복수의 언어 중 각각의 언어마다 상기 엔트리의 n-그램 빈도 스코어를 계산하도록 구성된 n-그램 빈도 구성요소와,

상기 n-그램 빈도 구성요소 및 상기 알파벳 스코어링 구성요소와 통신하는 처리 구성요소를 포함하되,

상기 처리 구성요소는 상기 알파벳 스코어와 상기 n-그램 빈도 스코어의 조합에 기초하여 상기 엔트리와 관련된 언어를 결정하도록 구성되는

장치.
제 21 항에 있어서,

상기 알파벳 스코어링 구성요소는 또한, 상기 엔트리를 상기 복수의 언어 각각의 알파벳과 비교하고 상기 복수의 언어 각각에 대한 스코어를 생성하도록 구성되되,

상기 복수의 언어 각각에 대한 스코어는 스코어링되는 복수의 언어 중 각각의 언어의 대응하는 알파벳으로 표현될 문자들 중 하나 이상의 실패에 적어도 일부분 기초하는

장치.
제 21 항에 있어서,

상기 n-그램 빈도 구성요소는 또한, 상기 복수의 언어 중 각각의 언어마다, 상기 엔트리를 상기 복수의 언어 중 상기 언어에 대한 n-그램 통계치와 비교하도록 구성되는

장치.
제 23 항에 있어서,

상기 엔트리는 n 개의 문자를 포함하고,

상기 n-그램 빈도 구성요소는 또한, n-1 개의 문자가 선행한다는 가정하에 상기 엔트리의 n 번째 문자의 조건부 확률을 결정하도록 구성되는

장치.
제 23 항에 있어서,

상기 n-그램 빈도 구성요소는 또한, 상기 n-그램 통계치의 각각의 n-그램 확률과 관련된 대응하는 시작 문자 및 끝 문자와 상관하여 사용하기 위해, 상기 엔트리의 첫 번째 문자 및 마지막 문자에 시작 문자 및 끝 문자를 각각 할당하도록 구성되는

장치.
제 21 항에 있어서,

상기 알파벳 스코어링 구성요소는 또한, 상기 복수의 언어 중 각각의 언어마다 상기 알파벳 스코어를 임계치와 비교하도록 구성되는

장치.
제 26 항에 있어서,

상기 n-그램 빈도 구성요소는 또한, 상기 알파벳 스코어가 상기 임계치를 만족시키는 상기 복수의 언어 중 몇몇 언어에 대해서만 상기 n-그램 빈도 스코어를 계산하도록 구성되는

장치.
제 26 항에 있어서,

상기 n-그램 빈도 구성요소는 또한, 상기 알파벳 스코어가 상기 임계치를 만족시키지 못함에 응답하여 상기 엔트리를 사전결정된 알파벳 스코어에 할당하도록 구성되는

장치.
제 21 항에 있어서,

상기 엔트리와 관련된 언어에 관하여 불확정한 결과를 제공하면 상기 알파벳 스코어와 상기 n-그램 빈도 스코어의 조합에 응답하여 언어의 사전정의된 순서에 기초해서 상기 엔트리와 관련된 언어를 선택하도록 구성된 패키지 순서화 구성요소를 더 포함하는

장치.
제 21 항에 있어서,

상기 엔트리는 입력 텍스트를 포함하는 복수의 세그먼트 중 하나이고,

상기 처리 구성요소는 또한, 상기 복수의 세그먼트 중 각각의 세그먼트의 알파벳 스코어와 n-그램 빈도 스코어의 누적 조합에 기초하여 상기 입력 텍스트와 관련된 언어를 결정하도록 구성되는

장치.
제 21 항에 있어서,

상기 장치는 이동 단말기로서 구현되는

장치.
컴퓨터 판독가능 텍스트 포맷으로 엔트리를 수신하는 수단과,

복수의 언어 중 각각의 언어마다 상기 엔트리의 알파벳 스코어를 결정하는 수단과,

상기 복수의 언어 중 각각의 언어마다 상기 엔트리의 n-그램 빈도 스코어를 결정하는 수단과,

상기 알파벳 스코어와 상기 n-그램 빈도 스코어의 조합에 기초하여 상기 엔트리와 관련된 언어를 결정하는 수단을 포함하는

장치.
제 32 항에 있어서,

상기 엔트리와 관련된 언어에 관하여 불확정한 결과를 제공하면 상기 알파벳 스코어와 상기 n-그램 빈도 스코어의 조합에 응답하여 언어의 사전정의된 순서에 기초해서 상기 엔트리와 관련된 언어를 선택하는 수단을 더 포함하는

장치.