TW200538969A

TW200538969A - Handwriting and voice input with automatic correction

Info

Publication number: TW200538969A
Application number: TW094103440A
Authority: TW
Inventors: Alex Robinson; Ethan Bradford; David Kay; Van Meurs Pim; James Stephanick
Original assignee: America Online Inc
Priority date: 2004-02-11
Filing date: 2005-02-03
Publication date: 2005-12-01
Also published as: WO2005077098A8; CN1918578B; CA2556065A1; EP1714234A2; EP1714234A4; BRPI0507577A; CN1918578A; WO2005077098A3; CA2556065C; KR20070090075A; JP2007524949A; WO2005077098A2; KR100912753B1; AU2005211782A1; AU2005211782B2; WO2005077098B1

Description

入的識別理等等之有上外型之嚴格大小限制以及輸選單等等）的嚴袼限制，小戰性的問題。現今接受文字。近來從攜帶電腦、手持電、行動電話以及其他攜帶無型攜帶使用者友善之使用者以編輯文件及訊息，如用於 •同時傳送及接收電子郵

200538969 玖、發明說明：【發明所屬之技術領域】本發明與使用資料處理系統之人類語言輪關，如在桌上型電腦、手持電腦、個人資料助的手寫辨識及語音辨識。【先前技術】由於記憶體限制、尺寸與修正文字之控制（按鈕、裝置上的文字輸入是一具挑入的手持電腦裝置變得更小與個人資料助理至雙向傳呼技術的發展已導出對於一小面的需求，以接受文字輸入向傳訊系統以及尤其是"5 (e-mail )或短訊的系統。多年來，攜帶電腦已變得越來越小。在製造一更小帶電腦之努力中的一項尺寸限制元件為鍵盤。如果使用準打字尺寸按鍵，該攜帶電腦至少和該鍵盤一樣大。縮的鍵盤已被使用在攜帶電腦上，但該縮小鍵盤按鍵太小無法被一使用者以足夠的精確性簡單或快速的梯作。在攜帶電腦中加入一全尺寸鍵盤也會I1 且礙該電腦之真正攜性效用。多數的攜帶電腦無法不被置於一平坦工作表面操作以允許該使用者用兩手輸入。一使用者在站立或移入型輸腦線介雙件攜標小而帶上動 5 200538969 時無法輕易地使用一攜帶電腦。手寫辨識為已被採用之一種方式，其可解決具備偵測一手指或觸控筆之動作的一電子感應螢幕或平板的小型裝置上的文子輸入問題。在稱為個人數位助理（PDAs )的最新世代小型攜帶電腦中，各公司嘗試藉由在該pda中加入手寫辨識軟體以解決此問題。一使用者可藉由在一觸控感應板或顯示螢幕上書寫而直接地輸入文字。該辨識軟體隨

即將此手寫文字轉換為數位資料。典型地，該使用者即時寫入文字而該PDA即時辨識一字元。在該觸控感應板或顯示營幕上的書寫建立指出該接觸點的-資料輸入串。該手寫辨識軟體分析該資料輸入串的幾何特徵以判定符合該使用者正在書寫的-字元。該手寫辨識軟體典型地執行幾何外型辨識以判定該手寫字元。不幸地，意。目前的手強大的個人電小型裝置上，性；而個人書於這些原因，個別字母之一該系統之幾何書寫該字母的結果為非常低一”V卞作/夂仞个兮人滿寫辨識解決方案罝古4☆ 茶/、有許多問題，例如即使在腦上，該手寫辨場私 Α軟體並非十分準確；而在記憶體限制更推尺進—步限制手寫辨識之準確寫風格也與用於訓綾、、來該手寫軟體的不同。由許多手寫或‘graffit彳，太產口口要求該使用者學習組特定筆晝。這牲a #

一、疋筆畫組合被用於簡化外型辨識處理並辦A 曰ϋ辨識率。這些筆晝常鱼自然方式十分不同。上提出之問題的最終的產品採用度。語音辨識為被採用以解決文予輸入問題的另一方式。 6 200538969 一，吾θ辨識系統典型地包括一麥克風以偵測並記錄該語音輸入該θ輪入被數位化並被分析以取出一語音樣本。浯曰辨識典型地需要一強大系統以處理該語音輸入。某些舭力有限之浯音辨識系統已被用於小型裝置上，如用於行動電話上以供語音控制操作。對於語音控制操作而言，一裝置僅需識別幾種命令。即使對於依有限範圍之語音辨識而口由於玲樣本會隨著不同使用者以及不同情況有所變化，一小型裝置血 /、5^地並不具有々人滿意的語音辨識準確度。發展出《更實用的系統以處理人類語言輸入是有利的，該系統具有-使用者友善方式，如手寫辨識系統以供以-自然方式輸入手寫或語音辨識系統以供以一自然方式說出語音輸入，該系統具有改善的準確度以及降低的計算需求，如降低的記憶體需求及處理能力需求。【發明内容】此處描述一混合方式以辦推眘粗南武以增進貝枓處理系統上的手寫辨識及語音辨識。在—實施例…前端被用於識別筆畫、字元、音節及/或音素。該前端傳回具備符合該輸入之相對或絕對可能性的候選者。依據該語言言學㈣，如字母或表意語言；輸入中字詞，如正被使用中的字詞或片語 7 200538969

的頻率，該輸入字詞之語音的可能部分，該語言之型態；或該輸入字詞之上下文，一後端結合該前端從字詞輸入所判定之候選者以匹配已知字詞以及該些字詞在目前上下文中的可能用法。該後端可使用外卡以選擇候選字詞、使用語言特徵以預測一待完成字詞或完整的接續字詞、呈現候選字詞以供使用者選擇、及/或提供附加輸出，如字元的自動重音、自動大寫以及自動增加標點及定義符號，以協助該使用者。在一實施例中，對多個輸入模式同步使用一語言後端，如語音辨識、手寫辨識以及鍵盤輸入。本發明之一實施例包含一種在一資料處理系統上處理語言輸入的方法，其包含：對多個字詞成分分別接收多個辨識結果已處理一語言之一字詞的使用者輸入，並從多個辨識結果與指出一字詞列表之使用可能性中判定該字詞之使用者輸入的一或多個候選字詞。該多個辨識結果中至少有一個包含多個候選字詞成分以及多個可能性指標。該多個可能性指標指出該多個字詞成分符合該使用者輸入之一部分相對於彼此之可能性程度。在一實施例中，該候選字詞成分包含來自手寫辨識的一筆晝、來自手寫辨識的字元以及來自語音辨識的音素。該語言可為字母的或表意的。在一實施例中，判定一或多個候選字詞包含：消除該多個辨識結果之多個候選字詞組合、自該語言之一字詞列表選擇多個候選字詞，該多個候選字詞含有該多個辨識結果之候選字詞成分的組合、從該多個辨識結果及指出一字詞列表之使用可能性的資料中對該一或多個候選字詞判定 8

200538969 或多個可能性指標以指出符合該字詞之使用者輸入的對可能性、或依據一或多個可能性指標排序該一或多個選字詞。在一實施例中，自動地從一或多個候選字詞選擇一選者並呈現給該使用者。可依據該語言中的任何片語、語言中的字詞對（word pairs )、以及該語言中的三連字 (word tri grams )而執行該自動選擇。也可依據該語言任何形態（morphology)以及該語言之文法規則而執行自動選擇。也可依據所接收之該字詞之使用者輸入的一下文而執行該自動選擇。在一實施例中，該方法進一步包含依據預料一使用輸入接續字詞而自動選擇的字詞而預測多個候選字詞。在一實施例中，該方法包含呈現該一或多個候選字以供使用者選擇，並接收一使用者輸入以選擇該多個候字詞其中之一。在一實施例中，一字詞成分之多個辨識結果包含一候選字詞成分之任一者對於符合該使用者字詞輸入之一分具有相同可能性的一指示。指出該字詞列表之使用可性的資料可包含該語言中的字詞使用頻率、一使用者使字詞之頻率以及一文件中使用字詞之頻率的任一者。在一實施例中，該方法進一步包含自動重音一或多字元、自動大寫一或多個字元、自動增加一或多個標點號以及自動增加一或多個定義符號的任一者。本發明之一實施例包含在一資料處理系統上辨識語相候候該串之該上者詞選組部能用個符言 9 200538969

輸入的一方法，該方法包含：透過樣式識別處理一語言之一字詞的一使用者輸入以對多個字詞成分個別建立多個辨識結果，並從多個辨識結果及指出一字詞列表之使用可能性的資料中判定該使用者輸入字詞的一或多個候選字詞。該多個辨識結果之至少一者包含多個候選字詞成分以及多個可能性指標。該多個可能性指標指出該多個字詞成分符合該使用者輸入之一部分相對於彼此的可能性程度。該樣式辨識可包括手寫辨識，其中每個該多個候選字詞成分包括一筆晝，例如用於一表意語言符號或字母字元；或一字元，例如用於一字母語言。該字詞可為一字母字詞或一表意語言符號。該樣式辨識可包括語音辨識，其中每個候選字詞成分包含一音素。在一實施例中，一字詞成分之多個辨識結果之一包含一指示，其指出一組候選字詞成分之任一者具有同等的可能性符合該使用者輸入之該字詞的一部分。該組候選字詞成分包含該語言之所有字母字元。指出該字詞列表之使用可能性的資料可包含該語言中的字詞使用頻率、一使用者使用字詞之頻率以及一文件中字詞使用之頻率的任一者。指出字詞列表之使用可能性的資料可包表示該語言之形態的資料以及表示該語言之文法規則的資料的任一者。指出該字詞列表之使用頻率的資料可包含：表示所接收之使用者輸入字詞的上下文的資料。在一實施例中，該使用者輸入僅指定該字詞之一完整字詞成分組合的一部分。該系統判定該候選字詞。 10 200538969 在一實施例中，該一或多個候選字詞包含一部分該多個辨識結果中的候選字詞成分組合所形成之字詞以及一部分含有辨識結果中的候選字詞成分組合的字詞。在一實施例中，該一或多個候選字詞包含多個候選字詞。該方法進一步包含：呈現該多個候選字詞以供選擇，以及接收一使用者輸入以從該多個候選字詞中選擇其中之

在一實施例中，該方法進一步包含：依據預測一使用者所輸入之接續字詞而選擇之一字詞而預測一或多個候選字詞。在一實施例中，該多個候選字詞以符合該使用者輸入之字詞的可能性順序而加以呈現。在一實施例中該方法進一步包含：從一或多個候選字詞中自動地選擇一最有可能者作為該使用者所輸入之一字詞的一辨識字詞。在一實施例中，該方法進一步包含：依據預測一使用者所輸入之接續字詞的一最有可能字詞而預測一或多個候選字詞。在一實施例中，該方法進一步包含自動重音一或多個字元、自動大寫一或多個字元、自動增加一或多個標點符號以及自動增加一或多個定義符號之任一者。在一實施例中，該多個辨識結果之每一者包含個別與多個候選字詞成分有關之可能性指標以指出符合該使用者輸入之一部分的相對可能性。【實施方式】 11 200538969 為主手持音辨體的擎的及語

音節性的而非詞輸中此提供而手為可

如一節、 URL 一實識，與數輸入方法，如手寫辨識及語音辨識，可為傳統以之輸入方法的重要替代方案，尤其是對於小型裝電腦、個人資料助理及行動電話而言。傳統手寫識系統面臨著需要超過小型電子裝置上可利用之難題。本發明透過自動校正以降低手寫或語音辨記憶體需求及處理能力需求而改進這些裝置上的音輸入技術。本發明使用一混合方式以增進資料處理系統之手語音辨識。在一實施例中，一前端辨識筆晝、字、及/或音素並傳回具有符合該輸入之相對或絕對候選者。可傳回不同候選者以供一後端進一步處使用該前端僅選擇一候選者。該後端結合該前端入所判定的候選者以配對已知字詞以及在目前上字詞之使用可能性。藉由結合該前端雨後端，本具有一增進辨識率以及更加使用者友善的一系統寫及語音辨識輸入之一有效且低記憶體/CPU使行的。在本發明中，一 “字詞（word ) ”係指任何語言物串形成一字詞、詞幹（word stem)、字首或字尾片語、縮寫、俚語、表情符號（emoticon )、使用者或表意字元序列的一或多個字元或符號。在本發施例中，一前端被用於執行該語言輸入上的樣如手寫、語音輸入等等。許多技術已被用於將該個目標樣式相比較，如筆晝、手寫字元以及語音鍵盤置如及語記憶識引文字寫辨元、可能理，從字下文發明〇因用成件，、音 ID、明之式辨輸入輸入 12 200538969

重音等。典型地’一輸入不同程度地與數個目標樣式相符合。舉例來說，一手寫字母可能與字元“a”或“c”、“〇”或‘、，，相似。目前可用之樣式辨識技術可判定該手寫字母為這些字元之任一者的 < 能性。然而’一辨識系統典型地被迫僅回報一項符合。因此’具有最高符合可能性的該字元典型地會被回報為辨識結果。在本發明之一實施例中，數個候選者被送進該後端作為可能選擇’而非預先排除其他候選者以得到一項可能為錯誤的符合，因而該後端使用該前後文以對該語言輸入整體地判定更為可能之候選者組合，如一字詞、一片語、字詞對、三連字串、或符合一語句之前後文的一字詞，例如依據文法結構。舉例來說，可從該使用者嘗試輸入之字詞中的不同字元候選者組合中判定不同的候選字詞。從該語言中使用該字詞的頻率以及符合該候選字元之相對或絕對可能性中，該後端可判定該使用者最有可能正在輸入的字詞。此與傳統方法不同，後者提供一組獨立判定之最有可能字元，其甚至無法組成一有意義字詞。因此，本發明結合精確字詞搜尋軟體與一手寫辨識 (HR)引擎或-語音辨識（SR)引擎以提供小型電子裝置如個人數位助理、電話或任彳_ 人饮何泛領域產業上用於輸入文字及資料的許多特定裝置上文丰盥任立又予興3吾音輸入之持續問題一種有力的解決方案。擎以有效地服務各種而僅有低度的記憶體此外，本發明使用一單一後端引輸入型態（標準鍵盤、手寫、語音）， 13 200538969 及處理器需求。

第1圖說明依據本發明在一資料處理系統上辨識使用者輸入之一系統的一圖示。在語言輸入101如手寫或語音於該樣式辨識引擎103被接收後，該樣式辨識引擎103處理該輸入以提供候選字詞成分如字元、音素或筆晝以及其符合該輸入1 05之對應部分的可能性。舉例來說，一字元輸入可與一候選字元列表相符，而造成模糊。在一實施例中，該模糊於該前端層級被容忍而被傳送至該語言非模糊後端以供進一步處理。舉例來說，一種以字詞為基礎的非模糊引擎1 07比對該字詞列表1 09核對該字元的可能組合以建立候選字詞以及其符合該使用者輸入111的關聯可能性。由於較不常使用之字詞或未知字詞如未列入字詞列表1 09中的字詞較不可能符合該使用者輸入，該些候選字詞可被降級而具有較低的符合可能性，即使依據該樣式辨識引擎1 05的結果其看似具有相對較高的符合可能性。該以字詞為基礎的非模糊引擎107可消除某些較不可能的候選字詞因而該使用者不會受到一龐大選擇清單所煩擾。替代地，該以字詞為基礎之非模糊引擎可從該候選字詞選擇一最有可能的字詞。在一實施例中，如果該以字詞為基礎之非模糊引擎 107的輸出中具有模糊，一種以片語為基礎之非模糊引擎 11 3進一步比對該片語列表11 5以核對該結果，該列表可包括二連字串、三連字串等等。可將一或多個先前辨識的 14 200538969 字詞與該目前字詞結合以符合該片語列毒該片語之使用頻率可被用於修改符合該柄以建立該候選片語以及符合11 7的關聯月模糊，該以片語為基礎的非模糊引擎可初識的字詞以及該片語列表11 5而預測接續在一實施例中，如果該依據片語之# 輸出中具有模糊，便執行一前後文及/或夕去不太可能的字詞/片語。如果無法透過驾處理解決該模糊，可呈現該選擇給該使用擇121。在該使用者選擇後，可更新該字該片語列表1 1 5以升級該使用者選擇的：加新的字詞/片語至該列表中。第2圖為依據本發明一種用於辨識使處理系統的一方塊圖。雖然第2圖說明一統之各種元件，已瞭解依據本發明之一嘴理系統-般可包括相較於第2圖所描述者件。舉例來說，某些系統可能不具有一窝需要用於處理聲音的元件。 • 丁呆些系統可能描述的其他功能，如一行動订動電話環境上# 圖說明各種與本發明之〆系些特徵密件。在此說明書中’一習知技藝人士將畴 /資料處理系統的配置並不限於第2 構。顯示器203透過適當的介面電路 • 11 5中的片語。選字詞之可能性能性。即使沒有 .用於依據先前辨字詞。模糊引擎113的法分析11 9以消自動語言非模糊者以供使用者選詞列表109以及 P詞/片語及/或增用者輸入之資料示範資料處理系施例的一資料處更多或較少的元音辨識能力而不具有第2圖中未通信電路。第2 切相關的各種元解依據本發明之中描述的特定結 ?至處理器2 0 1。 15 200538969 一手寫輸入裝置202，如一觸控螢幕、一滑鼠、或一數位筆’被連接至該處理器201以接收使用者輸入以供手寫辨識及/或其他使用者輸入。一語音輸入裝置如一麥克風被連接至該處理器201以接收使用者輸入以供語音辨識及/或其他語音輸入。選擇地，一聲音輸出裝置20 5如一別叭亦被連接至該處理器。該處理器201自該語音輸入裝置204接收輸入並管理輸出至該顯示器及剩 °八。該處理器2 0 1被連接至一記憶體2 1 0。該記憶體包括一暫時儲存媒體組合如隨機存取記憶體（RAM )以及永久儲存媒體組合如唯讀記憶體（ROM )、軟碟、硬碟或 CD-ROMs。該憶體210含有所有管理系統作業所需的軟體常式及資料。該記憶體典型地含有一作業系統2ιι以及應用程式220。應用程式之範例包括文書處理器、軟體辭典以及外語翻譯器。亦可提供語音合成軟體作為應用程式。較佳地’該記憶體進一步包含一筆畫/字元辨識引擎 =Γ供辨識該手寫輪入中的筆畫/字元及/或音素辨識引辨識該語音輸入中的音素。該音素辨識引擎以及該筆畫/字元辨識弓丨擎可使…域中已知之任何技術以提供-候選列表以及符合每個輸入之筆晝之關聯=。已瞭解該前端引擎如該筆畫/字元二;丨擎或該曰素辨識引擎213中用於樣式辨識之本發明中並非是適切的。 η 在本發明之一實施例中’該記憶體210進—步包括一 16 200538969 語言非模糊後端，复可6 “」匕祜一或多個以字詞為基礎的非糊引擎216、以片語兔苴姑七、為基礎之辨識非模糊引擎2 1 7、以前後文為基礎之非模构引整孕2 1 8、一選擇模組2 1 9以及其他如一字詞列表2 1 4以及一 y 片s吾列表2 1 5等等。在此實施例中，該以前後文為基礎之非禮模糊引擎應用有助於輸入非模糊之吏用者仃動的別後文態’策。舉例來說，可依據選擇的使用者位置’㈣使用者在辦公室或在家中；一天中的時間，如工作時間抑或閒暇年· 叹-間，或接收者等等。在本發明之一眘施例中’用於一非模糊後端之元件多數於不同輸入形式中祐极/、用’如用於手寫辨識與用於語音辨識。該字詞列表2〗4 1 4包含一語言中的一已知字詞列表。該字詞列表214可淮一止—人 ^ 步包含該語言中對應字詞之使用頻率資訊。在一實施例中 ’不存在於該語言之字詞列表 214 中的一字詞頻率被相見為零。替代地，可指派一非常小的使用頻率給一未知字匈 ”J °使用該未知字詞之預設使用頻率，便可以一實際上相同』的方式處理該已知及未知字詞。該字詞列表2 1 4可侔陆姑、 ~以字詞為基礎之非模糊引擎2 1 6而被使用以排列、消本β > /或選擇依據該樣式辨識前端（例如該筆畫/字元辨識引擎 # 212或該音素辨識引擎213)之結果所判定之候選字詞，祐Β 7〜、為了元成字詞而依據一部分的使用者輸入而預測字詞。無7 n Ί 類似地，該片語列表2 1 5可包含包括兩個以上字詞的一 y汉^；丨士片^列表以及該使用頻率資訊，該片語表可被該以片語為基礎之非模糊引擎2 1 7所使用且可被用於預測字詞以完成片語。 17 200538969 在本發明之一實施例中，每個輸入序列被參照至一咬多個字彙模組而加以處理，每個字彙模組含有一或多個字 •彙以及關於每個字彙的資訊，包括該字詞中的字元數量以 “及該字詞關於其他相同長度的字詞的發生頻率。替代地，關於該字彙模組或一特定字詞為一成員之模組的資訊被伴隨每個字詞而儲存，或一模組可依據語言樣式修改或建立字詞’如在一特定音節上放至一區別標記，或依據任何用於解譯該目前輸入序列的其他演算法及/或附近前後文而 • 建立或過滤候選字詞。在一實施例中，每個輸入序列被一樣式辨識鈿端所處理以提供一連串的候選列表，如筆晝、字元、音節、音素等等。該候選者的不同組合提供不同的候選字詞。該非模糊後端結合該候選者之符合可能性以及該候選字詞之使用頻率以排列、消去及/或選擇一字詞或更多字詞作為替代品以供使用者選擇。具有較高使用頻率的字詞為高度可能性的候選者。未知字詞或較低使用頻率的字詞為低度可能性的候選者。該選擇模組2 1 9選擇性地自該使用者可選擇者呈現數個南度可能性的字詞。在本發明 • 的另一實施例中，字詞之使用頻率乃依據該使用者之使用或在一特定前後文中該字詞之使用，例如在該使用者正在編輯之一訊息或文章中。因此，常使用的字詞成為更有可能的字詞。 _ 在另一實施例中，每個字彙模組中存有字詞，因而該字詞被分類為含有相同長度之字詞的檔案或叢集。首先藉由搜尋相同長度的字詞群組作為該輸入序列中的輸入數目 18 200538969 而處理每個輸入序列，並以最佳符合度量分數識別該選字詞。如果與該輸入序列具有相同長度而被識別的字詞少於一臨界數量，則該系統繼續比較N輸入的輸列與N+1長度之字詞群組中每個字詞的前1^個字母。理持續搜尋越來越長的字詞並比較輸入之輸入序列與群組中每個字詞的前N個字母，直到識別臨界數量的字詞。長度大於該輸入序列的可用候選字詞可被提供使用者作為該輸入序列的可能解釋，其提供一字詞完形式。 f安裝階段中，或在收到文字訊息或其他資料之過程中，在資料檔案尋此資訊樓案的方法已，加入語彙中的字詞。用一曰發^ 1 存在於習知技藝中。在搜尋過 α ,日m 史破增加至一子彙模組作為低頻詞，且因此被置於該念一播f 予祠相關聯之字詞列表的末端。押8¾過程中*一特定在 '新字詞被偵測到的次數，便藉由子Θ相關列表中升級丄疮 h子詞而指定一相對越來越高的度’因而增加資訊私 ,^ 貧冗輪入期間中該字詞顯示於該字詞選表中的可能性。在本發"明之_ - %、樣中，對於每個輸入序列，一字組藉由識別且右畏古八阿可能性的候選字詞成分並且編製選字詞成分所構成之 ^ 7 之〜子詞而建立一候選字詞。此“峰型”字詞隨後被包含％天匕^於候選字詞列表中，亦可被呈現於別^曰疋搁位中。該字詞語彙具有冒犯字詞之附錄，搭般可接又狀態下的頬似字詞，因而輸入該冒犯字詞時些候候選入序此處每個候選給該成的持續於搜程中率字依據在該優先擇列詞模由候切類一特配一，即 19 200538969

使該文字的確切輸入包含該冒犯字詞，僅會產生該確切類型攔位中的相關可接受字詞，且在適當情況下作為該字詞選擇列表中的一建議。此特性可過濾掉冒犯字詞的出現，該情形在該使用者暸解到可能更快地打字而較不注意地觸碰該鍵盤之預期字母的精確位置時將可能偶然地出現。因此，在顯示該確切鍵入字串之前使用習知技藝中熟知之技術，負責顯示該字詞選擇列表之軟體常式比較該目前確切鍵入字串以及冒犯字詞附錄，若發現兩者相符，便以相關可接受字詞取代該顯示字串。否則，即使將一冒犯字詞視為一極低頻率字詞，當該字詞之每個字母被直接觸碰時，其仍將被顯示為該確切鍵入字詞。即使此情形與意外在一標準鍵盤上鍵入一冒犯字詞相似，本發明容忍該使用者較不準確的輸入。此特性可由該使用者開啟或關閉，例如透過一系統選單選項。該些習知技藝人士將暸解可於該電腦中開啟額外字彙模組，例如含有法律術語、醫學術語以及其他語言之字彙模組。再者於某些語言如印度語中，該字彙模組可使用有效子字詞序列之“樣板（template) ”以於該先前輸入及該候選字詞正被考慮時判定何者候選字詞成分是可能的或適當的。透過一系統選單，該使用者可設定該系統以使該額外字彙字詞出現於可能字詞列表的最前面或最後面，例如藉由特別著色或高亮度標示，或該系統可自動依據何者字彙模組供應該直接先前選擇的字詞而自動切換該字詞之順序。因此，在附加申請專利範圍中，將瞭解本發明可以除 20 200538969 了此處特別說明之外的方式加以實施。依據本發明之另一態樣，在一使用者使用該系統之過程中，—升級演算法自動地調整該語彙，該演算法於每次該使用纟選擇_字詞肖執行以透㉟逐漸增加與該字詞相關之：：頻率而升级該語彙中的字詞。&一實施例中，該升級演算法增加與一相對大量增額所選擇之字詞相關的頻率數值’而降低_非常小減額所忽略之該些字詞的頻率數值。對於相對頻率資訊由字詞出現於一列表中的連續順序所指出的一字彙模組而言，藉由將該選擇字詞向上移動某部分與列表前端間的距離而完成升級。該升級演算法最好避免移動最常使用的字詞以及非常不常使用的字詞遠離其原始位置。舉例來說該列表之中間範圍中的字詞隨著每次選擇破升級最大的比例。位於該選擇字詞於該語橐升級中開始與結束之間的字詞被有效地以數值丨所降級。字詞列表整體維持守恆，因而關於該列表中字詞之相對頻率的資訊可被維護並更新，而無須增加該列表所需之儲存。該升級演算法增加選擇字詞之頻率且於適當1降低未選擇字詞之頻帛。舉例來說’在相對頻率資訊由字詞出現於-列表中的連績順序所指出的一語棄中，於該列表中的 IDX位置出現的一選擇字詞被移動至（Ιβχ/2 )位置。相應地，位於該列表中（1_位置向下至（lDx+i)之間的字詞被向下移動該列表中的一個位置。當一連串接觸點被處理且一字詞選擇依據該計算的符合度量分數所建立，且 -或多個字詞於該列表中出現於該使用者所選擇的字詞之 21 200538969 前時時，便將該列表中的字詞降級。在該選於更上端但未被選擇之字詞可被推定將被指 •高頻率，亦即於該列表中其出現過於上方。起 • 位置的此一字詞可被降級，例如被移動至（位置。因此，一字詞越常被考慮選擇，其被亦即其被移動的階層數量越少。該升級及降依據該使用者之一動作所觸發，或可能依據入而被不同地執行。舉例來說，僅有在該使

• 控筆或滑鼠點選或拖放其預期之字詞至一字的最前面位置時，在該選擇列表中比該使用詞更上方出現的字詞才會被降級。替代地，該選擇列表中一更上方位置的一選擇字詞可更大的係數。舉例來說，該升級字詞從IDX (IDX/3 )位置。對於該些習知技藝人士而變化是顯而易見的。依據本發明之另一態樣，該前端可偵測依據來自該後端之迴授改變其認知。隨著該 ^ 入並從該選擇列表中選擇該字詞，該候選文同順序以及每個選擇字詞中包含的預期字詞改變該前端所建立的可能性。替代地，該後該前端接收關於一或多個筆畫、字元、音節 •調整數值。一第3A及3B圖說明依據本發明之手寫辨糊輸出的一範例。本發明之一實施例結合一擇列表中出現派一不適當的初出現於IDX IDX*2+1 )之降級地越少，級處理可能僅該使用者的輸用者使用一觸詞選擇列表中者所預期之字被手動拖放至被升級較一般位置被移動至言，許多此類系統錯誤並且使用者重複輸字成分間的不成分可被用於端可維護一自或音素之獨立識軟體之非模手寫辨識引擎 22 200538969 與-模組’該模組自該手寫引擎取得與該使用者輸入之每個字母有關之所有可能符合，該實施例並結合這些可能性與該語言中的字詞可能性以對該使用者預測最有可能之字詞或該使用者嘗試輪入之字詞。習知技術中已知之任何技術可被用^定該τ能符纟以及與符合有關之可能性。舉例來說’該，使用者可能嘗試輸入五字元以輸入五個字母的字詞“often”。該使用者輸入可顯現為為第3α圈中

所說明者。該手寫辨識軟體指定以下的字元以及筆晝之字元可能性輸出：筆晝 1 (301):，〇, 60%，，a· 24%，V 12%，、，筆晝 2 (302):，t，40%，T 34%，4, 20%，τ 6% 筆晝 3 (303): V 50%，，f，42%，，Γ 4%，，i，4% 筆晝 4 (304): *c，40%，，e* 32%，，s，ι5%，13% 筆晝 5 (305):，n，42%，，!：，30%，，m，16%，v 12% 舉例來說，該筆畫301為的可能性為6〇%，筆畫3〇2 為t的可能性為40%，筆晝303為4’的可能性為筆畫304為‘c’的可能性為40%，筆晝305為、，的可能性為 4 2%。將該手寫辨識軟體認為最接近符合該使用者之筆畫的字母集中在一起，該手寫軟體模組呈現字串‘〇Ucn，給使用者，其並非該使用者預期輸入者。其甚至並非英語中的一字詞。本發明之一實施例使用一非模糊字詞搜尋模組以依據這些字元、關於該字元之符合可能性以及在英語中使用該字詞之頻率而找出一最佳預測。在本發明之一實施例中， 23 200538969 該結合的手寫模組以及該非模糊模組預測該最有可能的字詞為‘often’，其為該使用者嘗試輸入之字詞。

舉例來說，如第3B圖所示，一後端工具接收所有的候選者並判定一可能字詞列表包括：ottcn，attcn，〇ftcn， aftcn，otfcn，atfcn，offcn，affcn, otten, atten，often，aften， otfen，atfen, offen, affen, otter, attcr，oftcr，after, otfer， atfer，offer, affer，otter，atter，ofter，after, otfer, atfer， offer，affer等等。該可能字詞可從該前端判定選擇最高符合可能性至最低符合可能性的字元所構成。當一或多個高度可能的字詞被找出時，可能性較低的字元便可以不被使用。為了簡化該描述，在第3 A圖中假設未知字詞之使用頻率為0，而已知字詞如often，after與offer之使用頻率為1。在第A圖中，由該使用頻率結果以及該字詞中使用之候選字詞的符合可能性而計算一候選字詞之符合指示器。舉例來說，在第3A圖中，字元‘〇，，‘f，，‘t，，‘e，及‘η，的的符合可能性分別為0.6，0.34，0· 5，0.32，0.42，而該字詞‘often’的使用頻率為1。因此，符合該字詞“often”的一指示器被判定為0.0137。類似地，字詞“after，，及“offer”的指示器分別為0.0039及0.0082。當該後端工具選擇最有可能的字詞，便會選擇“often”。注意該字詞之“指示器，，可被正規化以排序該候選字詞。在本發明之一實施例中，一或多個輸入為明確的，亦即與單一筆畫、字元、音節或音素相關，因而符合每個字元等等的可能性等於1 〇〇%。在本發明之另一實施例中，一 24 200538969 明確輸入自該辨識前端產生一特定數值集合，其使得該非模糊後端僅配對該確切字元等等在每個候選字詞的對應位置中。在本發明之另一實施例中，明確輸入被保留數字、適當的讀音符號（diacritics)以及重音標記及/或其他定義符號，並於字詞之内與之間被保留標點符號。

第4 A-4C圖顯示依據本發明於一使用者介面上之手寫辨識的方案。如第4A圖所示，該裝置4〇1包括一區域以供使用者寫入該手寫輸入407。提供一區域4〇3以顯示該使用者正在輸入的訊息或文章，如在一網頁潘j覽器上、在一筆記軟體程式上、在一電子郵件程式上等等。該裝置包括觸控榮幕區域以供該使用者寫入。 ^，丨、你轉埋孩使用者手寫輸入4〇7之移該裝置於區域409提供一候選字詞列表以供該使用者

擇。該候選字詞被以餘人I 付σ可能性加以排序。該裝置可選呈現最前面幾個最有可你取秀Τ此的候選字詞。該使用者可使用傳統方法從該列表選擇一. 彈子巧，或使用對應該字詞之位的一數字鍵。替代地，哕 β亥使用者可選擇語音指令以選擇字詞，如藉由說出該遗 a 選擇予詞或對應該列表中字詞位置編號。在該較佳眘％ y t 呈現於d战歹1中’該最有可能字詞被自動選擇呈現於&域403。闵比如藉由開口此，如果該使用者接受該候選字詞‘ 如錯由開始寫入接績使用者碟實選擇一广’便不需要使用者選擇。如果; 候選者取代該自 ^詞，該裝置便以該使用者選擇< 可能的字詞被高=擇候選者。在另-實施例中，該… 儿又4硯作為該預設值，指出該使用者g 25 200538969 前選擇而將被輸出或被延伸一後續動作的一字詞，而一指定輸入改變該高亮度顯示至另一候選字詞。在另一實施例中，一指定的輸入選擇一音節或字詞以供修正或從已被輸入或預測之一多音節序列或多字詞片語重新輸入。

第4C圖說明當一前後文及/或文法分析進一步協助解決該模糊之一情形。舉例來說，第4C圖中該使用者已輸入該字詞“It is an”。以一文法分析而言，該裝置預測接續字詞為一名詞。因此，該裝置進一步調整該候選字詞之順序而提升屬於名詞之候選字詞。因此，該最有可能的字詞成為“offer”而非“often”。然而，由於一形容詞也可能位於該名詞及該字詞“an”之間，該裝置仍會呈現其他選項以供使用者選擇，如“often”及“after”。第5圖為一流程圖，其說明依據本發明之使用者輸入的處理。於步驟 5 01，該系統接收一字詞之手寫輸入。之後於步驟503建立可能符合該字詞之手寫中的每個字元的一候選字元列表。步驟5 0 5自該候選字元列表中判定一候選孛詞列表。步驟5 07結合該候選字詞之頻率指示器以及符合該候選字元之可能性以判定符合該候選字詞之可能性。步驟509依據符合該候選字詞之可能性而消去一部分的候選字詞。步驟5 1 1呈現一或多個候選字詞以供使用者選擇。雖然第5圖說明處理手寫輸入之一流程圖，從此說明中可暸解語音輸入也可以一類似方式加以處理，其中一語音辨識模組對該字詞中的每個音素建立候選音素。 26 200538969 又字及面臨更槽的記憶體及電腦處辨識系統的高錯誤率以及需常低〇本發明之一實施例結音辨識引擎所回報之相關可端以及可利用這些音素而形統白動修正該語音辨識輪出在本發明之一實施例中於接收每次輸入時在顯示器給該使用者〇該候選字詞以性所判定的順序加以呈現，最有可能的的字詞會出現在序列之提出解釋的其中之的輸入會起始 — 新的輸入序在本發明之另 — 態樣中示器上，最好是位於該文字候選字詞為依據該符合度量重複地啟動一特別指定的選可能性所判定之順序中呈現字詞〇一輸入序列也會在指及有效地選擇該序列之其中出之後被結束因而隨後的依據本發明之一混合系字母音節音素等等執行

命令輸入的語音辨識技術甚至理問題。此外，由於現今語音努力進行修正，故其採用度非合使用一組候選音素以及一語能性以及使用這些輸出的一後成之字詞的已知可能性。該系〇 ’符合該輸入序列的候選字詞上的一字詞選擇列表中被呈現計算每個候選字詞之符合可能因而依據該符合度量而被視為該列表的最前面。選擇該輸入會結束一輸入序列，因而隨後列。，僅有一候選字詞顯示於該顯正被建立之***點上。顯示的而被認為是最有可能者。藉由擇輸入，該使用者可以該符合的替代候選字詞取代該顯示的定選擇輸入的一或多個啟動以一提出解釋以供該系統實際輸輸入起始一新的輸入序列。統首先於一成分層級如筆畫、樣式辨識，如手寫辨識、語音 27

200538969 辨識等等，以提供模糊的結果以及相關的符合可能性隨後於内部成分層級如字詞、片語、字詞對、三連字等執行非模糊操作。該系統用於解決模糊所使用之語特徵可為該語言中的任何字詞使用頻率，該個別使用用字詞之頻率、該輸入字詞之可能語音部分、該語言態、該字詞被輸入的前後文、二連字串（字詞對）或字串、以及任何可用於解決該模糊之其他語言或前後訊。本發明可伴隨字母語言而使用，如英語及西班牙其中該手寫辨識前端的輸出為字母或筆晝以及其相關性。一字母語言之手寫非模糊操作可於該字詞層級行，其中每個字詞典型地包括多個字母。本發明亦可伴隨語意語言而使用，如中文及日文中該手寫辨識前端的輸出為筆晝以及其相關可能性。意語言之手寫非模糊操作可於該詞根/成分或字母層執行。該非模糊操作可進一步於一更高層級操作，如片二連字串、三連字串等等。再者，該語言之文法結構被用於該非模糊操作以選擇該輸入之最佳整體符合。本發明亦可伴隨語意語言之語音或字母表現而使該非模糊操作可於音節、語意字母、字詞、及/或片語 ***作。類似地，本發明也可被用於語音辨識，其中該語識前端的輸出包含音素及其相關符合可能性。該候選可被結合以供選擇一字詞、片語、二連字串、三連字，且串等言的者使之型三連文資語，可能被執，其一語級被語、也可用。層級音辨音素串或 28 200538969 慣用語之一最佳符合。

本發明之一實施例亦於該使用者僅已輸入一些筆晝時預測字詞完成。舉例來說，在成功地以高可能性辨識一字詞之最初幾個字母之後，該系統之後端可提供一字詞列表，其中該最初幾個字母與該符合的字母相同。一使用者可從該列表選擇一字詞以完成該輸入。替代地，該列表中接近某些字詞之一指示可提示該使用者依據該字詞之完成可藉由應用於該列表輸入之一指定輸入而被顯示；該隨後彈出的字詞列表顯示包含該字詞的有限字詞，且可依序指出進一步的完成。該首先幾個字元之每個可僅具有一個高可能性候選者，其被用於選擇該待完成字詞列表。替代地，一或多個該首先字元可含有模糊，因而該首先幾個字元的數個高可能性組合可被用於選擇該待完成字詞列表。用於完成之字詞列表可依據符合該使用者正嘗試輸入之字詞的可能性而被排序並顯示。舉例來說，用於完成之字詞可依據該字詞於例如該語言中、在該使用者正編輯的文章中、在特定前後文中如一對話方塊等等被該使用者被使用的頻率及/或在片語、二連字串、三連字串、慣用語等等中出現的頻率而被排序。當位於一片語、二連字串、三連字串或慣用語等等中的一或多個字詞緊接於正被處理之字詞之前，這些片語、二連字串、三連字串或慣用語之出現頻率於判定該待完成字詞之排序時可被進一步與該字詞之頻率相結合。並未位於任何目前已知片語、二連字串、三連字串、慣用語等等中的字詞被視為在具有一非常低出現頻率 29 200538969 的未♦片舍中。類似地，並未位於已知字詞列表中詞被視為具有一非常低出現頻率的一未知片語。因此 •何字詞之輸入或一字詞之最前面部分可被處理以判定 . 可能的輸入。在本發明之一實施例中，該後端持續取得該樣式前端所辨識之每個字詞、筆畫、音素的候選列表，以該列表並排序待完成字詞。隨著該使用者提供更多入，關於完成之較不可能的字詞會被消去。用於完成 • 詞列表隨著該使用者提供更多輸入而縮小規模，直到不存在或該使用者自該列表選擇一字詞為止。再者，在該樣式辨識前端提供該接續字詞之最前入一候選列表前’該後端自一或多個之前緊接的字詞已知片語、二連字串、三連字串、慣用語等等判定待字詞，以判定一片語、二連字串、三連字串、慣用語之待完成字詞列表。因此，本發明亦依據該使用者最入的字詞而判定該完整的接續字詞在本發明之一實施例中，該後端使用表示具有相 ® 能性之任何筆畫、字70、音節或音素的外卡。依據該輸入之一部分的該待完成字詞列表可被視為對於該使即將輸入或即將從該樣式辨識前端接收之一或多個筆字元或音素使用一外卡的〜範例。 • .在本發明之實施例中，該前端可能無法辨識 • 畫、字元或音素。該前蠕並不會停止該輸入處理以迫用者重新鍵入該輸入相反地該前端可容忍該結果並的字，任最有辨識更新的輸之字模糊面輸以及 JL> 等等後輸同可字詞用者晝、一筆使使傳送 30

200538969 一外卡至該後端。在一高層級中，該後端可解決該模糊無須迫使該使用者重新鍵入該輸入。此大大地增進該系之使用者友善度。在本發明之一實施例中，該後端自動地以外卡取代自於該前端的一或多個輸入。舉例來說，當從一已知字列表中未發現任何可能字詞時，該後端可以一外卡取代最模糊輸入以擴張候選組合。舉例來說，具有大量低可 2候選者的一列表可被一外卡所取代。在一實施例中，月·J端提供一候選列表因而該輸入符合該列表中的其中一 '者的可此性會高於一臨界值。因此，一模糊輸入具有量的低可能性候選者。在其他實施例中，該前端提供一、列表因而每個候選者符合該輸入的可能性會高於一臨因此’一模糊輸入為其中一候選者的可能性很低。 ’該系統實施外卡，例如適合任何字母的筆晝給予所 ^ ，相同的可能性，因而可處理未使用外卡時沒有找到能字窮1 啊情況。在本發明之一實施例中，該後端自該樣辨諸^ ΐΙίΤ irtjf J ~所提供之候選筆畫、字元或音素之組合中建立同的候；逛& 、艰予詞，舉例來說，每個字元輸入的候選字元可據符合· 4 ^ Μ輸入之可能性而加以排序。該候選字詞之建立付合的字元開始延伸至較不可能符合的字元。當個候iP + «χ 〜、、予詞在已知字詞列表中被發現時，較不可能符合元便可能不被用於建立進一步的候選字詞。在一實施中’該系統顯示最有可能的字詞或依據計算過的可能性 X排序的一所有候選字詞列表。該系統可自動地增加一而統來詞該能該候大候界因有可式不依從數的例加輸 31 200538969 出以幫助使用者。此包括例如自動重音字元、自及自動增加標點符號及定義符號。本發明之一態樣提供一語言後端同時地被用入形式如語音辨識、手寫辨識、在硬式鍵盤或觸的鍵盤輸入。在本發明之另一實施例中’ 一語言於去模糊該候選字詞。在一後端成分結合來自該選輸入以判定候選字詞及其符合可能性之後，一被用於依據語言特性排序該候選字詞。舉例來說 B 後段進一步結合使用該使用者於例如該語言中、正編輯之一文章中、需要該輸入之一前後文中等字詞之頻率以及源自該後端成分之候選字詞與其性以去模糊該候選字詞。該語言後端也可依據串、三連字串、片語等等而執行一去模糊操作。語言後端可依據該前後文、文法結構等等而執行作。由於該語言後端所執行之任務對於各種不同法如語音辨識、手寫辨識或使用硬式鍵盤或依觸鍵盤輸入而言都是相同的，因此該語言後端可於 Φ 形式間共享。在本發明之一實施例中’一語言後服務多個輸入形式，因而當一使用者結合不同的以提供一輸入時，僅需一單一語言後端以支援混式。在本發明之另一態樣中’來自一特定前端的 -被視為一明確的候選字詞成分，其若非被記錄符為1 00%即為該後端將使用之一明確筆晝、字元或合在對應位置中含有其的有限字詞。本發明亦包動大寫以於多個輸控螢幕上後端被用前端之候語言後端 ’該語言該使用者等使用該符合可能一二連字再者，該去模糊操的輸入方控螢幕之多個輸入端同時地輸入形式合輸入模每個輸入合可能性音節以符含一混合 32 200538969 系先纟使用來自_或多個辨識系統的候選者集合以及 =性，且其藉由使用…之某些已知特徵以解決 …中的槟糊。解決該手寫/語音辨識中的模糊可增進該統的辨識率以増進該使用者友善度

雖然此處伴隨該較佳實士將可明確地瞭解其他的應而不會偏離本發明之精神與於以下包含的申請專利範圍施例說明本發明，習知技藝人用程式可取代此處所提出者，範圍。因此，本發明應僅受限【圖式簡單說明】第1圖說明依據本發明用於在一資料處理系統上識別使用者輸入的一系統，· 第2圖為依據本發明用於辨識使用者輪入的一資料處理系統的一方塊圖；第3A及3B圖說明依據本發明之一手寫辨識軟體的非模糊輸出的一範例；

第4 A-4C圖說明依據本發明之一使用者介面上的手寫辨識方案；及第5A圖為依據本發明處理使用者輸入的一流程圖。【元件代表符號簡單說明】 1 0 1語言輸入 103樣式辨識引擎 105，111 輸入 33 200538969 107，113非模糊引擎 109字詞列表 11 5片語列表 11 7符合 11 9分析 1 2 1使用者選擇 201處理器

202手寫輸入裝置 203顯示器 204語音輸入裝置 205聲音輸出裝置 2 1 0記憶體 2 11作業系統 212筆晝/字元辨識引擎 213音素辨識引擎 2 1 4字詞列表 2 1 5片語列表 2 1 6以字詞為基礎的非模糊引擎 2 1 7以片語為基礎的非模糊引擎 2 1 8以前後文為基礎的非模糊引擎 2 1 9選擇模組 220應用程式 401裝置 403, 405, 409 區域 407手寫輸入 501，503，505, 507, 509, 5 1 1 步驟 34

Claims

200538969 拾、申請專利範圍： 1. 一種在一資料處理系統中用於識別語言輸入的方法，其至少包含以下步驟：

透過樣式辨識處理一語言之一字詞的一使用者輸入以分別對複數個字詞成分產生複數個辨識結果，該複數個辨識結果之至少其中之一包含複數個候選字詞成分以及複數個可能性指標，該複數個可能性指標指出該複數個字詞成分與該使用者輸入之一部分相對於彼此為符合的可能性程度；及自該複數個辨識結果以及可指出一字詞列表之使用可能性的資料中判定一或多個可供用者輸入之該字詞的候選字詞。 2.如申請專利範圍第1項所述之方法，其中該樣式辨識包含手寫辨識。 3.如申請專利範圍第2項所述之方法，其中該複數個候選字詞成分之每個包含一筆晝：且該字詞包含一語意語言符號。 35

200538969 4. 如申請專利範圍第2項所述之方法，其中該多個詞成分之每個包含一字元；且該字詞包含一字句 5. 如申請專利範圍第1項所述之方法，其中該樣式含語音辨識；且該複數個候選字詞成分之每個包素0 6.如申請專利範圍第1項所述之方法，其中一字詞該複數個辨識結果之一包含一指示，其指出一候成分集合中的任何一者具有符合該字詞之使用之一相同的可能性；及該候選字詞成分集合包含之字母字元。 7.如申請專利範圍第1項所述之方法，其中指出該表之使用可能性的資料至少包含下列之一：該語言中使用字詞的頻率；一使用者使用字詞之頻率；及一文件中使用字詞之頻率。 8 ·如申請專利範圍第1項所述之方法，其中指出該表之使用可能性的資料至少包含下列之一：該語言中的片語；該語言中的字詞對；及候選字字詞。辨識包含一音成分之選字詞者輸入該語言字詞列字詞列 36 200538969 該語言中的三連字串。 9.如申請專利範圍第1項所述之方法，其中指出該字詞列表之使用可能性的資料至少包含下列之一：表示該語言之形式的資料；及表示該語言之文法規則的資料。

1 0.如申請專利範圍第1項所述之方法，其中指出該字詞列表之使用可能性的資料至少包含：表示收到該字詞之使用者輸入的一前後文的資料。 1 1 ·如申請專利範圍第1項所述之方法，其中該使用者輸入僅指定該字詞之字詞成分的一完整集合的一部分。

1 2.如申請專利範圍第1項所述之方法，其中該一或多個候選字詞包含由該複數個辨識結果中的候選字詞成分之組合所形成的一部分字詞以及含有該複數個辨識結果中的候選字詞成分之組合的一部分字詞。 1 3 ·如申請專利範圍第1項所述之方法，其中該一或多個候選字詞包含複數個候選字詞；並且該方法更包含以下步驟：呈現該複數個候選字詞以供選擇；及 37 200538969 接收一使用者輸入以從該複數個候選字詞中選擇其中一者。 1 4 ·如申請專利範圍第1 3項所述之方法，其中更包含以下步驟：依據預期一使用者之次一字詞輸入所選擇之其中一者而預測一或多個候選字詞。

1 5.如申請專利範圍第1 3項所述之方法，其中以符合該字詞之使用者輸入的可能性順序來呈現該複數個候選字詞0 16.如申請專利範圍第1項所述之方法，其中更包含以下步驟：從一或多個候選字詞中自動選擇一最有可能者作為該字詞之使用者輸入的一辨識字詞；依據預期一使用者之次一字詞輸入之最有可能者而預測一或多個候選字詞。 1 7 ·如申請專利範圍第1項所述之方法，其中更包含以下步驟：自動地重音一或多個字元；自動地大寫一或多個字元； 38 200538969 自動地增加一或多個標點符號；及自動地增加一或多個定義符號。 1 8 ·如申請專利範圍第1項所述之方法，其中該複數個辨識結果之每個包含複數個分別與複數個候選字詞成分相關的可能性指標，以指出符合該使用者輸入之一部分的相對可能性。

19. 一種具有指令資料的一機器可讀取媒體，當該機器可讀取媒體於一資料處理系統上被執行時，將使該系統執行一種用於辨識語言輸入的方法，該方法至少包含以下步驟：

藉由執行樣式辨識處理一語言之一字詞的一使用者輸入以分別對複數個字詞成分產生複數個辨識結果，該複數個辨識結果之至少其中之一包含複數個候選字詞成分以及複數個可能性指標，該複數個可能性指標指出該複數個字詞成分與該使用者輸入之一部分相對於彼此為符合的可能性程度；及自該複數個辨識結果以及可指出一字詞列表之使用可能性的資料中判定一或多個可供用者輸入之該字詞的候選字詞。 2 0.如申請專利範圍第1 9項所述之媒體，其中該一或多個 39

200538969 候選字詞包含多個候選字詞；且該方法更包含以驟：呈現該多個候選字詞以供選擇；接收一使用者輸入以從該複數個候選字詞中其中一者；及依據預期一使用者之次一字詞輸入所選擇之一者而預測一或多個候選字詞。 21.如申請專利範圍第19項所述之媒體，其中該方法含以下步驟：從一或多個候選字詞中自動選擇一最有可能為該字詞之使用者輸入的一辨識字詞；依據預期一使用者之次一字詞輸入之最有可而預測一或多個候選字詞。 22. —種用於識別語言輸入的資料處理系統，其至少包處理構件，其係透過樣式辨識用以處理處理一之一字詞的一使用者輸入以分別對複數個字詞成生複數個辨識結果，該複數個辨識結果之至少其中包含複數個候選字詞成分以及複數個可能性指標，數個可能性指標指出該複數個字詞成分與該使用入之一部分相對於彼此為符合的可能性程度；及判定構件，其係用以自該複數個辨識結果以及下步選擇其中更包者作能者含：語言 I 分產之一該複者輸可指 40

200538969 出一字詞列表之使用可能性的資料中判定一或供用者輸入之該字詞的候選字詞。 23 .如申請專利範圍第22項所述之資料處理系統，一或多個候選字詞包含複數個候選字詞；而該系含：呈現構件，其係用以呈現該複數個候選字詞擇；接收構件，其係用以接收一使用者輸入以從個候選字詞中選擇其中一者；及其中以符合該字詞之使用者輸入的可能性現該複數個候選字詞。 24.如申請專利範圍第22項所述之資料處理系統，複數個辨識結果之每個包含複數個分別與複數字詞成分相關的可能性指標，以指出符合該使用之一部分的相對可能性。 25 .如申請專利範圍第22項所述之資料處理系統，包含用於下列之任一者的裝置：自動地重音一或多個字元；自動地大寫一或多個字元；自動地增加一或多個標點符號；及多個可其中該統更包以供選該複數順序呈其中該個候選者輸入其中更 41

200538969 自動地增加一或多個定義符號。 26.如申請專利範圍第22項所述之資料處理系統，其複數個候選字詞之選擇致使該樣式辨識對該選擇數個候選字詞之一或多個字詞成分調整後續的可指標。 27. —種用以在一資料處理系統中處理語言輸入的法，其中至少包含以下步驟：分別接受複數個字詞成分的複數個辨識結果，理一語言之一字詞的一使用者輸入，該複數個辨識之至少其中之一包含複數個候選字詞成分以及複可能性指標，該複數個可能性指標指出該複數個字分與該使用者輸入之一部分相對於彼此為符合的性程度；及自該複數個辨識結果以及可指出一字詞列表用可能性的資料中判定一或多個可供用者輸入之詞的候選字詞。 28.如申請專利範圍第27項所述之方法，其中該候選成分至少包含以下任何一者：源自手寫辨識、語音辨識或鍵盤輸入的一筆1 源自手寫辨識、語音辨識或鍵盤輸入的一字天中該的複能性一方以處結果數個詞成可能之使該字字詞 42 200538969 源自手寫辨識、語音辨識或鍵盤輸入的的一音素；及源自手寫辨識、語音辨識或鍵盤輸入的的一音節或其他語音表現的一音節。 2 9.如申請專利範圍第27項所述之方法，其中上述語言為字母的或語意的任何一種。

3 0.如申請專利範圍第27項所述之方法，其中判定一或多個候選字詞之步驟更包含以下步驟：消去複數個辨識結果之複數個候選字詞成分組合。 3 1.如申請專利範圍第3 0項所述之方法，其中判定一或多個候選字詞之步驟更包含以下步驟：自該語言之一字詞列表中選擇複數個候選字詞，該複數個候選字詞含有該複數個辨識結果中的候選字詞成分之組合。 32.如申請專利範圍第31項所述之方法，其中更包含以下步驟：自該複數個辨識結果以及可指出一字詞列表之使用可能性的資料對一或多個候選字詞判定一或多個可能性指標以指出符合該字詞之使用者輸入的可能性。 43 200538969 3 3 ·如申請專利範圍第3 2項所述之方法，其中更包含以下步驟：依據該一或多個可能性指標而排序該一或多個候選字詞。 34.如申請專利範圍第33項所述之方法，其中更包含以下步驟：

自動從該一或多個候選字詞中選擇一字詞。 35.如申請專利範圍第34項所述之方法，其中該自動選擇之步驟於以下任何一者上被執行：該語言中的片語；該語言中的字詞對；及該語言中的三連字串。 3 6 ·如申請專利範圍第3 4項所述之方法，其中該自動選擇之步驟乃依據下列之任一者而被執行：該語言之形態；及該語言之文法規則。 3 7.如申請專利範圍第34項所述之方法，其中該自動選擇之步驟乃依據收到該字詞之使用者輸入的一前後文而 44 200538969 被執行。 3 8.如申請專利範圍第3 4項所述之方法，其中更包含以下步驟：依據預期一使用者之次一字詞輸入所自動選擇之一字詞而預測多個候選字詞。 39.如申請專利範圍第33項所述之方法，其中更包含以下

步驟：呈現該一或多個候選字詞以供使用者選擇；及接收一使用者輸入以自該複數個候選字詞中選擇一字詞。 40.如申請專利範圍第39項所述之方法，其中依據該一或多個可能性指標之順序呈現該複數個候選字詞。 4 1 ·如申請專利範圍第3 9項所述之方法，其中更包含以下步驟：依據預期一使用者之次一字詞輸入所選擇之字詞而預測複數個候選字詞。 42.如申請專利範圍第27項所述之方法，其中一字詞成分之複數個辨識結果之一包含一預測，其指出候選字詞成 45 200538969 分之集合中的任何一者具有符合該字詞之使用之一部分之一相同的可能性。 43 .如申請專利範圍第27項所述之方法，其中指出列表之使用可能性的該資料包含以下任一者：該語言中使用字詞的頻率；一使用者使用字詞的頻率；及一文件中使用字詞的頻率。者輸入該字詞

44.如申請專利範圍第27項所述之方法，其中更包任一步驟：自動地重音一或多個字元；自動地大寫一或多個字元；自動地增加一或多個標點符號；及自動地增加一或多個定義符號。 45. —種具有指令資料的機器可讀取媒體，當該機器媒體於一資料處理系統上被執行時，將使該系統種用於辨識語言輸入的方法，該方法至少包含驟：分別接受多個字詞成分的複數個辨識結果，一語言之一字詞的一使用者輸入，該複數個辨識至少其中之一包含複數個候選字詞成分以及複含以下

可讀取執行一以下步以處理結果之數個可 46 200538969 能性指標，該複數個可能性指標指出該複數個字詞成分與該使用者輸入之一部分相對於彼此的符合可能性程度；及自該複數個辨識結果以及可指出一字詞列表之使用可能性的資料中判定一或多個可供用者輸入之該字詞的候選字詞。

46.如申請專利範圍第45項所述之媒體，其中該判定一或多個候選字詞之步驟包含以下步驟：消去複數個辨識結果之複數個候選字詞成分組合；及自該語言之一字詞列表中選擇複數個候選字詞，該複數個候選字詞含有該複數個辨識結果中的候選字詞成分之組合。 47.如申請專利範圍第46項所述之媒體；該方法更包含以下步驟：自該複數個辨識結果以及可指出一字詞列表之使用可能性的資料中對一或多個候選字詞判定一或多個可能性指標以指出符合該字詞之使用者輸入的可能性；依據該一或多個可能性指標排序該一或多個候選字詞；自動地從該一或多個候選字詞選擇其中一者；及 47