TW200538969A - Handwriting and voice input with automatic correction - Google Patents

Handwriting and voice input with automatic correction Download PDF

Info

Publication number
TW200538969A
TW200538969A TW094103440A TW94103440A TW200538969A TW 200538969 A TW200538969 A TW 200538969A TW 094103440 A TW094103440 A TW 094103440A TW 94103440 A TW94103440 A TW 94103440A TW 200538969 A TW200538969 A TW 200538969A
Authority
TW
Taiwan
Prior art keywords
word
candidate
words
input
item
Prior art date
Application number
TW094103440A
Other languages
English (en)
Inventor
Alex Robinson
Ethan Bradford
David Kay
Van Meurs Pim
James Stephanick
Original Assignee
America Online Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US11/043,506 external-priority patent/US7319957B2/en
Priority claimed from US11/043,525 external-priority patent/US20050192802A1/en
Application filed by America Online Inc filed Critical America Online Inc
Publication of TW200538969A publication Critical patent/TW200538969A/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/268Lexical context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Description

入的識別 理等等之 有 上 外型之嚴格大小限制以及輸 選單等等)的嚴袼限制,小 戰性的問題。現今接受文字 。近來從攜帶電腦、手持電 、行動電話以及其他攜帶無 型攜帶使用者友善之使用者 以編輯文件及訊息,如用於 •同時傳送及接收電子郵
200538969 玖、發明說明: 【發明所屬之技術領域】 本發明與使用資料處理系統之人類語言輪 關,如在桌上型電腦、手持電腦、個人資料助 的手寫辨識及語音辨識。 【先前技術】 由於記憶體限制、尺寸 與修正文字之控制(按鈕、 裝置上的文字輸入是一具挑 入的手持電腦裝置變得更小 與個人資料助理至雙向傳呼 技術的發展已導出對於一小 面的需求,以接受文字輸入 向傳訊系統以及尤其是"5 (e-mail )或短訊的系統。 多年來,攜帶電腦已變得越來越小。在製造一更小 帶電腦之努力中的一項尺寸限制元件為鍵盤。如果使用 準打字尺寸按鍵,該攜帶電腦至少和該鍵盤一樣大。縮 的鍵盤已被使用在攜帶電腦上,但該縮小鍵盤按鍵太小 無法被一使用者以足夠的精確性簡單或快速的梯作。在 攜帶電腦中加入一全尺寸鍵盤也會I1 且礙該電腦之真正攜 性效用。多數的攜帶電腦無法不被置於一平坦工作表面 操作以允許該使用者用兩手輸入。一使用者在站立或移 入 型 輸 腦 線 介 雙 件 攜 標 小 而 帶 上 動 5 200538969 時無法輕易地使用一攜帶電腦。 手寫辨識為已被採用之一種方式,其可解決具備偵測 一手指或觸控筆之動作的一電子感應螢幕或平板的小型裝 置上的文子輸入問題。在稱為個人數位助理(PDAs )的最 新世代小型攜帶電腦中,各公司嘗試藉由在該pda中加入 手寫辨識軟體以解決此問題。一使用者可藉由在一觸控感 應板或顯示螢幕上書寫而直接地輸入文字。該辨識軟體隨
即將此手寫文字轉換為數位資料。典型地,該使用者即時 寫入文字而該PDA即時辨識一字元。在該觸控感應板或顯 示營幕上的書寫建立指出該接觸點的-資料輸入串。該手 寫辨識軟體分析該資料輸入串的幾何特徵以判定符合該使 用者正在書寫的-字元。該手寫辨識軟體典型地執行幾何 外型辨識以判定該手寫字元。 不幸地, 意。目前的手 強大的個人電 小型裝置上, 性;而個人書 於這些原因, 個別字母之一 該系統之幾何 書寫該字母的 結果為非常低 一”V卞作/夂仞个兮人滿 寫辨識解決方案罝古4☆ 茶/、有許多問題,例如即使在 腦上,該手寫辨場私 Α軟體並非十分準確;而在 記憶體限制更推 尺進—步限制手寫辨識之準確 寫風格也與用於訓綾 、、來該手寫軟體的不同。由 許多手寫或‘graffit彳,太 產口口要求該使用者學習 組特定筆晝。這牲a #
一、疋筆畫組合被用於簡化 外型辨識處理並辦A 曰ϋ辨識率。這些筆晝常鱼 自然方式十分不同。 上提出之問題的最終 的產品採用度。 語音辨識為被採用以解決文 予輸入問題的另一方式。 6 200538969 一,吾θ辨識系統典型地包括一麥克風以偵測並記錄該語音 輸入該θ輪入被數位化並被分析以取出一語音樣本。 浯曰辨識典型地需要一強大系統以處理該語音輸入。某些 舭力有限之浯音辨識系統已被用於小型裝置上,如用於行 動電話上以供語音控制操作。對於語音控制操作而言,一 裝置僅需識別幾種命令。即使對於依有限範圍之語音辨識 而口由於玲樣本會隨著不同使用者以及不同情況有所 變化,一小型裝置血 /、5^地並不具有々人滿意的語音辨識準 確度。 發展出《更實用的系統以處理人類語言輸入是有利 的,該系統具有-使用者友善方式,如手寫辨識系統以供 以-自然方式輸入手寫或語音辨識系統以供以一自然方式 說出語音輸入,該系統具有改善的準確度以及降低的計算 需求,如降低的記憶體需求及處理能力需求。 【發明内容】 此處描述一混合方式以辦推眘粗南 武以增進貝枓處理系統上的手寫辨 識及語音辨識。在—實施例…前端被用於識別筆畫、 字元、音節及/或音素。該前端傳回具備符合該輸入之相對 或絕對可能性的候選者。依據該語言言學㈣,如字 母或表意語言;輸入中字詞,如正被使用中的字詞或片語 7 200538969
的頻率,該輸入字詞之語音的可能部分,該語言之型態; 或該輸入字詞之上下文,一後端結合該前端從字詞輸入所 判定之候選者以匹配已知字詞以及該些字詞在目前上下文 中的可能用法。該後端可使用外卡以選擇候選字詞、使用 語言特徵以預測一待完成字詞或完整的接續字詞、呈現候 選字詞以供使用者選擇、及/或提供附加輸出,如字元的自 動重音、自動大寫以及自動增加標點及定義符號,以協助 該使用者。在一實施例中,對多個輸入模式同步使用一語 言後端,如語音辨識、手寫辨識以及鍵盤輸入。 本發明之一實施例包含一種在一資料處理系統上處理 語言輸入的方法,其包含:對多個字詞成分分別接收多個 辨識結果已處理一語言之一字詞的使用者輸入,並從多個 辨識結果與指出一字詞列表之使用可能性中判定該字詞之 使用者輸入的一或多個候選字詞。該多個辨識結果中至少 有一個包含多個候選字詞成分以及多個可能性指標。該多 個可能性指標指出該多個字詞成分符合該使用者輸入之一 部分相對於彼此之可能性程度。在一實施例中,該候選字 詞成分包含來自手寫辨識的一筆晝、來自手寫辨識的字元 以及來自語音辨識的音素。該語言可為字母的或表意的。 在一實施例中,判定一或多個候選字詞包含:消除該 多個辨識結果之多個候選字詞組合、自該語言之一字詞列 表選擇多個候選字詞,該多個候選字詞含有該多個辨識結 果之候選字詞成分的組合、從該多個辨識結果及指出一字 詞列表之使用可能性的資料中對該一或多個候選字詞判定 8
200538969 或多個可能性指標以指出符合該字詞之使用者輸入的 對可能性、或依據一或多個可能性指標排序該一或多個 選字詞。 在一實施例中,自動地從一或多個候選字詞選擇一 選者並呈現給該使用者。可依據該語言中的任何片語、 語言中的字詞對(word pairs )、以及該語言中的三連字 (word tri grams )而執行該自動選擇。也可依據該語言 任何形態(morphology)以及該語言之文法規則而執行 自動選擇。也可依據所接收之該字詞之使用者輸入的一 下文而執行該自動選擇。 在一實施例中,該方法進一步包含依據預料一使用 輸入接續字詞而自動選擇的字詞而預測多個候選字詞。 在一實施例中,該方法包含呈現該一或多個候選字 以供使用者選擇,並接收一使用者輸入以選擇該多個候 字詞其中之一。 在一實施例中,一字詞成分之多個辨識結果包含一 候選字詞成分之任一者對於符合該使用者字詞輸入之一 分具有相同可能性的一指示。指出該字詞列表之使用可 性的資料可包含該語言中的字詞使用頻率、一使用者使 字詞之頻率以及一文件中使用字詞之頻率的任一者。 在一實施例中,該方法進一步包含自動重音一或多 字元、自動大寫一或多個字元、自動增加一或多個標點 號以及自動增加一或多個定義符號的任一者。 本發明之一實施例包含在一資料處理系統上辨識語 相 候 候 該 串 之 該 上 者 詞 選 組 部 能 用 個 符 言 9 200538969
輸入的一方法,該方法包含:透過樣式識別處理一語言之 一字詞的一使用者輸入以對多個字詞成分個別建立多個辨 識結果,並從多個辨識結果及指出一字詞列表之使用可能 性的資料中判定該使用者輸入字詞的一或多個候選字詞。 該多個辨識結果之至少一者包含多個候選字詞成分以及多 個可能性指標。該多個可能性指標指出該多個字詞成分符 合該使用者輸入之一部分相對於彼此的可能性程度。該樣 式辨識可包括手寫辨識,其中每個該多個候選字詞成分包 括一筆晝,例如用於一表意語言符號或字母字元;或一字 元,例如用於一字母語言。該字詞可為一字母字詞或一表 意語言符號。該樣式辨識可包括語音辨識,其中每個候選 字詞成分包含一音素。 在一實施例中,一字詞成分之多個辨識結果之一包含 一指示,其指出一組候選字詞成分之任一者具有同等的可 能性符合該使用者輸入之該字詞的一部分。該組候選字詞 成分包含該語言之所有字母字元。指出該字詞列表之使用 可能性的資料可包含該語言中的字詞使用頻率、一使用者 使用字詞之頻率以及一文件中字詞使用之頻率的任一者。 指出字詞列表之使用可能性的資料可包表示該語言之形態 的資料以及表示該語言之文法規則的資料的任一者。指出 該字詞列表之使用頻率的資料可包含:表示所接收之使用 者輸入字詞的上下文的資料。 在一實施例中,該使用者輸入僅指定該字詞之一完整 字詞成分組合的一部分。該系統判定該候選字詞。 10 200538969 在一實施例中,該一或多個候選字詞包含一部分該多 個辨識結果中的候選字詞成分組合所形成之字詞以及一部 分含有辨識結果中的候選字詞成分組合的字詞。 在一實施例中,該一或多個候選字詞包含多個候選字 詞。該方法進一步包含:呈現該多個候選字詞以供選擇, 以及接收一使用者輸入以從該多個候選字詞中選擇其中之
在一實施例中,該方法進一步包含:依據預測一使用 者所輸入之接續字詞而選擇之一字詞而預測一或多個候選 字詞。在一實施例中,該多個候選字詞以符合該使用者輸 入之字詞的可能性順序而加以呈現。 在一實施例中該方法進一步包含:從一或多個候選字 詞中自動地選擇一最有可能者作為該使用者所輸入之一字 詞的一辨識字詞。 在一實施例中,該方法進一步包含:依據預測一使用 者所輸入之接續字詞的一最有可能字詞而預測一或多個候 選字詞。在一實施例中,該方法進一步包含自動重音一或 多個字元、自動大寫一或多個字元、自動增加一或多個標 點符號以及自動增加一或多個定義符號之任一者。 在一實施例中,該多個辨識結果之每一者包含個別與多個 候選字詞成分有關之可能性指標以指出符合該使用者輸入 之一部分的相對可能性。 【實施方式】 11 200538969 為主 手持 音辨 體的 擎的 及語
音節 性的 而非 詞輸 中此 提供 而手 為可
如一 節、 URL 一實 識, 與數 輸入方法,如手寫辨識及語音辨識,可為傳統以 之輸入方法的重要替代方案,尤其是對於小型裝 電腦、個人資料助理及行動電話而言。傳統手寫 識系統面臨著需要超過小型電子裝置上可利用之 難題。本發明透過自動校正以降低手寫或語音辨 記憶體需求及處理能力需求而改進這些裝置上的 音輸入技術。 本發明使用一混合方式以增進資料處理系統之手 語音辨識。在一實施例中,一前端辨識筆晝、字 、及/或音素並傳回具有符合該輸入之相對或絕對 候選者。可傳回不同候選者以供一後端進一步處 使用該前端僅選擇一候選者。該後端結合該前端 入所判定的候選者以配對已知字詞以及在目前上 字詞之使用可能性。藉由結合該前端雨後端,本 具有一增進辨識率以及更加使用者友善的一系統 寫及語音辨識輸入之一有效且低記憶體/CPU使 行的。 在本發明中,一 “字詞(word ) ”係指任何語言物 串形成一字詞、詞幹(word stem)、字首或字尾 片語、縮寫、俚語、表情符號(emoticon )、使用者 或表意字元序列的一或多個字元或符號。在本發 施例中,一前端被用於執行該語言輸入上的樣 如手寫、語音輸入等等。許多技術已被用於將該 個目標樣式相比較,如筆晝、手寫字元以及語音 鍵盤 置如 及語 記憶 識引 文字 寫辨 元、 可能 理, 從字 下文 發明 〇因 用成 件, 、音 ID、 明之 式辨 輸入 輸入 12 200538969
重音等。典型地’一輸入不同程度地與數個目標樣式相符 合。舉例來說,一手寫字母可能與字元“a”或“c”、“〇”或‘、,, 相似。目前可用之樣式辨識技術可判定該手寫字母為這些 字元之任一者的 < 能性。然而’一辨識系統典型地被迫僅 回報一項符合。因此’具有最高符合可能性的該字元典型 地會被回報為辨識結果。在本發明之一實施例中,數個候 選者被送進該後端作為可能選擇’而非預先排除其他候選 者以得到一項可能為錯誤的符合,因而該後端使用該前後 文以對該語言輸入整體地判定更為可能之候選者組合,如 一字詞、一片語、字詞對、三連字串、或符合一語句之前 後文的一字詞,例如依據文法結構。舉例來說,可從該使 用者嘗試輸入之字詞中的不同字元候選者組合中判定不同 的候選字詞。從該語言中使用該字詞的頻率以及符合該候 選字元之相對或絕對可能性中,該後端可判定該使用者最 有可能正在輸入的字詞。此與傳統方法不同,後者提供一 組獨立判定之最有可能字元,其甚至無法組成一有意義字 詞。 因此,本發明結合精確字詞搜尋軟體與一手寫辨識 (HR)引擎或-語音辨識(SR)引擎以提供小型電子裝置 如個人數位助理、電話或任彳_ 人饮何泛領域產業上用於輸入文字 及資料的許多特定裝置上文丰盥任立 又予興3吾音輸入之持續問題一種 有力的解決方案。 擎以有效地服務各種 而僅有低度的記憶體 此外,本發明使用一單一後端引 輸入型態(標準鍵盤、手寫、語音), 13 200538969 及處理器需求。
第1圖說明依據本發明在一資料處理系統上辨識使用 者輸入之一系統的一圖示。在語言輸入101如手寫或語音 於該樣式辨識引擎103被接收後,該樣式辨識引擎103處 理該輸入以提供候選字詞成分如字元、音素或筆晝以及其 符合該輸入1 05之對應部分的可能性。舉例來說,一字元 輸入可與一候選字元列表相符,而造成模糊。在一實施例 中,該模糊於該前端層級被容忍而被傳送至該語言非模糊 後端以供進一步處理。 舉例來說,一種以字詞為基礎的非模糊引擎1 07比對 該字詞列表1 09核對該字元的可能組合以建立候選字詞 以及其符合該使用者輸入111的關聯可能性。由於較不常 使用之字詞或未知字詞如未列入字詞列表1 09中的字詞較 不可能符合該使用者輸入,該些候選字詞可被降級而具有 較低的符合可能性,即使依據該樣式辨識引擎1 05的結果 其看似具有相對較高的符合可能性。該以字詞為基礎的非 模糊引擎107可消除某些較不可能的候選字詞因而該使用 者不會受到一龐大選擇清單所煩擾。替代地,該以字詞為 基礎之非模糊引擎可從該候選字詞選擇一最有可能的字 詞。 在一實施例中,如果該以字詞為基礎之非模糊引擎 107的輸出中具有模糊,一種以片語為基礎之非模糊引擎 11 3進一步比對該片語列表11 5以核對該結果,該列表可 包括二連字串、三連字串等等。可將一或多個先前辨識的 14 200538969 字詞與該目前字詞結合以符合該片語列毒 該片語之使用頻率可被用於修改符合該柄 以建立該候選片語以及符合11 7的關聯月 模糊,該以片語為基礎的非模糊引擎可初 識的字詞以及該片語列表11 5而預測接續 在一實施例中,如果該依據片語之# 輸出中具有模糊,便執行一前後文及/或夕 去不太可能的字詞/片語。如果無法透過驾 處理解決該模糊,可呈現該選擇給該使用 擇121。在該使用者選擇後,可更新該字 該片語列表1 1 5以升級該使用者選擇的: 加新的字詞/片語至該列表中。 第2圖為依據本發明一種用於辨識使 處理系統的一方塊圖。雖然第2圖說明一 統之各種元件,已瞭解依據本發明之一嘴 理系統-般可包括相較於第2圖所描述者 件。舉例來說,某些系統可能不具有一窝 需要用於處理聲音的元件。 • 丁 呆些系統可能 描述的其他功能,如一行動 订動電話環境上# 圖說明各種與本發明之 〆系些特徵密 件。在此說明書中’一習知技藝人士將畴 /資料處理系統的配置並不限於第2 構。 顯示器203透過適當的介面電路 • 11 5中的片語。 選字詞之可能性 能性。即使沒有 .用於依據先前辨 字詞。 模糊引擎113的 法分析11 9以消 自動語言非模糊 者以供使用者選 詞列表109以及 P詞/片語及/或增 用者輸入之資料 示範資料處理系 施例的一資料處 更多或較少的元 音辨識能力而不 具有第2圖中未 通信電路。第2 切相關的各種元 解依據本發明之 中描述的特定結 ?至處理器2 0 1。 15 200538969 一手寫輸入裝置202,如一觸控螢幕、一滑鼠、或一數位 筆’被連接至該處理器201以接收使用者輸入以供手寫辨 識及/或其他使用者輸入。一語音輸入裝置如一麥克風被連 接至該處理器201以接收使用者輸入以供語音辨識及/或 其他語音輸入。選擇地,一聲音輸出裝置20 5如一別叭亦 被連接至該處理器。 該處理器201自 該語音輸入裝置204接收輸入並管理輸出至該顯示器及剩 °八。該處理器2 0 1被連接至一記憶體2 1 0。該記憶體包括 一暫時儲存媒體組合如隨機存取記憶體(RAM )以及永久 儲存媒體組合如唯讀記憶體(ROM )、軟碟、硬碟或 CD-ROMs。該憶體210含有所有管理系統作業所需的軟體 常式及資料。該記憶體典型地含有一作業系統2ιι以及應 用程式220。應用程式之範例包括文書處理器、軟體辭典 以及外語翻譯器。亦可提供語音合成軟體作為應用程式。 較佳地’該記憶體進一步包含一筆畫/字元辨識引擎 =Γ供辨識該手寫輪入中的筆畫/字元及/或音素辨識引 辨識該語音輸入中的音素。該音素辨識引擎以 及該筆畫/字元辨識弓丨擎可使…域中已知之任何技術 以提供-候選列表以及符合每個輸入之筆晝 之關聯=。已瞭解該前端引擎如該筆畫/字元二;丨擎 或該曰素辨識引擎213中用於樣式辨識之 本發明中並非是適切的。 η 在本發明之一實施例中’該記憶體210進—步包括一 16 200538969 語言非模糊後端,复可6 “」匕祜一或多個以字詞為基礎的非 糊引擎216、以片語兔苴姑七 、 為基礎之辨識非模糊引擎2 1 7、以前後 文為基礎之非模构引整 孕2 1 8、一選擇模組2 1 9以及其他如 一字詞列表2 1 4以及一 y 片s吾列表2 1 5等等。在此實施例中, 該以前後文為基礎之非禮 模糊引擎應用有助於輸入非模糊之 吏用者仃動的別後文態’策。舉例來說,可依據選擇的使用 者位置’㈣使用者在辦公室或在家中;一天中的時間, 如工作時間抑或閒暇年· 叹-間,或接收者等等。 在本發明之一眘 施例中’用於一非模糊後端之元件多 數於不同輸入形式中祐 极/、用’如用於手寫辨識與用於語音 辨識。該字詞列表2〗4 1 4包含一語言中的一已知字詞列表。 該字詞列表214可淮一止—人 ^ 步包含該語言中對應字詞之使用頻 率資訊。在一實施例中 ’不存在於該語言之字詞列表 214 中的一字詞頻率被相 見為零。替代地,可指派一非常小的使 用頻率給一未知字匈 ”J °使用該未知字詞之預設使用頻率, 便可以一實際上相同 』的方式處理該已知及未知字詞。該字 詞列表2 1 4可侔陆姑、 ~以字詞為基礎之非模糊引擎2 1 6而被 使用以排列、消本β > /或選擇依據該樣式辨識前端(例如該 筆畫/字元辨識引擎 # 212或該音素辨識引擎213)之結果所 判定之候選字詞,祐Β 7〜 、 為了元成字詞而依據一部分的使用 者輸入而預測字詞。無7 n Ί 類似地,該片語列表2 1 5可包含包括 兩個以上字詞的一 y汉^;丨士 片^列表以及該使用頻率資訊,該片語 表 可被該以片語為基礎之非模糊引擎2 1 7所使用且 可被用於預測字詞以完成片語。 17 200538969 在本發明之一實施例中,每個輸入序列被參照至一咬 多個字彙模組而加以處理,每個字彙模組含有一或多個字 •彙以及關於每個字彙的資訊,包括該字詞中的字元數量以 “及該字詞關於其他相同長度的字詞的發生頻率。替代地, 關於該字彙模組或一特定字詞為一成員之模組的資訊被伴 隨每個字詞而儲存,或一模組可依據語言樣式修改或建立 字詞’如在一特定音節上放至一區別標記,或依據任何用 於解譯該目前輸入序列的其他演算法及/或附近前後文而 • 建立或過滤候選字詞。在一實施例中,每個輸入序列被一 樣式辨識鈿端所處理以提供一連串的候選列表,如筆晝、 字元、音節、音素等等。該候選者的不同組合提供不同的 候選字詞。該非模糊後端結合該候選者之符合可能性以及 該候選字詞之使用頻率以排列、消去及/或選擇一字詞或更 多字詞作為替代品以供使用者選擇。具有較高使用頻率的 字詞為高度可能性的候選者。未知字詞或較低使用頻率的 字詞為低度可能性的候選者。該選擇模組2 1 9選擇性地自 該使用者可選擇者呈現數個南度可能性的字詞。在本發明 • 的另一實施例中,字詞之使用頻率乃依據該使用者之使用 或在一特定前後文中該字詞之使用,例如在該使用者正在 編輯之一訊息或文章中。因此,常使用的字詞成為更有可 能的字詞。 _ 在另一實施例中,每個字彙模組中存有字詞,因而該 字詞被分類為含有相同長度之字詞的檔案或叢集。首先藉 由搜尋相同長度的字詞群組作為該輸入序列中的輸入數目 18 200538969 而處理每個輸入序列,並以最佳符合度量分數識別該 選字詞。如果與該輸入序列具有相同長度而被識別的 字詞少於一臨界數量,則該系統繼續比較N輸入的輸 列與N+1長度之字詞群組中每個字詞的前1^個字母。 理持續搜尋越來越長的字詞並比較輸入之輸入序列與 群組中每個字詞的前N個字母,直到識別臨界數量的 字詞。長度大於該輸入序列的可用候選字詞可被提供 使用者作為該輸入序列的可能解釋,其提供一字詞完 形式。 f安裝階段中,或在收到文字訊息或其他資料之 過程中,在資料檔案 尋此資訊樓案的方法已,加入語彙中的字詞。用 一曰發^ 1 存在於習知技藝中。在搜尋過 α ,日m 史破增加至一子彙模組作為低頻 詞,且因此被置於該念 一播f 予祠相關聯之字詞列表的末端。 押8¾過程中*一特定在 '新字詞被偵測到的次數,便藉由 子Θ相關列表中升級丄 疮 h子詞而指定一相對越來越高的 度’因而增加資訊私 ,^ 貧冗輪入期間中該字詞顯示於該字詞選 表中的可能性。 在本發"明之_ - %、樣中,對於每個輸入序列,一字 組藉由識別且右畏古 八 阿可能性的候選字詞成分並且編製 選字詞成分所構成之 ^ 7 之〜子詞而建立一候選字詞。此“峰 型”字詞隨後被包含% 天匕^於候選字詞列表中,亦可被呈現於 別^曰疋搁位中。該字詞語彙具有冒犯字詞之附錄,搭 般可接又狀態下的頬似字詞,因而輸入該冒犯字詞時 些候 候選 入序 此處 每個 候選 給該 成的 持續 於搜 程中 率字 依據 在該 優先 擇列 詞模 由候 切類 一特 配一 ,即 19 200538969
使該文字的確切輸入包含該冒犯字詞,僅會產生該確切類 型攔位中的相關可接受字詞,且在適當情況下作為該字詞 選擇列表中的一建議。此特性可過濾掉冒犯字詞的出現, 該情形在該使用者暸解到可能更快地打字而較不注意地觸 碰該鍵盤之預期字母的精確位置時將可能偶然地出現。因 此,在顯示該確切鍵入字串之前使用習知技藝中熟知之技 術,負責顯示該字詞選擇列表之軟體常式比較該目前確切 鍵入字串以及冒犯字詞附錄,若發現兩者相符,便以相關 可接受字詞取代該顯示字串。否則,即使將一冒犯字詞視 為一極低頻率字詞,當該字詞之每個字母被直接觸碰時, 其仍將被顯示為該確切鍵入字詞。即使此情形與意外在一 標準鍵盤上鍵入一冒犯字詞相似,本發明容忍該使用者較 不準確的輸入。此特性可由該使用者開啟或關閉,例如透 過一系統選單選項。 該些習知技藝人士將暸解可於該電腦中開啟額外字彙 模組,例如含有法律術語、醫學術語以及其他語言之字彙 模組。再者於某些語言如印度語中,該字彙模組可使用有 效子字詞序列之“樣板(template) ”以於該先前輸入及該 候選字詞正被考慮時判定何者候選字詞成分是可能的或適 當的。透過一系統選單,該使用者可設定該系統以使該額 外字彙字詞出現於可能字詞列表的最前面或最後面,例如 藉由特別著色或高亮度標示,或該系統可自動依據何者字 彙模組供應該直接先前選擇的字詞而自動切換該字詞之順 序。因此,在附加申請專利範圍中,將瞭解本發明可以除 20 200538969 了此處特別說明之外的方式加以實施。 依據本發明之另一態樣,在一使用者使用該系統之過 程中,—升級演算法自動地調整該語彙,該演算法於每次 該使用纟選擇_字詞肖執行以透㉟逐漸增加與該字詞相關 之::頻率而升级該語彙中的字詞。&一實施例中,該升 級演算法增加與一相對大量增額所選擇之字詞相關的頻率 數值’而降低_非常小減額所忽略之該些字詞的頻率數 值。對於相對頻率資訊由字詞出現於一列表中的連續順序 所指出的一字彙模組而言,藉由將該選擇字詞向上移動某 部分與列表前端間的距離而完成升級。該升級演算法最好 避免移動最常使用的字詞以及非常不常使用的字詞遠離其 原始位置。舉例來說該列表之中間範圍中的字詞隨著每次 選擇破升級最大的比例。位於該選擇字詞於該語橐升級中 開始與結束之間的字詞被有效地以數值丨所降級。字詞列 表整體維持守恆,因而關於該列表中字詞之相對頻率的資 訊可被維護並更新,而無須增加該列表所需之儲存。 該升級演算法增加選擇字詞之頻率且於適當1降低未 選擇字詞之頻帛。舉例來說’在相對頻率資訊由字詞出現 於-列表中的連績順序所指出的一語棄中,於該列表中的 IDX位置出現的一選擇字詞被移動至(Ιβχ/2 )位置。相應 地,位於該列表中(1_位置向下至(lDx+i)之間的 字詞被向下移動該列表中的一個位置。當一連串接觸點被 處理且一字詞選擇依據該計算的符合度量分數所建立,且 -或多個字詞於該列表中出現於該使用者所選擇的字詞之 21 200538969 前時時,便將該列表中的字詞降級。在該選 於更上端但未被選擇之字詞可被推定將被指 •高頻率,亦即於該列表中其出現過於上方。起 • 位置的此一字詞可被降級,例如被移動至( 位置。因此,一字詞越常被考慮選擇,其被 亦即其被移動的階層數量越少。該升級及降 依據該使用者之一動作所觸發,或可能依據 入而被不同地執行。舉例來說,僅有在該使
• 控筆或滑鼠點選或拖放其預期之字詞至一字 的最前面位置時,在該選擇列表中比該使用 詞更上方出現的字詞才會被降級。替代地, 該選擇列表中一更上方位置的一選擇字詞可 更大的係數。舉例來說,該升級字詞從IDX (IDX/3 )位置。對於該些習知技藝人士而 變化是顯而易見的。 依據本發明之另一態樣,該前端可偵測 依據來自該後端之迴授改變其認知。隨著該 ^ 入並從該選擇列表中選擇該字詞,該候選文 同順序以及每個選擇字詞中包含的預期字詞 改變該前端所建立的可能性。替代地,該後 該前端接收關於一或多個筆畫、字元、音節 •調整數值。 一 第3A及3B圖說明依據本發明之手寫辨 糊輸出的一範例。本發明之一實施例結合一 擇列表中出現 派一不適當的 初出現於IDX IDX*2+1 )之 降級地越少, 級處理可能僅 該使用者的輸 用者使用一觸 詞選擇列表中 者所預期之字 被手動拖放至 被升級較一般 位置被移動至 言,許多此類 系統錯誤並且 使用者重複輸 字成分間的不 成分可被用於 端可維護一自 或音素之獨立 識軟體之非模 手寫辨識引擎 22 200538969 與-模組’該模組自該手寫引擎取得與該使用者輸入之每 個字母有關之所有可能符合,該實施例並結合這些可能性 與該語言中的字詞可能性以對該使用者預測最有可能之字 詞或該使用者嘗試輪入之字詞。習知技術中已知之任何技 術可被用^定該τ能符纟以及與符合有關之可能性。舉 例來說’該,使用者可能嘗試輸入五字元以輸入五個字母的 字詞“often”。該使用者輸入可顯現為為第3α圈中
所說明者。該手寫辨識軟體指定以下的字元以及筆晝之字 元可能性輸出: 筆晝 1 (301):,〇, 60%,,a· 24%,V 12%,、, 筆晝 2 (302):,t,40%,T 34%,4, 20%,τ 6% 筆晝 3 (303): V 50%,,f,42%,,Γ 4%,,i,4% 筆晝 4 (304): *c,40%,,e* 32%,,s,ι5%,13% 筆晝 5 (305):,n,42%,,!:,30%,,m,16%,v 12% 舉例來說,該筆畫301為的可能性為6〇%,筆畫3〇2 為t的可能性為40%,筆晝303為4’的可能性為筆 畫304為‘c’的可能性為40%,筆晝305為、,的可能性為 4 2%。將該手寫辨識軟體認為最接近符合該使用者之筆畫 的字母集中在一起,該手寫軟體模組呈現字串‘〇Ucn,給使 用者,其並非該使用者預期輸入者。其甚至並非英語中的 一字詞。 本發明之一實施例使用一非模糊字詞搜尋模組以依據 這些字元、關於該字元之符合可能性以及在英語中使用該 字詞之頻率而找出一最佳預測。在本發明之一實施例中, 23 200538969 該結合的手寫模組以及該非模糊模組預測該最有可能的字 詞為‘often’,其為該使用者嘗試輸入之字詞。
舉例來說,如第3B圖所示,一後端工具接收所有的 候選者並判定一可能字詞列表包括:ottcn,attcn,〇ftcn, aftcn,otfcn,atfcn,offcn,affcn, otten, atten,often,aften, otfen,atfen, offen, affen, otter, attcr,oftcr,after, otfer, atfer,offer, affer,otter,atter,ofter,after, otfer, atfer, offer,affer等等。該可能字詞可從該前端判定選擇最高符 合可能性至最低符合可能性的字元所構成。當一或多個高 度可能的字詞被找出時,可能性較低的字元便可以不被使 用。為了簡化該描述,在第3 A圖中假設未知字詞之使用 頻率為0,而已知字詞如often,after與offer之使用頻率 為1。在第A圖中,由該使用頻率結果以及該字詞中使用 之候選字詞的符合可能性而計算一候選字詞之符合指示 器。舉例來說,在第3A圖中,字元‘〇,,‘f,,‘t,,‘e,及‘η, 的的符合可能性分別為0.6,0.34,0· 5,0.32,0.42,而該字 詞‘often’的使用頻率為1。因此,符合該字詞“often”的一 指示器被判定為0.0137。類似地,字詞“after,,及“offer”的 指示器分別為0.0039及0.0082。當該後端工具選擇最有 可能的字詞,便會選擇“often”。注意該字詞之“指示器,,可 被正規化以排序該候選字詞。 在本發明之一實施例中,一或多個輸入為明確的,亦 即與單一筆畫、字元、音節或音素相關,因而符合每個字 元等等的可能性等於1 〇〇%。在本發明之另一實施例中,一 24 200538969 明確輸入自該辨識前端產生一特定數值集合,其使得該非 模糊後端僅配對該確切字元等等在每個候選字詞的對應位 置中。在本發明之另一實施例中,明確輸入被保留數字、 適當的讀音符號(diacritics)以及重音標記及/或其他定義 符號,並於字詞之内與之間被保留標點符號。
第4 A-4C圖顯示依據本發明於一使用者介面上之手寫 辨識的方案。如第4A圖所示,該裝置4〇1包括一區域 以供使用者寫入該手寫輸入407。提供一區域4〇3以顯示 該使用者正在輸入的訊息或文章,如在一網頁潘j覽器上、 在一筆記軟體程式上、在一電子郵件程式上等等。該裝置 包括觸控榮幕區域以供該使用者寫入。 ^,丨、你轉埋孩使用者手寫輸入4〇7之移 該裝置於區域409提供一候選字詞列表以供該使用者
擇。該候選字詞被以餘人I 付σ可能性加以排序。該裝置可選 呈現最前面幾個最有可你 取秀Τ此的候選字詞。該使用者可使用 傳統方法從該列表選擇一. 彈 子巧,或使用對應該字詞之位 的一數字鍵。替代地,哕 β亥使用者可選擇語音指令以選擇 字詞,如藉由說出該遗 a 選擇予詞或對應該列表中字詞位置 編號。在該較佳眘% y t 呈現於d战歹1中’該最有可能字詞被自動選擇 呈現於&域403。闵比 如藉由開口此,如果該使用者接受該候選字詞‘ 如錯由開始寫入接績 使用者碟實選擇一广’便不需要使用者選擇。如果; 候選者取代該自 ^詞,該裝置便以該使用者選擇< 可能的字詞被高=擇候選者。在另-實施例中,該… 儿又4硯作為該預設值,指出該使用者g 25 200538969 前選擇而將被輸出或被延伸一後續動作的一字詞,而一指 定輸入改變該高亮度顯示至另一候選字詞。在另一實施例 中,一指定的輸入選擇一音節或字詞以供修正或從已被輸 入或預測之一多音節序列或多字詞片語重新輸入。
第4C圖說明當一前後文及/或文法分析進一步協助解 決該模糊之一情形。舉例來說,第4C圖中該使用者已輸 入該字詞“It is an”。以一文法分析而言,該裝置預測接續 字詞為一名詞。因此,該裝置進一步調整該候選字詞之順 序而提升屬於名詞之候選字詞。因此,該最有可能的字詞 成為“offer”而非“often”。然而,由於一形容詞也可能位於 該名詞及該字詞“an”之間,該裝置仍會呈現其他選項以供 使用者選擇,如“often”及“after”。 第5圖為一流程圖,其說明依據本發明之使用者輸入 的處理。於步驟 5 01,該系統接收一字詞之手寫輸入。之 後於步驟503建立可能符合該字詞之手寫中的每個字元的 一候選字元列表。步驟5 0 5自該候選字元列表中判定一候 選孛詞列表。步驟5 07結合該候選字詞之頻率指示器以及 符合該候選字元之可能性以判定符合該候選字詞之可能 性。步驟509依據符合該候選字詞之可能性而消去一部分 的候選字詞。步驟5 1 1呈現一或多個候選字詞以供使用者 選擇。 雖然第5圖說明處理手寫輸入之一流程圖,從此說明 中可暸解語音輸入也可以一類似方式加以處理,其中一語 音辨識模組對該字詞中的每個音素建立候選音素。 26 200538969 又 字 及 面 臨 更 槽 的 記 憶 體 及 電 腦 處 辨 識 系 統 的 高 錯 誤 率 以 及 需 常 低 〇 本 發 明 之 一 實 施 例 結 音 辨 識 引 擎 所 回 報 之 相 關 可 端 以 及 可 利 用 這 些 音 素 而 形 統 白 動 修 正 該 語 音 辨 識輪 出 在 本 發 明 之 一 實 施 例 中 於 接 收 每 次 輸 入 時 在 顯 示 器 給 該 使 用 者 〇 該 候 選 字 詞 以 性 所 判 定 的 順 序 加 以 呈 現 , 最 有 可 能 的 的 字 詞 會 出 現 在 序 列 之 提 出 解 釋 的 其 中 之 的 輸 入 會 起 始 — 新 的 輸 入 序 在 本 發 明 之 另 — 態 樣 中 示 器 上 , 最 好 是 位 於 該 文 字 候 選 字 詞 為 依 據 該 符 合 度 量 重 複 地 啟 動 一 特 別 指 定 的 選 可 能 性 所 判 定 之 順 序 中 呈 現 字 詞 〇 一 輸 入 序 列 也 會 在 指 及 有 效 地 選 擇 該 序 列 之 其 中 出 之 後 被 結 束 因 而 隨後 的 依 據 本 發 明 之 一 混 合 系 字 母 音 節 音 素 等 等 執 行
命令輸入的語音辨識技術甚至 理問題。此外,由於現今語音 努力進行修正,故其採用度非 合使用一組候選音素以及一語 能性以及使用這些輸出的一後 成之字詞的已知可能性。該系 〇 ’符合該輸入序列的候選字詞 上的一字詞選擇列表中被呈現 計算每個候選字詞之符合可能 因而依據該符合度量而被視為 該列表的最前面。選擇該輸入 會結束一輸入序列,因而隨後 列。 ,僅有一候選字詞顯示於該顯 正被建立之***點上。顯示的 而被認為是最有可能者。藉由 擇輸入,該使用者可以該符合 的替代候選字詞取代該顯示的 定選擇輸入的一或多個啟動以 一提出解釋以供該系統實際輸 輸入起始一新的輸入序列。 統首先於一成分層級如筆畫、 樣式辨識,如手寫辨識、語音 27
200538969 辨識等等,以提供模糊的結果以及相關的符合可能性 隨後於内部成分層級如字詞、片語、字詞對、三連字 等執行非模糊操作。該系統用於解決模糊所使用之語 特徵可為該語言中的任何字詞使用頻率,該個別使用 用字詞之頻率、該輸入字詞之可能語音部分、該語言 態、該字詞被輸入的前後文、二連字串(字詞對)或 字串、以及任何可用於解決該模糊之其他語言或前後 訊。 本發明可伴隨字母語言而使用,如英語及西班牙 其中該手寫辨識前端的輸出為字母或筆晝以及其相關 性。一字母語言之手寫非模糊操作可於該字詞層級 行,其中每個字詞典型地包括多個字母。 本發明亦可伴隨語意語言而使用,如中文及日文 中該手寫辨識前端的輸出為筆晝以及其相關可能性。 意語言之手寫非模糊操作可於該詞根/成分或字母層 執行。該非模糊操作可進一步於一更高層級操作,如片 二連字串、三連字串等等。再者,該語言之文法結構 被用於該非模糊操作以選擇該輸入之最佳整體符合。 本發明亦可伴隨語意語言之語音或字母表現而使 該非模糊操作可於音節、語意字母、字詞、及/或片語 ***作。 類似地,本發明也可被用於語音辨識,其中該語 識前端的輸出包含音素及其相關符合可能性。該候選 可被結合以供選擇一字詞、片語、二連字串、三連字 ,且 串等 言的 者使 之型 三連 文資 語, 可能 被執 ,其 一語 級被 語、 也可 用。 層級 音辨 音素 串或 28 200538969 慣用語之一最佳符合。
本發明之一實施例亦於該使用者僅已輸入一些筆晝時 預測字詞完成。舉例來說,在成功地以高可能性辨識一字 詞之最初幾個字母之後,該系統之後端可提供一字詞列 表,其中該最初幾個字母與該符合的字母相同。一使用者 可從該列表選擇一字詞以完成該輸入。替代地,該列表中 接近某些字詞之一指示可提示該使用者依據該字詞之完成 可藉由應用於該列表輸入之一指定輸入而被顯示;該隨後 彈出的字詞列表顯示包含該字詞的有限字詞,且可依序指 出進一步的完成。該首先幾個字元之每個可僅具有一個高 可能性候選者,其被用於選擇該待完成字詞列表。替代地, 一或多個該首先字元可含有模糊,因而該首先幾個字元的 數個高可能性組合可被用於選擇該待完成字詞列表。用於 完成之字詞列表可依據符合該使用者正嘗試輸入之字詞的 可能性而被排序並顯示。舉例來說,用於完成之字詞可依 據該字詞於例如該語言中、在該使用者正編輯的文章中、 在特定前後文中如一對話方塊等等被該使用者被使用的頻 率及/或在片語、二連字串、三連字串、慣用語等等中出現 的頻率而被排序。當位於一片語、二連字串、三連字串或 慣用語等等中的一或多個字詞緊接於正被處理之字詞之 前,這些片語、二連字串、三連字串或慣用語之出現頻率 於判定該待完成字詞之排序時可被進一步與該字詞之頻率 相結合。並未位於任何目前已知片語、二連字串、三連字 串、慣用語等等中的字詞被視為在具有一非常低出現頻率 29 200538969 的未♦片舍中。類似地,並未位於已知字詞列表中 詞被視為具有一非常低出現頻率的一未知片語。因此 •何字詞之輸入或一字詞之最前面部分可被處理以判定 . 可能的輸入。 在本發明之一實施例中,該後端持續取得該樣式 前端所辨識之每個字詞、筆畫、音素的候選列表,以 該列表並排序待完成字詞。隨著該使用者提供更多 入,關於完成之較不可能的字詞會被消去。用於完成 • 詞列表隨著該使用者提供更多輸入而縮小規模,直到 不存在或該使用者自該列表選擇一字詞為止。 再者,在該樣式辨識前端提供該接續字詞之最前 入一候選列表前’該後端自一或多個之前緊接的字詞 已知片語、二連字串、三連字串、慣用語等等判定待 字詞,以判定一片語、二連字串、三連字串、慣用語 之待完成字詞列表。因此,本發明亦依據該使用者最 入的字詞而判定該完整的接續字詞 在本發明之一實施例中,該後端使用表示具有相 ® 能性之任何筆畫、字70、音節或音素的外卡。依據該 輸入之一部分的該待完成字詞列表可被視為對於該使 即將輸入或即將從該樣式辨識前端接收之一或多個筆 字元或音素使用一外卡的〜範例。 • .在本發明之實施例中,該前端可能無法辨識 • 畫、字元或音素。該前蠕並不會停止該輸入處理以迫 用者重新鍵入該輸入相反地該前端可容忍該結果並 的字 ,任 最有 辨識 更新 的輸 之字 模糊 面輸 以及 JL> 等等 後輸 同可 字詞 用者 晝、 一筆 使使 傳送 30
200538969 一外卡至該後端。在一高層級中,該後端可解決該模糊 無須迫使該使用者重新鍵入該輸入。此大大地增進該系 之使用者友善度。 在本發明之一實施例中,該後端自動地以外卡取代 自於該前端的一或多個輸入。舉例來說,當從一已知字 列表中未發現任何可能字詞時,該後端可以一外卡取代 最模糊輸入以擴張候選組合。舉例來說,具有大量低可 2候選者的一列表可被一外卡所取代。在一實施例中, 月·J端提供一候選列表因而該輸入符合該列表中的其中一 '者的可此性會高於一臨界值。因此,一模糊輸入具有 量的低可能性候選者。在其他實施例中,該前端提供一 、列表因而每個候選者符合該輸入的可能性會高於一臨 因此’一模糊輸入為其中一候選者的可能性很低。 ’該系統實施外卡,例如適合任何字母的筆晝給予所 ^ ,相同的可能性,因而可處理未使用外卡時沒有找到 能字窮1 啊情況。在本發明之一實施例中,該後端自該樣 辨諸^ ΐΙίΤ irtjf J ~所提供之候選筆畫、字元或音素之組合中建立 同的候;逛& 、艰予詞,舉例來說,每個字元輸入的候選字元可 據符合· 4 ^ Μ輸入之可能性而加以排序。該候選字詞之建立 付合的字元開始延伸至較不可能符合的字元。當 個候iP + «χ 〜、、予詞在已知字詞列表中被發現時,較不可能符合 元便可能不被用於建立進一步的候選字詞。在一實施 中’該系統顯示最有可能的字詞或依據計算過的可能性 X排序的一所有候選字詞列表。該系統可自動地增加一 而 統 來 詞 該 能 該 候 大 候 界 因 有 可 式 不 依 從 數 的 例 加 輸 31 200538969 出以幫助使用者。此包括例如自動重音字元、自 及自動增加標點符號及定義符號。 本發明之一態樣提供一語言後端同時地被用 入形式如語音辨識、手寫辨識、在硬式鍵盤或觸 的鍵盤輸入。在本發明之另一實施例中’ 一語言 於去模糊該候選字詞。在一後端成分結合來自該 選輸入以判定候選字詞及其符合可能性之後,一 被用於依據語言特性排序該候選字詞。舉例來說 B 後段進一步結合使用該使用者於例如該語言中、 正編輯之一文章中、需要該輸入之一前後文中等 字詞之頻率以及源自該後端成分之候選字詞與其 性以去模糊該候選字詞。該語言後端也可依據 串、三連字串、片語等等而執行一去模糊操作。 語言後端可依據該前後文、文法結構等等而執行 作。由於該語言後端所執行之任務對於各種不同 法如語音辨識、手寫辨識或使用硬式鍵盤或依觸 鍵盤輸入而言都是相同的,因此該語言後端可於 Φ 形式間共享。在本發明之一實施例中’一語言後 服務多個輸入形式,因而當一使用者結合不同的 以提供一輸入時,僅需一單一語言後端以支援混 式。在本發明之另一態樣中’來自一特定前端的 -被視為一明確的候選字詞成分,其若非被記錄符 為1 00%即為該後端將使用之一明確筆晝、字元或 合在對應位置中含有其的有限字詞。本發明亦包 動大寫以 於多個輸 控螢幕上 後端被用 前端之候 語言後端 ’該語言 該使用者 等使用該 符合可能 一二連字 再者,該 去模糊操 的輸入方 控螢幕之 多個輸入 端同時地 輸入形式 合輸入模 每個輸入 合可能性 音節以符 含一混合 32 200538969 系先纟使用來自_或多個辨識系統的候選者集合以及 =性,且其藉由使用…之某些已知特徵以解決 …中的槟糊。解決該手寫/語音辨識中的模糊可增進該 統的辨識率以増進該使用者友善度
雖然此處伴隨該較佳實 士將可明確地瞭解其他的應 而不會偏離本發明之精神與 於以下包含的申請專利範圍 施例說明本發明,習知技藝人 用程式可取代此處所提出者, 範圍。因此,本發明應僅受限 【圖式簡單說明】 第1圖說明依據本發明用於在一資料處理系統上識別 使用者輸入的一系統,· 第2圖為依據本發明用於辨識使用者輪入的一資料處 理系統的一方塊圖; 第3A及3B圖說明依據本發明之一手寫辨識軟體的非 模糊輸出的一範例;
第4 A-4C圖說明依據本發明之一使用者介面上的手寫 辨識方案;及 第5A圖為依據本發明處理使用者輸入的一流程圖。 【元件代表符號簡單說明】 1 0 1語言輸入 103樣式辨識引擎 105,111 輸入 33 200538969 107,113非模糊引擎 109字詞列表 11 5片語列表 11 7符合 11 9分析 1 2 1使用者選擇 201處理器
202手寫輸入裝置 203顯示器 204語音輸入裝置 205聲音輸出裝置 2 1 0記憶體 2 11作業系統 212筆晝/字元辨識引擎 213音素辨識引擎 2 1 4字詞列表 2 1 5片語列表 2 1 6以字詞為基礎的非模糊引擎 2 1 7以片語為基礎的非模糊引擎 2 1 8以前後文為基礎的非模糊引擎 2 1 9選擇模組 220應用程式 401裝置 403, 405, 409 區域 407手寫輸入 501,503,505, 507, 509, 5 1 1 步驟 34

Claims (1)

  1. 200538969 拾、申請專利範圍: 1. 一種在一資料處理系統中用於識別語言輸入的方法,其 至少包含以下步驟:
    透過樣式辨識處理一語言之一字詞的一使用者輸 入以分別對複數個字詞成分產生複數個辨識結果,該複 數個辨識結果之至少其中之一包含複數個候選字詞成 分以及複數個可能性指標,該複數個可能性指標指出該 複數個字詞成分與該使用者輸入之一部分相對於彼此 為符合的可能性程度;及 自該複數個辨識結果以及可指出一字詞列表之使 用可能性的資料中判定一或多個可供用者輸入之該字 詞的候選字詞。 2.如申請專利範圍第1項所述之方法,其中該樣式辨識包 含手寫辨識。 3.如申請專利範圍第2項所述之方法,其中該複數個候選 字詞成分之每個包含一筆晝:且該字詞包含一語意語言 符號。 35
    200538969 4. 如申請專利範圍第2項所述之方法,其中該多個 詞成分之每個包含一字元;且該字詞包含一字句 5. 如申請專利範圍第1項所述之方法,其中該樣式 含語音辨識;且該複數個候選字詞成分之每個包 素0 6.如申請專利範圍第1項所述之方法,其中一字詞 該複數個辨識結果之一包含一指示,其指出一候 成分集合中的任何一者具有符合該字詞之使用 之一相同的可能性;及該候選字詞成分集合包含 之字母字元。 7.如申請專利範圍第1項所述之方法,其中指出該 表之使用可能性的資料至少包含下列之一: 該語言中使用字詞的頻率; 一使用者使用字詞之頻率;及 一文件中使用字詞之頻率。 8 ·如申請專利範圍第1項所述之方法,其中指出該 表之使用可能性的資料至少包含下列之一: 該語言中的片語; 該語言中的字詞對;及 候選字 字詞。 辨識包 含一音 成分之 選字詞 者輸入 該語言 字詞列 字詞列 36 200538969 該語言中的三連字串。 9.如申請專利範圍第1項所述之方法,其中指出該字詞列 表之使用可能性的資料至少包含下列之一: 表示該語言之形式的資料;及 表示該語言之文法規則的資料。
    1 0.如申請專利範圍第1項所述之方法,其中指出該字詞列 表之使用可能性的資料至少包含: 表示收到該字詞之使用者輸入的一前後文的資料。 1 1 ·如申請專利範圍第1項所述之方法,其中該使用者輸入 僅指定該字詞之字詞成分的一完整集合的一部分。
    1 2.如申請專利範圍第1項所述之方法,其中該一或多個候 選字詞包含由該複數個辨識結果中的候選字詞成分之 組合所形成的一部分字詞以及含有該複數個辨識結果 中的候選字詞成分之組合的一部分字詞。 1 3 ·如申請專利範圍第1項所述之方法,其中該一或多個候 選字詞包含複數個候選字詞;並且該方法更包含以下步 驟: 呈現該複數個候選字詞以供選擇;及 37 200538969 接收一使用者輸入以從該複數個候選字詞中選擇 其中一者。 1 4 ·如申請專利範圍第1 3項所述之方法,其中更包含以下 步驟: 依據預期一使用者之次一字詞輸入所選擇之其中 一者而預測一或多個候選字詞。
    1 5.如申請專利範圍第1 3項所述之方法,其中以符合該字 詞之使用者輸入的可能性順序來呈現該複數個候選字 詞0 16.如申請專利範圍第1項所述之方法,其中更包含以下步 驟: 從一或多個候選字詞中自動選擇一最有可能者作 為該字詞之使用者輸入的一辨識字詞; 依據預期一使用者之次一字詞輸入之最有可能者 而預測一或多個候選字詞。 1 7 ·如申請專利範圍第1項所述之方法,其中更包含以下步 驟: 自動地重音一或多個字元; 自動地大寫一或多個字元; 38 200538969 自動地增加一或多個標點符號;及 自動地增加一或多個定義符號。 1 8 ·如申請專利範圍第1項所述之方法,其中該複數個辨識 結果之每個包含複數個分別與複數個候選字詞成分相 關的可能性指標,以指出符合該使用者輸入之一部分的 相對可能性。
    19. 一種具有指令資料的一機器可讀取媒體,當該機器可讀 取媒體於一資料處理系統上被執行時,將使該系統執行 一種用於辨識語言輸入的方法,該方法至少包含以下步 驟:
    藉由執行樣式辨識處理一語言之一字詞的一使用 者輸入以分別對複數個字詞成分產生複數個辨識結 果,該複數個辨識結果之至少其中之一包含複數個候選 字詞成分以及複數個可能性指標,該複數個可能性指標 指出該複數個字詞成分與該使用者輸入之一部分相對 於彼此為符合的可能性程度;及 自該複數個辨識結果以及可指出一字詞列表之使 用可能性的資料中判定一或多個可供用者輸入之該字 詞的候選字詞。 2 0.如申請專利範圍第1 9項所述之媒體,其中該一或多個 39
    200538969 候選字詞包含多個候選字詞;且該方法更包含以 驟: 呈現該多個候選字詞以供選擇; 接收一使用者輸入以從該複數個候選字詞中 其中一者;及 依據預期一使用者之次一字詞輸入所選擇之 一者而預測一或多個候選字詞。 21.如申請專利範圍第19項所述之媒體,其中該方法 含以下步驟: 從一或多個候選字詞中自動選擇一最有可能 為該字詞之使用者輸入的一辨識字詞; 依據預期一使用者之次一字詞輸入之最有可 而預測一或多個候選字詞。 22. —種用於識別語言輸入的資料處理系統,其至少包 處理構件,其係透過樣式辨識用以處理處理一 之一字詞的一使用者輸入以分別對複數個字詞成 生複數個辨識結果,該複數個辨識結果之至少其中 包含複數個候選字詞成分以及複數個可能性指標, 數個可能性指標指出該複數個字詞成分與該使用 入之一部分相對於彼此為符合的可能性程度;及 判定構件,其係用以自該複數個辨識結果以及 下步 選擇 其中 更包 者作 能者 含: 語言 I 分產 之一 該複 者輸 可指 40
    200538969 出一字詞列表之使用可能性的資料中判定一或 供用者輸入之該字詞的候選字詞。 23 .如申請專利範圍第22項所述之資料處理系統, 一或多個候選字詞包含複數個候選字詞;而該系 含: 呈現構件,其係用以呈現該複數個候選字詞 擇; 接收構件,其係用以接收一使用者輸入以從 個候選字詞中選擇其中一者;及 其中以符合該字詞之使用者輸入的可能性 現該複數個候選字詞。 24.如申請專利範圍第22項所述之資料處理系統, 複數個辨識結果之每個包含複數個分別與複數 字詞成分相關的可能性指標,以指出符合該使用 之一部分的相對可能性。 25 .如申請專利範圍第22項所述之資料處理系統, 包含用於下列之任一者的裝置: 自動地重音一或多個字元; 自動地大寫一或多個字元; 自動地增加一或多個標點符號;及 多個可 其中該 統更包 以供選 該複數 順序呈 其中該 個候選 者輸入 其中更 41
    200538969 自動地增加一或多個定義符號。 26.如申請專利範圍第22項所述之資料處理系統,其 複數個候選字詞之選擇致使該樣式辨識對該選擇 數個候選字詞之一或多個字詞成分調整後續的可 指標。 27. —種用以在一資料處理系統中處理語言輸入的 法,其中至少包含以下步驟: 分別接受複數個字詞成分的複數個辨識結果, 理一語言之一字詞的一使用者輸入,該複數個辨識 之至少其中之一包含複數個候選字詞成分以及複 可能性指標,該複數個可能性指標指出該複數個字 分與該使用者輸入之一部分相對於彼此為符合的 性程度;及 自該複數個辨識結果以及可指出一字詞列表 用可能性的資料中判定一或多個可供用者輸入之 詞的候選字詞。 28.如申請專利範圍第27項所述之方法,其中該候選 成分至少包含以下任何一者: 源自手寫辨識、語音辨識或鍵盤輸入的一筆1 源自手寫辨識、語音辨識或鍵盤輸入的一字天 中該 的複 能性 一方 以處 結果 數個 詞成 可能 之使 該字 字詞 42 200538969 源自手寫辨識、語音辨識或鍵盤輸入的的一音素; 及 源自手寫辨識、語音辨識或鍵盤輸入的的一音節或 其他語音表現的一音節。 2 9.如申請專利範圍第27項所述之方法,其中上述語言為 字母的或語意的任何一種。
    3 0.如申請專利範圍第27項所述之方法,其中判定一或多 個候選字詞之步驟更包含以下步驟: 消去複數個辨識結果之複數個候選字詞成分組合。 3 1.如申請專利範圍第3 0項所述之方法,其中判定一或多 個候選字詞之步驟更包含以下步驟: 自該語言之一字詞列表中選擇複數個候選字詞,該 複數個候選字詞含有該複數個辨識結果中的候選字詞 成分之組合。 32.如申請專利範圍第31項所述之方法,其中更包含以下 步驟: 自該複數個辨識結果以及可指出一字詞列表之使 用可能性的資料對一或多個候選字詞判定一或多個可 能性指標以指出符合該字詞之使用者輸入的可能性。 43 200538969 3 3 ·如申請專利範圍第3 2項所述之方法,其中更包含以下 步驟: 依據該一或多個可能性指標而排序該一或多個候 選字詞。 34.如申請專利範圍第33項所述之方法,其中更包含以下 步驟:
    自動從該一或多個候選字詞中選擇一字詞。 35.如申請專利範圍第34項所述之方法,其中該自動選擇 之步驟於以下任何一者上被執行: 該語言中的片語; 該語言中的字詞對;及 該語言中的三連字串。 3 6 ·如申請專利範圍第3 4項所述之方法,其中該自動選擇 之步驟乃依據下列之任一者而被執行: 該語言之形態;及 該語言之文法規則。 3 7.如申請專利範圍第34項所述之方法,其中該自動選擇 之步驟乃依據收到該字詞之使用者輸入的一前後文而 44 200538969 被執行。 3 8.如申請專利範圍第3 4項所述之方法,其中更包含以下 步驟: 依據預期一使用者之次一字詞輸入所自動選擇之 一字詞而預測多個候選字詞。 39.如申請專利範圍第33項所述之方法,其中更包含以下
    步驟: 呈現該一或多個候選字詞以供使用者選擇;及 接收一使用者輸入以自該複數個候選字詞中選擇 一字詞。 40.如申請專利範圍第39項所述之方法,其中依據該一或 多個可能性指標之順序呈現該複數個候選字詞。 4 1 ·如申請專利範圍第3 9項所述之方法,其中更包含以下 步驟: 依據預期一使用者之次一字詞輸入所選擇之字詞 而預測複數個候選字詞。 42.如申請專利範圍第27項所述之方法,其中一字詞成分 之複數個辨識結果之一包含一預測,其指出候選字詞成 45 200538969 分之集合中的任何一者具有符合該字詞之使用 之一部分之一相同的可能性。 43 .如申請專利範圍第27項所述之方法,其中指出 列表之使用可能性的該資料包含以下任一者: 該語言中使用字詞的頻率; 一使用者使用字詞的頻率;及 一文件中使用字詞的頻率。 者輸入 該字詞
    44.如申請專利範圍第27項所述之方法,其中更包 任一步驟: 自動地重音一或多個字元; 自動地大寫一或多個字元; 自動地增加一或多個標點符號;及 自動地增加一或多個定義符號。 45. —種具有指令資料的機器可讀取媒體,當該機器 媒體於一資料處理系統上被執行時,將使該系統 種用於辨識語言輸入的方法,該方法至少包含 驟: 分別接受多個字詞成分的複數個辨識結果, 一語言之一字詞的一使用者輸入,該複數個辨識 至少其中之一包含複數個候選字詞成分以及複 含以下
    可讀取 執行一 以下步 以處理 結果之 數個可 46 200538969 能性指標,該複數個可能性指標指出該複數個字詞成分 與該使用者輸入之一部分相對於彼此的符合可能性程 度;及 自該複數個辨識結果以及可指出一字詞列表之使 用可能性的資料中判定一或多個可供用者輸入之該字 詞的候選字詞。
    46.如申請專利範圍第45項所述之媒體,其中該判定一或 多個候選字詞之步驟包含以下步驟: 消去複數個辨識結果之複數個候選字詞成分組 合;及 自該語言之一字詞列表中選擇複數個候選字詞,該 複數個候選字詞含有該複數個辨識結果中的候選字詞 成分之組合。 47.如申請專利範圍第46項所述之媒體;該方法更包含以 下步驟: 自該複數個辨識結果以及可指出一字詞列表之使 用可能性的資料中對一或多個候選字詞判定一或多個 可能性指標以指出符合該字詞之使用者輸入的可能性; 依據該一或多個可能性指標排序該一或多個候選 字詞; 自動地從該一或多個候選字詞選擇其中一者;及 47
TW094103440A 2004-02-11 2005-02-03 Handwriting and voice input with automatic correction TW200538969A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US54417004P 2004-02-11 2004-02-11
US11/043,506 US7319957B2 (en) 2004-02-11 2005-01-25 Handwriting and voice input with automatic correction
US11/043,525 US20050192802A1 (en) 2004-02-11 2005-01-25 Handwriting and voice input with automatic correction

Publications (1)

Publication Number Publication Date
TW200538969A true TW200538969A (en) 2005-12-01

Family

ID=34865026

Family Applications (1)

Application Number Title Priority Date Filing Date
TW094103440A TW200538969A (en) 2004-02-11 2005-02-03 Handwriting and voice input with automatic correction

Country Status (9)

Country Link
EP (1) EP1714234A4 (zh)
JP (1) JP2007524949A (zh)
KR (1) KR100912753B1 (zh)
CN (1) CN1918578B (zh)
AU (1) AU2005211782B2 (zh)
BR (1) BRPI0507577A (zh)
CA (1) CA2556065C (zh)
TW (1) TW200538969A (zh)
WO (1) WO2005077098A2 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI474227B (zh) * 2008-03-11 2015-02-21 Microsoft Corp 在一觸控面板上解譯模糊輸入
TWI587281B (zh) * 2014-11-07 2017-06-11 Papago Inc Voice control system and its method
TWI616868B (zh) * 2014-12-30 2018-03-01 鴻海精密工業股份有限公司 會議記錄裝置及其自動生成會議記錄的方法
TWI619115B (zh) * 2014-12-30 2018-03-21 鴻海精密工業股份有限公司 會議記錄裝置及其自動生成會議記錄的方法

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008076812A (ja) * 2006-09-22 2008-04-03 Honda Motor Co Ltd 音声認識装置、音声認識方法、及び音声認識プログラム
US8032374B2 (en) 2006-12-05 2011-10-04 Electronics And Telecommunications Research Institute Method and apparatus for recognizing continuous speech using search space restriction based on phoneme recognition
KR100908444B1 (ko) * 2006-12-05 2009-07-21 한국전자통신연구원 음소 인식 기반의 탐색공간 제한을 이용한 연속음성인식장치 및 방법
WO2010084973A1 (ja) 2009-01-20 2010-07-29 日本電気株式会社 入力装置、情報処理装置、入力方法およびプログラム
JP2011065322A (ja) * 2009-09-16 2011-03-31 Konica Minolta Holdings Inc 文字認識システム及び文字認識プログラム、並びに音声認識システム及び音声認識プログラム
US8543382B2 (en) * 2010-10-27 2013-09-24 King Abdulaziz City for Science and Technology (KACST) Method and system for diacritizing arabic language text
CN103631802B (zh) * 2012-08-24 2015-05-20 腾讯科技(深圳)有限公司 歌曲信息检索方法、装置及相应的服务器
DE102013009375A1 (de) * 2012-12-28 2014-07-03 Volkswagen Aktiengesellschaft Verfahren zum Eingeben und Erkennen einer Zeichenkette
GB201321927D0 (en) * 2013-12-11 2014-01-22 Touchtype Ltd System and method for inputting text into electronic devices
CN105810197B (zh) * 2014-12-30 2019-07-26 联想(北京)有限公司 语音处理方法、语音处理装置和电子设备
US10657404B2 (en) 2015-07-17 2020-05-19 Rakuten, Inc. Character recognition device, character recognition method, and character recognition program
KR101636823B1 (ko) * 2015-11-27 2016-07-07 (주)인키움 자기소개서 자동 제공 서버 및 제공 방법
CN106406807A (zh) * 2016-09-19 2017-02-15 北京云知声信息技术有限公司 一种语音修改文字的方法及装置
JP7143665B2 (ja) 2018-07-27 2022-09-29 富士通株式会社 音声認識装置、音声認識プログラムおよび音声認識方法
CN109584882B (zh) * 2018-11-30 2022-12-27 南京天溯自动化控制***有限公司 一种针对特定场景的语音转文字的优化方法及***
KR102577589B1 (ko) * 2019-10-22 2023-09-12 삼성전자주식회사 음성 인식 방법 및 음성 인식 장치
TWI771720B (zh) 2020-07-24 2022-07-21 華碩電腦股份有限公司 具有多型態輸入之辨識方法及使用其之電子裝置
US11726657B1 (en) 2023-03-01 2023-08-15 Daniel Pohoryles Keyboard input method, system, and techniques

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4003025A (en) * 1975-12-24 1977-01-11 International Business Machines Corporation Alphabetic character word upper/lower case print convention apparatus and method
US5244802A (en) * 1987-11-18 1993-09-14 Phytogen Regeneration of cotton
US5828991A (en) * 1995-06-30 1998-10-27 The Research Foundation Of The State University Of New York Sentence reconstruction using word ambiguity resolution
US5917941A (en) * 1995-08-08 1999-06-29 Apple Computer, Inc. Character segmentation technique with integrated word search for handwriting recognition
US5950160A (en) * 1996-10-31 1999-09-07 Microsoft Corporation Method and system for displaying a variable number of alternative words during speech recognition
US5926566A (en) * 1996-11-15 1999-07-20 Synaptics, Inc. Incremental ideographic character input method
US5896321A (en) * 1997-11-14 1999-04-20 Microsoft Corporation Text completion system for a miniature computer
US6393395B1 (en) * 1999-01-07 2002-05-21 Microsoft Corporation Handwriting and speech recognizer using neural network with separate start and continuation output scores
US20020152075A1 (en) * 2001-04-16 2002-10-17 Shao-Tsu Kung Composite input method
WO2004023455A2 (en) * 2002-09-06 2004-03-18 Voice Signal Technologies, Inc. Methods, systems, and programming for performing speech recognition
US7444286B2 (en) * 2001-09-05 2008-10-28 Roth Daniel L Speech recognition using re-utterance recognition

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI474227B (zh) * 2008-03-11 2015-02-21 Microsoft Corp 在一觸控面板上解譯模糊輸入
TWI609302B (zh) * 2008-03-11 2017-12-21 微軟技術授權有限責任公司 在觸控螢幕上解譯模糊輸入
TWI587281B (zh) * 2014-11-07 2017-06-11 Papago Inc Voice control system and its method
TWI616868B (zh) * 2014-12-30 2018-03-01 鴻海精密工業股份有限公司 會議記錄裝置及其自動生成會議記錄的方法
TWI619115B (zh) * 2014-12-30 2018-03-21 鴻海精密工業股份有限公司 會議記錄裝置及其自動生成會議記錄的方法

Also Published As

Publication number Publication date
WO2005077098A8 (en) 2007-05-10
CN1918578B (zh) 2012-05-02
CA2556065A1 (en) 2005-08-25
EP1714234A2 (en) 2006-10-25
EP1714234A4 (en) 2012-03-21
BRPI0507577A (pt) 2007-07-03
CN1918578A (zh) 2007-02-21
WO2005077098A3 (en) 2005-11-03
CA2556065C (en) 2012-07-03
KR20070090075A (ko) 2007-09-05
JP2007524949A (ja) 2007-08-30
WO2005077098A2 (en) 2005-08-25
KR100912753B1 (ko) 2009-08-18
AU2005211782A1 (en) 2005-08-25
AU2005211782B2 (en) 2009-01-22
WO2005077098B1 (en) 2005-12-08

Similar Documents

Publication Publication Date Title
TW200538969A (en) Handwriting and voice input with automatic correction
US7319957B2 (en) Handwriting and voice input with automatic correction
JP4829901B2 (ja) マニュアルでエントリされた不確定なテキスト入力を音声入力を使用して確定する方法および装置
TWI266280B (en) Multimodal disambiguation of speech recognition
US8606582B2 (en) Multimodal disambiguation of speech recognition
US20050192802A1 (en) Handwriting and voice input with automatic correction
US7395203B2 (en) System and method for disambiguating phonetic input
JP4527731B2 (ja) 自動訂正機能を備えた仮想キーボードシステム
JP5462001B2 (ja) 文脈上の入力方法
JP2005202917A (ja) 表音入力の曖昧さを除くためのシステムおよび方法
JP5037491B2 (ja) 与えられた(1つ以上の)文字の全数より少ない数の文字、若しくは、その文字の字画の全数より少ない数の字画、又はその両方を供給することによる、表意言語の句の省略された手書き入力
JP2005508031A (ja) 部首に基づいた、適合化可能な画の書き順システム