TWI585681B - 從既存之單一語言程序建立多重語言程序 - Google Patents

從既存之單一語言程序建立多重語言程序 Download PDF

Info

Publication number
TWI585681B
TWI585681B TW102114033A TW102114033A TWI585681B TW I585681 B TWI585681 B TW I585681B TW 102114033 A TW102114033 A TW 102114033A TW 102114033 A TW102114033 A TW 102114033A TW I585681 B TWI585681 B TW I585681B
Authority
TW
Taiwan
Prior art keywords
language
input
component
machine translation
output
Prior art date
Application number
TW102114033A
Other languages
English (en)
Other versions
TW201403471A (zh
Inventor
薩利卡亞魯伊
波伊斯丹尼爾
瑟里基爾梅茲費蒂爾艾斯利
迪歐拉斯艾諾普K
希爾拉德達斯汀里格
哈卡尼圖爾狄雷克Z
圖爾高韓
艾勒娃菲雷諾A
Original Assignee
微軟技術授權有限責任公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 微軟技術授權有限責任公司 filed Critical 微軟技術授權有限責任公司
Publication of TW201403471A publication Critical patent/TW201403471A/zh
Application granted granted Critical
Publication of TWI585681B publication Critical patent/TWI585681B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Description

從既存之單一語言程序建立多重語言程序
本發明係關於從既存之單一語言程序建立多重語言程序。
傳統上,計算裝置的使用者不得不以由程序指定的方式向在彼等計算裝置上執行的彼等程序提供輸入。因此,例如,為在執行於計算裝置上的試算表應用程式中執行計算,使用者被迫輸入使用者想要以由試算表應用程式指定的方式計算的值及公式。作為另一實例,為在執行於計算裝置上的文書處理應用程式中選擇不同字體,使用者被迫經由藉由文書處理應用程式提供的機制選擇印刷資訊。儘管對使用者而言此等機制可能成為第二天性,該等使用者不斷地與在計算裝置上執行的此等應用程式相互作用,但此等機制仍與使用者傳統上彼此通訊的方式有所不同。
因已增強計算裝置的處理能力,故在彼等計算裝置上執行的大量應用程式已經設計來接受使用者更自然地提供的輸入。舉例而言,對使用者而言一個越來越普遍的輸入機 制為講話,或者為語言輸入,使用者想要應用程式執行什麼,應用程式則可翻譯此語言輸入及相應地回應。藉由提供具有回應語言輸入的能力的應用程式,此等應用程式的程式員提供使用者更易學習及利用的應用程式。
遺憾地是,語言輸入取決於使用者講話所用的語言。因此,經設計為接受以一種語言提供的語言輸入的應用程式將不能夠理解以另一不同語言提供的語言輸入。由於全世界使用者所講語言的種類,且由於語言之間的大量語言差異,故想要使他們的應用程式接受語言輸入的應用程式開發者被迫為此等應用程式將支援的不同語言中的每一者創建不同版本的彼等應用程式。
更重要地,創建可接受語言輸入的應用程式之程序可能係耗時的且昂貴的。舉例而言,大量的時間及資源投入可針對訓練此應用程式的語言理解元件,該元件能從使用者所提供的語言輸入準確地解密使用者的意圖。且此正是應用程式開發者想要他們的應用程式支援的語言理解元件,另外該語言理解元件必須經改造以用於每一語言。
在一個實施例中,既存應用程式的語言元件(該等元件以錨定語言操作,且該元件表示大量的時間及資源投入)可重新使用來創建應用程式,該等應用程式能夠接收除此錨定語言外的語言的語言輸入。機器翻譯技術藉由計算裝置提供將以一種語言接收的輸入翻譯至另一不同語言的輸入,可將機器翻譯技術與既存應用程式的此等語言元件耦合以重複 使用彼等語言元件,同時使能接收除錨定語言外的語言的輸入。
在另一實施例中,可將代表在多個語言與既存語言元件的錨定語言之間的翻譯的能力的多個機器翻譯元件封裝成單一應用程式,從而向此應用程式提供接收各種不同語言的語言輸入的能力。語言識別元件可首先接收語言輸入,並可由此識別正提供之此語言輸入的語言。然後可基於此語言識別選擇適當的機器翻譯元件。
在進一步實施例中,混合應用程式包含與錨定語言相關聯的既存語言元件及用於在其他語言與此錨定語言之間的翻譯的機器翻譯元件,該混合應用程式可作為開發與本國語言相關聯的語言元件的起始點,從而避免需要機器翻譯元件。
提供該【發明內容】以引入簡化形式之概念的選擇,該等概念在下文【具體實施方式】中進一步描述。該【發明內容】並不意欲識別所主張標的之主要特徵或基本特徵,該【發明內容】亦不意欲用於限制所主張標的之範疇。
額外特徵及優點將從下文之詳細描述顯而易見,參考附隨圖式繼續進行下文之詳細描述。
100‧‧‧計算裝置
120‧‧‧中央處理單元
121‧‧‧系統匯流排
130‧‧‧系統記憶體
131‧‧‧唯讀記憶體
132‧‧‧隨機存取記憶體
133‧‧‧基本輸入/輸出系統
134‧‧‧作業系統
135‧‧‧程式模組
136‧‧‧程式資料
140‧‧‧非揮發性記憶體介面
141‧‧‧硬碟驅動機
144‧‧‧作業系統
145‧‧‧程式模組
146‧‧‧程式資料
150‧‧‧使用者
151‧‧‧使用者輸入
152‧‧‧使用者回饋
170‧‧‧網路介面
171‧‧‧通用網路連接
172‧‧‧網路
180‧‧‧週邊介面
181‧‧‧鍵盤
182‧‧‧滑鼠
184‧‧‧麥克風
185‧‧‧移動偵測器
189‧‧‧揚聲器
190‧‧‧圖形硬體介面
191‧‧‧顯示器裝置
200‧‧‧系統
211‧‧‧輸入識別元件
212‧‧‧輸出產生元件
220‧‧‧既存應用程式架構
221‧‧‧語言理解元件
222‧‧‧對話管理器
223‧‧‧知識源
224‧‧‧語言產生元件
230‧‧‧語言識別元件
240‧‧‧機器翻譯組件
241‧‧‧輸入識別元件
242‧‧‧輸出產生元件
250‧‧‧外國使用者
260‧‧‧機器翻譯元件
261‧‧‧輸入識別元件
262‧‧‧輸出產生元件
270‧‧‧機器翻譯元件
271‧‧‧輸入識別元件
272‧‧‧輸出產生元件
300‧‧‧系統
310‧‧‧機器翻譯組件
311‧‧‧輸入識別元件
312‧‧‧輸出產生元件
321‧‧‧語言理解元件
322‧‧‧對話管理器
323‧‧‧知識源
324‧‧‧語言產生元件
400‧‧‧流程圖
410‧‧‧步驟
420‧‧‧步驟
430‧‧‧步驟
440‧‧‧步驟
450‧‧‧步驟
460‧‧‧步驟
470‧‧‧步驟
500‧‧‧流程圖
510‧‧‧步驟
515‧‧‧步驟
520‧‧‧步驟
525‧‧‧步驟
530‧‧‧步驟
535‧‧‧步驟
540‧‧‧步驟
545‧‧‧步驟
550‧‧‧步驟
555‧‧‧步驟
560‧‧‧步驟
565‧‧‧步驟
600‧‧‧流程圖
610‧‧‧步驟
615‧‧‧步驟
620‧‧‧步驟
625‧‧‧步驟
625‧‧‧步驟
630‧‧‧步驟
635‧‧‧步驟
640‧‧‧步驟
645‧‧‧步驟
650‧‧‧步驟
655‧‧‧步驟
660‧‧‧步驟
當結合附隨圖式時可最佳地理解下文之詳細描述,其中:第1圖為能夠接收語言輸入的示例性計算裝置的方塊圖;第2圖為示例性混合程序的方塊圖,該示例性混合程 序包含與錨定語言相關聯的語言元件及用於在錨定語言與其他語言之間翻譯的機器翻譯元件;第3圖為將混合程序示例性地轉換成本國語言程序的方塊圖;第4圖為混合程序的示例性創建的流程圖,該混合程序包含與錨定語言相關聯的語言元件及用於在錨定語言與其他語言之間翻譯的機器翻譯元件;第5圖為混合程序的示例性操作的流程圖,該混合程序包含與錨定語言相關聯的語言元件及用於在錨定語言與其他語言之間翻譯的機器翻譯元件;及第6圖為將混合程序示例性地轉換成本國語言程序的流程圖。
以下描述係關於程序的有效產生,該等程序能夠藉由重複使用與不同錨定語言相關聯的既存語言元件以及可在錨定語言與一或更多種其他語言之間翻譯的機器翻譯元件來接收一或更多種語言之語言輸入。語音輸入可導向至機器翻譯元件,該機器翻譯元件可將此輸入從提供此輸入之任何語言翻譯成與既存語言元件相關聯之錨定語言。然後,彼等既存語言元件可用於發起回應於語言輸入的處理並產生適當的輸出。視情況,輸出可導向至機器翻譯元件以翻譯回接收輸入的同一語言來呈現至使用者。多個機器翻譯元件可用於接受來自多個不同語言的語言輸入,且語言識別元件可首先接收此語言輸入並可識別提供此語言輸入的語言,從而選擇適 當的機器翻譯元件。包含機器翻譯元件及與錨定語言相關聯的語言元件的混合程序亦可作為起始構造,單一語言程序係隨時間而自該起始構造創建的。
本文中所述之技術聚焦於語言輸入,諸如話音輸入。然而,儘管進行此等說明及描述用於便於參考,但並未如此限制本文中所述之技術。詳言之,所述之技術同樣地可適用於基於語言之任意種類的輸入。因此,以下說明及描述僅意味說明性的,且並不意味限制以下所描述技術至所描述之特定語言輸入。
儘管不是必要的,但以下之描述將處於指令的大環境下,該等指令正由具有計算能力的裝置執行。此等計算裝置包括傳統電腦及具有計算能力(諸如由中央處理單元提供之彼等能力)的消費型電子裝置。因此,以下描述將處於能夠由此計算裝置執行之電腦可執行指令(諸如程式模組)之大環境下。更具體地,除非特別說明,否則描述將參考由一或更多個計算裝置或週邊設備執行之操作之動作及符號表示。如此,應理解,有時被稱為正被電腦執行的此等動作及操作包括由表示結構化形式之資料的電訊號的處理單元執行之操縱。此操縱轉換資料或將資料保持在記憶體中之位置處,記憶體重新配置或另外以熟習此項技術者所很好理解的方式改變計算裝置或週邊設備的操作。保持資料的資料結構為具有由資料之格式界定的特定特性的實體位置。
一般而言,程式模組包括執行特定任務或實現特定抽象資料類型的常式、程式、目標、元件、資料結構等等。 此外,熟習此項技術者將瞭解,並不需要將計算裝置限制於習知個人電腦及習知個人電子裝置,且計算裝置可包括能夠計算的其他裝置,包括掌上型裝置、多處理器系統、基於其他微處理器或可程式化消費型電子設備、網路PC、迷你電腦、主機電腦等等。同樣地,計算裝置不一定限制於單獨裝置,因機制亦可在遠端處理裝置執行任務的分散式運算環境中實踐,遠端處理裝置經由通訊網路連結。在分散式運算環境中,程式模組可定位在本端及遠端記憶體儲存裝置中。
參考第1圖,圖示示例性計算裝置100,該示例性計算裝置可包括但不限於一或更多個中央處理單元(CPU)120、系統記憶體130及系統匯流排121,該系統匯流排可將包括系統記憶體之各種系統元件耦合至處理單元120。系統匯流排121可為若干類型之匯流排結構中之任一種,該等匯流排結構包括使用各種匯流排構架中之任一者的記憶體匯流排或記憶體控制器、週邊匯流排及本端匯流排。計算裝置100可包括週邊設備,該等週邊設備可使能使用者150與計算裝置互動。此等週邊設備可包括用於將來自計算裝置100的資訊(諸如使用者回饋152)呈現至使用者150的週邊設備,且此等週邊設備可包括用於使能使用者150向計算裝置100提供資訊及指令(諸如使用者輸入151)的週邊設備。可使能計算裝置100向使用者呈現資訊的週邊設備可包含圖形硬體,該圖形硬體包括但不限於圖形硬體介面190及顯示器裝置191,該圖形硬體介面190及顯示器裝置191可由計算裝置用於向使用者呈現視覺圖形使用者介面。可使能計算裝置100 向使用者呈現資訊的附加週邊設備亦可包括一或更多個揚聲器189以及未在第1圖中明確圖示的其他類似週邊裝置,該一或更多個揚聲器189可向彼計算裝置的使用者提供來自計算裝置100的聽覺資訊。可經由連接至系統匯流排121之週邊介面180將此等週邊設備通訊耦合至計算裝置100。週邊設備可使能使用者向計算裝置100提供資訊,該等週邊設備可包括滑鼠182、鍵盤181、麥克風184、移動偵測器185或未在第1圖中明確圖示之其他裝置,諸如軌跡墊、附件板、多點觸控輸入裝置等等。可經由週邊介面180將上述週邊裝置通訊耦合至計算裝置100的系統匯流排121,且上述週邊裝置常常包括硬體態樣及軟體態樣以使能上述週邊裝置之功能。如此,儘管僅在第1圖中圖示週邊裝置之硬體表示,但參考以下此等週邊設備意謂包括用於此等週邊設備之合適操作的硬體態樣及軟體態樣兩者。
計算裝置100通常亦包括電腦可讀取媒體,電腦可讀取媒體可包括任意可用媒體,該任意可用媒體可由計算裝置100存取並包括揮發性媒體及非揮發性媒體及可移動媒體及不可移動媒體。舉例而言(而不是限制),電腦可讀取媒體可包含電腦儲存媒體、通訊媒體或上述之組合。電腦儲存媒體包括在用於儲存資訊(諸如電腦可讀取指令、資料結構、程式模組或其他資料)的任意方法或技術中實施的媒體。通訊媒體通常以調變資料訊號(諸如載波或其他傳送機制)體現電腦可讀取指令、資料結構、程式模組或其他資料,且通訊媒體通常包括任意資訊傳遞媒體。
系統記憶體130包括揮發性及/或非揮發性記憶體形式之電腦儲存媒體,諸如唯讀記憶體(ROM)131及隨機存取記憶體(RAM)132。基本輸入/輸出系統133(BIOS)含有諸如在啟動期間說明在計算裝置100內之元件之間轉移資訊的基本常式,該基本輸入/輸出系統133(BIOS)通常儲存在ROM 131中。RAM 132通常含有可立即存取的及/或目前正被處理單元120操作的資料及/或程式模組。舉例而言(而不是限制),第1圖圖示作業系統134、其他程式模組135及程式資料136。
計算裝置100亦可包括其他可移動/不可移動電腦儲存媒體、揮發性/非揮發性電腦儲存媒體。舉例而言,第1圖圖示從非揮發性磁性媒體讀取或寫入非揮發性磁性媒體的硬碟驅動機141。可與示例性計算裝置一起使用的其他可移動/不可移動電腦儲存媒體、揮發性/非揮發性電腦儲存媒體包括但不限於卡式磁帶、快閃記憶卡、數位化通用光碟、數位錄影帶、固態RAM、固態ROM等等。硬碟驅動機141通常經由介面(諸如非揮發性記憶體介面140)連接至系統匯流排121。
驅動機及上文所論述並在第1圖中圖示的與驅動機相關聯的電腦儲存媒體為電腦裝置100提供電腦可讀取指令、資料結構、程式模組及其他資料的儲存。例如,在第1圖中,將硬碟驅動機141圖示為儲存作業系統144、其他程式模組145及程式資料146。注意,此等元件可與作業系統134、其他程式模組135及程式資料136相同或不同。在此作業系 統144、其他程式模組145及程式資料146經給定不同符號以說明作業系統144、其他程式模組145及程式資料146至少為不同副本。
計算裝置100可在使用至一或更多個遠端電腦的邏輯連接的網路環境中操作。計算裝置100並不局限於任意特定網路或網路連結協議。因此,為簡單說明,在第1圖中將計算裝置100圖示為經由通用網路連接171連接至網路172,該通用網路連接171可為局域網路(LAN)、廣域網路(WAN)或其他網路。經由又連接至系統匯流排121的網路介面或適配器170將計算裝置100連接至通用網路連接171。在網路環境中,相對於計算裝置100描述的程式模組或程式模組的部分或週邊設備可儲存在一或更多個其他計算裝置的記憶體中,該一或更多個其他計算裝置經由通用網路連接171通訊耦合至計算裝置100。將瞭解,所圖示之網路連接係示例性的,且可使用用於在計算裝置之間建立通訊連結的其他手段。
轉向第2圖,圖中所示之系統200圖示示例性程序,該示例性程序可重複使用既存基礎架構以有效地提供對一或更多種語言的語言理解能力,該一或更多種語言不同於創建既存架構的語言。在一個實施例中,在計算裝置(諸如示例性計算裝置100)上執行之既存應用程式或程序可能能夠接收語言輸入,並視情況,能夠以創建應用程式或程序的錨定語言產生語言輸出。如在本文中所使用,術語「語言輸入」意謂任意形式的輸入,該輸入以字或短語將用於人之間的通訊的方式包含字或短語。舉例而言,可能已程式化在家庭娛樂 計算裝置上執行之應用程式以接收、理解及回應用英語說的話音命令,以使能使用者搜索及選擇將由此家庭娛樂計算裝置呈現的娛樂內容。作為另一實例,可能已程式化在智慧型手機計算裝置上執行的應用程式以接收、理解及回應用英語說的話音輸入,該等話音輸入包含使用者所提之問題。儘管,通常「語言輸入」將由使用者以話音形式提供,但並未如此限制本文中所使用及界定之術語「語言輸入」。事實上,本文中所述之機制同樣可適用於以文本、手勢、注視、手語形式提供之「語言輸入」,且可向計算裝置提供如本文中由該「語言輸入」所界定的其他類似的機制。
此應用程式或程序可包含既存應用程式架構220,諸如在第2圖中所圖示之彼架構,該既存應用程式架構可表示用於理解及對以錨定語言提供之語言輸入起作用的電腦可執行指令。熟習此項技術者將意識到,含在既存應用程式架構220內之元件及程序可表示大量的時間及資源投入。此外,對創建此結構之語言而言,此架構係獨有的。舉例而言,若既存應用程式架構220為經設計以接收及對以英語提供的語言輸入起作用的應用程式的部分,則此架構將不能夠對以另一語言(諸如法語)提供的輸入起作用。因此,若包含既存應用程式架構220之應用程式或程序開發者尋求釋放(例如)此應用程式或程序的法語版本,則彼開發者將需要再次投入大量時間及資源至既存應用程式架構220的面向法語的版本中。對將在世界各地使用的應用程式或程序而言,此單一語言限制可能因大量語言而導致單一語言應用程式架構從頭開 始的創建的重複。為避免此大量的時間及資源投入,既存應用程式架構220可在機器翻譯元件的說明下重複使用。更具體地,且如下文將詳細描述,機器翻譯元件可將輸入及視情況地來自應用程式或程序的使用者的本國語言的輸出翻譯成既存應用程式架構220的錨定語言,從而使能既存應用程式架構220向以不同於錨定語言的本國語言操作的應用程式或程序提供語言服務。藉由重複使用既存應用程式架構220,應用程式或程序開發者可在不投入再創建彼等其他語言之既存應用程式架構220的類似版本通常所需的大量時間及資源的情況下產生其他語言之等價版本。為清楚及便於參考,在本文中使用術語「錨定語言」以意謂創建初始語言架構的語言,將重複使用該初始語言架構。在本文中使用術語「本國語言」以意謂將向應用程式或程序提供輸入的語言及預期提供來自應用程式或程序的任意輸出的語言。
在第2圖中圖示之系統200圖示既存應用程式架構220,同時既存應用程式架構220可用於執行於計算裝置上且從使用者(諸如使用者150)接收語言輸入的應用程式或程序中。詳言之,且如由第2圖之系統200所示,使用者150產生之語言輸入可首先被適於使用者150提供的語言輸入的輸入識別元件211接收。舉例而言,若使用者150提供之語言輸入為話音輸入,則輸入識別元件211可為可能能夠將表示使用者之話音輸入之音訊資訊轉換成文本資訊的語音辨識元件。作為另一實例,若使用者150提供之語言輸入經由手語輸入,則輸入識別元件211可為可能能夠將表示使用者之手 語輸入之影像資訊轉換成文本資訊的手語識別元件。
可向語言理解元件221提供表示使用者之語言輸入之文本資訊。語言理解元件221可能能夠接收文本格式之此語言輸入,且可連同對話管理器222及知識源223(諸如)在識別待執行之適當的回應處理的環境下從語言輸入匯出意義。舉例而言,若使用者已講出指令以顯示指定電視節目的全部可用集,則語言理解元件221連同對話管理器222及知識源223可將此語言輸入解釋為搜索及顯示結果(search-and-display-results)請求且使用者所指定的名稱為搜索參數且該名稱為標題規格。同樣地,作為另一實例,若使用者已要求特定城市的中期預報,則語言理解元件221連同對話管理器222及知識源223可將此語言輸入解釋為對氣象資訊的實際請求,且使用者所提供之名稱為界定請求氣象資訊的地理區域的城市名稱。
如所指示,語言理解元件221、對話管理器222及知識源223可表示大量的時間及資源投入。更具體地,可能已經由從使用者接收語言輸入及判定且擔保回應處理的多次反覆運算來構建及改進語言理解元件221、對話管理器222及知識源223。此等多次反覆運算可設法調整在反覆運算前已次佳地實施的語言理解元件221、對話管理器222及知識源223的態樣。舉例而言,使用者可使用不同字及語言式樣來要求同一資訊,且語言理解元件221、對話管理器222及知識源223可經由各種反覆運算及改進解釋愈來愈多的此等不同字及語言式樣,以便能夠有意義地回應更廣泛的使用者及更多 種類之輸入。
在一個實施例中,可基於使用語言理解元件221、對話管理器222及知識源223的特定環境來進一步改進語言理解元件221、對話管理器222及知識源223。舉例而言,提供對家庭娛樂計算裝置上的娛樂內容的存取的應用程式可接收導向此娛樂內容的語言輸入,且可聚焦語言理解元件221、對話管理器222及知識源223以把此情況考慮在內。繼續進行此實例,若添加新電視節目,該新電視節目之名稱包含並非為既存應用程式架構220的先前部分的字或術語,則架構可經更新以包括此等字或術語,及此等字或術語之由使用者執行之發音及其他傳遞,以使得使用者應請求此新電視節目,既存應用程式架構將能夠認識此請求。同樣地,作為另一實例,提供對智慧型手機計算裝置之個人輔助服務之應用程式可接收導向通常由此個人輔助服務執行的有限動作的語言輸入,且可聚焦語言理解元件221、對話管理器222及知識源223以把此情況考慮在內。繼續進行此另一實例,若既存應用程式架構220的一個反覆運算並未正確地推斷或有效地處理請求以對指定使用者創建文本訊息,則既存應用程式架構220的隨後反覆運算可經更新以更容易地基於使用者之語言輸入識別此等請求並回應此等請求。
一旦語言理解元件221、對話管理器222及知識源223已發起回應處理之執行,則在某種程度上合適的任意輸出可導向可與對話管理器222及知識源223一起以語言方式提供輸出的語言產生元件224。與語言理解元件221一樣,語言 產生元件224、對話管理器222及知識源223亦可表示大量的時間及資源投入,並可能由於多次反覆運算已產生語言產生元件224、對話管理器222及知識源223,多次反覆運算設法在提供回應輸出時改進語言產生元件224所使用語言學的使用者的感知。
在一個實施例中,語言產生元件224提供之輸出可導向將以可由使用者150感知的形式產生的輸出產生元件212。舉例而言,文字至語音元件可為可產生話音格式之語言輸出的輸出產生元件。如將由熟習此項技術者所認識,可同樣地使用其他類型之輸出產生元件。
如所指示,既存應用程式架構220可表示大量的時間及資源投入。遺憾地是,通常在單一語言(諸如(例如)英語)環境下創建既存應用程式架構220。因此,提供另一不同語言(諸如法語)之語言輸入的使用者將不能夠使用此應用程式。然而,在一個實施例中,代替重新創建類似於其他語言之既存應用程式架構220之彼等元件的元件,可使用機器翻譯技術以在此等其他語言與錨定語言(首先在錨定語言環境內創建既存應用程式架構220)之間翻譯。第2圖之系統200圖示此混合應用程式,該混合應用程式可包含錨定語言之既存應用程式架構220及在本國語言與錨定語言之間翻譯的機器翻譯元件,從而提供對一或更多種本國語言的語言理解功能,同時重複使用錨定語言之既存應用程式架構220並節省重新創建彼等其他本國語言之類似架構的時間及費用。
最初,由使用者所提供的語言輸入可導向語言識別 元件230,該使用者使用不同於創建既存應用程式架構220之錨定語言的本國語言。舉例而言,外國使用者250可以本國語言提供輸入。此輸入可導向語言識別元件230,該語言識別元件230可使用已知技術,該已知技術用於識別外國使用者250提供語言輸入的語言。一旦識別由外國使用者250提供之語言輸入的語言,輸入即可導向輸入識別元件241、輸入識別元件261及輸入識別元件271中的合適的一個輸入識別元件。舉例而言,若外國使用者250以法語提供語言輸入,則語言識別元件230可將此語言輸入識別為法語並可將此語言輸入導向法語輸入識別元件。輸入識別元件241、輸入識別元件261及輸入識別元件271中之每一輸入識別元件可相對於此等輸入識別元件所關聯的語言(且此等語言輸入識別元件在此語言環境下操作)而執行類似功能。此等功能亦類似於輸入識別元件211,該輸入識別元件211之操作在上文詳細描述。
一旦已將外國使用者250所提供之語言輸入轉換成外國使用者250提供語言輸入之語言的基於文本的語言輸入,即可向機器翻譯元件提供基於文本的語言輸入以翻譯成錨定語言,從而使能重複使用既存應用程式架構220。取決於基於由語言識別元件230所執行的語言識別所選擇的輸入識別元件241、輸入識別元件261及輸入識別元件271,來自機器翻譯元件240、機器翻譯元件260及機器翻譯元件270之間的合適的機器翻譯元件可提供由輸入識別元件241、輸入識別元件261及輸入識別元件271中所選的一個輸入識別元件產 生的基於文本的語言輸入。
一旦機器翻譯元件(諸如機器翻譯元件240、機器翻譯元件260及機器翻譯元件270)中之一者已將語言輸入翻譯成錨定語言,則可以與上文詳細描述相同之方式向語言理解元件221提供彼翻譯輸入,因為彼翻譯輸入之語言係與上文之描述中之輸入相同之錨定語言。此外,既存應用程式架構220應(諸如)經由語言產生元件224產生輸出,向語言理解元件221提供經翻譯輸入之機器翻譯元件亦可接收由語言產生元件224產生之輸出並可將該輸出翻譯回本國語言以用於呈現給外國使用者250。更具體地,且如熟習此項技術者將認識到,機器翻譯技術可自一個應用程式雙向地翻譯至另一應用程式,且反之亦然。因此,在接收由語言產生元件224產生之輸出後,機器翻譯元件240、機器翻譯元件260及機器翻譯元件270中之適當的一個機器翻譯元件可自語言產生元件224提供此輸出之錨定語言翻譯至本國語言(亦即由外國使用者250使用之本國語言)以便首先提供輸入。
由機器翻譯元件240、機器翻譯元件260及機器翻譯元件270中之一個機器翻譯元件翻譯輸出,可將輸出提供至可以與上文詳細描述之輸出產生元件212類似的方式操作之對應輸出產生元件242、輸出產生元件262及輸出產生元件272。如熟習此項技術者將認識到,若輸出產生元件不過是非常基本之文字至語音元件,則可能不需要針對特定語言之輸出產生元件。然而,此非常基本之文字至語音元件可能不能夠準確地用語言表達語音輸出之某些態樣且可能不能夠適應 使用獨特聲音的語言。因此,第2圖之系統200圖示輸出產生元件242、輸出產生元件262及輸出產生元件272,輸出產生元件242、輸出產生元件262及輸出產生元件272係語言特定的,從而使能調整每一輸出產生元件以再現每一輸出產生元件所關聯之語言。
第2圖之系統200圖示其中電腦可執行指令的單一收集可接受來自講多個不同語言的外國使用者之輸入的實施例,即多語言混合應用程式。作為實例,若既存應用程式架構220為英語應用程式或程序的部分,則第2圖之系統200圖示其中電腦可執行指令的單一收集同樣可能接受法語、漢語及***語之輸入的實施例。法語輸入同樣可由語言識別元件230識別並可能被導向(例如)輸入識別元件241,且隨後導向可在法語及錨定語言(即在本實例中為英語)之間翻譯的對應機器翻譯元件240。同樣地,漢語輸入同樣可由語言識別元件230識別,且繼續進行本實例,漢語輸入可能被導向輸入識別元件261,且隨後導向可用於在漢語及英語之間翻譯的機器翻譯元件260。同樣地,再次作為實例,***語輸入可被導向輸入識別元件271及機器翻譯元件270。
然而,在另一實施例中,每一單一應用程式或程序可導向至僅一種特定語言,即單一語言混合應用程式。在此實施例中,可移除語言識別元件230,因可移除除機器翻譯元件及相關聯輸入識別及輸出產生元件中之一者外的所有元件。舉例而言,若使用為說英語的人構建之既存應用程式架構220來為說法語的人構建應用程式,則此應用程式可能包 含單一輸入識別元件及單一機器翻譯元件,該單一輸入識別元件可接受法語輸入並將法語輸入轉換成法語的基於文本之語言輸入,該單一機器翻譯元件可將彼法語的基於文本之語言輸入翻譯成英語的基於文本之語言輸入,以提供至語言理解元件221。同樣地,單一機器翻譯組件可將在某種程度上由既存應用程式架構220產生之任意英語輸出翻譯成法語,並向單一法語輸出產生元件提供彼經翻譯法語輸出。以此方式,可降低應用程式或程序之複雜性及尺寸,但每一此單一語言應用程式或程序僅可在一種語言環境中操作。
如熟習此項技術者將認識到,在此項技術中熟知機器翻譯元件(諸如在第2圖之系統200中圖示之彼等機器翻譯元件),且機器翻譯元件為繼續研究及改進的主題。然而,在一個實施例中,預計諸如以上文詳細描述之方式使用之機器翻譯元件可經調整以在應用程式或程序之特定環境下提供更高準確性。舉例而言,經設計以向使用者提供對娛樂內容之存取之應用程式(諸如將在家庭娛樂計算裝置上執行之應用程式)可包含機器翻譯元件,該機器翻譯元件可經改進以包括與娛樂應用程式的冗詞相關性,娛樂應用程式可能不為現成機器翻譯元件的部分且可繼續發展,諸如新電視節目或電影使用之術語。同樣地,語言理解元件221、對話管理器222、知識源223及語言產生元件224可同樣地經改進以適應可能隨著機器翻譯元件之引入而出現的特定問題。舉例而言,機器翻譯組件可相較於在相關語言中將係同義詞之其他文字、術語或短語更準確地翻譯錨定語言中的某些文字、術 語或短語。在此情況下,彼等文字、術語或短語可藉由既存應用程式架構220接收優待。
在一個實施例中,第2圖之系統200圖示之混合應用程式(其中機器翻譯元件用於在本國語言與錨定語言之間翻譯,從而促進重複使用錨定語言之既存應用程式架構)可用作起始點,自該起始點產生與錨定語言不同之本國語言的單一語言應用程式或程序。轉向第3圖,圖中所示之系統300圖示自混合應用程式或程序示例性創建非混合單一語言應用程式或程序。首先,如由第3圖之系統300所圖示,輸入識別元件311可接收本國語言之輸入,並然後可向機器翻譯元件310提供輸入以翻譯成錨定語言,以便以諸如上文詳細描述之方式提供至既存應用程式架構220。
如先前所指示,對使用者之輸入的某些文字、短語及其他語言元件而言,機器翻譯元件310、既存應用程式架構220或上述之一些組合可經修改以更準確地解釋及回應彼等語言元件。在一個實施例中,代替修改機器翻譯元件310或既存應用程式架構220,為了解釋此等改進,可創建本國語言之新語言理解元件321、再次為本國語言之新對話管理器322、新知識源323及新語言產生元件324以解決此等修改及改進。隨著時間,經由隨後之反覆運算,語言理解元件321、對話管理器322、知識源323及語言產生元件324可繼續改進及擴大以最後在不求助於既存應用程式架構220的情況下能夠操作。在此情況下,將同樣地不再需要機器翻譯元件310,且因此用於本國語言之新應用程式或程序可不再為混合應用 程式或程序,諸如上文詳細描述之彼等應用程式或程序。替代地,用於本國語言之此新應用程式或程序可包含輸入識別元件310、語言理解元件321、對話管理器322、知識源323、語言產生元件324及輸出產生元件312,所有元件可直接在本國語言中操作。以此方式,重複使用既存應用程式架構220之混合應用程式或程序可已充當權宜之計或臨時構造,可經由隨後之反覆運算自該權宜之計或臨時構造產生非混合單一語言應用程式或程序,在反覆運算期間,基於現實生活之使用及回饋而開發及改進本國語言之單一語言元件。
轉向第4圖,圖中所示之流程圖400圖示一系列示例性步驟,藉由該等步驟,可重複使用錨定語言之既存應用程式之語言元件以提供不同於錨定語言之一或更多種本國語言之語言功能。舉例而言,在一個實施例中,第4圖中所示之流程圖400之示例性步驟可由服務執行,可向應用程式或程序開發者提供該服務以使得開發者有效地創建開發者之應用程式或程序的版本,該版本可接受不同於錨定語言之一或更多種本國語言的語言輸入,彼等開發者最初以錨定語言創建開發者之應用程式或程序。如圖所示,在步驟410處,錨定語言之既存單一語言程序或應用程式可用作起始點,諸如將向服務提供之輸入。隨後,在步驟420處,在自步驟410接收或存取既存單一語言程序後,可安裝語言識別元件,該語言識別元件可接受除錨定語言外之語言之輸入,並可識別提供輸入之此等語言並可選擇適當之機器翻譯元件。如先前所指示,在一個實施例中,若創建混合應用程式或程序以接 受除錨定語言外之僅單一語言之輸入,則步驟420係可任選的,因為僅可使用一個機器翻譯元件,即用於在錨定語言與混合應用程式或程序將被導向之單一其他語言之間翻譯的機器翻譯元件。
在步驟430處,可安裝一或更多個機器翻譯元件,該一或更多個機器翻譯元件可在錨定語言與不同於錨定語言之一或更多種本國語言之間翻譯,在該錨定語言環境下創建自步驟410的單一語言程序,可以該一或更多種本國語言接受輸入且視情況可提供輸出。若在步驟430處安裝多個機器翻譯元件,則在步驟430處安裝之機器翻譯元件可在錨定語言與可由在步驟420處安裝之語言識別元件識別的彼等本國語言之間翻譯。
隨後,在步驟440處,可安裝對應於在步驟430處安裝之機器翻譯元件的輸入識別及輸出產生元件。如先前所指示,輸入識別元件可接受各種形式之語言輸入(諸如話音語言輸入之音訊),並可識別此等形式,並將此等形式轉換成基於文本之語言輸入。然後,可將此基於文本之語言輸入提供至進一步程序,諸如(例如)機器翻譯元件。亦如先前所指示,輸入識別元件(諸如在步驟440處安裝之彼等輸入識別元件)可為語言特定的,因為經設計以識別一種語言之語言輸入的輸入識別元件將僅能夠準確地識別彼一種語言的此語言輸入。因此,直至此等元件操作之語言環境為止,在步驟440處安裝之輸入識別元件可對應於在步驟430處安裝之機器翻譯元件。因此,若在步驟430處安裝用於一組特定 語言之機器翻譯元件,則在步驟440處,可安裝用於彼等相同語言之輸入識別元件。
如先前所指示,輸出產生元件可接受基於文本之語言輸出,且可以可諸如(例如)藉由說出語言輸出而由使用者接受之方式產生彼輸出。儘管輸出產生元件可為語言中性係可能的,但此等輸出產生元件可為次佳的。因此,在一個實施例中,預計,在步驟440處,可安裝語言特定之輸出產生元件,該等語言特定之輸出產生元件對應於亦在步驟440處安裝之輸入識別元件的語言。
隨後,在步驟450處,在步驟430處安裝之機器翻譯元件可以以下方式與在步驟440處安裝之輸入識別及輸出產生元件通訊耦合:接收特定語言之語言輸入之輸入識別元件與可在此語言與錨定語言之間翻譯的機器翻譯元件通訊耦合;及產生特定語言之語言輸出的輸出產生元件與可在彼語言與錨定語言之間翻譯的機器翻譯元件通訊耦合。在步驟460處,在步驟430處安裝之機器翻譯元件可與步驟410之既存單一語言程序或應用程式的語言元件通訊耦合。詳言之,在步驟430處安裝之機器翻譯元件可向既存單一語言程序或應用程式的此等語言元件提供語言輸入,該語言輸入自提供此語言輸入之本國語言翻譯成錨定語言。同樣地,在步驟430處安裝之機器翻譯元件中可視情況自既存單一語言應用程式或程序的此等語言元件接收錨定語言之語言輸出,然後機器翻譯元件可將該語言輸出翻譯成本國語言。
如由第2圖之系統200所圖示,由步驟420至步驟 460執行之安裝及通訊耦合可將既存單一語言應用程式或程序(諸如在步驟410處之彼輸入)轉換成混合應用程式或程序,該混合應用程式或程序可接受不同於錨定語言之一或更多種本國語言之輸入,並可視情況提供彼等相同本國語言之輸出。因此,可在步驟470處結束第4圖中所圖示之流程圖400之相關處理。
轉向第5圖,圖中所示之流程圖500可圖示一系列示例性步驟,該等步驟可由混合應用程式或程序執行,混合應用程式或程序可接受輸入且可視情況提供一或更多種本國語言之輸出,同時重複使用不同於彼等本國語言之錨定語言之語言元件。首先,在步驟510處,如圖所示,可以本國語言接收語言輸入。隨後,在步驟515處,可在步驟510處識別接收語言輸入之本國語言。可在步驟520處使用彼識別以選擇輸入識別元件,可將在步驟510處接收之語言輸入導向該輸入識別元件。詳言之,在步驟520處選擇之輸入識別元件可為如在步驟550處所識別的、經設計以識別本國語言之輸入的輸入識別元件。然後,在步驟525處,選擇之輸入識別元件可識別來自步驟510之語言輸入,並將語言輸入轉換成基於文本之語言輸入。
在步驟530處,可向機器翻譯元件提供基於文本之語言輸入,該機器翻譯元件能夠在如在步驟515處所識別的、在步驟510處接收的語言輸入的本國語言與錨定語言之間翻譯。在步驟535處,機器翻譯元件可將最初提供此語言輸入的本國語言的基於文本之語言輸入翻譯成錨定語言。隨後, 在步驟540處,可將現為錨定語言之經翻譯文本提供至最初以錨定語言產生之既存應用程式或程序之語言元件。然後可如先前所指示表示大量時間及資源投入的彼等既存語言元件可處理在步驟540處以錨定語言提供之輸入,並可產生適當之回應。
在步驟545處,來自既存語言元件之回應可以錨定語言接收並可在步驟550處,自錨定語言翻譯成在步驟510處接收語言輸入之本國語言。在步驟555處,可將經翻譯回應提供至與本國語言相關聯之輸出產生元件。舉例而言,如先前所指示,此輸出產生元件可為可用語言表達經翻譯回應之文字至語音元件。如熟習此項技術者將認識到,此文字至語音元件可為語言特定的以便捕捉特定話音語言之細微差別,並為使用者提供更準確之輸出以便接收。因此,在步驟555處,可選擇之輸出產生元件可為提供所需要語言之輸出的輸出產生元件,在步驟510處接收之語言輸入以該所需要語言接收。在步驟560處,可由輸出產生元件產生輸出,並可將該輸出提供至使用者。然後,可在步驟565處結束相關處理。
轉向第6圖,圖中所圖示之流程圖600圖示一系列示例性步驟,可執行該等步驟以創建單一語言程序,該單一語言程序可接受輸入並視情況提供本國語言之輸出,可自混合程序創建此單一語言程序,該混合程序連同在錨定語言與本國語言之間翻譯之機器翻譯元件重複使用最初以錨定語言創建之既存語言元件。最初,在步驟610處,可能已經諸如 (例如)藉由第4圖之流程圖400之步驟創建此混合程序。隨後,作為混合程序之執行的部分,可(諸如)在步驟650處接收本國語言之語言輸入。在步驟620處,混合程序可識別語言輸入,並將語言輸入(諸如)以上文所詳細描述之方式轉換成基於文本之語言輸入。
在步驟625處,可判定本國語言之語言理解元件是否可恰當地處理在步驟620處產生之基於文本之語言輸入。若在本國語言中操作之此語言理解元件不能恰當地處理此語言輸入,則處理可繼續進行至上文詳細描述之步驟530至步驟555。隨後,在執行步驟530至步驟555後,處理可返回至步驟630,在步驟630中,關於至由步驟530至步驟555執行之處理中之接收之語言輸入的資訊可用於改進語言理解元件、對話管理器及以本國語言實施之其他類似語言元件。然後,處理可繼續進行步驟645,在步驟645中,可以本國語言向使用者呈現或輸出由步驟530至步驟555產生之回應。
然而,若在步驟625處,判定本國語言之語言處理元件可適當地處理語言輸入,則替代地,處理可繼續進行至步驟635,在步驟635中,在不需要本國語言與錨定語言之間的任意機器翻譯的情況下,可以本國語言向語言理解元件提供基於文本之語言輸入。隨後,在步驟640處,可自類似於語言理解元件在本國語言環境下操作的語言產生元件接收回應。在步驟645處,如先前所指示,可向使用者輸出此本國語言回應。在一個實施例中,在步驟650處,可對由混合程序重複使用之錨定語言之既存語言元件事實上是否仍在使用 而執行檢查。若在步驟650處,判定此等錨定語言語言元件仍正被使用,則處理可返回至步驟615以接收進一步語言輸入。然而,若判定在步驟650處在錨定語言環境下操作之語言元件不再被使用,則在一個實施例中,在步驟655處,可自混合應用程式或程序捨棄彼等語言元件,僅留下在本國語言環境下操作之單一語言應用程式或程序,如在步驟660處所圖示。
如可自上述描述看出,已呈現以下機制,該等機制用於重複使用既存語言元件以藉由使用在此等語言與既存元件的語言之間翻譯的機器翻譯元件而處理除此等既存語言元件操作之環境的語言外的語言的語言輸入及視情況輸出。鑒於本文中所述之標的之許多可能變化,吾人主張我們發明之全部此等實施例在以下申請專利範圍及以下申請專利範圍之等效物之範疇內。
150‧‧‧使用者
200‧‧‧系統
211‧‧‧輸入識別元件
212‧‧‧輸出產生元件
220‧‧‧既存應用程式架構
221‧‧‧語言理解元件
222‧‧‧對話管理器
223‧‧‧知識源
224‧‧‧語言產生元件
230‧‧‧語言識別元件
240‧‧‧機器翻譯組件
241‧‧‧輸入識別元件
242‧‧‧輸出產生元件
250‧‧‧外國使用者
260‧‧‧機器翻譯元件
261‧‧‧輸入識別元件
262‧‧‧輸出產生元件
270‧‧‧機器翻譯元件
271‧‧‧輸入識別元件
272‧‧‧輸出產生元件

Claims (24)

  1. 一種電腦可讀取儲存媒體,該一或更多個電腦可讀取媒體包含用於提供語言服務之電腦可執行指令,該等電腦可執行指令導向包含以下步驟之步驟:自一使用者接收一第一語言之語言輸入;藉由識別該經接收語言輸入產生該第一語言的一基於文本之語言輸入;利用機器翻譯以將該基於文本之語言輸入自該第一語言翻譯成不同於該第一語言之一第二語言;向提供語言服務之既存元件提供該第二語言之該經翻譯的基於文本之語言輸入,該等既存元件在該第二語言的該環境下操作;自該等既存元件接收回應於該語言輸入之輸出,該輸出以該第二語言提供;利用該機器翻譯將該第二語言之該輸出翻譯成該第一語言;根據該第一語言之該經翻譯輸出產生該使用者可接收之輸出。
  2. 如請求項1所述之電腦可讀取儲存媒體,其中由該使用者藉由該使用者正以該第一語言發言來輸入該語言輸入。
  3. 如請求項1所述之電腦可讀取儲存媒體,其中用於產生可由該使用者接收之該輸出的該等電腦可執行指令包含文字至語音電腦可執行指令。
  4. 如請求項1所述之電腦可讀取儲存媒體,進一步包含導向以下步驟之電腦可執行指令:識別該第一語言與該接收的語言輸入,並選擇用於執行該產生該基於文本的語言輸入步驟的一輸入識別元件及基於該經識別之第一語言的一機器翻譯元件。
  5. 如請求項4所述之電腦可讀取儲存媒體,進一步包含至少兩個機器翻譯元件,該至少兩個機器翻譯元件中的至少一個用於將該基於文本的語言輸入自該第一語言翻譯成該第二語言。
  6. 如請求項1所述之電腦可讀取儲存媒體,進一步包含提供語言服務的元件,該等元件在該第一語言的該環境下操作,且該等元件與提供語言服務的、在該第二語言的該環境下操作的該等元件類似。
  7. 如請求項6所述之電腦可讀取儲存媒體,其中提供語言服務的、在該第二語言的該環境下操作的該等元件及該機器翻譯作為用於提供語言服務的、在該第一語言的該環境下操作的該等元件的該產生步驟的一起始點。
  8. 如請求項1所述之電腦可讀取儲存媒體,其中該機器翻譯經修改以解釋針對由該等電腦可執行指令提供的一功能的語言元素。
  9. 如請求項1所述之電腦可讀取儲存媒體,其中該等既存元件經修改以解釋針對由該等電腦可執行指令提供的一功能的語言元素。
  10. 一種電腦可讀取儲存媒體,該一或更多個電腦可讀取媒體包含用於修改一已經存在之程序以提供不同於一第一語言的至少一第二語言的語言服務的電腦可執行指令,該已經存在之程序提供該第一語言之語言服務,該等電腦可執行指令導向包含以下步驟之步驟:獲取該已經存在之程序的既存元件,該等既存元件提供該第一語言之語言服務;將在該第一語言與該第二語言之間翻譯的一機器翻譯元件通訊耦合至該等既存元件,該等既存元件與該機器翻譯元件之間的該通訊耦合提供以該第二語言接收的一基於文本的輸入,該基於文本的輸入將由該機器翻譯元件翻譯成該第一語言,且然後提供至該等既存元件,且該通訊耦合提供由該等既存元件產生的該第一語言的輸出,該輸出將由該機器翻譯元件接收並翻譯成該第二語言; 將一輸入識別元件通訊耦合至該機器翻譯元件以提供以該第二語言接收之輸入,該輸入將由該輸入識別元件識別成該基於文本的輸入,並提供至該機器翻譯元件;及將一輸出產生元件通訊耦合至該機器翻譯元件以提供該第二語言之經翻譯輸出,該經翻譯輸出將由該機器翻譯元件提供至輸出產生元件,並以提供該輸入之一使用者可接收的一方式輸出至該使用者。
  11. 如請求項10所述之電腦可讀取儲存媒體,其中以該第二語言接收之該輸入為使用該第二語言說出的一話音輸入。
  12. 如請求項10所述之電腦可讀取儲存媒體,其中該輸出產生元件為一文字至語音元件。
  13. 如請求項10所述之電腦可讀取儲存媒體,進一步包含用於以下步驟之電腦可執行指令:將一語言識別元件通訊耦合至該輸入識別元件,該語言識別元件接收該第二語言之該輸入;識別提供該輸入之一語言;及在將提供該輸入之該語言識別為該第二語言時將該輸入導向該輸入識別元件。
  14. 如請求項13所述之電腦可讀取儲存媒體,進一步包含用於以下步驟之電腦可執行指令:將一第二機器翻譯元件通訊耦合至該等既存元件,該第二機器翻譯元件在該第一語言與一第三語言之間翻譯;將一第二輸入識別元件通訊耦合至該第二機器翻譯元件;及 將該語言識別元件通訊耦合至該第二輸入識別元件,在將提供該輸入之該語言識別為該第三語言時該語言識別元件將該輸入導向該第二輸入識別元件。
  15. 如請求項10所述之電腦可讀取儲存媒體,進一步包含電腦可執行指令,該等電腦可執行指令用於修改該機器翻譯元件以解釋針對由該已經存在的程序提供的一功能的語言元素。
  16. 如請求項10所述之電腦可讀取儲存媒體,進一步包含電腦可執行指令,該等電腦可執行指令用於修改該等既存元件以解釋針對由該已經存在的程序提供的一功能的語言元素。
  17. 一種用於產生一程序的方法,該程序自一已經存在的程序在一第一應用程式中提供語言服務,該已經存在的程序提供不同於該第一語言的一第二語言之該等服務,該方法包含以下步驟:產生一混合程序以作為一起始點,該混合程序包含:該已經存在程序的既存元件,該等既存元件提供該第二語言之語言服務;一機器翻譯元件,該機器翻譯元件在該第一語言與該第二語言之間翻譯;一輸入識別元件,該輸入識別元件將以該第一語言接收之語言輸入識別成基於文本的語言輸入;及一輸出產生元件,該輸出產生元件以該使用者可接收之一方式產生該第一語言之輸出; 產生提供該第一語言之語言服務的元件,該等元件與提供該第二語言的語言服務的既存元件類似;基於接收之輸入及由該產生之混合程序執行的回應處理來改進提供該第一語言之該等語言服務之該等產生元件;及用提供該第一語言之該等語言服務的該等產生及改進元件替換該等既存元件及該機器翻譯元件。
  18. 如請求項17所述之方法,其中該混合程序進一步包含識別一語言之一語言識別元件,向該混合程序提供該語言之輸入。
  19. 如請求項17所述之方法,其中該改進提供該第一語言之語言服務之該等產生元件的步驟包含:將在由正產生之該程序提供的一功能的一環境內出現的新語言元素併入該等產生元件。
  20. 如請求項17所述之方法,其中由正產生之該程序提供的該等語言服務包含回應於以該第一語言說出的話音輸入。
  21. 一種用於提供語言服務之系統,該系統包含:既存元件,該等既存元件提供在一第二語言的環境下操作之語言服務,該等既存元件提供該第二語言的語言輸入,且產生回應於該語言輸入的輸出以作為回應,以該第二語言提供該輸出;一輸入識別元件,該輸入識別元件接收來自一使用者以一第一語言的語言輸入,且藉由識別該經接收語言輸入產生 該第一語言的一基於文本之語言輸入,該第一語言與該第二語言相異;一機器翻譯元件,該機器翻譯元件將由該輸入識別元件所產生的該基於文本之語言輸入自該第一語言翻譯成該第二語言,且進一步將以該第二語言提供之由該等既存元件所產生的該輸出翻譯成該第一語言;及一輸出產生元件,該輸出產生元件根據來自該機器翻譯元件的該第一語言之該經翻譯輸出產生該使用者可接收之輸出。
  22. 如請求項21所述之系統,進一步包含一語言識別元件,該語言識別元件接收該第一語言的該語言輸入,識別提供該語言輸入的一語言,且在將提供該語言輸入之該語言識別為該第一語言時將該語言輸入導向該輸入識別元件。
  23. 如請求項22所述之系統,進一步包含:一第二輸入識別元件,該第二輸入識別元件接收一第三語言的該語言輸入,且藉由識別該第三語言的該經接收語言輸入產生該第三語言的一基於文本之語言輸入,該第三語言與該第一及該第二語言皆相異;一第二機器翻譯元件,該第二機器翻譯元件將由該第二輸入識別元件所產生的該第三語言的該基於文本之語言輸入自該第三語言翻譯成該第二語言,且進一步將由該等既存元 件所產生且以該第二語言提供之的該輸出翻譯成該第三語言;及一第二輸出產生元件,該第二輸出產生元件根據來自該第二機器翻譯元件的該第三語言之該經翻譯輸出產生該使用者可接收之輸出;其中在該語言識別元件將以該第三語言提供的該語言輸入之該語言識別為該第三語言時,該語言識別元件將該第三語言的語言輸入導向該第二輸入識別元件。
  24. 如請求項21所述之系統,進一步包含提供語言服務的元件,該等元件在該第一語言的該環境下操作,且該等元件與提供語言服務的、在該第二語言的該環境下操作的該等既存元件類似;其中提供語言服務的、在該第二語言的該環境下操作的該等既存元件及該機器翻譯元件作為用於提供語言服務的、在該第一語言的該環境下操作的該等元件的產生的一起始點。
TW102114033A 2012-05-10 2013-04-19 從既存之單一語言程序建立多重語言程序 TWI585681B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US13/469,078 US9098494B2 (en) 2012-05-10 2012-05-10 Building multi-language processes from existing single-language processes

Publications (2)

Publication Number Publication Date
TW201403471A TW201403471A (zh) 2014-01-16
TWI585681B true TWI585681B (zh) 2017-06-01

Family

ID=48468775

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102114033A TWI585681B (zh) 2012-05-10 2013-04-19 從既存之單一語言程序建立多重語言程序

Country Status (7)

Country Link
US (1) US9098494B2 (zh)
EP (1) EP2847689A2 (zh)
JP (1) JP6595912B2 (zh)
KR (1) KR102092426B1 (zh)
CN (1) CN104412260B (zh)
TW (1) TWI585681B (zh)
WO (1) WO2013169530A2 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9503504B2 (en) * 2014-11-19 2016-11-22 Diemsk Jean System and method for generating visual identifiers from user input associated with perceived stimuli
US9690776B2 (en) * 2014-12-01 2017-06-27 Microsoft Technology Licensing, Llc Contextual language understanding for multi-turn language tasks
US9792560B2 (en) * 2015-02-17 2017-10-17 Microsoft Technology Licensing, Llc Training systems and methods for sequence taggers
US9886958B2 (en) 2015-12-11 2018-02-06 Microsoft Technology Licensing, Llc Language and domain independent model based approach for on-screen item selection
US10366690B1 (en) 2017-05-15 2019-07-30 Amazon Technologies, Inc. Speech recognition entity resolution
JP2019008570A (ja) * 2017-06-26 2019-01-17 ソニー株式会社 情報処理装置、情報処理方法及びプログラム
US11056116B2 (en) * 2018-04-11 2021-07-06 Google Llc Low latency nearby group translation
JP7434978B2 (ja) 2020-02-10 2024-02-21 トヨタ自動車株式会社 情報処理装置、情報処理方法、及び、プログラム
US11587362B2 (en) * 2020-12-16 2023-02-21 Lenovo (Singapore) Pte. Ltd. Techniques for determining sign language gesture partially shown in image(s)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100131262A1 (en) * 2008-11-27 2010-05-27 Nuance Communications, Inc. Speech Recognition Based on a Multilingual Acoustic Model
US20100174523A1 (en) * 2009-01-06 2010-07-08 Samsung Electronics Co., Ltd. Multilingual dialogue system and controlling method thereof
TW201216091A (en) * 2010-10-07 2012-04-16 Inventec Corp Apparatus for providing translation conversations between two users simultaneously and method thereof

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0176858B1 (en) * 1984-09-18 1993-01-20 Sharp Kabushiki Kaisha Translation system
JPS6471254A (en) * 1987-09-11 1989-03-16 Hashimoto Corp Automatic answering telephone system
US5477451A (en) * 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
KR100194798B1 (ko) * 1995-11-16 1999-06-15 이계철 개념 구조를 이용한 다국어 번역시스템에서 단일의미단어 통합 처리 방법
US5956740A (en) * 1996-10-23 1999-09-21 Iti, Inc. Document searching system for multilingual documents
JPH10198680A (ja) * 1997-01-07 1998-07-31 Hitachi Ltd 分散辞書管理方法及びそれを用いた機械翻訳方法
JP2000010999A (ja) * 1998-06-24 2000-01-14 Matsushita Electric Ind Co Ltd 翻訳通信装置
US6085160A (en) 1998-07-10 2000-07-04 Lernout & Hauspie Speech Products N.V. Language independent speech recognition
US6999932B1 (en) 2000-10-10 2006-02-14 Intel Corporation Language independent voice-based search system
JP4089148B2 (ja) * 2000-10-17 2008-05-28 株式会社日立製作所 通訳サービス方法および通訳サービス装置
GB2372864B (en) 2001-02-28 2005-09-07 Vox Generation Ltd Spoken language interface
US7043431B2 (en) 2001-08-31 2006-05-09 Nokia Corporation Multilingual speech recognition system using text derived recognition models
JP2005100335A (ja) * 2003-09-01 2005-04-14 Advanced Telecommunication Research Institute International 機械翻訳装置、機械翻訳コンピュータプログラム及びコンピュータ
US8249854B2 (en) * 2005-05-26 2012-08-21 Microsoft Corporation Integrated native language translation
US8090570B2 (en) * 2006-10-26 2012-01-03 Mobile Technologies, Llc Simultaneous translation of open domain lectures and speeches
DE102006057159A1 (de) 2006-12-01 2008-06-05 Deutsche Telekom Ag Verfahren zur Klassifizierung der gesprochenen Sprache in Sprachdialogsystemen
JP5121252B2 (ja) * 2007-02-26 2013-01-16 株式会社東芝 原言語による音声を目的言語に翻訳する装置、方法およびプログラム
US8909532B2 (en) 2007-03-23 2014-12-09 Nuance Communications, Inc. Supporting multi-lingual user interaction with a multimodal application
JP5239307B2 (ja) * 2007-11-20 2013-07-17 富士ゼロックス株式会社 翻訳装置及び翻訳プログラム
WO2009129315A1 (en) * 2008-04-15 2009-10-22 Mobile Technologies, Llc System and methods for maintaining speech-to-speech translation in the field
KR20100037813A (ko) * 2008-10-02 2010-04-12 삼성전자주식회사 통계적 자동 번역 장치 및 방법
US8554558B2 (en) * 2010-07-12 2013-10-08 Nuance Communications, Inc. Visualizing automatic speech recognition and machine translation output
US9646001B2 (en) 2011-09-19 2017-05-09 Nuance Communications, Inc. Machine translation (MT) based spoken dialog systems customer/machine dialog
JP5712150B2 (ja) 2012-02-22 2015-05-07 株式会社ゼンリンデータコム 検索サーバ装置、情報検索方法および情報検索プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100131262A1 (en) * 2008-11-27 2010-05-27 Nuance Communications, Inc. Speech Recognition Based on a Multilingual Acoustic Model
US20100174523A1 (en) * 2009-01-06 2010-07-08 Samsung Electronics Co., Ltd. Multilingual dialogue system and controlling method thereof
TW201216091A (en) * 2010-10-07 2012-04-16 Inventec Corp Apparatus for providing translation conversations between two users simultaneously and method thereof

Also Published As

Publication number Publication date
KR20150005608A (ko) 2015-01-14
TW201403471A (zh) 2014-01-16
WO2013169530A3 (en) 2014-03-13
WO2013169530A2 (en) 2013-11-14
JP2015523623A (ja) 2015-08-13
KR102092426B1 (ko) 2020-03-23
CN104412260B (zh) 2018-09-21
US20130304451A1 (en) 2013-11-14
EP2847689A2 (en) 2015-03-18
CN104412260A (zh) 2015-03-11
JP6595912B2 (ja) 2019-10-23
US9098494B2 (en) 2015-08-04

Similar Documents

Publication Publication Date Title
TWI585681B (zh) 從既存之單一語言程序建立多重語言程序
JP7259197B2 (ja) モデルトレーニング方法、音声合成方法、装置、電子機器、記憶媒体およびコンピュータプログラム
US10496759B2 (en) User interface for realtime language translation
US10489112B1 (en) Method for user training of information dialogue system
US9620122B2 (en) Hybrid speech recognition
JP7111682B2 (ja) 非表音文字体系を使用する言語のための音声支援型アプリケーションプロトタイプの試験中の音声コマンドマッチング
EP2601596B1 (en) Translating languages
US11295092B2 (en) Automatic post-editing model for neural machine translation
JP2016009193A (ja) ユーザ適合音声認識
WO2015023365A1 (en) User interface for realtime language translation
US10699712B2 (en) Processing method and electronic device for determining logic boundaries between speech information using information input in a different collection manner
JP6150268B2 (ja) 単語登録装置及びそのためのコンピュータプログラム
US20220415305A1 (en) Speech generation using crosslingual phoneme mapping
CN115039171A (zh) 使用有效文字标准化的语言无关的多语言建模
JP6090785B2 (ja) テキストデータ分割装置、テキストデータ分割方法、テキストデータ分割プログラム及び翻訳装置
JP2002351652A (ja) 音声認識操作支援システム、音声認識操作支援方法、および、音声認識操作支援プログラム
CN111104118A (zh) 一种基于aiml的自然语言指令执行方法及***
US20230097338A1 (en) Generating synthesized speech input
CN112567456A (zh) 学习辅助工具

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees