TWI634439B - 翻譯文件的媒合系統 - Google Patents

翻譯文件的媒合系統 Download PDF

Info

Publication number
TWI634439B
TWI634439B TW106135683A TW106135683A TWI634439B TW I634439 B TWI634439 B TW I634439B TW 106135683 A TW106135683 A TW 106135683A TW 106135683 A TW106135683 A TW 106135683A TW I634439 B TWI634439 B TW I634439B
Authority
TW
Taiwan
Prior art keywords
language
translation
database
category
file
Prior art date
Application number
TW106135683A
Other languages
English (en)
Other versions
TW201917604A (zh
Inventor
陳智偉
吳雋偉
Original Assignee
統一數位翻譯股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 統一數位翻譯股份有限公司 filed Critical 統一數位翻譯股份有限公司
Priority to TW106135683A priority Critical patent/TWI634439B/zh
Application granted granted Critical
Publication of TWI634439B publication Critical patent/TWI634439B/zh
Publication of TW201917604A publication Critical patent/TW201917604A/zh

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本發明之一種翻譯文件的媒合系統包括至少一電子裝置及一後端伺服器,電子裝置包括一翻譯文件,且電子裝置以網路連線的方式連接至該後端伺服器。後端伺服器包括一語言辨識單元、一類別辨識單元、一指派人員資料庫、一翻譯師資料庫、一媒合單元、一原文資料庫及一比對單元。語言辨識單元依據翻譯文件的內容產生一語言分析結果。類別辨識單元包括一領域資料庫,類別辨識單元將翻譯文件與領域資料庫內的資料進行比對,以產生一類別分析結果。指派人員資料庫包括多個不同的指派人員的派案紀錄,派案紀錄用以統計該指派人員擅長分案的語言及領域類別。翻譯師資料庫包括多個不同的翻譯師的翻譯紀錄,翻譯紀錄具有所對應的翻譯師已翻譯過的語言及領域類別。媒合單元依據語言分析結果及類別分析結果媒合並統計同樣語言及同樣領域類別的派案紀錄及翻譯紀錄。

Description

翻譯文件的媒合系統
本發明提供一翻譯文件的媒合系統,特別是一種具有語言辨識單元、類別辨識單元及比對單元的媒合系統。
現今,翻譯接案最初的作業處理流程通常需要仰賴人工判斷的作業程序,「業務人員」先分配給適合的翻譯文件「指派人員」,「指派人員」再指派翻譯工作給適合的「翻譯師」。
詳細來說:承接翻譯案件的「業務人員」及「指派人員」必需要先對翻譯文件進行初步的判斷:判斷文件的語言別及專業領域類別。判斷的依據為客戶提供的資訊及判斷人員的學識、經驗。若客戶提供的資訊有錯誤或判斷人員的學識、經驗不足,就有可能判斷錯誤。判斷錯誤會造成指派的「翻譯師」不適當。詳細來說,每位「翻譯師」都有其真正擅長翻譯的文件類型,若「翻譯師」硬接不擅長的文件類型時,除了會需要花更多的時間、心力進行翻譯外,翻譯的品質也容易出問題。此外,就算文件判斷正確,能否指派文件給最適合的「翻譯師」,也會因「指派人員」處理這類文件的經驗而受影響,若由經驗較不足的「指派人員」來處理,產生問題的機會也會比較高。
另外,當有大量或有時間壓力的翻譯文件需要進行判斷時,處理人員也不容易在短時間內消化並正確判斷所有的文件。仰賴人工判斷的作業程序,除了 容易判斷錯誤外,指派翻譯工作的效率也不會太好,影響到翻譯案件的處理進度。
因此,如何建立一個自動化的翻譯文件媒合系統,來幫助不同類型的翻譯文件迅速且正確的找到適合之「指派人員」及「翻譯師」,便是本領域具有通常知識者值得去思量地。
本發明之目的在於提供一翻譯文件的媒合系統,該媒合系統能針對客戶送翻譯文件,進行「語言別」、「類別」辨識及「近似文件」比對,進而提供適合的「指派人員」、「翻譯師」及「近似文件」之推薦,提高內部處理流程的效率及正確性,降低成本,減少人為因素造成的損失。
本發明之一種翻譯文件的媒合系統包括至少一電子裝置及一後端伺服器,電子裝置包括一翻譯文件,且電子裝置以網路連線的方式連接至該後端伺服器。此外,後端伺服器包括一翻譯師資料庫、一語言辨識單元、一類別辨識單元及一媒合單元。其中,翻譯師資料庫包括多個不同的翻譯師的翻譯紀錄,翻譯紀錄具有所對應的翻譯師已翻譯過的語言及領域類別。語言辨識單元依據翻譯文件的內容產生一語言分析結果,而類別辨識單元包括一領域資料庫,類別辨識單元將翻譯文件與領域資料庫內的資料進行比對,以產生一類別分析結果。媒合單元依據該語言分析結果及類別分析結果媒合並統計同樣語言及同樣領域類別的翻譯紀錄,提供翻譯師推薦。
在上所述之翻譯文件的媒合系統,其中後端伺服器還包括一指派人員資料庫,該指派人員資料庫包括多個不同的指派人員的派案紀錄,派案紀錄用以統計該指派人員擅長分案的語言及領域類別。在上所述之翻譯文件的媒合系統,其中媒合單元依據該語言分析結果及該類別分析結果媒合並統計相同語言及相同領域類別的派案紀錄。提供指派人員推薦。
在上所述之翻譯文件的媒合系統還包括一原文資料庫及一比對單元,原文資料庫內儲存多個原文資料,每一個原文資料具有一相對應的翻譯師資料及一相對應的指派人員資料。比對單元將翻譯文件與每一個原文資料進行比對,依近似程度,提供相似文件推薦。
在上所述之翻譯文件的媒合系統,其中該電子裝置還包括一顯示介面,且該語言分析結果及該類別分析結果被傳送至該顯示介面。
在上所述之翻譯文件的媒合系統,其中顯示介面包括一學習反饋機制,學習反饋機制依據一使用者傳送一反饋訊息至類別辨識單元,再將一學習資訊匯入該領域資料庫。
為讓上述特徵和優點能更明顯易懂,下文特舉較佳實施例,並配合所附圖式,作詳細說明如下。
1、2‧‧‧翻譯文件的媒合系統
10‧‧‧後端伺服器
101、201‧‧‧翻譯師資料庫
101D‧‧‧翻譯紀錄
102‧‧‧語言辨識單元
102A‧‧‧語言分析結果
103‧‧‧類別辨識單元
103B‧‧‧領域資料庫
103A‧‧‧類別分析結果
104‧‧‧媒合單元
201D‧‧‧翻譯紀錄
305‧‧‧指派人員資料庫
305D‧‧‧派案紀錄
403‧‧‧比對單元
405‧‧‧原文資料庫
405A‧‧‧原文資料
405B‧‧‧翻譯師資料
405C‧‧‧指派人員資料
12‧‧‧電子裝置
120‧‧‧翻譯文件
121‧‧‧顯示介面
121R‧‧‧學習反饋機制
1212‧‧‧反饋訊息
圖1所繪示為本實施例之翻譯文件的媒合系統1的表格示意圖。
圖2所繪示為顯示介面121的示意圖。
圖3所繪示為另一實施例之翻譯文件的媒合系統2的表格示意圖。
請參閱圖1,圖1所繪示為本實施例之翻譯文件的媒合系統1的表格示意圖。翻譯文件的媒合系統1包括至少一電子裝置12及一後端伺服器10。其中,電子裝置12包括一翻譯文件120及一顯示介面121,電子裝置12例如為桌上型電腦、筆記型電腦、平板電腦及智慧型手機,而翻譯文件120便是新客戶的翻譯案件,也就是尚未分案給「指派人員」及「翻譯師」的文件。此外,電子裝置12是以網路連線的方式連接至後端伺服器10,後端伺服器10包括一翻譯師資料庫101、一語言辨識單元102、類別辨識單元103及一媒合單元104。其中,翻譯師資料庫101包括多個不同的翻譯紀錄101D,翻譯紀錄101D是記錄著所對應的翻譯師已經翻 譯過的語言及領域類別。詳細來說,每一個翻譯紀錄101D是對應到一個翻譯師(不同的翻譯紀錄101D分別對應到翻譯師A、翻譯師B及翻譯師C),而每一個翻譯師都有擅長翻譯的“語言”及“領域類別”。其中,常見『語言』,例如:中文、英文、日文、韓文...等,『領域類別』指的是翻譯文件120所屬的專業領域,例如:電子、機械、電腦、化學、電機、通信、物理...等。此外,語言辨識單元102是利用各語言的特徵來分析翻譯文件120的內容,以決定翻譯文件120所屬的“語言”。舉例來說,若翻譯文件120的文字編碼、使用的標點符號、句構…等特徵屬於繁體中文時,則語言辨識單元102會判定這個翻譯文件120所屬的『語言』為“繁體中文”。語言分析結果102A會被傳送至顯示介面121。例如圖2中所顯示的繁體中文的比例佔整個文件的95.9%、英文的比例佔整個文件的4.1%。這樣一來,該使用者也能透過顯示介面121了解翻譯文件120的語言組成。
另外,類別辨識單元103包括一領域資料庫103B,領域資料庫103B內會儲存屬於各種不同專業領域的範本資料集,這些範本資料集的來源主要是維基百科,下載原始資料後,先經分類,再經文字探勘技術的分析整理,完成不同專業領域的範本資料集。類別辨識單元103將翻譯文件120與領域資料庫103B內的資料進行比對分析,以產生一類別分析結果103A。類別分析結果103A會依翻譯文件120與各領域相似的比例顯示,例如圖2所顯示的通信/網路領域所佔的比例為39.8%、運輸所佔領域的比例為20.9%、電腦/資訊科技領域所佔的比例為20.2%、電機領域所佔的比例為19.1%。類別分析結果103A同樣會被傳送至顯示介面121,這樣一來,使用者也能透過顯示介面121了解翻譯文件120的主要專業領域類別。
另外,翻譯文件的媒合系統1的後端伺服器10更包括一指派人員資料庫305。其中,指派人員資料庫305包括多個不同的指派人員的派案紀錄305D,派案紀錄305D是用以統計指派人員擅長分案的屬性。詳細來說,每一個派案紀錄 305D是對應到一個指派人員(不同的派案紀錄305D分別對應到指派人員D、指派人員E及指派人員F),該屬性也是類指翻譯文件120的『語言』及『類別』。因此,媒合單元依據語言分析結果102A及類別分析結果103A媒合並統計相同語言及相同領域類別的派案紀錄305D。這樣一來,不同的翻譯文件120便能快速找到適合的「指派人員」進行分案作業。
之後,媒合單元104依據該翻譯文件的『語言』及領域『類別』媒合並統計同樣語言及同樣領域類別的翻譯紀錄101D。因此,經由媒合而來的翻譯紀錄101D便能找出推薦的翻譯師(翻譯紀錄101D所對應的翻譯師)。如此一來,各種類型的翻譯文件120都能快速找到適合的「翻譯師」進行翻譯作業,以提高內部處理流程的效率及正確性,降低人為因素的損失。
請參閱圖2,顯示介面121還具有一學習反饋機制121R,學習反饋機制121R依據一使用者傳送一反饋訊息1212至類別辨識單元103,再將一學習資訊匯入領域資料庫103B。其中,反饋訊息1212例如為「正確」、「錯誤」或「不確定」。如此一來,學習反饋機制121R便能幫助類別辨識單元103進行自我學習,以提高之後辨識翻譯文件120所屬專業領域類別的正確率。
請參閱圖3,圖3所繪示為又一實施例之翻譯文件的媒合系統2的表格示意圖。翻譯文件的媒合系統2是經由翻譯文件的媒合系統1所演化而來,翻譯文件的媒合系統2更包括一原文資料庫405及一比對單元403。其中,原文資料庫405內儲存多個原文資料405A,且每一個原文資料405A具有一相對應的翻譯師資料405B及一相對應的指派人員資料405C。並且,比對單元403是用於比對每一個原文資料405A與翻譯文件120的近似程度,找出近似翻譯文件120的一筆或多筆原文資料405A,並可同時得知所對應的翻譯師資料405B及指派人員資料405C。找到的一筆或多筆近似原文資料405A,可供「業務人員」及「指派人員」利用:直接使用加上潤稿完成翻譯或提供給被指派到該翻譯文件的翻譯師參考或找近 似原文資料405A的原翻譯師405B來完成翻譯。找出近似的原文資料405A除了能夠幫助找到適合的翻譯師人選之外,也能減少需翻譯的字數,加快翻譯師作業的時間,節省翻譯成本。
雖然本發明已以較佳實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本發明之精神和範圍內,當可作些許之更動與潤飾,因此本發明之保護範圍當視後附之申請專利範圍所界定者為準。

Claims (5)

  1. 一種翻譯文件的媒合系統,包括:至少一電子裝置,包括一翻譯文件;及一後端伺服器,該電子裝置以網路連線的方式連接至該後端伺服器,該後端伺服器,包括:一翻譯師資料庫,包括多個不同的翻譯師的翻譯紀錄,該翻譯紀錄具有所對應的翻譯師已翻譯過的語言及領域類別;一語言辨識單元,該語言辨識單元依據該翻譯文件的內容產生一語言分析結果;一類別辨識單元,包括一領域資料庫,該類別辨識單元將翻譯文件與領域資料庫內的資料進行比對,以產生一類別分析結果;一媒合單元,該媒合單元依據該語言分析結果及該類別分析結果媒合並統計同樣語言及同樣領域類別的該翻譯紀錄;其中該後端伺服器還包括一指派人員資料庫,該指派人員資料庫包括多個不同的指派人員的派案紀錄,該派案紀錄用以統計該指派人員擅長分案的語言及領域類別。
  2. 如申請專利範圍第1項所述之翻譯文件的媒合系統,其中該媒合單元依據該語言分析結果及該類別分析結果媒合並統計相同語言及相同領域類別的該派案紀錄。
  3. 如申請專利範圍第1項所述之翻譯文件的媒合系統,還包括:一原文資料庫,該原文資料庫內儲存多個原文資料,每一個原文資料具有一相對應的翻譯師資料及一相對應的指派人員資料;一比對單元,該比對單元比對每一個原文資料與該翻譯文件的近似程度。
  4. 如申請專利範圍第1項所述之翻譯文件的媒合系統,其中該電子裝置還包括一顯示介面,且該語言分析結果及該類別分析結果被傳送至該顯示介面。
  5. 如申請專利範圍第4項所述之翻譯文件的媒合系統,其中該顯示介面包括一學習反饋機制,該學習反饋機制依據一使用者傳送一反饋訊息至類別辨識單元,再將一學習資訊匯入該領域資料庫。
TW106135683A 2017-10-18 2017-10-18 翻譯文件的媒合系統 TWI634439B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW106135683A TWI634439B (zh) 2017-10-18 2017-10-18 翻譯文件的媒合系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW106135683A TWI634439B (zh) 2017-10-18 2017-10-18 翻譯文件的媒合系統

Publications (2)

Publication Number Publication Date
TWI634439B true TWI634439B (zh) 2018-09-01
TW201917604A TW201917604A (zh) 2019-05-01

Family

ID=64453036

Family Applications (1)

Application Number Title Priority Date Filing Date
TW106135683A TWI634439B (zh) 2017-10-18 2017-10-18 翻譯文件的媒合系統

Country Status (1)

Country Link
TW (1) TWI634439B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140019113A1 (en) * 2012-07-13 2014-01-16 Microsoft Corporation Phrase-based dictionary extraction and translation quality evaluation
CN105138521A (zh) * 2015-08-27 2015-12-09 武汉传神信息技术有限公司 一种翻译行业风险项目通用推荐译员方法
TW201629796A (zh) * 2015-01-16 2016-08-16 Gurunavi Inc 資訊多語言轉換系統
TWM543395U (zh) * 2017-03-24 2017-06-11 shi-cheng Zhuang 翻譯輔助系統

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140019113A1 (en) * 2012-07-13 2014-01-16 Microsoft Corporation Phrase-based dictionary extraction and translation quality evaluation
TW201629796A (zh) * 2015-01-16 2016-08-16 Gurunavi Inc 資訊多語言轉換系統
CN105138521A (zh) * 2015-08-27 2015-12-09 武汉传神信息技术有限公司 一种翻译行业风险项目通用推荐译员方法
TWM543395U (zh) * 2017-03-24 2017-06-11 shi-cheng Zhuang 翻譯輔助系統

Also Published As

Publication number Publication date
TW201917604A (zh) 2019-05-01

Similar Documents

Publication Publication Date Title
US20190197119A1 (en) Language-agnostic understanding
US10891430B2 (en) Semi-automated methods for translating structured document content to chat-based interaction
US11914968B2 (en) Official document processing method, device, computer equipment and storage medium
US20160371246A1 (en) System and method of template creation for a data extraction tool
WO2021151270A1 (zh) 图像结构化数据提取方法、装置、设备及存储介质
US20190171873A1 (en) Cognitive document image digitization
US11727213B2 (en) Automatic conversation bot generation using input form
CN111512315A (zh) 文档元数据的按块提取
US10496751B2 (en) Avoiding sentiment model overfitting in a machine language model
US20200184584A1 (en) Systems and methods for legal clause matching and explanation
TWI743623B (zh) 基於人工智慧的商務智慧系統及其分析方法
CN111263943B (zh) 文档数字化中的语义规范化
US20200057799A1 (en) System and method for generating a proposal based on a request for proposal (rfp)
TW202134931A (zh) 一種自動生成數據採集模組的方法和系統
WO2019035280A1 (ja) 知的財産支援装置および知的財産支援方法並びに知的財産支援プログラム
CN112364145A (zh) 一种工单处理方法、装置、电子设备及存储介质
US11423219B2 (en) Generation and population of new application document utilizing historical application documents
US11386263B2 (en) Automatic generation of form application
CN110990527A (zh) 自动问答方法及装置、存储介质及电子设备
US20190197103A1 (en) Asynchronous speech act detection in text-based messages
EP3738053A1 (en) Smart search for annotations and inking
TWI634439B (zh) 翻譯文件的媒合系統
CN105721586A (zh) 信息智能分配装置、方法及***
US20210165835A1 (en) Computer driven question identification and understanding within a commerical tender document for automated bid processing for rapid bid submission and win rate enhancement
US20220405503A1 (en) Machine learning-based document splitting and labeling in an electronic document system