TWI769531B - 文件機密等級管理系統及方法 - Google Patents
文件機密等級管理系統及方法 Download PDFInfo
- Publication number
- TWI769531B TWI769531B TW109132910A TW109132910A TWI769531B TW I769531 B TWI769531 B TW I769531B TW 109132910 A TW109132910 A TW 109132910A TW 109132910 A TW109132910 A TW 109132910A TW I769531 B TWI769531 B TW I769531B
- Authority
- TW
- Taiwan
- Prior art keywords
- confidentiality level
- document
- file
- label
- confidentiality
- Prior art date
Links
Images
Landscapes
- Storage Device Security (AREA)
Abstract
一種文件機密等級管理系統,包括有:複數個文件機密等級設定系統與一聯邦學習系統,各文件機密等級設定系統根據一分析模型對文件進行機密等級之分析,根據分析結果提供一第一機密等級標籤,並與使用者提供的一第二機密等級標籤比對,若相同,依第一機密等級標籤對文件進行加密或權限控管;若不同,依第二機密等級標籤,對文件進行加密或權限控管;各文件機密等級設定系統將各分析模型的模型參數加密傳送至聯邦學習系統;聯邦學習系統產生一更新參數並傳送至各文件機密等級設定系統,以利用更新參數更新分析模型。藉以提升準確性及機密性。
Description
本發明係與資料文件之機密等級設定技術有關;特別是指一種利用人工智慧設定文件機密等級之系統與方法。
傳統上,文件之機密等級設定多半係以人工的方式,基於人工查閱文件內特定資訊進行文件機密等級的判定,以決定文件的機密等級。
隨著科技發展,過去以紙本書寫的文件已逐漸改由電子文件的方式呈現。不同於紙本文件不易修改增減內容,電子文件可直接利用電子軟體進行文件內容的修改。其中,目前文件之機密等級設定技術僅在於透過文件附檔名或關鍵字等內容來判斷文件的機密等級,或者是單純透過人工閱讀文件來分類文件的機密等級。
另外,當文件的內容有增減或重新編修後,其機密等級將可能有所改變,尤其現在電子文件的內容編輯修改十分快速,需要即時對文件進行機密等級分析,甚至是即時的重新判斷文件的機密等級,對於分類人員來說,是一大負擔。
此外,分類人員判斷文件的機密等級時,由於己經習慣在公司或單位中的經常性用詞,因此,當文件中出現涉及機密之罕見或新的用詞時,分類人員便不易查覺,而可能誤判了文件的機密等級。
有鑑於此,本發明之目的在於提供一種文件機密等級管理系統及方法,可於文件產生或編修後,根據人工智慧對文件進行機密等級分類,並且加上使用者對該文件的機密等級的判斷,來決定用何種機密等級對文件進行管控,同時又可優化人工智慧對文件之機密等級分類的準確性。
緣以達成上述目的,本發明提供一種文件機密等級管理系統,其包括有:複數個文件機密等級設定系統,各該文件機密等級設定系統包括一人工智慧分析模組、一資料外洩防護伺服器,其中:該人工智慧分析模組用以接收一文件,並根據一分析模型對該文件進行機密等級之分析,並根據分析結果提供一第一機密等級標籤;該資料外洩防護伺服器接收該第一機密等級標籤,並與一終端裝置連接,該終端裝置用以供使用者操作並提供一第二機密等級標籤,該資料外洩防護伺服器係比對該第一機密等級標籤與該第二機密等級標籤是否相同,若相同,該資料外洩防護伺服器係將該文件標記該第一機密等級標籤,並根據該第一機密等級標籤所定義之內容,對該文件進行加密或權限控管;若不同,該資料外洩防護伺服器係將該文件標記該第二機密等級標籤,並根據該第二機密等級標籤所定義之內容,對該文件進行加密或權限控管;一聯邦學習系統與各該文件機密等級設定系統連接,各該文件機密等級設定系統將各該分析模型之一模型參數加密形成一加密參數後傳送至該聯邦學習系統;該聯邦學習系統將該些加密參數聚合並產生一更新參數,及將該更新參數傳送至各該文件機密等級設定系統,各該人工智慧分析模組依據該更新參數更新該分析模型。
緣以達成上述目的,本發明另提供一種文件機密等級管理方法,應用於該文件機密等級管理系統中,該方法包括有以下步驟:
各該文件機密等級設定系統執行下列步驟:
A1、一終端裝置提供一文件;
A2、該文件經由該人工智慧分析模組根據一分析模型對於該文件進行機密等級之分析,並且該人工智慧分析模組根據分析結果提供一第一機密等級標籤予該資料外洩防護伺服器;
A3、該文件經由一使用者進行機密等級之分析,並提供一第二機密等級標籤予該資料外洩防護伺服器;
A4、該資料外洩防護伺服器比對該第一機密等級標籤及該第二機密等級標籤之異同;當該第一機密等級標籤與該第二機密等級標籤相同時,該資料外洩防護伺服器對該文件標記該第一機密等級標籤,並根據該第一機密等級標籤所定義之內容,對該文件進行加密或權限控管;當該第一機密等級標籤與該第二機密等級標籤不同時,該資料外洩防護伺服器對該文件標記該第二機密等級標籤,由該資料外洩防護伺服器根據該第二機密等級標籤所定義之內容,對該文件進行加密或權限控管;
A5、將該分析模型之一模型參數加密形成一加密參數後傳送到該聯邦學習系統;
該聯邦學習系統執行下列步驟:
B1、接收該些文件機密等級設定系統所傳來的加密參數;
B2、將該些加密參數聚合及產生一更新參數;
B3、將該更新參數傳送至各該文件機密等級設定系統;
各該文件機密等級設定系統更執行下列步驟:
A6、各該文件機密等級設定系統接收該更新參數;
A7、各該人工智慧分析模組依據該更新參數更新該分析模型。
本發明之效果在於,各該文件機密等級設定系統藉由人工智慧分析模組對文件進行機密等級分析,並藉由使用者對同一份文件進行機密等級分析,並且比對人工智慧分析模組與使用者所給出之機密等級是否有出入,而對文件進行權限控管。並且各該文件機密等級設定系統更將分析模型之模型參數加密後傳送到該聯邦學習系統以得到更新參數,各該文件機密等級設定系統依更新參數更新原有的分析模型,以提升人工智慧分析模組預測的準確性。由於各該文件機密等級設定系統之模型參數經過加密後才傳送出去,並非直接將文件或分析模型傳送出去,因此,可有效避免機密文件外洩的情形,提高各該文件機密等級設定系統中文件的資料安全性。
此外,本發明可應用在各個文件機密等級設定系統訓練資料量不足的情況,藉由利用其它文件機密等級設定系統的參數,有效解決各個文件機密等級設定系統之訓練資料量不足的問題,提升準確性。
讓具有相近的機密等級認定標準的多個使用者使用同一個文件機密等級設定系統,避免不同使用者對機密等級認定差異太大又使用單一個文件機密等級設定系統,造成分析模型失準。
為能更清楚地說明本發明,茲舉實施例並配合圖式詳細說明如後。請參圖1所示,圖1為本發明一實施例的文件機密等級設定系統的方塊圖。該文件機密等級設定系統包括有:一資料外洩防護伺服器10以及一人工智慧伺服器20,該人工智慧伺服器20包括有一人工智慧分析模組30以及一人工智慧訓練模組40。
該資料外洩防護伺服器10係與至少一終端裝置1連接,該資料外洩防護伺服器10係遵照一資料外洩防護規範管理該終端裝置1所處理之文件,例如,該資料外洩防護規範記載有當特定文件或文件格式被建立、開啟、共用、存取、編輯、刪除或是其他管理方式等文件處理動作時,該資料外洩防護伺服器10將依據該終端裝置1或是該終端裝置1之使用者所被授權的範圍,決定該文件處理動作是否可被執行。於本實施例中,所述資料外洩防護伺服器10還包括有一資料外洩防護單元12,該資料外洩防護單元12可以是但不限於為一應用程式,供安裝於終端裝置1上,並與該資料外洩防護伺服器10連線,並可將文件上傳至資料外洩防護伺服器10,再由該資料外洩防護伺服器10將該文件傳送至人工智慧伺服器20的人工智慧分析模組30,以對該文件進行機密等級之分析。該資料外洩防護單元12係按照資料外洩防護規範管理該終端裝置1所處理之文件,更進一步地說,該資料外洩防護單元12係可監控使用者透過該終端裝置1對文件處理之操作,例如資料外洩防護規範中可設定當該終端裝置1開啟的文件為word檔、PDF檔等檔案類型或是其他特定檔案類型之文件時,或是該終端裝置1所編輯之文件的內容中涉及有敏感性字詞或語句時,該資料外洩防護單元12將啟動並監控該終端裝置1對該文件的文件處理動作,並根據該文件所被標記之機密等級標籤所對應之內容,對該文件進行加密或權限控管,其中,所述的加密可以是但不限於隱藏或模糊化或其他加密方式使文件中特定或敏感性的字詞或語句,使其無法在終端裝置上正常顯示或無法被使用者所閱讀;所述的權限控管可以是但不限於限制使用者可在該終端裝置1上對該文件的操作行為或指令,例如包括有但不限於限制對該文件或該文件之內容執行開啟、共用、存取、編輯、刪除、複製、剪取等文件處理動作。於實際運作上,所述的資料外洩防護單元12可以有多個,分別安裝於不同的終端裝置1上,用以分別監控各終端裝置1,所述之終端裝置1可以是但不限於手機、平板電腦、筆記型電腦、桌上型電腦、工業電腦等裝置。該終端裝置1與文件庫連接,可自文件庫存取文件,所述之文件庫可以是終端裝置1上的儲存空間、伺服器或是雲端儲存空間,但不以此為限。於本實施例中,所述資料外洩防護伺服器10還包括有一應用程式介面14(Application Programming Interface)、一機密等級管理單元16以及一權限管理單元18。該應用程式介面14可供與該終端裝置1、人工智慧伺服器20進行通訊、資料傳輸,例如可對終端裝置1上的資料外洩防護單元12提供使用者權限的更新、文件機密等級的設定或變更資料等。該機密等級管理單元16用以管理對應各文件的機密等級標籤,例如機密等級管理單元16存有用以記錄各文件之機密等級標籤的目錄表或索引表等表單。該權限管理單元18用以管理各使用者所對於各機密等級文件之瀏覽、編修或其他文件處理動作的權限。據此,資料外洩防護單元12可與該應用程式介面14溝通,以自機密等級管理單元16下載或讀取各文件對應之機密等級標籤,或上傳機密等級標籤至機密等級管理單元16,以及自權限管理單元18更新對應該終端裝置1之使用者的權限。
另外,該終端裝置1亦可透過該資料外洩防護單元12與該資料外洩防護伺服器10進行通訊,並可將該文件由該終端裝置1傳送或上傳至該資料外洩防護伺服器10,並由該資料外洩防護伺服器10將該文件傳送至人工智慧分析模組30,以供該人工智慧分析模組30對該文件進行機密等級之分析,並且該人工智慧分析模組30之分析結果將回傳予該資料外洩防護伺服器10,或者回傳至該資料外洩防護伺服器10,再回傳至終端裝置1上的資料外洩防護單元12,並由該資料外洩防護伺服器10或該資料外洩防護單元12根據分析結果對該文件進行加密或權限控管。於本實施例中,該人工智慧分析模組30包括有一應用程式介面32,當人工智慧分析模組30完成對文件的機密等級分析後,可透過該應用程式介面32將人工智慧分析模組30所給出的機密等級標籤回傳給資料外洩防護伺服器10之機密等級管理單元16儲存。
該人工智慧訓練模組40與該人工智慧分析模組30相連接,用以訓練該人工智慧分析模組30所使用的分析模型,以及用以接收經該人工智慧分析模組30對該文件進行機密等級分析後所產生之分析資料,並依據該分析資料對該分析模型進行重新訓練。
請一併配合圖1及圖2所示,本發明之文件機密等級設定方法包括有以下的步驟:
終端裝置1提供一文件。所述終端裝置1提供文件的方式包括有但不限於:終端裝置1自文件庫下載一文件,或者使用者在終端裝置1上建立一文件,或使用者在終端裝置1上編輯並儲存一文件。資料外洩防護伺服器10或安裝於終端裝置1上的資料外洩防護單元12將根據資料外洩防護規範監控終端裝置1上所存放或執行之文件,舉例而言,當終端裝置1自文件庫存取受該資料外洩防護規範所列管之文件時,或者是使用者操作該終端裝置1建立了一文件,並欲將該文件儲存或移動至該文件庫時,若該文件屬於受資料外洩防護規範所監控之類型,該資料外洩防護伺服器10將提供該文件予該人工智慧分析模組30,由該人工智慧分析模組30依據分析模型對該文件進行機密等級之分析,並提供一第一機密等級標籤。
於一實施例中,可以是由該終端裝置1上的資料外洩防護單元12將該文件傳送至資料外洩防護伺服器10,再由該資料外洩防護伺服器10將該文件送給人工智慧分析模組30進行分析及預測對應該文件的機密等級。另外,於另一實施例中,該人工智慧分析模組30還包含有一模型代理程式34,該模型代理程式34可以是但不限於一應用程式,係供安裝於該終端裝置1上,用以對該文件進行機密等級之分析,如此一來,於終端裝置1或資料外洩防護單元12無法與外部的資料外洩防護伺服器10連線時,便可於終端裝置1本地的模型代理程式34針對該文件進行機密等級之分析,以提供相應之第一機密等級標籤。更進一步地說,該模型代理程式34係與該人工智慧伺服器20連線,並自該人工智慧伺服器20取得以及更新分析模型,並可利用該分析模型對文件進行機密等級分析,以提供第一機密等級標籤。
另外,使用者亦會對該文件進行機密等級分析,並提供一第二機密等級標籤,並將該第二機密等級標籤提供給該資料外洩防護伺服器10,由該資料外洩防護伺服器10比對該第一機密等級標籤與該第二機密等級標籤是否相同。其中,所述使用者提供第二機密等級標籤的時間點可以是在人工智慧分析模組30對該文件進行機密等級分析之後或之前,例如:於一情況下,當使用者對一文件進行編輯或者儲存一文件時,使用者可對該文件標記第二機密等級標籤,而後該文件將進一步提交予該人工智慧分析模組30進行機密等級分析,並產出對應之第一機密等級標籤;於另一情況下,該文件是先經由人工智慧分析模組30進行機密等級分析並產生第一機密等級標籤後,再提交至終端裝置1,以由使用者對該文件進行機密等級分析,以提供第二機密等級標籤。
於後,資料外洩防護伺服器10將比對該第一機密等級標籤與該第二機密等級標籤是否相同,若相同,則將該文件標記第一機密等級標籤,並由資料外洩防護伺服器10根據第一機密等級標籤所定義之內容,對該文件進行加密或權限控管;若不相同,則將該文件標記第二機密等級標籤,並由資料外洩防護伺服器根10據第二機密等級標籤所定義之內容,對該文件進行加密或權限控管。舉例而言,所述第一機密等級標籤、第二機密等級標籤可以是用來分類但不限於一般、密、機密、極機密、絕對機密等標籤,或者,所述第一、第二機密等級標籤係用以指向或代表使用者所設定之文件機密等級,以供資料外洩防護伺服器10讀取並根據第一、第二機密等級標籤之內涵對文件進行加密或使用者對於該文件可執行與不可執行動作之權限控管。
另外,該人工智慧分析模組30對文件進行機密等級分析後所產生之對應的分析資料,將傳送至一訓練資料庫儲存,並由該人工智慧訓練模組40連結至該訓練資料庫接收該些分析資料,並根據該些分析資料對分析模型進行重新訓練。於一實施例中,請配合圖1所示,所述人工智慧訓練模組40包括有一資料收集與標記工具42、一模型訓練工具44、一模型重訓練工具46以及一錯誤驗證工具48。
所述資料收集與標記工具42用以生成建立該分析模型所需的訓練資料,舉例而言,所述資料收集與標記工具42包含有一使用者介面,且該資料收集與標記工具42連接文件庫,於介面上可供使用者選擇所欲分析或訓練之文件,使用者可選擇其中一份或多份文件,並對文件標記第二機密等級標籤,另外,所述資料收集與標記工具42還包括有一建議標籤介面,該建議標籤介面與終端裝置相連接,並提供有多個基準模型(baseline model),使用者可藉由該建議標籤介面選擇其中一該基準模型,並由人工智慧分析模組30根據所選擇之基準模型對該文件進行機密等級之分析,並產生至少一建議的機密等級標籤,再由使用者決定是否選用所建議之機密等級標籤做為該第二機密等級標籤,換言之,當使用者不知如何設定或決定其文件的第二機密等級標籤時,便可藉由建議標籤介面的輔助,提供出第二機密等級標籤。其中,所述基準模型可以是選自相同或相似產業之文件機密等級設定系統所訓練得出之模型,或者是基於類別相似或相近之文件進行訓練而得之模型,舉例而言,A業者為模具製造商,其設定機密等級之文件為模具設計圖相關文件;B業者亦為模具製造商或者其機密文件同樣與A業者之模具設計圖相關或相近,則基於A業者之文件所訓練而得之基準模型,便可應用於B業者,以供B業者採用該基準模型對其文件給出第二機密等級標籤之參考。
該模型訓練工具44用以接收該些訓練資料以建立該分析模型。其中,該模型訓練工具44可使用的演算法包含有但不限於:支援向量機(SVM)、多層感知機(MLP)、梯度提升決策樹(GBDT)、BERT(Bidirectional Encoder Representations from Transformers)、LSTM(Long Short-Term Memory)等或其組合。請配合圖3及圖4所示於一實施例中,所述之模型訓練工具44可包含有但不限於:自動分詞(斷詞)模組(Word Segmentation Module)、詞向量模組(Word-to-Vector Module)、特徵選取模組(Feature Selection Module)、降維模組(Dimensionality Reduction Module)、加權模組(Weighted Module)以及分類模組(Classification Module)。所述自動分詞模組可根據不同語言(例如中文或英文等)對文件內之詞句基於辭典或詞庫匹配進行分詞、或基於詞頻度統計進行分詞但不以此為限;所述詞向量模組用以將分詞(斷詞)後之文件向量化為詞向量;所述特徵選取模組可以但不限於以單字母、雙字母或三字母作為一個特徵單位對詞向量進行特徵選取;所述降維模組可使用但不限於卡方檢定(chi-square)、單因子獨立變異數分析(ANOVA F-value)等降低特徵維度;所述加權模組可使用詞頻-逆文件頻率(TF-IDF)演算法,評估各字詞的重要程度,進行權重之計算;所述分類模組可使用但不限於支援向量機(SVM)、多層感知機(MLP)、梯度提升決策樹(GBDT),以建立該分析模型。於後,測試該分析模型對文件之密件等級分析並產出效果報告,根據效果報告之結果判斷分析模型的準確度或其他指標是否符合使用者的要求,若符合要求,則完成分析模型,若不符合要求,則持續調整模型建立之參數並增加訓練資料再進行模型之訓練。所述分析模型之訓練方式可使用但不限於按照80-20的拆分比例將訓練資料及/或分析資料,分成訓練集與測試集,再通過上述之模型訓練工具44之各模組幫助分析模型進行訓練,據以建立出該分析模型。又通常知識者可根據所進行分析之文件的類型不同,選擇不同的分析模型訓練方式,並不以上述說明為限制。該模型重訓練工具46可接收該訓練資料庫所儲存之分析資料對該分析模型進行重新訓練,該模型重訓練工具46的架構可採用與模型訓練工具44類似之架構,於此不再贅述。
該錯誤驗證工具48用以儲存第一機密等級標籤與第二機密等級標籤不同的文件,換言之,係儲存人工智慧分析模組30之文件機密等級預測結果與使用者所給出之文件機密等級不一致之文件,並留待使用者做後續確認或改善分析模型之用。舉例而言,使用者可定期使用錯誤驗證工具48檢視一段時間內第一、第二機密等級標籤不一致之文件,並確認第一機密等級標籤或第二機密等級標籤是否正確或恰當,於第一情況下,若第一機密等級標籤為正確或較恰當,則修改第二機密等級標籤為第一機密等級標籤,並將此結果儲存至訓練資料庫,並可供訓練分析模型之用;於第二情況下,若第二機密等級標籤為正確或較恰當,則修改第一機密等級標籤為第二機密等級標籤,並將此結果以有別於第一情況的權重輸入模型重訓練工具46以微調分析模型或對分析模型進行再訓練。
另外,於一實施例中,模型訓練工具44亦可利用深度學習技術來建立分析模型,舉例來說,可使用遷移學習(Transfer Learning)來訓練分析模型。請配合圖5所示,在建立分析模型的前置作業包括有:蒐集至少一產業的相關文件資料,例如:可以蒐集但不限於模具製造產業、機械產業、電子產業、醫療產業、銀行產業、保險產業、生技產業、醫藥產業等產業的相關文件資料,所述的相關文件資料可以是但不限於客戶資料、設計圖、製程文件、產品配方等。於後,使用通用語料庫所訓練出的語言模型(Language Model)與預先蒐集之至少一產業的文件資料,透過預訓練(Pre-Training)的方式,得到適合在該至少一產業的預訓練模型。之後,當欲導入業者之公司以對該公司之文件進行文件機密等級之設定與分類時,係根據該業者所屬之產業,或者根據該業者欲分類之文件類型,選擇適合之預訓練模型,並加入該業者之企業內部的文件以及機密等級分類等相關資料,所述機密等級分類可以是由該企業的機密文件管理辦法所得出,藉此,模型訓練工具44可學習到該企業之文件的機密等級特徵以及機密等級分類邏輯,並對預訓練模型進行模型微調(Fine-Tuning),據以產生適用於對該企業之文件進行文件機密等級設定的分析模型。並且,當文件機密等級設定系統於該企業運作一段期間後,所蒐集之第一機密等級標籤與第二機密等級標籤不一致的文件,可供模型重訓練工具46用以對分析模型進行重新訓練,例如可凍結分析模型之神經網路中一部分的階層(Layers),例如是數個低階層,並微調另一部分的階層,例如數個高階層,以這種鎖定特定階層權重的更新,或者是使用對神經網路各層設置不同的學習率等方式,對分析模型進行重訓練,藉以得到更加適合該企業的文件機密等級設定系統的分析模型。
值得一提的是,於一實施例中,當人工智慧分析模組30係再次對同一文件進行密件等級分析,且人工智慧分析模組30提供之第一機密等級標籤與使用者提供之第二機密等級標籤不同時,人工智慧訓練模組40將比對並提取該文件之前後版本的差異內容,並根據該差異內容對該分析模型進行重新訓練。舉例而言,當使用者對已經設定過文件機密等級的文件進行編輯或修改後,該文件的機密等級因此有所變動,使用者將會變更對該文件所給出的第二機密等級標籤,而若該文件再經過人工智慧分析模組30的判斷後,人工智慧分析模組30給出的第一機密等級標籤與第二機密等級標籤不同時,表示人工智慧分析模組30所使用的分析模型有更新的必要,因此,人工智慧訓練模組40將比對並提取該文件之前後版本的差異內容,也就是使用者對該文件二次編輯修改之內容,基於該差異內容對分析模型進行重新訓練,以提升往後使用該分析模型進行文件機密等級設定的準確率。
請配合圖6所示,於一實施例中,當資料外洩防護伺服器10在監控終端裝置1時,偵測到須設定機密等級之文件時,例如:偵測到使用者操作終端裝置1開啟、下載或儲存了一個疑似存有敏感性資料或資訊之文件時,或者偵測到資料外洩防護規範中所指定追蹤或是注意之檔案類型時,該資料外洩防護伺服器10將呼叫人工智慧分析模組30對該文件進行機密等級分析,並於人工智慧分析模組30提供了相應之第一機密等級標籤後,該資料外洩防護伺服器10將對該文件標記該第一機密等級標籤,或者將該文件與該第一機密等級標籤建立資料處理之連結關係,並先依據該第一機密等級標籤所定義之內容,對該文件進行加密或權限控管;另外,操作該文件的使用者或其他具有指揮監督權限之使用者也會對該文件進行機密等級分析,並提供一第二機密等級標籤,再由資料外洩防護伺服器10比對第一機密等級標籤與第二機密等級標籤的異同,若第一機密等級標籤與第二機密等級標籤為相同,則維持該文件所標記的第一機密等級標籤;若第一機密等級標籤與第二機密等級標籤不同,則將文件變更標記為第二機密等級標籤,再根據第二機密等級標籤所定義之內容對文件進行加密或權限控管。
其中,文件的機密等級標籤(第一機密等級標籤與第二機密等級標籤)可以被儲存於文件屬性中,而跟隨著文件存放及移轉;另外,於一些實施例中,所述文件的機密等級標籤亦可存放在如資料外洩防護伺服器10、終端裝置1或資料外洩防護單元12的資料儲存空間中,或者是存放於一資料庫當中,並於對應文件的機密等級標籤更新時,可同步更新各資料儲存空間中對應該文件的機密等級標籤,而資料外洩防護單元12可前往上述資料儲存空間或資料庫取得對應文件之機密等級標籤,並根據機密等級標籤內容對文件進行加密或權限控管。
請配合圖7A至圖7C所示,於一實施例中,所述文件的機密等級標籤係可存放於文件之文件屬性內容中,例如存放於「文件機密等級屬性」(例示性名稱)的內容中,包括有人工智慧標籤的欄位F1以及使用者標籤的欄位F2,於欄位F1中用以供填入人工智慧分析模組30所給出的第一機密等級標籤,於欄位F2中用以供填入使用者所給出的第二機密等級標籤。圖7A所示為尚未進行文件機密等級分析之文件的文件機密等級屬性的示意圖,此時,該文件尚未進行文件機密等級分析,因此,其欄位F1、F2均為空白;如圖7B所示,當人工智慧分析模組30給出第一機密等級標籤後,例如給出的第一機密等級標籤為代碼「A」,此時,對應人工智慧標籤的欄位F1就會被填入相應代碼「A」,當使用者給出第二機密等級標籤後,例如給出的第二機密等級標籤為代碼「B」,此時,對應的使用者標籤的欄位F2就會被填入相應代碼「B」,於後,資料外洩防護伺服器10將讀取欄位F1、F2的內容,並依據欄位F1、F2內容進行判斷,於本例子中,由於第一機密等級標籤為代碼「A」與第二機密等級標籤的代碼「B」並不相同,因此,資料外洩防護伺服器10將修改人工智慧標籤的欄位F1內容為代碼「B」,並將使用者標籤的欄位F2清空,以及將本次。於後,該文件所被標記的機密等級標籤代碼「B」即為使用者所給出的第二機密等級標籤,因此,資料外洩防護伺服器10或終端裝置1上的資料外洩防護單元12便根據該人工智慧標籤上留存的代碼「B」(第二機密等級標籤)對對應文件進行加密或權限控管。
另外,請配合圖8A至圖8C所示,與圖7A至圖7C大致相同,不同的是,使用者所給出的第二機密等級標籤與人工智慧分析模組30給出的第一機密等級標籤相同,均為代碼「A」,因此,在圖8C中,人工智慧標籤欄位F1仍然是代碼「A」,也就是人工智慧分析模組30所給出的第一機密等級標籤,並且該使用者標籤的欄位F2在資料外洩防護伺服器10比對第一機密等級標籤與第二機密等級標籤後,同樣會被清空,於後,該文件所被標記的機密等級標籤代碼「A」即為人工智慧分析模組30所給出的第一機密等級標籤,因此,資料外洩防護伺服器10或終端裝置1上的資料外洩防護單元12便根據該人工智慧標籤上留存的代碼「A」(第一機密等級標籤)對對應文件進行加密或權限控管。另外補充一提,前述的代碼「A」、「B」僅作為例示性說明之用,並非實際機密等級標籤的內容。
其中,前述將對應儲存第二機密等級標籤之使用者標籤的欄位F2清空的好處在於:當已標記有機密等級標籤的文件再次被使用者所編修而有內容的變更時,由於存放第二機密等級標籤之使用者標籤的欄位F2為空白,因此,資料外洩防護伺服器10將要求使用者再次對該文件的機密等級進行確認,以給出新的第二機密等級標籤,再與人工智慧分析模組30所給出的第一機密等級標籤進行比對,以避免當文件經編修而內容有所變動之後,又是以舊的第二機密等級標籤來評估該文件之機密等級的情況發生,而可實時地、即時地對有編修的文件重新評估文件機密等級。換言之,前述在比對完第一機密等級標籤與第二機密等級標籤後,將存放第二機密等級標籤之欄位清空的動作,將有助於對有重新編修後的文件進行文件機密等級的評估,資料外洩防護伺服器10可檢查使用者標籤的欄位狀態,據以決定是否提交文件給使用者做密件等級分析,以讓使用者提供即時的第二機密等級標籤。
本發明所提供的文件機密等級設定系統及方法,可於文件產生或編修後,除了根據預先學習的人工智慧分析模組進行文件機密等級分類外,還可回饋使用者所設定的文件機密等級,並且當使用者所標記的文件機密等級與人工智慧分析模組所標記的文件機密等級標籤產生出入時,即將該份文件納入人工智慧分析模組再學習的資料當中,並可依據該份文件與該文件先前版本之間的差異內容重新訓練人工智慧分析模組,進而提升未來人工智慧分析模組自動分類的準確率。另外,當文件被修改或重新編修時,亦可對該文件重新檢視有無須變更文件機密等級的需要,而可即時且準確地對文件進行機密等級的設定。
為了增加文件機密等級設定系統及方法對文件機密設定的準確性,請配合圖9,提供本發明一實施例之文件機密等級管理系統100,包括有複數個上述的文件機密等級設定系統110與一聯邦學習系統120。
該些文件機密等級設定系統110分別於相同產業類別之複數個不同單位中使用,例如是同一產業中的不同之企業。該聯邦學習系統120與各該文件機密等級設定系統110連接,本實施例中該聯邦學習系統120包括一聯邦學習伺服器122,該聯邦學習伺服器122與各該文件機密等級設定系統110的人工智慧伺服器20連接。人工智慧伺服器20更包括一模型參數加密模組50與一通訊模組52。該聯邦學習伺服器122包括一數據品質評估模組122a、一數據過濾模組122b、一特徵聚合模組122c、一模型參數更新儲存單元122d、一模型儲存單元122e與一模型派送模組122f。
請一併配合圖9及圖10所示,說明本發明之文件機密等級管理方法,其包括各該文件機密等級設定系統110所執行的步驟以及該聯邦學習系統120所執行的步驟,其中:
各該文件機密等級設定系統110所執行的步驟係以圖2所示之文件機密等級設定方法為基礎,更包括將該分析模型之一模型參數加密成一加密參數後傳送到該聯邦學習系統120,例如以類神經網路演算法為例,該模型參數可包括多個參數,包括梯度、權重、偏差值、神經網路的層數、損失函數、卷積核的大小、學習率、動量、迭代次數等,實務上,該模型參數可包括至少一個參數。本實施例中,係由該模型參數加密模組50對分析模型之模型參數以加密演算法加密,例如可採用進階加密標準(Advanced Encryption Standard,AES)、RSA加密演算法等演算法,但不以此為限,人工智慧伺服器20的通訊模組52再將加密後的加密參數傳送給聯邦學習伺服器124。
該聯邦學習系統120執行下列步驟:
接收該些文件機密等級設定系統110所傳來的加密參數。本實施例中係由聯邦學習伺服器124接收該些加密參數。
將該些加密參數聚合及產生一更新參數。
本實施例中,聯邦學習伺服器124係在同態加密之下對所接收的加密參數進行處理,包括進行篩選、聚合。該數據品質評估模組122a與該數據過濾模組122b用以對加密參數進行篩選,該數據品質評估模組122a對所接收的加密參數進行品質評估處理,以決定各加密參數是否可用於聚合,若各加密參數中的某一參數(例如梯度)偏離信賴區間則不用於聚合,以避免影響該更新參數。該數據過濾模組122b對所接收的加密參數進行過濾,以找出加密參數中可用於聚合的特徵。該特徵聚合模組122c對經前述處理後的加密參數聚合為該更新參數,儲存於模型儲存單元122e中。在一實施例中,更可對加密參數進行混淆處理。
將該更新參數傳送至各該文件機密等級設定系統110。本實施例中,由該模型派送模組122f將該模型儲存單元122e中的更新參數傳送到各該文件機密等級設定系統110的人工智慧伺服器20的通訊模組52。
各該文件機密等級設定系統110更執行下列步驟:
各該文件機密等級設定系統110接收該更新參數。
各該人工智慧分析模組30將依據該更新參數更新該分析模型。本實施例中,各該人工智慧分析模組30將該更新參數進行解密後,依據解密後的該更新參數與該分析模型原來的模型參數進行運算,例如將相同的參數進行加總或平均,以更新該分析模型。本實施例中,是由該通訊模組52接收到該更新參數後,決定是否將更新參數傳予人工智慧分析模組30更新該分析模型。若是,則通訊模組52驅動人工智慧分析模組30更新該分析模型。若使用者認為原來的分析模型已夠準確,可以設定在通訊模組52中設定不將更新參數傳予人工智慧分析模組30。
之後,各該文件機密等級設定系統110再次執行文件機密等級設定方法時,即可依據更新後的該分析模型對文件進行機密等級之分析。
藉由上述之文件機密等級管理系統100及方法,即可增加模型訓練的資料量,彌補各單位中各該文件機密等級設定系統之用於模型訓練的資料量不足的缺點,進而提升人工智慧分析模組30判斷的準確率。更值得一提的是,各該文件機密等級設定系統110是將模型參數加密後上傳至該聯邦學習系統120,而不是上傳分析模型,因此,即便得到加密參數後亦難以破解,縱然加密參數被破解,也得不到分析模型,如此一來,可有效避免各單位中的機密文件外洩的情形,提高各該文件機密等級設定系統110中文件的資料安全性。
此外,在以更新後的分析模型進行文件機密等級設定方法時,該人工智慧訓練模組40亦接收經該人工智慧分析模組30對文件進行機密等級分析後所產生之分析資料,並依據該分析資料對該分析模型進行重新訓練。換言之,在各單位的文件機密等級設定系統110將更新後的分析模型重新訓練之後,可產生更適合各單位的分析模型,更能提升人工智慧分析模組30判斷的準確率。之後,各該文件機密等級設定系統110亦可再將重新訓練後的分析模型的模型參數加密形成該加密參數後傳送至該聯邦學習系統,以再進行聚合產生更新模型。
請配合圖11與圖12,提供本發明另一實施例之文件機密等級管理系統101,本實施例中,該些文件機密等級設定系統110區分為複數個類別C,該些類別C可例如是不同的產業類別,例如是製造業、醫療業、金融業。每一該類別包括複數個該文件機密等級設定系統110,至少為二個文件機密等級設定系統110。各該文件機密等級設定系統110係於每一個類別C之複數個不同單位中使用。
本實施例中,該聯邦學習系統130包含複數個聯邦平台132與一聯邦學習伺服器134,各該聯邦平台132與各該類別的文件機密等級設定系統110連接,該聯邦學習伺服器134與該些聯邦平台132連接。各該聯邦平台132包括該數據品質評估模組122a、該數據過濾模組122b、該特徵聚合模組122c、該模型參數更新儲存單元122d。該聯邦學習伺服器134包括一模型優化更新模組134a,以及該模型儲存單元122e、該模型派送模組122f。
本實施例之文件機密等級管理方法如圖13所示,其具有大致相同於圖10之步驟,不同的是:
由各該聯邦平台132接收各該類別C的文件機密等級設定系統110之加密參數。
各該聯邦平台132將所接收各該類別的文件機密等級設定系統110之加密參數並聚合為一中繼參數後傳送至該聯邦學習伺服器134。本實施例中,各該聯邦平台132的各個模組所進行之處理同前一實施例,不同的是,該特徵聚合模組122c係對經處理後的加密參數聚合為該中繼參數,並儲存於模型儲存單元122e中。
該聯邦學習伺服器134在同態加密之下將該些中繼參數進行優化與更新,以產生該更新參數。由於各個類別C於文件中的機密之字詞或語句略有差異,因此,本實施例係由模型優化更新模組134a對各聯邦平台傳來的中繼參數進行優化與更新,優化與更新可例如為選擇相近類別C的各中繼參數中的部分參數再聚合,以產生適合該些類別的更新參數,並儲存於該模型儲存單元122e中,所產生的更新參數可以為一個,或者是針對不同類別C分別對應產生適合各類別C之不同的複數個更新參數。該模型派送模組122f將該模型儲存單元122e中的更新參數傳送到各該文件機密等級設定系統110的人工智慧伺服器20的通訊模組52。若為複數個更新參數,則該模型派送模組122f將各該更新參數分別傳送到對應之各該類別C的該文件機密等級設定系統110。
各該聯邦平台132對各該類別C的文件機密等級設定系統110所傳來的該些加密參數可包括在同態加密之下進行品質評估處理、混淆處理、聚合為該中繼參數。
本實施例可應用於將不同產業類別的該文件機密等級設定系統110的加密參數聚合,以產生更新參數,不但可以增加各單位的訓練之資料量,且可以利用到相關產業類別的機密之字詞或語句作為判斷機密文件。同樣地,也可有效避免各單位中的機密文件外洩,以提高各該文件機密等級設定系統110中文件的資料安全性。
請配合圖14,提供本發明另一實施例之文件機密等級管理系統102,本實施例中,其係以前述的文件機密等級管理系統100為基礎,不同的是,聯邦學習系統140包括複數個聯邦學習伺服器142,各該聯邦學習伺服器142係連接每一類別C的該文件機密等級設定系統110,且每一該類別C包括至少二個該文件機密等級設定系統110。本實施例之文件機密等級管理方法如圖15所示,其具有大致相同於圖10之步驟,不同的是:
該聯邦學習系統140係由各該聯邦學習伺服器142接收各該類別C的文件機密等級設定系統110之加密參數;各該聯邦學習伺服器142接收各該類別C的文件機密等級設定系統110之加密參數並聚合為一中繼參數,該些聯邦學習伺服器142之中的二者更將各自的中繼參數相互傳到對方並將來自對方的中繼參數與來自各該類別的文件機密等級設定系統110之加密參數聚合為一更新參數;而後,由各該聯邦學習伺服器142將各該更新參數傳送至對應之類別C的各該文件機密等級設定系統110。
本實施例的文件機密等級管理系統102中,可應用於將加密參數與相近類別的中繼參數聚合,以產生更新參數,不但可以增加各單位的訓練之資料量,且可以利用到相關產業類別的機密之字詞或語句作為判斷機密文件。同樣地,也可有效避免各單位中的機密文件外洩,以提高各該文件機密等級設定系統110中文件的資料安全性。
據上所述,本發明之文件機密等級管理系統及方法,可有效地將不同的文件機密等級設定系統110之分析模型再訓練為更準確的分析模型,克服了單一文件機密等級設定系統110中的訓練資料量不足的問題,藉以提升判斷的準確性。
由於文件機密等級設定系統110傳送至聯邦學習系統120, 130, 140的資料為分析模型的模型參數且模型參數經過加密後才傳送出去,並非直接將文件或分析模型傳送出去,因此,可有效避免機密文件外洩的情形,提高各該文件機密等級設定系統110中文件的資料安全性。
另外,文件機密等級管理系統100, 101, 102亦可應用在同一個企業中,而該些文件機密等級設定系統110分別於同一企業的複數個不同部門,例如包括有研發部門、業務部門、會計部門、行銷部門、設計部門等製造部門等。同一部門的使用者具有相近的機密等級認定標準,不同部門之使用者對機密等級的認定標準不同,因此讓各個部門使用各自的文件機密等級設定系統110進行訓練,避免不同部門的使用者使用單一個文件機密等級設定系統110且對文件機密等級認定差異太大,而造成單一個文件機密等級設定系統110的分析模型不準確,例如參數的權重降低、特徵亂度升高。透過聯邦學習系統120可將各分析模型的參數聚合,或選擇部分參數聚合,再回傳各部門的文件機密等級設定系統110,藉以提升各分析模型的準確度。
以上所述僅為本發明可行實施例而已,其中,文件機密等級設定系統中對文件標記第一機密等級標籤或第二機密等級標籤,可以是但不限於將機密等級標籤標記於對應該文件的文件屬性的欄位中,或者標記、記錄於一目錄表或索引表等表單當中,或是存放在如資料外洩防護伺服器、終端裝置或資料外洩防護單元的資料儲存空間中,或者是存放於一資料庫中,以供資料外洩防護伺服器前往存取,於資料外洩防護伺服器要對該文件進行加密或權限控管時,係自前述的文件屬性欄位、表單、資料儲存空間或資料庫中讀取對應該文件的機密等級標籤。舉凡應用本發明說明書及申請專利範圍所為之等效變化,理應包含在本發明之專利範圍內。
1:終端裝置
10:資料外洩防護伺服器
12:資料外洩防護單元
14:應用程式介面
16:機密等級管理單元
18:權限管理單元
20:人工智慧伺服器
30:人工智慧分析模組
32:應用程式介面
34:模型代理程式
40:人工智慧訓練模組
42:資料收集與標記工具
44:模型訓練工具
46:模型重訓練工具
48:錯誤驗證工具
100:文件機密等級管理系統
110:文件機密等級設定系統
50:模型參數加密模組
52:通訊模組
120:聯邦學習系統
124:聯邦學習伺服器
122a:數據品質評估模組
122b:數據過濾模組
122c:特徵聚合模組
122d:模型參數更新儲存單元
122e:模型儲存單元
122f:模型派送模組
101:文件機密等級管理系統
130:聯邦學習系統
132:聯邦平台
134:聯邦學習伺服器
134a:模型優化更新模組
102:文件機密等級管理系統
140聯邦學習系統
142聯邦學習伺服器
C:類別
圖1為本發明一實施例的文件機密等級設定系統的方塊圖;
圖2為本發明一實施例的文件機密等級設定方法的流程圖;
圖3為本發明一實施例的模型訓練工具的架構圖;
圖4為本發明一實施例的分析模型的訓練流程圖;
圖5為本發明另一實施例的分析模型的訓練流程圖;
圖6為本發明另一實施例的文件機密等級設定方法的流程圖;
圖7A至圖7C為本發明一實施例之文件機密等級標籤標記的示意圖;
圖8A至圖8C為本發明一實施例之文件機密等級標籤標記的示意圖;
圖9為本發明一實施例的文件機密等級管理系統的方塊圖;
圖10為本發明一實施例的文件機密等級管理方法的流程圖;
圖11為本發明另一實施例的文件機密等級管理系統的方塊圖;
圖12為圖11中的聯邦學習系統的方塊圖;
圖13為本發明上述實施例的文件機密等級設定方法的流程圖;
圖14為本發明另一實施例的文件機密等級管理系統的方塊圖;
圖15為本發明上述實施例的文件機密等級設定方法的流程圖。
100:文件機密等級管理系統
110:文件機密等級設定系統
20:人工智慧伺服器
30:人工智慧分析模組
40:人工智慧訓練模組"
50:模型參數加密模組
52:通訊模組
120:聯邦學習系統
122:聯邦學習伺服器
122a:數據品質評估模組
122b:數據過濾模組
122c:特徵聚合模組
122d:模型參數更新儲存單元
122e:模型儲存單元
122f:模型派送模組
Claims (15)
- 一種文件機密等級管理系統,其包括有:複數個文件機密等級設定系統,各該文件機密等級設定系統包括一人工智慧分析模組、一資料外洩防護伺服器,其中:該人工智慧分析模組用以接收一文件,並根據一分析模型對該文件進行機密等級之分析,並根據分析結果提供一第一機密等級標籤;該資料外洩防護伺服器接收該第一機密等級標籤,並與一終端裝置連接,該終端裝置用以供使用者操作並提供一第二機密等級標籤,該資料外洩防護伺服器係比對該第一機密等級標籤與該第二機密等級標籤是否相同,若相同,該資料外洩防護伺服器係將該文件標記該第一機密等級標籤,並根據該第一機密等級標籤所定義之內容,對該文件進行加密或權限控管;若不同,該資料外洩防護伺服器係將該文件標記該第二機密等級標籤,並根據該第二機密等級標籤所定義之內容,對該文件進行加密或權限控管;一聯邦學習系統,與各該文件機密等級設定系統連接,各該文件機密等級設定系統將各該分析模型之一模型參數加密形成一加密參數後傳送至該聯邦學習系統;該聯邦學習系統將該些加密參數聚合並產生一更新參數,及將該更新參數傳送至各該文件機密等級設定系統,各該人工智慧分析模組依據該更新參數更新該分析模型;其中,各該文件機密等級設定系統包含一人工智慧訓練模組,該人工智慧訓練模組與該人工智慧分析模組相連接,用以接收經該人工智慧分析模組對該文件進行機密等級分析後所產生之分析資料,並依據該分析資料對該分析模型進行重新訓練; 其中,該人工智慧訓練模組包括有一資料收集與標記工具、一錯誤驗證工具、一模型訓練工具以及一重訓練工具,該資料收集與標記工具用以生成建立該分析模型所需之訓練資料;該錯誤驗證工具用以儲存該第一機密等級標籤與該第二機密等級標籤不同之該文件;該模型訓練工具用以根據該訓練資料建立該分析模型;該重訓練工具根據該分析資料對該分析模型進行重新訓練。
- 如請求項1所述之文件機密等級管理系統,其中該些文件機密等級設定系統區分為複數個類別,每一該類別包括至少二個該文件機密等級設定系統;該聯邦學習系統包含複數個聯邦平台與一聯邦學習伺服器,各該聯邦平台與各該類別的文件機密等級設定系統連接,該聯邦學習伺服器與該些聯邦平台連接;各該聯邦平台接收各該類別的文件機密等級設定系統之加密參數並聚合為一中繼參數後傳送至該聯邦學習伺服器;該聯邦學習伺服器將該些中繼參數進行優化與更新,以產生至少一個該更新參數。
- 如請求項2所述之文件機密等級管理系統,其中該聯邦學習伺服器係產生複數個該更新參數,各該更新參數對應各該類別,且將各該更新參數分別傳送至對應之各該類別的該文件機密等級設定系統。
- 如請求項1所述之文件機密等級管理系統,其中該些文件機密等級設定系統區分為複數個類別,每一該類別包括至少二個該文件機密等級設定系統;其中該聯邦學習系統包含複數個聯邦學習伺服器,各該聯邦學習伺服器接收各該類別的文件機密等級設定系統之加密參數並聚合為一中繼參數,該些聯邦學習伺服器之中的二者更將各自的中繼參數相互傳到對方並將來自對方的中繼參數與來自各該類別的文件 機密等級設定系統之加密參數聚合為該更新參數後傳送至對應之類別的各該文件機密等級設定系統。
- 如請求項1所述之文件機密等級管理系統,其中各該文件機密等級設定系統包含將重新訓練後的該分析模型之模型參數加密形成該加密參數後傳送至該聯邦學習系統。
- 如請求項1所述之文件機密等級管理系統,其中該資料收集與標記工具包括有一建議標籤介面,該建議標籤介面與該終端裝置相連接,並提供有多個基準模型,使用者可透過該終端裝置選擇其中一該基準模型,並由該人工智慧分析模組根據該基準模型對該文件進行機密等級之分析,以提供該第二機密等級標籤。
- 一種文件機密等級管理系統,其包括有:複數個文件機密等級設定系統,各該文件機密等級設定系統包括一人工智慧分析模組、一資料外洩防護伺服器,其中:該人工智慧分析模組用以接收一文件,並根據一分析模型對該文件進行機密等級之分析,並根據分析結果提供一第一機密等級標籤;該資料外洩防護伺服器接收該第一機密等級標籤,並與一終端裝置連接,該終端裝置用以供使用者操作並提供一第二機密等級標籤,該資料外洩防護伺服器係比對該第一機密等級標籤與該第二機密等級標籤是否相同,若相同,該資料外洩防護伺服器係將該文件標記該第一機密等級標籤,並根據該第一機密等級標籤所定義之內容,對該文件進行加密或權限控管;若不同,該資料外洩防護伺服器係將該文件標記該第二機密等級標籤,並根據該第二機密等級標籤所定義之內容,對該文件進行加密或權限控管; 一聯邦學習系統,與各該文件機密等級設定系統連接,各該文件機密等級設定系統將各該分析模型之一模型參數加密形成一加密參數後傳送至該聯邦學習系統;該聯邦學習系統將該些加密參數聚合並產生一更新參數,及將該更新參數傳送至各該文件機密等級設定系統,各該人工智慧分析模組依據該更新參數更新該分析模型;其中,該資料外洩防護伺服器包括有一資料外洩防護單元,該資料外洩防護單元係安裝該終端裝置上,並與該資料外洩防護伺服器通訊,該資料外洩防護單元用以將該終端裝置上之該文件上傳至該資料外洩防護伺服器,並由該資料外洩防護伺服器將該文件傳送至人工智慧分析模組以對該文件進行機密等級之分析,且該資料外洩防護單元係根據該文件所被標記之該第一機密等級標籤或該第二機密等級標籤所定義之內容對該文件進行加密或權限控管。
- 一種文件機密等級管理系統,其包括有:複數個文件機密等級設定系統,各該文件機密等級設定系統包括一人工智慧分析模組、一資料外洩防護伺服器,其中:該人工智慧分析模組用以接收一文件,並根據一分析模型對該文件進行機密等級之分析,並根據分析結果提供一第一機密等級標籤;該資料外洩防護伺服器接收該第一機密等級標籤,並與一終端裝置連接,該終端裝置用以供使用者操作並提供一第二機密等級標籤,該資料外洩防護伺服器係比對該第一機密等級標籤與該第二機密等級標籤是否相同,若相同,該資料外洩防護伺服器係將該文件標記該第一機密等級標籤,並根據該第一機密等級標籤所定義之內容,對該文件進行加密或權限控管;若不同,該資料外洩防護伺服 器係將該文件標記該第二機密等級標籤,並根據該第二機密等級標籤所定義之內容,對該文件進行加密或權限控管;一聯邦學習系統,與各該文件機密等級設定系統連接,各該文件機密等級設定系統將各該分析模型之一模型參數加密形成一加密參數後傳送至該聯邦學習系統;該聯邦學習系統將該些加密參數聚合並產生一更新參數,及將該更新參數傳送至各該文件機密等級設定系統,各該人工智慧分析模組依據該更新參數更新該分析模型;其中,該人工智慧分析模組包括有一模型代理程式,該模型代理程式係安裝於該終端裝置上,用以根據該分析模型對該終端裝置上的文件進行機密等級之分析。
- 一種文件機密等級管理方法,應用於一文件機密等級管理系統中,該文件機密等級管理系統包括複數個文件機密等級設定系統與一聯邦學習系統,各該文件機密等級設定包括有一資料外洩防護伺服器與一人工智慧分析模組,各該文件機密等級設定系統與該聯邦學習系統連接,該方法包括有以下步驟:各該文件機密等級設定系統執行下列步驟:A1、一終端裝置提供一文件;A2、該文件經由該人工智慧分析模組根據一分析模型對於該文件進行機密等級之分析,並且該人工智慧分析模組根據分析結果提供一第一機密等級標籤予該資料外洩防護伺服器;A3、該文件經由一使用者進行機密等級之分析,並提供一第二機密等級標籤予該資料外洩防護伺服器;A4、該資料外洩防護伺服器比對該第一機密等級標籤及該第二機密等級標籤之異同;當該第一機密等級標籤與該第二機密等級標 籤相同時,該資料外洩防護伺服器對該文件標記該第一機密等級標籤,並根據該第一機密等級標籤所定義之內容,對該文件進行加密或權限控管;當該第一機密等級標籤與該第二機密等級標籤不同時,該資料外洩防護伺服器對該文件標記該第二機密等級標籤,由該資料外洩防護伺服器根據該第二機密等級標籤所定義之內容,對該文件進行加密或權限控管;A5、將該分析模型之一模型參數加密形成一加密參數後傳送到該聯邦學習系統;該聯邦學習系統執行下列步驟:B1、接收該些文件機密等級設定系統所傳來的加密參數;B2、將該些加密參數聚合及產生一更新參數;B3、將該更新參數傳送至各該文件機密等級設定系統;各該文件機密等級設定系統更執行下列步驟:A6、各該文件機密等級設定系統接收該更新參數;A7、各該人工智慧分析模組依據該更新參數更新該分析模型;其中,各該文件機密等級設定系統包含一人工智慧訓練模組,該方法更包含:該人工智慧訓練模組接收經該人工智慧分析模組對該文件進行機密等級分析後所產生之分析資料,並依據該分析資料對該分析模型進行重新訓練;更包含有以下步驟:當該人工智慧分析模組係再次對同一文件進行密件等級分析,且提供之該第一機密等級標籤與該使用者提供之該第二機密等級標籤不同時,該人工智慧訓練模組係比對並提取該文件之前後版本的差異內容,並根據該差異內容對該分析模型進行重新訓練。
- 如請求項9所述之文件機密等級管理方法,其中該些文件機密等級設定系統區分為複數個類別,每一該類別包括至少二個該文件機密等級設定系統;該聯邦學習系統包含複數個聯邦平台與一聯邦學習伺服器,各該聯邦平台與各該類別的文件機密等級設定系統連接,該聯邦學習伺服器與該些聯邦平台連接;其中:步驟B1中係由各該聯邦平台接收各該類別的文件機密等級設定系統之加密參數;步驟B2中係由各該聯邦平台將所接收各該類別的文件機密等級設定系統之加密參數並聚合為一中繼參數後傳送至該聯邦學習伺服器;該聯邦學習伺服器將該些中繼參數進行優化與更新,以產生至少一個該更新參數。
- 如請求項10所述之文件機密等級管理方法,其中步驟B2中係產生複數個該更新參數,各該更新參數對應各該類別;且步驟B3中,係將各該更新參數分別傳送至對應之各該類別的該文件機密等級設定系統。
- 如請求項9所述之文件機密等級管理方法,其中該些文件機密等級設定系統區分為複數個類別,每一該類別包括至少二個該文件機密等級設定系統;其中該聯邦學習系統包含複數個聯邦學習伺服器;其中步驟B1中係由各該聯邦學習伺服器接收各該類別的文件機密等級設定系統之加密參數;其中步驟B2係由各該聯邦學習伺服器接收各該類別的文件機密等級設定系統之加密參數並聚合為一中繼參數,該些聯邦學習伺服器之中的二者更將各自的中繼參數相互傳到對方並將來自對方的中繼參數與來自各該類別的文件機密等級設定系統之加密參數 聚合為該更新參數;其中步驟B3係由各該聯邦學習伺服器將各該更新參數傳送至對應之類別的各該文件機密等級設定系統。
- 如請求項9所述之文件機密等級管理方法,包含各該文件機密等級設定系統將重新訓練後的該分析模型之模型參數加密形成該加密參數後傳送到該聯邦學習系統。
- 一種文件機密等級管理方法,應用於一文件機密等級管理系統中,該文件機密等級管理系統包括複數個文件機密等級設定系統與一聯邦學習系統,各該文件機密等級設定包括有一資料外洩防護伺服器與一人工智慧分析模組,各該文件機密等級設定系統與該聯邦學習系統連接,該方法包括有以下步驟:各該文件機密等級設定系統執行下列步驟:A1、一終端裝置提供一文件;A2、該文件經由該人工智慧分析模組根據一分析模型對於該文件進行機密等級之分析,並且該人工智慧分析模組根據分析結果提供一第一機密等級標籤予該資料外洩防護伺服器;A3、該文件經由一使用者進行機密等級之分析,並提供一第二機密等級標籤予該資料外洩防護伺服器;A4、該資料外洩防護伺服器比對該第一機密等級標籤及該第二機密等級標籤之異同;當該第一機密等級標籤與該第二機密等級標籤相同時,該資料外洩防護伺服器對該文件標記該第一機密等級標籤,並根據該第一機密等級標籤所定義之內容,對該文件進行加密或權限控管;當該第一機密等級標籤與該第二機密等級標籤不同時,該資料外洩防護伺服器對該文件標記該第二機密等級標籤,由該資 料外洩防護伺服器根據該第二機密等級標籤所定義之內容,對該文件進行加密或權限控管;A5、將該分析模型之一模型參數加密形成一加密參數後傳送到該聯邦學習系統;該聯邦學習系統執行下列步驟:B1、接收該些文件機密等級設定系統所傳來的加密參數;B2、將該些加密參數聚合及產生一更新參數;B3、將該更新參數傳送至各該文件機密等級設定系統;各該文件機密等級設定系統更執行下列步驟:A6、各該文件機密等級設定系統接收該更新參數;A7、各該人工智慧分析模組依據該更新參數更新該分析模型;其中,在步驟A2之後,該資料外洩防護伺服器係對該文件標記該第一機密等級標籤,並根據該第一機密等級標籤所定義之內容,對該文件進行加密或權限控管;在步驟A4中,當該第二機密等級標籤與該第一機密等級標籤不同時,該資料外洩防護伺服器將該文件的標記變更為該第二機密等級標籤,並根據該第二機密等級標籤所定義之內容,對該文件進行加密或權限控管。
- 一種文件機密等級管理方法,應用於一文件機密等級管理系統中,該文件機密等級管理系統包括複數個文件機密等級設定系統與一聯邦學習系統,各該文件機密等級設定包括有一資料外洩防護伺服器與一人工智慧分析模組,各該文件機密等級設定系統與該聯邦學習系統連接,該方法包括有以下步驟:各該文件機密等級設定系統執行下列步驟:A1、一終端裝置提供一文件; A2、該文件經由該人工智慧分析模組根據一分析模型對於該文件進行機密等級之分析,並且該人工智慧分析模組根據分析結果提供一第一機密等級標籤予該資料外洩防護伺服器;A3、該文件經由一使用者進行機密等級之分析,並提供一第二機密等級標籤予該資料外洩防護伺服器;A4、該資料外洩防護伺服器比對該第一機密等級標籤及該第二機密等級標籤之異同;當該第一機密等級標籤與該第二機密等級標籤相同時,該資料外洩防護伺服器對該文件標記該第一機密等級標籤,並根據該第一機密等級標籤所定義之內容,對該文件進行加密或權限控管;當該第一機密等級標籤與該第二機密等級標籤不同時,該資料外洩防護伺服器對該文件標記該第二機密等級標籤,由該資料外洩防護伺服器根據該第二機密等級標籤所定義之內容,對該文件進行加密或權限控管;A5、將該分析模型之一模型參數加密形成一加密參數後傳送到該聯邦學習系統;該聯邦學習系統執行下列步驟:B1、接收該些文件機密等級設定系統所傳來的加密參數;B2、將該些加密參數聚合及產生一更新參數;B3、將該更新參數傳送至各該文件機密等級設定系統;各該文件機密等級設定系統更執行下列步驟:A6、各該文件機密等級設定系統接收該更新參數;A7、各該人工智慧分析模組依據該更新參數更新該分析模型;其中,於步驟A3中,該使用者係於數個基準模型當中選擇其中一該基準模型,並由該人工智慧分析模組根據該使用者所選擇之該基 準模型對該文件進行機密等級之分析,並由使用者根據分析結果提供該第二機密等級標籤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109132910A TWI769531B (zh) | 2020-09-23 | 2020-09-23 | 文件機密等級管理系統及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109132910A TWI769531B (zh) | 2020-09-23 | 2020-09-23 | 文件機密等級管理系統及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202213145A TW202213145A (zh) | 2022-04-01 |
TWI769531B true TWI769531B (zh) | 2022-07-01 |
Family
ID=82197105
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW109132910A TWI769531B (zh) | 2020-09-23 | 2020-09-23 | 文件機密等級管理系統及方法 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI769531B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI832701B (zh) * | 2023-02-14 | 2024-02-11 | 國立成功大學 | 具有叢集架構的聯邦式學習預約平台、預約系統及其預約方法 |
CN117034328B (zh) * | 2023-10-09 | 2024-03-19 | 国网信息通信产业集团有限公司 | 一种改进的基于联邦学习的异常用电检测***及方法 |
CN117763607B (zh) * | 2023-12-20 | 2024-06-25 | 北京汉勃科技有限公司 | 基于大模型的文件安全定级方法、***、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7100195B1 (en) * | 1999-07-30 | 2006-08-29 | Accenture Llp | Managing user information on an e-commerce system |
CN107409126A (zh) * | 2015-02-24 | 2017-11-28 | 思科技术公司 | 用于保护企业计算环境安全的***和方法 |
TW201919366A (zh) * | 2017-11-14 | 2019-05-16 | 香港商阿里巴巴集團服務有限公司 | 共享空間的訪問方法、權限管理方法及裝置 |
-
2020
- 2020-09-23 TW TW109132910A patent/TWI769531B/zh active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7100195B1 (en) * | 1999-07-30 | 2006-08-29 | Accenture Llp | Managing user information on an e-commerce system |
CN107409126A (zh) * | 2015-02-24 | 2017-11-28 | 思科技术公司 | 用于保护企业计算环境安全的***和方法 |
TW201919366A (zh) * | 2017-11-14 | 2019-05-16 | 香港商阿里巴巴集團服務有限公司 | 共享空間的訪問方法、權限管理方法及裝置 |
Also Published As
Publication number | Publication date |
---|---|
TW202213145A (zh) | 2022-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI769531B (zh) | 文件機密等級管理系統及方法 | |
WO2022134588A1 (zh) | 信息审核分类模型的构建方法和信息审核方法 | |
US20230214723A1 (en) | Method and system for implementing machine learning analysis of documents | |
US10692019B2 (en) | Failure feedback system for enhancing machine learning accuracy by synthetic data generation | |
US8990202B2 (en) | Identifying and suggesting classifications for financial data according to a taxonomy | |
US11625647B2 (en) | Methods and systems for facilitating analysis of a model | |
US11410448B2 (en) | Predictive analysis systems and methods using machine learning | |
US20240070318A1 (en) | Privacy Preserving Data Labeling | |
Ong et al. | Context-aware data loss prevention for cloud storage services | |
Shaikh et al. | An end-to-end machine learning pipeline that ensures fairness policies | |
CN112288279A (zh) | 基于自然语言处理和线性回归的业务风险评估方法和装置 | |
Yang et al. | Group decision making with incomplete interval‐valued q‐rung orthopair fuzzy preference relations | |
CN114117513A (zh) | 与特定受众共享数据 | |
CN117473431A (zh) | 一种基于知识图谱的机场数据分类分级方法及*** | |
Amaral et al. | Ml-based compliance verification of data processing agreements against gdpr | |
CN113868419A (zh) | 基于人工智能的文本分类方法、装置、设备及介质 | |
CN116737111B (zh) | 一种基于场景化的安全需求分析方法 | |
TW202205117A (zh) | 文件機密等級設定系統及方法 | |
Mohamad et al. | Identifying security-related requirements in regulatory documents based on cross-project classification | |
US20230196138A1 (en) | Labeling platform declarative model | |
CN112699245A (zh) | 预算管理知识图谱的构建方法、装置及应用方法、装置 | |
WO2023076910A1 (en) | A cognoscible computing engine for automatic decisioning on sensitive, confidential and personal data | |
US11361567B2 (en) | Methods and systems for facilitating classification of portions of a regulatory document | |
WO2021158984A1 (en) | Methods and systems for facilitating analysis of a model | |
Santiputri et al. | Mining goal refinement patterns: distilling know-how from data |