TW202407575A - 一種用於推薦文章之編輯系統 - Google Patents

一種用於推薦文章之編輯系統 Download PDF

Info

Publication number
TW202407575A
TW202407575A TW111129666A TW111129666A TW202407575A TW 202407575 A TW202407575 A TW 202407575A TW 111129666 A TW111129666 A TW 111129666A TW 111129666 A TW111129666 A TW 111129666A TW 202407575 A TW202407575 A TW 202407575A
Authority
TW
Taiwan
Prior art keywords
draft
articles
article
vector
editing system
Prior art date
Application number
TW111129666A
Other languages
English (en)
Other versions
TWI849472B (zh
Inventor
廖偉盛
黃鈺琪
許郁婷
Original Assignee
股感媒體科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 股感媒體科技股份有限公司 filed Critical 股感媒體科技股份有限公司
Priority to TW111129666A priority Critical patent/TWI849472B/zh
Priority claimed from TW111129666A external-priority patent/TWI849472B/zh
Publication of TW202407575A publication Critical patent/TW202407575A/zh
Application granted granted Critical
Publication of TWI849472B publication Critical patent/TWI849472B/zh

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本發明提供一種用於推薦文章之編輯系統,其包含編寫應用程式及雲端伺服器,透過編寫應用程式以產生文章初稿並傳輸至雲端伺服器。前述雲端伺服器又含複數篇文章,而透過將該文章初稿及該複數篇文章分別分離出初稿單詞組合及複數個文章單詞組合,這些組合再分別轉換為初稿向量及複數個向量,以令複數個向量相對應於複數篇文章;複數篇文章與複數個向量分成多個群組並依據多個群組建立主題模型,將該初稿向量導入該主題模型並選出一群組以計算該群組之一向量與該初稿向量間的相似度值,當該相似度值高於一閥值時,則推薦與該向量相對應的文章。

Description

一種用於推薦文章之編輯系統
本發明大致上係關於一種編輯系統,特別係指關於一種用於推薦文章之編輯系統。
傳統上,當筆者在撰寫文章時,通常會依據其過往熟知的內容或經驗來進行撰寫,而在撰寫的過程中,筆者所撰寫的內容往往會受限於自身過去的閱讀方向而在撰寫的內容中產生偏重或論述不足的情形。即便筆者為了充實其撰寫的內容而花費時間多方閱讀文章,但現有的文章來源過多,使筆者無法在有限的時間內找到與筆者思維重度相關的文章,且瀏覽某些網站平台的文章時,這些平台往往會在該文章末端提供其他相關內容推薦,上述所推薦之內容常見以2至3篇文章作為衍伸閱讀,且但是這些作為衍伸閱讀之文章有時並未與筆者所撰寫之主題內容正相關。
另一方面,當筆者閱讀經由搜尋所得之多篇文章時,在每一已閱讀之文章中對於所欲闡述的議題之各面向的比例及深度不同,讓筆者難以比較每一已閱讀之文章與其正在撰寫文章的關聯度高低,使筆者難以有效率且去蕪存菁地閱讀,因此,筆者在參考文章時,可能會忽略掉與其正在撰寫文章關聯度較高的文章,致使筆者未能及時獲取最需要的內容。
為了讓筆者能有效率地蒐羅與其所撰寫之內容高關聯性的文章,以助其增廣見聞並引導其快速認知其所閱讀的面向深度以助其強化所撰寫 之內容的完整度,故如何即時推薦筆者選擇所需的文章以讓筆者不浪費時間尋找並循著捷徑深化閱讀所需知識,即為每個業者所亟需解決的問題。
本發明之目的在於提供一種用於推薦文章之編輯系統。當使用者利用本發明之編輯系統撰寫文章初稿時,為了將其內心所欲陳述的評論或想法於其文章初稿做完整表示,使用者可利用本系統尋找與其文章初稿相關的參考文章並進行閱讀以求對於其文章初稿完整論述。而透過本發明之系統找出與該文章初稿高關聯性之文章時,能將文章初稿與在不同類型之文章群中進行比對以找出與該文章初稿有較高關聯性的文章,使本發明系統將這些高關聯性的文章提供給使用者,讓使用者參考這些文章後對於其所欲發表的初稿內容得以再做進一步調整或補綴內容,一方面提升使用者對於特定知識或議題的認知範圍,使其構想不再只是侷限於局部,另一方面,透過本發明的資訊分析所找出之推薦文章,讓使用者亦可參考這些推薦文章而重新審視其所撰寫之文章初稿的主題方向及重點內容是否有不足的地方。
本發明之另一目的在於建立多個主題模型並依此建構多個二維地圖,以供使用者找出適合的主題模型並從該主題模型中找出推薦之多篇文章,而被推薦的多篇文章會以編號顯示於二維地圖上。而在雲端伺服器的多篇文章會先分離出多個單詞組合並將上述多個單詞組合轉為轉換為與其相對應之複數個向量,以令該複數個向量相對應於該多篇文章,再使該複數篇文章與其相對應之該複數個向量分成多個群組並依據該多個群組建立一主題模型;上述主題模型又可為生活投資、理財、房產生活或區域總經等等主題模型;在每一個主題模型會再做進一步細部分群(例如,以生活投資為主題模型之下還會再細 分出產業思維、商業思維及投資思維三種子分類),且依據該主題模型以建構一二維地圖,並將該複數個向量座標化以產生複數個座標,使複數個座標呈現於該二維地圖上。
另外,使用者所撰擬的文章初稿會先分離出初稿單詞組合並將上述初稿單詞組合轉換為與其相對應之一初稿向量,以令該初稿向量相對應於該文章初稿,於本發明中,利用本發明系統可計算使用者之初稿向量與一主題模型中之一群組之一向量與該初稿向量間的相似度值,當該相似度值高於一閥值時,則推薦與該向量相對應的文章,故,當使用者閱讀本系統所推薦之文章時,可藉由吸收的新知而調整其所撰寫的文章初稿以豐富其內容。
於本發明的第一觀點中,本發明系統係在使用者撰擬文章初稿時推薦給使用者複數個與上述文章初稿具有高關聯性之文章,其包含一編寫應用程式及一雲端伺服器,其中上述編寫應用程式係位於一第一電子裝置(例如,手持電子裝置、桌上型電腦)中,而上述第一電子裝置又具有一第一處理裝置、一第一記憶體、無線傳輸模組,其中前述第一記憶體,例如雲端硬碟(Microsoft SkyDrive、Google Drive、Apple iTune)或一般硬碟,耦合第一處理裝置(可包含CPU、緩衝器、多工器等處理單元),用以儲存上述編寫應用程式,其中透過上述編寫應用程式所提供之一操作介面輸入內容(包括但不限於文字、圖片)以產生一文章初稿,其中前述文章初稿亦儲存於前述第一記憶體,而上述文章初稿係又進一步透過該第一電子裝置之無線傳輸模組輸出至雲端伺服器。
於本發明的第二觀點中,本發明揭露一雲端伺服器,前述雲端伺服器進一步包含一第二處理裝置、一通訊介面及複數篇文章,前述雲端伺服器之通訊介面與上述無線傳輸模組連結完成後則自該編寫應用程式傳輸該文章 初稿至該雲端伺服器,其中前述雲端伺服器又進一步包含一語料庫、轉換模組、分群模組、運算模組。上述之語料庫耦合該第二處理裝置用以儲存該文章初稿、複數篇文章、與該文章初稿相對應之一初稿單詞組合及與該複數篇文章相對應之複數個文章單詞組合(即每一文章具有相對應之一文章單詞組合),進一步而言,初稿單詞組合係分離自該文章初稿,該複數個文章單詞組合係分離自該複數篇文章(即每一文章單詞組合係分離自每一篇文章);上述轉換模組則耦合該第二處理裝置及該語料庫,其具有一機器學習模型以將上述初稿單詞組合轉換為與其相對應之一初稿向量,且上述複數個文章單詞組合亦被轉換為與其相對應之複數個向量,以令上述初稿向量相對應於該文章初稿,且該複數個向量相對應於該複數篇文章;另一方面,為了將上述複數篇文章進行分類,於本發明之雲端伺服器又包含一分群模組,其耦合該第二處理裝置,將上述複數篇文章與其相對應之該複數個向量分成多個群組並依據該多個群組建立一主題模型;上述運算模組耦合該第二處理裝置,將上述初稿向量導入該主題模型並選出一群組,並利用一第一演算模型計算前述群組之一向量與該初稿向量間的相似度值,當前數相似度值高於一閥值時,則推薦與該向量相對應的文章。進一步而言,上述複數篇文章與複數個文章單詞組合的相對應關係在於上述的複數篇文章亦被分離出與其相對應之複數個文章單詞組合;而上述文章初稿與初稿單詞組合的相對應關係在於上述的文章初稿亦被分離出與其相對應之初稿單詞組合。進一步而言,上述所指之單詞又進一步為關鍵字。
於本發明的第三觀點中,本發明除了揭露一種用於推薦文章之編輯系統,亦揭露該系統之文章推薦方法,其步驟包含:透過一編寫應用程式以產生一文章初稿並傳輸至該雲端伺服器,其中前述雲端伺服器又包含複數篇 文章;從上述文章初稿及複數篇文章分別分離出一初稿單詞組合及複數個文章單詞組合;利用一機器學習模型以將上述初稿單詞組合轉換為與其相對應之一初稿向量,且上述複數個文章單詞組合亦被轉換為與其相對應之複數個向量,以令該初稿向量相對應於該文章初稿,且該複數個向量相對應於該複數篇文章;將該複數篇文章與其相對應之該複數個向量分成多個群組並依據該多個群組建立一主題模型;將該初稿向量導入該主題模型並選出一群組,並利用一第一演算模型計算該群組之一向量與該初稿向量間的相似度值,當該相似度值高於一閥值時,則推薦與該向量相對應的文章;若該相似度值低於一閥值時,則不推薦與該向量相對應的文章。在一實施例中,上述機器學習模型係進一步為Doc2Vec模型。於某些實施例中,上述之相似度值進一步為餘弦相似度值。在一實施例中,上述第一演算模型進一步計算上述初稿向量與上述向量間的餘弦相似度值,若上述初稿向量與上述向量間的夾角角度越小,則換算出的餘弦相似度值越高,表示與該向量相對應的文章及使用者的文章初稿高度相似,因此,當該相似度值高於一閥值時,本發明之系統將推薦與上述向量相對應的文章給使用者參考。
在某一實施例中,上述系統進一步包含一分離模組,其耦合該第二處理裝置,上述文章初稿及該複數篇文章係藉由該分離模組之一第二演算模型分別分離出該初稿單詞組合及該複數個文章單詞組合;於某些實施例中,上述分離模組之第二演算模型進一步包含彈性搜尋(elasticsearch)元件以從該文章初稿、複數篇文章分別找出該初稿單詞組合及該複數個文章單詞組合;於另一實施例中,上述第二演算模型又進一步包含ik分詞演算法,其係用於將文章初稿及複數篇文章進行切詞及剔除不必要之詞彙(例如,標點符號、虛詞等 等),以從文章初稿分離出上述初稿單詞組合,且上述複數篇文章亦被分離出複數個文章單詞組合(即每一篇文章被分離出一文章單詞組合)。
100:用於推薦文章之編輯系統
102:編寫應用程式
104:雲端伺服器
106:第一電子裝置
108:第一處理裝置
110:第一記憶體
112:無線傳輸模組
114:顯示器
116:第二處理裝置
118:通訊介面
120:語料庫
122:轉換模組
124:分群模組
126:運算模組
128:分離模組
130:資料視覺化模組
A:文章初稿
A1:初稿單詞組合
B-J:複數篇文章
B1-J1:複數個文章單詞組合
202~210:步驟
300:用於推薦文章之編輯系統
302:分離模組
304:轉換模組
306:分群模組
A:文章初稿
A1:初稿單詞組合
B-J:複數篇文章
B1-J1:複數個文章單詞組合
a:初稿向量
b-j:複數個向量
Mo:主題模型
Go1:第一群組
Go2:第二群組
Go3:第三群組
Ma:二維地圖
1-7:編號
400:用於推薦文章之編輯系統
402:表格
本發明之實施例係藉由後附圖式中之實例加以說明,而非用以限制本發明。後附圖式中相似之元件符號係指類似之元件。
圖1係用以顯示一種用於推薦文章之編輯系統之基本架構以及其應用架構之方塊示意圖。
圖2係顯示本發明系統之文章推薦方法流程圖。
圖3(a)係為一實施例用以顯示本發明編輯系統中之數據流程圖。
圖3(b)係本發明之一實施例用以顯示本發明之二維地圖。
圖4係利用一實施例顯示透過本發明推薦之文章。
本發明將以較佳實施例及觀點加以描述,此類敘述係解釋本發明之系統與方法,僅用以說明而非用以限制本發明之申請專利範圍。因此,除說明書中之較佳實施例以外,本發明亦可廣泛實行於其他實施例中。
如圖1所示,其用以顯示一種用於推薦文章之編輯系統100之基本架構以及其應用架構之方塊示意圖。本發明之系統100係依據使用者所撰擬之文章初稿以從雲端伺服器之複數篇文章找出並推薦與前述文章初稿高關聯性的文章,其包含一編寫應用程式102及一雲端伺服器104,其中上述編寫應用程式係位於一第一電子裝置106(例如,手持電子裝置、桌上型電腦)中,而上述第一電子裝置106又具有一第一處理裝置108、一第一記憶體110、無線傳輸模組112及顯示器114,其中前述第一記憶體110,例如雲端硬碟(Microsoft SkyDrive、Google Drive、Apple iTune)或一般硬碟,耦合第一處理裝置108(可包含CPU、緩衝器、多工器等處理單元),用以儲存上述編寫應用程式102,其中透過上述編寫應用程式102所提供之一操作介面1021輸入內容(包括但不限於文字、圖片)用以產生一文章初稿A,其中前述文章初稿A亦儲存於前述第一記憶體110,而上述文章初稿A係又進一步透過該第一電子裝置106之無線傳輸模組112輸出至雲端伺服器104。上述顯示器114係耦合第一處理裝置108以顯示上述編寫應用程式102。
本發明系統進一步揭露一雲端伺服器104,前述雲端伺服器進一步包含一第二處理裝置116、一通訊介面118及複數篇文章B-J,前述雲端伺服器104之通訊介面118與上述無線傳輸模組112連結完成後則自該編寫應用程式102傳輸該文章初稿A至該雲端伺服器,其中前述雲端伺服器104又進一步包含一語料庫120、轉換模組122、分群模組124、運算模組126。上述之語料庫120耦合該第二處理裝置116用以儲存該文章初稿A、該複數篇文章B-J、初稿單詞組合A1及複數個文章單詞組合B1-J1,其中該初稿單詞組合A1係分離自該文章初稿A,該複數個文章單詞組合B1-J1係分離自該複數篇文章B-J,即文章初稿A具有相對應之初稿單詞組合A1,每一文章具有相對應之一文章單詞組合(例如,文章B具有相對應之一文章單詞組合B1),進一步而言,上述初稿單詞組合A1係分離自前述之文章初稿A,而上述複數個文章單詞組合B1-J1係分離自上述複數篇文章B-J。於某些實施例中,上述初稿單詞組合A1進一步為該文章初稿的多個單詞所組合而成,而上述複數個文章單詞組合中每一文章單詞組合進一步為每一文章的多個單詞所組合而成(例如,文章單詞組合B1進一步為文章B的多個單詞所組合而成)。進一步而言,上述所指之單詞又進一步為關鍵字。
於某些實施例中,為了從上述文章初稿A及複數篇文章B-J分別分離出初稿單詞組合A1及複數個文章單詞組合B1-J1,本發明之系統100進一步包含分離模組128,其係耦合該第二處理裝置116,而前述文章初稿A及該複數篇文章B-J係藉由該分離模組128之一第二演算模型分別分離出該初稿單詞組合及該複數個文章單詞組合;上述第二演算模型進一步包含彈性搜尋(elasticsearch)元件以分別從該文章初稿A、複數篇文章B-J分別找出該初稿單詞組合A1及該複數個文章單詞組合B1-J1;於一實施例中,上述第二演算模型又進一步包含ik分詞演算法以分別從該文章初稿A、複數篇文章B-J分別分離出該初稿單詞組合A1及該複數個文章單詞組合B1-J1。
在一實施例中,上述轉換模組122則耦合上述第二處理裝置116,其具有一機器學習模型以將該初稿單詞組合A1轉換為與其相對應之一初稿向量,且該複數個文章單詞組合B1-J1亦被轉換為與其相對應之複數個向量,以令該初稿向量相對應於該文章初稿A,且該複數個向量相對應於該複數篇文章B-J(請參照圖3)。在一實施例中,上述機器學習模型係進一步為Doc2Vec模型。
於某些實施例中,為了將上述複數篇文章B-J進行分類,於本發明之雲端伺服器又包含一分群模組124,其耦合該第二處理裝置116,將該複數篇文章與其相對應之該複數個向量分成多個群組並依據該多個群組建立一主題模型;上述運算模組126,耦合該第二處理裝置116,以將該初稿向量導入該主題模型並選出一群組,並利用一第一演算模型計算該群組之一向量與該初稿向量間的相似度值,當該相似度值高於一閥值時,則推薦與該向量相對應的文章(請參照以下圖3(a))。
於一實施例中,上述系統進一步包含一資料視覺化模組130,其係依據上述主題模型以建構一二維地圖(請參照圖3(b)),而前述資料視覺化模組係將該與該向量相對應的文章以編號顯示於該二維地圖。另一方面,上述運算模組進一步又將該複數個向量與該初稿向量坐標化而分別產生複數個坐標,而上述複數個坐標進一步透過該資料視覺化模組呈現於該二維地圖上。於一實施例中,本發明之系統進一步包含一表格生成模組以將該與該向量相對應的文章並加以編號及表格化。
參照圖2所示,圖2係為本發明系統之文章推薦方法流程圖,其對應於上述用於推薦文章之編輯系統,以下配合本發明之方法步驟202~210進行詳細闡述。
本發明除了揭露一種用於推薦文章之編輯系統,亦揭露該系統之文章推薦方法,如步驟202所示,透過一編寫應用程式以產生一文章初稿並傳輸至該雲端伺服器。
如步驟204所示,從該文章初稿及複數篇文章分別分離出一初稿單詞組合及複數個文章單詞組合。
如步驟206所示,利用一機器學習模型以將該初稿單詞組合轉換為與其相對應之一初稿向量,且該複數個文章單詞組合亦被轉換為與其相對應之複數個向量,以令該初稿向量相對應於該文章初稿,且該複數個向量相對應於該複數篇文章。
如步驟208所示,將該複數篇文章與其相對應之該複數個向量分成多個群組並依據該多個群組建立一主題模型。
如步驟210所示,將該初稿向量導入該主題模型並選出一群組,並利用一第一演算模型計算該群組之一向量與該初稿向量間的相似度值,當該相似度值高於一閥值時,則推薦與該向量相對應的文章。於某些實施例中,上述之相似度值進一步為餘弦相似度值。在一實施例中,上述第一演算模型進一步計算上述初稿向量與上述向量間的餘弦相似度值,若上述初稿向量與上述向量間的夾角角度越小,則換算出的餘弦相似度值越高,表示與該向量相對應的文章及使用者的文章初稿高度相似,因此,當該相似度值高於一閥值時,本發明之系統將推薦與上述向量相對應的文章給使用者參考。
請參照圖3(a)及(b),圖3(a)及(b)係為一實施例用以顯示本發明用於推薦文章之編輯系統300中之數據流程圖。上述文章初稿A則自該編寫應用程式傳輸至該雲端伺服器,而前述雲端伺服器又包含複數篇文章B-J,其中前述文章初稿A及複數篇文章B-J係藉由該分離模組302之一第二演算模型分別分離出該初稿單詞組合A1及該複數個文章單詞組合B1-J1;再利用轉換模組304之機器學習模型以將上述初稿單詞組合A1轉換為與其相對應之一初稿向量a,且上述複數個文章單詞組合B1-J1亦被轉換為與其相對應之複數個向量b-j,以令上述初稿向量a相對應於該文章初稿A,且該複數個向量b-j相對應於該複數篇文章B-J;於本發明之系統中,上述分群模組306其耦合該第二處理裝置,將上述複數篇文章B-J與其相對應之該複數個向量b-j分成多個群組並依據該多個群組建立一主題模型,舉例而言,將文章B-D與其相對應之該複數個向量b-d被分為第一群組Go1,文章E-G其相對應之該複數個向量e-g被分為第二群組Go2,文章H-J其相對應之該複數個向量h-j被分為第三群組Go3,使上述主題模型Mo包含上述第一群組Go1、第二群組Go2及第三群組Go3,其中上述初稿向量a導入該主題 模型Mo並選出上述第一群組Go1,並利用一第一演算模型計算該第一群組Go1之向量b與該初稿向量a間的相似度值,當該相似度值高於一閥值時,則推薦與該向量b相對應的文章B;若該相似度值低於一閥值時,則不推薦與該向量b相對應的文章B。
於某一實施例中,上述系統進一步包含一資料視覺化模組,其係依據上述主題模型以建構一二維地圖,而前述資料視覺化模組係將該與該向量b相對應的文章以編號顯示於該二維地圖。另一方面,上述運算模組進一步將該複數個向量b-j與該初稿向量a坐標化而分別產生複數個坐標,而上述複數個坐標進一步透過該資料視覺化模組呈現於該二維地圖上。
請參照圖3(b),圖3(b)係本發明之一實施例用以顯示本發明之二維地圖。舉例而言,圖3(b)係進一步為依據圖3(a)中數據流程產生之結果而構成之二維地圖Ma。由於該複數篇文章與其相對應之該複數個向量進一步被分成三個群組,並依據該三個群組建立一主題模型Mo,因此,從上述二維地圖呈現出上述主題模型Mo由第一群組Go1、第二群組Go2及第三群組Go3所建立而成,另外,本發明係將該初稿向量a座標化而產生座標a,而為了推薦與該向量b相對應的文章B,本發明係將該向量b座標化而產生座標b,可見與該向量b相對應的文章B為前述資料視覺化模組以編號“1”顯示於該二維地圖的座標b,而與該初稿向量a相對應之文章初稿A則以“本篇”顯示於該二維地圖的座標a。另一方面,當第一群組Go1之其他向量與該初稿向量間的相似度值亦高於一閥值時,本發明係將該其他向量座標化而產生多個座標,則也推薦與該其他向量相對應的其他文章並透過前述資料視覺化模組以編號顯示於該二維地圖的多個座標,如圖3(b)所示的編號“2~7”。在一實施例中,當與該向量b相對應的文 章B為前述資料視覺化模組以編號“1”顯示時,則表示上述文章B之向量b與該初稿向量間具有最高的相似度值。
請參照圖4,圖4係利用一實施例顯示透過本發明推薦之文章。本發明之用於推薦文章之編輯系統400進一步包含一表格生成模組以生成一表格402。舉例而言,若使用者將該初稿向量導入“房產生活”分類的主題模型並選出一“投資思維”之群組,並利用上述第一演算模型計算該“投資思維”群組之多個向量與該初稿向量間的相似度值,當有5個向量該初稿向量間的相似度值均高於一閥值時,則推薦與該5個向量相對應的5個文章。為了推薦上述5個文章,本發明之系統所包含一表格生成模組以將上述5個文章依照相似度值由高至低排列並加以編號及表格化,因此,在表格的文章標題中排名第1的“都是三房差在哪?大三房、小三房、2+1房哪個好?”即為其向量與初稿向量間的相似度值最高的文章;在表格402中亦會呈現編號、每個文章的標題及作者、主題模型(例如,“房產生活”分類)、主題模型中之群組(例如,“投資思維”)、被推薦之每個文章的點擊總流量及近一月的流量。
本發明之方法中的若干者係以其最基礎的形式加以敘述,但在不脫離本發明之基礎範圍下仍可加入若干方法至其任一者或從其任一者刪除若干方法,且可增加若干資訊至此處所述訊息之任一者中或從其刪減若干資訊。此領域中具通常知識之技藝者將得以領會,可對本發明進一步做若干更動及改變。此處所提供之特定實施例並非用以限制本發明,而係用以說明本發明。
以上敘述係為本發明之較佳實施例。此領域之技藝者應得以領會其係用以說明本發明而非用以限定本發明所主張之專利權利範圍。其專利保護範圍當視後附之申請專利範圍及其等同領域而定。凡熟悉此領域之技藝者, 在不脫離本專利精神或範圍內,所作之更動或潤飾,均屬於本發明所揭示精神下所完成之等效改變或設計,且應包含在下述之申請專利範圍內。
100:用於推薦文章之編輯系統
102:編寫應用程式
104:雲端伺服器
106:第一電子裝置
108:第一處理裝置
110:第一記憶體
112:無線傳輸模組
114:顯示器
116:第二處理裝置
118:通訊介面
120:語料庫
122:轉換模組
124:分群模組
126:運算模組
128:分離模組
130:資料視覺化模組
A:文章初稿
A1:初稿單詞組合
B-J:複數篇文章
B1-J1:複數個文章單詞組合

Claims (10)

  1. 一種用於推薦文章之編輯系統,其包含:
    一編寫應用程式,其裝設於一第一電子裝置之第一記憶體,並耦合該第一電子裝置之第一處理裝置,用以產生一文章初稿,其中該文章初稿係透過該第一電子裝置之無線傳輸模組輸出;
    一雲端伺服器,包含一第二處理裝置、一通訊介面及複數篇文章,當該無線傳輸模組與該通訊介面連結完成後則自該編寫應用程式傳輸該文章初稿至該雲端伺服器,其中該雲端伺服器包含:
    一語料庫,其耦合該第二處理裝置用以儲存該文章初稿、該複數篇文章、初稿單詞組合及複數個文章單詞組合,其中該初稿單詞組合係分離自該文章初稿,該複數個文章單詞組合係分離自該複數篇文章;
    一轉換模組,耦合該第二處理裝置及該語料庫,其具有一機器學習模型以將該初稿單詞組合轉換為與其相對應之一初稿向量,且該複數個文章單詞組合亦被轉換為與其相對應之複數個向量,以令該初稿向量相對應於該文章初稿,且該複數個向量相對應於該複數篇文章;
    一分群模組,其耦合該第二處理裝置,將該複數篇文章與其相對應之該複數個向量分成多個群組並依據該多個群組建立一主題模型;
    一運算模組,其耦合該第二處理裝置,將該初稿向量導入該主題模型並選出一群組,並利用一第一演算模型計算該群組之一向量與該初稿向量間的相似度值,當該相似度值高於一閥值時,則推薦與該向量相對應的文章。
  2. 如請求項第1項所述之用於推薦文章之編輯系統,其中該系統進一步包含一資料視覺化模組,其係依據該主題模型以建構一二維地圖。
  3. 如請求項第2項所述之用於推薦文章之編輯系統,其中該資料視覺化模組係將該與該向量相對應的文章以編號顯示於該二維地圖。
  4. 如請求項第2項所述之用於推薦文章之編輯系統,其中該運算模組進一步將該複數個向量與該初稿向量坐標化而分別產生複數個坐標。
  5. 如請求項第4項所述之用於推薦文章之編輯系統,其中該複數個坐標透過該資料視覺化模組呈現於該二維地圖上。
  6. 如請求項第1項所述之用於推薦文章之編輯系統,其中該複數篇文章與其相對應之該複數個向量進一步被分成三個群組。
  7. 如請求項第1項所述之用於推薦文章之編輯系統,其中該相似度值進一步為餘弦相似度值。
  8. 如請求項第1項所述之用於推薦文章之編輯系統,其中該系統進一步包含一分離模組,耦合該第二處理裝置,該文章初稿及該複數篇文章係藉由該分離模組之一第二演算模型分別分離出該初稿單詞組合及該複數個文章單詞組合。
  9. 如請求項第8項所述之用於推薦文章之編輯系統,其中該第二演算模型進一步包含彈性搜尋(elasticsearch)元件以從該文章初稿、複數篇文章分別找出該初稿單詞組合及該複數個文章單詞組合。
  10. 如請求項第8項所述之用於推薦文章之編輯系統,其中該第二演算模型包含ik分詞演算法,以從該文章初稿、該複數篇文章分別分離出該初稿單詞組合及該複數個文章單詞組合。
TW111129666A 2022-08-04 一種用於推薦文章之編輯系統 TWI849472B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW111129666A TWI849472B (zh) 2022-08-04 一種用於推薦文章之編輯系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW111129666A TWI849472B (zh) 2022-08-04 一種用於推薦文章之編輯系統

Publications (2)

Publication Number Publication Date
TW202407575A true TW202407575A (zh) 2024-02-16
TWI849472B TWI849472B (zh) 2024-07-21

Family

ID=

Similar Documents

Publication Publication Date Title
Tandoc Jr et al. Man vs. machine? The impact of algorithm authorship on news credibility
US20130263019A1 (en) Analyzing social media
US20130018892A1 (en) Visually Representing How a Sentiment Score is Computed
US20090083096A1 (en) Handling product reviews
US11055338B2 (en) Dynamic facet tree generation
US20060200341A1 (en) Method and apparatus for processing sentiment-bearing text
US10324917B2 (en) Methods and systems for data management
US20120259617A1 (en) System and method for slang sentiment classification for opinion mining
WO2013161850A1 (ja) テキストマイニングシステム、テキストマイニング方法及びプログラム
US11042689B2 (en) Generating a document preview
JP2015508514A (ja) アプリケーション・データファイルからの情報のコンピュータ支援消費のための方法およびシステム
US9569510B2 (en) Crowd-powered self-improving interactive visualanalytics for user-generated opinion data
US11574123B2 (en) Content analysis utilizing general knowledge base
CN108710654A (zh) 一种舆情数据可视化方法及设备
US20120141968A1 (en) Evaluation Assistant for Online Discussion
US20210406270A1 (en) Leveraging Interlinking Between Information Resources to Determine Shared Knowledge
US9020962B2 (en) Interest expansion using a taxonomy
US8458192B1 (en) System and method for determining topic interest
US20160260339A1 (en) System for taking notes
US20240086452A1 (en) Tracking concepts within content in content management systems and adaptive learning systems
TW202407575A (zh) 一種用於推薦文章之編輯系統
WO2021117483A1 (ja) 情報処理装置、情報処理方法、およびプログラム
US20220300762A1 (en) Ordering presentation of training documents for machine learning
US10474726B2 (en) Generation of digital documents
CN116868212A (zh) 术语定义的定制转换和质量评估