TWI776020B - 鎖定用戶興趣之裝置、方法及其電腦程式產品 - Google Patents
鎖定用戶興趣之裝置、方法及其電腦程式產品 Download PDFInfo
- Publication number
- TWI776020B TWI776020B TW108105153A TW108105153A TWI776020B TW I776020 B TWI776020 B TW I776020B TW 108105153 A TW108105153 A TW 108105153A TW 108105153 A TW108105153 A TW 108105153A TW I776020 B TWI776020 B TW I776020B
- Authority
- TW
- Taiwan
- Prior art keywords
- user
- interest
- users
- articles
- key
- Prior art date
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一種鎖定用戶興趣之裝置、方法及其電腦程式產品。該裝置儲存複數個興趣類別、複數篇文章、各該文章所對應之複數個關鍵字及一用戶之一閱讀記錄。該裝置利用該等文章建立複數個關聯規則,其中各該關聯規則介於該等興趣類別其中之一與該等關鍵字其中之一。該裝置根據該閱讀記錄確認該用戶之複數篇已讀文章,且根據該用戶之該等已讀文章決定該用戶之一關鍵字集,其中該用戶之該等已讀文章為該等文章之一子集,且該用戶之該關鍵字集為該等關鍵字之一子集。該裝置還根據該用戶之該關鍵字集所對應之該等關聯規則,確認該用戶之一興趣分布。
Description
本發明係關於一種鎖定用戶興趣之裝置、方法及其電腦程式產品。具體而言,本發明係關於一種基於用戶閱讀習慣而鎖定用戶興趣之裝置、方法及其電腦程式產品。
隨著數位時代的來臨,社會大眾已習慣在各式電子裝置上閱讀文章。許多的內容提供者會將文章分類(例如:政治類、體育類),讓使用者能方便地依據分類選擇欲閱讀的文章。另外,也有一些內容提供者會對各篇文章標註關鍵字,讓使用者能方便地檢索。
在此趨勢下,目前已有一些技術基於使用者的閱讀習慣提供數位服務。具體而言,某些技術係基於使用者閱讀過的文章的分類(例如:政治類、體育類)來分析使用者的興趣,但由於文章的分類過於上位,導致分析的結果會過於粗糙。另外的某些技術則是基於使用者閱讀過的文章的關鍵字來分析使用者的興趣,但各個關鍵字所傳遞的訊息太過特定,且使用者閱讀過的文章的關鍵字群又往往無法聚焦,導致無法鎖定使用者的興趣。
有鑑於此,本領域仍亟需一種能基於使用者的閱讀習慣找出
使用者的興趣的資訊探勘技術。
為解決先前技術的間題,本發明提供一種鎖定用戶興趣之裝置、方法及其電腦程式產品。
本發明所提供之鎖定用戶興趣之裝置包含一儲存器及一處理器,且該儲存器電性連接至該處理器。該儲存器儲存複數個興趣類別、複數篇文章、各該文章所對應之複數個關鍵字及該用戶之一閱讀記錄。該處理器利用該等文章建立複數個關聯規則(association rules),其中各該關聯規則介於該等興趣類別其中之一與該等關鍵字其中之一。該處理器還根據該閱讀記錄確認該用戶之複數篇已讀文章,且根據該用戶之該等已讀文章決定該用戶之一關鍵字集,其中該用戶之該等已讀文章為該等文章之一子集,且該用戶之該關鍵字集為該等關鍵字之一子集。該處理器還根據該用戶之該關鍵字集所對應之該等關聯規則,確認該用戶之一興趣分布。
本發明所提供之鎖定用戶興趣之方法適用於一電子計算裝置。該電子計算裝置儲存複數個興趣類別、複數篇文章、各該文章所對應之複數個關鍵字及一用戶之一閱讀記錄。該方法包含下列步驟:(a)利用該等文章建立複數個關聯規則,其中各該關聯規則介於該等興趣類別其中之一與該等關鍵字其中之一,(b)根據該閱讀記錄確認該用戶之複數篇已讀文章,(c)根據該用戶之該等已讀文章決定該用戶之一關鍵字集,其中該用戶之該等已讀文章為該等文章之一子集,且該用戶之該關鍵字集為該等關鍵字之一子集,以及(d)根據該用戶之該關鍵字集所對應之該等關聯規則,確認該用戶之一興趣分布。
本發明所提供之電腦程式產品包含複數個程式指令。一電子計算裝置載入該電腦程式產品後,該電子計算裝置執行該電腦程式產品所包含之該等程式指令,因而實現一種鎖定用戶興趣之方法。該電子計算裝置儲存複數個興趣類別、複數篇文章、各該文章所對應之複數個關鍵字及一用戶之一閱讀記錄。該方法包含下列步驟:(a)利用該等文章建立複數個關聯規則,其中各該關聯規則介於該等興趣類別其中之一與該等關鍵字其中之一,(b)根據該閱讀記錄確認該用戶之複數篇已讀文章,(c)根據該用戶之該等已讀文章決定該用戶之一關鍵字集,其中該用戶之該等已讀文章為該等文章之一子集,且該用戶之該關鍵字集為該等關鍵字之一子集,以及(d)根據該用戶之該關鍵字集所對應之該等關聯規則,確認該用戶之一興趣分布。
本發明所提供之興趣鎖定技術(至少包含裝置、方法及其電腦程式產品)在複數篇文章所彙整出之相異關鍵字與複數個興趣類別之間建立複數個關聯規則。在建立該等關聯規則後,本發明所提供之興趣鎖定技術便可針對單一用戶、多個用戶、一目標用戶群或/及全體用戶進行分析,以鎖定不同用戶的興趣分布,鎖定不同用戶的關鍵興趣類別,甚至針對不同興趣類別鎖定關鍵用戶。由於本發明所提供之興趣鎖定技術並非單純地根據文章的分類(例如:政治類、體育類)或單純地根據文章的關鍵字來判斷用戶之興趣分布,而是交叉比對出文章本身所具有的資訊與興趣類別間的關聯性,因此本發明所提供之興趣鎖定技術能更為準確地確認用戶之興趣分布,找出其關鍵興趣類別,且能針對不同興趣類別鎖定關鍵用戶,進而提供更為準確的數位服務。
以下結合圖式闡述本發明之詳細技術及實施方式,俾使本發明所屬技術領域中具有通常知識者能理解所請求保護之發明之技術特徵。
1‧‧‧興趣鎖定裝置
11‧‧‧儲存器
13‧‧‧處理器
C1、C2、……、Cm‧‧‧興趣類別
A1、A2、……、An‧‧‧文章
SA‧‧‧文章資料庫
RR1、RR2、……、RRs‧‧‧閱讀記錄
K1、K2、……、Kt‧‧‧關鍵字
R1、R2、……、Rz‧‧‧關聯規則
U1、U2、……、Us‧‧‧用戶
SA1、SA2、……、SAs‧‧‧複數篇已讀文章
SK1、SK2、……、SKs‧‧‧關鍵字集
ID1、ID2、……、IDs‧‧‧興趣分布
S201~S207‧‧‧步驟
第1A圖係描繪本發明第一實施方式之興趣鎖定裝置1之架構示意圖;第1B圖係描繪關鍵字K1、K2、……、Kt及興趣類別C1、C2、……、Cm之間建立複數個關聯規則R1、R2、……、Rz之示意圖;第1C圖係描繪興趣鎖定裝置1在獲得用戶U1之興趣分布時之訊息產生流程;以及第2圖係描繪本發明第二實施方式之興趣鎖定方法之流程圖。
以下將透過實施方式來解釋本發明所提供之鎖定用戶興趣之裝置、方法及其電腦程式產品。然而,該等實施方式並非用以限制本發明需在如該等實施方式所述之任何環境、應用或方式方能實施。因此,關於以下實施方式之說明僅在於闡釋本發明之目的,而非用以限制本發明之範圍。應理解,在以下實施方式及圖式中,與本發明非直接相關之元件已省略而未繪示,且圖式中各元件之尺寸以及元件間之尺寸比例僅為便於繪示及說明,而非用以限制本發明之範圍。
本發明之第一實施方式為一鎖定用戶興趣之裝置(下稱「興趣鎖定裝置」)1,其架構示意圖係描繪於第1A圖。興趣鎖定裝置1包含一儲存器11及一處理器13,且二者彼此電性連接。儲存器11可為一記憶體、一
通用串列匯流排(Universal Serial Bus;USB)碟、一硬碟、一光碟(Compact Disk;CD)、一隨身碟或本發明所屬技術領域中具有通常知識者所知悉之其他能儲存數位資料之非暫態儲存媒體或儲存電路。處理器13可為各種處理器、中央處理單元(Central Processing Unit;CPU)、微處理器(Microprocessor Unit;MPU)、數位訊號處理器(Digital Signal Processor;DSP)或本發明所屬技術領域中具有通常知識者所知悉之其他計算裝置。
儲存器11儲存複數個興趣類別C1、C2、……、Cm。需說明者,本發明未限制興趣類別C1、C2、……、Cm之產生方式及其具體數目,其可由興趣鎖定裝置1之管理者自行建立,亦可為任何現有已清楚定義之興趣類別(例如:美商臉書公司(Facebook,Inc.)所定義之興趣類別、美商谷歌有限公司(Google LLC)所定義之興趣類別)。此外,本發明未限制興趣類別C1、C2、……、Cm儲存於儲存器11之形式。舉例而言,興趣類別C1、C2、……、Cm可被記錄於一檔案或一資料庫中,但不以此為限。
儲存器11還儲存複數篇文章A1、A2、……、An。文章A1、A2、……、An整體可視為一文章資料庫SA。此外,儲存器11儲存章A1、A2、……、An各自所對應之複數個關鍵字(未繪示)。於本發明的不同實施方式中,文章A1、A2、……、An各自所對應之複數個關鍵字可透過不同方式產生。
儲存器11還儲存複數個用戶U1、U2、……、Us所分別對應之複數個閱讀記錄RR1、RR2、……、RRs。具體而言,閱讀記錄RR1、RR2、……、RRs各自記錄所對應之用戶讀過文章A1、A2、……、An中的哪幾篇。以閱讀記錄RR1為例,其係記錄用戶U1讀過文章A1、A2、……、
An中的哪幾篇。
於某些實施方式中,文章A1、A2、……、An各自所對應之該等關鍵字可由一使用者(例如:文章編輯、文章作者、興趣鎖定裝置1之管理者)所直接給定的。於某些實施方式中,文章A1、A2、……、An各自所對應之該等關鍵字則可由興趣鎖定裝置1產生。舉例而言,處理器13可針對文章A1、A2、……、An個別地進行斷詞處理及停用詞(stop words)過濾,藉此得到文章A1、A2、……、An各自對應之該等關鍵字。再舉例而言,處理器13可針對文章A1、A2、……、An個別地進行斷詞處理、停用詞過濾及一詞頻-逆文件頻率(Tenn Frequency-Inverse Document Frequency;TF-IDF)演算法過濾,藉此得到文章A1、A2、……、An各自對應之該等關鍵字。本發明所屬技術領域中具有通常知識者應熟知斷詞處理、停用詞過濾與詞頻-逆文件頻率演算法之運作細節,茲不贅言。
於本實施方式中,處理器13利用文章A1、A2、……、An,在興趣類別C1、……、Cm與從文章A1、A2、……、An所彙整出來的相異的關鍵字之間建立複數個關聯規則(association rules)。處理器13所建立的各該關聯規則係介於興趣類別C1、C2、……、Cm其中之一與從文章A1、A2、……、An彙整得到的該等關鍵字其中之一。
於某些實施方式中,處理器13係根據各該關鍵字與各該興趣類別C1、C2、……、Cm於文章A1、A2、……、An中同時出現之複數個比例建立該等關聯規則。若某一興趣類別與某一關鍵字同時出現之文章數目(或文章數目所佔之比例)高於一門檻值,處理器13便會在該興趣類別與該關鍵字之間建立一關聯規則。於某些實施方式中,處理器13則可根據各
該關鍵字與各該興趣類別C1、C2、……、Cm於文章A1、A2、……、An中同一段落同時出現之複數個比例建立該等關聯規則。若某一興趣類別與某一關鍵字同時出現之段落數目(或段落數目所佔之比例)高於一門檻值,處理器13便會在該興趣類別與該關鍵字之間建立一關聯規則。
為便於理解,請參第1B圖所示之一具體範例,但其非用以限制本發明之範圍。於該具體範例中,處理器13從文章A1、A2、……、An各自對應之該等關鍵字中彙整出相異的關鍵字K1、K2、……、Kt,再利用文章A1、A2、……、An所具有之資訊於相異的關鍵字K1、K2、……、Kt與興趣類別C1、C2、……、Cm之間建立複數個關聯規則R1、R2、……、Rz。如第1B圖所示,每一條介於關鍵字與興趣類別間之直線代表一關聯規則。關聯規則R1、R2、……、Rz各自介於興趣類別C1、C2、……、Cm其中之一與關鍵字K1、K2、……、Kt其中之一。
在建立關聯規則R1、R2、……、Rz後,處理器13便可針對單一用戶、多個用戶、一目標用戶群或/及全體用戶進行分析,以鎖定不同用戶的興趣分布,甚至鎖定不同用戶的關鍵興趣類別。
茲假設欲獲得全體用戶中之用戶U1之興趣分布,興趣鎖定裝置1運作時之訊息產生流程如第1C圖所示。具體而言,處理器13會根據用戶U1之閱讀記錄RR1確認用戶U1之複數篇已讀文章SA1。用戶U1之該等已讀文章SA1為前述文章A1、A2、……、An之一子集(亦即,文章A1、A2、……、An中被用戶U1讀過的)。處理器13再根據用戶U1之該等已讀文章SA1決定用戶U1之一關鍵字集SK1。用戶U1之關鍵字集SK1為關鍵字K1、K2、……、Kt之一子集(亦即,從用戶U1之該等已讀文章SA1彙整出來的相異關鍵字
所形成之集合)。之後,處理器13根據用戶U1之關鍵字集SK1所對應之該等關聯規則(亦即,關鍵字集SK1所包含之該等關鍵字所對應之該等關聯規則,為關聯規則R1、R2、……、Rz之一子集),確認用戶U1之一興趣分布ID1。
需說明者,興趣鎖定裝置1可採用數種不同方式呈現興趣分布ID1。於某些實施方式中,處理器13可計算用戶U1之關鍵字集SK1所包含之該等關鍵字中,屬於各興趣類別C1、C2、……、Cm之關鍵字佔關鍵字集SK1之比例,而這些比例便可視為用戶U1之一興趣分布ID1。為使興趣分布ID1更為分布,處理器13可進一步地將之正規化(normalized),使這些比例的總和為100%。再舉例而言,處理器13亦可計算用戶U1之關鍵字集SK1所包含之該等關鍵字中,屬於各興趣類別C1、C2、……、Cm之關鍵字之數目,而這些數目便可視為用戶U1之一興趣分布ID1。
若有需要,對於全體用戶中之其他用戶U2、……、Us,處理器13也可採取同樣的技術找出用戶U2、……、Us各自之興趣分布。簡言之,處理器13可根據用戶U2、……、用戶Us分別對應之閱讀記錄RR2、……、RRs確認用戶U2、……、用戶Us分別對應至複數篇已讀文章SA2、……、複數篇已讀文章SAs,其中各用戶之已讀文章為前述文章A1、A2、……、An之一子集。處理器13根據用戶U2、……、用戶Us分別對應之複數篇已讀文章SA2、……、複數篇已讀文章SAs,決定用戶U2、……、用戶Us分別對應之關鍵字集SK2、……、SKs,其中關鍵字集SK2、……、SKs各為關鍵字K1、K2、……、Kt之一子集。處理器13再根據用戶U2、……、用戶Us分別的關鍵字集SK2、……、SKs所對應之該等關聯規則,確認用戶U2、……、
用戶Us分別的興趣分布ID2、……、IDs。
於某些實施方式中,處理器13可針對全體用戶(亦即,用戶U1、U2、……、Us)進行分析,找出全體用戶之興趣分布。具體而言,處理器13根據全體用戶之已讀文章決定該全體用戶之一關鍵字集。同理,全體用戶之該等已讀文章為前述文章A1、A2、……、An之一子集(亦即,文章A1、A2、……、An中被任一用戶讀過的),且該全體用戶之該關鍵字集為關鍵字K1、K2、……、Kt之一子集(亦即,從該全體用戶之該等已讀文章彙整出來的相異關鍵字所形成之集合)。之後,處理器13根據該全體用戶之該關鍵字集所對應之該等關聯規則,確認該全體用戶之一興趣分布(以前述任一種確認興趣分布之技術)。由該全體用戶之興趣分布可看出大眾的興趣分布。
於某些實施方式中,處理器13可藉由比較某一用戶(例如:用戶U1)之該興趣分布及該全體用戶之該興趣分布,確認該用戶之至少一關鍵興趣類別。各該至少一關鍵興趣類別為興趣類別C1、C2、……、Cm其中之一。具體而言,若有某一(或某些)興趣類別在該用戶之興趣分布中所佔之比例高於在該全體用戶之興趣分布中所佔之比例,則那一(或那些)興趣類別為該用戶之關鍵興趣類別。舉例而言,興趣類別「閱讀」在用戶U1的興趣分布ID1中佔86.06%,而在全體用戶的興趣分布中佔32.9%,因此興趣類別「閱讀」便是為用戶U1之關鍵興趣類別。
若有需要,對於全體用戶中之其他用戶U2、……、Us,處理器13也可採取同樣的技術,找出用戶U2、……、Us各自之至少一關鍵興趣類別。
於某些實施方式中,處理器13可針對一目標用戶群進行分析,找出目標用戶群之興趣分布。該目標用戶群為全體用戶(亦即,用戶U1、U2、……、Us)之一子集。舉例而言,該目標用戶群可為全體用戶中曾經捐款的用戶、曾經參與某一活動的用戶,但不以此為限。
於該等實施方式中,處理器13根據該目標用戶群之複數篇已讀文章決定該目標用戶群之一關鍵字集。該目標用戶群之該等已讀文章為前述文章A1、A2、……、An之一子集(亦即,文章A1、A2、……、An中被該目標用戶群中之任一用戶讀過的),且該目標用戶群之該關鍵字集為關鍵字K1、K2、……、Kt之一子集(亦即,從該目標用戶群之該等已讀文章彙整出來的相異關鍵字所形成之集合)。之後,處理器13根據該目標用戶群之該關鍵字集所對應之該等關聯規則,確認該目標用戶群之一興趣分布(以前述任一種確認興趣分布之技術)。
於某些實施方式中,處理器13還可藉由比較該目標用戶群之該興趣分布及該全體用戶之該興趣分布,確認該目標用戶群之至少一關鍵興趣類別,茲不贅言。
於某些實施方式中,處理器13還可針對該目標用戶群所包含之複數個目標用戶進行分析,找出其共通性。如前所述,該目標用戶群為全體用戶(亦即,用戶U1、U2、……、Us)之一子集,因此各該目標用戶為用戶U1、U2、……、Us其中之一。處理器13會採用前述方式確認各該目標用戶之關鍵興趣類別,再找出該等目標用戶所分別對應之該等關鍵興趣類別之一交集作為該等目標用戶之一共同關鍵興趣類別。
舉例而言,目標用戶群包含用戶U1、用戶U2及用戶Us,其
中用戶U1的關鍵興趣類別為「閱讀」、「電影」及「遊戲」,用戶U2的關鍵興趣類別為「電影」及「運動」,而用戶Us的關鍵興趣類別為「電影」、「美食」及「旅遊」。處理器13便可找出用戶U1之關鍵興趣類別、用戶U2之關鍵興趣類別及用戶Us之關鍵興趣類別之一交集作為用戶U1、用戶U2及用戶Us的共同關鍵興趣類別(亦即,興趣類別「電影」)。
藉由前述技術,當興趣鎖定裝置1根據某一行為或某一資訊(例如:曾經捐款的用戶、曾經參與某一活動)鎖定一目標用戶群時,便能找出該目標用戶群之目標用戶之共通性。
於某些實施方式中,處理器13還可針對興趣類別C1、C2、……、Cm中每一個,找出其所對應之至少一關鍵用戶。具體而言,處理器13先針對用戶U1、U2、……、Us中的每一個找出對應之至少一關鍵興趣類別。由於各該關鍵興趣類別為興趣類別C1、C2、……、Cm其中之一,處理器13便能根據用戶U1、U2、……、Us之該等關鍵興趣類別,確認興趣類別C1、C2、……、Cm中每一個所對應之至少一關鍵用戶。具體而言,若一興趣類別屬於某一(或某些)用戶之關鍵興趣類別,則該(等)用戶為該興趣類別之關鍵用戶。舉例而言,若興趣類別C2為用戶U1、U2、Us之關鍵興趣類別,則用戶U1、U2、Us為興趣類別C2之關鍵用戶。
由上述說明可知,興趣鎖定裝置1在文章A1、A2、……、An之相異關鍵字與興趣類別C1、C2、……、Cm之間建立關聯規則R1、R2、……、Rz。在建立關聯規則R1、R2、……、Rz後,處理器13便可針對單一用戶、多個用戶、一目標用戶群或/及全體用戶進行分析,以鎖定不同用戶的興趣分布,鎖定不同用戶的關鍵興趣類別,甚至針對不同興趣類別
鎖定關鍵用戶。由於興趣鎖定裝置1並非單純地根據文章的分類(例如:政治類、體育類)或單純地根據文章的關鍵字來判斷用戶之興趣分布,而是交叉比對出文章本身所具有的資訊與興趣類別間的關聯性,因此興趣鎖定裝置1能更為準確地確認用戶之興趣分布,找出其關鍵興趣類別,且能針對不同興趣類別鎖定關鍵用戶。
本發明之第二實施方式為一種鎖定用戶興趣之方法(下稱「興趣鎖定方法」),其流程圖係描繪於第2圖。興趣鎖定方法適用於一電子計算裝置(例如:第一實施方式中所述之興趣鎖定裝置1),且該電子計算裝置儲存複數個興趣類別、複數篇文章、各該文章所對應之複數個關鍵字以及複數個用戶分別對應之複數個閱讀記錄。各該閱讀記錄中記載了所對應之用戶讀過該等文章中的哪幾篇。需說明者,本發明未限制該等興趣類別之產生方式及其具體數目,其可由一管理者自行建立,亦可為任何現有已清楚定義之興趣類別。
另需說明者,於某些實施方式中,各該文章所對應之該等關鍵字可由一使用者(例如:文章編輯、文章作者、管理者)所直接給定的。於某些實施方式中,各該文章所對應之該等關鍵字可由興趣鎖定方法產生。舉例而言,興趣鎖定方法可包含至少一步驟(未繪示),由該電子計算裝置針對各該文章進行斷詞處理及停用詞過濾,藉此得到各該文章所對應之該等關鍵字。再舉例而言,興趣鎖定方法可包含至少一步驟(未繪示),由該電子計算裝置針對各該文章進行斷詞處理、停用詞過濾及一詞頻-逆文件頻率演算法過濾,藉此得到各該文章所對應之該等關鍵字。
該興趣鎖定方法至少包含步驟S201~步驟S207。於步驟
S201,由該電子計算裝置利用該等文章建立複數個關聯規則,其中各該關聯規則介於該等興趣類別其中之一與該等關鍵字其中之一。於某些實施方式中,步驟S201係根據各該關鍵字與各該興趣類別於該等文章中同時出現之複數個比例建立該等關聯規則。於某些實施方式中,步驟S201係根據各該關鍵字與各該興趣類別於該等文章中同一段落同時出現之複數個比例建立該等關聯規則。
於步驟S203,由該電子計算裝置根據一用戶之一閱讀記錄確認該用戶之複數篇已讀文章,其中該用戶之該等已讀文章為該等文章之一子集。於步驟S205,由該電子計算裝置根據該用戶之該等已讀文章決定該用戶之一關鍵字集,其中該用戶之該關鍵字集為該等關鍵字之一子集。於步驟S207,由該電子計算裝置根據該用戶之該關鍵字集所對應之該等關聯規則,確認該用戶之一興趣分布。於某些實施方式中,興趣鎖定方法可針對全體用戶中的各個用戶執行步驟S203至步驟S207,藉此確認各個用戶之興趣分布。
於某些實施方式中,該興趣鎖定方法還包含一步驟,由該電子計算裝置根據全體用戶之複數篇已讀文章決定該全體用戶之一關鍵字集。該興趣鎖定方法還包含一步驟,由該電子計算裝置根據該全體用戶之該關鍵字集所對應之該等關聯規則,確認該全體用戶之一興趣分布。
於某些實施方式中,該興趣鎖定方法還包含一步驟,由該電子計算裝置藉由比較某一用戶之該興趣分布及該全體用戶之該興趣分布,確認該用戶之至少一關鍵興趣類別。同理,若有需要,該興趣鎖定方法可針對全體用戶中的各個用戶執行此一步驟,藉此確認各該用戶之至少一關
鍵興趣分布。
於某些實施方式中,該興趣鎖定方法還包含一步驟,由該電子計算裝置根據一目標用戶群之複數篇已讀文章決定該目標用戶群之一關鍵字集。該興趣鎖定方法還包含一步驟,由該電子計算裝置根據該目標用戶群之該關鍵字集所對應之該等關聯規則,確認該目標用戶群之一興趣分布,其中該目標用戶群為該全體用戶之一子集。
於某些實施方式中,該興趣鎖定方法還包含一步驟,由該電子計算裝置藉由比較該目標用戶群之該興趣分布及該全體用戶之該興趣分布,確認該目標用戶群之至少一關鍵興趣類別。
於某些實施方式中,該興趣鎖定方法還可針對該目標用戶群所包含之複數個目標用戶進行分析,找出其共通性。該目標用戶群為全體用戶之一子集,因此各該目標用戶為前述該等用戶其中之一。該興趣鎖定方法會採用前述方式確認各該目標用戶之關鍵興趣類別,再執行一步驟以由該電子計算裝置找出該等目標用戶所分別對應之該等關鍵興趣類別之一交集作為該等目標用戶之一共同關鍵興趣類別。
於某些實施方式中,該興趣鎖定方法還可針對各該興趣類別,找出其所對應之至少一關鍵用戶。具體而言,該興趣鎖定方法先採用前述技術針對各該用戶找出對應之至少一關鍵興趣類別。由於各該關鍵興趣類別為該等興趣類別其中之一,該興趣鎖定方法還包含一步驟,根據該等用戶之該等關鍵興趣類別,確認各該興趣類別之至少一關鍵用戶。具體而言,若一興趣類別屬於某一(或某些)用戶之關鍵興趣類別,則該(等)用戶為該興趣類別之關鍵用戶。
除了上述步驟,第二實施方式能執行第一實施方式所描述之興趣鎖定裝置1之所有運作及步驟,具有同樣之功能,且達到同樣之技術效果。本發明所屬技術領域中具有通常知識者可直接瞭解第二實施方式如何基於上述第一實施方式以執行此等運作及步驟,具有同樣之功能,並達到同樣之技術效果,故不贅述。
第二實施方式中所闡述之興趣鎖定方法可由包含複數個程式指令之一電腦程式產品實現。該電腦程式產品可為能被於網路上傳輸之檔案,亦可被儲存於一非暫態電腦可讀取儲存媒體中。該非暫態電腦可讀取儲存媒體可為一電子產品,例如:一唯讀記憶體(Read Only Memory;ROM)、一快閃記憶體、一軟碟、一硬碟、一光碟(Compact Disk;CD)、一數位多功能光碟(Digital Versatile Disc;DVD)、一隨身碟、一可由網路存取之資料庫或本發明所屬技術領域中具有通常知識者所知且具有相同功能之任何其他儲存媒體。該電腦程式產品所包含之該等程式指令被載入一電子計算裝置(例如:興趣鎖定裝置1)後,該電腦程式執行如在第二實施方式中所述之興趣鎖定方法。
需說明者,於本發明專利說明書及申請專利範圍中,某些用語(包含:用戶、子集等)前被冠以「第一」或「第二」,該等「第一」及「第二」及「第三」僅用來區分該等用語係指不同項目。
綜上所述,本發明所提供之興趣鎖定技術(至少包含裝置、方法及其電腦程式產品)在複數篇文章所彙整出之相異關鍵字與複數個興趣類別之間建立複數個關聯規則。在建立該等關聯規則後,本發明所提供之興趣鎖定技術便可針對單一用戶、多個用戶、一目標用戶群或/及全體用
戶進行分析,以鎖定不同用戶的興趣分布,鎖定不同用戶的關鍵興趣類別,甚至針對不同興趣類別鎖定關鍵用戶。由於本發明所提供之興趣鎖定技術並非單純地根據文章的分類(例如:政治類、體育類)或單純地根據文章的關鍵字來判斷用戶之興趣分布,而是交叉比對出文章本身所具有的資訊與興趣類別間的關聯性,因此本發明所提供之興趣鎖定技術能更為準確地確認用戶之興趣分布,找出其關鍵興趣類別,且能針對不同興趣類別鎖定關鍵用戶,進而提供更為準確的數位服務。
上述實施方式僅為例示性說明本發明之部分實施態樣,以及闡釋本發明之技術特徵,而非用來限制本發明之保護範疇及範圍。任何熟悉此技藝之人士可輕易完成之改變或均等性之安排均屬於本發明所主張之範圍,本發明之權利保護範圍應以申請專利範圍為準。
A1、A2、……、An‧‧‧文章
SA‧‧‧文章資料庫
U1、U2、……、Us‧‧‧用戶
SA1、SA2、…...、SAs‧‧‧複數篇已讀文章
SK1、SK2、……、SKs‧‧‧關鍵字集
ID1、ID2、……、IDs‧‧‧興趣分布
Claims (15)
- 一種鎖定用戶興趣之裝置,包含:一儲存器,儲存複數個興趣類別、複數篇文章、各該文章所對應之複數個關鍵字及一第一用戶之一第一閱讀記錄;以及一處理器,電性連接至該儲存器,且利用該等文章建立複數個關聯規則(association rules),各該關聯規則介於該等興趣類別其中之一與該等關鍵字其中之一,其中,該處理器還根據該第一閱讀記錄確認該第一用戶之複數篇已讀文章,且根據該第一用戶之該等已讀文章決定該第一用戶之一關鍵字集,其中該第一用戶之該等已讀文章為該等文章之一第一子集,且該第一用戶之該關鍵字集為該等關鍵字之一第一子集,其中,該處理器還根據該第一用戶之該關鍵字集所對應之該等關聯規則,確認該第一用戶之一興趣分布,其中,該第一用戶及複數個第二用戶形成一全體用戶,該處理器還根據該第一用戶之該等已讀文章以及各該第二用戶之複數篇已讀文章決定該全體用戶之一關鍵字集,該處理器還根據該全體用戶之該關鍵字集所對應之該等關聯規則,確認該全體用戶之一興趣分布,且該處理器還藉由比較該第一用戶之該興趣分布及該全體用戶之該興趣分布,確認該第一用戶之至少一關鍵興趣類別。
- 如請求項1所述之裝置,其中該儲存器還儲存各該第二用戶所分別對應之複數個第二閱讀記錄,該處理器還針對各該第二用戶執行以下運作:根據該第二用戶之該第二閱讀記錄確認該第二用戶之該等已讀文 章,根據該第二用戶之該等已讀文章決定該第二用戶之一關鍵字集,其中該第二用戶之該等已讀文章為該等文章之一第二子集,且該第二用戶之該關鍵字集為該等關鍵字之一第二子集,以及根據該第二用戶之該關鍵字集所對應之該等關聯規則,確認該第二用戶之一興趣分布。
- 如請求項1所述之裝置,其中該處理器還根據一目標用戶群之複數篇已讀文章決定該目標用戶群之一關鍵字集,且該處理器還根據該目標用戶群之該關鍵字集所對應之該等關聯規則,確認該目標用戶群之一興趣分布,其中該目標用戶群為該全體用戶之一子集。
- 如請求項3所述之裝置,其中該處理器還藉由比較該目標用戶群之該興趣分布及該全體用戶之該興趣分布,確認該目標用戶群之至少一關鍵興趣類別。
- 如請求項2所述之裝置,其中該處理器還藉由比較各該第二用戶之該興趣分布及該全體用戶之該興趣分布,確認各該第二用戶之至少一關鍵興趣類別,且該處理器還根據該第一用戶之該至少一關鍵興趣類別及各該第二用戶之該至少一關鍵興趣類別,確認各該興趣類別之至少一關鍵用戶。
- 如請求項2所述之裝置,其中該處理器還藉由比較各該第二用戶之該興趣分布及該全體用戶之該興趣分布,確認各該第二用戶之至少一關鍵興趣類別,其中,一目標用戶群包含複數個目標用戶,各該目標用戶為該第一用戶及該等第二用戶其中之一,該處理器還找出該等目標用戶所分別對 應之該等關鍵興趣類別之一交集作為該等目標用戶之一共同關鍵興趣類別。
- 如請求項1所述之裝置,其中該處理器係根據各該關鍵字與各該興趣類別於該等文章中同時出現之複數個比例建立該等關聯規則。
- 一種鎖定用戶興趣之方法,適用於一電子計算裝置,該電子計算裝置儲存複數個興趣類別、複數篇文章、各該文章所對應之複數個關鍵字及一第一用戶之一第一閱讀記錄,該第一用戶及複數個第二用戶形成一全體用戶,該方法包含下列步驟:(a)利用該等文章建立複數個關聯規則,其中各該關聯規則介於該等興趣類別其中之一與該等關鍵字其中之一;(b)根據該第一閱讀記錄確認該第一用戶之複數篇已讀文章;(c)根據該第一用戶之該等已讀文章決定該第一用戶之一關鍵字集,其中該第一用戶之該等已讀文章為該等文章之一第一子集,且該第一用戶之該關鍵字集為該等關鍵字之一第一子集;(d)根據該第一用戶之該關鍵字集所對應之該等關聯規則,確認該第一用戶之一興趣分布;(e)根據該第一用戶之該等已讀文章以及各該第二用戶之複數篇已讀文章決定該全體用戶之一關鍵字集;(f)根據該全體用戶之該關鍵字集所對應之該等關聯規則,確認該全體用戶之一興趣分布;以及(g)藉由比較該第一用戶之該興趣分布及該全體用戶之該興趣分布,確認該第一用戶之至少一關鍵興趣類別。
- 如請求項8所述之方法,其中該電子計算裝置還儲存各該第二用戶所分別對應之複數個第二閱讀記錄,該方法還包含以下步驟:針對各該第二用戶執行以下步驟:根據該第二用戶之該第二閱讀記錄確認該第二用戶之該等已讀文章;根據該第二用戶之該等已讀文章決定該第二用戶之一關鍵字集,其中該第二用戶之該等已讀文章為該等文章之一第二子集,且該第二用戶之該關鍵字集為該等關鍵字之一第二子集;以及根據該第二用戶之該關鍵字集所對應之該等關聯規則,確認該第二用戶之一興趣分布。
- 如請求項8所述之方法,還包含以下步驟:根據一目標用戶群之複數篇已讀文章決定該目標用戶群之一關鍵字集;以及根據該目標用戶群之該關鍵字集所對應之該等關聯規則,確認該目標用戶群之一興趣分布,其中該目標用戶群為該全體用戶之一子集。
- 如請求項10所述之方法,還包含以下步驟:藉由比較該目標用戶群之該興趣分布及該全體用戶之該興趣分布,確認該目標用戶群之至少一關鍵興趣類別。
- 如請求項9所述之方法,還包含下列步驟:藉由比較各該第二用戶之該興趣分布及該全體用戶之該興趣分布,確認各該第二用戶之至少一關鍵興趣類別;以及根據該第一用戶之該至少一關鍵興趣類別及各該第二用戶之該至少 一關鍵興趣類別,確認各該興趣類別之至少一關鍵用戶。
- 如請求項9所述之方法,還包含下列步驟:藉由比較各該第二用戶之該興趣分布及該全體用戶之該興趣分布,確認各該第二用戶之至少一關鍵興趣類別;以及找出該等目標用戶所分別對應之該等關鍵興趣類別之一交集作為該等目標用戶之一共同關鍵興趣類別。
- 如請求項8所述之方法,其中該步驟(a)係根據各該關鍵字與各該興趣類別於該等文章中同時出現之複數個比例建立該等關聯規則。
- 一種電腦程式產品,經由一電子計算裝置載入該電腦程式產品後,該電子計算裝置執行該電腦程式產品所包含之複數個程式指令,以執行一種鎖定用戶興趣之方法,該電子計算裝置儲存複數個興趣類別、複數篇文章、各該文章所對應之複數個關鍵字及一用戶之一閱讀記錄,該第一用戶及複數個第二用戶形成一全體用戶,該方法包含下列步驟:利用該等文章建立複數個關聯規則,其中各該關聯規則介於該等興趣類別其中之一與該等關鍵字其中之一;根據該閱讀記錄確認該用戶之複數篇已讀文章;根據該用戶之複數篇已讀文章決定該用戶之一關鍵字集,其中該用戶之該等已讀文章為該等文章之一子集,且該用戶之該關鍵字集為該等關鍵字之一子集;根據該用戶之該關鍵字集所對應之該等關聯規則,確認該用戶之一興趣分布;根據該第一用戶之該等已讀文章以及各該第二用戶之複數篇已讀文 章決定該全體用戶之一關鍵字集;根據該全體用戶之該關鍵字集所對應之該等關聯規則,確認該全體用戶之一興趣分布;以及藉由比較該第一用戶之該興趣分布及該全體用戶之該興趣分布,確認該第一用戶之至少一關鍵興趣類別。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW108105153A TWI776020B (zh) | 2019-02-15 | 2019-02-15 | 鎖定用戶興趣之裝置、方法及其電腦程式產品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW108105153A TWI776020B (zh) | 2019-02-15 | 2019-02-15 | 鎖定用戶興趣之裝置、方法及其電腦程式產品 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202032460A TW202032460A (zh) | 2020-09-01 |
TWI776020B true TWI776020B (zh) | 2022-09-01 |
Family
ID=73643650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW108105153A TWI776020B (zh) | 2019-02-15 | 2019-02-15 | 鎖定用戶興趣之裝置、方法及其電腦程式產品 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI776020B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW200943107A (en) * | 2008-02-25 | 2009-10-16 | Yahoo Inc | Prioritizing media assets for publication |
TWI574218B (zh) * | 2012-07-19 | 2017-03-11 | 菲絲博克公司 | 社群網路環境中從品牌頁至用戶的特製內容遞送方法 |
TWI584138B (zh) * | 2013-12-04 | 2017-05-21 | 納寶股份有限公司 | 基於社交網路服務的用戶關係資訊以提供知識分享服務之系統及方法 |
US20180233035A1 (en) * | 2017-02-10 | 2018-08-16 | Nec Europe Ltd. | Method and filter for floating car data sources |
-
2019
- 2019-02-15 TW TW108105153A patent/TWI776020B/zh active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW200943107A (en) * | 2008-02-25 | 2009-10-16 | Yahoo Inc | Prioritizing media assets for publication |
TWI574218B (zh) * | 2012-07-19 | 2017-03-11 | 菲絲博克公司 | 社群網路環境中從品牌頁至用戶的特製內容遞送方法 |
TWI584138B (zh) * | 2013-12-04 | 2017-05-21 | 納寶股份有限公司 | 基於社交網路服務的用戶關係資訊以提供知識分享服務之系統及方法 |
US20180233035A1 (en) * | 2017-02-10 | 2018-08-16 | Nec Europe Ltd. | Method and filter for floating car data sources |
Also Published As
Publication number | Publication date |
---|---|
TW202032460A (zh) | 2020-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10685071B2 (en) | Methods, systems, and computer program products for storing graph-oriented data on a column-oriented database | |
TWI718643B (zh) | 異常群體識別方法及裝置 | |
US20170140058A1 (en) | Systems and Methods for Identifying Influencers and Their Communities in a Social Data Network | |
US10452627B2 (en) | Column weight calculation for data deduplication | |
US10657186B2 (en) | System and method for automatic document classification and grouping based on document topic | |
US10097664B2 (en) | Recommending media items based on purchase history | |
CN110362829B (zh) | 结构化病历数据的质量评估方法、装置及设备 | |
JP7332949B2 (ja) | 評価方法、評価プログラム、および情報処理装置 | |
CN106354867A (zh) | 多媒体资源的推荐方法及装置 | |
TW201820173A (zh) | 去識別化資料產生裝置、方法及其電腦程式產品 | |
CN110019017B (zh) | 一种基于访问特征的高能物理文件存储方法 | |
Oh et al. | De-Wipimization: Detection of data wiping traces for investigating NTFS file system | |
CN108009223B (zh) | 一种交易数据的一致性检测方法及装置 | |
US10430454B2 (en) | Systems and methods for culling search results in electronic discovery | |
US11176196B2 (en) | Unified pipeline for media metadata convergence | |
US20140365571A1 (en) | Automatically Determining Veracity of Documents Posted in a Public Forum | |
US9734229B1 (en) | Systems and methods for mining data in a data warehouse | |
JP2008310626A (ja) | 自動タグ付与装置、自動タグ付与方法、自動タグ付与プログラムおよびそのプログラムを記録した記録媒体 | |
US20180096436A1 (en) | Computing System for Automatically Obtaining Age Data in a Social Data Network | |
WO2019128317A1 (zh) | 物品推送方法、装置及服务器、计算设备及存储介质 | |
Bouadjenek et al. | Literature consistency of bioinformatics sequence databases is effective for assessing record quality | |
TWI776020B (zh) | 鎖定用戶興趣之裝置、方法及其電腦程式產品 | |
CN112997172B (zh) | 针对数据资产的计算高效的有效标签确定 | |
CN107404491A (zh) | 终端环境异常检测方法、检测装置及计算机可读存储介质 | |
US9898485B2 (en) | Dynamic context-based data protection and distribution |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent |