TWI636416B

TWI636416B - 內容個人化之多相排序方法和系統

Info

Publication number: TWI636416B
Application number: TW103109377A
Authority: TW
Inventors: 韓軼平; 魯伊斯布魯諾Ｍ費爾南德斯; 簡馬克蘭洛伊斯; 金林; 史考特葛夫尼
Original assignee: 美商奧誓公司
Priority date: 2013-03-15
Filing date: 2014-03-14
Publication date: 2018-09-21
Also published as: WO2014149199A1; TW201447797A; US20140280214A1; US10102307B2

Abstract

本發明教導內容之複數個具體實施例，揭示用於一多相排序系統的方法、系統及程式，以利用一個人化內容系統實作。所揭示之方法、系統及程式使用一加權併和(AND)系統，以計算該使用者描述紀錄與一第一相中一內容描述紀錄、一第二相中一內容品質指標及一第三相中一規則過濾器的內積。

Description

內容個人化之多相排序方法和系統

【相關申請之相互參照】

本申請書主張於2013年三月15日申請之美國非臨時申請案號13/893,169的優先權，其藉由引用形式而整體併入本文。

本發明教導與提供內容的方法與系統有關。具體來說，本發明教導與提供線上內容的方法與系統有關。

網際網路已經讓一使用者可能在任何時間從任何地點以虛擬方式進行電子式存取。隨著資訊的***，提供複數個使用者與該使用者有關的資訊，而非只是提供一般的資訊變的越來越重要。此外，當現今社交活動的複數個使用者依賴網際網路做為資訊、娛樂及/或社交連接的來源時，像是新聞、社交互動、電影、音樂等等，提供複數個使用者使其覺得有價值的資訊將變的關鍵。

已經努力嘗試使複數個使用者能立即存取相關與即時內容。例如，相較於像是傳統搜尋引擎的一般性內容蒐集系統而言，已經發展了更具題材導向的主題式入口網站。示例性的主題式入口網站包含財經、運動、新聞、天氣、購物、音樂、藝術、影片等等的入口網站。所述主題式入口網站讓複數個使用者存取與這些入口網站所指向之複數個題材有關的資訊。使用者必須到不同的入口網站，以存取某些題材的內容，這並不方便且並非以使用者為中心。

另一項嘗試讓複數個使用者能容易存取相關內容的努力方式係透過個人化，其目標在於瞭解每一使用者各自的複數個喜好/興趣/偏好，因此可以設定代表每一使用者的一個別化使用者描述紀錄，並用於選擇與一使用者複數個興趣相符的內容。其底層目標是為了滿足使用者對於內容消費的心思。傳統上，使用者描述紀錄係根據該使用者所宣稱的複數個興趣所建構，及/或從例如使用者的個人屬性所推斷。已經有許多系統用以根據對該使用者與內容之間複數個互動的觀察，辨識使用者的複數個興趣。所述使用者與內容之間的互動典型實例為點擊率(CTR)。

這些傳統方法具有許多缺點。例如，並未參考任何基線而對使用者的複數個興趣加以描述，否則其感興趣的程度可被更精確估計。使用者複數個興趣係在獨立的應用程式中偵測，因此在個別應用程式中的使用者描述紀錄並無法捕捉大範圍的使用者整體興趣。所述進行使用者描述紀錄剖析的傳統方法造成對使用者複數個興趣的零散呈現，而不對該使用者的複數個偏好進行一致性的瞭解。因為從不同應用程式設定所推衍該相同使用者的複數個數據資料常常係以該等應用程式的特徵為基準，難以將其整合以產生能更加代表該使用者複數個興趣的一致性數據資料。

引導至內容的使用者複數個互動傳統上係被觀測並用於估計或推斷使用者的多個興趣。CTR為最一般使用的度量，以估計使用者的多個興趣。然而，如果實際上一使用者對不同裝置形式上執行的不同活動形式，也可以反映或涉及使用者複數個興趣，CTR便不再能夠適宜的捕捉使用者的複數個興趣。此外，使用者對於內容的複數個反應通常代表使用者的短期興趣。這種觀察到的短期興趣在片段取得時，可能只導向成為對使用者的反應性服務，而非主動服務，如同傳統方法時常進行的方式。雖然短期興趣是重要的，但並不適合用於瞭解一使用者更持續性的長期興趣，對於使用者保留而言，長期興趣是關鍵的。大部分使用者與內容的複數個互動都代表該使用者的複數個短期興趣，因此若依賴所述短期興趣行為，將難以擴展對該使用者興趣範圍增加的瞭解。當這與所述蒐集資料總是過去的行為且為被動蒐集的情況結合時，便產生一個人化的氣泡罩，如果不是不可能的話，也難以發掘一使用者的複數個其他興趣，除非該使用者開始某些透露新興趣的動作。

而另一項努力讓複數個使用者存取相關內容的方式，為根據該等使用者的興趣，匯總該等使用者可能感到興趣的內容。在網際網路上資訊***的情況下，不管在哪時候需要選擇與一特定使用者有關的內容時，就算可能也不會希望評估透過網際網路所能存取的全部內容。因此，現實上需要根據某些條件辨識該網際網路內容之一子集合或一內容池，因此可以根據該等使用者有興趣的消費內容從此內容池進行選擇並進行推薦。

建立所述內容子集合的傳統方式係以應用程式為中心。每一應用程式都利用該應用程式所專用的方式，開拓該應用程式本身的內容子集。例如，Amazon.com具有一內容池，該內容池與複數個產品及該等產品關聯資訊有關，該內容池則根據與Amazon.com本身擁有的複數個使用者及/或所述使用者與Amazon.com互動時所表現的複數個興趣相關的資訊所建立 /更新。臉書同樣具有其本身的內容子集合，其非為了臉書所專用，而是根據該等使用者在臉書上活動時所呈現的使用者複數個興趣所產生。當一使用者於複數個不同應用程式(例如，Amazon.com與臉書)，並與每一應用程式活動時，可能只呈現該使用者全部興趣中連結該應用程式本質的部分。在此情況下，最好的情況為每一應用程式都可以經常獲得對複數個使用者的部分興趣，但仍難以發展用於為該使用者廣泛範圍複數個興趣提供服務的內容子集合。

另一種努力則導向為個人化內容推薦，也就是根據使用者的個人化描述紀錄從內容池選擇內容，並將所述辨識內容推薦給該使用者。傳統的解決方式專注於相關性，也就是該內容與該使用者之間的關聯。雖然相關性是重要的，但仍有許多其他因此影響應該如何選擇推薦內容，以滿足一使用者的複數個興趣。大複數個的內容推薦系統將廣告***於為一使用者所推薦的辨識內容之中。某些用以辨識複數個***廣告的傳統系統，則比對內容與廣告，或比對使用者查詢(及其內容)與廣告，而非為根據該使用者個人屬性及由複數個廣告商所定義之目標聽眾複數個特徵的比對。某些傳統系統比對複數個使用者描述紀錄與由複數個廣告商所定義之目標聽眾之該等特定個人屬性，但不進行提供給該使用者的內容與該廣告的比對。理由為內容時常根據該內容中所涵蓋的題材分類於分類法中，而廣告分類法則時常以需要的目標聽眾群集為基礎。這對於選擇最相關的廣告，以***對一特定使用者推薦的內容之中而言是沒效率的。

需要對於個人化內容推薦的傳統方法進行改進。

在此揭示之教導與進行內容個人化之多相排序的方法、系統與程式有關。在一具體實施例中，揭示一種在一計算裝置上實作之方法，該計算裝置至少具有一處理器、一儲存器與連接至一網路的通訊介面，以進行內容排序。該方法包括獲得代表一使用者之一使用者描述紀錄，該使用者描述紀錄將該使用者複數個興趣特徵化；獲得代表一第一集合內容中每一內容片段之一內容描述紀錄，及獲得一內容品質指標，該內容品質指標將該第一集合內容中每一內容片段的品質特徵化；根據該使用者描述紀錄與代表該內容片段之該內容描述紀錄，估計該第一集合內容中每一內容片段與該使用者之間的近似度度量；根據對於該第一集合內容中每一內容片段的近似度度量，從該第一集合內容選擇一第二集合內容；根據該內容品質指標過濾該第二集合內容，以產生一第三集合內容；及輸出該第三集合內容。

在另一具體實施例中，揭示用於排序個人化內容的系統，該系統包括一使用者分析器，該使用者分析器經配置以獲得代表一使用者之一使用者描述紀錄，該使用者描述紀錄將該使用者複數個興趣特徵化；一內容分析器，該內容分析器經配置以獲得代表一第一集合內容中每一內容片段之一內容描述紀錄，及獲得一內容品質指標，該內容品質指標將該第一集合內容中每一內容片段的品質特徵化；一估計器，該估計器經配置以根據該使用者描述紀錄與代表該內容片段之該內容描述紀錄，估計該第一集合內容中每一內容片段與該使用者之間的近似度度量；一選擇器，該選擇器經配置以根據對於該第一集合內容中每一內容片段的近似度度量，從該第一集合內容選擇一第二集合內容；及一過濾器，該過濾器經配置以根據該內容品質指標過濾該第二集合內容，以產生一第三集合內容。

在另一具體實施例中，一種非暫態機器可讀媒介，該媒介上具有記錄資訊，用以進行內容排序，其中當由該電腦讀取該資訊時，使該電腦執行以下步驟：獲得代表一使用者之一使用者描述紀錄，該使用者描述紀錄將該使用者複數個興趣特徵化；獲得代表一第一集合內容中每一內容片段之一內容描述紀錄，及獲得一內容品質指標，該內容品質指標將該第一集合內容中每一內容片段的品質特徵化；根據該使用者描述紀錄與代表該內容片段之該內容描述紀錄，估計該第一集合內容中每一內容片段與該使用者之間的近似度度量；根據對於該第一集合內容中每一內容片段的近似度度量，從該第一集合內容選擇一第二集合內容；根據該內容品質指標過濾該第二集合內容，以產生一第三集合內容；及輸出該第三集合內容。

10‧‧‧系統圖式

100‧‧‧個人化內容推薦模組

105‧‧‧使用者

110‧‧‧內容來源

115‧‧‧知識資料庫

120‧‧‧第三方平台

125‧‧‧廣告商

126‧‧‧廣告資料庫

127‧‧‧廣告分類法

130‧‧‧應用程式

135‧‧‧內容池

140‧‧‧內容池產生/更新單元

145‧‧‧概念/內容分析器

150‧‧‧內容爬取器

155‧‧‧使用者瞭解單元

160‧‧‧使用者描述紀錄

165‧‧‧內容分類法

170‧‧‧內容資訊分析器

175‧‧‧使用者事件分析器

190‧‧‧第三方興趣分析器

195‧‧‧社交媒體內容來源辨識器

200‧‧‧廣告***單元

205‧‧‧內容/廣告/分類法關聯器

210‧‧‧內容排序單元

215‧‧‧未知興趣勘探器

205‧‧‧步驟

210‧‧‧步驟

215‧‧‧步驟

220‧‧‧步驟

225‧‧‧步驟

230‧‧‧步驟

235‧‧‧步驟

240‧‧‧步驟

245‧‧‧步驟

250‧‧‧步驟

255‧‧‧步驟

410‧‧‧內容/概念分析控制單元

420‧‧‧內容效能估計器

430‧‧‧內容品質評估單元

440‧‧‧使用者活動分析器

450‧‧‧內容狀態評估單元

455‧‧‧頻率

460‧‧‧內容記錄

470‧‧‧內容描述紀錄

480‧‧‧內容選擇單元

490‧‧‧內容更新控制單元

510‧‧‧步驟

520‧‧‧步驟

530‧‧‧步驟

540‧‧‧步驟

550‧‧‧步驟

560‧‧‧步驟

570‧‧‧步驟

580‧‧‧步驟

610‧‧‧步驟

620‧‧‧步驟

630‧‧‧步驟

640‧‧‧步驟

650‧‧‧步驟

660‧‧‧步驟

670‧‧‧步驟

680‧‧‧步驟

690‧‧‧步驟

710‧‧‧興趣描述紀錄基線產生器

720‧‧‧使用者描述紀錄產生器

730‧‧‧興趣描述紀錄基線

740‧‧‧使用者企圖/興趣估計器

750‧‧‧短期興趣辨識器

760‧‧‧長期興趣辨識器

810‧‧‧步驟

820‧‧‧步驟

830‧‧‧步驟

840‧‧‧步驟

850‧‧‧步驟

860‧‧‧步驟

910‧‧‧步驟

920‧‧‧步驟

930‧‧‧步驟

940‧‧‧步驟

945‧‧‧步驟

950‧‧‧步驟

960‧‧‧步驟

970‧‧‧步驟

980‧‧‧步驟

1010‧‧‧選內容取得器

1020‧‧‧多相內容排序單元

1110‧‧‧步驟

1120‧‧‧步驟

1130‧‧‧步驟

1140‧‧‧步驟

1150‧‧‧步驟

1160‧‧‧步驟

1170‧‧‧步驟

1180‧‧‧步驟

1190‧‧‧步驟

1200‧‧‧系統

1210‧‧‧使用者個人屬性資料檔案

1215‧‧‧事件管線

1220‧‧‧效能索引

1225‧‧‧使用者事件串流

1230‧‧‧使用者分析處理

1235‧‧‧使用者索引

1240‧‧‧內容串流

1245‧‧‧內容處理管線

1250‧‧‧內容索引

1255‧‧‧排序模組

1260‧‧‧頁面

1310‧‧‧使用者識別符

1315‧‧‧推論特徵

1320‧‧‧社交網路數據資料

1325‧‧‧映射至分類法與維基百科

1330‧‧‧映射至分類法與維基百科

1335‧‧‧個人屬性資料

1340‧‧‧使用者宣稱特徵

1350‧‧‧內容串流

1365‧‧‧為效能進行分析

1410‧‧‧第一相排序

1420‧‧‧第一相排序的結果

1430‧‧‧第二相排序

1440‧‧‧個人化內容

1450‧‧‧第三相排序

1510‧‧‧內容管線

1512‧‧‧正規化標註器

1514‧‧‧資料庫

1520‧‧‧內容儲存器

1530‧‧‧索引建立器

1532‧‧‧文件輪詢器

1534‧‧‧排序特徵儲存器

1536‧‧‧資料轉換器

1538‧‧‧快速索引搜尋引擎

1540‧‧‧內容特徵管線

1542‧‧‧事件模型模組

1544‧‧‧彙整器

1550‧‧‧評分伺服器

1552‧‧‧第二相排序

1554‧‧‧第三相排序

1560‧‧‧內容儲存器

1570‧‧‧模組

1572‧‧‧快速索引搜尋索引

1574‧‧‧第一相排序

1610‧‧‧來自社交媒體數據資料的複數個興趣

1615‧‧‧來自複數個檢視習慣推論的複數個興趣

1620‧‧‧映射至分類法與維基百科

1640‧‧‧從內容擷取複數個關鍵用詞

1645‧‧‧映射至分類法與維基百科

1650‧‧‧排序文件品質

1660‧‧‧根據內容題材的第一相排序

1665‧‧‧根據文件品質排序的第二相排序

1670‧‧‧根據複數個規則的第三相排序

1675‧‧‧格式化內容串流

1700‧‧‧電腦

1710‧‧‧匯流排

1720‧‧‧中央處理單元

1730‧‧‧唯讀記憶體

1740‧‧‧隨機存取記憶體

1750‧‧‧電腦輸出微片埠口

1760‧‧‧輸入/輸出組件

1770‧‧‧磁碟

1780‧‧‧使用者介面元件

在此敘述之該等方法、系統及/或程式係進一步對於示例具體實施例敘述。這些示例具體實施例則詳細參考該等圖式敘述。這些具體實施例為非限制性示例具體實施例，其中在該等圖式眾多圖面之中，相同的參考數字代表相同的結構，其中：第一圖描繪根據本發明教導一具體實施例，用於個人化內容推薦之一示例系統圖；第二圖為根據本發明教導一具體實施例，用於個人化內容推薦之一示例程序流程圖；第三圖描述上下文資訊之多種示例形式；第四圖描繪根據本發明教導一具體實施例，一內容池產生/更新單元之一示例圖式；第五圖為根據本發明教導一具體實施例，建立一內容池之一示例程序流程圖；第六圖為根據本發明教導一具體實施例，用於更新一內容池之一示例程序流程圖；第七圖描繪根據本發明教導一具體實施例，一使用者理解單元之一示例圖式；第八圖為根據本發明教導一具體實施例，用於產生一興趣描述紀錄基線之一示例程序流程圖；第九圖為根據本發明教導一具體實施例，用於產生一個人化使用者描述紀錄之一示例程序流程圖；第十圖描繪根據本發明教導一具體實施例，一內容排序單元之一示例系統圖；第十一圖為根據本發明教導一具體實施例，該內容排序單元之一示例程序流程圖；第十二圖描繪根據本發明揭示內容，具有一內容排序系統之一個人化系統之具體實施例；第十三a圖描繪根據本發明揭示一具體實施例，用於建立一使用者描述紀錄之該等輸入；第十三b圖描繪根據本發明揭示一具體實施例，用於建立一內容索引之該等輸入；第十四圖描繪根據本發明揭示一具體實施例，用於一個人化系統之一排序與內容排序單元；第十五圖描繪根據本發明揭示一具體實施例，用於一個人化系統之一排序與內容排序單元；第十六圖描繪根據本發明揭示一具體實施例，用於一個人化系統之一排序與內容排序單元；及第十七圖描繪一一般性電腦結構，於該電腦結構上可實作本發明之教導。

在以下詳細敘述中，以實例方式設定許多特定細節，以提供對該等相關教導的完整瞭解。然而，對於該領域技術人員應該明顯的是，本發明教導可在不利用所述細節下實作。在其他方面，已被知悉的方法、程序、元件及/或電路係以相對高階敘述，而不進行詳細說明，以避免對本發明教導之複數個態樣造成不必要的干擾。

本發明教導與對一使用者的個人化線上內容推薦有關。實際上，本發明教導與一種用於個人化內容推薦的系統、方法及/或程式有關，用以解決與傳統內容推薦方法於個人化、內容池建立與推薦個人化內容有關的缺點。

對於個人化而言，本發明教導辨識一使用者有關於一通用興趣空間的複數個興趣，該通用興趣空間則透過已知的概念資料庫達成，像是維基百科及/或內容分類法。使用所述的通用興趣空間，於多種不同應用程式及透過多種不同平台所呈現複數個使用者的複數個興趣，便可用於建立一般性的人口數據資料以做為基線，以此基線便可決定個別使用者的複數個興趣及興趣程度。例如，活躍在像是臉書或推特等第三方應用程式中的複數個使用者，及所述複數個使用者在這些第三方應用程式所呈現的該等興趣，都可被映射至該通用興趣空間，並接著用於計算該一般人口的興趣描述紀錄基線。具體來說，對於涵蓋某些題材或概念之每一文件所觀察到的每一使用者的複數個興趣，都可以被映射至例如維基百科或某種內容分類法。根據該通用興趣空間可以建構一高維度向量，其中該向量的每一屬性都對應於該通用興趣空間中的一概念，而該屬性數值可對應該使用者對此特定概念之興趣的評估。該一般性興趣描述紀錄基線可根據代表該人口的所有向量所推衍。代表一個體的每一向量都可對於該興趣描述紀錄基線進行正規化，因此可以決定該使用者對於該通用興趣空間中該等概念的興趣相對程度。這可達成對於該使用者相關於較一般性人口而言，於不同題材感興趣之程度的較佳瞭解，並能夠強化個人化的內容推薦。相較於像先前技術時常做的，只根據專有的內容分類法將複數個使用者的複數個興趣特徵化，本發明教導運用公共概念資料庫，像是維基百科或線上百科全書，定義一通用興趣空間，以一種更一致性的方法分析一使用者的複數個興趣。所述高維度向量捕捉每一使用者的完整興趣空間，以更有效果的方式對於個人複數個興趣進行人員對人員的比較。分析一使用者及此方法也達成有效率地辨識共享類似興趣的複數個使用者。此外，可於相同通用興趣空間中對內容進行特徵化，例如，可以建立關於該通用興趣空間中該等概念之一高維度向量，該向量中具有的複數個數值指示該內容是否涵蓋該通用興趣空間中該等概念的每一概念。藉由將使用者與內容以一致性方式於該相同空間特徵化的方式，可以透過例如代表該使用者之向量與代表該內容之向量的內積，決定一使用者與一內容片段之間的近似度。

本發明教導也運用複數個短期興趣，以較佳地瞭解複數個使用者的複數個長期興趣。短期興趣可透過使用者線上活動觀察，並用於線上內容推薦，一使用者較持續的長期興趣則有助於以一種更健全的方式改良內容推薦品質，並因此改善使用者保留率。本發明教導揭示長期興趣及短期興趣的發掘方法。

為了改良個人化，本發明教導也揭示根據各種使用者活動改進估計一使用者興趣之能力的方法。因為有意義的使用者活動時常在不同設定中於不同裝置上並於不同操作模式中發生，因此這特別有用。透過所述不同的使用者活動，可以測量使用者與內容的契合度，以推論使用者的複數個興趣。傳統上，已經使用點擊與點擊率(CTR)估計複數個使用者的企圖及推論複數個使用者的複數個興趣。CTR已不適合現今的世界。複數個使用者可能停留在該內容一特定部分，此停留情況可能是不同時間長度、複數個使用者可能沿著該內容捲動，並停留在該內容一具體部分某時間長度、複數個使用者可能以不同速度向下捲動、複數個使用者可能在靠近該內容某些部分時改變所述速度、複數個使用者可能跳過該內容某些部分等等。所有所述活動都有隱含複數個使用者與該內容之契合度。所述契合度可用於推論或估計一使用者複數個興趣。本發明教導運用可能在不同設定中跨及不同裝置形式發生的各種使用者活動，以達成對複數個使用者契合度的較佳估計，以利用一更可靠的方式強化捕捉一使用者複數個興趣的能力。

關於個人化的本發明教導另一態樣，為利用產生探測內容，勘探一使用者複數個未知興趣的能力。傳統上，使用者分析係根據使用者所提供的資訊(例如，所宣稱的複數個興趣)或被動觀察的過去資訊所進行，像是對於該使用者已經檢視的內容、對所述內容的反應等等。所述先前技術方案可能導致一個人化氣泡罩，其中只有該使用者所顯露的複數個興趣可用於內容推薦。因為這樣，只有該等可被觀察到的使用者活動係被指向所述的已知興趣，阻礙了瞭解一使用者完整興趣的能力。這在複數個使用者時常在不同的應用程式設定中展現不同興趣(大複數個為部分的興趣)的事實下所考量。本發明教導揭示利用複數個概念產生探測內容的方法，該等概念目前係未被辨別成為該使用者複數個興趣之一，以勘探該使用者未知的複數個興趣。所述探測內容係經選擇並推薦給該使用者，而指至該探測內容的複數個使用者活動接著可經分析，以估計該使用者是否具有複數個其他興趣。所述探測內容的選擇可以一使用者目前已知的複數個興趣為基礎，例如，藉由外推該使用者目前複數個興趣的方式。例如，對於該使用者的某些已知興趣(例如，在當時的複數個短期興趣)而言，在該通用興趣空間中的某些探測概念，其為該使用者於過去中並未展現的複數個興趣，係可根據某些條件(例如，在一分類樹中與該使用者目前已知興趣相距一特定距離內)加以選擇，而接著與所述探測概念有關的內容可被選擇，並推薦給該使用者。另一種辨識探測概念(相應於該使用者的位置興趣)的方法則可透過該使用者的世代群組。例如，一使用者可以與他/她的世代群組共有某些興趣，但該群組圈裡的某些成員可能具有某些該使用者之前未曾展現過的某些興趣。所述與世代群組間未共有的興趣可被選擇做為該使用者的探測未知興趣，而接著與所述探測未知興趣有關的內容可被選擇做為推薦給該使用者的探測內容。在此方法中，本發明教導揭示一種方案，藉此方案可以連續探測並瞭解一使用者的複數個興趣，以改善個人化的品質。所述經管理的探測方式可與隨機選擇的探測內容組合，以發掘與該使用者目前複數個已知興趣相距甚遠的該使用者複數個未知興趣。

推薦品質個人化內容之一第二態樣，為建立具有品質內容之一內容池，該內容池涵蓋複數個使用者感到興趣的複數個題材。在該內容池中的內容可對於該內容本身的主題及/或效能給予評比。例如，可將內容對於其所揭示之複數個概念進行特徵化，而所述特徵可關於該通用興趣空間產生，例如，如以上討論透過像是內容分類法及/或維基百科及/或線上百科全書的概念資料庫所定義。例如，每一內容片段都可透過一高維度向量特徵化，該高維度向量每一屬性都與該通用興趣中一概念對應，而該屬性的數值指示該內容是否涵蓋該概念及/或該內容涵蓋該概念的程度。當一內容片段如對於使用者描述紀錄一般於該相同通用興趣空間中進行特徵化時，便可以有效率的決定該內容與一使用者描述紀錄之間的近似度。

該內容池中每一內容片段都可以各自對於複數個其他條件特徵化。例如，與效能相關的度量，像是該內容的流行性可以用於敘述該內容。與效能相關的內容特徵可用於選擇被整合至該內容池之中的內容，及用於選擇已經在該內容池中而為複數個特定使用者進行個人化內容推薦的內容。所述每一內容片段複數個效能導向的特徵可能隨時間改變，並可以根據複數個使用者複數個活動進行週期性估計及完成。內容池也根據各種理由隨時間改變，像是內容效能、複數個使用者複數個興趣的改變等等。在該內容池中內容特徵的效能動態改變也可以根據該內容的效能度量進行週期性或動態的評估，因此內容池可隨時間調整，也就是利用移除低效能內容片段、加入具有高效能的新內容，或是更新內容。

為了使該內容池成長，本發明的教導揭示將來自該等新內容來源的可存取、評估或整合至該內容池之中的興趣內容，連續發掘新內容與複數個新內容來源兩者的方式，。可透過存取來自複數個第三方應用程式的資訊，動態發掘新內容，複數個使用者係使用該等第三方應用程式並展現各種興趣。所述第三方應用程式的實例包含臉書、推特、Microblogs或YouTube。當根據某些(自然)事件的發生，產生或預測對於某些題材出現某些新的興趣或感興趣的增加程度時，也可以將新的內容加入該內容池。一實例為有關於Pope Benedict生命的內容，一般而言這對於大複數個使用者並非是感興趣的主題，但可能在Pope Benedict突然的辭職發佈時，造成大複數個使用者的興趣。所述對該內容池的動態調整目標在於涵蓋複數個使用者複數個興趣的一動態(或可能成長)範圍，包含那些由複數個使用者在不同設定或應用程式中所展現的那些，或按照上下文資訊進行的預測。接著在將所述新發掘的內容可被選擇加入至該內容池之前，可對該內容進行評估。

該內容池中的某些內容，例如日誌或新聞，則需要隨時間更新。傳統的方法通常根據一固定排程週期性更新所述內容。本發明教導揭示根據各種因子決定該內容池中內容更新步調的動態方案。內容更新可受到上下文資訊的影響。例如，一內容片段進行更新排程的頻率可能是每兩小時，但此頻率可根據例如像是地震的突發事件作動態調整。做為另一實例，一般而言來自臉書上專用於天主教信仰的社交群集內容可以每天進行更新。當Pope Benedict的辭職新聞發生時，來自該社交群集的內容可被每小時更新，因此有興趣的複數個使用者可以保持對於來自此社交群集複數個成員的討論追蹤。此外，不管在何時出現新辨識的內容來源時，都可以利用例如從該等新來源爬取該內容、處理該經爬取內容、評估該經爬取內容，及選擇被整合至該內容池之品質新內容新的方式，進行更新該內容池的排程。所述動態更新的內容池目標在於相容於該動態改變的複數個使用者複數個興趣而成長，以促成具品質的個人化內容推薦。

另一項品質個人化內容推薦的關鍵，為辨識符合一使用者該等興趣之品質內容以進行推薦的態樣。先前解決方法當選擇推薦內容時時常只強調該內容對於該使用者的相關性。此外，根據內容推薦的傳統相關性大多只以該使用者複數個短期興趣為基礎。這不只造成一內容推薦氣泡罩，就是已知複數個短期興趣造成推薦便受限於該等短期興趣，而對於所述短期興趣的反應則使該推薦循環集中回到開始該程序的該等短期興趣。此氣泡罩使其難以離開該循環，亦即難以推薦不但作為複數個使用者的該等整體興趣，也作為複數個使用者複數個長期興趣的內容。本發明教導結合相關性與該內容的效能，因此可在一多相排序系統中，對複數個使用者選擇及推薦不但具有相關係也具有品質的內容。

此外，為了辨識可作為一使用者廣泛興趣範圍的推薦內容，本發明教導係以該使用者的短期與長期興趣兩者為基礎，辨識使用者-內容的近似度，以選擇符合複數個使用者多處興趣的廣泛範圍，推薦給使用者的內容。

在內容推薦中，像是廣告的貨幣化內容通常也經選擇作為向一使用者推薦之內容的部分。傳統方法選擇廣告的方式，時常係以***該廣告之內容為基礎。某些傳統方式也根據像是查詢的使用者輸入為基礎，以估計何者廣告可能使回收經濟效益最大。這些方法藉由比對該查詢分類法或根據該查詢所取得之內容與廣告內容分類法的方式選擇該廣告。然而，內容分類法普遍被認為不對應於廣告分類法，複數個廣告商係使用廣告分類法瞄準特定聽眾。因此，根據內容分類法選擇廣告並無法使***至該內容並向複數個使用者推薦的廣告獲得最大的回收經濟效益。本發明教導揭示建立內容分類法與廣告分類法之間鏈結的方法與系統，因此可選擇不只與一使用者複數個興趣有關，也與複數個廣告商的興趣有關的廣告。在此方法中，推薦給使用者帶有廣告的內容不僅考慮了該使用者的複數個興趣，而在同時也允許該內容操作者透過廣告增強貨幣化效果。

而本發明教導之另一項個人化內容推薦的態樣與推薦探測內容有關，該探測內容係由外推目前已知的使用者複數個興趣以辨識。傳統方法以選擇目前已知使用者複數個興趣以外的隨機內容，或是具有像是高度點擊活動之特定效能的內容為基礎。隨機選擇探測內容為低機率的去發掘出一使用者複數個未知興趣。藉由選擇已被觀察到具有較高度活動之內容進行探測內容辨識也同樣具有問題，因為可能存在一使用者潛在有興趣的許多內容片段，但該等片段僅具有低度活動程度。本發明教導揭示藉由外推目前已知興趣的方式辨識探測內容的方法，其具有從該等目前已知興趣移開多遠的彈性。此方法也整合辨識品質探測內容的機制，因此對於發掘一使用者複數個未知興趣上具有強化的可能性。在任何時刻該等興趣的焦點都可做為一錨定興趣，根據該錨定興趣便可從該等錨定興趣外推複數個探測興趣(其非為該使用者目前被已知的興趣)，並可以根據該等探測興趣選擇探測內容，並與該等錨定興趣的內容一起推薦給該使用者。也可以根據其他考量決定探測興趣/內容，像是位置、時間或裝置型式。在此方式中，所揭示之個人化內容推薦系統可以連續勘探及發掘一使用者的複數個未知興趣，以對該使用者整體興趣更加瞭解，以擴展服務範圍。

在以下敘述中，將部分設定額外的新穎特徵，該等部分對於該領域技術人員在檢視下述與該等伴隨圖式之後將變的明確，並可藉由該等實例的製造與操作獲得學習。本發明教導之該等優點可透過實作或使用於以下討論該等詳細實例中所設定之方法論、手段與組合所實現及達成。

第一圖描繪根據本發明教導一具體實施例之一示例系統圖式10，以對一使用者105進行個人化內容推薦。系統10包括一個人化內容推薦模組100、複數個內容來源110、複數個知識資料庫115、複數個第三方平台120與複數個廣告商125，該等廣告商125具有廣告分類法127與廣告資料庫126，該個人化內容推薦模組100包括許多子模組。該等內容來源110可為任何線上內容來源，像是線上新聞、發佈文章、部落格、線上文摘、雜誌、音訊內容、圖片內容與視訊內容。其可為來自內提供者的內容，像是來自Yahoo！Finance、Yahoo！Sports、CNN與ESPN。其可為多媒體內容或文字或任何其他內容形式，包括網站內容、社交媒體內容，像是臉書、推特、Reddit等等，或其他的豐富內容提供器。其可為來自像是AP與Reuters之提供者的版權內容。其也可以是在網際網路上從各種來源所爬取及標記的內容。該等內容來源110提供龐大的內容陣列至該系統10該個人化內容推薦模組 100。

該等知識資料庫115可為像是維基百科的線上百科全書或是線上字典的索引系統。該等線上概念資料庫115可用於其內容與其分類或索引系統。該等知識資料庫115提供擴充的分類系統，以協助該使用者105複數個偏好的分類與內容的分類兩方。該等知識概念資料庫，像是維基百科可能具有數十萬至數百萬的分類與子分類。分類可用於顯示該類型的階層。該等分類兩項主要目的。首先，該等分類協助該系統瞭解一類型與另一類型如何相關，第二，該等分類協助該系統於該階層較高階層之間的調遣，而不需要往上及往下移動至該等次類型。在該等知識資料庫115中所建立之該等類型或分類結構則用於多維度內容向量與多維度使用者描述紀錄向量，該等向量可由該個人化內容推薦模組100使用，以對一使用者105比對個人化內容。該等第三方平台120可為任何第三方平台，包含像是臉書、推特、LinkedIn、Google+的社交網站，但不限制於此。其可包含複數個第三方郵件伺服器，像是Gmail或Bing Search。該等第三方平台120提供內容來源與對於一使用者複數個個人化偏好及行為的瞭解兩方。

該等廣告商125可與該廣告內容資料庫126及廣告分類系統或該廣告分類法127連接，該廣告分類法127則為廣告內容分類法所用。該等廣告商125提供串流內容、靜態內容與贊助內容。廣告內容可放置於一個人化內容頁面任何位置上，並可呈現為策略上置在該內容串流中或繞著該內容串流放置之一內容串流之部分與一獨立廣告兩方。

該個人化內容推薦模組100包括複數個應用程式130、內容池135、內容池產生/更新單元140、概念/內容分析器145、內容爬取器150、未知興趣勘探器215、使用者瞭解單元155、複數個使用者描述紀錄160、內容分類法165、內容資訊分析器170、使用者事件分析器175、第三方興趣分析器190、社交媒體內容來源辨識器195、廣告***單元200及內容/廣告/分類法關聯器205。這些元件經連結以達成個人化、內容池建立及推薦個人化內容給一使用者。例如，一內容排序單元210與該內容資訊分析器170、未知興趣勘探器215及該廣告***單元200一起工作，以產生推薦給一使用者之個人化內容，該個人化內容具有***之個人化廣告或探測內容。為了達成個人化，該使用者瞭解單元155與各種元件聯合工作，以動態及連續地更新該等使用者描述紀錄160，包含該內容分類法165、該等知識資料庫115、該使用者事件分析器175與該第三方興趣分析器190。各種元件係經連結以維持一內容池，包含該內容池產生/更新單元140、該使用者事件分析器175、該社交媒體內容來源辨識器195、概念/內容分析器145、內容爬取器150、內容分類法165與該等使用者描述紀錄160。

當該使用者105透過該等應用程式130加入該系統10時，便觸發該個人化內容推薦模組100。該等應用程式130可以透過某些計算裝置形式，從該使用者105接收具有使用者識別、餅乾文件、登錄資訊形式的資訊。該使用者105可以透過有線或無線裝置存取該系統10，並可以使用固定式或行動式的裝置。該使用者105可以在一平板、智慧手機、膝上電腦、桌上電腦或任何其他計算裝置上與該等應用程式130介接，該等應用程式可嵌入於像是手錶、眼鏡或汽車等的裝置之中。除了接收來自該使用者105有關於該使用者105可能對何種資訊有興趣的瞭解以外，該等應用程式130也以個人化內容串流的形式提供該使用者105資訊。使用者瞭解可為輸入至該系統的使用者搜尋項目、使用者宣稱之興趣、使用者於一特定文章或主題上的點擊、使用者於特定內容的停留時間與捲動、使用者對於某些內容跳過等等。使用者瞭解可為該使用者於一社交網站上所進行喜愛、分享或轉寄動作的使用者指示，像是在臉書上，或甚至像是列印或掃瞄某些內容的周邊設備活動。這些所有的使用者瞭解或事件都由該個人化內容推薦模組100使用，以設置並客製化對該使用者105呈現的內容。透過該等應用程式130所接收之該等使用者瞭解則用於更新代表該等使用者的個人化描述紀錄，可被儲存於該等使用者描述紀錄160中。該等使用者描述紀錄160可為一資料庫或一資料庫串列，以儲存個人化使用者資訊在該系統10的該等所有使用者中。該等使用者描述紀錄160可為一平坦或關聯式資料庫，並可儲存於一或多個位置中。所述使用者瞭解也用於決定如何動態更新該內容池135中之內容。

透過該等應用程式130所接收之一特定使用者事件則沿著該使用者事件分析器175通過，該使用者事件分析器175分析該使用者事件資訊，並將該分析結果與該事件資料饋入至該使用者瞭解單元155及/或該內容池產生/更新單元140。根據所述使用者事件資訊，該使用者瞭解單元155估計該使用者之複數個短期興趣及/或根據該使用者105在長時間或重複期間所展現的複數個行為，推論該使用者的複數個長期興趣。例如，一長期興趣可為關於運動的一般興趣，而一短期興趣可能與一特殊運動事件有關，像是在特定時間的超級盃。隨時間經過，可藉由分析複數個重複使用者事件的方式估計一使用者的長期興趣。一使用者在每次契合該系統10的期間規則地選擇與該股票市場相關的內容，都可以視為是對於財經具有一長期興趣。在此情況中，該系統10據此能夠為該使用者105決定該個人化內容應該包含與財經有關的內容。相對的，短期興趣可以根據在一短期內時常發生的複數個使用者事件，但並非為長期中該使用者105所感到有興趣的某些事物所決定。例如，一短期興趣可以反映一使用者的瞬間興趣，其可能因為該使用者看到該內容所觸發，但所述興趣並不隨時間持續存在。對於辨識符合該使用者105需求的內容而言，短期與長期興趣都很重要，但因為其本質上及影響該使用者的方式的差異，而需要被分別管理。

在某些具體實施例中，可分析一使用者的複數個短期興趣以預測該使用者的複數個長期興趣。為了維持住一使用者，重要的是瞭解該使用者的持續性或長期興趣。藉由辨識該使用者105短期興趣並提供他/她具品質的個人化經驗，該系統10可以將一偶發的使用者轉變成為一長期使用者。此外，短期興趣可能轉變成為長期興趣，反之亦然。該使用者瞭解單元155提供估計短期與長期興趣兩者的能力。

該使用者瞭解單元155從多重來源蒐集使用者資訊，包含該等所有使用者事件，並建立一或多個多維度個人化向量。在某些具體實施例中，該使用者瞭解單元155接收關於該使用者105根據該等使用者事件所推論的複數個特徵，像是他/她觀看的內容、自我宣稱之複數個興趣、屬性或特徵、複數個使用者活動及/或來自複數個第三方平台的複數個事件。在一具體實施例中，該使用者瞭解單元155從該社交媒體內容來源辨識器195接收複數個輸入。該社交媒體內容來源辨識器195以該使用者105的社交媒體內容為基礎，將該使用者描述紀錄個人化。藉由分析該使用者的社交媒體頁面、喜好、分享等等，該社交媒體內容來源辨識器195提供資訊至該使用者瞭解單元155。該社交媒體內容來源辨識器195能夠利用辨識例如在複數個社交媒體平台上具品質之數位策展員的方式，辨別複數個新的內容來源，該等社交媒體平台則像是推特、臉書或部落格，該社交媒體內容來源辨識器195也能夠使該個人化內容推薦模組100發掘複數個新的內容來源，來自該等內容來源的品質內容則可加入至該內容池135。由該社交媒體內容來源辨識器195所產生的資訊可傳送至該概念/內容分析器145，並接著根據內容分類法165及複數個知識資料庫115之一分類系統，映射至特定類型或分類。

該第三方興趣分析器190運用來自複數個其他第三方平台關於複數個使用者活躍在所述第三方平台上的資訊、複數個使用者興趣及這些第三方使用者的內容，強化該使用者瞭解單元155的效能。例如，當可以從一或多個第三方平台存取關於一大量使用人口的資訊時，該使用者瞭解單元155可以根據關於一大量人口的資料，建立一興趣描述紀錄基線，以進行複數個個別使用者更精準及更可靠的興趣估計，例如，藉由比較關於一特定使用者的興趣資料與該興趣描述紀錄基線的方式，將能高度確定性地捕捉該使用者複數個興趣。

當從該內容來源110或該等第三方平台120辨識新內容時，該內容係經處理，且其複數個概念係被分析。該等概念可映射至該內容分類法165與該等知識資料庫115中的一或多個類型。該內容分類法165是一種組織化的概念結構或概念類型，且其可以包含數千種分類的數百種分類。該等知識資料庫115可以提供百萬種概念，其可以或可以不利用與該內容分類法165相同的方式結構化。所述內容分類法與知識資料庫可以做為一通用興趣空間。從該內容所估計的複數個概念可被映射至一通用興趣空間，並可為每一內容片段建構一高維度向量，該高維度向量可用於將該內容特徵化。同樣的，對每一使用者而言，也可以建構一個人的興趣描述紀錄，其特徵化為複數個概念，並將該使用者複數個興趣映射至該通用興趣空間，因此可以建構利用該使用者複數個興趣程度所填入的一高維度向量。

該內容池135可為一般性內容池，其具備用於提供所有使用者的內容。該內容池135也可以建構為具有為每一使用者的個人化內容池。在此情況中，該內容中的內容係對於每一個別使用者所產生及保留。該內容池也可以被組織為一層狀系統，其具備該一般性內容池及為複數個不同使用者的複數個個人化個別內容池。例如，在一使用者之每一內容池中，該內容本身可以不實際存在，但可以透過鏈結、指標或索引操作，該等鏈結、指標或索引則提供指向該實際內容儲存於該一般性內容池何處的參考。

該內容池135係由該內容池產生/更新單元140動態更新。該內容池135中的內容來來去去，並根據該等使用者該動態資訊、該內容本身及其他資訊形式建立複數個決策。例如，當該內容效能退化時，例如該使用者展現低度興趣時，該內容池產生/更新單元140可以決定從該內容池去除該內容。當內容變的陳舊或過期時，也可以從該內容池移除該內容。當存在來自從一使用所偵測的較新興趣時，該內容池產生/更新單元140可以取得與該等新發掘興趣校準的新內容。該等使用者事件對於內容效能與使用者興趣動態而言，可能是一種建立觀測的重要來源。該等使用者活動係由該使用者事件分析器175分析，而所述資訊則傳送至該內容池產生/更新單元140。當取得新內容時，該內容池產生/更新單元140引動該內容爬取器150 蒐集新內容，接著由該概念/內容分析器145分析，接著在決定該內容是否包含於該內容池中之前，由該內容池產生/更新單元140對該內容品質與效能進行評估。該內容可能因為其不再相關、因為複數個其他使用者不再認為其具有高品質，或因為其不再具有適時性而從該內容池135移除。如果該使用者105具備高品質、及時個人化內容的潛在來源，當該內容時常改變及更新時，該內容池135也時常改變及更新。

除了該內容以外，該個人化內容推薦模組100也用於從該廣告商125進行目標或個人化廣告內容。該廣告資料庫126包含欲被***至一使用者內容串流中的廣告內容。來自該廣告資料庫126之廣告內容則透過該內容排序單元210***至該內容串流之中。該廣告內容的個人化選擇可以該使用者描述紀錄為基礎。該內容/廣告/分類法關聯器205可以將一不同的廣告分類法127重新投影或映射至與該等使用者描述紀錄160關聯的分類法。該內容/廣告/分類法關聯器205可以對該重新投影應用一直接映射方式，或以應用某些智慧演算法，以根據類似或重疊的分類法類型，決定該等使用者哪些具有一相似或相關的興趣。

該內容排序單元210根據該使用者描述紀錄為基礎從該內容池135所選擇的內容，及由該廣告***單元200選擇的廣告，產生欲對該使用者105推薦之該內容串流。欲推薦給該使用者105的內容也可以根據來自該內容資訊分析器170的資訊由該內容排序單元210決定。例如，如果一使用者目前位於不同於該使用者描述紀錄中郵遞區號的一海灘城鎮中時，便可以推論該使用者可在度假。在此情況中，與該使用者目前所在位置相關的資訊可以從該內容資訊分析器170傳遞給該內容排序單元210，因此可以選擇不但符合該使用者複數個興趣，也為該地區進行客製化的內容。其他上下文資訊包括日期、時間與裝置形式。該上下文資訊也可以包含在該使用者目前使用之裝置上所偵測的事件，像是釣魚專用網站的一瀏覽事件。根據所述一偵測事件，可以由該內容資訊分析器170估計該使用者的瞬間興趣，其接著可以引導該內容排序單元210蒐集在該使用者所在地區與釣魚適宜性相關的內容，以進行推薦。

該個人化內容推薦模組100也經配置以允許在推薦給該使用者105的內容中包含探測內容，即使該探測內容並不代表與該使用者目前複數個已知興趣相符的題材。所述探測內容可由該未知興趣勘探器215所選擇。一旦該探測內容整合至欲推薦給該使用者的內容中，便由該使用者事件分析器175蒐集並分析與指向該探測內容之複數個使用者活動有關的資訊(包含不進行動作)，接著將該分析結果傳遞至長期/短期興趣辨識器180及185。如果對於指向該探測內容之複數個使用者的分析顯示該使用者對於該探測內容有興趣或沒興趣，那麼該使用者瞭解單元155可以據此更新與該經探測使用者相關的使用者描述紀錄。這是一種如何發掘複數個未知興趣的方法。在某些具體實施例中，根據該使用者目前的關注興趣(例如，短期興趣)，以外推該等目前關注興趣的方法，產生該探測內容。在某些具體實施例中，可從不管是來自該內容池135或來自該等內容來源110的一般性內容，透過一隨機選擇辨識該探測內容，因此可以執行一額外的探測，以發掘複數個未知興趣。

為了辨識向一使用者推薦的個人化內容，該內容排序單元210根據在一多相排序方法中該使用者描述紀錄向量與該內容向量的比較，採用所有這些輸入並辨識該內容。該選擇也可以使用上下文資訊加以過濾。接著，被***之廣告及可能的探測內容，可以與該經選擇個人化內容合併。

第二圖為根據本發明教導一具體實施例，用於個人化內容推薦之一示例程序流程圖。在205處產生內容分類法。從複數個不同內容來源存取內容，並分析該內容，將該內容分類法為複數個不同可為預定之類型中。每一類型都給定某些標籤，接著將複數個不同類組織至某些結構中，例如，組織至一階層結構中。在210處產生一內容池。當建立該內容池時可以應用不同條件。所述條件的實例包含由該內容池中該內容所涵蓋的複數個主題、該內容池中該內容的效能等等。可獲得用以填入該內容池之內容的複數個來源包含該等內容來源110或該等第三方平台120，像是臉書、推特、部落格等等。第三圖提供根據本發明教導一具體實施例，與內容池建立有關的更詳細示例流程圖。在215處根據例如使用者資訊、複數個使用者活動、該使用者複數個經辨識的短期/長期興趣等等，產生複數個使用者描述紀錄。該等使用者描述紀錄可相關於一人口興趣描述紀錄基線產生，該人口興趣描述紀錄基線則以例如有關於第三方興趣、複數個知識資料庫與複數個內容分類法為基礎所建立。

一旦該等使用者描述紀錄與該內容池被建立之後，當該系統10在220處偵測一使用者的存在時，像是位置、日期、時間的上下文資訊便可於225處獲得及分析。第四圖描述上下文資訊之複數個示例形式。根據該經偵測使用者描述紀錄、選擇性的上下文資訊，便可辨識用於推薦的個人化內容。第五圖中呈現用於產生供推薦之個人化內容的高階示例流程。所述經蒐集的個人化內容可被排序及過濾，使用於推薦之內容總量達到合理的尺寸。選擇地(未圖示)，廣告與探測內容也可以整合於該個人化內容之中，所述內容接著在230處推薦給該使用者。

在235處監控對該經推薦內容的複數個使用者反應與活動，並於240處分析。所述事件或活動包含點擊、跳過、停留時間測量、捲動位置與速度、位置、時間、分享、轉遞、盤旋、像是搖晃的動作等等。要瞭解任何其他事件或活動是可以監控及分析的。例如，當該使用者移動該滑鼠游標在該內容上時，該內容的標題或摘要可能會被強調或被輕微的展開。在另一實例中，當一使用者利用她/他的指尖與一觸控螢幕互動時，可以偵測任何已知的觸控螢幕使用者手勢。仍在另一實例中，於該使用者裝置上的眼球追蹤可為另一種使用者活動，此活動與使用者行為相關，並可被偵測。所述使用者事件的分析包括評估該使用者的複數個長期興趣，及所述展現的複數個短期興趣是如何可能影響該系統對該使用者複數個長期興趣的瞭解。與所述評估有關的資訊接著被傳遞至該使用者瞭解單元155，以在255處引導如何更新該使用者描述紀錄。在同時間，根據該等使用者活動，於245處評估該等使用者呈現興趣之推薦內容的部分，而接著在250處使用該評估結果更新該內容池。例如，如果該使用者對於該建議的探測內容顯示有興趣，便可能適合更新該內容池，以確保新發掘出的該使用者興趣有關的內容將被包含於該內容池中。

第三圖描述多種不同上下文資訊形式，其可被偵測及使用，以協助向一使用者推薦之個人化內容。在此描述中，上下文資訊可以包含許多資料類型，該等資料類型包含但不限制於時間、空間、平台與網路條件。時間相關資訊可為該年的時間、(例如，從一特定月份可推論何季節)、該週的日數、該日的特定時間等等。所述資訊可以提供對於與一使用者關聯之何種特定興趣集合可能是最相關的瞭解。在特定時刻推論一使用者該等特定興趣，也可能與該使用者所處地區有關，而這可以在空間相關上下文資訊中反映，像是哪個國家、什麼地區(例如，觀光城鎖)、該使用者在哪個設施裡(例如，在雜貨店裡)，或甚至該使用者當時站在哪個景點(例如，該使用者可能正站在一雜貨店裡陳列穀類食品的走廊中)。其他上下文資訊形式包含與該使用者裝置有關的特定平台，例如，智慧手機、平板、膝上電腦、桌上電腦、該使用者裝置的頻寬/資料傳輸率，這將影響可以有效對該使用者呈現的內容形式。此外，像是該使用者裝置所連接之網路的狀態、於該條件下的可用頻寬等等的網路相關資訊，也可能影響應該推薦給該使用者的內容，因此該使用者可以以合理的品質接收或檢視該推薦內容。

第四圖描繪根據本發明教導一具體實施例，該內容池產生/更新單元140之一示例系統圖式。該內容池135可被初次產生，並接著根據該等使用者、該等內容及偵測需求的動態所維持。在此描述中，該內容池產生/更新單元140包括一內容/概念分析控制單元410、一內容效能估計器420、一內容品質評估單元430、一內容選擇單元480，該內容選擇單元480將選擇適當的內容以放置於該內容池135之中。此外，為了控制如何更新內容，該內容池產生/更新單元140也包含一使用者活動分析器440、一內容狀態評估單元450與一內容更新控制單元490。

該內容/概念分析控制單元410與該內容爬取器150(第一圖) 介接，以獲得候選內容，該候選內容將被分析以決定是否將該新內容加入至該內容池。該內容/概念分析控制單元410也與該內容/概念分析器145(第一圖)介接，以獲得內容，該內容經分析以擷取由該內容涵蓋的複數個概念或主題。根據該新內容的分析，可以透過例如將從該內容擷取之該等概念映射至該通用興趣空間的方法，計算代表該內容描述紀錄的一高維度向量，該通用興趣空間則由例如透過維基百科或其他內容分類法所定義。所述內容描述紀錄向量可以與該等使用者描述紀錄160比較，以決定該內容是否引起該等使用者的興趣。此外，可由該內容效能估計器420根據例如第三方資訊對於該內容的效能進行評估，該第三方資訊則像是複數個使用者來自複數個第三方平台的複數個活動，因此該新活動雖然尚未由該系統複數個使用者所動作，仍可評估其效能。該內容效能資訊可以與和該內容主題相關的該內容高維度向量一起儲存於該內容描述紀錄470中。該效能評估也被傳送至該內容品質評估單元430，例如該內容品質評估單元430將以一種與該內容池中複數個其他內容片段一致的方式，一起進行該內容排序。根據所述排序，該內容選擇單元480接著決定該新內容是否要被整合至該內容池135之中。

為了動態更新該內容池135，該內容池產生/更新單元140可以根據所有存在於該內容池中的內容保持一內容記錄460，並在接收更多與該內容效能有關的資訊時，動態更新該記錄。當該使用者活動分析器440接收與該等使用者事件有關的資訊時，可以在該內容記錄460中記錄所述事件，並執行分析以估計例如該相關內容之效能或流行性隨時間的任何改變。來自該使用者活動分析器440的結果也可以用於更新該等內容描述紀錄，例如，效能於何時發生改變。該內容狀態評估單元450監控該內容記錄460與該內容描述紀錄470，以動態決定該內容池135中每一內容片段係如何被更新。根據與一內容片段有關之狀態，如果該內容效能退化至一特定程度以下時，該內容狀態評估單元450可以決定捨棄該內容。也可以在該系統複數個使用者整體興趣程度下降至一特定程度以下時，決定捨棄該內容片段。對於需要更新的內容而言，例如新聞或日誌，該內容狀態評估單元450也可以根據其接收的動態資訊控制該等更新的頻率455。該內容更新控制單元490根據來自該內容狀態評估單元450的複數個決定及某些內容需要進行更新的頻率，進行該等更新工作。該內容更新控制單元490也可以在存在周邊資訊指示需求時決定加入新內容，例如出現突發事件而且在該內容池中關於該題材的內容並不適時的時候。在此情況中，該內容更新控制單元490分析該周邊資訊及是否需要新內容，接著該內容更新控制單元490傳送一控制訊號至該內容/概念分析控制單元410，因此該內容更新控制單元490可以與該內容爬取器150介接以獲得新內容。

第五圖為根據本發明教導一具體實施例，建立該內容池之一示例程序流程圖。在510處從複數個內容來源存取內容，包含來自像是Yahoo！之內容入口網站、來自像是網站或檔案傳送協定(FTP)站的一般性網際網路來源、來自像是推特的社交媒體平台或像是臉書之其他第三方平台的內容。於520處，對於像是效能、該內容所涵蓋之題材，及該內容如何滿足複數個使用者複數個興趣的各種考量評估所述經存取內容。根據所述評估，於530處選擇某些內容以產生該內容池135，該內容池135可用於該系統的一般人口，或可具有進一步的結構以建立複數個子內容池，根據該使用者複數個特定興趣，該每一個子內容池都可以專屬於一特定使用者。在540，決定是否建立複數個使用者特定內容池。如果否，在580處組織該一般性內容池135(例如，給予索引或分類)。如果打算為複數個個別使用者建立複數個個別內容池，於550處獲得複數個使用者描述紀錄，並對於每一使用者描述紀錄於560處選擇一個人化內容集合，接著於570處使用該個人化內容集合為每一使用者建立一子內容池。接著在580處組織該整體內容池與該等子內容池。

第六圖為根據本發明教導一具體實施例，用於更新該內容池135之一示例程序流程圖。於610處接收動態資訊，所述資訊包含複數個使用者活動、周邊資訊、使用者相關資訊等等。根據該接收動態資訊，於620處更新該內容記錄，並於630處分析該動態資訊。根據該接收動態資訊的分析，於640處對於由該動態資訊所涉及之內容，針對該內容的狀態改變進行評估。例如，如果接收資訊係與指向特定內容片段之複數個使用者活動有關，該內容片段的效能便需要被更新，以產生該內容片段的新狀態。接著在650處決定是否需要更新。例如，如果來自一外圍來源的動態資訊指示特定主題的內容可能在最近未來時具有高度需求，可以決定取得該主題的新內容，並將該內容加入至該內容池。在此情況中，於660處，便決定需要加入內容。此外，如果一內容片段的效能或流行性已經剛好下降至一可接受程度，該內容片段可能需要從該內容池135捨棄。在670處選擇欲被捨棄的內容。此外，如果該接收動態資訊指示需要對於像是日誌或新聞的規則性刷新內容進行更新時，進行該更新所依據的排程也可以被改變。這則在680處達成。

第七圖描繪根據本發明教導一具體實施例，該使用者瞭解單元155之一示例圖式。在此示例建構中，該使用者瞭解單元155包括一興趣描述紀錄基線產生器710、一使用者描述紀錄產生器720、一使用者企圖/興趣估計器740、一短期興趣辨識器750與一長期興趣辨識器760。操作上，該使用者瞭解單元155採用各種輸入並產生該等使用者描述紀錄160作為輸出。其輸入包含第三方資料，像是來自所述第三方平台的複數個使用者資訊及內容、所述使用者所存取及陳述之複數個興趣、於所述第三方資料中涵蓋的複數個概念、來自該通用興趣空間(例如，維基百科或內容分類法)的複數個概念、有關於準備建構之該等個人化描述紀錄之複數個使用者的資訊，及與所述使用者該等活動有關的資訊。來自欲被產生及更新之個人化描述紀錄之一使用者的資訊包含該使用者的個人屬性資料、該使用者宣稱的複數個興趣等等。與複數個使用者事件有關的資訊包括時間、日期、該使用者進行某些活動的位置，像是點擊一內容片段、在一內容片段上停留長時間、轉遞一內容片段給朋友等等。

操作上，該興趣描述紀錄基線產生器710存取有關大量使用者人口的資訊，包含複數個使用者的複數個興趣及來自一或多個第三方來源(例如，臉書)該等使用者有興趣的內容。來自所述來源的內容則由該概念/內容分析器145(第一圖)分析，該概念/內容分析器145從所述內容辨識該等概念。當由該興趣描述紀錄基線產生器710接收所述概念時，該興趣描述紀錄基線產生器710將所述概念映射至該等知識資料庫115與內容分類法165(第一圖)，並產生一或多個高維度向量，其代表該使用者人口之興趣描述紀錄基線。所述產生的興趣描述紀錄基線儲存於該使用者瞭解單元 155中的730處。當存在來自額外第三方來源的類似資料時，該興趣描述紀錄基線730可被動態更新，以反映該成長人口的興趣程度基線。

一旦該興趣描述紀錄基線被建立，當該使用者描述紀錄產生器720接收使用者資訊或與估計該相同使用者短期與長期興趣有關的資訊時，該使用者描述紀錄產生器720接著可將該使用者複數個興趣映射至例如由該等知識資料庫或內容分類法所定義之該等概念，因此現在該使用者的複數個興趣便被映射至該相同空間，該空間則為建構該興趣描述紀錄基線的空間。該使用者描述紀錄產生器720接著比較該使用者關於每一概念的興趣程度與由該興趣描述紀錄基線730所表現一較大使用者人口的興趣程度，以決定該使用者關於該通用興趣空間中每一概念的興趣程度。這為每一使用者產出一高維度向量。在結合其他額外資訊下，像是結合使用者個人屬性資料等等，便可以產生一使用者描述紀錄並儲存於160中。

該等使用者描述紀錄160係根據新接收的動態資訊持續更新。例如，一使用者可以宣稱複數個其額外資訊，而所述資訊在由該使用者描述紀錄產生器720接收時，可用於更新該對應使用者描述紀錄。此外，該使用者可能在複數個不同應用程式中活躍，而所述活動可經觀察，而與這些有關的資訊可被蒐集，以決定這些活動如何影響該現有的使用者描述紀錄，並在需要時，根據所述新資訊更新該使用者描述紀錄。例如，與每一使用者有關之複數個事件可由該使用者企圖/興趣估計器740蒐集及接收。所述事件包含該使用者時常停留在特定主題某些內容上、該使用者最近去一海灘城鎮進行衝浪比賽，或是該使用者最近參與槍枝控管的討論等等。所述資訊可經分析，以推論該使用者複數個企圖/興趣。當該等使用者活動與在一使用者上線時對內容的反應有關時，所述資訊可由該短期興趣辨識器750使用，以決定該使用者複數個短期興趣。同樣的，某些資訊可能與該使用者複數個長期興趣有關。例如，來自該使用者對於搜尋與飲食資訊有關之內容的請求數量，可以提供推論該使用者對於與飲食有關的內容有興趣的基礎。在某些情況中，估計長期興趣可由觀察該使用者存取某種形式資訊的頻率與規則進行。例如，如果該使用者重複且規則地存取與特定主題有關的內容，例如股票，所述使用者的重複性與規則性活動可用於推論他/她的複數個長期興趣。該短期興趣辨識器750可以與該長期興趣辨識器760連結工作，以使用複數個觀察短期興趣推論複數個長期興趣。所述估計之短期/長期興趣也傳送至該使用者描述紀錄產生器720，因此可隨該改變的動態去調整該個人化情形。

第八圖為根據本發明教導一具體實施例，用於根據與一大量使用者人口有關的資訊，產生一興趣描述紀錄基線之一示例程序流程圖，該第三方資訊，包含使用者興趣資訊與其感興趣之內容兩者，係於810與820處存取。於803處分析與該等第三方使用者興趣有關的內容，而來自所述內容之該等概念則於840與50處映射至複數個知識資料庫及/或內容分類法。為了建立一興趣描述紀錄基線，代表複數個第三方使用者的該等映射向量被總結以產生代表該人口之一興趣描述紀錄基線。可以存在各種方式，將該等向量總結，以產生關於其基層人口之一平均興趣描述紀錄。

第九圖為根據本發明教導一具體實施例，用於產生/更新一使用者描述紀錄之一示例程序流程圖。先於910處接收使用者資訊。所述資訊包含使用者個人屬性資料、使用者宣稱複數個興趣等等。在920處也接收與複數個使用者活動有關的資訊。在930處存取已知由該使用者感到興趣的複數個內容片段，其接著於950處分析，以擷取由該等內容片段所涵蓋之複數個概念。該等經擷取概念接著於960處映射至該通用興趣空間，並一個接著一個概念與該興趣描述紀錄基線比較，以在970處決定在已知該人口下該使用者的特定興趣程度。此外，根據已知或估計之複數個短期與長期興趣也可以辨識每一使用者的興趣程度，其分別在940與950處根據使用者活動或已知為使用者有興趣的內容所估計。接著在980處可以根據關於該通用興趣空間中的每一概念，產生一個人化使用者描述紀錄。

第十圖描繪根據本發明教導一具體實施例，該內容排序單元210之一示例系統圖。該內容排序單元210採用各種輸入並產生向一使用者推薦之個人化內容。對該內容排序單元210的輸入包含來自一使用者所介接之該等應用程式130的資訊、複數個使用者描述紀錄160、在該時候繞著該使用者的上下文資訊、來自該內容池135的內容、由該廣告***單元200所選擇的廣告，及來自該未知興趣勘探器215的選擇性探測內容。該內容排序單元210包括一候選內容取得器1010與一多相內容排序單元1020。根據來自該等應用程式130之使用者資訊與該相關使用者數據料，該候選內容取得器1010決定從該內容池135所欲取得之該等內容片段。所述候選內容可以一種與該使用者複數個興趣一致的方式，或以個別方式決定。一般而言，存在大量的候選內容集合，而其需要進一步決定此集合中哪些內容片段係在該上下文資訊下最為適當。該多相內容排序單元1020採用來自該候選內容取得器1010、該廣告及該選擇性探測內容之該候選內容，作為進行推薦之一內容池，並接著執行多階段排序，例如以相關性為基礎的排序、以效能為基礎的排序等等，及針對繞著此推薦程序之上下文的複數個因子排序，並選擇該內容一子集合以作為向該使用者推薦之該個人化內容。

第十一圖為根據本發明教導一具體實施例，該內容排序單元之一示例程序流程圖。首先於1110處接收使用者相關資訊與使用者描述紀錄。根據該接收資訊，於1120處決定該使用者複數個興趣，該等使用者興趣接著可以用於在1150處從該內容池135取得候選內容。該等使用者興趣也可以用於分別在1140及1130處取得廣告及/或探測內容。所述取得內容於1160處進一步排序，以為該使用者選擇最適當的子集合。如以上討論，該選擇以一多相排序程序進行，該等相之每一相都指向某些排序條件或其組合，以產出不但對該等興趣而言與該使用者最為相關，而且是可能由該使用者感到興趣的高品質內容之一內容子集合。該選擇內容子集合也可以進一步在1170處根據例如上下文資訊過濾。例如，即使一使用者一般而言係對於政治與藝術的內容感到有興趣，如果該使用者目前在義大利米蘭時，該使用者便可能正在度假。在此情況中，與其選擇與政治有關的內容，選擇跟米蘭裡藝術博物館有關的內容可能更為相關。在此情況中，該多相內容排序單元1020可以根據此上下文資訊過濾掉與政治有關的內容。這為該使用者產出一最後的個人內容集合。在1180處，根據與該使用者周圍關聯之該上下文資訊(例如，所使用的裝置、網路頻寬等等)，該內容排序單元於1180處根據該上下文資訊包裹該經選擇的個人化內容，並接著在1190處傳輸該個人化內容至該使用者。

該系統10各種態樣的更多詳細揭示，特別是該個人化內容推薦模組100，係涵蓋於不同美國專利申請案及專利合作條約(PCT)申請案中，這些申請案的標題為「Method and System For User Profiling Via Mapping Third Party Interests To A Universal Interest Space」、「Method and System for Multi-Phase Ranking For Content Personalization」、「Method and System for Measuring User Engagement Using Click/Skip In Content Stream」、「Method and System for Dynamic Discovery And Adaptive Crawling of Content From the Internet」、「Method and System For Dynamic Discovery of Interesting URLs From Social Media Data Stream」、「Method and System for Discovery of User Unknown Interests」、「Method and System for Efficient Matching of User Profiles with Audience Segments」、Method and System For Mapping Short Term Ranking Optimization Objective to Long Term Engagement」、「Social Media Based Content Selection System」、「Method and System For Measuring User Engagement From Stream Depth」、「Method and System For Measuring User Engagement Using Scroll Dwell Time」、「Almost Online Large Scale Collaborative Based Recommendation System」與「Efficient and Fault-Tolerant Distributed Algorithm for Learning Latent Factor Models through Matrix Factorization」。本發明教導特別指向一種與線上內容多相排序有關的方法與系統，以向一使用者進行個人化呈現。

傳統提供個人化內容的方法單獨聚焦於像是點擊率(CTR)的使用者互動，作為決定一使用者是否喜歡或不喜歡所檢視內容的決定因子，並根據該等使用者歷史行為為該使用者產生內容。該等系統無法無視於該使用者的複數個檢視習慣，並時常無法為該使用者複數個興趣考量複數個其他來源。該等傳統系統也無法針對於時效性、一般性使用者興趣等等考量該內容的品質。據此，需要一種系統與方法，其具現一種更全面的取得與排序引擎，能夠根據複數個使用者描述紀錄進行有效率的比對，之後進行複雜的排序及混合功能，及在「加權併和(WAND)」比對上的內容移動。

本發明揭示內容與一多相取得與排序引擎有關，能夠進行有效率的比對，接著進行複雜的排序及混合功能，例如，梯度推進決策樹(GBDT)與WAND基礎上的內容特徵比對。

在該個人化內容系統之一具體實施例中，一多相取得與排序引擎能夠進行有效率的比對，接著進行複雜的排序及混合功能，其利用迦瑪卜瓦松(GMP)及/或GBDT與WAND基礎上的內容特徵比對。在一具體實施例中，為了為一使用者找到個人化內容，可以在一多相排序系統一第一相期間，使用一加權併和(WAND)操作器，以產生複數個內容推薦。所述WAND系統可以使用一或多相以將個人化內容映射至一使用者。在一具體實施例中，可以使用一三相排序系統，其中利用一數據資料特徵向量與一文件特徵向量的內積，計算一使用者描述紀錄與一內容池一文件之間的比對分數。在該排序第一階段期間，該文件池中的所有內容都被評估，並使用以內容為基礎的比對。所述以內容為基礎的比對或以相關性為基礎的比對係根據內容文件比對，其以句法或語意相似性為基礎。此外及/或替代的，可以使用一預定使用者內容池。該預定內容池可能已經根據與該特定使用者相關的其他條件預先過濾。在該一般性內容池上的排序將回傳非千即百的候選內容，以進行第二相排序。

在一具體實施例中，該第二相排序係用以決定將從該數百或數千的候選內容中，選擇哪些內容並向複數個終端使用者推薦。該第二相排序使用以效能為基礎的比對或品質比對，以根據預測點擊能力或品質建立複數個文件關聯。因為該原始內容池的尺寸，此複雜計算形式係具有高度計算性，並因此針對該較小的第一相排序結果執行。在一具體實施例中，使用一進化點擊模型作為該第二相排序，但也可以使用其他的品質度量，像是與其他內容的相似度、複數個其他使用者的平均停留時間等等。在該第二相處，因為該候選數量被顯著裁減，因此可以使用更具計算強度或更複雜的模型，像是利用GMP或GBDT的複雜的排序及混合功能。在所述排序中的某些排序目標/度量牽涉到預測的CTR、預測的使用者停留時間及文件多樣性，其可在該相中計算。在一具體實施例中，該系統也可以使用一進化點擊模式，其具備來自快速回饋資料的多重CTR加總能力。此外，在一具體實施例中，對於該第二相排序而言，可以使用一組合模型以將所有排序根據合併在一起，以建立一最終推薦內容清單。在一具體實施例中，對該第二相排序的結果進行一第三相排序。該第三相可為一種根據相似度或時間，以規則為基礎的過濾方式，以去除重複文件，其也可以運用以其他規則為基礎的過濾方式，像是不包含成人內容或來自一特定來源的內容。在完成該第三向之後，可以對該使用者傳送一個人化內容串流。

本發明揭示內容與一個人化內容推薦的新平台有關。該等個人化推薦考慮一連串使用者條件，包含但不限制於一使用者閱讀興趣、一使用者搜尋興趣、一使用者本身辨識的條件、一使用者社交媒體互動、一使用者電子郵件及一使用者與複數個其他第三方應用程式的互動。

對於一好的推薦系統而言，重要的是找到使用者相關及感興趣的複數個內容，以保持該使用者契合。因此做為一第一步驟，重要的是辨識代表一使用者興趣的複數個良好指示或訊號。可以從許多來源推衍該等訊號。存在「自我宣稱」的興趣，其為一使用者利用該系統上一使用者描述紀錄或其他帳號的方式具體指明於一數據資料中。例如，當建立一電子郵件帳號或訂閱其他像是Yahoo！Finance的線上內容時，可以提示該使用者利用多重關鍵字或主題的輸入方式，指示某些關於該等使用者本身的個人資訊。

當一使用者拜訪像是Yahoo！Sports的入口網站頁面，並對該內容撰寫評論時，也可以建立複數個良好的指示。此種正面的使用者行為同樣指出對該主題的強烈興趣。要注意一使用者的喜好或興趣可能隨時間變化，並可被檢視為短期或長期興趣。據此，一使用者描述紀錄需要被不斷更新、精鍊與發展，以確保在需要長時間向一使用者傳送個人化內容時，該等短期興趣不會遮蔽該等長期興趣，也就是說本質上一使用者的閱讀興趣應該為長期興趣，亦即對於財經有興趣的使用者將會想要時常拜訪財經頁面。一良好的第三來源指示為一使用者在一搜尋中的查詢。所述查詢常常為短期興趣的良好指示，但隨時間可能轉變為一長期興趣，特別是當該使用者重複該搜尋查詢許多次時。使用者可能使用搜尋取代書籤內容，因此該等使用者可能習慣性輸入該相同搜尋項目，像是天氣或體育隊伍名稱，這些「書籤」形式搜尋則為一使用者長期興趣的良好指示。

一使用者複數個興趣的另一項良好指示為該使用者於社交網站上的複數個互動或評論或與一使用者朋友的分享，像是在推特與臉書上。這些為該使用者潛在長期興趣的良好訊號。具體來說，如果一使用者跟隨推特上某些類型或喜愛臉書上一特定頁面，這些通常都是該使用者複數個長期興趣的良好指示。其他用於將一良好使用者描述紀錄模型化的資訊來源也可以包含像是使用者個人屬性資料的事項，這可由該系統決定，像是該使用者位置、該使用者何時登錄該系統，或是可由該使用者直接供應或來自該使用者動作所供應的資訊，像是根據該使用者複數個動作可能可以簡單決定該使用者的年齡與性別。所有關於該使用者的資訊都需要被限定並儲存於該使用者描述紀錄中。而在為該使用者從其檢視習慣與社交媒體活動針對主題所推論資訊的情況中，這些動作可以直接映射至一主題分類法或索引，更佳的限縮該使用者的複數個興趣。該索引可為像是維基百科的一廣泛使用分類系統，其具有數十萬的類型，也可以是一種經建立已經複數個興趣分類的分類法，其可具有數百或數千的主題或次主題。在某些具體實施例中，維基百科形式的索引與類型分類法兩者都可以用於將一使用者的複數個主題興趣進行分類。

複數個使用者的活動資料對於使用者區隔模型而言是另一種有價值的資料來源。首先，可以使用該新的活動資料計算新用於行為目標模型的複數個新特徵。對於以規則為基礎的區隔而言，可以使用該新的活動資料建構複數個新的條件，作為使用者區隔的定義。例如，複數個廣告商可以利用該新的系統，把目標訂為最近閱讀一給定類型複數個文章的那些使用者。

在一具體實施例中，來自複數個不同來源的複數個使用者指示或訊號可以分別儲存，而非將其彙整於一數據資料中。例如，一使用者的短期興趣可能與長期興趣非常不同。如果將兩者結合，在將兩者合併為一興趣向量之中時，可能降低彼此的效果。

該等所有使用者訊號都為一原始文字形式。從該等原始文字將擷取複數個關鍵字。可以從該等擷取關鍵字推論類型或主題，並接著映射至一分類法與維基百科索引。此外，在一具體實施例中，該系統可以使用一廣告分類法以將該使用者放置於由行為目標模型所輸出的類型之中。

一旦利用複數個關鍵字辨識一使用者的複數個興趣，在該使用者描述紀錄中的相關性也需要被模型化，以代表該使用者的複數個興趣。遵循向量空間模型(vector space modeling,VSM)，一使用者的興趣將被轉換為該相關空間中的一多維度向量。在一具體實施例中，該空間可為一關鍵字、一分類法中的類型識別符、一主題識別符等等，或其組合。一旦辨識該等關鍵用詞，該使用者的複數個推論特徵與社交媒體數據資料便可轉換為關鍵字或類型識別符或主題識別符的集合，其也將被映射至一索引與分類法，並接著轉換至一向量之中。

在該向量空間模型中，該向量將該使用者對該等文件該內容(及一般而言對於任何物件)的複數個興趣表現為複數個識別符的向量，例如像是以該維基百科索引及該主題分類法為基礎的複數個索引項目。來自該使用者檢視的資訊與來自社交媒體的複數個主題，一旦被索引化後，便可以以向量表現為：d _j=(W_1,j,W_2,j,....W_t,j)and q=(W_1,q,W_2,q,....W_t,q)。

該向量每一維度都對應一分別項目。如果在該文件中出現一項目，該項目於該向量中的數值便為非零值。在此方法中，一使用者的數據資料便根據該使用者所檢視及顯示具有興趣的內容，而成長為一多維度向量之中。

一旦計算一使用者向量空間，便隨著監控該使用者複數個行為而不斷更新。為了將該使用者描述紀錄中所辨識之該使用者興趣映射至相關內容，該潛在的內容本身必須以符記化、名稱實體辨識、機器學習分類或潛藏主題推論的方式映射至該相同的向量空間。此外，在一具體實施例中，不同的特徵空間可被建構於複數個不同頻道中，而最後結果可為對該不同向量空間應用複數個加權之複數個不同頻道的組合。在一具體實施例中，可以使用一種以餘弦相似性為基礎的關聯模型，以評估每一文件對每一使用者描述紀錄的關聯性。

在一具體實施例中，如同該使用者描述紀錄一般，像是文件、統一資源***(URL)、部落格、媒體等等的內容，也需要被符記化、分類、推論。同樣的，可以根據詮釋文字或詮釋資料將圖片與視訊索引化，或利用該視訊或圖片內容本身。為了完成此動作，將該內容傳送至該內容處理管線，該內容處理管線則從一文件擷取該等所有關鍵用詞。一旦已經辨識該等關鍵用詞，便可以使用該概念/內容分析器145及一內容分類法165及像是維基百科的線上索引與概念存檔115以在與該使用者描述紀錄的相似空間中建立一向量。為了每一考量的內容片段建立一向量，並建立一內容池135。該內容池135係被不斷更新，並以來自一內容池產生/更新單元140的新內容饋入，以確保新鮮的高品質內容。此外，除了為每一內容片段建立一內容向量以外，該內容也需要對其品質或排序進行評估。

一文件排序或品質係與該文件本身關聯之許多因子有關。因為該內容串流的巨大尺寸，因此需要一種如何將複數個內容排序，及只在頁面上顯示受限的最上面n個內容的方法。在本發明揭示一具體實施例中，使用一多相排序程序。此排序可根據該文件本身的內容、關聯性與品質執行。在一具體實施例中，預期一系統每天可以處理大約200,000至750,000個內容片段，較佳的是500,000個。這在形成的工作內容集合中，大約有5,000,000至10,000,000個內容片段，而較佳的是在該內容池中具有7,000,000個項目。

一文件品質的排序並不與該內容本身有關，但是與複數個其他使用者已經如何使用、檢視或接收該文件的方法有關。一文件品質的度量可為複數個其他使用者對由一推薦系統所輸出超鏈結的點擊率(CTR)。CTR為一種複數個其他使用者與該內容契合的簡單度量。如果使用使用者停留時間時，使用者停留時間相較於CTR而言為一種較佳的度量。藉由蒐集來自廣泛各種使用者於一特定內容片段上的使用者停留時間，可以決定一良好的內容品質指標。

同樣的，在像是臉書與推特之複數個社交網路上的「喜愛/評論/分享」動作，也為使用者與特定內容契合度的良好指示。然而，缺乏關於特定內容的這些訊號並不意味著即使該等使用者採取這些動作時並不與該等內容契合。所以，具備這些訊號的事件為該內容品質的正向指示，但不具該等訊號的事件可能並非指示對該內容進行負面處理。另一種內容品質的指示為該內容的新鮮度或時效性。這在對於新聞推薦方面特別可靠。趨勢，雖然與時效性類似，但指示一種不同的品質標準。例如，雖然兩文章可能具有相同的時間符記，但關於一知名電影明星的文章可能比關於一一般人員的文章更具流行性。這種一文件在時間上變的流行的趨勢或活躍度標記可為一品質指示。社交網站訊號也為所述趨勢與活躍度的良好指示。

主題多樣性也為文章品質的良好指示。當該系統努力提供個人化內容時，該使用者對於只提供少量主題的內容或重複性的內容並不感到有興趣。如果所有內容都類似或甚至重複，對終端使用者而言絕對是無聊的。使用者可能想要對單一主題但來自各種觀點或意見的內容。因此，該內容品質的一良好指示為該內容來自複數個不同來源的多樣性，以提供使用者多種不同興趣。

在一具體實施例中，這些品質指示的所有或某些都可以映射至一向量，並用於為該內容池中每一內容片段形成該內容索引。據此，對於每一內容片段而言，其可以與一內容向量及一品質向量關聯，並在該排序程序中使用。

在一具體實施例中，為該內容池中所有內容計算複數個內容向量，及為所有使用者描述紀錄計算複數個使用者向量。一旦獲得此資訊之後，該個人化模組100必須產生一合理的內容量，以傳遞給該使用者105。在一具體實施例中，該內容排序單元210可為一多相排序單元。使用多相排序的好處如下，在該第一相時，該龐大的內容池(大約7,000,000個內容片段)係被減縮為潛在相關資料的可管理大小內容池。藉由聚焦在該使用者描述紀錄向量與該內容向量的內積，該系統能夠快速且容易處理大量資料。

第一相排序可為一種以反向索引為基礎的取得順序。根據該第一相排序，可根據該使用者描述紀錄與一文件特徵向量，由一查詢特徵向量的內積，計算一數據資料與該內容池中一文件之間的比對分數。在一具體實施例中，估計該文件池中的所有內容。該第一相排序將回傳數百個內容候選以進行第二相處理。在一具體實施例中，並非估計該內容池中的所有內容，可以根據複數個其他特徵與複數個使用者描述紀錄模型，為該特定使用者建立一個人化內容池。在一具體實施例中，第一相排序除了包含以內容為基礎的比對元件以外，也可以包含以效能為基礎的比對元件。該第一相排序可以利用該完整內容池平行執行，並分散於大量的處理器，以提高處理速度。該第一相以內容為基礎的比對使用具備文件長度正規化與使用者特徵長度正規化的內積資訊。該內積或純量乘積採用兩相等長度的正規化向量，並回傳一單一數字。此操作可以代數或幾何方式定義。代數定義上，其為該兩數字串對應項目的乘積總和。幾何定義上，其為該兩向量的乘積大小及該兩向量之間的角度餘弦值。

在一具體實施例中，該第一相排序可為一加權邏輯併和(AND)，其使用相符機率取代完全相符，也就是其本身為一雜湊比對。在一具體實施例中，可以計算三種內積分數：

1)對於宣稱之使用者複數個特徵而言Declared_pos_dotproduct=User_declared_pos*A/(doc_adj*scale_pos_declared)

2)對於該使用者的複數個社交媒體興趣而言FB_score_dotproduct=User_FB*A/(doc_adj*scale_FB)

3)對於從使用者複數個檢視習慣所推論的使用者興趣而言Inferred_score_dotproduct=User_inferred*A/(doc_adj*scale_inferred)

其中，User_declared_pos=使用者複數個宣稱興趣；A=文件內容向量；doc_ad=該目前文件中(分類法/維基百科)的特徵數量；scale_pos_declared=數據資料規模調整參數；User_FB=來自社交媒體複數個興趣的數據資料向量；Scale_FB=數據資料規模調整參數；User_inferred=來自複數個推論興趣的數據資料向量。

在另一具體實施例中，該第一相排序牽涉到該平均使用者描述紀錄與該文件之間的內積，而非為每一文件計算三個個別內積。可利用對於該declared_pos_interests、該social_media_score_interests與該inferred_score_interests的計數，將其全部加權並接著對於該內容向量計算的方式，計算該平均數據資料分數。一旦計算之後，該simple_profiles_score=ave_profile * A。

該第一相排序與該第二相排序之間的差異在於該第一相排序聚焦於該兩向量的內積，並盡可能運用該內積操作的簡易性，而該第二相排序根據該內容的該等品質參數計算更具有計算強度的分數，並可以使用機器學習或GBDT程序。

該第一相排序與該第二相排序可根據可利用的計算能力平行或串列進行。在一具體實施例中，在前進至該第二相排序之前，利用平行處理計算該第一相排序。該第二相排序也可以平行執行，並前進至該第三相排序。在該第二相排序完成之後，進行該第三相排序，其無法平行進行，因為必須對所有剩餘而提供作為個人化內容的所有文件應用該第三相排序。

在該第一相排序之後，使用該第二相排序以最後決定從數百個候選內容中將選擇哪些內容，並推薦給複數個終端使用者。在此排序相期間，將計算以迦瑪卜瓦松(GMP)分佈為基礎的效能分數、機器學習或GBDT。因為在該內容池中候選內容的數量係被明顯裁減，該系統可以運用像是GMP、貝氏分佈、GBDT與機器學習等更昂貴的計算與更複雜的模型。某些像是預測CTR、預測使用者停留時間、多樣性的排序/品質度量可在此相計算。在一具體實施例中，可以使用來自快速回饋資料具備複數個CTR匯總的進化點擊模型。此外，對於該第二相排序而言，該系統需要一組合模型，以將所有排序根據合併一起，並建立一內容池，以送至進行該第三相排序。

第三相排序可為一預定編輯規則集合的應用，以從該最終內容串流移除重複內容，或移除受限制的內容。在使用該第三相排序之後，將該個人化內容傳送至該終端使用者105。

第十二圖描繪根據本發明揭示一具體實施例，可於該內容排序單元210中運用之該排序程序概觀。該系統1200包括引導至排序模組1255的三個不同路徑，一內容路徑、一使用者描述紀錄路徑與一內容品質路徑。複數個使用者事件1225饋入至該事件管線1215，並產生一效能索引1220。使用者事件串流1225與使用者個人屬性資料檔案1210饋入至該使用者分析處理1230，並產生一使用者索引1235。內容串流1240饋入至內容處理管線1245，並產生一內容索引1250。

該內容串流1240可以包含複數個文章、文字、網站、部落格、音訊、視訊或任何數位線上內容形式。此饋入至該內容處理管線1245，於該內容處理管線1245處擷取該內容成為文字，並映射至一分類法與索引維基百科，以建立一多維度內容向量。除了作為該內容處理的部分以外，與內容有關之複數個其他使用者事件也被饋入至該事件管線1215之中，計算該文件品質，並傳送至該效能索引1225。在該模組1255的排序處理期間，該等內容品質與該內容主題則用於排序一特定內容中的使用者興趣。該使用者事件串流1225接收該等所有使用者與網站、文字、音訊、視訊、社交網路等等的互動。這些事件則傳送至該使用者分析處理1230與該事件管線1215。對於每一特定使用者而言，該使用者的複數個內容偏好被映射至一主題分類法或維基百科索引，以建立一多維度使用者描述紀錄向量。對於一般性的複數個使用者事件而言，被傳送至該事件管線，於該事件管線處使用該等使用者事件以建立該等文件的品質。

該內容索引1250、使用者索引1235與效能索引1220都饋入至該排序模組1255之中。該排序模組1255可以在該內容索引中執行每一文件的三項排序，將具有最高評比的文件傳送至該使用者，以將該頁面1260格式化。要瞭解該實際內容可被快取並傳送至該使用者做為一格式化頁面1260的部分，或可以傳送對一特定文件的鏈結。

在一具體實施例中，該三項排序牽涉到一第一相，於該第一相中使用該正規化使用者描述紀錄向量與該正規化內容向量的內積，以減少來自該內容索引的可能內容片段數量。該減少係以為了每一文件對於使用者描述紀錄，來自該內積計算之結果的一門檻分數為基礎。該第二相排序使用該經減少的文件集合，並應用一更具計算強度的條件。可以使用機器學習、貝氏、GBDT或GMP分佈。該等剩餘文件的效能索引1220可以設定為一門檻，其中根據CTR、停留時間、多樣性等等選擇只有該等最高品質的文件。做為一第三相排序的部分，可以對該文件的剩餘集合應用以規則為基礎的過濾器最終集合，接著可被輸出做為一格式化頁面1260。要瞭解到當記錄到新的內容與新的使用者事件，並加入至該內容索引1250與使用者索引1235與效能索引1220時，可以連續的、週期性的執行此程序。例如，一內容片段最初可能具有低效能索引，但如果該內容開始成為趨勢，該相同的內容片段可能僅在15分鐘之後即具有一較高的效能索引。在所述實例中，該內容最初可能不被包含於該格式化頁面中，但當重新執行該排序時，其可能跨過該門檻，並變成一高優先性的文件。

第十三a圖與第十三b圖分別描繪用於建立該使用者描述紀錄索引1235與該內容索引1250之資訊。如第十三a圖所見，每一使用者都被指定一使用者識別符1310，當該使用者首次登錄至該系統時該使用者識別符1310辨識該使用者並追蹤該數據資料。該使用者識別符1310可具有與其關聯之一推論特徵1315及一社交網路數據資料1320的集合。可從該使用者所檢視獲消費的內容形式獲得複數個推論特徵。可以根據一文件或與一文件關聯之詮釋資料中的文字，蒐集複數個推論特徵。該社交網路數據資料1320可以包含該使用者於複數個社交網站上已經顯示具有興趣的資訊。這可以包含喜愛、分享、追蹤等等，及該使用者已經顯示具有興趣之主題。該推論特徵集合1315與該社交網路數據資料1320兩者都被映射至一分類法，例如根據其題材及像是維基百科的類型索引。這些映射結果將根據該分類法與該維基百科映射產生兩不同的多維度向量。此外，可能存在使用者個人屬性資料，像是位置、性別、年紀、使用時間，這將被加入至該使用者描述紀錄索引1235而非該等向量。同樣的由該使用者本身所產生之使用者宣稱的複數個特徵1340，像是該使用者何時建立帳號，也可以加入至該使用者描述紀錄索引1235。這四個資訊片段都可被用於建構一特定使用者之該使用者描述紀錄，並與該使用者識別符1310建立關聯。

第十三b圖中顯示用於內容索引1250的輸入。該內容串流1350係饋入至處理管線1245之中，其中在該概念/內容分析器145處為主題分析該內容，並建立一多維度向量。該內容1350也可在1365處為效能進行分析。接著，該效能與該文件關聯之內容兩者都儲存於該內容索引1250中。

第十四描繪本發明一具體實施例中一三相排序程序。該內容索引1250與該使用者描述紀錄索引1235提供複數個多維度向量至該第一相排序1410。該第一相排序1410可以於平行或序列處理中執行。在第一相排序期間，對於代表每一文件之該內容向量，計算該數據資料向量中每一元素的內積。對於該內容索引1250中儲存的大量內容而言，平行處理大大減少計算時間。該內容與使用者描述紀錄向量的內積將與一門檻比較，而只回傳該第一相排序1420結果中一文件候選集合。該1420中的文件則為儲存於該效能索引1220中的每一文件，對於該等內容效能向量進行處理。此程序可以包含機器學習與其他處理。該第二相排序1430也可平行進行以加速處理。雖然因為與文件相關聯之該等特性使得該第二相排序係具有計算強度的特性，但該縮減的內容集合使所述處理可以完成。據此，可以執行GMP、貝氏、GBDT或機器學習。該第二相排序的輸出被傳送至該第三相排序1450，其中以序列方式對該內容應用一過濾器。該第三相的過濾預期從該第二相排序集合移除禁止或重複文件。一旦完成該第三相過濾，對該使用者呈現該個人化內容1440。該第一相與第二相的兩項加權併和(AND)處理允許在該內容大型語料庫的向量空間中進行快速評估。這種使用第一相中的文件內容，並接著使用第二相中更為計算昂貴的貝氏、GBDT或機器學習模型，則用於以一種更具效率且更及時的方式將該等文件重新排序。

第十五圖揭示本發明揭示內容一具體實施例。一內容管線1510包含正規化標註器1512與資料庫1514。該正規化標註器1512可用於計算每一文件或每一內容片段的長度正規化。該資料庫1514可以用於儲存內容。一內容特徵管線1540包含一事件模型模組1542與一彙整器1544。該事件模型模組1542可為一GMP模型模組，其根據像是CTR、停留時間等等的使用者事件，計算與該內容有關之輸入的GMP分數。該彙整器1544可用於將內容群聚成為複數個群集，像是趨勢內容或及時內容或是對18-25歲男性而言最感興趣的內容。這些群集文件可傳送至該一內容儲存器1460，其可為一記憶快取，能夠以群集方式儲存該等最高評比的文章。

所有傳送至該內容管線1510的內容都被置於並儲存於一內容儲存器1520中。該內容將從該內容儲存器1520傳送至一索引建立器1530。該索引建立器1530包含文件輪詢器1532、排序特徵儲存器1534、資料轉換器1536與一快速索引搜尋引擎1538。該文件輪詢器1532為來自該內容儲存器1520之一資料卸載，並用於索引建立。該排序特徵儲存器1534接收來自該內容特徵管線1540的輸入，並為每一關聯內容片段儲存該效能指示。該資料轉換器1536利用長度正規化與特徵加權的方式，將複數個內容特徵轉換成該快速索引搜尋引擎1538能辨識的格式。該快速索引搜尋引擎1538建立一索引並將其儲存於模組1570的快速索引搜尋(RiSe)索引1572中。一旦所有索引都儲存於RiSe索引1572中，便如以上敘述，根據該等使用者描述紀錄向量與該內容向量的內積，計算該第一相排序1574。一旦完成該第一相排序1574，這些結果將傳送至一評分伺服器1550中的第二相排序1552。評分伺服器1550執行該第二相排序1552與第三相排序1554。在第三相排序之後，將一個人化內容串流傳送至該終端使用者。

第十六圖描繪本系統一具體實施例之另一表現，用以排序個人化內容。相同的參考數字指示相同的組件與功能。使用者識別符1310提供關於使用者105的資訊，並在1610處從複數個社交媒體習慣辨別使用者的複數個興趣。在1615處，根據檢視習慣獲得該使用者的複數個推論興趣。該等社交媒體興趣1610與該等推論興趣1615於1620處映射至內容分類法165與知識資料庫115。在1340處，該等使用者宣稱屬性則與該個人屬性資料結合，並全部用於建立該使用者索引1235。

在該內容側平行進行的是1640處從該內容擷取該等關鍵用詞，並在1645處映射至該內容分類法165與知識資料庫115。於1650處計算該文件的排序品質，並在1250處與該映射內容分類法165及知識資料庫115結合，以建立該內容索引。於1600處將來自1235的該使用者描述紀錄與來自1250的該內容索引輸入至該第一相排序之中。在第一相排序完成並產生一縮減的內容集合之後，於1665處根據內容品質執行該第二相排序。在1670處，將該第二相排序的結果傳送至該第三相排序，以將重複項目去除並應用過濾規則，於1675處將該多相排序文件串流格式化，以呈現給該使用者105。

為了實作本發明教導，可使用多種電腦硬體平台作為在此敘述之一或多個元件的硬體平台。所述電腦之該等硬體元件、操作系統與程式語言係本質上為一般的，並假設該領域技術人員對其適切熟悉，以調整這些技術以實作在此敘述之基本處理。一電腦具備複數個使用者介面元件，可用於實作一個人電腦(PC)或其他工作站或終端裝置的形式，當然在適當編程下一電腦也可做為一伺服器。相信該領域技術人員對於所述電腦設備的結構、程式與一般操作係為熟悉，而因此該圖式應該具有自我詮釋能力。

第十七圖描繪一一般電腦結構，於該電腦結構上可實作本發明教導，該電腦結構具有一功能區塊圖式，其描述包含複數個使用者介面元件之一電腦硬體平台。該電腦可為一般目的電腦或特殊目的電腦。此電腦1700可用於實作如此敘述之個人化內容結構多相排序的任何組件。在本發明中該系統的多種不同組件都可以透過硬體、軟體程式、韌體或其組合實作於像是該電腦1700之一或多個電腦上。雖然為了方便只有顯示一所述電腦，但與該目標度量辨識有關之該等電腦功能可以利用分散形式實作於複數個類似平台上，以分散處理負荷。

該電腦1700例如包含複數個電腦輸出微片埠口(COM)1750，其連接至一網路，以促成資料通訊。該電腦1700也包含一中央處理單元(CPU)1720，其具有一或多個處理器形式，用以執行複數個程式指令。該示例電腦平台包含一內部通訊匯流排1710、不同形式的程式儲存器與資料儲存器，例如磁碟1770、唯讀記憶體(ROM)1730或隨機存取記憶體(RAM)1740，以供各種欲被處理及/或該電腦通訊之資料檔案，及可能由該CPU所執行的程式指令所用。該電腦1700也包含一輸入/輸出組件1760，支援該電腦與該電腦中複數個其他組件之間的輸入/輸出流，像是與複數個使用者介面元件1780之間。該電腦1700也可以透過複數個網路通訊接收程式與資料。

因此，如以上描繪該個人化內容之多相排序方法的各種態樣可具現於程式之中。該技術的程式態樣可被視為「產品」或「生產品」，其一般而言具有可執行編碼及/或關聯資料的形式，並儲存或具現於一機器可讀媒介形式中。有形的非暫態「儲存器」形式媒體包含所有任意的記憶體或其他儲存器，以供該等電腦、處理器等等或其關聯模組所用，像是各種半導體記憶體、磁帶裝置、磁碟裝置與其他類似裝置，能在任何時間為該軟體程式提供儲存能力。

該軟體的所有或部分可隨時透過網路通訊，像是透過網際網路或各種其他電信網路。所述通訊，例如可以將該軟體從一電腦或處理器載入至另一電腦或處理器。因此，另一種可以承載該等軟體元件的媒體形式包含光學、電子與電磁波，像是使用在複數個局部裝置的跨實體介面，透過有線與光學地線網路與透過各種空氣鏈結。攜帶所述波載之該等實體元件，像是有線或無線鏈結、光學鏈結或其他鏈結，也可以被視為承載該軟體的媒體。當在此使用者，除非限定為有形的「儲存器」媒體，像是電腦或機器「可讀媒介」的用詞係指任何參與提供複數個指令至一處理器進行執行的媒介。

因此，一機器可讀媒介可採用許多形式，包含一有形儲存媒介、一載波媒介或實體傳輸媒介，但不限制於此。非揮發性儲存媒體例如包含光碟或磁碟，像是在任何電腦或類似裝置中的任何儲存裝置，其可用於實作該系統或該系統任何組件，如該等圖式中所示。揮發性儲存媒體包含動態記憶體，像是所述電腦平台中之一主要記憶體。有形傳輸媒體包含同軸纜線、銅線或光纖，包含在一電腦系統中形成一匯流排的接線。載波傳輸媒體可以採用電子或電磁訊號或聲波或光波的形式，像是在無線射頻(RF)與紅外線(IR)資料通訊期間所產生的載波。因此電腦可讀媒體的一般形式例如包含：軟碟、彈性碟、硬碟、磁帶、任何其他磁性媒介、光碟、多功能數位碟片、或多功能數位碟片唯讀記憶體、任何其他光學媒介、穿孔卡片紙帶、任何其他具有孔洞圖形的實體儲存媒介、RAM、可編程唯讀記憶體(PROM)、可抹除可編程唯讀記憶體(EPROM)、快閃可抹除可編程唯讀記憶體、任何其他記憶棒或卡匣、一載波傳輸資料或指令、傳輸所述載波之纜線或鏈結或任何其他媒介，而一電腦可從此媒介讀取程式編碼及/或資料。許多這些電腦可讀媒體形式都與將一或多個指令的一或多個序列攜帶至一處理器進行執行有關。

該領域技術人員將可辨識本發明教導係可接納各種修改及/或強化。例如，雖然以上敘述各種組件的實作可具現於硬體裝置中，但也可只實作為軟體作為解決方案。此外，如在此揭示之該系統該等組件可實作為韌體、韌體/軟體組合、韌體/硬體組合或硬體/韌體/軟體組合。

雖然已經於以上敘述被視為是最佳模式及/或其他實例，要瞭解在此可以進行各種修正，且在此揭示之題材可以實作於各種形式與實例之中，而該教導可以應用於許多應用之中，而在此只敘述其某些部分。以下申請專利範圍預期主張落於本發明教導真實觀點之中之任何與所有的應用、修改與變化。

Claims

一種實現於一機器上之方法，該機器至少具有一處理器、一儲存器與連接至一網路的通訊介面以進行內容選擇，該方法包括：獲得代表一使用者之一使用者描述紀錄，該使用者描述紀錄將該使用者複數個興趣特徵化；獲得代表第一集合內容中每一內容片段之一內容描述紀錄及一內容品質指標，將該第一集合內容中每一內容片段的品質特徵化；根據該使用者描述紀錄與該內容描述紀錄，估計該第一集合內容中每一內容片段與該使用者之間的近似度度量，該內容描述記錄與該第一集合內容中每一內容片段有關，其中所述估計該近似度度量包含：產生該第一集合內容中每一內容片段之一第一向量，該第一向量的每一第一數值都指出每一內容片段是否涵蓋與一興趣空間有關的一概念；產生該使用者之一第二向量，該第二向量的每一第二數值指出該使用者的興趣與概念之一估計；基於該第一向量和該第二向量，產生該近似度度量；根據與該第一集合內容中每一內容片段有關的近似度度量，從該第一集合內容中選擇一第二集合內容；根據在該第二集合內容中每一內容片段之該內容品質指標過濾該第二集合內容，以產生一第三集合內容，其中每一該內容品質指標係根據其他使用者與第二集合內容中每一內容片段的契合度獲得；及輸出該第三集合內容。
如申請專利範圍第1項之方法，進一步包括：根據一或多項規則過濾該第三集合內容，以產生一第四集合內容；及輸出該第四集合內容。
如申請專利範圍第1項之方法，其中：該第二集合內容係以一第一模型為基礎而進一步被選擇；及該第三集合內容係以一第二模型為基礎而進一步被產生。
如申請專利範圍第3項之方法，其中：該使用者描述紀錄係由一第三特徵向量所表示，該內容描述紀錄係由一第四特徵向量所表示；及該第一模型係以該第三特徵向量與第四特徵向量的乘積為基礎。
如申請專利範圍第3項之方法，其中該第二模型至少包含以下之一：一統計分佈；一機器學習模型；及一決策樹。
如申請專利範圍第1項之方法，其中該使用者描述紀錄、該內容描述紀錄與該內容品質指標係為動態更新。
如申請專利範圍第1項之方法，其中該使用者描述紀錄係根據至少以下之一所獲得：一或多個宣稱的複數個使用者興趣；與該使用者有關的內容消費；與該使用者有關的複數個線上行為；及與該使用者有關的個人屬性資料。
如申請專利範圍第1項之方法，其中該內容品質指標係根據至少以下之一所獲得：該第一集合內容之每一內容片段的適時性；該第一集合內容之每一內容片段的一活躍性；及該第一集合內容之每一內容片段的多樣性。
一種系統，至少具有一處理器、一儲存器與一通訊平台，以進行內容選擇，該系統包括；一使用者描述紀錄器，配置以獲得代表一使用者之一使用者描述紀錄，將該使用者複數個興趣特徵化；一內容描述紀錄器，配置以獲得代表第一集合內容中每一內容片段之一內容描述紀錄及一內容品質指標，將該第一集合內容中每一內容片段的品質特徵化；一估計器，根據該使用者描述紀錄與該內容描述紀錄，配置以估計該第一集合內容中每一內容片段與該使用者之間的近似度度量，該內容描述紀錄與該第一集合內容中每一內容片段有關，其中該估計器係配置以：產生該第一集合內容中每一內容片段之一第一向量，該第一向量的每一第一數值都指出內容片段是否涵蓋與一興趣空間有關的一概念；產生與該使用者有關之一第二向量，該第二向量的每一第二數值指出該使用者的興趣與概念之一估計；及基於該第一向量和該第二向量，產生該近似度度量；一選擇器，根據與該第一集合內容中每一內容片段有關的近似度度量，配置從該第一集合內容選擇一第二集合內容；一第一過濾器，根據在該第二集合內容中每一內容片段之該內容品質指標配置以過濾該第二集合內容，以產生一第三集合內容，其中每一該內容品質指標係根據其他使用者與該第二集合內容中每一內容片段的契合度獲得；及一輸出組件，配置以輸出該第三集合內容。
如申請專利範圍第9項之系統，進一步包括：一第二過濾器，根據一或多項規則配置以過濾該第三集合內容，以產生一第四集合內容；其中該輸出組件係經進一步配置以輸出該第四集合內容。
如申請專利範圍第9項之系統，其中：該第二集合內容係以一第一模型為基礎而進一步被選擇；及該第三集合內容係以一第二模型為基礎而進一步被產生。
如申請專利範圍第11項之系統，其中該使用者描述紀錄係由一第三特徵向量所表示，該內容描述紀錄係由一第四特徵向量所表示；及該第一模型係以該第三特徵向量與該第四特徵向量的乘積為基礎。
如申請專利範圍第11項之系統，其中該第二模型至少包含以下之一：一統計分佈；一機器學習模型；及一決策樹。
如申請專利範圍第9項之系統，其中該使用者描述紀錄、該內容描述紀錄與該內容品質指標係為動態更新。
如申請專利範圍第9項之系統，其中該使用者描述紀錄係根據至少以下之一所獲得：一或多個宣稱的複數個使用者興趣；與該使用者有關的內容消費；與該使用者有關的複數個線上行為；及與該使用者有關的個人屬性資料。
如申請專利範圍第9項之系統，其中該內容品質指標係根據至少以下之一所獲得：該第一集合內容中每一內容片段的適時性；該第一集合內容中每一內容片段的一活躍性；及該第一集合內容中每一內容片段的多樣性。
一種非暫態機器可讀媒介，具有記錄資訊以進行內容選擇，其中當由該機器讀取該資訊時，使該機器執行以下動作：獲得代表一使用者之一使用者描述紀錄，該使用者描述紀錄將該使用者複數個興趣特徵化；獲得代表一第一集合內容中每一內容片段之一內容描述紀錄及一內容品質指標，將該第一集合內容中每一內容片段的品質特徵化；根據該使用者描述紀錄與該內容描述紀錄，估計該第一集合內容中每一內容片段與該使用者之間的近似度度量，該內容描述紀錄與該第一集合內容中每一內容片段有關，其中所述估計該近似度度量包含：產生該第一集合內容中每一內容片段之一第一向量，該第一向量的每一第一數值都指出每一內容片段是否涵蓋與一興趣空間有關的每一概念；產生與該使用者有關之一第二向量，該第二向量的每一第二數值指出該使用者的興趣與概念之一估計；及基於該第一向量和該第二向量，產生該近似度度量；根據與該第一集合內容中每一內容片段的近似度度量，從該第一集合內容中選擇一第二集合內容；根據在該第二集合內容中每一內容片段之該內容品質指標過濾該第二集合內容，以產生一第三集合內容，其中每一該內容品質指標係根據其他使用者與該第二集合內容中每一內容片段的契合度獲得；及輸出該第三集合內容。
如申請專利範圍第17項之媒介，其中當由該機器讀取該資訊時，使該機器進一步執行以下動作：根據一或多項規則過濾該第三集合內容，以產生一第四集合內容；及輸出該第四集合內容。
如申請專利範圍第17項之媒介，其中：該第二集合內容係以一第一模型為基礎而進一步被選擇；及該第三集合內容係以一第二模型為基礎而進一步被產生。
如申請專利範圍第17項之媒介，其中該使用者描述紀錄、該內容描述紀錄與該內容品質指標係為動態更新。