TWI534732B

TWI534732B - Recommended information output method, system and server

Info

Publication number: TWI534732B
Application number: TW099139199A
Authority: TW
Inventors: Quan-Wu Xiao; Ning-Jun Su; chang Tan; Qi Liu; jin-yin Zhang; En-Hong Chen
Original assignee: Alibaba Group Holding Ltd
Priority date: 2010-11-15
Filing date: 2010-11-15
Publication date: 2016-05-21
Also published as: TW201220232A

Description

推薦資訊的輸出方法，系統及伺服器

本申請涉及網路技術領域，尤其涉及一種推薦資訊的輸出方法、系統及伺服器。

網路購物已經成為人們生活中的一種常見的購物方式，用戶在網站瀏覽商品並選擇購物的過程中，網站的推薦引擎伺服器可能向用戶推薦熱門商品，並將這些熱門商品的相關資訊呈現在網頁的特定位置，供用戶選擇。現有技術中在輸出推薦的商品資訊時，僅僅按照商品的銷量資訊或者用戶的感興趣資訊(例如：點擊量或瀏覽量)進行推薦，比如，如果某件商品的歷史購買量超過一定的數值，則向用戶推薦該商品資訊，或者，如果某件商品的點擊量超過一定的數值，則向用戶推薦該商品資訊等。

發明人在對現有技術的研究過程中發現，現有技術中的商品資訊推薦輸出方法，僅僅統計了商品在購買量等維度上的資訊，僅僅是購買量等歷史資料的累加，而忽略了時間因素對於商品推薦資訊的影響，例如，用戶在購買商品時，根據季節的不同存在差異，用戶會在夏天大量購買短袖類的服裝，到了冬天該短袖類服裝的累積購買量或點擊量已經非常高，此時如果仍然向用戶推薦該服裝，則將導致推薦引擎伺服器的推薦準確率下降，用戶體驗也不高；並且由於冬天時羽絨服類的服裝的點擊量或購買量勢必劇增，如果僅僅通過對歷史購買量或點擊量的累加來決定向用戶推薦的商品，在冬天時可能會將羽絨服類的服裝資訊連同一些用戶不需要的短袖類服裝資訊同時推薦給用戶，導致在網路中傳輸的資料量增大，降低了網路資料傳輸速度。而為了防止上述推薦資訊不準確的情況發生，現有的推薦引擎伺服器通常採用人工方式，手動修改推薦資訊，使得推薦資訊與推薦時間相匹配，但是人工修改推薦資訊工作量較大，自動化程度不高，難以充分利用推薦引擎伺服器的計算能力。

本申請實施例的目的是提供一種推薦資訊的輸出方法、系統及伺服器，以解決現有技術中輸出的推薦資訊與推薦時間不匹配，且人工作業導致工作量較大的問題。

為解決上述技術問題，本申請實施例提供了一種推薦資訊的輸出方法，是這樣實現的：一種推薦資訊的輸出方法，包括：從用戶行為資料庫中提取預設的統計週期內的用戶行為資料；將該用戶行為資料按照商品標識進行歸類，獲得每一種商品在該統計週期內的感興趣程度的時間序列；根據該感興趣程度的時間序列計算該商品的購買峰值機率；當接收到輸出推薦資訊的命令時，將該購買峰值機率按照從高到低的順序進行排序，根據該排序的結果輸出商品的推薦資訊。

為解決上述技術問題，本申請實施例還提供了一種推薦資訊的輸出系統，是這樣實現的：一種推薦資訊的輸出系統，包括：資料處理伺服器、資訊推薦伺服器，其中，該資料處理伺服器，用於從用戶行為資料庫中提取預設的統計週期內的用戶行為資料，將該用戶行為資料按照商品標識進行歸類，獲得每一種商品在該統計週期內的感興趣程度的時間序列，根據該感興趣程度的時間序列計算該商品的購買峰值機率；資訊推薦伺服器，用於當接收到輸出推薦資訊的命令時，從該資料處理伺服器中獲取每種商品的購買峰值機率，將該購買峰值機率按照從高到低的順序進行排序，並根據該排序的結果輸出商品的推薦資訊。

為解決上述技術問題，本申請實施例還提供了一種推薦資訊的輸出伺服器，是這樣實現的：一種推薦資訊的輸出伺服器，包括：提取單元，用於從用戶行為資料庫中提取預設的統計週期內的用戶行為資料；歸類單元，用於將該用戶行為資料按照商品標識進行歸類，獲得每一種商品在該統計週期內的感興趣程度的時間序列；計算單元，用於根據該感興趣程度的時間序列計算該商品的購買峰值機率；接收單元，用於接收輸出推薦資訊的命令；輸出單元，用於將該購買峰值機率按照從高到低的順序進行排序，根據該排序的結果輸出商品的推薦資訊。

可見，本申請實施例中從用戶行為資料庫中提取預設的統計週期內的用戶行為資料，將該用戶行為資料按照商品標識進行歸類，獲得每一種商品在該統計週期內的感興趣程度的時間序列，根據該感興趣程度的時間序列計算該商品的購買峰值機率，當接收到輸出推薦資訊的命令時，將該購買峰值機率按照從高到低的順序進行排序，根據該排序的結果輸出商品的推薦資訊。本申請輸出推薦資訊的實施例考慮了商品在時間維度上的資訊，按照用戶行為資料自動統計商品在時間維度上的購買峰值機率，並根據購買峰值機率向用戶推薦資訊，由此可以提高推薦系統的推薦準確率，減少不必要資料在網路中的傳輸量，提升用戶體驗、提高網路傳輸速度；並且，由於推薦資訊由伺服器自動修正並輸出，因此克服了現有技術中需要手動調整推薦資訊導致推薦系統的自動化程度不高的問題，充分利用了伺服器的計算能力，當通過購買峰值機率調整推薦資訊時，可以減少推薦系統的資訊輸入量，節約推薦系統的計算資源。

本申請實施例提供一種推薦資訊的輸出方法、系統及伺服器。

為了使本技術領域的人員更好地理解本申請實施例中的技術方案，並使本申請實施例的上述目的、特徵和優點能夠更加明顯易懂，下面結合附圖對本申請實施例中技術方案作進一步詳細的說明。

參見圖1，為本申請推薦資訊的輸出方法的第一實施例流程圖：步驟101：從用戶行為資料庫中提取預設的統計週期內的用戶行為資料。

所有用戶對商品的操作的行為資料都將保存到用戶行為資料庫中，用戶行為資料的類型包括了用戶對商品的點擊數量、瀏覽數量、瀏覽時間、購買金額、購買數量等等，用戶通過操作終端介面每完成一次用戶行為時，伺服器將該用戶行為所觸發的行為資料保存到行為資料庫中與該用戶對應的表項中。

在用戶行為資料庫中，對於同一種商品的不同用戶行為資料可能通過不同的基礎表進行保存，當需要對用戶行為資料進行處理時，則可根據統計週期的開始時間和結束時間查找用戶行為資料庫中的若干基礎資料表，從若干基礎資料表中獲取與統計週期匹配的用戶行為資料，並生成一張資料匯總表，該資料匯總表中可以包含用戶行為資料的發生日期、商品標識、用戶標識和若干行為資料。

步驟102：將用戶行為資料按照商品標識進行歸類，獲得每一種商品在統計週期內的感興趣程度的時間序列。

由於所生成的資料匯總表中包含了日期、商品標識、用戶標識和若干行為資料等欄位，因此為了獲取統計週期內所有用戶對同一商品的感興趣程度，可以按照商品標識的不同，提取具有同一商品標識的用戶行為資料，對於具有同一商品標識的用戶行為資料，按照用戶行為資料的類型分別匯總每一種類型的用戶行為資料，並生成每一種類型的用戶行為資料的時間序列。其中，時間序列中的時間點的個數可以預先設置，以統計週期為一年為例，如果時間點為一天，則該時間序列中包含365個時間點，如果時間點為一周，則該時間序列中包含52個時間點。因此，每一種類型的用戶行為資料的時間序列中包含了與時間點個數一致的離散值，每個離散值表示一個時間點上某一種類型的用戶行為資料的集合。

通過每一種類型的用戶行為資料的權重值，計算每一種商品的感興趣程度的時間序列，該時間序列中包含了與時間點個數一致的感興趣程度值。其中，權重值的計算可以通過建立用戶行為模型，並運用機器學習方法獲得，在實際應用中，可以採用現有的BP神經網路來訓練權重並獲得權重值，在此不再贅述。

步驟103：根據感興趣程度的時間序列計算商品的購買峰值機率。

根據感興趣程度的時間序列中的所有感興趣程度值計算該時間序列的感興趣程度平均值，根據感興趣程度平均值計算感興趣程度閾值，將每個感興趣程度值與感興趣程度平均值及感興趣程度閾值分別進行比較，根據比較的結果，將低於感興趣程度平均值的感興趣程度值的購買峰值機率設置為0，將高於感興趣程度閾值的感興趣程度值的購買峰值機率設置為1，並根據感興趣程度平均值和感興趣程度閾值計算在上述兩個值之間的感興趣程度值的購買峰值機率。

步驟104：當接收到輸出推薦資訊的命令時，將購買峰值機率按照從高到低的順序進行排序。

步驟105：根據排序的結果輸出商品的推薦資訊，結束當前流程。

在利用購買峰值機率的排序結果輸出商品的推薦資訊時，可以首先獲取推薦系統輸出的商品的初始推薦資訊，對於初始推薦資訊按照購買峰值機率的排序，調整其中的商品資訊的排序。這種方式可以用於對現有推薦系統的推薦資訊進行自動校正，提高用戶體驗。

也可以，從排序的結果中按照從高到低的順序獲取預設數量的商品的推薦資訊，將預設數量的商品的推薦資訊輸入到推薦系統中，由推薦系統對預設數量的商品的推薦資訊進行處理後輸出商品的推薦資訊。這種方式可以減少推薦系統的輸入資訊量和資訊處理量，提高系統的推薦效率。

參見圖2，為本申請推薦資訊的輸出方法的第二實施例流程圖：步驟201：從用戶行為資料庫中提取預設的統計週期內的用戶行為資料。

本申請實施例中，可以根據系統輸入的觸發命令開始進行用戶行為資料的處理，或者按照預設的時間間隔自動進行用戶行為資料的處理。在用戶行為資料庫中，對於同一種商品的不同用戶行為資料可能通過不同的基礎表進行保存，當需要對用戶行為資料進行處理時，則可根據統計週期從若干基礎表中提取所需要的用戶行為資料到一張匯總資料表中，例如，統計週期為從2010年5月1日至2011年4月30日這一年內的用戶行為資料，則按照統計週期從若干基礎表中提取滿足上述時間段的資料，並匯總到如下表1所示的資料匯總表中，該資料匯總表中包含如下欄位：日期(用戶行為資料的發生時間)，用戶ID，商品ID、用戶行為資料(點擊數、瀏覽數、購買金額)：

從上表1中可知，該資料匯總表中的每一個表項記錄的是某個用戶某一天對某個商品的用戶行為資料的總和，即記錄了多個用戶與多種商品的多對多關係，為了進行後續商品購買峰值和購買週期的計算，需要對表1中的資料進行處理得到單一商品與多個用戶的一對多關係，從而獲取每個商品的推薦資訊。例如，對於Product2，以其商品ID為索引，從表1中提取在一定時間段內(比如一年)，所有用戶對該Product2的點擊數量、瀏覽數量、購買金額等用戶行為資料的集合。

步驟202：將用戶行為資料按照商品標識進行歸類，獲得每一種商品在統計週期內的感興趣程度的時間序列。

在提取出每一種商品與用戶行為資料的集合後，需要將同一種商品的各種用戶行為資料進行歸併。

假設x₁(t)表示某一商品在t時間點的用戶購買數量，那麼時間序列{x₁}={x₁(t)，t=1,2,...,n}就表示某一商品在時間點t=1到t=n之間的購買數量的集合，其中，n的取值可以根據實際需要確定，例如t=1到t=n可以表示一年中的每一天，即n取365，或者t=1到t=n表示一年中的每一周，即n取52；x₁(t)表示在t時間點所有用戶的購買數量的總和；上述t時間點指統計週期一年內的第t個時間點，例如，如果統計週期為2010年5月1日至2011年4月30日，則t=1時刻就指2010年5月1日這一天。上述列舉的時間序列{x₁}為購買數量的事件序列，同理，瀏覽數量、回饋數量、點擊數量等用戶行為資料對應的時間序列分別表示為{x₂}、{x₃}、{x₄}。需要說明的是，用戶行為資料可以不侷限在上述列舉的購買數量、瀏覽數量、回饋數量和點擊數量這四種。

以表1中的用戶行為資料為例，其中時間點t以天為單位，那麼對於商品Product1，根據其“商品ID”和“日期”查找表1，將每一天中所有用戶對該Product1的瀏覽數量相加，就得到Product1在一天中的用戶瀏覽總數，依次類推，就可以得到每一天用戶對Product1的瀏覽總數。假設選取某一天為t=1的時間點，並確定統計週期的時間長度為n，就可以得到一個Product1的用戶瀏覽數量的時間序列{x₂}，它表示了從某一天t=1開始，其後n天在內的每一天Product1的用戶瀏覽數量集合，記為{x₂}={x₂(t)，t=1,2,...,n}，n通常為統計週期內所包含的時間點的個數。

前面採集的為某種商品的若干用戶行為資料的時間序列，而某種商品的用戶感興趣程度由若干用戶行為資料共同確定，設用戶對某種商品隨時間變化的感興趣程度設為時間序列{X}={X(t),t=1,2,...,n}，{X}表示在統計週期t=1至t=n內用戶對商品的感興趣程度，其中X(t)表示第t個時間點上對該商品的感興趣程度值，X(t)可以是用戶行為資料的線性組合，假設共有m種用戶行為資料，則X(t)可以按照下式進行計算：

{X(t)}=w₁{x₁(t)}+w₂{x₂(t)}+...+w_m{x_m(t)}

上式中，w₁,w₂,...,w_m為該商品的每一種用戶行為資料的權重值，表示每一種用戶行為資料相對於用戶對商品感興趣程度值比重的強弱。權重值的計算可以通過建立用戶行為模型，並運用機器學習方法獲得，在實際應用中，可以採用現有的BP神經網路來訓練權重並獲得權重值，在此不再贅述。對於不同的商品，均按照上述方式來獲取用戶對商品的感興趣程度的時間序列，每種商品的權重值w₁,w₂,...,w_m可以不同，可以分別通過神經網路進行訓練。

步驟203：根據感興趣程度的時間序列分別計算商品的購買峰值機率和商品的呈現週期。

在計算商品的購買峰值機率時，可以按照如下方式進行：首先，前述求得的每種商品的感興趣程度的時間序列一般存在明顯的上升趨勢項，即在t=1至t=n的前期商品的感興趣程度值往往小於後期的感興趣程度值，因為商品在剛推出的時候往往不如該商品在呈現一段時間後用戶行為資料的值大，例如，某個商品在推出的首周用戶的點擊數量較少，但過了一個月後，可能用戶的點擊數量會大幅上升。因此，為了去除上述隨時間存在的上升趨勢，可以通過樣條擬合函數對求得的感興趣程度的時間序列擬合一個線性函數，然後將感興趣程度的時間序列減去這個線性函數，假設擬合的線性函數為y(t)=10t，則消除上升趨勢後的感興趣程度的時間序列{X}={X(t)-10t,t=1,2,...,n}。

其次，前述計算出的對於每一種商品的用戶感興趣程度的時間序列為：{X}={X(t)-10t,t=1,2,...,n}，為了描述方便仍然假設{X}={X(t),t=1,2,...,n}，該{X}實際為橫坐標為t的n個離散值的集合，每個離散值代表商品在某一天的用戶感興趣程度值，按照下式計算該時間序列的平均值avg：

avg=(X(1)+X(2)+...+X(n))/n

將X(t)值與avg進行比較，並將所有小於avg的點的峰值機率p設置為0，即這些點不可能成為峰值。

再次，對於高於avg的點，設置一個閾值z，該z按照下式進行計算：

z=(X_max－avg)×0.6

上式中，X_max為{X}={X(t),t=1,2,...,n}中的最大值，將X(t)值與z進行比較，所有大於z的點的峰值機率p設置為1，即這些點均為峰值。需要說明的是，上式中的0.6是一個經驗值，在實際應用過程中，可以適當調整該值，從而計算合適的閾值z。

最後，對於在閾值z和avg之間的點，按照下式分別計算其峰值機率p：

p=(X(t)-avg)/(z-avg)

通過以上四步，就得到了一段時間內(t=1,2,...,n)每個時間點的峰值機率p，它也可以表示為一個時間序列{p}={p(t),t=1,2,...,n}。

在計算商品的購買週期時，可以按照如下方式進行：用戶對商品隨時間變化的感興趣程度的時間序列{X}和在{X}上發現的峰值機率時間序列{p}，可以發現用戶的購買週期。

首先對感興趣程度的時間序列{X}使用FFT(快速傅立葉變換)進行計算，獲取其中最強的正弦分量，根據該正弦分量發現可能存在的購買週期長度L；隨後將時間序列{X}按長度L分割成若干時間段，比較各時間段之間是否相似，如果相似，則認為存在用戶購買週期。在進行比較時可以採用模糊匹配峰值的方法，即在相同或相近的間隔內是否出現峰值，或者也可以採用cosine(餘弦相似性)比較法，即比較各個時間段序列之間的相似程度，設兩個等長的時間序列{P}，{Q}，則按如下公式計算其cosine值：

上式中的cosine值越接近1，則說明兩個時間序列{P}和{Q}的相似性越高，由此確定存在購買週期L。

步驟204：根據呈現週期修正商品的購買峰值機率，獲得商品的週期購買峰值機率。

在商品可能存在購買週期或者已經明確發現購買週期L時，可以將多個週期L(假定共有k個週期)的峰值時間點和峰值機率進行比較，計算每個峰值時間點上的多週期平均峰值機率p_a

p_a(t)=(p₁(t)+p₂(t)+...+p_k(t))/k

其中p₁,p₂,...,p_k表示時間點t的每個週期的峰值機率，這裏對於峰值點定義p=1，非峰值點p=0，如果p_a高於一個預設的閾值，就可以認為該時間點在多個週期中都是峰值，可以作為一個週期性的峰值進行記錄，即該商品在每個週期的該時間點都會出現峰值，推薦時在每個週期的該時間點都可以推薦該商品。

步驟205：保存商品的購買峰值機率，並根據商品的資訊更新情況按照預設的時間間隔維護商品的購買峰值機率和購買週期。

保存上述求得的資訊至商品購買峰值資料表，該資料表中的表項包含的欄位有商品ID、峰值時間點和峰值機率，對於週期平均峰值機率，可以進一步記錄其週期長度。

上述商品購買峰值資料表可以保存在商品購買峰值資料庫中，除了該資料庫，還可以進一步設置商品資訊資料庫，用於保存商品的基本資訊，包括商品的分類資訊、商品是否存在、商品存在的持續時間、商品的描述資訊等，上述基本資訊可能隨著時間的變化而發生變化，因此需要根據即時變化情況進行更新。商品的基本資訊可以作為購買峰值計算的參考，例如，對於已經不存在的商品，可以停止計算其購買峰值機率和購買週期，並從資料庫中刪除該商品的資訊，對於存在時間較短的商品，額可以等待其持續之間足夠長，且用戶行為資料充分時，再計算其購買峰值機率和購買週期。

步驟206：當接收到輸出推薦資訊的命令時，將購買峰值機率按照從高到低的順序進行排序。

推薦系統按照現有方式可以得到某一天所要推薦的商品的推薦資訊，但是通過現有技術的描述可知，上述推薦資訊不準確，且包括大量用戶不需要的資訊，因此可以應用前述獲得的商品購買峰值對該推薦結果進行修正。在修正時，以所要推薦的這一天所在的時間點為索引查找所保存的商品購買峰值資料表，獲取該時間點上每種商品的峰值機率，根據峰值機率從高到低進行排列，僅向用戶推薦排序靠前的資訊，峰值機率越高的商品說明其越有可能成為熱銷商品。

步驟207：根據排序的結果輸出商品的推薦資訊，結束當前流程。

根據推薦場景的不同，通過獲得的熱銷商品對推薦結果進行修正可以採用如下方式：

1)直接篩選推薦結果。對於推薦系統給出的初始推薦結果，根據峰值機率的從高到低對推薦結果進行排序，將熱銷商品的排序提前。例如，推薦系統根據用戶瀏覽得到的用戶可能喜歡的商品的推薦結果是羽絨服和T恤，而當前時間T恤的峰值機率高於羽絨服，則修正時將推薦結果中T恤的順序排列到羽絨服之前。在實際應用中可以只將排序靠前的T恤推薦給用戶，而不推薦羽絨服資訊，因此可以減少資料在網路中的傳輸量，提高網路傳輸速度。

2)使用推薦系統篩選熱銷商品。在一些應用場景中，可能只需要展示少量的推薦商品，例如，只需要展示10種商品，但是推薦系統在按照現有方式輸出推薦結果時，需要將所有商品輸入到推薦系統中並輸出推薦結果，即如果有一萬種商品的資訊，則這一萬種商品的資訊都需要輸入到推薦系統中，而為了降低推薦系統的工作量，可以按照峰值機率的排序初次篩選出排名靠前的商品，例如，篩選出排在前200位的商品，將初始篩選出的商品輸入到推薦系統中進行處理，則可以降低推薦系統的處理資料量，同時由於所輸入的商品為按照峰值機率排序後的結果，因此可以提高用戶對推薦結果的滿意度。

上述實施例在應用時，可以將對用戶行為資料進行處理獲得購買峰值機率和購買週期的功能部署在一台伺服器中實現，而將對購買峰值機率和購買週期及商品資訊的儲存和維護功能部署在另一台伺服器中實現，由此實現負載均衡；當然，上述兩部分功能也可以在一台伺服器中執行，對此本申請實施例不進行限制。上述兩部分功能可以離線執行，當需要輸出推薦資訊時，則由線上的資訊推薦伺服器通過TCP/IP協定與儲存購買峰值機率和購買週期的伺服器進行通信，獲取購買峰值機率，並根據對其排序結果輸出商品的推薦資訊。

與本申請推薦資訊的輸出方法的實施例相對應，本申請還提供了推薦資訊的輸出系統及伺服器的實施例。

參見圖3，為本申請推薦資訊的輸出系統的實施例框圖：該系統包括：資料處理伺服器310和資訊推薦伺服器320。

其中，該資料處理伺服器310，用於從用戶行為資料庫中提取預設的統計週期內的用戶行為資料，將該用戶行為資料按照商品標識進行歸類，獲得每一種商品在該統計週期內的感興趣程度的時間序列，根據該感興趣程度的時間序列計算該商品的購買峰值機率；資訊推薦伺服器320，用於當接收到輸出推薦資訊的命令時，從該資料處理伺服器中獲取每種商品的購買峰值機率，將該購買峰值機率按照從高到低的順序進行排序，並根據該排序的結果輸出商品的推薦資訊。

進一步，該系統還可以包括資料維護伺服器330，用於保存該商品的購買峰值機率，並根據該商品的資訊更新情況按照預設的時間間隔維護該商品的購買峰值機率。

參見圖4，為本申請推薦資訊的輸出伺服器的第一實施例框圖：該伺服器包括：提取單元410、歸類單元420、計算單元430、接收單元440和輸出單元450。

其中，提取單元410，用於從用戶行為資料庫中提取預設的統計週期內的用戶行為資料；歸類單元420，用於將該用戶行為資料按照商品標識進行歸類，獲得每一種商品在該統計週期內的感興趣程度的時間序列；計算單元430，用於根據該感興趣程度的時間序列計算該商品的購買峰值機率；接收單元440，用於接收輸出推薦資訊的命令；輸出單元450，用於將該購買峰值機率按照從高到低的順序進行排序，根據該排序的結果輸出商品的推薦資訊。

參見圖5，為本申請推薦資訊的輸出伺服器的第二實施例框圖：該伺服器包括：提取單元510、歸類單元520、計算單元530、修正單元540、保存單元550、維護單元560、接收單元570和輸出單元580。

其中，提取單元510，用於從用戶行為資料庫中提取預設的統計週期內的用戶行為資料；歸類單元520，用於將該用戶行為資料按照商品標識進行歸類，獲得每一種商品在該統計週期內的感興趣程度的時間序列；計算單元530，用於根據該感興趣程度的時間序列計算該商品的購買峰值機率，以及根據該感興趣程度的時間序列計算該商品的呈現週期；修正單元540，用於根據該呈現週期修正該商品的購買峰值機率，獲得該商品的週期購買峰值機率；保存單元550，用於保存該商品的購買峰值機率；維護單元560，用於根據該商品的資訊更新情況按照預設的時間間隔維護該商品的購買峰值機率；接收單元570，用於接收輸出推薦資訊的命令；輸出單元580，用於將該購買峰值機率按照從高到低的順序進行排序，根據該排序的結果輸出商品的推薦資訊。

具體的，該提取單元510可以包括(圖5中未示出)：資料庫查找單元，用於按照該統計週期的開始時間和結束時間查找用戶行為資料庫中的若干基礎資料表；匯總表生成單元，用於從該若干基礎資料表中獲取與該統計週期匹配的用戶行為資料，並生成資料匯總表，該資料匯總表中包含日期、商品標識、用戶標識和若干行為資料。

具體的，該歸類單元520可以包括(圖5中未示出)：資料提取單元，用於按照商品標識提取具有同一商品標識的用戶行為資料；時間序列生成單元，用於對於具有同一商品標識的用戶行為資料，按照該用戶行為資料的類型分別匯總每一種類型的用戶行為資料，並生成每一種類型的用戶行為資料的時間序列；時間序列計算單元，用於通過每一種類型的用戶行為資料的權重值，計算該商品的感興趣程度的時間序列。

具體的，該計算單元530可以包括(圖5中未示出)：平均值計算單元，用於根據該感興趣程度的時間序列中的所有感興趣程度值計算該時間序列的感興趣程度平均值；閾值計算單元，用於根據該感興趣程度平均值計算感興趣程度閾值；感興趣程度比較單元，用於將每個感興趣程度值與該感興趣程度平均值及感興趣程度閾值分別進行比較；比較結果執行單元，用於根據該比較的結果，將低於該感興趣程度平均值的感興趣程度值的購買峰值機率設置為0，將高於該感興趣程度閾值的感興趣程度值的購買峰值機率設置為1，並根據該感興趣程度平均值和感興趣程度閾值計算在上述兩個值之間的感興趣程度值的購買峰值機率。

具體的，該輸出單元580可以包括(圖5中未示出)：初始資訊獲取單元，用於獲取推薦系統輸出的商品的初始推薦資訊；初始資訊調整單元，用於按照該購買峰值機率的排序，調整該初始推薦資訊中的商品資訊的排序。或者，推薦資訊獲取單元，用於從該排序的結果中按照從高到低的順序獲取預設數量的商品的推薦資訊；推薦資訊輸出單元，用於將該預設數量的商品的推薦資訊輸入到推薦系統中，該推薦系統用於對該預設數量的商品的推薦資訊進行處理後輸出商品的推薦資訊。

通過以上的實施方式的描述可知，本申請實施例中從用戶行為資料庫中提取預設的統計週期內的用戶行為資料，將該用戶行為資料按照商品標識進行歸類，獲得每一種商品在該統計週期內的感興趣程度的時間序列，根據該感興趣程度的時間序列計算該商品的購買峰值機率，當接收到輸出推薦資訊的命令時，將該購買峰值機率按照從高到低的順序進行排序，根據該排序的結果輸出商品的推薦資訊。本申請輸出推薦資訊的實施例考慮了商品在時間維度上的資訊，按照用戶行為資料自動統計商品在時間維度上的購買峰值機率，並根據購買峰值機率向用戶推薦資訊，由此可以提高推薦系統的推薦準確率，提升用戶體驗；並且，由於推薦資訊由伺服器自動修正並輸出，因此克服了現有技術中需要手動調整推薦資訊導致推薦系統的自動化程度不高的問題，充分利用了伺服器的計算能力，當通過購買峰值機率調整推薦資訊時，可以減少推薦系統的資訊輸入量，節約推薦系統的計算資源。

通過以上的實施方式的描述可知，本領域的技術人員可以清楚地瞭解到本申請可借助軟體加必需的通用硬體平臺的方式來實現。基於這樣的理解，本申請的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟體產品的形式體現出來，該電腦軟體產品可以儲存在儲存媒體中，如ROM/RAM、磁碟、光碟等，包括若干指令用以使得一台電腦設備(可以是個人電腦，伺服器，或者網路設備等)執行本申請各個實施例或者實施例的某些部分所述的方法。

本說明書中的各個實施例均採用遞進的方式描述，各個實施例之間相同相似的部分互相參見即可，每個實施例重點說明的都是與其他實施例的不同之處。尤其，對於系統實施例而言，由於其基本相似於方法實施例，所以描述的比較簡單，相關之處參見方法實施例的部分說明即可。

本申請可用於眾多通用或專用的計算系統環境或配置中。例如：個人電腦、伺服器電腦、手持設備或可攜式設備、平板型設備、多處理器系統、基於微處理器的系統、置頂盒、可編程的消費電子設備、網路PC、小型電腦、大型電腦、包括以上任何系統或設備的分散式計算環境等等。

本申請可以在由電腦執行的電腦可執行指令的一般上下文中描述，例如程式模組。一般地，程式模組包括執行特定任務或實現特定抽象資料類型的常式、程式、物件、元件、資料結構等等。也可以在分散式計算環境中實踐本申請，在這些分散式計算環境中，由通過通信網路而被連接的遠端處理設備來執行任務。在分散式計算環境中，程式模組可以位於包括儲存設備在內的本地和遠端電腦儲存媒體中。

雖然通過實施例描繪了本申請，本領域普通技術人員知道，本申請有許多變形和變化而不脫離本申請的精神，希望所附的申請專利範圍包括這些變形和變化而不脫離本申請的精神。

310．．．資料處理伺服器

320．．．資訊推薦伺服器

330．．．資料維護伺服器

410．．．提取單元

420．．．歸類單元

430．．．計算單元

440．．．接收單元

450．．．輸出單元

510．．．提取單元

520．．．歸類單元

530．．．計算單元

540．．．修正單元

550．．．保存單元

560．．．維護單元

570．．．接收單元

580．．．輸出單元

為了更清楚地說明本申請實施例或現有技術中的技術方案，下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本申請中記載的一些實施例，對於本領域普通技術人員來講，在不付出創造性勞動性的前提下，還可以根據這些附圖獲得其他的附圖。

圖1為本申請推薦資訊的輸出方法的第一實施例流程圖；

圖2為本申請推薦資訊的輸出方法的第二實施例流程圖；

圖3為本申請推薦資訊的輸出系統的實施例框圖；

圖4為本申請推薦資訊的輸出伺服器的第一實施例框圖；

圖5為本申請推薦資訊的輸出伺服器的第二實施例框圖。

Claims

一種推薦資訊的輸出方法，其特徵在於，包括：從用戶行為資料庫中提取預設的統計週期內的用戶行為資料；將該用戶行為資料按照商品標識進行歸類，獲得每一種商品在該統計週期內的感興趣程度的時間序列；根據該感興趣程度的時間序列計算該商品在時間維度上的購買峰值機率；當接收到輸出推薦資訊的命令時，將該購買峰值機率按照從高到低的順序進行排序，從該排序的結果中按照從高到低的順序獲取預設數量的商品的推薦資訊，將該預設數量的商品的推薦資訊輸入到推薦系統中，該推薦系統用於對該預設數量的商品的推薦資訊進行處理後輸出商品的推薦資訊，其中，根據該感興趣程度的時間序列計算該商品的購買峰值機率包括：根據該感興趣程度的時間序列中的所有感興趣程度值計算該時間序列的感興趣程度平均值；根據該感興趣程度平均值計算感興趣程度閾值；將每個感興趣程度值與該感興趣程度平均值及感興趣程度閾值分別進行比較；根據該比較的結果，將低於該感興趣程度平均值的感興趣程度值的購買峰值機率設置為0，將高於該感興趣程度閾值的感興趣程度值的購買峰值機率設置為1，並根據該感興趣程度平均值和感興趣程度閾值計算在上述兩個值之間的感興趣程度值的購買峰值機率。
根據申請專利範圍第1項所述的方法，其中，從用戶行為資料庫中提取預設的統計週期內的用戶行為資料包括：按照該統計週期的開始時間和結束時間查找用戶行為資料庫中的若干基礎資料表；從該若干基礎資料表中獲取與該統計週期匹配的用戶行為資料，並生成資料匯總表，該資料匯總表中包含日期、商品標識、用戶標識和若干行為資料。
根據申請專利範圍第1項所述的方法，其中，將該用戶行為資料按照商品標識進行歸類，獲得每一種商品在該統計週期內的感興趣程度的時間序列包括：按照商品標識提取具有同一商品標識的用戶行為資料；對於具有同一商品標識的用戶行為資料，按照該用戶行為資料的類型分別匯總每一種類型的用戶行為資料，並生成每一種類型的用戶行為資料的時間序列；通過每一種類型的用戶行為資料的權重值，計算該商品的感興趣程度的時間序列。
根據申請專利範圍第1項所述的方法，其中，獲得每一種商品在該統計週期內的感興趣程度的時間序列後，還包括：根據該感興趣程度的時間序列計算該商品的呈現週期；根據該呈現週期修正該商品的購買峰值機率，獲得該商品的週期購買峰值機率。
根據申請專利範圍第1項所述的方法，其中，還包括：保存該商品的購買峰值機率，並根據該商品的資訊更新情況按照預設的時間間隔維護該商品的購買峰值機率。
一種推薦資訊的輸出系統，其特徵在於，包括：資料處理伺服器、資訊推薦伺服器，其中，該資料處理伺服器，用於從用戶行為資料庫中提取預設的統計週期內的用戶行為資料，將該用戶行為資料按照商品標識進行歸類，獲得每一種商品在該統計週期內的感興趣程度的時間序列，根據該感興趣程度的時間序列計算該商品在時間維度上的購買峰值機率，其中，根據該感興趣程度的時間序列計算該商品的購買峰值機率包括：根據該感興趣程度的時間序列中的所有感興趣程度值計算該時間序列的感興趣程度平均值；根據該感興趣程度平均值計算感興趣程度閾值；將每個感興趣程度值與該感興趣程度平均值及感興趣程度閾值分別進行比較；根據該比較的結果，將低於該感興趣程度平均值的感興趣程度值的購買峰值機率設置為0，將高於該感興趣程度閾值的感興趣程度值的購買峰值機率設置為1，並根據該感興趣程度平均值和感興趣程度閾值計算在上述兩個值之間的感興趣程度值的購買峰值機率；及資訊推薦伺服器，用於當接收到輸出推薦資訊的命令時，從該資料處理伺服器中獲取每種商品的購買峰值機率，將該購買峰值機率按照從高到低的順序進行排序，並從該排序的結果中按照從高到低的順序獲取預設數量的商品的推薦資訊，將該預設數量的商品的推薦資訊輸入到推薦系統中，該推薦系統用於對該預設數量的商品的推薦資訊進行處理後輸出商品的推薦資訊。
根據申請專利範圍第6項所述的系統，其中，還包括：資料維護伺服器，用於保存該商品的購買峰值機率，並根據該商品的資訊更新情況按照預設的時間間隔維護該商品的購買峰值機率。
一種推薦資訊的輸出伺服器，其特徵在於，包括：提取單元，用於從用戶行為資料庫中提取預設的統計週期內的用戶行為資料；歸類單元，用於將該用戶行為資料按照商品標識進行歸類，獲得每一種商品在該統計週期內的感興趣程度的時間序列；計算單元，用於根據該感興趣程度的時間序列計算該商品在時間維度上的購買峰值機率；接收單元，用於接收輸出推薦資訊的命令；及輸出單元，用於將該購買峰值機率按照從高到低的順序進行排序，根據該排序的結果輸出商品的推薦資訊，其中，該輸出單元包括：推薦資訊獲取單元，用於從該排序的結果中按照從高到低的順序獲取預設數量的商品的推薦資訊；推薦資訊輸出單元，用於將該預設數量的商品的推薦資訊輸入到推薦系統中，該推薦系統用於對該預設數量的商品的推薦資訊進行處理後輸出商品的推薦資訊，及其中，該計算單元包括：平均值計算單元，用於根據該感興趣程度的時間序列中的所有感興趣程度值計算該時間序列的感興趣程度平均值；閾值計算單元，用於根據該感興趣程度平均值計算感興趣程度閾值；感興趣程度比較單元，用於將每個感興趣程度值與該感興趣程度平均值及感興趣程度閾值分別進行比較；比較結果執行單元，用於根據該比較的結果，將低於該感興趣程度平均值的感興趣程度值的購買峰值機率設置為0，將高於該感興趣程度閾值的感興趣程度值的購買峰值機率設置為1，並根據該感興趣程度平均值和感興趣程度閾值計算在上述兩個值之間的感興趣程度值的購買峰值機率。
根據申請專利範圍第8項所述的伺服器，其中，該提取單元包括：資料庫查找單元，用於按照該統計週期的開始時間和結束時間查找用戶行為資料庫中的若干基礎資料表；匯總表生成單元，用於從該若干基礎資料表中獲取與該統計週期匹配的用戶行為資料，並生成資料匯總表，該資料匯總表中包含日期、商品標識、用戶標識和若干行為資料。
根據申請專利範圍第8項所述的伺服器，其中，該歸類單元包括：資料提取單元，用於按照商品標識提取具有同一商品標識的用戶行為資料；時間序列生成單元，用於對於具有同一商品標識的用戶行為資料，按照該用戶行為資料的類型分別匯總每一種類型的用戶行為資料，並生成每一種類型的用戶行為資料的時間序列；時間序列計算單元，用於通過每一種類型的用戶行為資料的權重值，計算該商品的感興趣程度的時間序列。
根據申請專利範圍第8項所述的伺服器，其中，該計算單元，還用於根據該感興趣程度的時間序列計算該商品的呈現週期；該伺服器還包括：修正單元，用於根據該呈現週期修正該商品的購買峰值機率，獲得該商品的週期購買峰值機率。
根據申請專利範圍第8項所述的伺服器，其中，還包括：保存單元，用於保存該商品的購買峰值機率；維護單元，用於根據該商品的資訊更新情況按照預設的時間間隔維護該商品的購買峰值機率。