TWI756967B - 內容點擊數預測裝置及其方法 - Google Patents

內容點擊數預測裝置及其方法 Download PDF

Info

Publication number
TWI756967B
TWI756967B TW109142912A TW109142912A TWI756967B TW I756967 B TWI756967 B TW I756967B TW 109142912 A TW109142912 A TW 109142912A TW 109142912 A TW109142912 A TW 109142912A TW I756967 B TWI756967 B TW I756967B
Authority
TW
Taiwan
Prior art keywords
content
information
click
tested
ranking
Prior art date
Application number
TW109142912A
Other languages
English (en)
Other versions
TW202223771A (zh
Inventor
范斯越
王彥翔
Original Assignee
萬里雲互聯網路有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 萬里雲互聯網路有限公司 filed Critical 萬里雲互聯網路有限公司
Priority to TW109142912A priority Critical patent/TWI756967B/zh
Application granted granted Critical
Publication of TWI756967B publication Critical patent/TWI756967B/zh
Publication of TW202223771A publication Critical patent/TW202223771A/zh

Links

Images

Landscapes

  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一種內容點擊數預測裝置及其方法,所述的內容點擊數預測裝置可建立一曝光量預測模型,可預測出至少一待測內容資訊的一邊緣權重和一預測曝光量,其中,內容點擊數預測裝置可於曝光量預測模型增加一模擬內容資訊,計算出模擬內容資訊的邊緣權重和一曝光量分流後,即可修正各待測內容資訊的邊緣權重和預測曝光量,再者,內容點擊數預測裝置可再依據各待測內容資訊的一平均排名,與估計排名誤差範圍計算出一點擊率期望值,再基於預測曝光量與點擊率期望值計算出一內容點擊數。

Description

內容點擊數預測裝置及其方法
本發明涉及網路技術領域,尤指一種可貼近現實環境計算出至少一待測內容資訊的一預測曝光量,並依據各待測內容資訊的平均排名,計算出待測內容資訊的一點擊率期望值,再以預測曝光量和點擊率期望值計算出一預測內容點擊數的內容點擊數預測裝置及其方法。
目前數位廣告投放技術成熟,廣告業主投放數位廣告於網路環境時,許多廣告業主會先進行搜尋引擎最佳化(Search Engine Optimization, SEO)服務,依據數位廣告中出現的關鍵字,預估判斷此數位廣告未來一段時間的預測曝光量(Impression),目前已有第三方關鍵字分析系統業者會提供多筆關鍵字的一關鍵字預測曝光量及預測點擊率,以供廣告業主參考,目前另有其他方式,請參照中華民國專利第TWI660317號「行銷標的熱門度預測方法以及非暫態電腦可讀取媒體」,此專利即揭露一種透過分析關鍵詞之曝光量後,依據機器學習演算法產生一個預測模型,以預測關鍵字的熱門度,並給予關鍵字所對應之權重,以供廣告業主作為選擇依據,另有其他參考案件如下: (1)  TWI521453「搜尋關鍵詞的估計值預測方法和裝置」; (2)  CN110415032A「一種曝光轉化率預估方法、裝置、設備以及存儲介質」; (3)  CN110363346A「點擊率預測方法、預測模型的訓練方法、裝置及設備」; (4)  CN110399479A「搜索資料處理方法、裝置、電子設備及電腦可讀介質」; (5)  US8725566B2「Predicting advertiser keyword performance indicator values based on established performance indicator values」; (6)  US20120158456A1「Forecasting Ad Traffic Based on Business Metrics in Performance-based Display Advertising」。
從上述揭露內容可知,目前第三方關鍵字分析系統產生關鍵字清單資訊時,必須先以爬蟲程式於搜尋引擎進行一段時間的搜尋,累積搜尋數據後透過演算法估算出該筆關鍵字未來一段時間的曝光量,然而,網路數據極為龐大,爬蟲程式以關鍵字進行數位廣告的搜尋時,會搜尋到大量相關聯網頁資訊,再依據權重計算各筆關鍵字之曝光量,統計相關聯關鍵字之曝光量,即可取得數位廣告的預測曝光量,然而,爬蟲程式進行搜尋時有可能未能搜尋到相關內容,而這些未被搜尋到的內容也會佔據關鍵字預測曝光量一定比例,即關鍵字預測曝光量會有曝光量分流的狀況,若未考量曝光量分流狀況,數位廣告所預測的曝光量將會被高估,更會直接影響內容點擊數預測的準確性,如此,如能考量現實搜尋環境會有的曝光量分流狀況,更加準確的分析且預測出內容點擊數,此乃待需解決之問題。
有鑒於上述的問題,本發明人係依據多年來從事相關行業的經驗,針對曝光量預測裝置及曝光量預測方法進行研究及改進;緣此,本發明之主要目的在於提供一種可依據待測內容排名位置推估出點擊率期望值,以計算出逼近現實點擊數的內容點擊數預測裝置及其方法。
為達上述的目的,本發明之內容點擊數預測裝置可基於一關鍵字清單資訊執行一搜尋任務,取得包含有至少一待測內容資訊的搜尋結果,依據搜尋結果建立一曝光量預測模型及一點擊率預測模型,其中,內容點擊數預測裝置可依據曝光量預測模型,計算出各待測內容資訊的至少一邊緣權重及一預測曝光量,再於曝光量預測模型中加入一模擬內容資訊,透過計算出模擬內容資訊的邊緣權重及一曝光量分流後,修正各待測內容資訊的邊緣權重及預測曝光量,由於模擬內容資訊可模擬裝置未搜尋到的內容,因此本發明進行曝光量預測時,可貼近現實網頁搜尋環境,使待測內容資訊的預測曝光量和邊緣權重可以更加接近實際的曝光量,又,內容點擊數預測裝置可依據搜尋結果,取得各待測內容資訊的一平均排名,內容點擊數預測裝置可依據平均排名估算出一預測排名範圍,再依據預測排名範圍計算出一點擊率期望值,最後,依據預測曝光量與點擊率期望值計算出一內容點擊數,據此,本發明實施後可產生以下功效: (1)  透過建立模擬內容資訊計算出曝光量分流,以修正待測內容資訊的預測曝光量,藉此符合現實環境之搜尋結果; (2)  利用各待測內容資訊的排名位置,作為點擊率預測的主要依據,如此即使非搜尋引擎大廠(如Google、 Bing)也能夠建立在搜尋引擎大廠的結果上做預測; (3)  透過推估出預測排名範圍,可計算出點擊率的期望值,使計算出的內容點擊數可逼近待測內容真實的點擊數; (4)  本發明於搜尋任務取得有限的平均排名,即可推估出逼近真實狀況的點擊數,可大幅降低系統的運算負擔,並且大幅縮短預測點擊數的處理時間。
為使 貴審查委員得以清楚了解本發明之目的、技術特徵及其實施後之功效,茲以下列說明搭配圖示進行說明,敬請參閱。
請參閱「第1圖」,圖中所示為本發明之組成示意圖(一),如圖,本發明之內容點擊數預測裝置10實施時,其係資訊連接於至少一業主端裝置11和至少一第三方分析端12;所述的內容點擊數預測裝置10可基於關鍵字清單資訊執行一搜尋任務,取得包含有至少一待測內容資訊的搜尋結果資訊,並依據搜尋結果資訊建立一曝光量預測模型,其中,所述的關鍵字清單資訊包含有至少一關鍵字,此外,內容點擊數預測裝置10更進一步於曝光量預測模型中加入一模擬內容資訊,使模擬內容資訊可加入各筆待測內容資訊之曝光量預測環境之中,當內容點擊數預測裝置10計算出模擬內容資訊的邊緣權重和預測曝光量分流後,即可依據模擬內容資訊分散出的邊緣權重及曝光量分流,再修正各待測內容資訊的邊緣權重及預測曝光量,其中,由於模擬內容資訊被定義為內容點擊數預測裝置10未能搜尋到的內容,透過計算模擬內容資訊之預估曝光量分流,進而模擬出符合現實網頁搜尋環境的預測曝光量,再者,內容點擊數預測裝置10於搜尋任務中,更可以取得各待測內容資訊的一平均排名,內容點擊數預測裝置10可依據平均排名,推估出一預測排名範圍,並以預測排名範圍計算出期望的一點擊率,使內容點擊數預測裝置10可以點擊率期望值 (排名範圍內各採樣點的點擊率)與預測曝光量計算出一內容點擊數;所述的業主端裝置11可建立及傳送待測內容資訊,所述的待測內容資訊可以為含有文字的一網頁內容資訊,例如,一廣告資訊、一文章資訊、一網站資訊或一廣告排名資訊,但不以此為限;所述的第三方分析端12可向內容點擊數預測裝置10提供數據,以便內容點擊數預測裝置10進行分析,第三方分析端12可包含一關鍵字分析裝置121和一內容排名分析裝置122,所述的關鍵字分析裝置121可提供一關鍵字預測曝光量,其可以為Google Analytics,再者,所述的關鍵字預測曝光量為關鍵字分析裝置121預測未來一段時間,指定關鍵字於搜尋結果頁(Search Engine Results Page, SERP)的曝光量,關鍵字分析裝置121可將各筆關鍵字、及相關聯的關鍵字預測曝光量匯入於關鍵字清單資訊,以供內容點擊數預測裝置10分析,所述的內容排名分析裝置122可提供一內容排名資訊,所述的內容排名資訊主要包含多筆內容中,搜尋排名與點擊率關係之資訊,但不以此為限;其中,關鍵字分析裝置121和內容排名分析裝置122可由不同服務業者提供,並不以此為限,特先陳明。
請再參閱「第2圖」,圖中所示為本發明之組成示意圖(二),如圖,本發明之內容點擊數預測裝置10,其包含有一運算處理模組101,另有一模型處理模組102、一內容模擬模組103、一資料搜索模組104、一曝光量計算模組105、一資料儲存模組106和一點擊數計算模組107與運算處理模組101完成資訊連接; (1)  所述的運算處理模組101供以運行內容點擊數預測裝置10、及驅動上述各模組,並具備邏輯運算、暫存運算結果、保存執行指令位置等功能,其可以為一中央處理器(Central Processing Unit, CPU)或一微控制器(Microcontroller Unit, MCU); (2)  所述的模型處理模組102,可擷取待測內容資訊和關鍵字清單資訊,依據搜尋任務之一搜尋結果資訊建立曝光量預測模型,其中,模型處理模組102可比對待測內容資訊,判斷待測內容資訊與哪些關鍵字相對應,且所述的曝光量預測模型可以二分化圖表實現,又,模型處理模組102可對已斷詞之關鍵字進行分析處理,其中,模型處理模組102針對關鍵字清單資訊進行斷詞後,計算關鍵字所包含的詞彙數,又,資料搜索模組104蒐集第三方搜尋引擎斷詞後之搜尋待側內容與排名資訊後,再與模型處理模組102針對不同詞彙數所建立的點擊率預測模型進行計算;模型處理模組102可依據內容排名資訊以及不同廣告關鍵字所包含的詞彙數建立點擊率預測模型,並且可對點擊率預測模型進行雙對數座標圖轉換(Log-Log Linear Interpolation)之處理,所述的搜尋排名與點擊率資訊,提供有搜尋引擎一段時間各內容(廣告或文案)於搜尋結果頁的排名位置,以及與排名位置相對應的預測點擊率,所述之詞彙數主要為針對關鍵字清單斷詞後,關鍵字所包含之單詞、雙詞、三詞、四詞或四詞以上之詞彙數; (3)  所述的內容模擬模組103,可於曝光量預測模型增加模擬內容資訊,其中,模擬內容資訊被定義為內容點擊數預測裝置10未能搜尋到的內容,其中,模擬內容資訊可對應關鍵字清單資訊中全部各筆關鍵字,內容點擊數預測裝置10透過內容模擬模組103建立模擬內容資訊,使得內容點擊數預測裝置10可進一步估算出模擬內容資訊之曝光量分流,據此,透過將模擬內容資訊加入曝光量預測模型,即可使曝光量預測模型可以模擬出真實的搜尋環境,在模擬環境下,曝光量預測模型可以考慮模擬內容資訊之曝光量分流,使估算出的曝光量結果更加精確; (4)  所述的資料搜索模組104,資訊連接於至少一第三方搜尋引擎,資料搜索模組104可執行網路爬蟲程式(web crawler),以關鍵字清單資訊中各筆關鍵字作為搜尋條件,於第三方搜尋引擎搜尋的搜尋結果頁,確認關鍵字清單資訊中各筆關鍵字的搜尋狀況,並依據搜尋結果產生包含有各待測內容資訊關聯的一搜尋結果資訊,其中,所述的搜尋結果資訊包含一搜尋成功次數、及一待測內容排名位置,所述的搜尋成功次數指內容點擊數預測裝置10於一段時間內,透過爬蟲應用程式以各關鍵字搜尋於搜尋結果頁,有搜查到各待測內容資訊的成功次數,其中,本實施例中並不侷限於待測內容資訊,亦包含其他內容(廣告或文案內容),若搜尋不到任何內容則為搜尋失敗次數,即搜尋到模擬內容資訊的次數,所述的第三方搜尋引擎可供內容點擊數預測裝置10進行網頁搜尋,其可以為百度、Google、Alexa Internet、Yahoo Search、Bing,又,所述的待測內容排名位置為各內容(廣告或文案)於搜尋結果頁上的排序位置,又,資料搜索模組104可對已斷詞之關鍵字進行蒐集,其中,關鍵字之斷詞方式主要由第三方搜尋引擎進行斷詞,但不以此為限; (5)  所述的曝光量計算模組105,可依據搜尋結果資訊,計算各待測內容資訊的邊緣權重(edge weight),並以關鍵字預測曝光量和邊緣權重,計算出各待測內容資訊的一預測曝光量,例如,關鍵字預測曝光量為1000,第一關鍵字對第一待測內容的邊緣權重為0.2、第二關鍵字對第一待測內容的邊緣權重為0.3,則第一關鍵字對第一待測內容的曝光量為1000*0.2=200、第二關鍵字對第一待測內容的曝光量為1000*0.3=300,因此,第一待測內容的預測曝光量為500,又,曝光量計算模組105可計算出模擬內容資訊的邊緣權重和曝光量分流; (6)  所述的資料儲存模組106,可供以儲存電子資訊,其可以為硬碟,又,資料儲存模組106包含有一模型資料庫1061、一關鍵字資料庫1062、及一搜尋資料庫1063;所述的模型資料庫1061可供儲存曝光量預測模型;所述的關鍵字資料庫1062可供儲存關鍵字清單資訊,其中,使用者可於關鍵字資料庫1062增加或刪減關鍵字清單資訊內的關鍵字,編輯完成後即儲存於關鍵字資料庫1062;所述的搜尋資料庫1063可供儲存包含有待測內容資訊的搜尋結果資訊,其中,搜尋結果資訊可以電子表單格式儲存,當資料搜索模組104完成搜尋任務後,即可更新搜尋結果資訊,其中,搜尋結果資訊包含有至少一筆搜尋排名與待測內容; (7)  所述的點擊數計算模組107,可以各待測內容資訊的預測曝光數與預測點擊率期望值計算出一內容點擊數,其中,點擊數計算模組107主要透過計算出各待測內容排名位置的一平均排名,其中,點擊數計算模組107可對平均排名進行邊際誤差(Margin of Error)處理,以逼近真實內容的點擊率;點擊數計算模組107依據平均排名估算出一預測排名範圍,再依據預測排名範圍計算出一點擊率期望值,最後,依據預測曝光量與點擊率期望值計算出內容點擊數。
請參閱「第3圖」,圖中所示為本發明之實施流程圖,並請搭配參閱「第1圖」~「第2圖」,如圖: (1)  一依據關鍵字清單資訊進行搜尋任務S1:請搭配參閱「第4圖」,圖中所示為本發明之實施示意圖(一),如圖,內容點擊數預測裝置10基於關鍵字清單資訊建立及執行一搜尋任務,其中,搜尋任務執行時,內容點擊數預測裝置10以關鍵字清單資訊中第一關鍵字KW1、第二關鍵字KW2作為搜尋條件於搜尋引擎進行搜尋,產生以各筆關鍵字(KW1、KW2)搜尋到包含有至少一待測內容資訊(AD1~AD4)的一搜尋結果資訊; (2)  一建立曝光量預測模型S2:內容點擊數預測裝置10基於搜尋結果資訊建立一曝光量預測模型,並且,內容點擊數預測裝置10依據該曝光量預測模型,分析關鍵字清單資訊中各關鍵字與各待測內容資訊(AD1~AD4); (3)  一計算待測內容資訊的邊緣權重S3:當內容點擊數預測裝置10建立曝光量預測模型後,內容點擊數預測裝置10依據該曝光量預測模型,分析紀錄有各關鍵字(KW1~KW2)與各待測內容資訊(AD1~AD4)的搜尋結果資訊,依據搜尋結果資訊計算出各筆關鍵字(KW1~KW2)對相關聯的各待測內容資訊(AD1~AD4)的邊緣權重(edge weight),其中,各待測內容資訊的邊緣權重為各待測內容資訊(AD1~AD4),被關鍵字搜尋到的次數(即搜尋成功次數); (4)  一加入模擬內容資訊及計算邊緣權重S4:請搭配參閱「第5圖」,圖中所示為本發明之實施示意圖(二),如圖,當內容點擊數預測裝置10分別計算出各待測內容資訊(AD1~AD4)的邊緣權重(edge weight)後,內容點擊數預測裝置10將一模擬內容資訊GN加入於曝光量預測模型,內容點擊數預測裝置10可計算出模擬內容資訊GN與關鍵字清單資訊中全部關鍵字的邊緣權重,由於模擬內容資訊GN被定義為內容點擊數預測裝置10未搜尋到的內容,因此,內容點擊數預測裝置10不會對模擬內容資訊GN進行搜尋,內容點擊數預測裝置10可以公式1估算出模擬內容資訊GN的邊緣權重,其中,公式1以負二項分佈計算,公式1如下:
Figure 02_image001
(公式1) 其中,依據公式1的期望值解析後得到k=
Figure 02_image003
P為各待測內容資訊單次成功搜尋到的機率。 n為各待測內容資訊搜尋成功次數。 k為模擬內容資訊的搜尋成功次數。 (5)  一計算各待測內容資訊的預測曝光量S5:內容點擊數預測裝置10取得模擬內容資訊GN的邊緣權重後,內容點擊數預測裝置10依據各待測內容資訊(AD1~AD4)的邊緣權重與模擬內容資訊GN邊緣權重的比例關係,重新修正各待測內容資訊(AD1~AD4)的邊緣權重,內容點擊數預測裝置10再計算模擬內容資訊GN的一曝光量分流,和各待測內容資訊(AD1~AD4)的一預測曝光量,即預測曝光量(曝光量分流)=關鍵字預測曝光量*邊緣權重,其中,內容點擊數預測裝置10係以一關鍵字預測曝光量依據邊緣權重的比例分配流量,又,由於模擬內容資訊GN的曝光量分流會進一步分散待測內容資訊(AD1~AD4)的預測曝光量,即可模擬出現實搜尋環境中,可能分散各待測內容資訊(AD1~AD4)預測曝光量的曝光量分流,使預測的預測曝光量更加精確; (6)  一計算各待測內容資訊的平均排名S6:內容點擊數預測裝置10從搜尋結果資訊中分別擷取各待測內容資訊(AD1~AD4)的至少一待測內容排名位置,其中,內容點擊數預測裝置10可對各待測內容排名位置計算出一平均排名,例如,資料搜索模組104以指定的搜尋頻率,以關鍵字「台灣視訊」共搜尋到待測內容資訊7次,分別為[2/7、1/7、1/4、1/5、2/3、2/6、1/6],其中以”2/7”為例,2代表於搜尋結果頁的排名位置、7為搜尋結果頁上共搜尋到7筆內容,因此,平均這7次搜尋任務的平均排名即為1.42857; (7)  一計算內容點擊數S7:請搭配參閱「第6圖」,如圖,當內容點擊數預測裝置10計算出各待測內容資訊(AD1~AD4)的平均排名後,基於各待測內容資訊(AD1~AD4)的平均排名計算出一預測排名範圍,以各待測內容資訊(AD1~AD4)的預測排名範圍及一點擊率預測模型,計算出相對應的一點擊率期望值,內容點擊數預測裝置10再基於各待測內容資訊(AD1~AD4)的預測曝光量與點擊率期望值計算出一內容點擊數,其中,內容點擊數=預測曝光量*點擊率期望值。
承步驟「計算各待測內容資訊的平均排名S6」,當內容點擊數預測裝置10計算出各待測內容資訊(AD1~AD4)的平均排名後,點擊數計算模組107可進一步對平均排名進行邊際誤差(Margin of Error)處理,即可取得所述的預測排名範圍,其中,邊際誤差公式可例如為: T C(dof)*s/
Figure 02_image005
其中,dof=n-1 T C(dof)為T分布,可依照不同的自由度(dof)生成不同的T分布,並可依不同需求設定信賴水準(Confidence Level),較佳為95% s為單一次任務搜尋結果的排名標準差
Figure 02_image005
為搜尋成功次數 再將邊際誤差加入於平均排名得到信賴區間(Confidence Interval),即預測排名範圍為: 平均排名
Figure 02_image007
T C(dof)*s/
Figure 02_image005
據此,本實施例中,即便待測內容排名位置的搜尋次數較少,點擊數計算模組107經過邊際誤差(Margin of Error)之處理,亦可取得出預測排名範圍,以逼近實際的排名情況;例如,待測內容資訊共進行7次搜尋,搜尋結果分別為[2/7、1/7、1/4、1/5、2/3、2/6、1/6] 預測排名範圍(即設定信賴區間為95%)為: 1.42857
Figure 02_image007
2.4469*(0.4948)
Figure 02_image009
其中,Tc(6)=2.4469 計算結果,最小排名為0.97、最大排名為1.88,須注意的是最小排名應不低於1,因此,最小排名0.97應取1。
點擊數計算模組107取得預測排名範圍(信賴區間)後,計算出點擊率預測範圍時,點擊數計算模組107可以搭配預測排名範圍計算點擊率的期望值,計算點擊率的期望值的公式為:
Figure 02_image011
P(
Figure 02_image013
)為排名為
Figure 02_image013
的機率
Figure 02_image015
為排名為
Figure 02_image013
的點擊率
Figure 02_image017
為點擊率的期望值
Figure 02_image019
為排名範圍內採樣數量,可依據需求設定。
承步驟「計算內容點擊數S7」,內容點擊數預測裝置10接收內容排名資訊建立點擊率預測模型時,由於內容排名資訊中搜尋排名和點擊率為離散數據分布(例如每0.1排名一個區間),因此,模型處理模組102可進一步對內容排名資訊進行雙對數坐標線性內插法(Log-Log Linear Interpolation),使點擊率預測模型中的搜尋排名和點擊率可以模擬出連續的數值,再針對各已斷詞之關鍵字包含的詞彙數量(為關鍵字所包含的詞彙數,例如:詞彙數為單詞、雙詞、三詞、四詞或四詞以上)模擬不同連續線性數值,以便點擊數計算模組107進行後續的數值計算及比對。
請參閱「第6圖」,圖中所示為本發明之實施示意圖(三),資料搜索模組104執行搜尋任務時,可針對由第三方搜尋引擎,已斷詞之關鍵字進行蒐集作業,例如,搜尋任務「台灣熱門視訊實況」搜尋時,第三方搜尋引擎將斷詞切割成四個詞彙「台灣、熱門、視訊、實況」,模型處理模組102可依據第三方搜尋引擎與系統內部斷詞的結果建立點擊率預測模型M時,可依據不同關鍵字所包含的詞彙數產生模型,再對其產生模型進行雙對數坐標線性內插法(Log-Log Linear Interpolation),使點擊率預測模型中的搜尋排名和點擊率可以模擬出連續的數值,如圖中所示「台灣、熱門、視訊、實況」即可對應於模型中a4kw_ctr線段(詞彙數為四詞或四詞以上),又,例如搜尋任務為「視訊實況」,則後續如圖則對應於模型中a2kw_ctr線段(詞彙數為雙詞),以上實例僅為舉例,並不以此為限。
綜上可知,本發明之內容點擊數預測裝置及其方法,其中,內容點擊數預測裝置可基於一關鍵字清單資訊建立包含有至少一待測內容資訊的一曝光量預測模型,並且於曝光量預測模型中加入一模擬內容資訊,透過計算出模擬內容資訊對至少一關鍵字的至少一曝光量分流,以計算各待測內容資訊的一預測曝光量,又,內容點擊數預測裝置基於各待測內容資訊的一平均排名計算出一預測排名範圍,再依據預測排名範圍計算出一點擊率期望值,最後,依據預測曝光量與點擊率期望值計算出一內容點擊數;依此,本發明據以實施後,確實可達到提供一種可依據待測內容排名位置推估出點擊率期望值,以計算出逼近現實點擊數的內容點擊數預測裝置及其方法之目的。
以上所述者,僅為本發明之較佳之實施例而已,並非用以限定本發明實施之範圍;任何熟習此技藝者,在不脫離本發明之精神與範圍下所作之均等變化與修飾,皆應涵蓋於本發明之專利範圍內。
綜上所述,本發明係具有「產業利用性」、「新穎性」與「進步性」等專利要件;申請人爰依專利法之規定,向 鈞局提起發明專利之申請。
10:內容點擊數預測裝置 11:業主端裝置 101:運算處理模組 12:第三方分析端 102:模型處理模組 121:關鍵字分析裝置 103:內容模擬模組 122:內容排名分析裝置 104:資料搜索模組 105:曝光量計算模組 106:資料儲存模組 1061:模型資料庫 1062:關鍵字資料庫 1063:搜尋資料庫 107:點擊數計算模組 AD1:第一待測內容資訊 KW1:第一關鍵字 AD2:第二待測內容資訊 KW2:第二關鍵字 AD3:第三待測內容資訊 AD4:第四待測內容資訊 GN:模擬內容資訊 M:點擊率預測模型 S1:依據關鍵字清單資訊進行搜尋任務 S2:建立曝光量預測模型 S3:計算待測內容資訊的邊緣權重 S4:加入模擬內容資訊及計算邊緣權重 S5:計算各待測內容資訊的預測曝光量 S6:計算各待測內容資訊的平均排名 S7:計算內容點擊數
第1圖,為本發明之組成示意圖(一)。 第2圖,為本發明之組成示意圖(二)。 第3圖,為本發明之實施流程圖。 第4圖,為本發明之實施示意圖(一)。 第5圖,為本發明之實施示意圖(二)。 第6圖,為本發明之實施示意圖(三)。
S1:依據關鍵字清單資訊進行搜尋任務
S2:建立曝光量預測模型
S3:計算待測內容資訊的邊緣權重
S4:加入模擬內容資訊及計算邊緣權重
S5:計算各待測內容資訊的預測曝光量
S6:計算各待測內容資訊的平均排名
S7:計算內容點擊數

Claims (6)

  1. 一種內容點擊數預測方法,透過一內容點擊數預測裝置預測至少一待測內容資訊的一內容點擊數,其包含:該內容點擊數預測裝置基於一關鍵字清單執行一搜尋任務,並取得一搜尋結果資訊;該內容點擊數預測裝置基於該搜尋結果資訊,擷取各該待測內容資訊的一待測內容排名位置,依據各該待測內容排名位置計算出一平均排名;該內容點擊數預測裝置基於各該平均排名,經由邊際誤差處理計算出一預測排名範圍,並以各該預測排名範圍及一點擊率預測模型計算出一點擊率期望值;該內容點擊數預測裝置分別以各該待測內容資訊的一預測曝光量與該點擊率期望值計算出該內容點擊數;該內容點擊數預測裝置基於一曝光量預測模型,分別計算出各該待測內容資訊的該預測曝光量;以及該內容點擊數預測裝置於該曝光量預測模型加入一模擬內容資訊,計算各該待測內容資訊的一曝光量分流,以修正各該待測內容資訊的各該預測曝光量。
  2. 如請求項1所述的內容點擊數預測方法,其中,該內容點擊數預測裝置執行該搜尋任務時,該搜尋結果資訊 更包含一第三方搜尋引擎針對該關鍵字清單進行斷詞,並針對斷詞結果搜尋之資訊。
  3. 如請求項1所述的內容點擊數預測方法,其中,該內容點擊數預測裝置接收各該內容排名資訊建立該點擊率預測模型時,該內容點擊數預測裝置對各該內容排名資訊進行雙對數坐標線性內插法。
  4. 一種內容點擊數預測裝置,供以預測一待測內容資訊的一內容點擊數,其包含:一運算處理模組,供以運行該內容點擊數預測裝置;一資料搜索模組,與該運算處理模組完成資訊連接,該資料搜索模組透過執行一搜尋任務產生一搜尋結果資訊,從該搜尋結果資訊分別擷取各該待測內容資訊的至少一待測內容排名位置;一模型處理模組,與該運算處理模組完成資訊連接,該模型處理模組擷取一內容排名資訊經由邊際誤差處理以建立一點擊率預測模型;一點擊數計算模組,與該運算處理模組完成資訊連接,該點擊數計算模組以各該待測內容資訊的一平均排名,計算出一預測排名範圍,以各該預測排名範圍與該點擊率預測模型,計算各該待測內容資訊的一點擊率期望值,再基於各該待測內容資訊的一預測曝光量,與該點擊率期望值計算出該內容點擊數;以及 該點擊數計算模組基於一曝光量預測模型,分別計算出各該待測內容資訊的該預測曝光量,並於該曝光量預測模型加入一模擬內容資訊,計算各該待測內容資訊的一曝光量分流,以修正各該待測內容資訊的各該預測曝光量。
  5. 如請求項4所述的內容點擊數預測裝置,其中,該模型處理模組接收各該內容排名資訊建立該點擊率預測模型時,該模型處理模組對各該內容排名資訊進行雙對數坐標線性內插法。
  6. 如請求項4所述的內容點擊數預測裝置,其中,該資料搜索模組執行該搜尋任務時,該資料搜索模組更可擷取一第三方搜尋引擎針對一關鍵字清單進行斷詞,並針對斷詞結果搜尋之資訊。
TW109142912A 2020-12-04 2020-12-04 內容點擊數預測裝置及其方法 TWI756967B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW109142912A TWI756967B (zh) 2020-12-04 2020-12-04 內容點擊數預測裝置及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW109142912A TWI756967B (zh) 2020-12-04 2020-12-04 內容點擊數預測裝置及其方法

Publications (2)

Publication Number Publication Date
TWI756967B true TWI756967B (zh) 2022-03-01
TW202223771A TW202223771A (zh) 2022-06-16

Family

ID=81710918

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109142912A TWI756967B (zh) 2020-12-04 2020-12-04 內容點擊數預測裝置及其方法

Country Status (1)

Country Link
TW (1) TWI756967B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWM530993U (zh) * 2016-04-28 2016-10-21 冠麗數位資訊股份有限公司 雲端廣告系統
CN106204099A (zh) * 2016-06-23 2016-12-07 广州筷子信息科技有限公司 基于元素级别的广告创意有效性分析方法及装置
WO2017121258A1 (zh) * 2016-01-12 2017-07-20 腾讯科技(深圳)有限公司 信息投放方法、装置、服务器和存储介质
CN109154944A (zh) * 2016-04-29 2019-01-04 微软技术许可有限责任公司 集合预测器
CN109635034A (zh) * 2018-11-08 2019-04-16 北京字节跳动网络技术有限公司 训练数据重采样方法、装置、存储介质及电子设备
TWM612107U (zh) * 2020-12-04 2021-05-21 萬里雲互聯網路有限公司 內容點擊數預測系統

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017121258A1 (zh) * 2016-01-12 2017-07-20 腾讯科技(深圳)有限公司 信息投放方法、装置、服务器和存储介质
TWM530993U (zh) * 2016-04-28 2016-10-21 冠麗數位資訊股份有限公司 雲端廣告系統
CN109154944A (zh) * 2016-04-29 2019-01-04 微软技术许可有限责任公司 集合预测器
CN106204099A (zh) * 2016-06-23 2016-12-07 广州筷子信息科技有限公司 基于元素级别的广告创意有效性分析方法及装置
CN109635034A (zh) * 2018-11-08 2019-04-16 北京字节跳动网络技术有限公司 训练数据重采样方法、装置、存储介质及电子设备
TWM612107U (zh) * 2020-12-04 2021-05-21 萬里雲互聯網路有限公司 內容點擊數預測系統

Also Published As

Publication number Publication date
TW202223771A (zh) 2022-06-16

Similar Documents

Publication Publication Date Title
CN107609152B (zh) 用于扩展查询式的方法和装置
TWI591556B (zh) Search engine results sorting method and system
CN107862022B (zh) 文化资源推荐***
JP2015537259A (ja) クリックスルー率に基づく検索結果の順位付け
US11429653B2 (en) Generating estimated trait-intersection counts utilizing semantic-trait embeddings and machine learning
CN106251174A (zh) 信息推荐方法及装置
US20110119267A1 (en) Method and system for processing web activity data
JP5543020B2 (ja) リサーチミッション識別
CN107424043A (zh) 一种产品推荐方法及装置,电子设备
JP2021166109A (ja) 融合順序付けモデルの訓練方法と装置、検索の順序付け方法と装置、電子デバイス、記憶媒体、及びプログラム
US20150242447A1 (en) Identifying effective crowdsource contributors and high quality contributions
WO2018090545A1 (zh) 融合时间因素的协同过滤方法、装置、服务器和存储介质
EP2407897A1 (en) Device for determining internet activity
US8504558B2 (en) Framework to evaluate content display policies
US9286379B2 (en) Document quality measurement
EP2960849A1 (en) Method and system for recommending an item to a user
US10346453B2 (en) Multi-tiered information retrieval training
US20180247247A1 (en) Method and system for search provider selection based on performance scores with respect to each search query
CA3062119A1 (en) Method and device for setting sample weight, and electronic apparatus
EP3639163A1 (en) Systems and methods for optimizing and simulating webpage ranking and traffic
WO2020135059A1 (zh) 搜索引擎评测方法、装置、设备以及可读存储介质
CN112487283A (zh) 训练模型的方法、装置、电子设备及可读存储介质
CN110543474A (zh) 一种基于全埋点与潜在因子模型的用户行为分析方法和装置
Gezici et al. Neural sentiment analysis of user reviews to predict user ratings
TWM612107U (zh) 內容點擊數預測系統