TWI508011B - Category information providing method and device - Google Patents

Category information providing method and device Download PDF

Info

Publication number
TWI508011B
TWI508011B TW100104746A TW100104746A TWI508011B TW I508011 B TWI508011 B TW I508011B TW 100104746 A TW100104746 A TW 100104746A TW 100104746 A TW100104746 A TW 100104746A TW I508011 B TWI508011 B TW I508011B
Authority
TW
Taiwan
Prior art keywords
unit
keyword
category information
search keyword
search
Prior art date
Application number
TW100104746A
Other languages
English (en)
Other versions
TW201220233A (en
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of TW201220233A publication Critical patent/TW201220233A/zh
Application granted granted Critical
Publication of TWI508011B publication Critical patent/TWI508011B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

類目資訊提供方法及裝置
本發明關於資訊處理技術領域,尤其關於一種類目資訊提供方法及裝置。
電子商務網站為用戶提供了能夠在網上實現交易的商品的商品資訊,用戶利用電子商務網站的資金結算系統來購買商品,電子商務網站通過物流配送系統將用戶購買的商品配送給用戶,這極大提高了用戶購物的便利性。
用戶通過輸入搜尋關鍵字以檢索電子商務網站上相關商品,電子商務網站根據用戶輸入的關鍵字輸出相關商品頁面鏈結,並為其推薦合理的類目,以便於用戶在選擇的類目所包含的商品中順利找到自己需要的商品,這避免了用戶盲目和繁瑣的搜尋過程。
習知技術中,為用戶提供類目資訊可以通過即時查詢的方式實現,如圖1所示,其具體處理過程如下:
步驟11,接收用戶輸入的關鍵字,例如用戶輸入的關鍵字為“純色帽子”;
步驟12,在所有商品的商品標識中,查找包含該關鍵字的商品標識;假設一共查找到包含“純色帽子”的商品標識有508個;
步驟13,確定查找到的各商品標識分別對應的類目資訊,若查找到的508個商品標識分別對應的類目資訊為“帽子”或“女裝”,則確定出的類目資訊為“帽子”和“女裝”;
步驟14,針對確定出的每個類目資訊,在查找到的商品標識中,確定與該類目資訊對應的商品標識的個數;假設查找到的508個商品標識中,有192個商品標識對應的類目資訊均為“帽子”,有316個商品標識對應的類目資訊均為“女裝”,因此,針對類目資訊“帽子”確定出的個數為192個,針對類目資訊“女裝”確定出的個數為316個;
步驟15,將確定出的每個類目資訊和針對該類目資訊確定出的個數對應提供給該用戶;例如將“帽子(192)”和“女裝(316)”提供給該用戶。
但是,在上述方法中,電子商務網站需要根據用戶輸入的關鍵字即時地進行商品標識檢索和類目資訊的確定,這將耗費較多的處理資源,並且處理效率比較低。
針對上述問題,習知技術提出了查詢詞表的方式,如圖2所示,其具體處理過程如下:
步驟21,當用戶點擊搜尋結果列表中的商品鏈結時,將用戶輸入的當前關鍵字和該商品的類目資訊進行對應儲存;
步驟22,對儲存的關鍵字和類目資訊進行簡單匯總,確定出規定時間段內搜尋次數大於規定臨限值的關鍵字;例如,確定出一周內搜尋次數大於30次的關鍵字;
步驟23,由確定出的各關鍵字和類目資訊的對應關係組成查詢詞表,其中每個關鍵字和至少一個類目資訊對應;
步驟24,後續用戶輸入關鍵字搜尋商品時,根據用戶輸入的關鍵字,在儲存的查詢詞表中查找與用戶輸入的關鍵字對應的類目資訊;
步驟25,將查找到的類目資訊提供給用戶。
由上可見,基於查詢詞表的方式為用戶提供類目資訊時,查詢詞表中只儲存了用戶搜尋頻率較高的關鍵字和類目資訊的對應關係,習知技術中,用戶搜尋頻率較低的關鍵字稱為低頻搜尋關鍵字,也可以稱為長尾關鍵字,由於查詢詞表中並沒有儲存長尾關鍵字以及對應的類目資訊,因此當用戶輸入的關鍵字為長尾關鍵字時,難以為用戶提供對應的類目資訊。
本發明實施例提供一種類目資訊提供方法及裝置,用以解決習知技術中存在的無法為用戶提供長尾關鍵字的類目資訊的問題。
本發明實施例技術方案如下:
一種類目資訊提供方法,該方法包括步驟:獲得規定時間段內輸入的各搜尋關鍵字和各搜尋關鍵字對應的類目資訊;將獲得的每個搜尋關鍵字,劃分為各搜尋關鍵字單元;分別將針對每個搜尋關鍵字劃分出的各搜尋關鍵字單元,組合為各階搜尋關鍵字單元組;根據獲得的各搜尋關鍵字對應的類目資訊,分別確定組合出的各搜尋關鍵字單元組對應的類目資訊;根據確定出的類目資訊,建立各階搜尋關鍵字表,每階搜尋關鍵字表中包含各該階搜尋關鍵字單元組與類目資訊的對應關係;根據輸入的當前關鍵字,在建立的各階搜尋關鍵字表中,確定選擇出的當前關鍵字單元所對應的類目資訊,並返回確定出的類目資訊。
一種類目資訊提供裝置,包括:搜尋關鍵字獲得單元,用於獲得規定時間段內輸入的各搜尋關鍵字和各搜尋關鍵字對應的類目資訊;搜尋關鍵字劃分單元,用於將搜尋關鍵字獲得單元獲得的每個搜尋關鍵字,劃分為各搜尋關鍵字單元;搜尋關鍵字單元組合單元,用於分別將搜尋關鍵字劃分單元針對每個搜尋關鍵字劃分出的各搜尋關鍵字單元,組合為各階搜尋關鍵字單元組;第一類目資訊確定單元,用於根據搜尋關鍵字獲得單元獲得的各搜尋關鍵字對應的類目資訊,分別確定搜尋關鍵字單元組合單元組合出的各搜尋關鍵字單元組對應的類目資訊;搜尋關鍵字表建立單元,用於根據第一類目資訊確定單元確定出的類目資訊,建立各階搜尋關鍵字表,每階搜尋關鍵字表中包含各該階搜尋關鍵字單元組與類目資訊的對應關係;第二類目資訊確定單元,用於根據輸入的當前關鍵字,在搜尋關鍵字表建立單元建立的各階搜尋關鍵字表中,確定選擇出的當前關鍵字單元所對應的類目資訊;第一類目資訊返回單元,用於返回第二類目資訊確定單元確定出的類目資訊。
本發明實施例技術方案中,將規定時間段內輸入的每個搜尋關鍵字劃分為各搜尋關鍵字單元,分別將針對每個搜尋關鍵字劃分出的各搜尋關鍵字單元,組合為各階搜尋關鍵字單元組,確定組合出的各搜尋關鍵字單元組對應的類目資訊,根據確定出的類目資訊,建立各階搜尋關鍵字表,根據輸入的當前關鍵字,在建立的各階搜尋關鍵字表中,確定選擇出的當前關鍵字單元所對應的類目資訊,並返回確定出的類目資訊,由上可見,本發明實施例技術方案預先建立了包含各階搜尋關鍵字表,後續可以直接根據建立的搜尋關鍵字表查詢當前關鍵字對應的類目資訊,解決了習知技術無法為用戶提供長尾關鍵字的類目資訊的問題,有效地提高了為用戶提供類目資訊的全面性和靈活性。
下面結合各個附圖對本發明實施例技術方案的主要實現原理、具體實施方式及其對應能夠達到的有益效果進行詳細地闡述。
實施例一
本發明實施例一提供了一種類目資訊提供方法,如圖3所示,其具體處理過程如下:
步驟31,獲得規定時間段內輸入的各搜尋關鍵字和各搜尋關鍵字對應的類目資訊;
用戶通過網頁流覽器輸入搜尋關鍵字後,網頁流覽器會為用戶提供一個搜尋結果列表,該搜尋結果列表中包含根據用戶輸入的搜尋關鍵字搜尋到的各個商品的鏈結,若用戶點擊了搜尋結果列表中的一個鏈結,則網頁流覽器將該用戶的此次點擊行為記錄在點擊日誌中倂發送給日誌伺服器,每個點擊日誌中包含用戶輸入的搜尋關鍵字、用戶點擊的商品對應的類目資訊以及用戶標識,由於用戶相當於電子商務網站的訪客,因此用戶標識也為訪客標識,點擊日誌的格式可以但不限於為下述:
其中,搜尋關鍵字也可以對應兩個以上的類目資訊,此時點擊日誌的格式可以但不限於為下述:
定時從日誌伺服器獲得點擊日誌,該定時的週期可以但不限於設置為一天、一周或一個月等,因此就能夠定時的獲得對應週期內的各搜尋關鍵字和各搜尋關鍵字對應的類目資訊。
此外,還可以使用上傳日誌來代替點擊日誌,上傳日誌中包含賣家上傳的商品標識、該商品的類目資訊以及該商家的標識,其中賣家上傳的商品標識可以被視為點擊日誌中的搜尋關鍵字,該商家的標識可以被視為點擊日誌中的訪客標識。
步驟32,將獲得的每個搜尋關鍵字,劃分為各搜尋關鍵字單元;
獲得點擊日誌後,對獲得的每個點擊日誌進行分析,首先將各點擊日誌中的搜尋關鍵字進行歸一化處理。例如去除不必要的詞、去除多餘空格、大小寫字母的轉換、全形半形的轉換、簡體繁體的轉換、去除標點符號、數位格式的轉換等,完成歸一化處理後,將每個搜尋關鍵字劃分為各搜尋關鍵字單元。其中劃分的方式可以但不限於基於統計的分詞演算法,使用語料庫來劃分搜尋關鍵字單元,將搜尋關鍵字與語料庫中的各個分詞進行匹配,將匹配出的各個分詞確認為劃分後的各搜尋關鍵字單元,例如,對獲得的搜尋關鍵字“純色長袖襯衫”進行劃分後,得到的各搜尋關鍵字單元分別為“純色”、“長袖”和“襯衫”。
本發明實施例一提出,在將每個搜尋關鍵字劃分為各個搜尋關鍵字單元後,可以對劃分的各搜尋關鍵字單元進行排序,得到排序後的搜尋關鍵字。其中可以但不限於按照拼音、筆劃等排序進行排序。排序的目的是減少最後形成的搜尋關鍵字表的規模以及建立搜尋關鍵字表的處理步驟。例如,針對搜尋關鍵字“長袖純色襯衫”和“長袖襯衫純色”進行搜尋關鍵字單元劃分後的結果均為:“長袖”、“純色”和“襯衫”,排序後的搜尋關鍵字均為“長袖^襯衫^純色”,後續只要針對排序後的搜尋關鍵字“長袖^襯衫^純色”進行處理即可。當然,針對每個搜尋關鍵字劃分出的各個搜尋關鍵字單元不進行排序處理的技術方案也在本發明的保護範圍內。
步驟33,分別將針對每個搜尋關鍵字劃分出的各搜尋關鍵字單元,組合為各階搜尋關鍵字單元組;
本發明實施例一提出,可以預先設置一個規定數目N,其中N1,建立1階至N階搜尋關鍵字表,對每個搜尋關鍵字進行關鍵字單元劃分時,假設劃分出的搜尋關鍵字單元的數目為P,若P>N,此時可以組合出1階至N階搜尋關鍵字單元組,若PN,此時只能組合出1階至P階搜尋關鍵字單元組。每階搜尋關鍵字單元組中包含的搜尋關鍵字單元的數目與階數相同。
下面分別介紹如何組合1階、2階、3階搜尋關鍵字單元組。
當組合1階搜尋關鍵字單元組時,在排序後的每個搜尋關鍵字中,直接將每個搜尋關鍵字單元作為組合後的一個1階搜尋關鍵字單元組。例如針對“長袖純色襯衫”和“長袖襯衫純色”劃分出的搜尋關鍵字單元均是“長袖”、“襯衫”和“純色”,也就是說對應的排序後的搜尋關鍵字均為“長袖^襯衫^純色”,則1階搜尋關鍵字單元組分別為“長袖”、“襯衫”和“純色”;
當組合2階搜尋關鍵字單元組時,在排序後的每個搜尋關鍵字中,將每兩個搜尋關鍵字單元組成一個2階搜尋關鍵字單元組,例如針對“長袖純色襯衫”和“長袖襯衫純色”劃分出的關鍵字單元均是“長袖”、“襯衫”和“純色”,也就是說對應的排序後的關鍵字均為“長袖^襯衫^純色”,將這三個搜尋關鍵字單元兩兩組合,得到三個2階搜尋關鍵字單元組,
當組合3階搜尋關鍵字單元組時,在排序後的每個搜尋關鍵字中,將每三個搜尋關鍵字單元組成一個3階搜尋關鍵字單元組,例如針對“長袖純色時尚襯衫”和“長袖襯衫純色時尚”劃分出的搜尋關鍵字單元均是“長袖”、“襯衫”、“時尚”和“純色”,也就是說對應的排序後的搜尋關鍵字均為“長袖^襯衫^純色^時尚”,在這四個搜尋關鍵字單元中,可以組合出四個3階搜尋關鍵字單元組。
當組合3階以上的搜尋關鍵字單元組時,組合的方式和上述方式一致,這裏不再贅述。
本發明實施例一還提出,在組合出各階搜尋關鍵字單元組後,還可以進一步對每個搜尋關鍵字單元組中的各搜尋關鍵字單元按照拼音或筆劃順序進行排序,得到排序後的搜尋關鍵字單元組,例如將排序後的搜尋關鍵字“長袖^襯衫^純色”中的各搜尋關鍵片語合為三個2階搜尋關鍵字單元組,進行排序後的搜尋關鍵字單元組分別為“長袖^襯衫”、“長袖^純色”和“襯衫^純色”,排序的目的是減少最後形成的搜尋關鍵字表的規模以及建立搜尋關鍵字表的處理步驟。例如,2階搜尋關鍵字單元組“長袖^襯衫”和“襯衫^長袖”進行排序後的2階搜尋關鍵字單元組均為“長袖^襯衫”,後續只要針對排序後的搜尋關鍵字單元組“長袖^襯衫”進行處理即可。當然,針對組合出的每個搜尋關鍵字單元組中的各搜尋關鍵字單元不進行排序處理的技術方案也在本發明的保護範圍內。
步驟34,根據獲得的各搜尋關鍵字對應的類目資訊,分別確定組合出的各搜尋關鍵字單元組對應的類目資訊;
當確定搜尋關鍵字單元組對應的類目資訊時,可以將該搜尋關鍵字單元組中的各搜尋關鍵字單元所屬的搜尋關鍵字對應的類目資訊,確定為該搜尋關鍵字單元組對應的類目資訊。例如2階搜尋關鍵字單元組“長袖^襯衫”所屬的搜尋關鍵字為“長袖純色襯衫”、“長袖襯衫純色”和“女士長袖襯衫”,其中“長袖純色襯衫”和“長袖襯衫純色”對應的類目資訊均為“時尚男裝”和“時尚女裝”,“女士長袖襯衫”對應的類目資訊為“時尚女裝”,如下表所示:
因此2階搜尋關鍵字單元組“長袖^襯衫”對應的類目資訊為“時尚男裝”和“時尚女裝”。
步驟35,根據確定出的類目資訊,建立各階搜尋關鍵字表,每階搜尋關鍵字表中包含各該階搜尋關鍵字單元組與類目資訊的對應關係;
若預先設置的規定數目為N,則建立1階至N階搜尋關鍵字表。
步驟36,分別確定劃分出的各搜尋關鍵字單元的重要度;
本發明實施例一提出,預先確定每個搜尋關鍵字單元的重要度,建立重要度表,後續將獲得的當前關鍵字劃分為各當前關鍵字單元後,直接在建立的重要度表中確定各當前關鍵字單元的重要度,其中每個搜尋關鍵字單元的重要度可以但不限於通過下述過程確定:
步驟A,根據獲得的各搜尋關鍵字對應的類目資訊,分別確定劃分出的各搜尋關鍵字單元對應的類目資訊。其中,每個搜尋關鍵字單元所屬的各搜尋關鍵字分別對應的類目資訊即為該搜尋關鍵字單元對應的類目資訊。例如,假設搜尋關鍵字單元“純色”所屬的搜尋關鍵字有兩個,分別為“純色帽子”和“純色長袖襯衫”,而搜尋關鍵字“純色帽子”對應的類目資訊為“時尚女裝”和“帽子”,搜尋關鍵字“純色長袖襯衫”對應的類目資訊為“時尚女裝”和“時尚男裝”,則搜尋關鍵字單元“純色”的類目資訊為“時尚女裝”、“帽子”和“時尚男裝”,如下表所示:
步驟B、根據各點擊日誌中的訪客標識,分別確定各搜尋關鍵字單元在對應的類目資訊中的獨立訪客(UV,Unique Visitor)的數量。其中,UV的數量指的是頁面展現按照訪客標識去重後的次數。每個搜尋關鍵字單元所屬的各搜尋關鍵字在各類目資訊下的UV的數量的和,即為該搜尋關鍵字單元在該類目資訊下的UV的數量。例如,假設“純色帽子”在“時尚女裝”這一類目資訊中的UV數量為205個,在“帽子”這一類目資訊中的UV的數量為300個,“純色長袖襯衫”在“時尚女裝”這一類目資訊中的UV數量為459個,在“時尚男裝”這一類目資訊中的UV的數量為902個,則搜尋關鍵字單元“純色”在“時尚女裝”這一類目資訊中的UV的數量為205+459=664個,在“帽子”這一類目資訊中的UV的數量為300個,在“時尚男裝”這一類目資訊中的UV的數量為902個。如下表所示:
本發明實施例一中,還可以按照預設規則,將針對每個搜尋關鍵字劃分出的各個搜尋關鍵字單元進行排序,得到各個排序後的搜尋關鍵字對應的類目資訊以及在對應的類目資訊中的UV的數量,然後再確定各個搜尋關鍵字單元在各類目資訊中的UV的數量。
步驟C,根據確定出的UV的數量,確定每個搜尋關鍵字單元在各類目資訊中的類目資訊熵;
可以但不限於通過如下方式確定各搜尋關鍵字單元在各類目資訊中的類目資訊熵:
其中,Hi 為搜尋關鍵字單元i的類目資訊熵;K為存在搜尋關鍵字單元i的UV的類目資訊的數量;P ij 為搜尋關鍵字單元i在第j個類目資訊中的UV數量;P i 為搜尋關鍵字單元i在所有類目資訊中的UV數量,也就是在各個類目資訊中的UV數量的和。
步驟D,根據確定出的類目資訊熵,確定每個搜尋關鍵字單元的重要度;
本發明實施例一中,重要度可以但不限於通過類目資訊熵的倒數確定,即搜尋關鍵字單元i的類目資訊熵為Hi ,重要度為Zi ,則此時。當然重要度和類目資訊熵之間的關係不局限於倒數關係,只要滿足類目資訊熵值與重要度呈負相關即可。
步驟37,根據確定出的重要度,建立包含各搜尋關鍵字單元與重要度的對應關係的重要度表;
在確定出各搜尋關鍵字單元的重要度後,可以將各搜尋關鍵字單元與確定出的重要度儲存在重要度表中。
本發明實施例一中,除了根據類目資訊熵來確定搜尋關鍵字單元的重要度外,還可以採用詞頻-逆向檔頻率(TF-IDF,Term Frequency-Inverse Document Frequency)的方法確定搜尋關鍵字單元的重要度,具體為:
首先,計算搜尋關鍵字單元的詞頻。即根據獲得的點擊日誌,確定出每個類目資訊所對應的搜尋關鍵字;將每個搜尋關鍵字劃分為各搜尋關鍵字單元;確定每個搜尋關鍵字單元在所有搜尋關鍵字單元中的詞頻;
其次,計算每個搜尋關鍵字單元的檔頻率;
再次,計算搜尋關鍵字單元的TF-IDF權重值,針對每個搜尋關鍵字單元,將計算出的詞頻除以檔頻率,得到該搜尋關鍵字單元的TF-IDF權重值;
最後,針對每個搜尋關鍵字單元,根據計算出的TF-IDF權重值,確定該搜尋關鍵字單元的重要度,其中TF-IDF權重值與重要度呈正相關,即TF-IDF權重值越大,則重要度越大,TF-IDF權重值越小,則重要度越小。
步驟38,獲得輸入的當前關鍵字後,將獲得的當前關鍵字劃分為各當前關鍵字單元;
用戶在需要搜尋商品資訊時,通過網頁流覽器輸入搜尋的當前關鍵字,對該當前關鍵字進行歸一化處理,完成歸一化處理後,首先在儲存各關鍵字和類目資訊的對應關係的查詢詞表中,查找獲得的當前關鍵字對應的類目資訊,若能夠查找到,則確認該當前關鍵字不為長尾關鍵字,此時直接將查找到的類目資訊提供給該用戶,若沒有查找到,則確認該當前關鍵字為長尾關鍵字。
在確認獲得的當前關鍵字為長尾關鍵字後,將該當前關鍵字劃分為多個當前關鍵字單元。其中劃分的方式可以但不限於基於統計的分詞演算法。
步驟39,在建立的重要度表中,確定劃分出的各當前關鍵字單元的重要度;
步驟310,在劃分出的各關鍵字單元中,選擇出滿足預設條件的重要度對應的關鍵字單元;
該預設條件可以為重要度不小於規定臨限值的當前關鍵字單元,也就是說選擇出重要度不小於規定臨限值的各當前關鍵字單元;該預設條件還可以為按照重要度由高到低的順序進行排序後的前規定數目個當前關鍵字單元;也就是說選擇重要度最高的前規定數目個當前關鍵字單元,例如選擇重要度最高的前3個當前關鍵字單元。
步驟311,在建立的各階搜尋關鍵字表中,確定選擇出的當前關鍵字單元所對應的類目資訊;
可以但不限於按照下述方式確定選擇出的當前關鍵字單元所對應的類目資訊:
若選擇出的當前關鍵字單元的數量為S,當S不大於N時,則按照預設規則,將選擇出的S個當前關鍵字單元進行排序後組成S階當前關鍵字單元組,在S階搜尋關鍵字表中,查找該S階當前關鍵字單元組對應的類目資訊,若未查找到,則在S個關鍵字單元中,選擇出(S-1)個當前關鍵字單元,並將(S-1)置為S,重複執行上述逐個減少當前關鍵字單元的步驟,直至查找到對應的類目資訊;
當S大於N時,則首先需要在S個當前關鍵字單元中選擇重要度最大的N個當前關鍵字單元,然後將選擇出的N個當前關鍵字單元進行排序後組成N階當前關鍵字單元組,在N階搜尋關鍵字表中,查找該N階當前關鍵字單元組對應的類目資訊,若未查找到,則在N個關鍵字單元中,選擇出(N-1)個當前關鍵字單元,並將(N-1)置為N,重複執行上述步驟,直至查找到對應的類目資訊。
若選擇的當前關鍵字單元的數量為3,即S=3,且N=3,則首先按照拼音或筆劃順序將選擇出的3個當前關鍵字單元進行排序,組成3階當前關鍵字單元組,然後在3階搜尋關鍵字表中查找該3階當前關鍵字單元組對應的類目資訊,若查找到,則返回給網頁流覽器,由網頁流覽器提供給用戶;若未查找到,則在3個當前關鍵字單元中選擇出重要度最高的兩個當前關鍵字單元,將選擇出的兩個當前關鍵字單元按照拼音或筆劃順序排序後組成2階當前關鍵字單元組,然後在2階搜尋關鍵字表中查找該2階當前關鍵字單元組對應的類目資訊,若查找到,則返回給網頁流覽器,由網頁流覽器提供給用戶;若未查找到,則在這兩個當前關鍵字單元中選擇出重要度最高的一個當前關鍵字單元,該選擇出的當前關鍵字單元可以看作一個1階當前關鍵字單元組,然後在1階搜尋關鍵字表中查找該1階當前關鍵字單元組對應的類目資訊,將查找到的類目資訊返回給網頁流覽器,由網頁流覽器提供給用戶,由於1階搜尋關鍵字表涵蓋了所有出現過的關鍵字單元,因此在1階搜尋關鍵字表中總能查找到對應的類目資訊。
步驟312,返回確定出的類目資訊。
本發明實施例一中,針對非長尾關鍵字和類目資訊的對應關係的查詢詞表,也可以預先將該查詢詞表中的各非長尾關鍵字先進行分詞,劃分為各關鍵字單元,然後將針對每個非長尾關鍵字劃分出的各關鍵字單元按照拼音或筆劃順序進行排序,得到排序後的非長尾關鍵字,然後將排序後的非長尾關鍵字和類目資訊的對應關係儲存在查詢詞表中,後續在獲得輸入的當前關鍵字後,可以先將獲得的當前關鍵字劃分為各當前關鍵字單元,然後按照拼音或筆劃順序進行排序,得到排序後的當前關鍵字,在查詢詞表中查詢該排序後的當前關鍵字對應的類目資訊,若查找不到,則確認獲得的當前關鍵字為長尾關鍵字,然後再選擇重要度滿足預設條件的當前關鍵字單元,確定對應的類目資訊並提供給用戶。當然,在獲得用戶輸入的當前關鍵字後,可以直接按照本發明實施例一提出的方法提供類目資訊,而不需要在查詢詞表中進行查詢,也就是說,可以不執行確定接收到的是否為長尾關鍵字還是非長尾關鍵字的步驟。
由上述處理過程可知,本發明實施例技術方案中,將規定時間段內輸入的每個搜尋關鍵字劃分為各搜尋關鍵字單元,分別將針對每個搜尋關鍵字劃分出的各搜尋關鍵字單元,組合為各階搜尋關鍵字單元組,確定組合出的各搜尋關鍵字單元組對應的類目資訊,根據確定出的類目資訊,建立各階搜尋關鍵字表,根據輸入的當前關鍵字,在建立的各階搜尋關鍵字表中,確定選擇出的當前關鍵字單元所對應的類目資訊,並返回確定出的類目資訊,由上可見,本發明實施例技術方案預先建立了包含各階搜尋關鍵字表,後續可以直接根據建立的搜尋關鍵字表查詢當前關鍵字對應的類目資訊,解決了習知技術無法為用戶提供長尾關鍵字的類目資訊的問題,有效地提高了為用戶提供類目資訊的全面性和靈活性。
下面給出更為具體的實施方式。
實施例二
如圖4所示,為本發明實施例二中,返回類目資訊的具體實現方法流程圖,其具體處理過程如下:
步驟41,獲得用戶輸入的當前關鍵字;
步驟42,對獲得的當前關鍵字進行歸一化處理後,劃分為各個當前關鍵字單元;
步驟43,按照拼音或筆劃順序,將劃分出的各當前關鍵字單元進行排序,得到排序後的當前關鍵字;
步驟44,在儲存的查詢詞表中查找排序後的當前關鍵字對應的類目資訊,若查找不到,則轉至45,若查找到,則轉至步驟415;
步驟45,在重要度表中查找劃分出的各當前關鍵字單元的重要度;
步驟46,按照重要度由高到低的順序將各個當前關鍵字單元進行排序,選擇前3個當前關鍵字單元;
步驟47,將選擇的3個當前關鍵字單元按照拼音或筆劃順序進行排序後組成3階當前關鍵字單元組;
步驟48,在3階搜尋關鍵字表中,查找該3階當前關鍵字單元組對應的類目資訊,若查找不到,則轉至步驟49,若查找到,則轉至步驟415;
步驟49,按照重要度由高到低的順序將3個當前關鍵字單元進行排序,選擇前兩個當前關鍵字單元;
步驟410,將選擇的兩個當前關鍵字單元按照拼音或筆劃順序進行排序後組成2階當前關鍵字單元組;
步驟411,在2階搜尋關鍵字表中,查找該2階當前關鍵字單元組對應的類目資訊,若查找不到,則轉至步驟412,若查找到,則轉至步驟415;
步驟412,按照重要度由高到低的順序將這兩個當前關鍵字單元進行排序,選擇第一個當前關鍵字單元;
步驟413,選擇出的當前關鍵字單元組成一個1階當前關鍵字單元組;
步驟414,在1階搜尋關鍵字表中,查找該1階當前關鍵字單元組對應的類目資訊;
步驟415,將查找到的類目資訊返回給用戶。
實施例三
相應的,本發明實施例三提供一種類目資訊提供裝置,其結構如圖5所示,包括搜尋關鍵字獲得單元51、搜尋關鍵字劃分單元52、搜尋關鍵字單元組合單元53、第一類目資訊確定單元54、搜尋關鍵字表建立單元55、第二類目資訊確定單元56和第一類目資訊返回單元57,其中:
搜尋關鍵字獲得單元51,用於獲得規定時間段內輸入的各搜尋關鍵字和各搜尋關鍵字對應的類目資訊;
搜尋關鍵字劃分單元52,用於將搜尋關鍵字獲得單元51獲得的每個搜尋關鍵字,劃分為各搜尋關鍵字單元;
搜尋關鍵字單元組合單元53,用於分別將搜尋關鍵字劃分單元52針對每個搜尋關鍵字劃分出的各搜尋關鍵字單元,組合為各階搜尋關鍵字單元組;
第一類目資訊確定單元54,用於根據搜尋關鍵字獲得單元51獲得的各搜尋關鍵字對應的類目資訊,分別確定搜尋關鍵字單元組合單元53組合出的各搜尋關鍵字單元組對應的類目資訊;
搜尋關鍵字表建立單元55,用於根據第一類目資訊確定單元54確定出的類目資訊,建立各階搜尋關鍵字表,每階搜尋關鍵字表中包含各該階搜尋關鍵字單元組與類目資訊的對應關係;
第二類目資訊確定單元56,用於根據輸入的當前關鍵字,在搜尋關鍵字表建立單元55建立的各階搜尋關鍵字表中,確定選擇出的當前關鍵字單元所對應的類目資訊;
第一類目資訊返回單元57,用於返回第二類目資訊確定單元56確定出的類目資訊。
較佳地,所述類目資訊提供裝置還包括重要度確定單元和重要度表建立單元,其中:
重要度確定單元,用於在搜尋關鍵字表建立單元55建立各階搜尋關鍵字表後,分別確定劃分出的各搜尋關鍵字單元的重要度;
重要度表建立單元,用於根據重要度確定單元確定出的重要度,建立包含各搜尋關鍵字單元與重要度的對應關係的重要度表;
第二類目資訊確定單元56具體包括當前關鍵字獲得子單元、當前關鍵字劃分子單元、第一重要度確定子單元、當前關鍵字單元選擇子單元和第一類目資訊確定子單元,其中:
當前關鍵字獲得子單元,用於獲得輸入的當前關鍵字;
當前關鍵字劃分子單元,用於將當前關鍵字獲得子單元獲得的當前關鍵字劃分為各當前關鍵字單元;
第一重要度確定子單元,用於在重要度表建立單元建立的重要度表中,確定當前關鍵字劃分子單元劃分出的各當前關鍵字單元的重要度;
當前關鍵字單元選擇子單元,用於在當前關鍵字劃分子單元劃分出的各當前關鍵字單元中,選擇出滿足預設條件的重要度對應的當前關鍵字單元;
第一類目資訊確定子單元,用於在搜尋關鍵字表建立單元55建立的各階搜尋關鍵字表中,確定當前關鍵字單元選擇子單元選擇出的當前關鍵字單元所對應的類目資訊。
更佳地,第一類目資訊確定單元54具體包括第二類目資訊確定子單元和第三類目資訊確定子單元,其中:
第二類目資訊確定子單元,用於針對搜尋關鍵字單元組合單元53組合出的每個搜尋關鍵字單元組的各搜尋關鍵字單元,根據搜尋關鍵字獲得單元51獲得的各搜尋關鍵字對應的類目資訊,確定包含該搜尋關鍵字單元的搜尋關鍵字對應的類目資訊;
第三類目資訊確定子單元,用於將第二類目資訊確定子單元確定出的、各搜尋關鍵字對應的類目資訊,確定為該搜尋關鍵字單元組對應的類目資訊。
較佳地,重要度確定單元具體包括獨立訪客數量確定子單元、類目資訊熵確定子單元和第二重要度確定子單元,其中:
獨立訪客數量確定子單元,用於確定每個搜尋關鍵字單元在各類目資訊中的UV的數量;
類目資訊熵確定子單元,用於根據獨立訪客數量確定子單元確定出的UV的數量,確定每個搜尋關鍵字單元在各類目資訊中的類目資訊熵;
第二重要度確定子單元,用於根據類目資訊熵確定子單元確定出的類目資訊熵,確定每個搜尋關鍵字單元的重要度。
較佳地,所述類目資訊提供裝置還包括搜尋關鍵字單元排序單元、類目資訊查找單元和第二類目資訊返回單元,其中:
搜尋關鍵字單元排序單元,用於在搜尋關鍵字表建立單元55建立的各階搜尋關鍵字表中,確定選擇出的當前關鍵字單元所對應的類目資訊之前,按照預設規則,將針對每個搜尋關鍵字劃分出的各搜尋關鍵字單元進行排序,得到排序後的搜尋關鍵字單元;
類目資訊查找單元,用於針對搜尋關鍵字單元排序單元得到的每個排序後的搜尋關鍵字單元,在儲存有非長尾關鍵字和類目資訊對應關係的查詢詞表中,查找該排序後的搜尋關鍵字單元對應的類目資訊;
第二類目資訊返回單元,用於在類目資訊查找單元查找到時,返回查找到的類目資訊;
第二類目資訊確定單元56在類目資訊查找單元未查找到時,執行在建立的各階搜尋關鍵字表中確定選擇出的當前關鍵字單元所對應的類目資訊的步驟。
本發明實施例三中,還可以將類目資訊提供裝置分為兩個大的裝置,分別為線下分析裝置61和線上確定裝置62,如圖6所示,網頁流覽器獲得用戶輸入的搜尋關鍵字後,形成點擊日誌後發送給日誌伺服器,線下分析裝置61定時從日誌伺服器獲得點擊日誌,然後建立各階搜尋關鍵字表和重要度表,然後將建立的各階搜尋關鍵字表和重要度表發送給線上確定裝置62,網頁流覽器獲得用戶輸入的當前關鍵字後,發送給線上確定裝置62,線上確定裝置62根據各階搜尋關鍵字表和重要度表確定該當前關鍵字對應的類目資訊,然後發送給網頁流覽器,以返回給用戶。
其中線下分析裝置61包含搜尋關鍵字獲得單元51、搜尋關鍵字劃分單元52、搜尋關鍵字單元組合單元53、第一類目資訊確定單元54和搜尋關鍵字表建立單元55,線上確定裝置62包含第二類目資訊確定單元56和第一類目資訊返回單元57。
此外,線下分析裝置61還進一步包括重要度確定單元和重要度表建立單元,線上確定裝置62還進一步包括搜尋關鍵字單元排序單元、類目資訊查找單元和第二類目資訊返回單元。
本領域的技術人員應明白,本發明的實施例可提供為方法、裝置(設備)、或電腦程式產品。因此,本發明可採用完全硬體實施例、完全軟體實施例、或結合軟體和硬體方面的實施例的形式。而且,本發明可採用在一個或多個其中包含有電腦可用程式碼的電腦可用記憶介質(包括但不限於磁盤記憶體、CD-ROM、光學記憶體等)上實施的電腦程式產品的形式。
本發明是參照根據本發明實施例的方法、裝置(設備)和電腦程式產品的流程圖和/或方塊圖來描述的。應理解可由電腦程式指令實現流程圖和/或方塊圖中的每一流程和/或方塊、以及流程圖和/或方塊圖中的流程和/或方塊的結合。可提供這些電腦程式指令到通用電腦、專用電腦、嵌入式處理機或其他可編程資料處理設備的處理器以產生一個機器,使得通過電腦或其他可編程資料處理設備的處理器執行的指令產生用於實現在流程圖一個流程或多個流程和/或方塊圖一個方塊或多個方塊中指定的功能的裝置。
這些電腦程式指令也可儲存在能引導電腦或其他可編程資料處理設備以特定方式工作的電腦可讀記憶體中,使得儲存在該電腦可讀記憶體中的指令產生包括指令裝置的製造品,該指令裝置實現在流程圖一個流程或多個流程和/或方塊圖一個方塊或多個方塊中指定的功能。
這些電腦程式指令也可裝載到電腦或其他可編程資料處理設備上,使得在電腦或其他可編程設備上執行一系列操作步驟以產生電腦實現的處理,從而在電腦或其他可編程設備上執行的指令提供用於實現在流程圖一個流程或多個流程和/或方塊圖一個方塊或多個方塊中指定的功能的步驟。
儘管已描述了本發明的較佳實施例,但本領域內的技術人員一旦得知了基本創造性概念,則可對這些實施例作出另外的變更和修改。所以,所附申請專利範圍意欲解釋為包括較佳實施例以及落入本發明範圍的所有變更和修改。顯然,本領域的技術人員可以對本發明進行各種改動和變型而不脫離本發明的精神和範圍。這樣,倘若本發明的這些修改和變型屬於本發明申請專利範圍及其等效技術的範圍之內,則本發明也意圖包含這些改動和變型在內。
51...搜尋關鍵字獲得單元
52...搜尋關鍵字劃分單元
53...搜尋關鍵字單元組合單元
54...第一類目資訊確定單元
55...搜尋關鍵字表建立單元
56...第二類目資訊確定單元
57...第一類目資訊返回單元
61...線下分析裝置
62...線上確定裝置
圖1為習知技術中通過即時查詢的方式為用戶提供類目資訊的方法流程示意圖;
圖2為習知技術中通過查詢詞表的方式為用戶提供類目資訊的方法流程示意圖;
圖3為本發明實施例一中類目資訊提供方法流程示意圖;
圖4為本發明實施例二中類目資訊提供方法具體實現流程示意圖;
圖5為本發明實施例三中類目資訊提供裝置結構示意圖;
圖6為本發明實施例三中類目資訊提供裝置結構示意圖。

Claims (10)

  1. 一種類目資訊提供方法,其特徵在於,包括:獲得規定時間段內輸入的各搜尋關鍵字和各搜尋關鍵字對應的類目資訊;將獲得的每個搜尋關鍵字,劃分為各搜尋關鍵字單元;分別將針對每個搜尋關鍵字劃分出的各搜尋關鍵字單元,組合為各階搜尋關鍵字單元組,其中,規定數目不小於1;根據獲得的各搜尋關鍵字對應的類目資訊,分別確定組合出的各搜尋關鍵字單元組對應的類目資訊;根據確定出的類目資訊,建立各階搜尋關鍵字表,每階搜尋關鍵字表中包含各該階搜尋關鍵字單元組與類目資訊的對應關係;在建立各階搜尋關鍵字表後,分別確定劃分出的各搜尋關鍵字單元的重要度,具體包括:確定每個搜索關鍵字單元在各類目資訊中的獨立訪客UV的數量,根據確定出的UV的數量,確定每個搜尋關鍵字單元在各類目資訊中的類目資訊熵,根據確定出的類目資訊熵,確定每個搜尋關鍵字單元的重要度;根據確定出的重要度,建立包含各搜尋關鍵字單元與重要度的對應關係的重要度表;獲得輸入的當前關鍵字後,將獲得的當前關鍵字劃分為各當前關鍵字單元; 在建立的重要度表中,確定劃分出的各當前關鍵字單元的重要度;在劃分出的各當前關鍵字單元中,選擇出滿足預設條件的重要度對應的當前關鍵字單元;在建立的各階搜尋關鍵字表中,確定選擇出的當前關鍵字單元所對應的類目資訊;返回確定出的類目資訊。
  2. 如申請專利範圍第1項之類目資訊提供方法,其中,根據獲得的各搜尋關鍵字對應的類目資訊,分別確定組合出的各搜尋關鍵字單元組對應的類目資訊,具體包括:針對組合出的每個搜尋關鍵字單元組的各搜尋關鍵字單元,根據獲得的各搜尋關鍵字對應的類目資訊,確定包含該搜尋關鍵字單元的搜尋關鍵字對應的類目資訊;將確定出的、各搜尋關鍵字對應的類目資訊,確定為該搜尋關鍵字單元組對應的類目資訊。
  3. 如申請專利範圍第1項之類目資訊提供方法,其中,透過如下方式確定每個搜尋關鍵字單元在各類目資訊中的類目資訊熵: 其中,Hi 為搜尋關鍵字單元i的類目資訊熵;K為存在搜尋關鍵字單元i的UV的類目資訊的數量;P ij 為搜尋關鍵字單元i在第j個類目資訊中的UV數量;P i 為搜尋關鍵字單元i在所有類目資訊中的UV數量。
  4. 如申請專利範圍第1項之類目資訊提供方法,其中,確定每個搜尋關鍵字單元在各類目資訊中的UV的數量,具體包括:獲得規定時間段內輸入的搜尋關鍵字對應的訪客標識;根據獲得的各搜尋關鍵字對應的類目資訊,分別確定劃分出的各搜尋關鍵字單元對應的類目資訊;根據獲得的訪客標識,分別確定各搜尋關鍵字單元在對應的類目資訊中的UV的數量。
  5. 如申請專利範圍第1項之類目資訊提供方法,其中,若選擇出的當前關鍵字單元的數量為S,S1,建立的搜尋關鍵字表為1階至N階搜尋關鍵字表,N1:當SN時,在建立的各階搜尋關鍵字表中確定選擇出的當前關鍵字單元所對應的類目資訊,具體包括:步驟A1,按照預設規則,將選擇出的S個當前關鍵字單元進行排序後組成S階當前關鍵字單元組;步驟A2,在各S階搜尋關鍵字表中,查找該S階當前關鍵字單元組對應的類目資訊;步驟A3,若未查找到,則在S個當前關鍵字單元中,選擇出(S-1)個當前關鍵字單元,並將(S-1)置為S;重複執行步驟A1至步驟A3,直至查找到對應的類目資訊;當S>N時,在建立的各階搜尋關鍵字表中確定選擇出的當前關鍵字單元所對應的類目資訊,具體包括: 步驟B1,在選擇出的S個當前關鍵字單元中,選擇重要度最大的N個當前關鍵字單元;步驟B2,按照預設規則,將選擇出的N個當前關鍵字單元進行排序後組成N階當前關鍵字單元組;步驟B3,在各N階搜尋關鍵字表中,查找該N階當前關鍵字單元組對應的類目資訊;步驟B4,若未查找到,則在選擇的N個當前關鍵字單元中,選擇出(N-1)個當前關鍵字單元,並將(N-1)置為N;重複執行步驟B2至步驟B4,直至查找到對應的類目資訊。
  6. 如申請專利範圍第1項之類目資訊提供方法,其中,在建立的各階搜尋關鍵字表中,確定選擇出的當前關鍵字單元所對應的類目資訊之前,還包括:按照預設規則,將針對每個搜尋關鍵字劃分出的各搜尋關鍵字單元進行排序,得到排序後的搜尋關鍵字單元;針對得到的每個排序後的搜尋關鍵字單元,在儲存有非長尾關鍵字和類目資訊對應關係的查詢詞表中,查找該排序後的搜尋關鍵字單元對應的類目資訊;若查找到,則返回查找到的類目資訊;若未查找到,則執行在建立的各階搜尋關鍵字表中確定選擇出的當前關鍵字單元所對應的類目資訊的步驟。
  7. 如申請專利範圍第2項之類目資訊提供方法,其中,該預設條件為: 重要度不小於規定臨限值的當前關鍵字單元;或按照重要度由高到低的順序進行排序後的前規定數目個當前關鍵字單元。
  8. 一種類目資訊提供裝置,其特徵在於,包括:搜尋關鍵字獲得單元,用於獲得規定時間段內輸入的各搜尋關鍵字和各搜尋關鍵字對應的類目資訊;搜尋關鍵字劃分單元,用於將搜尋關鍵字獲得單元獲得的每個搜尋關鍵字,劃分為各搜尋關鍵字單元;搜尋關鍵字單元組合單元,用於分別將搜尋關鍵字劃分單元針對每個搜尋關鍵字劃分出的各搜尋關鍵字單元,組合為1至規定數目階搜尋關鍵字單元組,其中,規定數目不小於1;第一類目資訊確定單元,用於根據搜尋關鍵字獲得單元獲得的各搜尋關鍵字對應的類目資訊,分別確定搜尋關鍵字單元組合單元組合出的各搜尋關鍵字單元組對應的類目資訊;搜尋關鍵字表建立單元,用於根據第一類目資訊確定單元確定出的類目資訊,建立各階搜尋關鍵字表,每階搜尋關鍵字表中包含各該階搜尋關鍵字單元組與類目資訊的對應關係;重要度確定單元,用於在搜尋關鍵字表建立單元建立各階搜尋關鍵字表後,分別確定劃分出的各搜尋關鍵字單元的重要度,具體包括:獨立訪客數量確定子單元,用於確定每個搜尋關鍵字 單元在各類目資訊中的獨立訪客UV的數量;類目資訊熵確定子單元,用於根據獨立訪客數量確定子單元確定出的UV的數量,確定每個搜尋關鍵字單元在各類目資訊中的類目資訊熵;第二重要度確定子單元,用於根據類目資訊熵確定子單元確定出的類目資訊熵,確定每個搜尋關鍵字單元的重要度;重要度表建立單元,用於根據重要度確定單元確定出的重要度,建立包含各搜尋關鍵字單元與重要度的對應關係的重要度表;第二類目資訊確定單元具體包括:當前關鍵字獲得子單元,用於獲得輸入的當前關鍵字;當前關鍵字劃分子單元,用於將當前關鍵字獲得子單元獲得的當前關鍵字劃分為各當前關鍵字單元;第一重要度確定子單元,用於在重要度表建立單元建立的重要度表中,確定當前關鍵字劃分子單元劃分出的各當前關鍵字單元的重要度;當前關鍵字單元選擇子單元,用於在當前關鍵字劃分子單元劃分出的各當前關鍵字單元中,選擇出滿足預設條件的重要度對應的當前關鍵字單元;第一類目資訊確定子單元,用於在搜尋關鍵字表建立單元建立的各階搜尋關鍵字表中,確定當前關鍵字單元選擇子單元選擇出的當前關鍵字單元所對應的類目資訊; 第一類目資訊返回單元,用於返回第二類目資訊確定單元確定出的類目資訊。
  9. 如申請專利範圍第8項之類目資訊提供裝置,其中,第一類目資訊確定單元具體包括:第二類目資訊確定子單元,用於針對搜尋關鍵字單元組合單元組合出的每個搜尋關鍵字單元組的各搜尋關鍵字單元,根據搜尋關鍵字獲得單元獲得的各搜尋關鍵字對應的類目資訊,確定包含該搜尋關鍵字單元的搜尋關鍵字對應的類目資訊;第三類目資訊確定子單元,用於將第二類目資訊確定子單元確定出的、各搜尋關鍵字對應的類目資訊,確定為該搜尋關鍵字單元組對應的類目資訊。
  10. 如申請專利範圍第8項之類目資訊提供裝置,其中,還包括:搜尋關鍵字單元排序單元,用於在搜尋關鍵字表建立單元建立的各階搜尋關鍵字表中,確定選擇出的當前關鍵字單元所對應的類目資訊之前,按照預設規則,將針對每個搜尋關鍵字劃分出的各搜尋關鍵字單元進行排序,得到排序後的搜尋關鍵字單元;類目資訊查找單元,用於針對搜尋關鍵字單元排序單元得到的每個排序後的搜尋關鍵字單元,在儲存有非長尾關鍵字和類目資訊對應關係的查詢詞表中,查找該排序後的搜尋關鍵字單元對應的類目資訊;第二類目資訊返回單元,用於在類目資訊查找單元查 找到時,返回查找到的類目資訊;第二類目資訊確定單元在類目資訊查找單元未查找到時,執行在建立的各階搜尋關鍵字表中確定選擇出的當前關鍵字單元所對應的類目資訊的步驟。
TW100104746A 2010-11-02 2011-02-14 Category information providing method and device TWI508011B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010530231.5A CN102456058B (zh) 2010-11-02 2010-11-02 类目信息提供方法及装置

Publications (2)

Publication Number Publication Date
TW201220233A TW201220233A (en) 2012-05-16
TWI508011B true TWI508011B (zh) 2015-11-11

Family

ID=45997813

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100104746A TWI508011B (zh) 2010-11-02 2011-02-14 Category information providing method and device

Country Status (7)

Country Link
US (2) US8583685B2 (zh)
EP (1) EP2635960A4 (zh)
JP (1) JP5449628B2 (zh)
CN (1) CN102456058B (zh)
HK (1) HK1166527A1 (zh)
TW (1) TWI508011B (zh)
WO (1) WO2012060866A1 (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102841946B (zh) * 2012-08-24 2016-05-25 北京国政通科技有限公司 商品数据检索排序及商品推荐方法和***
CN103902545B (zh) * 2012-12-25 2018-10-16 北京京东尚科信息技术有限公司 一种类目路径识别方法及***
US9201969B2 (en) * 2013-01-31 2015-12-01 Lexisnexis, A Division Of Reed Elsevier Inc. Systems and methods for identifying documents based on citation history
US9609050B2 (en) 2013-01-31 2017-03-28 Facebook, Inc. Multi-level data staging for low latency data access
CN103336806B (zh) * 2013-06-24 2016-08-10 北京工业大学 一种基于词出现间距的内在与外在模式熵差的关键词排序方法
CN104301353B (zh) * 2013-07-18 2019-10-08 腾讯科技(深圳)有限公司 一种订阅长尾类信息的方法、装置和***
CN103825952B (zh) * 2014-03-04 2017-07-04 百度在线网络技术(北京)有限公司 细胞词库推送方法和服务器
CN104268233B (zh) * 2014-09-26 2018-07-13 北京国双科技有限公司 组合关键词的生成方法及装置
CN105589853B (zh) * 2014-10-20 2017-09-15 阿里巴巴集团控股有限公司 一种类目目录确定方法及装置、自动分类方法及装置
CN105262812A (zh) * 2015-10-16 2016-01-20 浪潮(北京)电子信息产业有限公司 一种基于云计算平台的日志数据处理方法、装置及***
CN106815228B (zh) * 2015-11-27 2020-03-03 北京国双科技有限公司 搜索关键词的类名选取方法和装置
CN105808641A (zh) * 2016-02-24 2016-07-27 百度在线网络技术(北京)有限公司 线下资源的挖掘方法和装置
CN105893592B (zh) * 2016-04-12 2019-06-21 Oppo广东移动通信有限公司 一种搜索方法和装置
WO2018070026A1 (ja) * 2016-10-13 2018-04-19 楽天株式会社 商品情報表示システム、商品情報表示方法、及びプログラム
CN106874492B (zh) * 2017-02-23 2021-01-26 北京京东尚科信息技术有限公司 搜索方法和装置
US10466963B2 (en) 2017-05-18 2019-11-05 Aiqudo, Inc. Connecting multiple mobile devices to a smart home assistant account
US10929613B2 (en) 2017-12-29 2021-02-23 Aiqudo, Inc. Automated document cluster merging for topic-based digital assistant interpretation
US10963495B2 (en) * 2017-12-29 2021-03-30 Aiqudo, Inc. Automated discourse phrase discovery for generating an improved language model of a digital assistant
US10963499B2 (en) 2017-12-29 2021-03-30 Aiqudo, Inc. Generating command-specific language model discourses for digital assistant interpretation
CN111127060B (zh) * 2018-10-31 2023-08-08 百度在线网络技术(北京)有限公司 确定业务的推广用户的方法和装置
CN110413645A (zh) * 2019-06-19 2019-11-05 平安普惠企业管理有限公司 数据搜索方法、装置、终端及计算机可读存储介质
CN112650914A (zh) * 2020-12-30 2021-04-13 深圳市世强元件网络有限公司 一种长尾关键词识别方法、关键词搜索方法及计算机设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1512402A (zh) * 2002-12-31 2004-07-14 程松林 一种语音检索方法及采用该方法的音像信息检索***
US20050222987A1 (en) * 2004-04-02 2005-10-06 Vadon Eric R Automated detection of associations between search criteria and item categories based on collective analysis of user activity data
CN101593200A (zh) * 2009-06-19 2009-12-02 淮海工学院 基于关键词频度分析的中文网页分类方法
US7792858B2 (en) * 2005-12-21 2010-09-07 Ebay Inc. Computer-implemented method and system for combining keywords into logical clusters that share similar behavior with respect to a considered dimension

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3648051B2 (ja) 1998-02-02 2005-05-18 富士通株式会社 関連情報検索装置及びプログラム記録媒体
JP2000222431A (ja) * 1999-02-03 2000-08-11 Mitsubishi Electric Corp 文書分類装置
US6826568B2 (en) 2001-12-20 2004-11-30 Microsoft Corporation Methods and system for model matching
US20040260677A1 (en) 2003-06-17 2004-12-23 Radhika Malpani Search query categorization for business listings search
KR100452086B1 (ko) 2003-12-22 2004-10-13 엔에이치엔(주) 카테고리 별 키워드의 입력 순위를 제공하기 위한 검색서비스 시스템 및 그 방법
KR100520428B1 (ko) 2005-01-13 2005-10-11 엔에이치엔(주) 사용자 인증에 따라 다양한 종류의 키워드를 연동하여관리하는 방법 및 그 시스템
KR100785352B1 (ko) 2006-04-21 2007-12-18 엔에이치엔(주) 검색결과리스트 생성 방법 및 검색결과리스트 생성 시스템
US7996393B1 (en) * 2006-09-29 2011-08-09 Google Inc. Keywords associated with document categories
KR20090076798A (ko) 2006-11-08 2009-07-13 가부시키가이샤 시리우스 테크놀로지즈 광고정보 제공 방법, 광고정보 제공 시스템 및 광고정보 제공 프로그램
US8131722B2 (en) * 2006-11-20 2012-03-06 Ebay Inc. Search clustering
US8862608B2 (en) * 2007-11-13 2014-10-14 Wal-Mart Stores, Inc. Information retrieval using category as a consideration
US8620910B2 (en) 2008-02-27 2013-12-31 Nec Corporation Search system, search method, and program
US8244752B2 (en) * 2008-04-21 2012-08-14 Microsoft Corporation Classifying search query traffic
US9361365B2 (en) * 2008-05-01 2016-06-07 Primal Fusion Inc. Methods and apparatus for searching of content using semantic synthesis
JP4922240B2 (ja) * 2008-06-04 2012-04-25 ヤフー株式会社 Web検索において選択的に擬似フィードバック処理を適用する検索処理装置、方法及びプログラム
US20100257171A1 (en) 2009-04-03 2010-10-07 Yahoo! Inc. Techniques for categorizing search queries
US20100306198A1 (en) 2009-06-02 2010-12-02 Cbs Interactive, Inc. System and method for determining categories associated with searches of electronic catalogs and displaying category information with search results

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1512402A (zh) * 2002-12-31 2004-07-14 程松林 一种语音检索方法及采用该方法的音像信息检索***
US20050222987A1 (en) * 2004-04-02 2005-10-06 Vadon Eric R Automated detection of associations between search criteria and item categories based on collective analysis of user activity data
US7792858B2 (en) * 2005-12-21 2010-09-07 Ebay Inc. Computer-implemented method and system for combining keywords into logical clusters that share similar behavior with respect to a considered dimension
CN101593200A (zh) * 2009-06-19 2009-12-02 淮海工学院 基于关键词频度分析的中文网页分类方法

Also Published As

Publication number Publication date
JP5449628B2 (ja) 2014-03-19
US20140074831A1 (en) 2014-03-13
TW201220233A (en) 2012-05-16
JP2013545189A (ja) 2013-12-19
EP2635960A4 (en) 2014-09-10
US9087108B2 (en) 2015-07-21
US20120109946A1 (en) 2012-05-03
WO2012060866A1 (en) 2012-05-10
CN102456058A (zh) 2012-05-16
US8583685B2 (en) 2013-11-12
EP2635960A1 (en) 2013-09-11
CN102456058B (zh) 2014-03-19
HK1166527A1 (zh) 2012-11-02

Similar Documents

Publication Publication Date Title
TWI508011B (zh) Category information providing method and device
CN103729359B (zh) 一种推荐搜索词的方法及***
US9928537B2 (en) Management and storage of distributed bookmarks
JP6301958B2 (ja) 検索語句を構成し、広告を配信し、製品情報を検索するための方法および装置
JP5717858B2 (ja) テキストセットの照合
US8700621B1 (en) Generating query suggestions from user generated content
JP6066077B2 (ja) 更新パラメータを生成および相関するキーワードを表示するための方法および装置
CN103870505B (zh) 一种查询词推荐方法和查询词推荐***
US9727906B1 (en) Generating item clusters based on aggregated search history data
CN104252456B (zh) 一种权重估计方法、装置及***
US9058393B1 (en) Tools for appraising a domain name using keyword monetary value data
US20110153595A1 (en) System And Method For Identifying Topics For Short Text Communications
CN103870507B (zh) 一种基于类目的搜索方法和装置
US8655737B1 (en) Brand name synonymy
US20150058334A1 (en) Presentation of items based on a theme
WO2017088496A1 (zh) 一种搜索推荐方法、装置、设备及计算机存储介质
US8825620B1 (en) Behavioral word segmentation for use in processing search queries
JP2015522190A (ja) 検索結果の生成
JP2013218686A (ja) 製品及びサービスの講評からアスペクトベースの評価点を抽出するためのシステム及び方法
WO2017005119A1 (zh) 一种个性化引导的实现方法及装置
TW201401088A (zh) 搜索方法和裝置
TWI539306B (zh) Information delivery method, processing server and merge server
US8909558B1 (en) Appraising a domain name using keyword monetary value data
CN107766229B (zh) 一种利用蜕变测试评价商品搜索***正确性的方法
Zhao et al. Tourism e-commerce recommender system based on web data mining