TWI525457B - Information processing methods and equipment - Google Patents

Information processing methods and equipment Download PDF

Info

Publication number
TWI525457B
TWI525457B TW099140209A TW99140209A TWI525457B TW I525457 B TWI525457 B TW I525457B TW 099140209 A TW099140209 A TW 099140209A TW 99140209 A TW99140209 A TW 99140209A TW I525457 B TWI525457 B TW I525457B
Authority
TW
Taiwan
Prior art keywords
product information
product
standard
attribute parameter
information
Prior art date
Application number
TW099140209A
Other languages
English (en)
Other versions
TW201214166A (en
Inventor
Hai-Jie Gu
Ning-Jun Su
qi-feng Dai
Hai-Ping Ma
jin-yin Zhang
En-Hong Chen
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of TW201214166A publication Critical patent/TW201214166A/zh
Application granted granted Critical
Publication of TWI525457B publication Critical patent/TWI525457B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/087Inventory or stock management, e.g. order filling, procurement or balancing against orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

資訊處理的方法及設備
本申請涉及電腦技術領域,尤其涉及一種資訊處理的方法及設備。
隨著電腦技術以及通信技術的不斷發展,越來越多的用戶在購物網站上搜索、查詢、購買商品。用戶在搜索、查詢、購買商品之前,會瀏覽賣家用戶在網站上發佈的產品資訊,該賣家用戶可以是企業實體、廠商或是個人經營者。
網站伺服器接收到的賣家用戶上報的產品資訊是海量資訊,為了對接收到的產品資訊所表示的產品進行分類以及有效地引導買家用戶獲得其想要的產品資訊,網站伺服器通常採用多級類目的方式來劃分產品資訊。多級類目體系一般有以下兩個特徵:
特徵1:多級類目體系的架構相對穩定。
架構相對穩定的多級類目體系一方面有助於賣家用戶積累習慣,在向網站伺服器上報產品資訊時,按照多級類目體系的要求上報標準格式和內容的產品資訊。另一方面有助於買家用戶積累習慣,根據累計的經驗在多級類目體系下快速搜索、查找想要獲得的產品資訊。
特徵2:多級類目體系一般由網站伺服器的運營人員人工運營。
人工運營的方式可以將本領域的共有知識固定下來形成標準,有助於多級類目體系在各種網站內的推廣使用。
為了保持多級類目體系的上述兩點特徵,在通過多級類目的方式劃分海量產品資訊時,只能按照相對較粗的粒度劃分產品資訊,這是因為:由於產品資訊的多種多樣,如果將產品資訊劃分為較細的粒度,則多級類目的最底層葉子類目需要隨著產品資訊的改變而變化,不利於多級類目體系的穩定;且如果細粒度地劃分產品資訊,生成的多級類目的架構勢必會非常龐大,增加了人工運營網站伺服器的難度。
例如:若某一葉子類目下是連衣裙的產品資訊,針對其中的某一產品資訊,在該產品資訊中的產品材質由絲質修改為棉質時,該產品資訊仍是該連衣裙葉子類目下的產品資訊,葉子類目不發生變化。若多級類目體系劃分的粒度更細,如某一葉子類目下是絲質連衣裙的產品資訊,則當某一產品資訊中的產品材質由絲質修改為棉質時,需要將該產品資訊由絲質連衣裙的葉子類目改為棉質連衣裙的葉子類目,此時,葉子類目隨著產品資訊的改變而變化。同時,由於多級類目體系是樹狀的節點架構,因此,每增加一層子類目,多級類目體系中將增加大量的類目,使得多級類目的架構非常龐大。
由於多級類目體系下的產品資訊劃分粒度較粗,因此,即使是多級類目體系中的最底層的葉子類目中包含的產品資訊也依舊是大量的。在此情況下,買家用戶通過多級類目體系搜索、查詢產品資訊時的查詢時間較長,且查詢的準確度較低,且網站伺服器向買家用戶推薦產品資訊時,也只能以葉子類目為單位,向買家用戶推薦葉子類目下的所有產品資訊,使得推薦的產品資訊差異很大,準確度不能滿足買家用戶的實際需求。除此以外,由於葉子類目中包含的產品信息量很大,屬於同一葉子類目中的產品資訊差異也很大,因此,針對葉子類目下的產品資訊的操作實現難度也較大。例如:在通過價格參數來自動抓取不安全的產品資訊的操作中,一般認為極端價格很可能涉嫌假冒產品,假設A品牌的產品價格低於100元時表示該產品為假冒產品,而B品牌的同類型產品價格低於20元時表示該產品為假冒產品,如果某一產品的價格為50元,則通過價格參數的方式很難直接定位出價格為50元的產品是否為假冒產品,還必須結合該產品的其他資訊來判斷,而葉子類目下的產品資訊衆多,使得運算量非常大。
本申請實施例提供一種資訊處理的方法及設備,用以解決現有技術中存在的多級類目體系下產品資訊劃分粒度較大的問題。
一種資訊處理的方法,該方法包括:確定葉子類目下各標準產品資訊中的至少一個產品屬性參數;利用確定的該至少一個產品屬性參數對該標準產品資訊進行劃分,得到該葉子類目下的多個集合;其中,劃分在同一集合內的標準產品資訊中的該至少一個產品屬性參數的值都相同。
一種資訊處理的設備,該設備包括:標準參數確定模組,用於確定葉子類目下各標準產品資訊中的至少一個產品屬性參數;第一劃分模組,用於利用確定的該至少一個產品屬性參數對該標準產品資訊進行劃分,得到該葉子類目下的多個集合,其中,劃分在同一集合內的標準產品資訊中的該至少一個產品屬性參數的值都相同。
本申請有益效果如下:
本申請實施例在葉子類目的基礎上,根據葉子類目下各標準產品資訊中的至少一個產品屬性參數對該標準產品資訊進行劃分,得到該葉子類目下的多個集合,由於劃分在同一集合內的標準產品資訊中的該至少一個產品屬性參數的值都相同,因此,最終得到的是產品資訊細粒度劃分的集合,買家用戶以細粒度的產品資訊集合為基礎搜索、查詢產品資訊時,可以有效減少搜索、查詢的時間、提高搜索、查詢的準確性以及提高向買家用戶推薦產品資訊的準確度,且細粒度的產品資訊集合也能夠提高對產品資訊進行操作的可用性,減少對產品資訊進行操作時的運算量。
為了實現本申請目的,本申請在多類目體系的葉子類目基礎上,對葉子類目下的產品資訊按照其產品屬性參數作進一步劃分,在每一個葉子類目下劃分出多個細粒度的產品資訊集合,使得在買家用戶搜索、查詢產品資訊時,以細粒度的產品資訊集合為基礎,可以有效減少搜索、查詢的時間、提高搜索、查詢的準確性以及提高網站伺服器向買家用戶推薦產品資訊的準確度,且細粒度的產品資訊集合也能夠提高對產品資訊進行操作的可用性,減少對產品資訊進行操作時的運算量;並且,本申請方案是在多類目體系的葉子類目基礎上執行的,對多級類目體系的實質性內容沒有改變,多級類目體系本身仍然具有上述的兩點特徵。
本申請各實施例中涉及的資訊處理設備可以應用在多級類目體系下,其架構如圖1所示,在多級類目體系的最底層葉子類目下,資訊處理設備對葉子類目中的產品資訊進行處理,得到葉子類目下一層次的對產品資訊做細粒度劃分的集合和子集合。多級類目體系下的各葉子類目是相對獨立的類目,本申請方案是要在每一葉子類目下繼續構建細粒度的類目結構,因此,本實施例方案中可以採用分散式演算法,將每一個葉子類目作為一個計算節點,通過電腦集群對多個葉子類目進行分散式操作,以加快本實施例中的資訊處理方案。在圖1所示的結構下,獨立於多級類目體系下的一個資訊處理設備可以對多級類目體系下的多個葉子類目中的產品資訊進行處理。
若將本申請方案中的資訊處理方案處理後的集合和子集合中的標準產品資訊應用於向買家用戶推薦產品資訊或是買家用戶的產品資訊搜索的場景,則用於向買家用戶推送產品資訊的伺服器根據買家用戶的需求(如買家用戶輸入的關鍵字或是買家用戶在之前一段時間內的購買習慣),將集合或子集合中的產品資訊推送給買家用戶,或是搜索引擎從集合和子集合中進行關鍵字搜索,並將搜索得到的產品資訊發送給買家用戶。
根據葉子類目下的產品資訊的產品屬性參數值是否符合設定的條件,可以將其劃分為標準產品資訊和非標準產品資訊,標準產品資訊的產品屬性參數值符合設定的條件,而非標準產品資訊的某些或全部產品屬性參數值不符合設定的條件。該設定的條件可以是產品屬性參數值的取值是實際可用的取值。例如:某一葉子類目下包含的是針對連衣裙的產品資訊,產品資訊1中的價格參數值是100~150元區間,而產品資訊2中的價格參數值是ABC,並不是表示價格的正數數值,說明賣家用戶在填寫產品資訊2中的價格參數值時可能出現失誤,則將產品資訊2看作是非標準產品資訊。
不論是標準產品資訊還是非標準產品資訊都包括產品屬性參數和非產品屬性參數,產品屬性參數表示該產品資訊對應產品本身的固定屬性,包括但不限於:產品的價格、產品的材質、產品的品牌、產品的型號、產品的重量等;非產品屬性參數表示賣家用戶或是網站伺服器為產品定義的屬性,包括但不限於:產品資訊所屬的葉子類目、發佈產品的標題、賣家用戶ID、產品的用途等。
下面結合說明書附圖對本申請實施例進行詳細描述。
實施例一:
如圖2所示,為本申請實施例一中資訊處理方法示意圖,該方法包括以下步驟:
步驟101:確定葉子類目下各標準產品資訊中的至少一個產品屬性參數。
假設本步驟中的葉子類目包含的是針對連衣裙的產品資訊,包含的標準產品資訊有1000個,其中3個標準產品資訊(標準產品資訊1、標準產品資訊2和標準產品資訊3)的內容如表1所示:每個標準產品資訊中有4個產品屬性參數,分別是連衣裙的價格、連衣裙的材質、連衣裙的品牌、連衣裙的型號。
若將表1中的4個產品屬性參數都作為細粒度產品資訊的劃分條件,對葉子類目下的標準產品資訊進行劃分,則會由於劃分條件過於複雜導致劃分後得到的集合數量過多。例如:若葉子類目下的所有1000個標準產品資訊中共包含4種連衣裙的價格區間、3種連衣裙的材質、50種連衣裙的品牌、5種連衣裙的型號,則最多將會劃分得到4×3×50×5=3000個集合。而在實際的處理過程中,產品屬性參數的種類可能會更多,每種產品屬性參數值的可選項也更多,因此,將全部產品屬性參數都作為劃分條件的話,運算量會比較大。對此,本步驟提出一種優化方案,從全部產品屬性參數中選擇部分產品屬性參數來作為本步驟101中確定的產品屬性參數用於作細粒度的產品資訊劃分。
具體的選擇產品屬性參數的操作需要滿足以下兩方面要求:
一方面,選擇的產品屬性參數應該是對外最能反映該產品資訊的參數,即買家用戶常用於搜索、查詢的參數,以便於根據選擇的產品屬性參數進行劃分後得到的集合能夠提高用戶搜索、查詢的準確性;另一方面,選擇的產品屬性參數的值最好是離散型的,以減少在後續劃分集合時由於標準產品資訊中的產品屬性參數的取值可能性過多導致運算量大的問題。
為了滿足以上兩方面要求,本步驟中選擇用戶集合劃分的產品屬性參數的條件是:產品屬性參數作為搜索條件,在之前的一段設定時長內,在葉子類目下進行產品資訊搜索的次數需要達到第一閾值,且該產品屬性參數的值為離散型。
按照上述條件選擇出至少一個產品屬性參數後用於後續的集合劃分操作。仍以表1所示的產品資訊中的產品屬性參數為例,若葉子類目下的所有1000個標準產品資訊中共包含4種連衣裙的價格區間、3種連衣裙的材質、50種連衣裙的品牌、5種連衣裙的型號,則可以將其中連衣裙的價格的值的4個區間看作離散型;連衣裙的材質的取值為3種不同的材質,可以看作是離散型;連衣裙的品牌的取值為50種不同的品牌,可以看作是離散型;連衣裙的型號的取值為5種不同的型號,可以看作是離散型。若買家用戶最常用價格和材質為搜索條件進行產品資訊的搜索、查詢,則將產品的價格、產品的材質作為本步驟中確定的用於集合劃分的產品屬性參數。
步驟102:對該標準產品資訊進行劃分,得到該葉子類目下的多個集合,其中,劃分在同一集合內的標準產品資訊中的該至少一個產品屬性參數的值都相同。
在本步驟中,若用於劃分集合的產品屬性參數是產品的價格和產品的材質,其中,產品的價格有4種價格區間,產品的材質有3種不同的材質,則劃分後應該得到以下12個集合:
集合1:價格區間1+材質1;集合2:價格區間1+材質2;集合3:價格區間1+材質3;集合4:價格區間2+材質1;集合5:價格區間2+材質2;集合6:價格區間2+材質3;集合7:價格區間3+材質1;集合8:價格區間3+材質2;集合9:價格區間3+材質3;集合10:價格區間4+材質1;集合11:價格區間4+材質2;集合12:價格區間4+材質3。
劃分在同一集合中的任意兩個標準產品資訊中的價格區間和材質都相同,根據表1所示的各標準產品資訊的產品屬性參數描述,標準產品資訊1和標準產品資訊2應劃分在集合1,標準產品資訊3應劃分在集合5,任意兩個集合中滿足類與類不相似的原則。
由於在步驟101中選擇用於細粒度產品資訊劃分的產品屬性參數時,充分考慮到了買家用戶的搜索、查詢習慣以及產品屬性參數的值為離散型,同時忽略未選擇的產品屬性參數,使得本步驟的劃分結果不僅能夠正確體現買家用戶的使用習慣,還減少了劃分時的運算量。
通過以上步驟101和步驟102的方案,對多級類目體系的葉子類目中的產品資訊作了細粒度的劃分,得到了細粒度劃分產品資訊的集合,使得買家用戶通過集合內的細粒度產品進行搜索、查詢時可以有效減少等待時間、提高準確性以及提高網站伺服器向買家用戶推薦產品資訊的準確性,有助於提高對產品資訊的各項操作的可行性。例如,在將連衣裙的葉子類目劃分為上述12個集合後,可以根據買家用戶的搜索條件在相應的集合內進行搜索,由於集合內的產品資訊數量遠遠小於葉子類目下的產品資訊數量,因此,可以大大減少買家用戶搜索等待時間,且保證搜索、查詢的準確性;同時,在向買家用戶推薦產品資訊時,根據向買家用戶推薦特定價位以及材質的產品資訊,使得推薦的產品資訊接近買家用戶實際需求;另外,仍以通過價格參數來自動抓取不安全的產品資訊的操作為例,通過上述方式劃分細粒度的產品資訊集合後,可以根據待測的價格快速定位出相應的集合,進而在定位出的集合中查詢是否存在假冒產品,相比於在葉子類目下的操作,可以有效地減少操作的運算量,提高操作執行的有效性。
在上述步驟101和步驟102的優選方案中,根據最能反映產品資訊以及取值為離散型的產品屬性參數作為劃分集合的產品屬性參數,可以進一步根據劃分後得到的集合來提高用戶搜索、查詢的準確性,以及減少在劃分集合時由於標準產品資訊中的產品屬性參數的值的可能性過多導致運算量大的問題。
步驟103:針對劃分後的每一集合,按照集合中各標準產品資訊中的至少一個非產品屬性參數的相似度,將集合內的標準產品資訊進一步劃分至多個子集合。
本步驟是實現本申請目的的優選步驟,在葉子類目下劃分出多個集合後,再針對每一個集合作進一步的劃分,可以在步驟102的基礎上得到更細粒度的標準產品資訊的子集合。
本步驟的具體做法為:
首先,針對劃分後得到的每一集合,確定集合中各標準產品資訊中的至少一個非產品屬性參數。
仍以步驟101和步驟102中涉及的連衣裙產品資訊為例,假設本步驟中確定的非產品屬性參數是賣家用戶在網站伺服器上發佈產品的標題,標準產品資訊1和標準產品資訊2劃分在集合1中,標準產品資訊1內發佈產品的標題中的關鍵字為:連衣裙、動物圖案,標準產品資訊2內發佈產品的標題中的關鍵字為:連衣裙、條紋圖案。
然後,確定同一集合內各標準產品資訊的至少一個非產品屬性參數的相似度。
由於以發佈產品的標題為非產品屬性參數,因此,本步驟中需要運算同一集合內各發佈產品的標題之間的相似度。如通過K-中心點等聚類演算法運算相似度。
最後,將同一集合內各標準產品資訊做進一步劃分,得到該集合下的多個子集合,使得劃分在同一子集合內的兩兩標準產品資訊中的該至少一個非產品屬性參數之間的相似度達到第二閾值。
若通過K-中心點等聚類演算法運算相似度時,將相似度達到第二閾值的各標準產品資訊劃分在同一子集合,不同子集合之間,非產品屬性參數的相似度較低。
本實施例也不限於通過產品資訊的其他非產品屬性參數之間的相似度來劃分子集合,如通過產品用途劃分等。
通過上述步驟101~步驟103的方案,完成了針對標準產品資訊的細粒度劃分,進一步地,還可以對非標準產品資訊作細粒度的劃分。
步驟104:確定葉子類目下的非標準產品資訊。
本步驟也是實現本申請目的的優選步驟,雖然葉子類目下的非標準產品資訊中的部分或全部產品屬性參數的值不符合設定的條件,但如果這些值是賣家用戶上報時填寫失誤或是其他人為誤差造成的,則該非標準產品資訊也應該真實表示一個產品的相關資訊,且該非標準產品資訊也具有搜索、查詢、向用戶推薦或是用於其他操作的意義,因此,本優選步驟就是在已劃分標準產品資訊的集合和子集合後,進一步對非標準產品資訊的劃分。
步驟105:判斷非標準產品資訊中的用於劃分集合的全部產品屬性參數的值是否都不符合設定的條件,若是,則執行步驟106;否則執行步驟108。
非標準產品資訊的某些或全部產品屬性參數值不符合設定的條件,在本步驟中,需要判斷在步驟101中確定的用於劃分集合的產品屬性參數是否是不符合設定的條件的參數。例如,在步驟101中確定的用戶劃分集合的產品屬性參數為產品的價格、產品的材質,則在本步驟中將確定非標準產品資訊中的產品的價格和產品的材質這兩種產品屬性參數是否都不符合設定的條件。
需要說明的是,若在步驟101中將產品資訊的全部產品屬性參數都用於劃分集合,則只要有產品屬性參數值是不符合設定的條件的產品資訊就定義為非標準產品資訊;若在步驟101中設定部分產品屬性參數用於劃分集合,則在本步驟中涉及的非標準產品資訊是指用於劃分集合的至少一個產品屬性參數值為不符合設定的條件的產品資訊。
特殊地,若存在某一非標準產品資訊,該非標準產品資訊中取值不符合設定的條件的產品屬性參數並未用於劃分集合,如用於劃分集合的產品屬性參數為產品的價格、產品的材質,但該非標準產品資訊中取值不符合設定的條件的產品屬性參數是產品型號,則該非標準產品資訊可以作為標準產品資訊的特例,在步驟102中進行劃分;也可以仍舊作為非標準產品資訊,在後續步驟中劃分。
步驟106:確定非標準產品資訊中的至少一個非產品屬性參數,並判斷是否存在與非標準產品資訊的非產品屬性參數的相關性達到第三閾值的子集合,若存在,則將非標準產品資訊劃分至相關性達到第三閾值且最高的子集合內,並跳轉至步驟111;否則,執行步驟107。
由於非標準產品資訊中的產品屬性參數無法用於集合劃分,因此,本步驟中利用非標準產品資訊的非產品屬性參數來判斷該非標準產品資訊應該屬於哪一子集合。
仍以用於劃分集合的產品屬性參數為產品的價格、產品的材質為例,用於劃分子集合的非產品屬性參數為發佈產品的標題,則在本步驟中,某一非標準產品資訊的產品的價格和產品的材質的值不符合設定的條件,確定該非標準產品資訊的發佈產品的標題,通過K-中心點等聚類演算法運算該發佈產品的標題與每一子集合中的各標準產品資訊的發佈產品的標題的相似度,為減少運算量,可以與每一子集合中的一個標準產品資訊的發佈產品的標題進行相似運算,查找出相似度達到第三閾值的標準產品資訊所在的子集合,並將該非標準產品資訊劃分為相似度最高的標準產品資訊所在的子集合。
步驟107:將該非標準產品資訊劃分至特定集合,並跳轉至步驟111。
在本實施例中,由於存在某些非標準產品資訊的用於劃分集合的產品屬性參數的值不符合設定的條件且非產品屬性參數不與任何集合內的子集合相關,則為這一類非標準產品資訊單獨設置一個特定集合。
該特定集合與步驟102中劃分的集合滿足類與類之間不相似的原則。
步驟108:確定非標準產品資訊中用於劃分集合的產品屬性參數中的值符合設定的條件的產品屬性參數。
在本步驟中,由於非標準產品資訊中部分用於劃分集合的產品屬性參數中的值符合設定的條件,因此,可以利用值符合設定的條件的這部分產品屬性參數來劃分非標準產品資訊。
例如:若在步驟101中確定的用於劃分集合的產品屬性參數為產品的價格、產品的材質,而某一非標準產品資訊的產品的價格的值不符合設定的條件,但產品的材質的值符合設定的條件,則可以利用產品材質這一產品屬性參數來劃分非標準產品資訊。
步驟109:根據步驟108確定的產品屬性參數,確定非標準產品資訊所屬的集合。
在本步驟中,根據確定的產品屬性參數的值以及各集合中的標準產品資訊中的該產品屬性參數的值,查找出與該非標準產品資訊的產品屬性參數的值相同的集合。
確定的集合數量可能不止一個,在此情況下,可以將確定的所有集合執行後續步驟。例如:在步驟101中示例中產生了12個集合,假設本步驟中的產品屬性參數是產品的材質,取值為材質1,則本步驟確定的該非標準產品資訊所屬的集合可能為集合1、集合4、集合7以及集合10中的一個。
步驟110:根據非標準產品資訊的非產品屬性參數,將該非標準產品資訊劃分至步驟109確定的集合內的一個子集合中。
通過步驟109確定了非標準產品資訊應該屬於的集合,但還不能最終確定該非標準產品資訊應該屬於哪一集合中的哪一子集合,因此,本步驟進一步採用非產品屬性資訊對非標準產品資訊作進一步劃分,將非標準產品資訊劃分至非產品屬性參數的相似度最高的子集合中。
在步驟106中劃分非標準產品資訊時,與劃分至的子集合之間的相似度需要達到第三閾值,進而再選擇相似度最高的子集合,而在本步驟中只需要從步驟109確定的集合中選擇相似度最高的子集合即可,這是因為:在步驟106中,非標準產品資訊的用於劃分集合的產品屬性參數都不符合設定的條件,因此,如果只選擇與非標準產品資訊的非產品屬性參數相關性最高的子集合,而不為相關性設置最低的門限值(即第三閾值),則可能出現非標準產品資訊與任一子集合的相關性都很低,但仍舊選擇一個子集合作為非標準產品資訊歸屬的子集合,導致該非標準產品資訊和同一子集合內的其他標準產品資訊的相關性低。而在步驟110中,由於在步驟109中確定的集合是通過非標準產品資訊的一個取值符合設定的條件的產品屬性參數來確定的,因此,在步驟110中用於選擇的集合與非標準產品資訊有一定的相關性,進而從中選擇的子集合與非標準產品資訊的相關性也較高。
步驟111:確定重複的標準產品資訊,並保留其中一個標準產品資訊,去除剩餘的標準產品資訊,以及確定重複的非標準產品資訊,並保留其中一個非標準產品資訊,去除剩餘的非標準產品資訊。
若兩個標準產品資訊間的產品屬性參數和非產品屬性參數都相同,則定義這兩個標準產品資訊是重複的標準產品資訊。
若兩個非標準產品資訊間的產品屬性參數和非產品屬性參數都相同,則定義這兩個非標準產品資訊是重複的非標準產品資訊。
步驟111是實現本申請目的的優選步驟,由於賣家用戶在網站伺服器上可能出現重複發佈產品資訊的情況,為了減少對重複產品資訊進行處理所佔用的資源,步驟111對標準產品資訊和非標準產品資訊進行去重操作。
步驟111的去重操作可以在步驟101之前,或是步驟101~步驟110之間的任意時刻執行,或是在步驟110之後執行。
步驟112:為每一子集合命名。
在執行到步驟110時,實際上已經自動對產品資訊進行了劃分,得到了以集合為單位或是子集合為單位的標準產品單元(standard product unit,SPU)。本步驟作為本實施例的優選步驟,是為每一個SPU進行命名或者打標籤,也就是標識每一SPU代表的內容。
本步驟的具體做法是:首先確定每一子集合的標準產品資訊和非標準產品資訊中的產品屬性參數和非產品屬性參數;然後統計確定該產品屬性參數和非產品屬性參數中的至少一個高頻詞;最後將該高頻詞用於為該子集合命名。
後續買家用戶搜索、查詢以及向買家用戶推薦產品資訊時,可以通過子集合名稱中涉及的高頻詞作為關鍵字進行搜索或推薦。
步驟112可以在步驟110之後且步驟111之前執行。
實施例二:
本申請實施例二提供一種與實施例一屬於同一發明構思下的資訊處理的設備,如圖3所示,該設備包括標準參數確定模組11和第一劃分模組12,其中:標準參數確定模組11用於確定葉子類目下各標準產品資訊中的至少一個產品屬性參數;第一劃分模組12用於利用確定的該至少一個產品屬性參數對該標準產品資訊進行劃分,得到該葉子類目下的多個集合,其中,劃分在同一集合內的標準產品資訊中的該至少一個產品屬性參數的值都相同。
如圖4所示,該標準參數確定模組具體包括屬性參數確定子模組21、次數確定子模組22和選擇子模組23,其中:屬性參數確定子模組21用於確定葉子類目下各標準產品資訊中的全部產品屬性參數;次數確定子模組22確定設定時長內每一產品屬性參數作為搜索條件,在該葉子類目下進行產品資訊搜索的次數;選擇子模組23用於從該全部產品屬性參數中選擇至少一個產品屬性參數,其中,選擇的任一產品屬性參數作為搜索條件進行產品資訊搜索的次數達到第一閾值且該產品屬性參數的值為離散型。
該設備還包括非標準參數確定模組13、相似度確定模組14和第二劃分模組15,其中:非標準參數確定模組13用於針對劃分後得到的每一集合,確定集合中各標準產品資訊中的至少一個非產品屬性參數;相似度確定模組14用於確定同一集合內各標準產品資訊的至少一個非產品屬性參數的相似度;第二劃分模組15用於按照確定的相似度對同一集合內各標準產品資訊做進一步劃分,得到該集合下的多個子集合,其中,劃分在同一子集合內的任意兩個標準產品資訊的該至少一個非產品屬性參數之間的相似度達到第二閾值。
該設備還包括判斷模組16,用於判斷非標準產品資訊中的用於劃分集合的全部產品屬性參數的值是否都不符合設定的條件,若是,則觸發非標準參數確定模組13,否則,觸發標準參數確定模組11,該非標準產品資訊中的用於劃分集合的至少一個產品屬性參數的值不符合設定的條件。
根據判斷模組16的觸發,非標準參數確定模組13和標準參數確定模組11各自的運行過程如下:在非標準產品資訊中的用於劃分集合的全部產品屬性參數的值都不符合設定的條件時:該非標準參數確定模組13還用於確定該非標準產品資訊中的至少一個非產品屬性參數;該相似度確定模組14用於確定非標準產品資訊的非產品屬性參數與各子集合內的標準產品資訊中的非產品屬性參數的相似度;該第二劃分模組15還用於根據非產品屬性參數,將該非標準產品資訊劃分至一個子集合內,其中,該非標準產品資訊的非產品屬性參數與劃分至的子集合內的標準產品資訊中的非產品屬性參數的相似度達到第三閾值。
特殊地,非標準產品資訊中的用於劃分集合的全部產品屬性參數的值不符合設定的條件,且該非標準產品資訊的非產品屬性參數與任一子集合內的標準產品資訊中的非產品屬性參數的相似度低於第三閾值時,該第一劃分模組12還用於在非標準產品資訊中的用於劃分集合的全部產品屬性參數的值不符合設定的條件,且該非標準產品資訊的非產品屬性參數與任一子集合內的標準產品資訊中的非產品屬性參數的相似度低於第三閾值時,將該非標準產品資訊劃分至特定集合。
在非標準產品資訊中的用於劃分集合的全部產品屬性參數的值不全不符合設定的條件時:
該標準參數確定模組11還用於確定非標準產品資訊中用於劃分集合的產品屬性參數中值符合設定的條件的產品屬性參數;該第一劃分模組12還用於確定包含該值符合設定的條件的產品屬性參數的集合;該第二劃分模組15還用於根據非標準產品資訊的非產品屬性參數,將該非標準產品資訊劃分至第一劃分模組12確定的集合內的一個子集合中,其中,該非標準產品資訊的非產品屬性參數與劃分至的子集合內的標準產品資訊中的非產品屬性參數的相似度最高。
該設備還包括去重模組17,用於確定重複的標準產品資訊,保留其中一個標準產品資訊,去除剩餘的標準產品資訊,以及,確定重複的非標準產品資訊,保留其中一個非標準產品資訊,去除剩餘的非標準產品資訊,該重複的標準產品資訊間的產品屬性參數和非產品屬性參數都相同,該重複的非標準產品資訊間的產品屬性參數和非產品屬性參數都相同。
該設備還包括命名模組18,用於確定每一子集合的標準產品資訊和非標準產品資訊中的產品屬性參數和非產品屬性參數。統計確定該產品屬性參數和非產品屬性參數中的至少一個高頻詞,並利用確定的至少一個高頻詞為該子集合命名。
本實施例二中的資訊處理設備還可以包括能夠執行實施例一中涉及的各項功能的模組。
通過本申請實施例提供的方法及設備,可以在葉子類目的基礎上,以產品屬性參數為條件劃分細粒度的產品資訊集合,進一步地,還以非產品屬性參數為條件劃分更加細粒度的產品資訊子集合,使得在買家用戶搜索、查詢產品資訊時,以細粒度的產品資訊集合為基礎,可以有效減少搜索、查詢的時間、提高搜索、查詢的準確性以及提高網站伺服器向買家用戶推薦產品資訊的準確度,且細粒度的產品資訊集合也能夠提高對產品資訊進行操作的可用性,減少對產品資訊進行操作時的運算量;並且,在集合和子集合的劃分過程中,對多級類目體系的實質性內容沒有改變,遵守現有的多級類目體系的特點,且充分考慮買家用戶搜索習慣,將買家用戶常用於搜索的產品屬性參數用於劃分集合;另外,對於非標準產品資訊中的產品屬性參數的值不符合設定的條件的各種情況給出了對應的劃分手段,使得各非標準產品資訊能夠盡可能地劃分至相關性高的子集合中;最後,本申請方案還對產品資訊進行去重以及對劃分後的子集合進行命名,有效地減少了對重複產品資訊進行處理所佔用的資源,以及方便管理員根據子集合的名稱對子集合進行管理和以子集合的名稱為關鍵字查找子集合內的產品資訊。
本領域內的技術人員應明白,本申請的實施例可提供為方法、系統、或電腦程式產品。因此,本申請可採用完全硬體實施例、完全軟體實施例、或結合軟體和硬體方面的實施例的形式。而且,本申請可採用在一個或多個其中包含有電腦可用程式碼的電腦可用儲存媒體(包括但不限於磁盤記憶體、CD-ROM、光學記憶體等)上實施的電腦程式產品的形式。
本申請是參照根據本申請實施例的方法、設備(系統)、和電腦程式產品的流程圖和/或方框圖來描述的。應理解可由電腦程式指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些電腦程式指令到通用電腦、專用電腦、嵌入式處理機或其他可編程資料處理設備的處理器以產生一個機器,使得通過電腦或其他可編程資料處理設備的處理器執行的指令產生用於實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些電腦程式指令也可儲存在能引導電腦或其他可編程資料處理設備以特定方式工作的電腦可讀記憶體中,使得儲存在該電腦可讀記憶體中的指令產生包括指令裝置的製造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些電腦程式指令也可裝載到電腦或其他可編程資料處理設備上,使得在電腦或其他可編程設備上執行一系列操作步驟以產生電腦實現的處理,從而在電腦或其他可編程設備上執行的指令提供用於實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
儘管已描述了本申請的優選實施例,但本領域內的技術人員一旦得知了基本創造性概念,則可對這些實施例做出另外的變更和修改。所以,所附申請專利範圍意欲解釋為包括優選實施例以及落入本申請範圍的所有變更和修改。
顯然,本領域的技術人員可以對本申請進行各種改動和變型而不脫離本申請的精神和範圍。這樣,倘若本申請的這些修改和變型屬於本申請之申請專利範圍及其等同技術的範圍之內,則本申請也意圖包含這些改動和變型在內。
11...標準參數確定模組
12...第一劃分模組
13...非標準參數確定模組
14...相似度確定模組
15...第二劃分模組
16...判斷模組
17...去重模組
18...命名模組
21...屬性參數確定子模組
22...次數確定子模組
23...選擇子模組
圖1為本申請中的資訊處理設備在多級類目體系下的示意圖;
圖2為本申請實施例一中資訊處理方法示意圖;
圖3為本申請實施例二中資訊處理設備結構示意圖;
圖4為本申請實施例二中資訊處理設備中的標準參數確定模組結構示意圖。

Claims (13)

  1. 一種資訊處理的方法,其特徵在於,該方法包括:確定葉子類目下各標準產品資訊中的至少一個產品屬性參數,其中此步驟具體包括:確定葉子類目下各標準產品資訊中的全部產品屬性參數;確定設定時長內每一產品屬性參數作為搜索條件,在該葉子類目下進行產品資訊搜索的次數;從該全部產品屬性參數中選擇至少一個產品屬性參數,其中,選擇的任一產品屬性參數作為搜索條件進行產品資訊搜索的次數達到第一閾值且該產品屬性參數的值為離散型;利用確定的該至少一個產品屬性參數對該標準產品資訊進行劃分,得到該葉子類目下的多個集合;其中,劃分在同一集合內的標準產品資訊中的該至少一個產品屬性參數的值都相同。
  2. 如申請專利範圍第1項所述的方法,其中,對該標準產品資訊進行劃分,得到該葉子類目下的多個集合之後,該方法還包括:針對劃分後得到的每一集合,確定集合中各標準產品資訊中的至少一個非產品屬性參數;確定同一集合內各標準產品資訊的至少一個非產品屬性參數的相似度; 按照確定的相似度對同一集合內各標準產品資訊做進一步劃分,得到該集合下的多個子集合;其中,劃分在同一子集合內的任意兩個標準產品資訊的該至少一個非產品屬性參數之間的相似度達到第二閾值。
  3. 如申請專利範圍第2項所述的方法,其中,該方法還包括:確定葉子類目下的非標準產品資訊,該非標準產品資訊中的用於劃分集合的至少一個產品屬性參數的值不符合設定的條件;得到集合下的多個子集合之後,該方法還包括:判斷非標準產品資訊中的用於劃分集合的全部產品屬性參數的值是否都不符合設定的條件;若是,則確定該非標準產品資訊中的至少一個非產品屬性參數,並根據該非產品屬性參數將該非標準產品資訊劃分至一個子集合內,其中,該非標準產品資訊的非產品屬性參數與劃分至的子集合內的標準產品資訊中的非產品屬性參數的相似度達到第三閾值;若否,則確定非標準產品資訊中用於劃分集合的產品屬性參數中取值符合設定的條件的產品屬性參數,並確定包含取值符合設定的條件的產品屬性參數的集合,以及,根據非標準產品資訊的非產品屬性參數,將該非標準產品資訊劃分至確定的集合內的一個子集合中,其中,該非標準產品資訊的非產品屬性參數與劃分至的子集合內的標準 產品資訊中的非產品屬性參數的相似度最高。
  4. 如申請專利範圍第3項所述的方法,其中,在非標準產品資訊中的用於劃分集合的全部產品屬性參數的值不符合設定的條件,且該非標準產品資訊的非產品屬性參數與任一子集合內的標準產品資訊中的非產品屬性參數的相似度低於第三閾值時,將該非標準產品資訊劃分至特定集合。
  5. 如申請專利範圍第3或4項所述的方法,其中,該方法還包括:確定重複的標準產品資訊,保留其中一個標準產品資訊,去除剩餘的標準產品資訊;確定重複的非標準產品資訊,保留其中一個非標準產品資訊,去除剩餘的非標準產品資訊;該重複的標準產品資訊間的產品屬性參數和非產品屬性參數都相同,該重複的非標準產品資訊間的產品屬性參數和非產品屬性參數都相同。
  6. 如申請專利範圍第3或4項所述的方法,其中,確定每一子集合的標準產品資訊和非標準產品資訊中的產品屬性參數和非產品屬性參數;統計確定該產品屬性參數和非產品屬性參數中的至少一個高頻詞;利用確定的至少一個高頻詞為該子集合命名。
  7. 如申請專利範圍第1項所述的方法,其中,得到該葉子類目下的多個集合之後,該方法還包括: 根據得到的各集合中的標準產品資訊進行搜索或產品資訊推薦。
  8. 一種資訊處理的設備,其特徵在於,該設備包括:標準參數確定模組,用於確定葉子類目下各標準產品資訊中的至少一個產品屬性參數,其中該標準參數確定模組,包括:屬性參數確定子模組,用於確定葉子類目下各標準產品資訊中的全部產品屬性參數;次數確定子模組,確定設定時長內每一產品屬性參數作為搜索條件,在該葉子類目下進行產品資訊搜索的次數;選擇子模組,用於從該全部產品屬性參數中選擇至少一個產品屬性參數,其中,選擇的任一產品屬性參數作為搜索條件進行產品資訊搜索的次數達到第一閾值且該產品屬性參數的值為離散型;第一劃分模組,用於利用確定的該至少一個產品屬性參數對該標準產品資訊進行劃分,得到該葉子類目下的多個集合,其中,劃分在同一集合內的標準產品資訊中的該至少一個產品屬性參數的值都相同。
  9. 如申請專利範圍第8項所述的設備,其中,該設備還包括:非標準參數確定模組,用於針對劃分後得到的每一集合,確定集合中各標準產品資訊中的至少一個非產品屬性參數; 相似度確定模組,用於確定同一集合內各標準產品資訊的至少一個非產品屬性參數的相似度;第二劃分模組,用於按照確定的相似度對同一集合內各標準產品資訊做進一步劃分,得到該集合下的多個子集合,其中,劃分在同一子集合內的任意兩個標準產品資訊的該至少一個非產品屬性參數之間的相似度達到第二閾值。
  10. 如申請專利範圍第9項所述的設備,其中,該設備還包括:判斷模組,用於判斷非標準產品資訊中的用於劃分集合的全部產品屬性參數的值是否都不符合設定的條件,若是,則觸發非標準參數確定模組,否則,觸發標準參數確定模組,該非標準產品資訊中的用於劃分集合的至少一個產品屬性參數的值不符合設定的條件;該非標準參數確定模組,還用於確定該非標準產品資訊中的至少一個非產品屬性參數;該相似度確定模組,用於確定非標準產品資訊的非產品屬性參數與各子集合內的標準產品資訊中的非產品屬性參數的相似度;該標準參數確定模組,還用於確定非標準產品資訊中用於劃分集合的產品屬性參數中符合設定的條件的產品屬性參數;該第一劃分模組,還用於確定包含該符合設定的條件的產品屬性參數的集合; 該第二劃分模組,還用於根據非產品屬性參數,將該非標準產品資訊劃分至一個子集合內,其中,該非標準產品資訊的非產品屬性參數與劃分至的子集合內的標準產品資訊中的非產品屬性參數的相似度達到第三閾值,或者,根據非標準產品資訊的非產品屬性參數,將該非標準產品資訊劃分至第一劃分模組確定的集合內的一個子集合中,其中,該非標準產品資訊的非產品屬性參數與劃分至的子集合內的標準產品資訊中的非產品屬性參數的相似度最高。
  11. 如申請專利範圍第10項所述的設備,其中,該第一劃分模組,還用於在非標準產品資訊中的用於劃分集合的全部產品屬性參數的值不符合設定的條件,且該非標準產品資訊的非產品屬性參數與任一子集合內的標準產品資訊中的非產品屬性參數的相似度低於第三閾值時,將該非標準產品資訊劃分至特定集合。
  12. 如申請專利範圍第10或11項所述的設備,其中,該設備還包括:去重模組,用於確定重複的標準產品資訊,保留其中一個標準產品資訊,去除剩餘的標準產品資訊,以及,確定重複的非標準產品資訊,保留其中一個非標準產品資訊,去除剩餘的非標準產品資訊,該重複的標準產品資訊間的產品屬性參數和非產品屬性參數都相同,該重複的非標準產品資訊間的產品屬性參數和非產品屬性參數都相同。
  13. 如申請專利範圍第10或11項所述的設備,其中,該設備還包括:命名模組,用於確定每一子集合的標準產品資訊和非標準產品資訊中的產品屬性參數和非產品屬性參數,統計確定該產品屬性參數和非產品屬性參數中的至少一個高頻詞,並利用確定的至少一個高頻詞為該子集合命名。
TW099140209A 2010-09-21 2010-11-22 Information processing methods and equipment TWI525457B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102923840A CN102411591A (zh) 2010-09-21 2010-09-21 一种信息处理的方法及设备

Publications (2)

Publication Number Publication Date
TW201214166A TW201214166A (en) 2012-04-01
TWI525457B true TWI525457B (zh) 2016-03-11

Family

ID=45818676

Family Applications (1)

Application Number Title Priority Date Filing Date
TW099140209A TWI525457B (zh) 2010-09-21 2010-11-22 Information processing methods and equipment

Country Status (6)

Country Link
US (3) US8626798B2 (zh)
EP (1) EP2619718A4 (zh)
JP (1) JP5681801B2 (zh)
CN (1) CN102411591A (zh)
TW (1) TWI525457B (zh)
WO (1) WO2012039760A1 (zh)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5386663B1 (ja) * 2012-05-30 2014-01-15 楽天株式会社 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体
US8874499B2 (en) * 2012-06-21 2014-10-28 Oracle International Corporation Consumer decision tree generation system
CN103578015A (zh) * 2012-08-07 2014-02-12 阿里巴巴集团控股有限公司 一种商品属性导航的实现方法及装置
CN104239020A (zh) * 2013-06-21 2014-12-24 Sap欧洲公司 决策做出标准驱动的推荐
WO2015013954A1 (en) 2013-08-01 2015-02-05 Google Inc. Near-duplicate filtering in search engine result page of an online shopping system
JP5953277B2 (ja) * 2013-09-11 2016-07-20 日本電信電話株式会社 データ索引装置、データ索引方法及びプログラム
CN105096098A (zh) * 2014-05-21 2015-11-25 苏州市大创信息运用有限公司 基于递归和继承算法的设备配置树管理方法
CN105528446A (zh) * 2015-12-23 2016-04-27 北京奇虎科技有限公司 满足延伸产品需求的摘要生成方法及装置
US9672543B1 (en) * 2016-02-12 2017-06-06 Visa International Service Association System and method for device valuation
US10528992B2 (en) 2016-02-12 2020-01-07 Visa International Service Association System and method for automated execution of device-related services
JP6523188B2 (ja) * 2016-02-18 2019-05-29 株式会社東芝 作業手順生成支援装置、作業手順生成支援方法、およびプログラム
JP6246271B1 (ja) * 2016-06-30 2017-12-13 ヤフー株式会社 属性評価装置、販売システム、属性評価方法、および属性評価プログラム
CN107608983B (zh) * 2016-07-11 2021-03-30 阿里巴巴集团控股有限公司 标题信息优化方法、装置、设备及***
CN108230057A (zh) * 2016-12-09 2018-06-29 阿里巴巴集团控股有限公司 一种智能推荐方法及***
CN106599256B (zh) * 2016-12-21 2020-05-22 上海智臻智能网络科技股份有限公司 结构信息生成方法及装置、交互方法及装置
CN106933976B (zh) * 2017-02-14 2020-09-18 深圳奥比中光科技有限公司 建立人体3d净模型的方法及其在3d试衣中的应用
CN106933571A (zh) * 2017-02-16 2017-07-07 广州视源电子科技股份有限公司 白板文档存储方法及***
CN108491773B (zh) * 2018-03-12 2022-11-08 中国工商银行股份有限公司 一种识别方法及***
CN108711082A (zh) * 2018-03-26 2018-10-26 广东小天才科技有限公司 餐厅推荐方法、装置、餐饮服务器及存储介质
CN109272373B (zh) * 2018-08-02 2021-09-14 创新先进技术有限公司 一种基于计算机的品牌推荐方法
CN112016582B (zh) * 2019-05-31 2023-11-24 口口相传(北京)网络技术有限公司 菜品推荐方法及其装置
CN111126442B (zh) * 2019-11-26 2021-04-30 北京京邦达贸易有限公司 一种物品关键属性生成方法、物品分类方法和装置
CN112819533A (zh) * 2021-01-29 2021-05-18 深圳脉腾科技有限公司 信息推送方法、装置、电子设备及存储介质
CN113744021A (zh) * 2021-02-08 2021-12-03 北京沃东天骏信息技术有限公司 一种推荐方法、装置、计算机存储介质及***
CN113240252B (zh) * 2021-04-28 2024-01-12 中核工程咨询有限公司 核电工程质量评价数据处理方法、装置、设备及存储介质
US11941076B1 (en) * 2022-09-26 2024-03-26 Dell Products L.P. Intelligent product sequencing for category trees

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06211323A (ja) * 1992-11-30 1994-08-02 Olympus Optical Co Ltd 物流管理システム
US7082426B2 (en) 1993-06-18 2006-07-25 Cnet Networks, Inc. Content aggregation method and apparatus for an on-line product catalog
JP4237312B2 (ja) * 1998-11-27 2009-03-11 新日鉄ソリューションズ株式会社 商品取引処理装置
US6128626A (en) * 1998-06-30 2000-10-03 Bull Hn Information Systems Inc. Method for minimizing storage requirements for production assembly information and updates
US7107226B1 (en) * 1999-01-20 2006-09-12 Net32.Com, Inc. Internet-based on-line comparison shopping system and method of interactive purchase and sale of products
US6529898B1 (en) * 1999-07-22 2003-03-04 Matthew Shawn Fortner Method and system for electronically retrieving door hardware data
US6981040B1 (en) * 1999-12-28 2005-12-27 Utopy, Inc. Automatic, personalized online information and product services
US6625619B1 (en) 2000-03-15 2003-09-23 Building Systems Design, Inc. Electronic taxonomy for construction product information
US20010049677A1 (en) * 2000-03-30 2001-12-06 Iqbal Talib Methods and systems for enabling efficient retrieval of documents from a document archive
US7523114B2 (en) 2000-04-24 2009-04-21 Ebay Inc. Method and system for categorizing items in both actual and virtual categories
JP2002032417A (ja) * 2000-07-14 2002-01-31 Ebara Corp 部品管理方法、部品管理サーバ及び構成ツリー
US20020026386A1 (en) 2000-08-17 2002-02-28 Walden John C. Personalized storage folder & associated site-within-a-site web site
US6910044B2 (en) * 2000-09-20 2005-06-21 Sap Aktiengesellschaft Method and apparatus for structuring, maintaining, and using families of data
US10282765B2 (en) * 2001-09-27 2019-05-07 Jda Software Group, Inc. Order acceleration through user document storage and reuse
JP4251897B2 (ja) * 2003-03-26 2009-04-08 富士通株式会社 商品情報提供方法及びプログラム
JP2007115222A (ja) * 2005-09-26 2007-05-10 Sony Corp 情報処理装置および方法、並びにプログラム
US7849047B2 (en) 2006-02-09 2010-12-07 Ebay Inc. Method and system to analyze domain rules based on domain coverage of the domain rules
CN101266603B (zh) * 2007-03-12 2010-09-08 北京搜狗科技发展有限公司 一种网页信息分类方法、***及应用该分类的服务***
KR100893129B1 (ko) * 2007-10-24 2009-04-15 엔에이치엔(주) 멀티 미디어 컨텐츠의 추천 키워드 추출 시스템 및 그 방법
US20090119172A1 (en) 2007-11-02 2009-05-07 Soloff David L Advertising Futures Marketplace Methods and Systems
JP4783775B2 (ja) * 2007-11-21 2011-09-28 ヤフー株式会社 商品情報分類装置、プログラム、商品情報分類方法
JP5299624B2 (ja) * 2009-01-29 2013-09-25 ヤフー株式会社 商品検索装置、および商品検索装置の動作方法
DE102009038007A1 (de) * 2009-08-20 2011-03-03 Dynapac Gmbh Verfahren zur Herstellung eines Straßenbelags, vorzugsweise eines Beton-Straßenbelags, und Straßenfertiger

Also Published As

Publication number Publication date
US9524310B2 (en) 2016-12-20
CN102411591A (zh) 2012-04-11
WO2012039760A8 (en) 2013-04-04
EP2619718A4 (en) 2015-08-12
US8626798B2 (en) 2014-01-07
US20140143094A1 (en) 2014-05-22
US8903868B2 (en) 2014-12-02
TW201214166A (en) 2012-04-01
JP5681801B2 (ja) 2015-03-11
JP2013541090A (ja) 2013-11-07
EP2619718A1 (en) 2013-07-31
US20150100585A1 (en) 2015-04-09
WO2012039760A1 (en) 2012-03-29
US20120072462A1 (en) 2012-03-22

Similar Documents

Publication Publication Date Title
TWI525457B (zh) Information processing methods and equipment
CN106484875B (zh) 基于molap的数据处理方法及装置
Mendes et al. Sieve: linked data quality assessment and fusion
US9690846B2 (en) Intelligent navigation of a category system
CN104866474B (zh) 个性化数据搜索方法及装置
CN105765573B (zh) 网站通信量优化方面的改进
US9747349B2 (en) System and method for distributing queries to a group of databases and expediting data access
WO2016003427A1 (en) Automatic generation of sub-queries
JP2010541092A5 (zh)
CN101425063A (zh) 多维度数据集的显示及浏览的方法及设备
US20160092556A1 (en) Generation of data for a dendrogrammatic tree data structure
EP2668590A1 (en) Identifying categorized misplacement
TW201140349A (en) Compensating for unbalanced hierarchies when generating OLAP queries from report specifications
CN107368501B (zh) 数据的处理方法及装置
JP2006164256A5 (zh)
CN110674387B (zh) 用于数据搜索的方法、装置和计算机存储介质
CN113590931A (zh) 利用变体的用户活动数据来改进搜索
CN103186650A (zh) 一种搜索方法和装置
CN111125499A (zh) 数据查询方法及装置
US20180349372A1 (en) Media item recommendations based on social relationships
CN111930967B (zh) 一种基于知识图谱的数据查询方法、装置及存储介质
EP2636014A2 (en) Product information search
JP5545896B2 (ja) 処理装置、処理方法、及びプログラム
TWI547888B (zh) A method of recording user information and a search method and a server
KR101545216B1 (ko) 데이터 모델링 방법 및 장치