TWI778481B - 用於基於ai的產品整合及去冗餘的電腦實行系統及使用ai對產品進行整合及去冗餘的方法 - Google Patents
用於基於ai的產品整合及去冗餘的電腦實行系統及使用ai對產品進行整合及去冗餘的方法 Download PDFInfo
- Publication number
- TWI778481B TWI778481B TW109146299A TW109146299A TWI778481B TW I778481 B TWI778481 B TW I778481B TW 109146299 A TW109146299 A TW 109146299A TW 109146299 A TW109146299 A TW 109146299A TW I778481 B TWI778481 B TW I778481B
- Authority
- TW
- Taiwan
- Prior art keywords
- product
- machine learning
- learning model
- information associated
- keywords
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 91
- 230000010354 integration Effects 0.000 title claims description 33
- 238000010801 machine learning Methods 0.000 claims abstract description 102
- 239000013598 vector Substances 0.000 claims description 54
- 238000001914 filtration Methods 0.000 claims description 7
- 239000000463 material Substances 0.000 claims description 6
- 230000013016 learning Effects 0.000 claims description 2
- 239000000047 product Substances 0.000 description 592
- 230000008569 process Effects 0.000 description 57
- 238000012549 training Methods 0.000 description 38
- 239000011159 matrix material Substances 0.000 description 29
- 238000012384 transportation and delivery Methods 0.000 description 29
- 238000007781 pre-processing Methods 0.000 description 17
- 238000003860 storage Methods 0.000 description 16
- 238000004422 calculation algorithm Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000007726 management method Methods 0.000 description 8
- 238000013068 supply chain management Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000013145 classification model Methods 0.000 description 6
- 230000002452 interceptive effect Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000012856 packing Methods 0.000 description 4
- 229920001690 polydopamine Polymers 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 201000007197 atypical autism Diseases 0.000 description 3
- 238000013475 authorization Methods 0.000 description 3
- 208000029560 autism spectrum disease Diseases 0.000 description 3
- 230000002354 daily effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000001407 pulse-discharge detection Methods 0.000 description 3
- 230000007723 transport mechanism Effects 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 241001272996 Polyphylla fullo Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000035045 associative learning Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010224 classification analysis Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/087—Inventory or stock management, e.g. order filling, procurement or balancing against orders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/258—Heading extraction; Automatic titling; Numbering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K19/00—Record carriers for use with machines and with at least a part designed to carry digital markings
- G06K19/06—Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Medical Informatics (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- Multimedia (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Algebra (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Library & Information Science (AREA)
Abstract
本發明提供用於使用AI對產品進行整合及去冗餘的系統
及方法。一個方法包括:接收至少一個請求以登記第一產品;搜尋第二產品的至少一個資料儲存;使用機器學習模型標記來自與第一產品相關聯的產品資訊的至少一個關鍵字且標記來自與第二產品相關聯的產品資訊的至少一個關鍵字;使用機器學習模型判定第一產品與第二產品之間的匹配分數;在匹配分數高於第一預定臨限值時,使用機器學習模型判定第一產品等同於第二產品;以及在匹配分數低於第一預定臨限值時,使用機器學習模型判定第一產品並非第二產品。
Description
本揭露大體上是關於使用人工智慧於產品整合與去冗餘之電腦化系統以及方法。特定而言,本揭露的實施例是關於與以下各項有關的發明性及非習知系統:接收與第一產品相關聯的產品資訊,收集與第二產品相關聯的產品資訊,判定第一產品與第二產品之間的匹配分數,基於匹配分數判定第一產品與第二產品是否等同,基於所述判定對第一產品及第二產品進行整合及去冗餘,以及登記第一產品。
消費者常常經由電腦及智慧型裝置線上採購及購買各種物件。此等線上購物者常常使用搜尋引擎來尋找購買的產品。然而,由於搜尋結果網頁將相同產品作為不同產品顯示多次,阻礙了正常的線上購物體驗。
每天數百萬產品由賣方線上登記。賣方在線上登記其產品以供銷售時需要正確地標註其產品。然而,許多不同賣方意外
地或有意地利用不相關字或獨特短語來標註其產品,使得其產品被登記成與其他賣方不同的產品。舉例而言,第一賣方可將其產品標註為「限量版」,而第二賣方可將同一產品標註為「限量銷售」。無法將兩種產品識別為等同產品的產品登記系統可能由於延長消費者產品搜尋時間且由於降低線上平台的推薦品質而嚴重地降低消費者的使用者體驗。此外,由於每天登記數百萬產品,故手動地對產品進行整合及去冗餘常常是困難且耗時的。若線上平台自動地對等同產品去冗餘且將等同產品整合至單個搜尋結果中,則將顯著地改良消費者的使用者體驗,從而允許同一產品的賣方競爭針對所列產品推薦的「最佳賣方」。
因此,需要用於產品整合與去冗餘的改良方法及系統,使得消費者可在線上購物時迅速尋找及購買產品。
本揭露的一個態樣是關於一種用於基於AI的產品整合及去冗餘的電腦實行系統。系統可包括:至少一個處理器;以及至少一個非暫時性儲存媒體,包括在由至少一個處理器執行時使得至少一個處理器執行步驟的指令。步驟可包括:接收至少一個請求以登記第一產品;接收與第一產品相關聯的產品資訊;搜尋第二產品的至少一個資料儲存;使用機器學習模型收集與第二產品相關聯的產品資訊;使用機器學習模型標記來自與第一產品相關聯的產品資訊的至少一個關鍵字且標記來自與第二產品相關聯的產品資訊的至少一個關鍵字;藉由使用與第一產品及第二產品相關聯的經標記關鍵字,使用機器學習模型判定第一產品與第二產
品之間的匹配分數;在匹配分數高於第一預定臨限值時,使用機器學習模型判定第一產品等同於第二產品,且修改至少一個資料儲存以包含指示第一產品等同於第二產品的資料;在匹配分數低於第一預定臨限值時,使用機器學習模型判定第一產品並非第二產品,且修改至少一個資料儲存以包含指示第一產品並非第二產品的資料;登記第一產品;以及修改網頁以包含第一產品的登記。
本揭露的另一態樣是關於一種用於使用AI對產品進行整合及去冗餘的方法。方法可包括:接收至少一個請求以登記第一產品;接收與第一產品相關聯的產品資訊;搜尋第二產品的至少一個資料儲存;使用機器學習模型收集與第二產品相關聯的產品資訊;使用機器學習模型標記來自與第一產品相關聯的產品資訊的至少一個關鍵字且標記來自與第二產品相關聯的產品資訊的至少一個關鍵字;藉由使用與第一產品及第二產品相關聯的經標記關鍵字,使用機器學習模型判定第一產品與第二產品之間的匹配分數;在匹配分數高於第一預定臨限值時,使用機器學習模型判定第一產品等同於第二產品,且修改至少一個資料儲存以包含指示第一產品等同於第二產品的資料;在匹配分數低於第一預定臨限值時,使用機器學習模型判定第一產品並非第二產品,且修改至少一個資料儲存以包含指示第一產品並非第二產品的資料;登記第一產品;以及修改網頁以包含第一產品的登記。
本揭露的又一態樣是關於一種用於基於AI的產品整合及去冗餘的電腦實行系統。系統可包括:至少一個處理器;以及至少一個非暫時性儲存媒體,包括在由至少一個處理器執行時使得至少一個處理器執行步驟的指令。步驟可包括:接收至少一個請
求以登記第一產品;接收與第一產品相關聯的產品資訊;搜尋第二產品的至少一個資料儲存;使用第一機器學習模型收集與第二產品相關聯的產品資訊;使用第一機器學習模型標記來自與第一產品相關聯的產品資訊的至少一個關鍵字且標記來自與第二產品相關聯的產品資訊的至少一個關鍵字;藉由使用與第一產品及第二產品相關聯的經標記關鍵字,使用第一機器學習模型判定第一產品與第二產品之間的匹配分數;在匹配分數高於第一預定臨限值時,使用第一機器模型判定第一產品等同於第二產品,且修改至少一個資料儲存以包含指示第一產品等同於第二產品的資料;在匹配分數低於第一預定臨限值時,使用第一機器模型判定第一產品並非第二產品,且修改至少一個資料儲存以包含指示第一產品並非第二產品的資料;登記第一產品;以及修改網頁以包含第一產品的登記。步驟可更包括:使用第二機器學習模型收集與多個第三產品相關聯的產品資訊;使用第二機器學習模型標記來自與多個第三產品相關聯的產品資訊的多個關鍵字;藉由使用與多個第三產品相關聯的經標記關鍵字,使用第二機器學習模型判定多個第三產品之間的多個第二匹配分數;在多個第二匹配分數中的任一者高於第一預定臨限值時,使用第二機器學習模型判定與第二匹配分數相關聯的第三產品是等同的,且對等同第三產品進行去冗餘;以及修改網頁以包含等同第三產品的去冗餘。
本文中亦論述其他系統、方法以及電腦可讀媒體。
100、400、500:系統
101:運送授權技術系統
102A、107A、107B、107C、119A、119B、119C:行動裝置
102B:電腦
103:外部前端系統
105:內部前端系統
107:運輸系統
109:賣方入口網站
111:運送及訂單追蹤系統
113:履行最佳化系統
115:履行通信報閘道
117:供應鏈管理系統
119:倉庫管理系統
121A、121B、121C:第3方履行系統
123:履行中心授權系統
125:勞動管理系統
200:履行中心
201、222:卡車
202A、202B、208:物件
203:入站區
205:緩衝區
206:叉車
207:卸貨區
209:揀貨區
210:儲存單元
211:包裝區
213:樞紐區
214:運輸機構
215:營地區
216:牆
218、220:包裹
224A、224B:遞送工作者
226:汽車
300:SRP
310:產品
410:線上匹配訓練資料系統
412、422、432、442:處理器
414、424、434、444:記憶體
416、426、436、446、516、620、630:資料庫
420:線上匹配預處理系統
430:線上匹配模型訓練器
440:線上匹配模型系統
450、550:網路
460、560:使用者裝置
460A、560A:使用者
520:單個產品離線匹配系統
530:批量產品離線匹配系統
600、640、650:候選項搜尋系統
601、602、603、604、605、606、607、611、612、613、614、1001、1003、1005、1007、1009、1011:步驟
700、800:類別預測系統
701、801:候選項
702:分類模型
703:訓練資料
704:模型訓練器
705:匹配分數
800CA、800CB、800CC、800D、800E、800F、801CA:過程
802:產品集群
804:符記向量
805:產品對級別符記匹配張量
806:產品對級別一般特徵向量張量
807:向量
808:預測模型
809:產品對
820、821、822、823、824、825、826、827、828:單元
900:資料
910:品牌
912:性別
914:鞋型
916:顏色
918:大小
920:型號
WC、WD、WG、WT:權重矩陣
圖1A為與所揭露實施例一致的示出包括用於實現運送、運輸以及物流操作的通信的電腦化系統的網路的例示性實施例的示意性方塊圖。
圖1B描繪與所揭露實施例一致的包含滿足搜尋請求的一或多個搜尋結果以及交互式使用者介面元素的樣本搜尋結果頁(Search Result Page;SRP)。
圖1C描繪與所揭露實施例一致的包含產品及關於所述產品的資訊以及交互式使用者介面元素的樣本單一詳情頁(Single Detail Page;SDP)。
圖1D描繪與所揭露實施例一致的包含虛擬購物車中的物件以及交互式使用者介面元素的樣本購物車頁。
圖1E描繪與所揭露實施例一致的包含來自虛擬購物車的物件以及關於購買及運送的資訊以及交互式使用者介面元素的樣本訂單頁。
圖2為與所揭露實施例一致的組態成利用所揭露電腦化系統的例示性履行中心的圖解圖示。
圖3描繪與所揭露實施例一致的包含在不具有產品整合及去冗餘系統的情況下產生的一或多個搜尋結果的樣本SRP。
圖4為與所揭露實施例一致的示出包括用於基於AI的產品整合及去冗餘的電腦化系統的網路的例示性實施例的示意性方塊圖。
圖5為與所揭露實施例一致的示出包括用於基於AI的產品整合及去冗餘的電腦化系統的網路的例示性實施例的示意性方塊圖。
圖6為與所揭露實施例一致的示出用於基於AI的產品整合及去冗余的候選項搜尋系統的例示性實施例的過程。
圖7為與所揭露實施例一致的示出用於基於AI的產品整合及去冗餘的類別預測系統的例示性實施例的過程。
圖8A為與所揭露實施例一致的示出用於基於AI的產品整合及去冗餘的類別預測系統的例示性實施例的過程。
圖8B為與所揭露實施例一致的示出用於基於AI的產品整合及去冗余的計算符記向量的例示性實施例的過程。
圖8CA至圖8F為與所揭露實施例一致的示出用於基於AI的產品整合及去冗餘的將特徵合併至一個向量中的例示性實施例的過程。
圖9描繪與所揭露實施例一致的用於基於AI的產品整合及去冗餘的樣本經標記資料。
圖10描繪與所揭露實施例一致的用於使用AI對產品進行整合及去冗餘的過程。
以下詳細描述參考隨附圖式。只要可能,即在圖式及以下描述中使用相同附圖標號來指代相同或類似部分。儘管本文中描述若干示出性實施例,但修改、調適以及其他實施方案是可能的。舉例而言,可對圖式中所示出的組件及步驟進行替代、添加或修改,且可藉由取代、重新排序、移除步驟或將步驟添加至所揭露方法來修改本文中所描述的示出性方法。因此,以下詳細描述不限於所揭露實施例及實例。實情為,本發明的正確範圍由隨
附申請專利範圍界定。
本揭露的實施例是關於組態成用於使用AI進行產品整合及去冗餘的系統及方法。所揭露實施例有利地能夠在線即時地自動對產品進行整合及去冗餘且離線具有大量產品。舉例而言,線上匹配系統可經由使用者裝置自使用者(例如賣方)接收登記第一產品的新請求。新請求可包含與待登記的第一產品相關聯的產品資訊資料(例如產品識別編號、類別識別、產品名稱、產品影像URL、產品品牌、產品描述、製造商、供應商、屬性、型號、條碼等)。線上匹配系統可使用來自與第一產品相關聯的產品資訊資料的關鍵字來搜尋第二產品的資料庫。在一些實施例中,線上匹配系統可使用搜尋引擎(例如彈性搜尋(Elasticsearch))來搜尋含有第一產品的關鍵字、短語、關鍵字在短語中的位置等給定關鍵字的資料庫的倒置索引。
在一些實施方案中,線上匹配系統可使用機器學習模型來判定第一產品與第二產品中的每一者之間的匹配分數。可使用與第一產品及第二產品相關聯的經標記關鍵字來計算匹配分數。可使用方法(例如彈性搜尋、傑卡德(Jaccard)、樸素貝葉斯(naïve Bayes)、W-CODE、ISBN等)的任何組合來計算匹配分數。舉例而言,可藉由量測第一產品的關鍵字與第二產品的關鍵字之間的拼寫相似性來計算匹配分數。在一些實施例中,可基於第一產品與第二產品之間的共用關鍵字的數目來計算匹配分數。線上匹配系統的機器學習模型可在匹配分數高於預定臨限值時判定第一產品等同於第二產品中的一者(例如,具有最高匹配分數及最小匹配屬性數目的第二產品,與最高匹配分數相關聯的第二產品,具
有最高匹配分數及一定價格範圍內的價格的第二產品等)。機器學習模型可接著修改資料庫以包含指示第一產品等同於第二產品的資料,藉此將產品合併至單個列表中且防止產品複製。在匹配分數並不符合預定臨限值時,機器學習模型可判定第一產品並非第二產品中的任一者。機器學習模型可接著修改資料庫以包含指示第一產品並非第二產品中的任一者的資料,藉此將第一產品作為不同的新列表列出。
在一些實施例中,離線匹配系統可在線上匹配系統未操作時操作。舉例而言,離線匹配系統可定期(例如每日)且獨立於線上匹配系統操作。線上匹配系統可在時間約束(例如15分鐘)下操作,使得賣方可在無延遲的情況下登記新產品。離線匹配系統可在無時間約束的情況下操作,因此可針對第一批的多個產品及第二批的多個產品計算匹配分數。由於離線匹配系統可在無時間約束的情況下操作,故離線匹配系統可使用更昂貴的計算邏輯(例如梯度提昇、卷積神經網路等)。與線上匹配系統類似,離線匹配系統可使用機器學習模型來標記來自與第一批及第二批的產品相關聯的產品資訊的多個關鍵字,且判定第一批及第二批的產品的任何組合之間的多個匹配分數。可藉由使用經標記關鍵字來判定匹配分數。在匹配分數高於預定臨限值時,機器學習模型可判定與匹配分數相關聯的產品是等同的。機器學習模型可自第一等同產品相關聯的列表移除第一等同產品,且將彼第一等同產品添加至與第二等同產品相關聯的列表以便對產品進行整合及去冗餘。
參考圖1A,繪示示出包括用於允許運送、運輸以及物流
操作的通信的電腦化系統的系統的例示性實施例的示意性方塊圖100。如圖1A中所示出,系統100可包含各種系統,所述系統中的每一者可經由一或多個網路彼此連接。所述系統亦可經由直接連接(例如,使用電纜)彼此連接。所描繪系統包含運送授權技術(shipment authority technology;SAT)系統101、外部前端系統103、內部前端系統105、運輸系統107、行動裝置107A、行動裝置107B以及行動裝置107C、賣方入口網站109、運送及訂單追蹤(shipment and order tracking;SOT)系統111、履行最佳化(fulfillment optimization;FO)系統113、履行通信報閘道(fulfillment messaging gateway;FMG)115、供應鏈管理(supply chain management;SCM)系統117、倉庫管理系統119、行動裝置119A、行動裝置119B以及行動裝置119C(描繪為在履行中心(FC)200內部)、第3方履行系統121A、第3方履行系統121B以及第3方履行系統121C、履行中心授權系統(fulfillment center authorization;FC Auth)123以及勞動管理系統(labor management system;LMS)125。
在一些實施例中,SAT系統101可實行為監視訂單狀態及遞送狀態的電腦系統。舉例而言,SAT系統101可判定訂單是否超過其承諾遞送日期(Promised Delivery Date;PDD)且可採取適當的動作,包含發起新訂單、對未遞送訂單中的物件進行重新運送、取消未遞送訂單、發起與訂購客戶的連絡,或類似者。SAT系統101亦可監視其他資料,包含輸出(諸如在特定時間段期間運送的包裹的數目)及輸入(諸如接收到的用於運送的空紙板盒的數目)。SAT系統101亦可充當系統100中的不同裝置之間的閘
道,從而(例如,使用儲存及轉發或其他技術)實現諸如外部前端系統103及FO系統113的裝置之間的通信。
在一些實施例中,外部前端系統103可實行為使得外部使用者能夠與系統100中的一或多個系統交互的電腦系統。舉例而言,在系統100使得系統的呈現能夠允許使用者針對物件下訂單的實施例中,外部前端系統103可實行為接收搜尋請求、呈現物件頁以及索求支付資訊的網頁伺服器。舉例而言,外部前端系統103可實行為電腦或電腦運行軟體,諸如阿帕奇(Apache)HTTP伺服器、微軟網際網路資訊服務(Internet Information Service;IIS)、NGINX,或類似者。在其他實施例中,外部前端系統103可運行經設計以接收及處理來自外部裝置(例如,行動裝置102A或電腦102B)的請求、基於彼等請求自資料庫及其他資料儲存庫獲取資訊,以及基於所獲取的資訊將回應提供至接收到的請求的定製網頁伺服器軟體。
在一些實施例中,外部前端系統103可包含網頁快取系統、資料庫、搜尋系統或支付系統中的一或多者。在一個態樣中,外部前端系統103可包括此等系統中的一或多者,而在另一態樣中,外部前端系統103可包括連接至此等系統中的一或多者的介面(例如,伺服器至伺服器、資料庫至資料庫,或其他網路連接)。
藉由圖1B、圖1C、圖1D以及圖1E所示出的例示性步驟集合將有助於描述外部前端系統103的一些操作。外部前端系統103可自系統100中的系統或裝置接收資訊以供呈現及/或顯示。舉例而言,外部前端系統103可代管或提供一或多個網頁,包含搜尋結果頁(SRP)(例如,圖1B)、單一詳情頁(Single Detail
Page;SDP)(例如,圖1C)、購物車頁(例如,圖1D),或訂單頁(例如,圖1E)。(例如,使用行動裝置102A或電腦102B的)使用者裝置可導航至外部前端系統103且藉由將資訊輸入至搜尋方塊中來請求搜尋。外部前端系統103可向系統100中的一或多個系統請求資訊。舉例而言,外部前端系統103可向FO系統113請求滿足搜尋請求的資訊。外部前端系統103亦可(自FO系統113)請求及接收包含於搜尋結果中的每一產品的承諾遞送日期或「PDD」。在一些實施例中,PDD可表示在特定時間段內(例如,在一天結束(下午11:59)前)訂購的情況下對含有產品的包裹將何時抵達使用者的所要位置或承諾將產品遞送至使用者的所要位置處的日期的估計。(PDD在下文相對於FO系統113進一步論述。)
外部前端系統103可基於資訊來準備SRP(例如,圖1B)。SRP可包含滿足搜尋請求的資訊。舉例而言,此可包含滿足搜尋請求的產品的圖像。SRP亦可包含每一產品的各別價格,或與每一產品的增強遞送選項、PDD、重量、大小、報價、折扣或類似者相關的資訊。外部前端系統103可(例如,經由網路)將SRP發送至請求使用者裝置。
使用者裝置可接著例如藉由點選或輕觸使用者介面或使用另一輸入裝置自SRP選擇產品,以選擇表示於SRP上的產品。使用者裝置可製訂對關於所選產品的資訊的請求且將其發送至外部前端系統103。作為回應,外部前端系統103可請求與所選產品相關的資訊。舉例而言,資訊可包含除針對各別SRP上的產品呈現的資訊以外的額外資訊。此可包含例如保存期限、原產國、重
量、大小、包裹中的物件的數目、處置說明,或關於產品的其他資訊。資訊亦可包含類似產品的推薦(基於例如巨量資料及/或對購買此產品及至少一個其他產品的客戶的機器學習分析)、頻繁詢問的問題的答案、來自客戶的評論、製造商資訊、圖像,或類似者。
外部前端系統103可基於接收到的產品資訊來準備SDP(單一詳情頁)(例如,圖1C)。SDP亦可包含其他交互式元素,諸如「現在購買」按鈕、「添加至購物車」按鈕、數量欄、物件的圖像,或類似者。SDP可更包含提供產品的賣方的列表。可基於每一賣方提供的價格來對列表進行排序,使得可在頂部處列出提供以最低價格出售產品的賣方。亦可基於賣方排名來對列表進行排序,使得可在頂部處列出排名最高的賣方。可基於多個因素來製訂賣方排名,所述因素包含例如賣方的符合承諾PDD的過去的追蹤記錄。外部前端系統103可(例如,經由網路)將SDP遞送至請求使用者裝置。
請求使用者裝置可接收列出產品資訊的SDP。在接收到SDP後,使用者裝置可接著與SDP交互。舉例而言,請求使用者裝置的使用者可點選或以其他方式與SDP上的「放在購物車中」按鈕交互。此將產品添加至與使用者相關聯的購物車。使用者裝置可將把產品添加至購物車的此請求傳輸至外部前端系統103。
外部前端系統103可產生購物車頁(例如,圖1D)。在一些實施例中,購物車頁列出使用者已添加至虛擬「購物車」的產品。使用者裝置可藉由在SRP、SDP或其他頁上的圖標上點選或以其他方式與所述圖標交互來請求購物車頁。在一些實施例
中,購物車頁可列出使用者已添加至購物車的所有產品,以及關於購物車中的產品的資訊(諸如每一產品的數量、每一產品每物件的價格、每一產品基於相關聯數量的價格)、關於PDD的資訊、遞送方法、運送成本、用於修改購物車中的產品(例如,刪除或修改數量)的使用者介面元素、用於訂購其他產品或設置產品的定期遞送的選項、用於設置利息支付的選項、用於前進至購買的使用者介面元素,或類似者。使用者裝置處的使用者可在使用者介面元素(例如,寫著「現在購買」的按鈕)上點選或以其他方式與所述使用者介面元素交互,以發起對購物車中的產品的購買。在如此做後,使用者裝置可將發起購買的此請求傳輸至外部前端系統103。
外部前端系統103可回應於接收到發起購買的請求而產生訂單頁(例如,圖1E)。在一些實施例中,訂單頁重新列出來自購物車的物件且請求支付及運送資訊的輸入。舉例而言,訂單頁可包含請求關於購物車中的物件的購買者的資訊(例如,姓名、地址、電子郵件地址、電話號碼)、關於接收者的資訊(例如,姓名、地址、電話號碼、遞送資訊)、運送資訊(例如,遞送及/或揀貨的速度/方法)、支付資訊(例如,***、銀行轉賬、支票、儲存的積分)的部分、請求現金收據(例如,出於稅務目的)的使用者介面元素,或類似者。外部前端系統103可將訂單頁發送至使用者裝置。
使用者裝置可輸入關於訂單頁的資訊,且點選或以其他方式與將資訊發送至外部前端系統103的使用者介面元素交互。自此處,外部前端系統103可將資訊發送至系統100中的不同系
統,以使得能夠創建及處理具有購物車中的產品的新訂單。
在一些實施例中,外部前端系統103可進一步組態成使得賣方能夠傳輸及接收與訂單相關的資訊。
在一些實施例中,內部前端系統105可實行為使得內部使用者(例如,擁有、操作或租用系統100的組織的雇員)能夠與系統100中的一或多個系統交互的電腦系統。舉例而言,在系統100使得系統的呈現能夠允許使用者針對物件下訂單的實施例中,內部前端系統105可實行為使得內部使用者能夠查看關於訂單的診斷及統計資訊、修改物件資訊或審查與訂單相關的統計的網頁伺服器。舉例而言,內部前端系統105可實行為電腦或電腦運行軟體,諸如阿帕奇HTTP伺服器、微軟網際網路資訊服務(IIS)、NGINX,或類似者。在其他實施例中,內部前端系統105可運行經設計以接收及處理來自系統100中所描繪的系統或裝置(以及未描繪的其他裝置)的請求、基於彼等請求自資料庫及其他資料儲存庫獲取資訊,以及基於所獲取的資訊來將回應提供至接收到的請求的定製網頁伺服器軟體。
在一些實施例中,內部前端系統105可包含網頁快取系統、資料庫、搜尋系統、支付系統、分析系統、訂單監視系統或類似者中的一或多者。在一個態樣中,內部前端系統105可包括此等系統中的一或多者,而在另一態樣中,內部前端系統105可包括連接至此等系統中的一或多者的介面(例如,伺服器至伺服器、資料庫至資料庫,或其他網路連接)。
在一些實施例中,運輸系統107可實行為實現系統100中的系統或裝置與行動裝置107A至行動裝置107C之間的通信的
電腦系統。在一些實施例中,運輸系統107可自一或多個行動裝置107A至行動裝置107C(例如,行動電話、智慧型手機、PDA,或類似者)接收資訊。舉例而言,在一些實施例中,行動裝置107A至行動裝置107C可包括由遞送工作者操作的裝置。遞送工作者(其可為永久雇員、暫時雇員或輪班雇員)可利用行動裝置107A至行動裝置107C來實現對含有由使用者訂購的產品的包裹的遞送。舉例而言,為遞送包裹,遞送工作者可在行動裝置上接收指示遞送哪一包裹及將所述包裹遞送到何處的通知。在抵達遞送位置後,遞送工作者可(例如,在卡車的後部中或在包裹的條板箱中)定位包裹、使用行動裝置掃描或以其他方式擷取與包裹上的識別符(例如,條碼、影像、文字串、RFID標籤,或類似者)相關聯的資料,且遞送包裹(例如,藉由將其留在前門處、將其留給警衛、將其交給接收者,或類似者)。在一些實施例中,遞送工作者可使用行動裝置擷取包裹的相片及/或可獲得簽名。行動裝置可將資訊發送至運輸系統107,所述資訊包含關於遞送的資訊,包含例如時間、日期、GPS位置、相片、與遞送工作者相關聯的識別符、與行動裝置相關聯的識別符,或類似者。運輸系統107可在資料庫(未描繪)中儲存此資訊以用於由系統100中的其他系統訪問。在一些實施例中,運輸系統107可使用此資訊來準備追蹤資料且將所述追蹤資料發送至其他系統,從而指示特定包裹的位置。
在一些實施例中,某些使用者可使用一個種類的行動裝置(例如,永久工作者可使用具有定製硬體(諸如條碼掃描器、尖筆以及其他裝置)的專用PDA),而其他使用者可使用其他類型
的行動裝置(例如,暫時工作者或輪班工作者可利用現成的行動電話及/或智慧型手機)。
在一些實施例中,運輸系統107可使使用者與每一裝置相關聯。舉例而言,運輸系統107可儲存使用者(由例如使用者識別符、雇員識別符或電話號碼表示)與行動裝置(由例如國際行動設備身分(International Mobile Equipment Identity;IMEI)、國際行動訂用識別符(International Mobile Subscription Identifier;IMSI)、電話號碼、通用唯一識別符(Universal Unique Identifier;UUID)或全球唯一識別符(Globally Unique Identifier;GUID)表示)之間的關聯。運輸系統107可結合在遞送時接收到的資料使用此關聯來分析儲存於資料庫中的資料,以便尤其判定工作者的位置、工作者的效率,或工作者的速度。
在一些實施例中,賣方入口網站109可實行為使得賣方或其他外部實體能夠與系統100中的一或多個系統電子地通信的電腦系統。舉例而言,賣方可利用電腦系統(未描繪)來上載或提供賣方希望經由使用賣方入口網站109的系統100來出售的產品的產品資訊、訂單資訊、連絡資訊或類似者。
在一些實施例中,運送及訂單追蹤系統111可實行為接收、儲存以及轉送關於含有由客戶(例如,由使用裝置102A至裝置102B的使用者)訂購的產品的包裹的位置的資訊的電腦系統。在一些實施例中,運送及訂單追蹤系統111可請求或儲存來自由遞送含有由客戶訂購的產品的包裹的運送公司操作的網頁伺服器(未描繪)的資訊。
在一些實施例中,運送及訂單追蹤系統111可請求及儲
存來自在系統100中描繪的系統的資訊。舉例而言,運送及訂單追蹤系統111可請求來自運輸系統107的資訊。如上文所論述,運輸系統107可自與使用者中的一或多者(例如,遞送工作者)或車輛(例如,遞送卡車)相關聯的一或多個行動裝置107A至行動裝置107C(例如,行動電話、智慧型手機、PDA或類似者)接收資訊。在一些實施例中,運送及訂單追蹤系統111亦可向倉庫管理系統(warehouse management system;WMS)119請求資訊以判定個別產品在履行中心(例如,履行中心200)內部的位置。運送及訂單追蹤系統111可向運輸系統107或WMS 119中的一或多者請求資料,在請求後處理所述資料,且將所述資料呈現給裝置(例如,使用者裝置102A及使用者裝置102B)。
在一些實施例中,履行最佳化(FO)系統113可實行為儲存來自其他系統(例如,外部前端系統103及/或運送及訂單追蹤系統111)的客戶訂單的資訊的電腦系統。FO系統113亦可儲存描述特定物件保存或儲存於何處的資訊。舉例而言,某些物件可能僅儲存於一個履行中心中,而某些其他物件可能儲存於多個履行中心中。在再其他實施例中,某些履行中心可經設計以僅儲存特定物件集合(例如,新鮮農產品或冷凍產品)。FO系統113儲存此資訊以及相關聯資訊(例如,數量、大小、接收日期、過期日期等)。
FO系統113亦可計算每一產品的對應PDD(承諾遞送日期)。在一些實施例中,PDD可以基於一或多個因素。舉例而言,FO系統113可基於下述者來計算產品的PDD:對產品的過去需求(例如,在一段時間期間訂購了多少次所述產品)、對產品的預期
需求(例如,預測在即將到來的一段時間期間多少客戶將訂購所述產品)、指示在一段時間期間訂購了多少產品的全網路過去需求、指示預期在即將到來的一段時間期間將訂購多少產品的全網路預期需求、儲存於每一履行中心200中的產品的一或多個計數、哪一履行中心儲存每一產品、產品的預期或當前訂單,或類似者。
在一些實施例中,FO系統113可定期(例如,每小時)判定每一產品的PDD且將其儲存於資料庫中以供檢索或發送至其他系統(例如,外部前端系統103、SAT系統101、運送及訂單追蹤系統111)。在其他實施例中,FO系統113可自一或多個系統(例如,外部前端系統103、SAT系統101、運送及訂單追蹤系統111)接收電子請求且按需求計算PDD。
在一些實施例中,履行通信報閘道(FMG)115可實行為自系統100中的一或多個系統(諸如FO系統113)接收呈一種格式或協定的請求或回應、將其轉換為另一格式或協定且將其以轉換後的格式或協定轉發至其他系統(諸如WMS 119或第3方履行系統121A、第3方履行系統121B或第3方履行系統121C)且反之亦然的電腦系統。
在一些實施例中,供應鏈管理(SCM)系統117可實行為進行預測功能的電腦系統。舉例而言,SCM系統117可基於例如下述者來預測對特定產品的需求水平:基於對產品的過去需求、對產品的預期需求、全網路過去需求、全網路預期需求、儲存於每一履行中心200中的計數產品、每一產品的預期或當前訂單,或類似者。回應於此預測水平及所有履行中心中的每一產品的量,SCM系統117可產生一或多個購買訂單以購買及儲備足夠
數量,以滿足對特定產品的預測需求。
在一些實施例中,倉庫管理系統(WMS)119可實行為監視工作流程的電腦系統。舉例而言,WMS 119可自個別裝置(例如,裝置107A至裝置107C或裝置119A至裝置119C)接收指示離散事件的事件資料。舉例而言,WMS 119可接收指示此等裝置中的一者的使用掃描包裹的事件資料。如下文相對於履行中心200及圖2所論述,在履行過程期間,可藉由特定階段處的機器(例如,自動式或手持式條碼掃描器、RFID讀取器、高速攝影機、諸如平板電腦119A、行動裝置/PDA 119B、電腦119C的裝置或類似者)掃描或讀取包裹識別符(例如,條碼或RFID標籤資料)。WMS 119可將指示掃描或包裹識別符的讀取的每一事件以及包裹識別符、時間、日期、位置、使用者識別符或其他資訊儲存於對應資料庫(未描繪)中,且可將此資訊提供至其他系統(例如,運送及訂單追蹤系統111)。
在一些實施例中,WMS 119可儲存使一或多個裝置(例如,裝置107A至裝置107C或裝置119A至裝置119C)與一或多個使用者(所述一或多個使用者與系統100相關聯)相關聯的資訊。舉例而言,在一些情形下,使用者(諸如兼職雇員或全職雇員)可與行動裝置相關聯,此是由於使用者擁有行動裝置(例如,行動裝置為智慧型手機)。在其他情形下,使用者可與行動裝置相關聯,此是由於使用者暫時保管行動裝置(例如,使用者在一天開始時拿到行動裝置,將在一天期間使用所述行動裝置,且將在一天結束時退還所述行動裝置)。
在一些實施例中,WMS 119可維護與系統100相關聯的
每一使用者的工作日志。舉例而言,WMS 119可儲存與每一雇員相關聯的資訊,包含任何指定的過程(例如,自卡車卸載、自揀貨區揀取物件、合流牆(rebin wall)工作、包裝物件)、使用者識別符、位置(例如,履行中心200中的樓層或區)、藉由雇員經由系統移動的單位數目(例如,所揀取物件的數目、所包裝物件的數目)、與裝置(例如,裝置119A至裝置119C)相關聯的識別符,或類似者。在一些實施例中,WMS 119可自計時系統接收登記及登出資訊,所述計時系統諸如在裝置119A至裝置119C上操作的計時系統。
在一些實施例中,第3方履行(3rd party fulfillment;3PL)系統121A至第3方履行系統121C表示與物流及產品的第三方提供商相關聯的電腦系統。舉例而言,儘管一些產品儲存於履行中心200中(如下文相對於圖2所論述),但其他產品可儲存於場外、可按需求生產,或可以其他方式不可供用於儲存於履行中心200中。3PL系統121A至3PL系統121C可組態成(例如,經由FMG 115)自FO系統113接收訂單,且可直接為客戶提供產品及/或服務(例如,遞送或安裝)。在一些實施例中,3PL系統121A至3PL系統121C中的一或多者可為系統100的部分,而在其他實施例中,3PL系統121A至3PL系統121C中的一或多者可在系統100外部(例如,由第三方提供商擁有或操作)。
在一些實施例中,履行中心Auth系統(FC Auth)123可實行為具有各種功能的電腦系統。舉例而言,在一些實施例中,FC Auth 123可充當系統100中的一或多個其他系統的單一簽入(single-sign on;SSO)服務。舉例而言,FC Auth 123可使得使用
者能夠經由內部前端系統105登入、判定使用者具有訪問運送及訂單追蹤系統111處的資源的類似特權,且使得使用者能夠在不需要第二登入過程的情況下取得彼等特權。在其他實施例中,FC Auth 123可使得使用者(例如,雇員)能夠使自身與特定任務相關聯。舉例而言,一些雇員可能不具有電子裝置(諸如裝置119A至裝置119C),且實際上可能在一天的過程期間在履行中心200內自任務至任務以及自區至區移動。FC Auth 123可組態成使得彼等雇員能夠在一天的不同時間指示其正進行何任務以及其位於何區。
在一些實施例中,勞動管理系統(LMS)125可實行為儲存雇員(包含全職雇員及兼職雇員)的出勤及超時資訊的電腦系統。舉例而言,LMS 125可自FC Auth 123、WMS 119、裝置119A至裝置119C、運輸系統107及/或裝置107A至裝置107C接收資訊。
圖1A中所描繪的特定組態僅為實例。舉例而言,儘管圖1A描繪連接至FO系統113的FC Auth系統123,但並非所有實施例均要求此特定組態。實際上,在一些實施例中,系統100中的系統可經由一或多個公用或私用網路彼此連接,所述網路包含網際網路、企業內部網路、廣域網路(Wide-Area Network;WAN)、都會區域網路(Metropolitan-Area Network;MAN)、順應IEEE 802.11a/b/g/n標準的無線網路、租用線,或類似者。在一些實施例中,系統100中的系統中的一或多者可實行為在資料中心、伺服器群或類似者處實行的一或多個虛擬伺服器。
圖2描繪履行中心200。履行中心200為儲存用於在訂購
時運送至客戶的物件的實體位置的實例。可將履行中心(FC)200劃分成多個區,所述區中的每一者描繪於圖2中。在一些實施例中,可認為此等「區」為接收物件、儲存物件、檢索物件以及運送物件的過程的不同階段之間的虛擬劃分。因此,儘管在圖2中描繪「區」,但其他區劃分為可能的,且在一些實施例中可省略、複製及/或修改圖2中的區。
入站區203表示FC 200的自希望使用來自圖1A的系統100出售產品的賣方接收到物件的區域。舉例而言,賣方可使用卡車201來遞送物件202A及物件202B。物件202A可表示足夠大以佔據其自身運送托板的單一物件,而物件202B可表示在同一托板上堆疊在一起以節省空間的物件集合。
工作者將在入站區203中接收物件,且可使用電腦系統(未描繪)來視情況檢查物件的損壞及正確性。舉例而言,工作者可使用電腦系統來比較物件202A及物件202B的數量與物件的所訂購數量。若數量不匹配,則工作者可拒絕物件202A或物件202B中的一或多者。若數量的確匹配,則工作者可(使用例如台車、手推平車、叉車或手動地)將彼等物件移動至緩衝區205。緩衝區205可為當前(例如由於揀貨區中存在足夠高數量的物件以滿足預測需求而)無需處於揀貨區中的所述物件的暫時儲存區域。在一些實施例中,叉車206操作以圍繞緩衝區205及在入站區203與卸貨區207之間移動物件。若(例如,由於預測需求而)需要揀貨區中的物件202A或物件202B,則叉車可將物件202A或物件202B移動至卸貨區207。
卸貨區207可為FC 200的在將物件移動至揀貨區209之
前儲存所述物件的區域。指定給揀貨任務的工作者(「揀貨員」)可靠近揀貨區中的物件202A及物件202B,使用行動裝置(例如,裝置119B)來掃描揀貨區的條碼,且掃描與物件202A及物件202B相關聯的條碼。揀貨員可接著(例如,藉由將物件置放於推車上或攜帶所述物件)將所述物件取至揀貨區209。
揀貨區209可為FC 200的將物件208儲存於儲存單元210上的區域。在一些實施例中,儲存單元210可包括實體擱架、書架、盒、手提包、冰箱、冷凍機、冷儲存區或類似者中的一或多者。在一些實施例中,揀貨區209可組織成多個樓層。在一些實施例中,工作者或機器可以多種方式將物件移動至揀貨區209中,包含例如叉車、電梯、傳送帶、推車、手推平車、台車、自動化機器人或裝置,或手動地移動。舉例而言,揀貨員可在卸貨區207中將物件202A及物件202B置放於手推平車或推車上,且將物件202A及物件202B步移至揀貨區209。
揀貨員可接收將物件置放(或「堆裝」)於揀貨區209中的特定點(諸如儲存單元210上的特定空間)的指令。舉例而言,揀貨員可使用行動裝置(例如,裝置119B)來掃描物件202A。裝置可例如使用指示走道、貨架以及位置的系統來指示揀貨員應將物件202A堆裝於何處。裝置可接著提示揀貨員在將物件202A堆裝於所述位置之前掃描所述位置處的條碼。裝置可(例如,經由無線網路)將資料發送至諸如圖1A中的WMS 119的電腦系統,從而指示已由使用裝置119B的使用者將物件202A堆裝於所述位置處。
一旦使用者下訂單,揀貨員即可在裝置119B上接收自儲
存單元210檢索一或多個物件208的指令。揀貨員可檢索物件208、掃描物件208上的條碼,且將所述物件208置放於運輸機構214上。儘管將運輸機構214表示為滑動件,但在一些實施例中,運輸機構可實行為傳送帶、電梯、推車、叉車、手推平車、台車或類似者中的一或多者。物件208可接著抵達包裝區211。
包裝區211可為FC 200的自揀貨區209接收到物件且將所述物件包裝至盒或包中以用於最終運送至客戶的區域。在包裝區211中,指定給接收物件的工作者(「合流工作者」)將自揀貨區209接收物件208且判定所述物件208對應於哪一訂單。舉例而言,合流工作者可使用諸如電腦119C的裝置來掃描物件208上的條碼。電腦119C可在視覺上指示物件208與哪一訂單相關聯。此可包含例如對應於訂單的牆216上的空間或「單元格」。一旦訂單完成(例如,由於單元格含有所述訂單的所有物件),合流工作者即可指示包裝工作者(或「包裝員」)訂單完成。包裝員可自單元格檢索物件且將所述物件置放於盒或包中以用於運送。包裝員可接著例如經由叉車、推車、台車、手推平車、傳送帶、手動地或以其他方式將盒或包發送至樞紐區(hub zone)213。
樞紐區213可為FC 200的自包裝區211接收所有盒或包(「包裹」)的區域。樞紐區213中的工作者及/或機器可檢索包裹218且判定每一包裹預期去至遞送區域的哪一部分,且將包裹投送至適當的營地區(camp zone)215。舉例而言,若遞送區域具有兩個更小子區域,則包裹將去至兩個營地區215中的一者。在一些實施例中,工作者或機器可(例如,使用裝置119A至裝置119C中的一者)掃描包裹以判定其最終目的地。將包裹投送至營地區
215可包括例如(例如,基於郵遞碼)判定包裹去往的地理區域的一部分,以及判定與地理區域的所述部分相關聯的營地區215。
在一些實施例中,營地區215可包括一或多個建築物、一或多個實體空間或一或多個區域,其中自樞紐區213接收包裹以用於分選至路線及/或子路線中。在一些實施例中,營地區215與FC 200實體地分開,而在其他實施例中,營地區215可形成FC 200的一部分。
營地區215中的工作者及/或機器可例如基於下述者來判定包裹220應與哪一路線及/或子路線相關聯:目的地與現有路線及/或子路線的比較、對每一路線及/或子路線的工作負荷的計算、時刻、運送方法、運送包裹220的成本、與包裹220中的物件相關聯的PDD,或類似者。在一些實施例中,工作者或機器可(例如,使用裝置119A至裝置119C中的一者)掃描包裹以判定其最終目的地。一旦將包裹220指定給特定路線及/或子路線,工作者及/或機器即可移動待運送的包裹220。在例示性圖2中,營地區215包含卡車222、汽車226以及遞送工作者224A及遞送工作者224B。在一些實施例中,卡車222可由遞送工作者224A駕駛,其中遞送工作者224A為遞送FC 200的包裹的全職雇員,且卡車222由擁有、租用或操作FC 200的同一公司擁有、租用或操作。在一些實施例中,汽車226可由遞送工作者224B駕駛,其中遞送工作者224B為在視需要基礎上(例如,季節性地)遞送的「靈活」或臨時工作者。汽車226可由遞送工作者224B擁有、租用或操作。
參考圖3,繪示樣本SRP 300,其包含在無產品整合及去冗餘系統的情況下產生的一或多個搜尋結果。舉例而言,產品310
可由八個不同賣方銷售,且SRP 300可針對同一產品310顯示八個不同產品結果。使用所揭露實施例,產品310可整合至推薦最佳賣方的單個產品結果中。
參考圖4,繪示示出包括用於基於AI的產品整合及去冗餘的電腦化系統的網路的例示性實施例的示意性方塊圖。如圖4中所示出,系統400可包含線上匹配訓練資料系統410、線上匹配預處理系統420、線上匹配模型訓練器430以及線上匹配模型系統440,其中每一者可經由網路450與使用者裝置460通信,所述使用者裝置460與使用者460A相關聯。在系統與正登記賣方的產品的一或多個賣方同時操作時,系統可線上操作。在一些實施例中,線上匹配訓練資料系統410、線上匹配預處理系統420、線上匹配模型訓練器430以及線上匹配模型系統440可經由直接連接(例如使用電纜)彼此通信且與系統400的其他組件通信。在一些其他實施例中,系統400可以是圖1A的系統100的一部分,且可經由網路450或經由直接連接(例如使用電纜)與系統100的其他組件(例如外部前端系統103或內部前端系統105)通信。線上匹配訓練資料系統410、線上匹配預處理系統420、線上匹配模型訓練器430以及線上匹配模型系統440可各自包括單個電腦,或可各自組態為分散式電腦系統,所述分散式電腦系統包含交互操作以執行與所揭露實例相關聯的過程及功能中的一或多者的多個電腦。
如圖4中所示,線上匹配訓練資料系統410可包括處理器412、記憶體414以及資料庫416。線上匹配預處理系統420可包括處理器422、記憶體424以及資料庫426。線上匹配模型訓練
器系統430可包括處理器432、記憶體434以及資料庫436。線上匹配模型系統440可包括處理器442、記憶體444以及資料庫446。處理器412、處理器422、處理器432以及處理器442可以是一或多個已知處理裝置,諸如來自由英特爾TM(IntelTM)製造的奔騰TM(PentiumTM)系列或由AMDTM製造的炫龍TM(TurionTM)系列的微處理器。處理器412、處理器422、處理器432以及處理器442可構成單核心處理器或同時執行並行過程的多核心處理器。舉例而言,處理器412、處理器422、處理器432以及處理器442可使用邏輯處理器來同時執行及控制多個過程。處理器412、處理器422、處理器432以及處理器442可實行虛擬機技術或其他已知技術以提供執行、控制、運行、操控、儲存等多個軟體過程、應用程式、程式等的能力。在另一實例中,處理器412、處理器422、處理器432以及處理器442可包含多核心處理器配置,其組態成提供允許線上匹配訓練資料系統410、線上匹配預處理系統420、線上匹配模型訓練器系統430以及線上匹配模型系統440同時執行多個過程的並行處理功能。所屬技術領域中具有通常知識者應瞭解,可實行提供本文中所揭露的能力的其他類型的處理器配置。
記憶體414、記憶體424、記憶體434以及記憶體444可儲存一或多個作業系統,所述一或多個作業系統在分別由處理器412、處理器422、處理器432以及處理器442執行時執行已知作業系統功能。藉助於實例,作業系統可包含微軟視窗(Microsoft Window)、Unix、Linux、安卓(Android)、Mac OS、iOS或其他類型的作業系統。因此,所揭露發明的實例可用運行任何類型的作業系統的電腦系統操作及運作。記憶體414、記憶體424、記憶
體434以及記憶體444可以是揮發性或非揮發性、磁性、半導體、磁帶、光學、可移除式、非可移除式或其他類型的儲存裝置或有形電腦可讀媒體。
資料庫416、資料庫426、資料庫436以及資料庫446可包含例如甲骨文TM(OracleTM)資料庫、賽貝斯TM(SybaseTM)資料庫或其他關連式資料庫或非關連式資料庫,諸如HadoopTM順序檔案、HBaseTM或CassandraTM。資料庫416、資料庫426、資料庫436以及資料庫446可包含計算組件(例如,資料庫管理系統、資料庫伺服器等),所述計算組件組態成接收及處理對儲存於資料庫的記憶體裝置中的資料的請求及自資料庫提供資料。資料庫416、資料庫426、資料庫436以及資料庫446可包含NoSQL資料庫,諸如HBase、MongoDBTM或CassandraTM。替代地,資料庫416、資料庫426、資料庫436以及資料庫446可包含諸如甲骨文、MySQL以及微軟SQL伺服器的關連式資料庫。在一些實施例中,資料庫416、資料庫426、資料庫436以及資料庫446可呈伺服器、通用電腦、大型主機電腦或此等組件的任何組合的形式。
資料庫416、資料庫426、資料庫436以及資料庫446可儲存可分別由處理器412、處理器422、處理器432以及處理器442使用以用於執行與所揭露實例相關聯的方法及過程的資料。資料庫416、資料庫426、資料庫436以及資料庫446可分別位於線上訓練資料系統410、線上預處理系統420、線上匹配模型訓練器系統430以及線上匹配模型系統440中,如圖4中所示,或替代地,其可處於位於線上訓練資料系統410、線上預處理系統420、線上匹配模型訓練器系統430以及線上匹配模型系統440外部的外部
儲存裝置中。儲存於416中的資料可包含與產品(例如產品識別編號、類別識別、產品名稱、產品影像URL、產品品牌、產品描述、製造商、供應商、屬性、型號、條碼、最高類別級別、類別子級別等)相關聯的任何適合線上匹配訓練資料,儲存於426中的資料可包含與線上匹配經預處理訓練資料相關聯的任何適合資料,儲存於436中的資料可包含與訓練線上匹配模型相關聯的任何適合資料,且儲存於446中的資料可包含與不同對產品的匹配分數相關聯的任何適合資料。
使用者裝置460可以是平板電腦、行動裝置、電腦或類似物。使用者裝置460可包含顯示器。舉例而言,顯示器可包含液晶顯示器(liquid crystal display;LCD)、發光二極體螢幕(light emitting diode screen;LED)、有機發光二極體螢幕(organic light emitting diode screen;OLED)、觸控螢幕以及其他已知顯示裝置。顯示器可向使用者展示各種資訊。舉例而言,其可顯示用於輸入或產生訓練資料的線上平台,包含供內部使用者(例如,擁有、操作或租用系統100的組織的雇員)或外部使用者輸入訓練資料或產品資訊資料的輸入文字盒,所述產品資訊資料包含產品資訊(例如,產品識別編號、最高類別級別、類別子級別、產品名稱、產品影像、產品品牌、產品描述等)。使用者裝置460可包含一或多個輸入/輸出(input/output;I/O)裝置。I/O裝置可包含允許使用者裝置460發送來自使用者460A或另一裝置的資訊及自使用者460A或另一裝置接收資訊的一或多個裝置。I/O裝置可包含各種輸入/輸出裝置:攝影機、麥克風、鍵盤、滑鼠型裝置、手勢感測器、動作感測器、實體按鈕、口頭輸入等。I/O裝置亦可包含一或
多個通信模組(未繪示),所述一或多個通信模組用於藉由例如建立使用者裝置460與網路450之間的有線或無線連接來發送及接收來自線上匹配訓練資料系統410、線上匹配預處理系統420、線上匹配模型訓練器系統430或線上匹配模型系統440的資訊。
線上匹配訓練資料系統410可接收包含與一或多個產品相關聯的產品資訊的初始訓練資料。線上匹配訓練資料系統410可藉由人類對產品對進行標註來收集訓練資料。舉例而言,使用者460A可比較第一產品的產品資訊(例如產品類別、名稱、品牌、型號等)與第二產品的產品資訊,判定所述一對產品是否等同,且若產品等同,則將所述一對產品標註為「匹配」,或若產品並不等同,則標註為「不同」。使用者(例如使用者460A)可定期(例如每日)取樣產品對以將所述對標註為「匹配」或「不同」,藉此向線上匹配訓練資料系統410提供訓練資料。
線上匹配預處理系統420可接收由線上匹配訓練資料系統410收集的初始訓練資料,且藉由預處理初始訓練資料來產生合成訓練資料。線上匹配預處理系統420可標記來自一對產品的關鍵字。標記關鍵字可包含提取關鍵字以及基於預定條件篩選所提取關鍵字。舉例而言,線上匹配預處理系統420可自與一對第一產品及第二產品相關聯的產品資訊提取關鍵字,且根據預定條件篩選出與品牌名稱相關聯的關鍵字,儲存除品牌名稱之外的第一產品及第二產品的關鍵字。線上匹配預處理系統420可藉由參考儲存於資料庫426中的符記字典及實行Aho-Corasick演算法以判定是否將關鍵字分離成多個關鍵字來使關鍵字符記化。舉例而言,可將以某些語言(諸如韓語)書寫的關鍵字儲存為無空格的
單一文字串。(流利的說話者應瞭解,可將此文字串分離成字的各種組合。)線上匹配預處理系統420可實行Aho-Corasick演算法,其為在與第一產品及第二產品相關聯的文字內定位一組有限串(例如「字典」)的元素的字典匹配演算法。演算法同時匹配所有串,使得線上匹配預處理系統420可藉由收集文字的實際關鍵字同時移除未在所儲存字典中列出的「分離」字來提取關鍵字。關鍵字符記化可藉由移除使機器學習模型減緩的多餘字來增大產品整合及去冗餘。
線上匹配模型訓練器430可接收自線上匹配預處理系統420產生的合成訓練資料。線上匹配模型訓練器430可使用接收到的合成資料產生及訓練至少一個線上匹配模型以進行產品匹配。舉例而言,可針對每一較高級別產品類別產生模型。每一模型可以是樸素貝葉斯模型,其可基於一對產品的產品資訊而訓練以判定所述一對產品等同的可能性。線上匹配模型訓練器430可假設每一產品特性彼此無關,且使用接收到的合成訓練資料來使用下式計算匹配分數:
使用合成訓練資料可能是有利的,因為一對產品的經標記特性(例如顏色、大小、品牌等)及一對產品的經符記化關鍵字(例如XL、紅色、黑色等)兩者可用於計算所述一對產品的匹配分數且自動合併等同產品。
舉例而言,合成訓練資料可包含10,000對產品。百分之
六十的合成訓練資料可以是「匹配」的產品對,而百分之四十的合成訓練資料可以是「不同」的產品對。百分之八十三的「匹配」對可具有相同顏色,而百分之五十的「不同」對可具有相同顏色。線上匹配模型訓練器430可在一對產品具有相同顏色時使用如下等式(1)計算其等同的機率:
線上匹配模型訓練器430可針對合成訓練資料中的任一者在一對產品共用多個產品資訊時使用等式(1)計算其等同的機率。
在登記賣方的產品時,線上匹配模型系統440可執行實時操作。舉例而言,線上匹配模型系統440可經由使用者裝置460自使用者460A(例如賣方)接收登記第一產品的新請求。新請求可包含與待登記的第一產品相關聯的產品資訊資料(例如產品識別編號、類別識別、產品名稱、產品影像URL、產品品牌、產品描述、製造商、供應商、屬性、型號、條碼等)。線上匹配模型系統440可使用來自與第一產品相關聯的產品資訊資料的關鍵字來搜尋第二產品的資料庫446。舉例而言,線上匹配模型系統440可使用搜尋引擎(例如彈性搜尋)來搜尋含有第一產品的關鍵字、短語、關鍵字在短語中的位置等給定關鍵字的資料庫446的倒置索引。倒置索引可包含可出現於任何產品資訊中的所有關鍵字、短語、關鍵字在短語中的位置等的列表,以及其中出現每一關鍵字、短語、關鍵字在短語中的位置等的產品列表。線上匹配模型系統440可使用方法的任何組合來處理第一產品的關鍵字。舉例而言,線上匹配模型系統440可藉由將每一關鍵字還原為其根字
(root word)來對每一關鍵字執行字幹搜尋(stemming)過程。舉例而言,字「雨」、「下雨」以及「降雨」具有共同根字「雨」。在關鍵字被索引化時,根字儲存至索引中,藉此增大關鍵字的搜尋關聯性。儲存於資料庫446中的關鍵字為索引化的經字幹搜尋的關鍵字。另外,線上匹配模型系統440可對每一關鍵字執行同義詞搜尋,藉此改良關鍵字搜尋品質。
線上匹配模型系統440可使用由線上匹配模型訓練器430訓練的機器學習模型來基於第一產品及第二產品的共用或類似關鍵字判定資料庫446中的至少一個第二產品(例如100個第二產品)可與第一產品類似。線上匹配模型系統440的機器學習模型可收集與至少一個第二產品相關聯的產品資訊(例如產品識別編號、類別識別、產品名稱、產品影像URL、產品品牌、產品描述、製造商、供應商、屬性、型號、條碼等)。資料庫446中的第二產品可以是當前由至少一個賣方登記的產品。
機器學習模型可接著標記來自第一產品及第二產品的關鍵字。標記關鍵字可包含提取關鍵字以及基於預定條件篩選所提取關鍵字。舉例而言,機器學習模型可自與第一產品及第二產品相關聯的產品資訊提取關鍵字,且根據預定條件篩選出與品牌名稱相關聯的關鍵字,儲存除品牌名稱之外的第一產品及第二產品的關鍵字。機器學習模型可藉由參考儲存於資料庫446中的符記字典及實行Aho-Corasick演算法以判定是否將關鍵字分離成多個關鍵字來使關鍵字符記化。舉例而言,可將以某些語言(諸如韓語)書寫的關鍵字儲存為無空格的單一文字串。(流利的說話者應瞭解,可將此文字串分離成字的各種組合。)機器學習模型可實
行Aho-Corasick演算法,其為在與第一產品及第二產品相關聯的文字內定位一組有限串(例如「字典」)的元素的字典匹配演算法。演算法同時匹配所有串,使得機器學習模型可藉由收集文字的實際關鍵字同時移除未在所儲存字典中列出的「分離」字來提取關鍵字。關鍵字符記化可藉由移除使機器學習模型減緩的多餘字來增大產品整合及去冗餘。
線上匹配模型系統440可使用機器學習模型來判定第一產品與第二產品中的每一者之間的匹配分數。可藉由使用與第一產品及第二產品相關聯的經標記關鍵字以及儲存於資料庫446中以用於經訓練機器學習模型的機率分數來計算匹配分數。可使用方法(例如彈性搜尋、傑卡德、樸素貝葉斯、W-CODE、ISBN等)的任何組合來計算匹配分數。舉例而言,亦可藉由量測第一產品的關鍵字與第二產品的關鍵字之間的拼寫相似性來計算匹配分數。在一些實施例中,可基於第一產品與第二產品之間的共用關鍵字的數目來計算匹配分數。
線上匹配模型系統440的機器學習模型可識別來自第一產品及第二產品的關鍵字,且使用庫(例如fastText)來將關鍵字轉換為向量表示。機器學習模型可使用庫來學習每一關鍵字的字元n元語法(n-gram)的表示。每一關鍵字接著可表示為一包字元n元語法,且總字嵌入為字元n元語法的總和。舉例而言,內部使用者或外部使用者(例如使用者460A)可手動地設定或機器學習模型可自動設定n元語法為3,在此情況下,字「其中」的向量將由三元語法的總和表示:<wh,whe,her,ere,re>,其中括號<、>為標示字的開始及結束的邊界符號。在每一字表示為n元語法的
總和之後,潛伏文字嵌入導出為字嵌入的平均值,此時,文字嵌入可由機器學習模型使用以預測標籤。在識別稀少關鍵字或並不包含於資料庫446中的關鍵字時,此過程可為有利的。舉例而言,不常見字的向量表示可比較常見字的向量表示具有更大權重。機器學習模型可定製類似關鍵字的關聯性。
在一些實施例中,線上匹配模型系統440可基於第一產品與第二產品之間的交叉關鍵字的百分比來計算匹配分數。舉例而言,可藉由交叉關鍵字的數目除以關鍵字的總數目來計算匹配分數。匹配分數可隨著交叉關鍵字的數目而增大。
在一些實施例中,線上匹配模型系統440可基於由機器學習模型判定的機率分數計算匹配分數。舉例而言,機器學習模型可基於共用產品資訊(例如產品識別編號、類別識別、產品名稱、產品影像URL、產品品牌、產品描述、製造商、供應商、屬性、型號、條碼等)判定第一產品的關鍵字與第二產品的關鍵字有關的機率。由於機器學習模型需要更少的訓練資料且所述模型可假設關鍵字的每一特徵與彼關鍵字的任何其他特徵無關,故此計算匹配分數的方法可有利於增大機器學習模型的穩定性。
機器學習模型可在匹配分數高於預定臨限值時判定第一產品等同於第二產品中的一者(例如,具有最高匹配分數及最小匹配屬性數目的第二產品,與最高匹配分數相關聯的第二產品,具有最高匹配分數及一定價格範圍內的價格的第二產品等)。機器學習模型可修改資料庫446以包含指示第一產品等同於第二產品的資料,藉此將產品合併至單個列表中且防止產品複製。在匹配分數並不符合預定臨限值時,機器學習模型可判定第一產品並非
第二產品中的任一者。機器學習模型可接著修改資料庫446以包含指示第一產品並非第二產品中的任一者的資料,藉此將第一產品作為不同的新列表列出。
線上匹配模型系統440的機器學習模型可登記第一產品,在與使用者460A相關聯的使用者裝置460上顯示指示第一產品的登記的資料,以及基於與第一產品相關聯的產品資訊、與第二產品相關聯的產品資訊以及匹配分數來更新機器學習模型。機器學習模型可同時處理來自多個使用者的多個請求,計算每一新請求的每一產品與來自資料庫446的至少一個產品之間的匹配分數。
參考圖5,繪示示出包括用於基於AI的產品整合及去冗餘的電腦化系統的網路的例示性實施例的示意性方塊圖。如圖5中所示出,系統500可包含單個產品離線匹配系統520及批量產品離線匹配系統530,其中每一者可經由網路550與資料庫516及與使用者560A相關聯的使用者裝置560通信。在匹配系統並不與正登記賣方的產品的一或多個賣方同時操作時,匹配系統可離線操作。在一些實施例中,單個產品離線匹配系統520及批量產品離線匹配系統530可經由直接連接(例如使用電纜)彼此通信且與系統500的其他組件通信。在一些其他實施例中,系統500可以是圖1A的系統100的一部分,且可經由網路550或經由直接連接(例如使用電纜)與系統100的另一組件(例如外部前端系統103、內部前端系統105或系統400)通信。單個產品離線匹配系統520及批量產品離線匹配系統530可各自包括單個電腦,或可各自組態為分散式電腦系統,所述分散式電腦系統包含交互操
作以執行與所揭露實例相關聯的過程及功能中的一或多者的多個電腦。
資料庫516可儲存可由系統520及系統530使用以執行與所揭露實例相關聯的方法及過程的資料。資料庫516可與上文所描述的資料庫類似,且可處於位於系統520及系統530外部的外部儲存裝置中,如圖5中所示,或替代地,其可位於系統520或系統530中。儲存於516中的資料可包含與產品相關聯的任何適合資料(例如產品識別編號、類別識別、產品名稱、產品影像URL、產品品牌、產品描述、製造商、供應商、屬性、型號、條碼、最高類別級別、類別子級別、匹配分數等)。使用者裝置560及使用者560A可與上文所描述的使用者裝置及使用者類似。
離線匹配系統520及離線匹配系統530可以與上文所描述的線上匹配模型系統440的步驟類似的方式執行步驟。離線匹配系統520及離線匹配系統530可在線上匹配模型系統440未操作時操作。舉例而言,離線匹配系統520及離線匹配系統530可定期(例如每日)且獨立於線上匹配模型系統440操作。線上匹配模型系統440可在時間約束(例如15分鐘)下操作,使得賣方可在無延遲的情況下登記新產品。離線匹配系統520及離線匹配系統530可在無時間約束的情況下操作,因此,離線匹配系統520及離線匹配系統530的機器學習模型(可與線上匹配模型系統440的機器學習模型相同,或是不同的機器學習模型)可計算單對產品的單個匹配分數或第一批多個產品及第二批多個產品的匹配分數。與(例如第一批及第二批)產品相關聯的產品資訊可儲存於資料庫516中。資料庫516可儲存與資料庫416、資料庫426、資
料庫436或資料庫446中相同或類似的資料。
單個產品離線匹配系統520可包含候選項搜尋系統640及類別預測系統700(下文相對於圖7論述)。在一些實施例中,候選項搜尋系統600可使用搜尋引擎(例如彈性搜尋)來產生由使用者(例如使用者560A)提交的單個產品請求的候選項。批量產品離線匹配系統530可包含候選項搜尋系統650及類別預測系統800(下文相對於圖8A論述)。
參考圖6,繪示示出用於基於AI的產品整合及去冗余的候選項搜尋系統640及候選項搜尋系統650的例示性實施例的過程。儘管在一些實施例中,圖4或圖5中所描繪的系統中的一或多者可執行本文中所描述的步驟中的若干者,但其他實施方案為可能的。舉例而言,本文中所描述及示出的系統及組件(例如系統100中繪示的彼等系統及組件等)中的任一者可執行本揭露中所描述的步驟。
在步驟601中,候選項搜尋系統600(例如候選項搜尋系統640或候選項搜尋系統650)可自使用者(例如經由使用者裝置560自使用者560A)接收登記一或多個產品的一或多個新請求。候選項搜尋系統600可藉由新請求接收與待登記的產品相關聯的產品資訊資料(例如產品識別編號、類別識別、產品名稱、產品影像URL、產品品牌、產品描述、製造商、供應商、屬性、型號、條碼等)。
在步驟602中,候選項搜尋系統600可提取待登記的產品的影像,且在步驟603中,系統600可在資料庫620中搜尋匹配產品。資料庫620可與上文所描述的資料庫類似且包含索引化
的產品影像。
在步驟611中,系統600可自現存產品提取所有影像。在步驟612中,系統600可基於預定臨限值(例如影像大小、可與影像相關聯的產品的數目等)使用個別影像特徵(例如影像頻率統計、影像相關性統計、影像位置頻率統計、影像大小等)篩選出非產品影像(例如廣告影像)。在步驟613中,剩餘影像可被索引化且儲存於資料庫620中。
在步驟604中,系統600可自資料庫620檢索潛在匹配產品。在步驟605中,系統600可計算所請求產品及潛在匹配產品的影像特徵,且將所述特徵儲存於資料庫630中。資料庫630可與上文所描述的資料庫類似,且包含與產品相關聯的影像屬性及特徵。類似地,在步驟614中,系統600可計算儲存於資料庫620中的影像的影像特徵且將所述影像特徵儲存於資料庫630中。
可被計算的影像特徵包含距影像的中心點的平方距離的總和、距影像的中心點的平方距離的平均值、影像是否為第一影像、影像是否為中心影像、影像是否為最末影像,或位置分數(例如影像的位置除以總影像計數)。影像特徵亦可包含影像內容大小(例如影像解析度)的日誌、包含影像的產品的總計數、包含影像的供應商的總計數、除以產品計數的內容大小或除以供應商計數的內容大小。
在步驟605中,可針對所述對所請求產品以及潛在匹配產品中的每一者計算匹配影像特徵。舉例而言,匹配影像特徵可包含總影像計數、匹配影像計數、匹配影像百分比、總內容大小、匹配內容大小、匹配內容大小百分比或平均產品價格。匹配特徵
的數目愈大,所請求產品與潛在匹配產品等同的可能性愈高。
在步驟606中,系統600可使用機器學習模型來預測可匹配所請求產品的產品候選項。系統600可使用現存產品的經計算特徵來訓練模型。舉例而言,系統600可使用匹配影像內容大小的總和、平均影像位置分數或最高特徵值來訓練模型。模型可以是利用分析用於分類及回歸分析的資料的相關聯學習演算法的監督式學習模型(例如支持向量機)。系統600可基於標記為等同或不同的訓練資料對建構模型,從而向一個類別或另一類別指派新實例,使其成為非機率二元線性分類器。模型可表示如空間中的點的實例,其經映射以使得獨立類別的實例由儘可能寬的清晰間隙分隔。接著將新實例映射至同一空間中,且基於其所落的間隙的側來預測其所屬的種類。模型可藉由將輸入隱含地映射至高維特徵空間中來高效地執行非線性分類。
在步驟607中,系統600可經由使用者裝置560將由模型預測以匹配所請求產品的潛在產品匹配候選項發送至類別預測系統700或發送至使用者560A(例如內部雇員)。使用者(例如使用者560A)可隨機地對產品對取樣,且將產品標註為等同或不同,使用經標註資料來再訓練模型。
在一些實施例中,資料庫620及資料庫630以及步驟611至步驟614可離線操作且與步驟601至步驟607同時操作。
參考圖7,繪示示出用於基於AI的產品整合及去冗餘的類別預測系統700的例示性實施例的過程。儘管在一些實施例中,圖4或圖5中所描繪的系統中的一或多者可執行本文中所描述的步驟中的若干者,但其他實施方案為可能的。舉例而言,本文中
所描述及示出的系統及組件(例如系統100中繪示的彼等系統及組件等)中的任一者可執行本揭露中所描述的步驟。
在一些實施例中,分類模型702可自候選項搜尋系統640接收具有匹配文字特徵或具有匹配影像特徵的候選項701。訓練資料703可用於使用模型訓練器704訓練模型702。訓練資料703可與系統410的訓練資料類似,且以與如上文所描述的系統520類似的方式經預處理。模型訓練器704可以與上文所描述的模型訓練器430類似的方式訓練模型702。
舉例而言,模型訓練器704可自經預處理訓練資料703接收合成訓練資料。系統700可標記來自一對產品的關鍵字。標記關鍵字可包含提取關鍵字以及基於預定條件篩選所提取關鍵字。舉例而言,系統700可自與一對第一產品及第二產品相關聯的產品資訊提取關鍵字,且根據預定條件篩選出與品牌名稱相關聯的關鍵字,儲存除品牌名稱之外的第一產品及第二產品的關鍵字。系統700可藉由參考儲存於資料庫(例如資料庫426)中的符記字典及實行Aho-Corasick演算法以判定是否將關鍵字分離成多個關鍵字來使關鍵字符記化。舉例而言,可將以某些語言(諸如韓語)書寫的關鍵字儲存為無空格的單一文字串。(流利的說話者應瞭解,可將此文字串分離成字的各種組合。)系統700可實行Aho-Corasick演算法,其為在與第一產品及第二產品相關聯的文字內定位一組有限串(例如「字典」)的元素的字典匹配演算法。演算法同時匹配所有串,使得系統700可藉由收集文字的實際關鍵字同時移除未在所儲存字典中列出的「分離」字來提取關鍵字。關鍵字符記化可藉由移除使機器學習模型減緩的多餘字來增大產
品整合及去冗餘。
系統700可使用方法的任何組合來處理第一產品的關鍵字。舉例而言,系統700可藉由將每一關鍵字還原為其根字來對每一關鍵字執行字幹搜尋過程。舉例而言,字「雨」、「下雨」以及「降雨」具有共同根字「雨」。在關鍵字被索引化時,根字儲存至索引中,藉此增大關鍵字的搜尋關聯性。儲存於資料庫中的關鍵字為索引化的經字幹搜尋的關鍵字。另外,系統700可對每一關鍵字執行同義詞搜尋,藉此改良關鍵字搜尋品質。
分類模型702可判定具有候選項701的所請求產品的匹配分數705(例如系統400的匹配分數)高於預定臨限值。雖然分類模型702描繪為可學習及預測所有產品類別的單個模型,但分類模型702可包含多個模型,其中針對不同產品類別訓練每一模型。分類模型702可提供用於回歸及分類問題的梯度提昇框架(例如XGBoost、CatBoost等),其產生呈弱預測模型的集合(例如決策樹)形式的預測模型。系統700可以逐階段方式建構模型702,且藉由允許最佳化任意可微分損失函數來一般化模型。
系統700可基於匹配分數705判定所請求產品是否等同於現存產品。若所請求產品的匹配分數705高於預定臨限值,則系統700可判定所請求產品等同於現存產品且應與彼產品的列表合併。若所請求產品的匹配分數705低於預定臨限值,則系統700可判定所請求產品不同於任何現存產品且繼續將所請求產品作為新登記產品列出。
參考圖8A,繪示示出用於基於AI的產品整合及去冗餘的類別預測系統800的例示性實施例的過程。儘管在一些實施例
中,圖4或圖5中所描繪的系統中的一或多者可執行本文中所描述的步驟中的若干者,但其他實施方案為可能的。舉例而言,本文中所描述及示出的系統及組件(例如系統100中繪示的彼等系統及組件等)中的任一者可執行本揭露中所描述的步驟。
系統800可自候選項搜尋系統650接收候選項801且建構產品集群802。每一集群802中的產品可為類似的(例如共用至少一個產品影像)。系統800可以與上文所描述的符記化類似的方式符記化產品集群802。
系統800可接著計算符記向量804。每一特徵可表示符記向量804的維數。特徵可包含:字元(例如「a」、「b」、「c」等);訊文(例如外來(foreign)、產品集群中的符記的群組分數、位置分數、含有符記的現存產品的百分比、字元佈置、涉及文數字名稱空間的不同供應商的數目、文數字名稱空間信賴度分數);格式(例如禁制品、年齡範圍、性別、衣服大小、浮點數、數位、文數字數位、英文字、韓文字、字長、重量、長度、體積、數量等);統計資料(例如,來自所請求產品的暴露屬性的符記,符記用於暴露屬性中的次數、具有此符記的供應商的數目、具有此符記的產品的數目、具有此符記的類別的數目、符記最常出現的位置、符記在暴露屬性中的百分比等);位置(例如符記在品牌欄、型號欄、搜尋標籤、製造欄、SKU欄、條碼欄、CQI品牌欄、色場等中的頻率);統計資料率(例如總體暴露計數的增長速度、平均完全位置分數的增長速度等)、統計資料相對率(例如產品的所有符記的平均總體符記計數、產品的所有符記的最小總體符記計數等),或一般產品對級別特徵(例如標準化產品識別差距、銷售價
格差、產品集群的總產品計數、共用韓國文字的百分比等)。
參考圖8B,繪示示出用於基於AI的產品整合及去冗余的計算符記向量804的例示性實施例的過程。
如圖8B中所示,單元820可表示來自所請求產品及候選項產品兩者的七個匹配符記,單元821可表示來自所請求產品的十個不匹配符記,且單元822可表示來自候選項產品中的一者的五個不匹配符記。單元823可表示所請求產品與候選項產品之間的匹配的上十六個符記。若小於十六個符記匹配,則單元823可包含「NULL」單元。單元824可表示來自所請求產品的上八個不匹配符記,且單元825可表示來自候選項產品的上八個不匹配符記。若小於八個符記不匹配,則單元824及單元825可包含「NULL」單元。
系統800可計算16×164個符記向量804。單元826可包含164個維數,其中每一維數表示一個符記的特徵。單元827可表示匹配符記的維數,其中每一列為符記的向量。單元828可表示不匹配符記的維數,其中每一列為符記的向量。單元827及單元828可由預定規則排序,使得類似符記位於大致相同位置中。系統800可平面化且預先附加符記向量804的一般物件對級別特徵以計算1×5253維數向量。
返回參考圖8A,系統800可編寫產品對級別符記匹配張量805及產品對級別一般特徵向量張量806。
參考圖8CA、圖8CB、圖8CC、圖8D、圖8E以及圖8F,繪示示出用於基於AI的產品整合及去冗餘的將特徵合併至一個向量807中的例示性實施例的過程。
圖8CA、圖8CB以及圖8CC可包含過程800CA、過程801CA、過程800CB以及過程800CC。圖8D、圖8E以及圖8F可分別包含過程800D、過程800E以及過程800F。如圖8CA、圖8CB、圖8CC以及圖8D中所示,張量805可具有用於關注重要符記的查詢上下文注意。805的第一層可使用具有核心1×124的卷積層,且可將符記向量嵌入至更密集向量中。系統800可使用定製查詢上下文注意層來尋找所請求及候選項產品的不匹配符記的重要符記。使用更多卷積層來產生最終一維輸出,系統800可使用匯流母線層來調整所請求及候選項產品的注意結果的重要性。
舉例而言,在過程800CA中,系統800可將維數向量(例如圖8B的1×5253維數向量)再銳化為兩個符記向量(例如一個1×5向量以及一個32×164向量)。在過程801CA中,系統800可將一個符記向量嵌入至密集向量(例如1×32向量)中。在過程801CA中,系統800可計算可包含維數(例如164維數)的符記向量(例如32×164向量),其中符記向量的每一行是表示符記向量的維數的符記的特徵。符記向量可包含具有一對產品的匹配上下文的匹配符記的維數(例如16維數),其中每一列為符記的向量。符記向量亦可包含具有所請求產品的符記的維數(例如8維數)及候選項產品的符記的維數(例如8維數)的不匹配符記的維數(例如16維數),其中每一列為符記的向量。
在過程800CB中,系統800可包含x方向卷積神經網路(X-CNN)及y方向卷積神經網路(Y-CNN)。X-CNN可包含用於關注符記向量級別上的重要符記的查詢上下文注意。X-CNN可包含具有大核心(例如1×124)的第一卷積層,其可將符記向量嵌入
至更密集向量中。X-CNN可使用定製查詢上下文注意層來尋找其應關注的所請求產品及候選項產品的不匹配符記的重要符記。
Y-CNN可關注特徵級別匹配的重要特徵。在過程800CB中,系統800可使用y方向上的具有大核心(例如32×1、124×1)的卷積層。前兩個卷積層可具有大核心大小(例如32×1、124×1),而其他層可具有小核心大小(例如2×2、3×3、4×4等)。Y-CNN可使用定製查詢上下文注意層來尋找其應關注的所請求產品及候選項產品的不匹配符記的重要符記。在過程800CC中,系統800可使用X-CNN及Y-CNN的結果來計算經組合向量。系統800可使用匯流母線層來調整查詢上下文注意結果的重要性,且使用更多卷積層來計算最終1維輸出。
過程800D及過程800E可包含以與上文所描述的過程800CA、過程801CA、過程800CB以及過程800CC類似的方式操作的過程。如圖8E中所示,張量806可藉由使用豎直(例如y)方向上的具有大核心(例如32×1、124×1)的卷積層而關注重要特徵。前兩個卷積層可具有大核心,而其他層可具有小核心(例如2×2、3×3、4×4等)。
如圖8F中所示,在過程800F中,系統800可藉由使用用於注意的權重矩陣WC及權重矩陣WD以及用於閘控機制的權重矩陣WG及權重矩陣WT來實行查詢上下文注意。如圖8F中所示,系統800可計算上下文矩陣(例如16×32)與權重矩陣Wc(例如32×32)的點乘積來輸出經轉換上下文矩陣(例如16×32)。系統800可計算查詢(例如所請求產品)矩陣(例如8×32)的每一列與經轉換上下文矩陣的每一列的點乘積且除以每一列的長度
「K」,以輸出矩陣(例如8×16)。系統800可對矩陣的每一列應用softmax。對於矩陣的每一列的所有值,系統800可乘以經轉換上下文矩陣中的對應列。舉例而言,第一值可乘以經轉換上下文矩陣的第二列,且可在豎直方向上對上下文矩陣求和以產生一個列(例如具有32行)。處理所有列可形成新矩陣(例如8×32)。
在過程800F中,系統800可計算查詢矩陣與矩陣Wd(例如32×32)的點乘積,以輸出經轉換查詢矩陣(例如8×32)。系統800可計算經轉換查詢矩陣的每一列與候選項矩陣的每一列的點乘積且除以每一列的長度「K」,以輸出新矩陣(例如8×8)。系統800可對矩陣的每一列應用softmax。對於每一列的所有值,系統800可乘以經轉換查詢矩陣中的對應列。舉例而言,第一值可乘以經轉換上下文矩陣的第一列,且第二值可乘以經轉換查詢矩陣的第二列,且可在豎直方向上對矩陣(例如8x32)求和以產生一個列(例如具有32行)。處理所有列可形成新矩陣(例如8x32)。系統800可將處理的經轉換上下文矩陣與處理的經轉換查詢矩陣組合以輸出單個矩陣(例如8×64)。系統800可添加額外閘極層以調整單個矩陣中的權重。
返回參考圖8A,預測模型808可基於合併向量807判定多個所請求產品與多個候選項產品之間的匹配分數。系統800可基於匹配分數高於預定臨限值而判定所預測產品對809。系統800可基於匹配分數判定所請求產品是否等同於現存產品。若匹配分數高於預定臨限值,則系統800可判定所請求產品等同於現存產品且應與產品的列表合併。若匹配分數低於預定臨限值,則系統800可判定所請求產品不同於任何現存產品且繼續將所請求產品
作為新登記產品列出。
在一些實施例中,不同於線上匹配模型系統440,離線匹配系統520及離線匹配系統530由於其可在無時間約束的情況下操作而可使用更昂貴的計算邏輯(例如梯度提昇、卷積神經網路等)。與上文所描述的線上匹配模型系統440類似,離線匹配系統520的機器學習模型可標記來自與第一批及第二批的產品相關聯的產品資訊的多個關鍵字,且判定第一批及第二批的產品的任何組合之間的多個匹配分數。可使用經標記關鍵字計算匹配分數,如上文針對線上匹配系統410所描述。在匹配分數高於預定臨限值時,機器學習模型可判定與匹配分數相關聯的產品是等同的(如上文針對線上匹配系統410所描述)。機器學習模型可自第一等同產品相關聯的列表移除第一等同產品,且將彼第一等同產品添加至與第二等同產品相關聯的列表以便對產品進行整合及去冗餘。機器學習模型可針對任何數目的產品或產品的組合同時執行此等步驟。
參考圖9,繪示用於基於AI的產品整合及去冗餘的樣本經標記資料900。系統(例如系統100、系統400、系統500等)可提取與產品的品牌910、性別912、鞋型914、顏色916、大小918以及型號920相關聯的關鍵字。系統可根據預定條件篩選出與型號920相關聯的關鍵字,以篩選出與型號相關聯的關鍵字。所提取關鍵字910、關鍵字912、關鍵字914、關鍵字916以及關鍵字918可用於產品整合及去冗餘。圖9中描繪的特定關鍵字為例示性的;更多、更少或其他關鍵字可用於不同實施例中。
參考圖10,繪示用於使用AI對產品進行整合及去冗餘的
過程。儘管在一些實施例中,圖4或圖5中所描繪的系統中的一或多者可執行本文中所描述的步驟中的若干者,但其他實施方案為可能的。舉例而言,本文中所描述及示出的系統及組件(例如系統100中繪示的彼等系統及組件等)中的任一者可執行本揭露中所描述的步驟。
在步驟1001中,系統400可經由使用者裝置460自使用者460A接收登記第一產品的至少一個新請求。系統400可藉由新請求接收與待登記的第一產品相關聯的產品資訊資料(例如產品識別編號、類別識別、產品名稱、產品影像URL、產品品牌、產品描述、製造商、供應商、屬性、型號、條碼等)。系統400可使用來自與第一產品相關聯的產品資訊資料的關鍵字來搜尋第二產品的資料庫446。系統400可接著基於第一產品及第二產品的共用或類似關鍵字判定資料庫446中的至少一個第二產品(例如100個第二產品)可與第一產品類似。系統400的機器學習模型可收集與至少一個第二產品相關聯的產品資訊(例如產品識別編號、類別識別、產品名稱、產品影像URL、產品品牌、產品描述、製造商、供應商、屬性、型號、條碼等)。資料庫446中的第二產品可以是當前由至少一個賣方登記的產品。
在步驟1003中,機器學習模型可接著標記來自第一產品及第二產品的關鍵字。標記關鍵字可包含提取關鍵字以及基於預定條件篩選所提取關鍵字。舉例而言,機器學習模型可自與第一產品及第二產品相關聯的產品資訊提取關鍵字,且根據預定條件篩選出與品牌名稱相關聯的關鍵字,儲存除品牌名稱之外的第一產品及第二產品的關鍵字。
在步驟1005中,機器學習模型可判定第一產品與第二產品中的每一者之間的匹配分數。可藉由使用與第一產品及第二產品相關聯的經標記關鍵字判定匹配分數。可使用方法(例如彈性搜尋、傑卡德、樸素貝葉斯、W-CODE、ISBN等)的任何組合來計算匹配分數。舉例而言,可藉由量測第一產品的關鍵字與第二產品的關鍵字之間的拼寫相似性來計算匹配分數。在一些實施例中,可基於第一產品與第二產品之間的共用關鍵字的數目來計算匹配分數。
在步驟1007中,機器學習模型可在匹配分數高於預定臨限值時判定第一產品等同於第二產品中的一者(例如,具有最高匹配分數及最小匹配屬性數目的第二產品,與最高匹配分數相關聯的第二產品,具有最高匹配分數及一定價格範圍內的價格的第二產品等)。機器學習模型可修改資料庫446以包含指示第一產品等同於第二產品的資料,藉此將產品合併至單個列表中且防止產品複製。
在步驟1009中,機器學習模型可在匹配分數並不符合預定臨限值時判定第一產品並非第二產品中的任一者。機器學習模型可接著修改資料庫446以包含指示第一產品並非第二產品中的任一者的資料,藉此將第一產品作為不同的新列表列出。
在步驟1011中,機器學習模型可接著登記第一產品,修改指示第一產品的登記的網頁,以及基於與第一產品相關聯的產品資訊、與第二產品相關聯的產品資訊以及匹配分數來更新機器學習模型。
儘管已參考本揭露的特定實施例繪示及描述本揭露,但
應理解,可在不修改的情況下在其他環境中實踐本揭露。已出於示出的目的呈現前述描述。前述描述並不詳盡且不限於所揭露的精確形式或實施例。修改及調適對所屬技術領域中具有通常知識者將自本說明書的考量及所揭露實施例的實踐顯而易見。另外,儘管將所揭露實施例的態樣描述為儲存於記憶體中,但所屬技術領域中具有通常知識者應瞭解,此等態樣亦可儲存於其他類型的電腦可讀媒體上,諸如次級儲存裝置,例如硬碟或CD ROM,或其他形式的RAM或ROM、USB媒體、DVD、藍光,或其他光碟機媒體。
基於書面描述及所揭露方法的電腦程式在有經驗開發者的技能內。各種程式或程式模組可使用所屬技術領域中具有通常知識者已知的技術中的任一者來創建或可結合現有軟體來設計。舉例而言,程式區段或程式模組可以或藉助於.Net框架(.Net Framework)、.Net緊密框架(.Net Compact Framework)(及相關語言,諸如視覺培基(Visual Basic)、C等)、爪哇(Java)、C++、目標-C(Objective-C)、HTML、HTML/AJAX組合、XML或包含爪哇小程式的HTML來設計。
此外,儘管本文中已描述示出性實施例,但所屬技術領域中具有通常知識者將基於本揭露瞭解具有等效元件、修改、省略、(例如,各種實施例中的態樣的)組合、調適及/或更改的任何及所有實施例的範圍。申請專利範圍中的限制應基於申請專利範圍中所採用的語言來廣泛地解釋,且不限於本說明書中所描述或在本申請案的審查期間的實例。實例應視為非排他性的。另外,所揭露方法的步驟可以包含藉由對步驟重新排序及/或***或刪除
步驟的任何方式修改。因此,希望僅將本說明書及實例視為示出性的,其中藉由以下申請專利範圍及其等效物的完整範圍指示真實範圍及精神。
1001、1003、1005、1007、1009、1011:步驟
Claims (18)
- 一種用於基於AI的產品整合及去冗餘的電腦實行系統,所述電腦實行系統包括:記憶體,儲存指令;以及至少一個處理器,組態成執行所述指令以進行以下操作:接收至少一個請求以登記第一產品;接收與所述第一產品相關聯的產品資訊;搜尋第二產品的至少一個資料儲存;使用機器學習模型收集與所述第二產品相關聯的產品資訊;使用所述機器學習模型標記來自與所述第一產品相關聯的所述產品資訊的至少一個關鍵字且標記來自與所述第二產品相關聯的所述產品資訊的至少一個關鍵字,其中所述標記包括自與所述第一產品及所述第二產品相關聯的所述產品資訊提取至少一個關鍵字,以及基於預定條件篩選所提取關鍵字;使用所述機器學習模型來將經標記關鍵字轉換為向量表示,其中所述向量表示與所述經標記關鍵字的文數字字元相關聯;使用所述機器學習模型基於所述經標記關鍵字的類別來向所述向量表示指派不同的權重;藉由使用與所述第一產品及所述第二產品相關聯的所述經標記關鍵字的經加權的向量表示,使用所述機器學習模型判定所述第一產品與所述第二產品之間的匹配分數; 在所述匹配分數高於第一預定臨限值時,使用所述機器學習模型判定所述第一產品等同於所述第二產品,且修改所述至少一個資料儲存以包含指示所述第一產品等同於所述第二產品的資料;在所述匹配分數低於所述第一預定臨限值時,使用所述機器學習模型判定所述第一產品並非所述第二產品,且修改所述至少一個資料儲存以包含指示所述第一產品並非所述第二產品的資料;登記所述第一產品;以及修改網頁以包含所述第一產品的登記。
- 如請求項1所述的電腦實行系統,其中與所述第一產品相關聯的所述產品資訊及與所述第二產品相關聯的所述產品資訊包括製造商、供應商、產品名稱、品牌、價格、影像URL、型號及類別識別中的至少一者。
- 如請求項1所述的電腦實行系統,其中與所述第一產品相關聯的所述產品資訊及與所述第二產品相關聯的所述產品資訊共用至少一個產品資訊資料。
- 如請求項1所述的電腦實行系統,其中所述提取包括使至少一個關鍵字符記化。
- 如請求項1所述的電腦實行系統,其中計算所述匹配分數是基於所述關鍵字的拼寫。
- 如請求項1所述的電腦實行系統,其中計算所述匹配分數是基於由所述第一產品及所述第二產品共用的關鍵字的數目。
- 如請求項1所述的電腦實行系統,其中計算所述匹配分數是基於與所述第一產品相關聯的機率分數及與所述第二產品相關聯的機率分數。
- 如請求項1所述的電腦實行系統,其中所述至少一個處理器進一步組態成執行所述指令以基於與所述第一產品相關聯的所述產品資訊、與所述第二產品相關聯的所述產品資訊以及所述匹配分數來更新所述機器學習模型。
- 一種使用AI對產品進行整合及去冗餘的方法,所述方法包括:接收至少一個請求以登記第一產品;接收與所述第一產品相關聯的產品資訊;搜尋第二產品的至少一個資料儲存;使用機器學習模型收集與所述第二產品相關聯的產品資訊;使用所述機器學習模型標記來自與所述第一產品相關聯的所述產品資訊的至少一個關鍵字且標記來自與所述第二產品相關聯的所述產品資訊的至少一個關鍵字,其中所述標記包括自與所述第一產品及所述第二產品相關聯的所述產品資訊提取至少一個關鍵字,以及基於預定條件篩選所提取關鍵字;使用所述機器學習模型來將經標記關鍵字轉換為向量表示,其中所述向量表示與所述經標記關鍵字的文數字字元相關聯;使用所述機器學習模型基於所述經標記關鍵字的類別來向所述向量表示指派不同的權重;藉由使用與所述第一產品及所述第二產品相關聯的所述經標 記關鍵字的經加權的向量表示,使用所述機器學習模型判定所述第一產品與所述第二產品之間的匹配分數;在所述匹配分數高於第一預定臨限值時,使用所述機器學習模型判定所述第一產品等同於所述第二產品,且修改所述至少一個資料儲存以包含指示所述第一產品等同於所述第二產品的資料;在所述匹配分數低於所述第一預定臨限值時,使用所述機器學習模型判定所述第一產品並非所述第二產品,且修改所述至少一個資料儲存以包含指示所述第一產品並非所述第二產品的資料;登記所述第一產品;以及修改網頁以包含所述第一產品的登記。
- 如請求項9所述的方法,其中與所述第一產品相關聯的所述產品資訊及與所述第二產品相關聯的所述產品資訊包括製造商、供應商、產品名稱、品牌、價格、影像URL、型號及類別識別中的至少一者。
- 如請求項9所述的方法,其中與所述第一產品相關聯的所述產品資訊及與所述第二產品相關聯的所述產品資訊共用至少一個產品資訊資料。
- 如請求項9所述的方法,其中所述提取包括使至少一個關鍵字符記化。
- 如請求項9所述的方法,其中計算所述匹配分數是基於所述關鍵字的拼寫。
- 如請求項9所述的方法,其中計算所述匹配分數是 基於由所述第一產品及所述第二產品共用的關鍵字的數目。
- 如請求項9所述的方法,其中計算所述匹配分數是基於與所述第一產品相關聯的機率分數及與所述第二產品相關聯的機率分數。
- 如請求項9所述的方法,更包括基於與所述第一產品相關聯的所述產品資訊、與所述第二產品相關聯的所述產品資訊以及所述匹配分數來更新所述機器學習模型。
- 一種用於基於AI的產品整合及去冗餘的電腦實行系統,所述電腦實行系統包括:記憶體,儲存指令;以及至少一個處理器,組態成執行所述指令以進行以下操作:接收至少一個請求以登記第一產品;接收與所述第一產品相關聯的產品資訊;搜尋第二產品的至少一個資料儲存;使用第一機器學習模型收集與所述第二產品相關聯的產品資訊;使用所述第一機器學習模型標記來自與所述第一產品相關聯的所述產品資訊的至少一個關鍵字且標記來自與所述第二產品相關聯的所述產品資訊的至少一個關鍵字,其中所述標記包括自與所述第一產品及所述第二產品相關聯的所述產品資訊提取至少一個關鍵字,以及基於預定條件篩選所提取關鍵字;使用所述第一機器學習模型來將經標記關鍵字轉換為向量表示,其中所述向量表示與所述經標記關鍵字的文數字 字元相關聯;使用所述第一機器學習模型基於所述經標記關鍵字的類別來向所述向量表示指派不同的權重;藉由使用與所述第一產品及所述第二產品相關聯的所述經標記關鍵字的經加權的向量表示計算第一相似性分數,使用所述第一機器學習模型判定所述第一產品與所述第二產品之間的第一匹配分數;在所述第一匹配分數高於第一預定臨限值時,使用所述第一機器學習模型判定所述第一產品等同於所述第二產品,且修改所述至少一個資料儲存以包含指示所述第一產品等同於所述第二產品的資料;在所述第一匹配分數低於所述第一預定臨限值時,使用所述第一機器學習模型判定所述第一產品並非所述第二產品,且修改所述至少一個資料儲存以包含指示所述第一產品並非所述第二產品的資料;登記所述第一產品;修改網頁以包含所述第一產品的登記;使用第二機器學習模型收集與多個第三產品相關聯的產品資訊;使用所述第二機器學習模型標記來自與所述多個第三產品相關聯的產品資訊的多個關鍵字;藉由使用與所述多個第三產品相關聯的經標記關鍵字,使用所述第二機器學習模型判定所述多個第三產品之間的多個第二匹配分數; 在所述多個第二匹配分數中的任一者高於所述第一預定臨限值時,使用所述第二機器學習模型判定與第二匹配分數相關聯的所述多個第三產品是等同的,且對等同第三產品進行去冗餘;以及修改所述網頁以包含所述等同第三產品的去冗餘。
- 如請求項17所述的電腦實行系統,其中去冗餘包括:自第一等同第三產品的相關聯列表中移除所述第一等同第三產品;以及將所述第一等同第三產品添加至與第二等同第三產品相關聯的列表。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/834,051 US20210304121A1 (en) | 2020-03-30 | 2020-03-30 | Computerized systems and methods for product integration and deduplication using artificial intelligence |
US16/834,051 | 2020-03-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202137109A TW202137109A (zh) | 2021-10-01 |
TWI778481B true TWI778481B (zh) | 2022-09-21 |
Family
ID=77856257
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW109146299A TWI778481B (zh) | 2020-03-30 | 2020-12-25 | 用於基於ai的產品整合及去冗餘的電腦實行系統及使用ai對產品進行整合及去冗餘的方法 |
TW111132282A TW202248929A (zh) | 2020-03-30 | 2020-12-25 | 用於基於ai的產品整合及去冗餘的電腦實行系統及使用ai對產品進行整合及去冗餘的方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111132282A TW202248929A (zh) | 2020-03-30 | 2020-12-25 | 用於基於ai的產品整合及去冗餘的電腦實行系統及使用ai對產品進行整合及去冗餘的方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20210304121A1 (zh) |
JP (1) | JP2023519031A (zh) |
KR (2) | KR102354395B1 (zh) |
SG (1) | SG11202104711PA (zh) |
TW (2) | TWI778481B (zh) |
WO (1) | WO2021198761A1 (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210342761A1 (en) * | 2020-04-30 | 2021-11-04 | Hexagon Technology Center Gmbh | System for mapping model, cost, and schedule of large-scale capital project |
US11847106B2 (en) * | 2020-05-12 | 2023-12-19 | Hubspot, Inc. | Multi-service business platform system having entity resolution systems and methods |
EP3929773A1 (en) * | 2020-06-26 | 2021-12-29 | Davide De Guz | Method and system for automatic customisation of uniform resource locators (url) by extracting a url or a content containing one or more urls and replacing with one or more customized urls |
US20220067280A1 (en) * | 2020-08-25 | 2022-03-03 | Microsoft Technology Licensing, Llc | Multi-token embedding and classifier for masked language models |
US11797590B2 (en) * | 2020-09-02 | 2023-10-24 | Microsoft Technology Licensing, Llc | Generating structured data for rich experiences from unstructured data streams |
US12014383B2 (en) * | 2020-10-30 | 2024-06-18 | Ncr Voyix Corporation | Platform-based cross-retail product categorization |
US20220245677A1 (en) * | 2021-01-30 | 2022-08-04 | Pubwise, LLLP | De-duplication of online advertising requests |
US20230136886A1 (en) * | 2021-10-29 | 2023-05-04 | Maplebear Inc. (Dba Instacart) | Incrementally updating embeddings for use in a machine learning model by accounting for effects of the updated embeddings on the machine learning model |
CN114090526B (zh) * | 2022-01-19 | 2022-04-08 | 广东省出版集团数字出版有限公司 | 一种云教育资源管理*** |
KR20230162351A (ko) * | 2022-05-20 | 2023-11-28 | 쿠팡 주식회사 | 아이템 관련 상세 정보를 제공하는 이미지 관리를 위한 전자 장치 및 그 방법 |
KR102607872B1 (ko) * | 2022-12-29 | 2023-11-29 | 주식회사 바이스퀘어 | 인공지능을 이용한 광고주 상품의 포털 사이트별 핵심 키워드 및 연관 키워드 추천 시스템 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040143600A1 (en) * | 1993-06-18 | 2004-07-22 | Musgrove Timothy Allen | Content aggregation method and apparatus for on-line purchasing system |
CN102193936A (zh) * | 2010-03-09 | 2011-09-21 | 阿里巴巴集团控股有限公司 | 一种数据分类的方法及装置 |
US20120239650A1 (en) * | 2011-03-18 | 2012-09-20 | Microsoft Corporation | Unsupervised message clustering |
TW201319982A (zh) * | 2011-11-11 | 2013-05-16 | Alibaba Group Holding Ltd | 產品資訊的即時去重複方法和裝置 |
CN103577989A (zh) * | 2012-07-30 | 2014-02-12 | 阿里巴巴集团控股有限公司 | 一种基于产品识别的信息分类方法及信息分类*** |
US20140108206A1 (en) * | 2012-10-15 | 2014-04-17 | Cbs Interactive Inc. | System and method for managing product catalogs |
US20140188905A1 (en) * | 2003-01-22 | 2014-07-03 | Amazon Technologies, Inc. | Method and system for manually maintaining item authority |
US8868554B1 (en) * | 2004-02-26 | 2014-10-21 | Yahoo! Inc. | Associating product offerings with product abstractions |
CN104915440A (zh) * | 2015-06-26 | 2015-09-16 | 苏宁云商集团股份有限公司 | 一种商品排重方法和*** |
US20180165740A1 (en) * | 2016-12-14 | 2018-06-14 | Facebook, Inc. | Product Clustering Algorithm |
CN108388555A (zh) * | 2018-02-01 | 2018-08-10 | 口碑(上海)信息技术有限公司 | 基于行业类别的商品去重方法及装置 |
CN109584006A (zh) * | 2018-11-27 | 2019-04-05 | 中国人民大学 | 一种基于深度匹配模型的跨平台商品匹配方法 |
US20190347359A1 (en) * | 2018-05-14 | 2019-11-14 | Ebay Inc. | Search system for providing web crawling query prioritization based on classification operation performance |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6728695B1 (en) * | 2000-05-26 | 2004-04-27 | Burning Glass Technologies, Llc | Method and apparatus for making predictions about entities represented in documents |
KR100490442B1 (ko) * | 2002-03-16 | 2005-05-17 | 삼성에스디에스 주식회사 | 벡터문서모델을 이용한 동일/유사제품 클러스트링 장치 및그 방법 |
US8930307B2 (en) * | 2011-09-30 | 2015-01-06 | Pure Storage, Inc. | Method for removing duplicate data from a storage array |
KR102215436B1 (ko) * | 2014-02-26 | 2021-02-16 | 십일번가 주식회사 | 쇼핑몰의 동일 상품 판별 장치 및 방법 |
US9858481B2 (en) * | 2015-11-23 | 2018-01-02 | Lexmark International, Inc. | Identifying consumer products in images |
KR102179890B1 (ko) * | 2017-12-07 | 2020-11-17 | 최윤진 | 텍스트 데이터 수집 및 분석을 위한 시스템 |
-
2020
- 2020-03-30 US US16/834,051 patent/US20210304121A1/en not_active Abandoned
- 2020-05-07 KR KR1020200054710A patent/KR102354395B1/ko active IP Right Grant
- 2020-12-22 SG SG11202104711PA patent/SG11202104711PA/en unknown
- 2020-12-22 JP JP2021528908A patent/JP2023519031A/ja active Pending
- 2020-12-22 WO PCT/IB2020/062346 patent/WO2021198761A1/en active Application Filing
- 2020-12-25 TW TW109146299A patent/TWI778481B/zh active
- 2020-12-25 TW TW111132282A patent/TW202248929A/zh unknown
-
2022
- 2022-01-18 KR KR1020220007288A patent/KR20220012396A/ko active Application Filing
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040143600A1 (en) * | 1993-06-18 | 2004-07-22 | Musgrove Timothy Allen | Content aggregation method and apparatus for on-line purchasing system |
US20140188905A1 (en) * | 2003-01-22 | 2014-07-03 | Amazon Technologies, Inc. | Method and system for manually maintaining item authority |
US8868554B1 (en) * | 2004-02-26 | 2014-10-21 | Yahoo! Inc. | Associating product offerings with product abstractions |
CN102193936A (zh) * | 2010-03-09 | 2011-09-21 | 阿里巴巴集团控股有限公司 | 一种数据分类的方法及装置 |
US20120239650A1 (en) * | 2011-03-18 | 2012-09-20 | Microsoft Corporation | Unsupervised message clustering |
TW201319982A (zh) * | 2011-11-11 | 2013-05-16 | Alibaba Group Holding Ltd | 產品資訊的即時去重複方法和裝置 |
CN103577989A (zh) * | 2012-07-30 | 2014-02-12 | 阿里巴巴集团控股有限公司 | 一种基于产品识别的信息分类方法及信息分类*** |
US20140108206A1 (en) * | 2012-10-15 | 2014-04-17 | Cbs Interactive Inc. | System and method for managing product catalogs |
CN104915440A (zh) * | 2015-06-26 | 2015-09-16 | 苏宁云商集团股份有限公司 | 一种商品排重方法和*** |
US20180165740A1 (en) * | 2016-12-14 | 2018-06-14 | Facebook, Inc. | Product Clustering Algorithm |
CN108388555A (zh) * | 2018-02-01 | 2018-08-10 | 口碑(上海)信息技术有限公司 | 基于行业类别的商品去重方法及装置 |
US20190347359A1 (en) * | 2018-05-14 | 2019-11-14 | Ebay Inc. | Search system for providing web crawling query prioritization based on classification operation performance |
CN109584006A (zh) * | 2018-11-27 | 2019-04-05 | 中国人民大学 | 一种基于深度匹配模型的跨平台商品匹配方法 |
Also Published As
Publication number | Publication date |
---|---|
TW202248929A (zh) | 2022-12-16 |
KR102354395B1 (ko) | 2022-01-21 |
JP2023519031A (ja) | 2023-05-10 |
SG11202104711PA (en) | 2021-11-29 |
KR20220012396A (ko) | 2022-02-03 |
TW202137109A (zh) | 2021-10-01 |
KR20210121990A (ko) | 2021-10-08 |
US20210304121A1 (en) | 2021-09-30 |
WO2021198761A1 (en) | 2021-10-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI778481B (zh) | 用於基於ai的產品整合及去冗餘的電腦實行系統及使用ai對產品進行整合及去冗餘的方法 | |
KR102578114B1 (ko) | 인공지능을 사용하여 데이터베이스 파라미터를 최적화하기 위한 컴퓨터화된 시스템 및 방법 | |
KR102350982B1 (ko) | 인공 지능을 이용한 제품 분류를 위한 컴퓨터 시스템 및 방법 | |
US20220188660A1 (en) | Systems and methods for processing data for storing in a feature store and for use in machine learning | |
TWI771841B (zh) | 基於競爭神經字元語言模式斷詞之系統以及方法 | |
US20220215452A1 (en) | Systems and method for generating machine searchable keywords | |
KR20230107496A (ko) | 제품 타이틀로부터 속성을 지능적으로 추출하기 위한시스템 및 방법 | |
KR20240007737A (ko) | 제품 추천을 생성하기 위해 인공 지능을 사용하는 컴퓨터 시스템 및 방법 | |
TW202221529A (zh) | 用於產生搜尋的關鍵詞的方法以及系統 | |
TW202147203A (zh) | 用於追蹤線上社群的電腦實行系統以及方法 | |
TW202341041A (zh) | 電腦實施的系統以及電腦實施的方法 | |
KR102459120B1 (ko) | 제품 타이틀을 이용한 지능적 제품 분류를 위한 시스템 및 방법 | |
KR102466233B1 (ko) | 제품 타이틀로부터 수량의 지능적 추출을 위한 시스템 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent |