CN111639516B - 基于机器学***台 - Google Patents

基于机器学***台 Download PDF

Info

Publication number
CN111639516B
CN111639516B CN202010091280.7A CN202010091280A CN111639516B CN 111639516 B CN111639516 B CN 111639516B CN 202010091280 A CN202010091280 A CN 202010091280A CN 111639516 B CN111639516 B CN 111639516B
Authority
CN
China
Prior art keywords
data
processing
projects
purchase
machine learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010091280.7A
Other languages
English (en)
Other versions
CN111639516A (zh
Inventor
V·德塞
R·苏布拉玛尼安
S·德索托
R·F·普拉卡什
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Accenture Global Solutions Ltd
Original Assignee
Accenture Global Solutions Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Accenture Global Solutions Ltd filed Critical Accenture Global Solutions Ltd
Publication of CN111639516A publication Critical patent/CN111639516A/zh
Application granted granted Critical
Publication of CN111639516B publication Critical patent/CN111639516B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping
    • G06Q10/0835Relationships between shipper or supplier and carriers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/137Hash-based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping
    • G06Q10/0838Historical data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/04Billing or invoicing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • G06Q30/0635Processing of requisition or of purchase orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开的实施例涉及基于机器学***台。一种设备可以接收与多个***相关的***数据、与多个请购单相关的请购单数据或与多个工程相关的工程数据。设备可以使用特征提取引擎来处理数据,以标识数据的特征。设备可以使用变换引擎来处理数据,以减小数据的大小。设备可以使用机器学习模型的集合来处理数据。设备可以生成与以下中的至少一者相关的推荐的集合:将多个***中的每一个、多个请购单中的每一个或多个工程中的每一个分类为多种类别中的一种或多种;针对多个请购单中的每一个或多个工程中的每一个标识可能的供应方的集合;或针对多个工程中的每一个标识相似工程的集合。设备可以执行一个或多个动作。

Description

基于机器学***台
技术领域
本公开的实施例涉及机器学***台。
背景技术
不同类型的机器学习算法与不同类型的数据输入和输出相关联和/或与不同类型的任务或问题相关联。一种机器学习算法是监督或半监督机器学习算法,其中,模型是由包含输入和期望输出二者的数据集构造的。另一机器学习算法是无监督机器学习算法,其中,模型是由仅包含输入的数据集构造的。另一机器学习算法是强化学习算法,其中,软件代理被配置为在环境中采取动作,以使累积回报的某一概念最大化。
发明内容
根据一些实现,一种方法可以包括:由设备接收数据,其中该数据包括以下中的至少一者:与关联于组织的多个***相关的***数据、与关联于组织的多个请购单相关的请购单数据或者与关联于组织的多个工程相关的工程数据;由设备在接收到数据之后使用预处理技术来处理数据,其中该预处理技术包括以下中的至少一者:图像处理技术或者文本处理技术;由设备在使用预处理技术来处理数据之后使用特征提取引擎来处理数据,以标识数据的特征;由设备在使用特征提取引擎来处理数据之后使用变换引擎来处理数据,以减小数据的大小;由设备在使用变换引擎来处理数据之后使用机器学习模型的集合来处理数据,其中该机器学习模型的集合与以下中的至少一者相关:将与***数据相关联的多个***中的每个***、与请购单数据相关联的多个请购单中的每个请购单或与工程数据相关联的多个工程中的每个工程分类为与组织的操作相关联的多种类别中的一种或多种类别;针对与请购单数据相关联的多个请购单中的每个请购单或与工程数据相关联的多个工程中的每个工程标识可能的供应方的集合;或者针对与工程数据相关联的多个工程中的每个工程标识相似工程的集合;以及由设备在使用该机器学习模型的结合来处理数据之后执行一个或多个动作。
根据一些实现,一种设备可以包括:一个或多个存储器;以及一个或多个处理器,该一个或多个处理器被通信地耦合至该一个或多个存储器,该一个或多个处理器用以:接收数据,其中数据与关联于组织的多个***、多个请购单或多个工程相关;在接收到数据之后使用预处理技术来处理数据,其中该预处理技术包括以下中的至少一者:图像处理技术或者文本处理技术;在使用预处理技术来处理数据之后使用特征提取引擎来处理数据,以标识数据的特征;在使用特征提取引擎来处理数据之后使用变换引擎来处理数据,以减小数据的大小;在使用变换引擎来处理数据之后使用机器学习模型的集合来处理数据,其中该机器学习模型的集合与以下中的至少一者相关:将多个***中的每个***、多个请购单中的每个请购单或多个工程中的每个工程分类为与组织的操作相关联的多种类别中的一种或多种类别;针对多个请购单中的每个请购单或多个工程中的每个工程标识可能的供应方的集合;或者针对多个工程中的每个工程标识相似工程的集合;基于来自该机器学习模型的集合的输出,确定针对数据的分数,其中该分数标识多种类别中的一种或多种类别、该可能的供应方的集合或该相似工程的集合;以及在确定分数之后执行一个或多个动作。
根据一些实现,一种存储指令的非瞬态计算机可读介质,该指令可以包括:一个或多个指令,该一个或多个指令在由一个或多个处理器执行时使该一个或多个处理器:接收数据,其中该数据包括以下中的至少一者:与关联于组织的多个***相关的***数据、与关联于组织的多个请购单相关的请购单数据或与关联于组织的多个工程相关的工程数据;在接收到数据之后使用特征提取引擎来处理数据,以标识数据的特征;在使用特征提取引擎来处理数据之后使用变换引擎来处理数据,以减小数据的大小;在使用变换引擎来处理数据之后使用机器学习模型的集合来处理数据;在使用该机器学习模型的集合来处理数据之后生成与以下中的至少一者相关的推荐的集合:将与***数据相关联的多个***中的每个***、与请购单数据相关联的多个请购单中的每个请购单或与工程数据相关联的多个工程中的每个工程分类为与组织的操作相关联的多种类别中的一种或多种类别,针对与请购单数据相关联的多个请购单中的每个请购单或与工程数据相关联的多个工程中的每个工程标识可能的供应方的集合,或者针对与工程数据相关联的多个工程中的每个工程标识相似工程的集合;以及在生成该推荐的集合之后执行一个或多个动作。
附图说明
图1A至图2是本文中所描述的一种或多种示例实现的示意图。
图3是可以实现本文中所描述的***和/或方法的示例环境的示意图。
图4是图3的一个或多个设备的示例组件的示意图。
图5至图7是用于使用基于机器学***台来执行基于机器学习的分析的示例过程的流程图。
具体实施方式
示例实现的以下详细描述参照附图。不同示意图中的相同附图标记可以标识相同或相似元件。
组织可以生成与***、请购单、工程等相关的大容量数据。例如,组织可以在每天、每周或每月的基础上针对***、请购单、工程等生成数百万、数十亿或更多的数据元素。在一些情况下,数据可以具有如此大的容量,以至于常规计算设备可能无法高效地处理数据。例如,数据容量可能过大,以至于无法使用常规存储器资源进行有效地存储,无法实时或近实时地进行操纵等。附加地或备选地,并且作为另一示例,从不同***生成的数据可以针对数据中所包括的数据元素、用于标识数据的数据元素的标识符等具有不一致。结果,数据可以与存储数据相关联地消耗大量存储器资源(或可能难以存储或不可能存储),可能与尝试处理数据相关联地消耗大量处理资源(或可能难以处理或不可能处理)等。
本文中所描述的一些实现提供能够使用各种技术来处理与关联于组织的***、请购单、工程等相关的数据的基于机器学***台,并且可以处理数据以执行数据的分析。例如,采购分析平台可以处理数据以减少或消除数据不一致,以(例如,通过从数据中移除无关数据元素)简化数据,以压缩数据(例如,以减少数据的大小)等,并且可以处理数据以执行数据的分析。以这种方式,采购分析平台可以处理数据以按照如下形式放置数据:相对于不以本文中所描述的方式处理数据可以更容易地存储的形式、相对于不以本文中所描述的方式处理数据可以用于更容易地执行分析的形式等。这减少了存储数据所需的存储器资源量,从而节省了存储器资源。此外,以本文中所描述的方式处理数据节省了处理资源,由于数据不一致、由于数据量等,这些处理资源将经由用以处理数据的不成功尝试而被消耗。另外,采购分析平台提供了可以用于以先前不可能的方式执行数据分析(诸如通过便于对数千个、数百万个或更多个***、请购单和/或工程的分析)的工具。
图1A至图1F是本文中所描述的示例实现100的示意图。实现100包括客户端设备、采购分析平台和递送车辆(图1A中未示出)。在一些实现中,采购分析平台可以是多租户平台。例如,采购分析平台在执行如本文中所描述的操作时可以针对采购分析平台的不同用户、不同数据集等同时(或在不同时间处)执行操作。
如由附图标记102所示,采购分析平台可以从客户端设备接收数据。例如,在生成了数据时,采购分析平台可以基于客户端设备的用户经由客户端设备输入数据、基于从客户端设备请求数据,实时或近实时地根据时间表定期接收数据等。在一些实现中,采购分析平台可以在每天、每周或每月的基础上接收成数千、数百万或更多的数据元素,以执行与关联于组织的***、请购单、工程等相关的分析。以这种方式,采购分析平台可以在不会导致计算资源过载的情况下、在不消耗常规计算资源的大量存储器资源的情况下等接收无法使用常规计算资源来处理的数据集。
在一些实现中,数据可以包括与关联于组织的***相关的***数据。例如,***数据可以标识各种***、各种***的金额、与***相关联的项目和/或服务、与***相关联的实体(例如生成***或正在接收***的组织、生成***或正在接收***的个体等)、生成***的日期,***到期的日期等。
在一些实现中,数据可以包括与关联于组织的请购单相关的请购单数据。例如,请购单数据可以标识生成请购单的日期、要完成请购单的日期、要经由请购单获得的项目、要获得的项目的数量、请购单的预算等。
在一些实现中,数据可以包括与关联于组织的工程相关的工程数据。例如,工程数据可以标识由组织完成的工程、受雇于工程的个体、工程的持续时间、工程是已经完成还是正在进行中、工程是否在预算内、先前针对工程使用的供应方、工程的主题(例如信息技术(IT)工程、咨询工程等)等。
在一些实现中,数据可以呈特定形式。例如,数据可以呈图像形式、呈文本形式、呈电子数据表文件格式等。在一些实现中并且如本文中的其他位置处所描述,采购分析平台可以使用预处理技术来处理数据以从数据提取术语、短语、数字、符号等。
如由附图标记104-1和104-2所示,采购分析平台可以将数据提供给与采购分析平台相关联的各种评分组件。例如,且如由附图标记104-1所示,采购分析平台可以将采购单数据和/或工程数据提供给实时评分组件以用于实时(或近实时)分析。附加地或备选地,且作为另一示例,采购分析平台可以将***数据提供给分批评分组件以用于分批处理。在一些实现中,根据对实时(或近实时)结果的需要、数据的性质(例如可以分批生成一些数据)等,可以针对不同数据(例如请购单数据、工程数据和/或***数据)使用实时评分组件和分批评分组件。在一些实现中,采购分析平台可以在接收到数据之后,基于接收到来自采购分析平台的用户的执行分析的请求,在接收到阈值数据量(例如针对将要提供给分批评分组件的数据)之后等,而将数据提供给各种评分组件。
转到图1B且如由附图标记106所示,采购分析平台可以使用预处理技术来处理数据。例如,采购分析平台可以在接收到数据之后、在将数据提供给各种评分组件之后等,而使用各种评分组件来使用预处理技术处理数据。
在一些实现中,所使用的预处理技术可以取决于数据的形式。例如,当数据呈图像形式时,采购分析平台可以使用图像处理技术(例如计算机视觉技术、光学字符识别(OCR)技术等)来处理数据;当数据呈文本形式时,采购分析平台可以使用文本处理技术(例如自然语言处理技术、计算语言学技术等)来处理数据等。
如由附图标记108所示且将***用作示例,采购分析平台可以处理***的图像以标识***中的术语、短语、数字、符号等。例如,采购分析平台可以使用诸如OCR技术的图像处理技术来标识与***相关联的组织(“公司A”和“公司B”),可以标识与***相关联的项目(“铅笔——机械式0.5毫米”),可以通过标识图像中的文本、通过在图像的预定义区域中搜索文本等来标识项目的数量(“1000”)、项目的单价(“$0.10”)、项目的总价(“$100.00”)以及***的到期日期(“2/4/2018”)等。
如由附图标记110所示且仍以***作为示例,采购分析平台可以在标识***中的数据之后从***中提取数据。例如,采购分析平台可以在标识图像中的项目、短语、数字、符号等之后从***的图像提取术语、短语、数字、符号等。在一些实现中,采购分析平台可以通过复制数据的部分、通过生成数据的片段等来提取所标识的数据。例如,采购分析平台可以从***的图像中复制所标识的术语、短语、数字、符号等,可以从***的图像中捕获包括术语、短语、数字、符号等的图像片段等。继续参照先前的示例,由附图标记110所示的数据可以包括来自***的图像的复制数据、包括数据的图像片段等。
在一些实现中,采购分析平台可以删除未提取的数据。例如,采购分析平台可以在从图像中提取术语、短语、数字、符号等之后删除***的图像。这通过减少或消除对采购分析平台存储和/或处理未提取的数据的需要而节省了采购分析平台的存储器资源和/或处理资源。
转到图1C且如由附图标记112所示,采购分析平台可以使用数据特征提取引擎来处理数据。例如,在使用预处理技术来处理数据之后,采购分析平台可以使用数据特征提取引擎来处理在***的图像中标识的数据。在一些实现中,数据特征提取引擎可以使用标准化技术、令牌化技术、基于文本的数值特征建模技术、潜在特征建模技术等来处理数据。
在一些实现中,当使用数据特征提取引擎来处理数据时,采购分析平台可以使用令牌化技术来使数据令牌化。例如,采购分析平台可以根据在***中标识的数据来生成各种字符序列。继续参照先前的示例,采购分析平台可以根据多术语短语来生成多个术语的集合,可以将短语缩写为首字母缩略词(或可以扩展首字母缩略词),可以将数据分类为特定类型的数据并且可以从数据中移除指示数据分类的符号(例如可以将“$1.00”分类为美元金额且可以将“$1.00”令牌化为“1”),可以从数据中移除特定术语和/或短语(例如可以从包括组织名称的数据中移除“Inc.”或“Company”)等。这减小了数据的大小,从而在存储数据时节省了采购分析平台的存储器资源,从而在处理数据时节省了处理资源等。
在一些实现中,当使用数据特征提取引擎来处理数据时,采购分析平台可以使用标准化技术来使数据标准化。例如,采购分析平台可以处理数据以减少或消除数据之间的不一致(例如来自不同源的数据集中的不一致或关于参考数据集的不一致)。继续参照先前的示例,采购分析平台可以将多个术语转换为单数术语(反之亦然),可以相对于数据将字母、标点符号等添加进来和/或移除字母、标点符号等(例如可以将“U.S.A.”转换为“USA”),可以纠正数据中的拼写错误,可以将术语的变型转换为常用术语(例如可以将“Comp.A”和“Company A”转换为“A”)等。这减少或消除了数据的不一致,这以易于使采购分析平台在采购分析平台的其他操作期间进行处理的形式放置数据,从而节省了采购分析平台的处理资源。
在一些实现中,当使用数据特征提取引擎来处理数据时,采购分析平台可以使用基于文本的数值特征建模技术来处理数据。例如,采购分析平台可以生成描述了数据中所包括的数据元素的数值特征的集合(例如数据元素的可测量的属性或特性的集合)的特征向量,并且可以基于特征向量将来自物种分类的数据分类为属分类(例如通过计算特征向量与权重向量之间的标量积,并且基于标量积与阈值的比较来确定数据元素的分类)。例如,采购分析平台可以将“剪刀”和“铅笔”分类为“办公用品”分类,可以将“铅笔——2号”和“铅笔——机械式0.5毫米”分类为“铅笔”分类等。这经由将相似数据分类为相同分类简化了用于处理的数据,从而在处理数据时节省了采购分析平台的处理资源,从而便于数据的更快分析等。
在一些实现中,当使用特征提取引擎来处理数据时,采购分析平台可以使用潜在特征建模技术来处理数据。例如,采购分析平台可以对如关于基于文本的数值特征建模技术所描述的数据执行相似分类。继续参照先前的示例,采购分析平台可以标识数据中所包括的术语、短语等之中的相似性或差异(例如通过标识与相同属术语相关的物种术语和/或短语)并且可以将相似术语分类在一起。这经由相似数据的分类简化了用于处理的数据,从而在处理数据时节省了采购分析平台的处理资源,从而便于数据的更快分析等。
在一些实现中,采购分析平台可以与使用特征提取引擎相关联地使用机器学***台可以使用与特征提取引擎相关联的机器学***台可以经由对机器学***台可以训练机器学习模型以输出与***(例如***的类别)、请购单(例如请购单的类别和/或要针对请购单使用的供应方)、工程(例如工程的类别、要针对工程使用的供应方和/或针对工程的相似工程的集合)等相关的预测。
在一些实现中,采购分析平台可以在训练数据集上训练机器学***台将与历史***、历史请购单和/或历史工程相关的数据输入到机器学***台可以输入数据的第一部分作为训练数据集(例如用于训练机器学***台可以根据机器学习模型的测试结果来(例如通过提交数据的不同部分作为训练数据集、验证数据集以及测试数据集)执行机器学习模型的训练的多次迭代。
在一些实现中,当训练机器学***台可以利用随机森林分类器技术来训练机器学***台可以在训练期间利用随机森林分类器技术来构造多个决策树,并且可以输出数据的分类。附加地或备选地,当训练机器学***台可以利用一种或多种梯度提升技术来生成机器学***台可以利用xgboost分类器技术、梯度提升树等来根据弱预测模型的集合生成预测模型。
在一些实现中,当训练机器学***台可以利用逻辑回归来训练机器学***台可以利用与历史***、历史请购单和/或历史工程相关的数据的二进制分类(例如历史***、历史请购单和/或历史工程是否与特定类别相关联)来训练机器学***台可以利用朴素贝叶斯分类器来训练机器学***台可以利用二进制递归分区将与历史***、历史请购单和/或历史工程相关的数据划分为各种二进制类别(例如从历史***、历史请购单和/或历史工程是否与数据的历史模式相匹配开始)。基于使用递归分区,采购分析平台可以相对于数据点的手动线性分类和分析减少了对计算资源的利用,从而使得能够使用数千、数百万或数十亿的数据点来训练机器学习模型,与使用较少的数据点相比,这可能会产生更准确的机器学习模型。
附加地或备选地,当训练机器学***台可以利用支持向量机(SVM)分类器。例如,采购分析平台可以利用线性模型来实现非线性类边界,诸如经由最大边界超平面。附加地或备选地,当利用SVM分类器时,采购分析平台可以利用二进制分类器来执行多类别分类。SVM分类器的使用可以减少或消除了过度拟合,可以增加机器学习模型对噪声的稳健性等。
在一些实现中,采购分析平台可以使用监督训练过程来训练机器学***台可以使用一种或多种其他模型训练技术,诸如神经网络技术、潜在语义索引技术等。例如,采购分析平台可以执行多层人工神经网络处理技术(例如使用两层前馈神经网络架构、三层前馈神经网络架构等),以执行关于历史***、请购单和/或工程的模式的模式识别;基于历史分析的准确性来执行关于历史***、请购单和/或工程的模式的模式识别等。在这种情况下,使用人工神经网络处理技术可以通过针对噪声、不精确或不完整的数据更为稳健且通过启用采购分析平台来提高由采购分析平台生成的监督学习模型的准确性,以使用不太复杂的技术来检测人类分析人员或***无法检测到的模式和/或趋势。
作为示例,采购分析平台可以使用监督多标签分类技术来训练机器学***台可以在标记历史***、请购单和/或工程之后将与历史***、请购单和/或工程相关联的数据映射到先前生成的模型的集合。在这种情况下,可以将历史***、请购单和/或工程的分类表征为已经被准确或不准确地预测等(例如由技术人员来进行,从而相对于采购分析平台减少分析每个历史***、请购单和/或工程所需的处理)。
作为第二步骤,采购分析平台可以确定分类器链,由此可以关联目标变量的标签(例如在此示例中,标签可以是历史分类的结果,且关联性可以指代不同标签所共有的历史分类等)。在这种情况下,采购分析平台可以将第一标签的输出用作第二标签的输入(以及一个或多个输入特征,这些特征可以是与历史***、请购单和/或工程相关的其他数据),并且可以基于与关联于相似数据的其他历史***、请购单和/或工程的相似性来确定要将特定历史***、请购单和/或工程与至少一种分类相关联的可能性。以这种方式,采购分析平台将分类从多标签分类问题转换为多个单分类问题,从而降低了处理利用率。
作为第三步骤,采购分析平台可以通过使用验证数据集来确定与执行分类中的标签的准确性相关的汉明(Hamming)损失量度(例如将权重应用于每个历史***、请购单和/或工程的准确性,且每个历史***、请购单和/或工程是否与特定分类相关联,是否会产生正确分类等,从而说明了历史***、请购单和/或工程之间的变化)。
作为第四步骤,采购分析平台可以基于满足与汉明损失度量相关联的阈值准确性的标签来最终确定机器学习模型,并且可以将机器学习模型用于其他模型的后续确定。
作为另一示例,采购分析平台可以使用线性回归技术来确定在数据元素的值的集合中,数据元素的值的阈值百分比不指示特定分类、是否不应针对请购单使用特定供应方等,并且可以确定数据元素的那些值将接收相对较低的关联分数。相比之下,采购分析平台可以确定数据元素的值的另一阈值百分比指示特定分类、是否应针对请购单使用供应方等,并且可以将相对较高的关联分数分配给数据元素的那些值。基于指示分类的数据元素的特性、是否应使用供应方等,采购分析平台可以生成模型并且可以使用该模型来分析与采购分析平台标识的***、请购单、工程等相关的新数据元素。
因此,如本文中所描述,采购分析平台可以使用人工智能技术、机器学习技术、深度学习技术等来确定类别,确定要使用的供应方,标识相似工程等。
在一些实现中,采购分析平台可以生成模型并且使用该模型来执行本文中所描述的各种处理。例如,基于与跨多个***的数百、数千、数百万或更多个实体相关的数据,采购分析平台可以确定***、请购单和/或工程的类别,可以确定要针对请购单和/或工程使用的供应方和/或可以针对工程标识相似工程。在这种情况下,该模型可以是基于项目的协同过滤模型、单值分解模型、混合推荐模型和/或基于***数据、请购单数据、工程数据等来实现本文中所描述的各种确定的另一种类型的模型。
在一些实现中,采购分析平台可以生成关联于生成不同预测、关联于处理来自不同***和/或不同形式的数据等的不同机器学***台可以将从***接收到的数据输入到机器学***台可以使用此信息来针对***、请购单和/或工程生成推荐。
附图标记114示出了使用数据特征提取引擎从***(如由附图标记110所示)提取的处理数据的示例输出。例如,由附图标记110所示的数据的一些数据元素已被修改成由附图标记114所示的形式。继续参照先前的示例,数据元素“公司A”和“公司B”已被分别修改为“A”和“B”,这减小了这些数据元素的大小。附加地或备选地,且继续参照先前的示例,短语“铅笔-机械式0.5毫米”已被分成术语“铅笔”、“机械式”和“0.5毫米”,同时从短语中的移除“-”和“,”字符,从而减小了数据的大小,并且便于短语“铅笔–机械式,0.5毫米”的物种和属分类(例如分类为“铅笔”分类、分类为“机械式铅笔”分类等)。
转到图1D且如由附图标记116所示,采购分析平台可以使用变换引擎来处理数据。例如,采购分析平台可以在使用特征提取引擎来处理数据之后使用变换引擎来处理数据。
在一些实现中,变换引擎可以使用弱分类器技术(例如,其中基于弱分类器将数据的子集分组在一起)、降维技术(例如,其中通过特征选择和特征提取来减少数据中的随机变量)等。例如,采购分析平台可以使用变换引擎来将数据分类成与归纳数据相关联的一种或多种分类。这减少了采购分析平台必须处理的独特数据元素的数量,便于对数据特性的改进检测等。附加地或备选地,变换引擎可以包括使用函数来压缩数据。例如,函数可以包括哈希函数、校验和等。这减小了数据的大小(例如从字符串到较短长度的哈希、校验和等),从而在存储数据时节省了采购分析平台的存储器资源,在处理数据时节省了采购分析平台的处理资源等。在一些实现中,采购分析平台可以在使用变换引擎时使用与本文中的其他位置所描述的机器学习模型相似的机器学习模型。
附图标记118和120示出了使用变换引擎从特征提取引擎(由附图标记114所示)输出的处理结果。例如,并且如由附图标记118所示,采购分析平台可以使用哈希函数将术语“铅笔”、“机械式”和“0.5毫米”转换成哈希“56”,可以将数字“1,000”分类成“低于10,000个单位”,可以基于在***日期(“1/3/2018”)的60天内的到期日期将到期日期“2/4/2018”分类为“在60天内到期”分类等。这降低了数据的复杂性和/或数据的大小,从而在处理数据时节省了采购分析平台的处理资源,在存储数据时节省了存储器资源等。
继续参照先前的示例,且如由附图标记120所示,采购分析平台可以将标识公司B的“B”分类为“办公供应方”,并且可以将“56”分类为“办公用品”分类。这有助于基于具有相似分类的历史数据来生成与数据相关的推荐。
转到图1E且如由附图标记122所示,采购分析平台可以使用机器学***台可以在使用变换引擎来处理数据之后使用机器学习模型的集合来处理数据。在一些实现中,该机器学习模型的集合可以与本文中的其他位置所描述的机器学习模型相似。在一些实现中,该机器学习模型的集合可以包括梯度提升机器学习模型(例如以弱预测模型的集合的形式使用预测模型的机器学习模型,诸如决策树)、广义线性模型(例如使用线性回归模型的广义线性模型,该线性回归模型允许具有除正态分布以外的误差分布模型的响应变量)等。
在一些实现中,该机器学***台可以使用该机器学***台可以使用该机器学***均分数或最低平均分数来对***、请购单和/或工程进行分类,等等。在一些实现中,采购分析平台可以使用该机器学习模型的集合来以相似方式为请购单和/或工程确定供应方(例如要针对请购单和/或工程使用的供应方)、针对工程标识相似工程等。
附图标记124示出了来自关于***、请购单和/或工程的该机器学习模型的集合的输出的示例。例如,并且关于***,来自该机器学习模型的集合的输出可以标识评估***的各种类别和与各种类别相关联的对应分数。继续参照先前的示例,该机器学习模型的集合可以针对类别“办公用品”输出0.99的高分,从而指示***最有可能与办公用品相关联。如本文中的其他位置所描述,这有助于在与相同类别相关联的其他***的上下文中分析***。
附加地或备选地,且作为关于请购单的示例,来自该机器学习模型的集合的输出可以针对各种类别和各种供应方标识相似分数。继续参照先前的示例,且相对于各种供应方的分数,该机器学习模型的集合可以针对供应方“D”输出0.91的高分。如本文中的其他位置所描述,这可以表明供应方“D”是对于请购单而言最有可能合乎理想的供应方,从而有助于针对请购单选择供应方。
附加地或备选地,且作为关于工程的示例,来自该机器学习模型的集合的输出可以针对各种类别、各种供应方和各种其他工程标识相似分数。继续参照先前的示例,且关于各种其他工程的分数,该机器学习模型的集合可以针对工程“Q”输出0.83的高分,从而指示“Q”与工程最为相似。这有助于在一个或多个其他相似工程的上下文中对项目进行分析,有助于在一个或多个其他相似工程的上下文中监测工程等。
转到图1F,且如由附图标记126所示,采购分析平台可以执行一个或多个动作。例如,采购分析平台可以基于来自该机器学习模型的集合的输出,在使用该机器学习模型的集合来处理数据之后执行一个或多个动作等。
在一些实现中,采购分析平台可以从采购分析平台的用户接收对来自该机器学***台可以基于手动调整来更新该机器学***台可以基于手动调整来重新训练该机器学习模型的集合,可以生成用户特定的机器学习模型的集合等。
附加地或备选地,采购分析平台可以基于该机器学***台可以执行***的分析。继续参照先前的示例,采购分析平台可以分析金额、到期日期、项目、项目的数量等是否与***被分类为的相同类别中的其他***相匹配。附加地或备选地,且作为另一示例,采购分析平台可以执行请购单的分析。继续参照先前的示例,采购分析平台可以执行与请购单被分类为的类别相关的相似分析和/或可以针对请购单标识的供应方的分析(例如是否基于与请购单和相似请购单相关联的项目、金额、数量等将相似请购单与供应方相关联)。附加地或备选地,且作为另一示例,采购分析平台可以执行工程的分析。继续参照先前的示例,采购分析平台可以针对与本文中的其他位置所描述的工程相似的工程执行类别和/或供应方的分析,并且可以在针对工程标识的相似工程的上下文中执行工程的分析(例如工程的预算使用和/或成本是否与相似工程相匹配、工程的持续时间是否与相似工程相匹配等)。
作为采购分析平台可以执行的分析的另一示例,采购分析平台可以执行供应商合理化和/或推荐分析。例如,采购分析平台可以执行供应商合理化和/或推荐分析,以标识针对工程用品使用的供应商组合的低效率、降低与使用不同供应商相关联的成本的方式等。继续参照先前的示例,采购分析平台可以基于切换供应商来分析项目的单价是否可以更低,可以为项目推荐新供应商等。附加地或备选地,采购分析平台可以确定采购订单和/或费用与采购订单计数的供应商的对应数量的百分比、采购订单费用的供应商的数量等。例如,采购分析平台可以确定与采购订单总量和/或采购订单费用总额的10%、20%、30%等相关联的供应商数量。相似地,采购分析平台可以为供应商做出相似确定(例如与供应商相关联的采购订单总量的百分比,与供应商相关联的采购订单费用总额的百分比等)。
基于这些分析,采购分析平台可以推荐对所使用的供应商组合的修改。例如,采购分析平台可以推荐将一组供应商合并为较小数量的供应商(或将所使用的一组供应商扩展为大量供应商),可以推荐将一个或多个供应商替换为一个或多个其他供应商等。
附加地或备选地,且作为采购分析平台可以执行的分析的另一示例,采购分析平台可以执行与各种供应商的价格合规性相关的分析。例如,采购分析平台可以标识与比超出预测金额的阈值金额更高的价格相关联的项目,可以标识价格上涨或下跌的趋势(且如果这些趋势与所预期的结果不同,那么可以触发警报)等。
在一些实现中,执行与价格合规性相关的分析可以包括选择和/或接收在一段时间期间接收到的采购订单的集合的数据。附加地或备选地,执行分析可以包括将行项过滤器应用于采购订单。例如,采购分析平台可以过滤缺少有关行项的描述性数据的采购订单的行项,可以过滤特定类型的行项(例如特定类型的项目),可以过滤零数量或零值行项等。附加地或备选地,执行分析可以包括(例如使用机器学***台可以标识与采购订单相关联的独特产品(例如基于采购订单的文本、产品的采购订单中的项目描述、产品的标识符等)。这有助于在不同采购订单中标识相似产品,但不考虑文本的一致性或其他描述符,减少需要处理的独特数据点的数量(从而节省了采购分析平台的处理资源和/或存储器资源),有助于标识相似产品之间的价格变化(这可以有助于节省费用)等。
附加地或备选地,分析可以包括将产品过滤器应用于采购订单中标识的产品和/或可以将产品聚类成各种分组。例如,采购分析平台可以过滤并未以阈值频率采购的产品,可以过滤经历价格的阈值变化的产品,可以过滤以未能满足阈值的数量采购的产品,可以基于价格对相似产品进行聚类等。这通过移除离群数据、通过将数据分组为容易分析的组(这有助于更快的分析,节省处理资源等)等来便于对采购订单的更准确的分析。附加地或备选地,采购分析平台可以执行与价格合规性相关的分析。例如,采购分析平台可以预测产品价格,可以做出关于采购产品的最佳时间和/或要采购的产品的最佳数量的推荐(基于产品价格的历史波动时机、基于应用于历史大宗订单的历史折扣等),可以标识未能与历史价格或预测价格相匹配的价格等。继续参照先前的示例,如果价格以阈值金额超出了历史价格或预测价格,那么采购分析平台可以将价格标识为不合规;如果价格以阈值金额超过了历史价格或预测价格,那么采购分析平台可以将价格标识为可能的数据误差等。
在一些实现中,采购分析平台可以与执行与价格合规性相关的分析相关联地执行聚类分析。例如,采购分析平台可以按单价、采购日期等对产品进行聚类。执行聚类分析可以减少被错误地标记为不合规的行项的数量(例如基于处于特定聚类中),这节省了与标记行项相关联的处理资源和/或减少或消除了对标记的手动检查的需要,可以有助于标识随时间流逝的一致或不一致价格变化等。在一些实现中,采购分析平台可以基于对所使用的供应商、对采购订单用途的时间段、对采购位置、对所分析的采购订单的集合等的改变来更新聚类。附加地或备选地,采购分析平台可以利用可调整的回顾时段来解决不稳定的价格。例如,采购分析平台可以使用10天、90天等时间段来在滚动的基础上分析采购订单。
在一些实现中,采购分析平台可以在价格数据和/或折扣的历史趋势上训练机器学习模型,以有助于执行与价格合规性相关的分析。这提高了标识不合规价格的准确性,从而节省了由于不准确地标识不合规价格而将以其他方式被消耗的处理资源。
附加地或备选地,且如由附图标记128所示,采购分析平台可以输出报告以供显示(例如通过将报告提供给客户端设备)。例如,报告可以包括标识分析结果的信息、包括来自该机器学习模型的集合的输出的信息等。
在一些实现中,采购分析平台可以生成推荐。例如,采购分析平台可以基于来自该机器学***台可以生成对***、请购单和/或工程的推荐修改(例如以与***、请购单和/或工程被分类为的类别的特性相匹配),可以推荐要针对请购单和/或工程使用的特定供应方(或对当前供应方的修改),可以向与供应方相关联的采购***发送电子订单以发出项目订单,可以推荐对管理工程的方式的修改(例如可以推荐应急计划以加速工程的完成,可以推荐对与工程相关联的费用的修改,以使工程保持在预算内或等于预算)等。在一些实现中,采购分析平台可以输出标识采购分析平台已生成的推荐的信息以供显示。
附加地或备选地,且如由附图标记130所示,采购分析平台可以将递送指令的集合发送到递送车辆(例如车载***、与递送车辆相关联的用户设备等)。例如,该递送指令的集合可以针对与***、请购单和/或工程相关联的项目标识递送位置。附加地或备选地,采购分析平台可以基于***中或请购单中标识的金额向服务器设备发送消息以贷记账户和/或借记账户。附加地或备选地,采购分析平台可以向服务器设备发送消息以更新关于***的状态(例如是否已经接收到、处理和/或支付了***)的账户、请购单(例如请购单是否已经被发送、是否已由供应方确认和/或是否已配货)和/或工程(例如工程是否按时、按预算等)。
以这种方式,采购分析平台可以处理数据以减小数据的大小和/或简化数据。这减少了存储数据所需的存储器资源量,从而节省了采购分析平台的存储器资源。此外,相对于使用未经处理的数据集,以这种方式处理数据有助于更快地处理数据。另外,以这种方式处理数据以在处理数据时减少处理资源上的计算负载的形式放置数据。
如上文所指示,图1A至图1F仅仅被提供作为一个或多个示例。其他示例可以与关于图1A至图1F描述的内容不同。
图2是本文中所描述的示例实现200的示意图。实现200包括采购分析平台。
如由附图标记210所示,采购分析平台可以按与本文中的其他位置所描述的方式相似的方式接收数据。例如,采购分析平台可以接收***数据、请购单数据和/或工程数据。如由附图标记220所示,采购分析平台可以按与本文中的其他位置所描述的方式相似的方式使用特征提取引擎来处理数据。例如,采购分析平台可以使用标准化技术(例如单词标准化)、令牌化技术(例如令牌化词干)、基于文本的数值特征建模技术(例如对数tf-idf)、潜在特征建模技术(例如word2vec、GloVe向量)等来处理数据。
如由附图标记230所示,采购分析平台可以按与本文中的其他位置所描述的方式相似的方式使用变换引擎来处理来自特征提取引擎的输出。例如,采购分析平台可以使用弱分类器技术、降维技术(例如使用特征哈希)等来处理来自特征提取引擎的输出。如由附图标记240所示,采购分析平台可以按与本文中的其他位置所描述的方式相似的方式使用机器学***台可以使用梯度提升机器学习模型、广义线性模型等来处理来自变换引擎的输出。如由附图标记250所示,来自该机器学习模型的集合的输出可以与本文中的其他位置所描述的输出相似。例如,来自该机器学习模型的集合的输出可以包括类别、供应方推荐、相似工程推荐等。
如上文所指示,图2仅仅被提供作为示例。其他示例可以与关于图2所描述的内容不同。
图3是可以实现本文中所描述的***和/或方法的示例环境300的示意图。如图3所示,环境300可以包括客户端设备310、服务器设备320、托管在包括计算资源334的集合的云计算环境332内的采购分析平台330以及网络340。环境300的设备可以经由有线连接、无线连接或有线连接与无线连接的组合互连。
客户端设备310包括能够接收、生成、存储、处理和/或提供本文中所描述的数据的一个或多个设备。例如,客户端设备310可以包括移动电话(例如智能电话、无线电话等)、膝上型计算机、平板计算机、手持式计算机、游戏设备、可穿戴通信设备(例如智能腕表、一对智能眼镜等)、台式计算机或相似类型的设备。如本文中的其他位置所描述,在一些实现中,客户端设备310可以从采购分析平台330接收由采购分析平台330执行的数据的分析结果。
服务器设备320包括能够接收、生成、存储、处理和/或提供本文中所描述的数据的一个或多个设备。例如,服务器设备320可以包括服务器(例如在数据中心或云计算环境中)、数据中心(例如多服务器微数据中心)、工作站计算机、设置在云计算环境中的虚拟机(VM)或相似类型的设备。在一些实现中,服务器设备320可以包括允许服务器设备320从环境300中的其他设备接收信息和/或向环境300中的其他设备传送信息的通信接口。在一些实现中,服务器设备320可以是在诸如机架的外壳内实现的物理设备。在一些实现中,服务器设备320可以是由云计算环境或数据中心的一个或多个计算机设备实现的虚拟设备。在一些实现中,如本文中的其他位置所描述,服务器设备320可以向采购分析平台330提供数据以供由采购分析平台330处理。
采购分析平台330包括能够接收、生成、存储、处理和/或提供本文中所描述的数据的一个或多个设备。例如,采购分析平台330可以包括云服务器或一组云服务器。在一些实现中,采购分析平台330可以被设计成模块化的,使得某些软件组件可以根据特定需要而被换入或换出。这样,采购分析平台330可以容易地和/或快速地被重新配置为用于不同用途。
在一些实现中,如图3所示,可以将采购分析平台330托管在云计算环境332中。值得注意的是,虽然本文中所描述的实现将采购分析平台330描述为被托管在云计算环境332中,但在一些实现中,采购分析平台330可以是非基于云的(即,可以在云计算环境外部实现)或可以是部分基于云的。
云计算环境332包括托管采购分析平台330的环境。云计算环境332可以提供不需要终端用户了解托管采购分析平台330的***和/或设备的物理位置和配置的计算、软件、数据访问、存储和/或其他服务。如所示出,云计算环境332可以包括一组计算资源334(统称为“计算资源334”且单独地称为“计算资源334”)。
计算资源334包括一个或多个个人计算机、工作站计算机、服务器设备或另一种类型的计算和/或通信设备。在一些实现中,计算资源334可以托管采购分析平台330。云资源可以包括在计算资源334中执行的计算实例、在计算资源334中提供的存储设备、由计算资源334提供的数据传输设备等。在一些实现中,计算资源334可以经由有线连接、无线连接或有线连接与无线连接的组合与其他计算资源334通信。
如图3中进一步所示,计算资源334可以包括一组云资源,诸如一个或多个应用(“APP”)334-1、一个或多个虚拟机(“VM”)334-2、一个或多个虚拟化存储装置(“VS”)334-3或一个或多个管理程序(“HYP”)335-4。
应用334-1包括可以被提供给环境300的一个或多个设备或由环境300的一个或多个设备访问的一个或多个软件应用。应用334-1可以消除在环境300的设备上安装和执行软件应用的需要。例如,应用334-1可以包括与采购分析平台330相关联的软件和/或能够经由云计算环境332提供的任何其他软件。在一些实现中,一个应用334-1可以经由虚拟机334-2向/从一个或多个其他应用334-1发送/接收信息。在一些实现中,应用334-1可以包括与一个或多个数据库和/或操作***相关联的软件应用。例如,应用334-1可以包括企业应用、功能应用、分析应用等。
虚拟机334-2包括执行程序(比如物理机)的机器(例如计算机)的软件实现。虚拟机334-2可以是***虚拟机或过程虚拟机中的任一者,这取决于虚拟机334-2对任何实机的使用和对应程度。***虚拟机可以提供支持执行完整操作***(“OS”)的完整***平台。过程虚拟机可以执行单个程序并且可以支持单个过程。在一些实现中,虚拟机334-2可以代表用户(例如客户端设备310的用户)执行,并且可以管理云计算环境332的基础设施,诸如数据管理、同步或长期数据传输。
虚拟化存储装置334-3包括一个或多个存储***和/或一个或多个设备,该一个或多个设备使用计算资源334的存储***或设备内的虚拟化技术。在一些实现中,在存储***的上下文内,虚拟化类型可以包括区块虚拟化和文件虚拟化。区块虚拟化可以指逻辑存储装置与物理存储装置的抽象(或分离),使得可以在不考虑物理存储装置或异构结构的情况下访问存储***。这种分离可以允许存储***的管理员实现管理员管理终端用户的存储装置的方式的灵活性。文件虚拟化可以消除在文件级别处访问的数据与物理地存储文件的位置之间的依赖性。这可以使能优化存储使用、服务器整合和/或非中断性文件迁移的性能。
管理程序334-4提供了硬件虚拟化技术,该硬件虚拟化技术允许多个操作***(例如“访客操作***”)在主机计算机(诸如计算资源334)上同时执行。管理程序334-4可以向访客操作***呈现虚拟操作平台并且可以管理访客操作***的执行。各种操作***的多个实例可以共享虚拟化硬件资源。
网络340包括一个或多个有线和/或无线网络。例如,网络340可以包括蜂窝网络(例如长期演进(LTE)网络、码分多址(CDMA)网络、3G网络、4G网络、5G网络、另一种类型的新一代网络等)、公共陆地移动网络(PLMN)、局域网(LAN)、广域网(WAN)、城域网(MAN)、电话网络(例如公共交换电话网络(PSTN))、专有网络、自组织网络、内联网、互联网、基于光纤的网络、云计算网络等和/或这些或其他类型的网络的组合。
图3中所示的设备和网络的数目和布置被提供为一个或多个示例。实际上,与图3中所示的设备和网络相比,可以存在附加设备和/或网络、更少的设备和/或网络、不同的设备和/或网络或以不同方式布置的设备和/或网络。此外,图3中所示的两个或更多个设备可以被实现在单个设备内,或者图3中所示的单个设备可以被实现为多个分布式设备。附加地或备选地,环境300的设备的集合(例如一个或多个设备)可以执行被描述为由环境300的另一设备的集合执行的一个或多个功能。
图4是设备400的示例组件的示意图。设备400可以与客户端设备310、服务器设备320、采购分析平台330和/或计算资源334相对应。在一些实现中,客户端设备310、服务器设备320、采购分析平台330和/或计算资源334可以包括一个或多个设备400和/或设备400的一个或多个组件。如图4所示,设备400可以包括总线410、处理器420、存储器430、存储组件440、输入组件450、输出组件460以及通信接口470。
总线410包括允许设备400的多个组件之间的通信的组件。利用硬件、固件和/或硬件和软件的组合来实现处理器420。处理器420是中央处理单元(CPU)、图形处理单元(GPU)、加速处理单元(APU)、微处理器、微控制器、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、专用集成电路(ASIC)或另一种类型的处理组件。在一些实现中,处理器420包括能够被编程为执行功能的一个或多个处理器。存储器430包括存储供处理器420使用的信息和/或指令的随机存取存储器(RAM)、只读存储器(ROM)和/或另一种类型的动态或静态存储设备(例如闪速存储器、磁性存储器和/或光学存储器)。
存储组件440存储与设备400的操作和使用相关的信息和/或软件。例如,存储组件440可以包括硬盘(例如磁盘、光盘和/或磁光盘)、固态驱动器(SSD)、压缩盘(CD)、数字多功能光盘(DVD)、软盘、磁带盒、磁带和/或另一种类型的非瞬态计算机可读介质以及对应驱动器。
输入组件450包括允许设备400诸如经由用户输入接收信息的组件(例如触摸屏显示器、键盘、小键盘、鼠标、按钮、交换机和/或麦克风)。附加地或备选地,输入组件450可以包括用于确定位置的组件(例如全球定位***(GPS)组件)和/或传感器(例如加速度计、陀螺仪、致动器、另一种类型的位置或环境传感器等)。输出组件460包括(经由例如,显示器、扬声器、触觉反馈组件、音频或视觉指示器等)提供来自设备400的输出信息的组件。
通信接口470包括类似收发器的组件(例如收发器、分离接收器、分离发射器等),该组件使得设备400能够与其他设备通信,诸如经由有线连接、无线连接或有线连接与无线连接的组合。通信接口470可以允许设备400从另一设备接收信息和/或向另一设备提供信息。例如,通信接口470可以包括以太网接口、光学接口、同轴接口、红外接口、射频(RF)接口、通用串行总线(USB)接口、Wi-Fi接口、蜂窝网络接口等。
设备400可以执行本文中所描述的一个或多个过程。设备400可以基于处理器420执行由非瞬态计算机可读介质(诸如存储器430和/或存储组件440)存储的软件指令来执行这些过程。如本文中所使用,术语“计算机可读介质”是指非瞬态存储器设备。存储器设备包括单个物理存储设备内的存储器空间或跨多个物理存储设备分布的存储器空间。
可以经由通信接口470从另一计算机可读介质或从另一设备将软件指令读取到存储器430和/或存储组件440中。存储在存储器430和/或存储组件440中的软件指令在被执行时可以使处理器420执行本文中所描述的一个或多个过程。附加地或备选地,硬件电路装置可以代替软件指令使用或与软件指令结合使用以执行本文中所描述的一个或多个过程。因此,本文中所描述的实现不限于硬件电路装置和软件的任何特定组合。
图4中所示的组件的数目和布置被提供为示例。实际上,与图4中所示的组件相比,设备400可以包括附加组件、更少的组件、不同组件或以不同方式布置的组件。附加地或备选地,设备400的组件的集合(例如一个或多个组件)可以执行被描述为由设备400的另一组件的集合执行的一个或多个功能。
图5是用于使用基于机器学***台来执行基于机器学***台(例如采购分析平台330)执行。在一些实现中,图5的一个或多个过程框可以由另一设备或一组设备来执行,这些设备与采购分析平台分离或包括采购分析平台,诸如客户端设备(例如客户端设备310)、服务器设备(例如服务器设备320)和计算资源(例如计算资源334)。
如图5所示,过程500可以包括接收数据,其中,该数据包括以下中的至少一者:与关联于组织的多个***相关的***数据、与关联于组织的多个请购单相关的请购单数据、或与关联于组织的多个工程相关的工程数据(框510)。例如,如上文所描述,采购分析平台(例如使用计算资源334、处理器420、输入组件450、通信接口470等)可以接收数据。在一些实现中,该数据包括以下中的至少一者:与关联于组织的多个***相关的***数据、与关联于组织的多个请购单相关的请购单数据或与关联于组织的多个工程相关的工程数据。
如图5中进一步所示,过程500可以包括在接收到数据之后使用预处理技术来处理数据,其中,预处理技术包括以下中的至少一者:图像处理技术或文本处理技术(框520)。例如,如上文所描述,采购分析平台(例如使用计算资源334、处理器420等)可以在接收到数据之后使用预处理技术来处理数据。在一些实现中,预处理技术包括以下中的至少一者:图像处理技术或文本处理技术。
如图5中进一步所示,过程500可以包括在使用预处理技术来处理数据之后使用特征提取引擎来处理数据,以标识数据的特征(框530)。例如,如上文所描述,采购分析平台(例如使用计算资源334、处理器420等)可以在使用预处理技术来处理数据之后使用特征提取引擎来处理数据,以标识数据的特征。
如图5中进一步所示,过程500可以包括在使用特征提取引擎来处理数据之后使用变换引擎来处理数据,以减小数据的大小(框540)。例如,采购分析平台(例如使用计算资源334、处理器420等)可以在使用特征提取引擎来处理数据之后使用变换引擎来处理数据,以减小数据的大小。
如图5中进一步所示,过程500可以包括在使用变换引擎来处理数据之后使用机器学***台(例如使用计算资源334、处理器420等)可以在使用变换引擎来处理数据之后使用机器学习模型的集合来处理数据。在一些实现中,该机器学习模型的集合与以下中的至少一者相关:将与***数据相关联的多个***中的每一个、与请购单数据相关联的多个请购单中的每一个或与工程数据相关联的多个工程中的每一个分类为与组织的操作相关联的多种类别中的一种或多种;针对与请购单数据相关联的多个请购单中的每一个或与工程数据相关联的多个工程中的每一个标识可能的供应方的集合;或针对与工程数据相关联的多个工程中的每一个标识相似工程的集合。
如图5中进一步所示,过程500可以包括在使用该机器学***台(例如使用计算资源334、处理器420、存储器430、存储组件440、输入组件450、输出组件460、通信接口470等)可以在使用该机器学习模型的集合来处理数据之后执行一个或多个动作。
过程500可以包括附加实现,诸如,下文所描述的任何单种实现或实现的任何组合和/或结合本文中的其他地方所描述的一个或多个其他过程。
在一些实现中,采购分析平台可以基于来自该机器学***台可以基于该分数的集合来生成与以下中的至少一者相关的推荐的集合:对多个***进行分类;标识该可能的供应方的集合;标识该相似工程的集合;或执行一个或多个动作。
在一些实现中,该机器学***台可以生成包括信息的报告,该信息标识以下中的至少一者:多种类别中的一种或多种、该可能的供应方的集合或该相似工程的集合,并且可以在生成报告之后经由客户端设备输出报告以供显示。
在一些实现中,采购分析平台可以基于与该可能的供应方的集合相关联的相应分数来选择该可能的供应方的集合中的供应方,其中,从该机器学***台可以向与递送一个或多个项目相关联的车辆发送标识用于一个或多个项目的递送位置的信息。
尽管图5示出了过程500的示例框,但在一些实现中,与图5中所描绘的框相比,过程500可以包括附加框、更少的框、不同的框或以不同方式布置的框。附加地或备选地,过程500的框中的两个或更多个可以并行执行。
图6是用于使用基于机器学***台来执行基于机器学***台(例如采购分析平台330)执行。在一些实现中,图6的一个或多个过程框可以由另一设备或一组设备来执行,这些设备与采购分析平台分离或包括采购分析平台,诸如客户端设备(例如客户端设备310)、服务器设备(例如服务器设备320)和计算资源(例如计算资源334)。
如图6所示,过程600可以包括接收数据,其中,该数据与关联于组织的多个***、多个请购单或多个工程相关(框610)。例如,如上文所描述,采购分析平台(例如使用计算资源334、处理器420、输入组件450、通信接口470等)可以接收数据。在一些实现中,数据与关联于组织的多个***、多个请购单或多个工程相关。
如图6中进一步所示,过程600可以包括在接收到数据之后使用预处理技术来处理数据,其中,预处理技术包括以下中的至少一者:图像处理技术或文本处理技术(框620)。例如,如上文所描述,采购分析平台(例如使用计算资源334、处理器420等)可以在接收到数据之后使用预处理技术来处理数据。在一些实现中,预处理技术包括以下中的至少一者:图像处理技术或文本处理技术。
如图6中进一步所示,过程600可以包括在使用预处理技术来处理数据之后使用特征提取引擎来处理数据,以标识数据的特征(框630)。例如,如上文所描述,采购分析平台(例如使用计算资源334、处理器420等)可以在使用预处理技术来处理数据之后使用特征提取引擎来处理数据,以标识数据的特征。
如图6中进一步所示,过程600可以包括在使用特征提取引擎来处理数据之后使用变换引擎来处理数据,以减小数据的大小(框640)。例如,如上文所描述,采购分析平台(例如使用计算资源334、处理器420等)可以在使用特征提取引擎来处理数据之后使用变换引擎来处理数据,以减小数据的大小。
如图6中进一步所示,过程600可以包括在使用变换引擎来处理数据之后使用机器学***台(例如使用计算资源334、处理器420等)可以在使用变换引擎来处理数据之后使用机器学习模型的集合来处理数据。在一些实现中,该机器学习模型的集合与以下中的至少一者相关:将多个***中的每一个、多个请购单中的每一个或多个工程中的每一个分类为与组织的操作相关联的多种类别中的一种或多种;针对多个请购单中的每一个或多个工程中的每一个标识可能的供应方的集合;或针对多个工程中的每一个标识相似工程的集合。
如图6中进一步所示,过程600可以包括基于来自该机器学***台(例如使用计算资源334、处理器420等)可以基于来自该机器学习模型的集合的输出来确定数据的分数。在一些实现中,分数标识多种类别中的一种或多种、该可能的供应方的集合或该相似工程的集合。
如图6中进一步所示,过程600可以包括在确定分数之后执行一个或多个动作(框670)。例如,如上文所描述,采购分析平台(例如使用计算资源334、处理器420、存储器430、存储组件440、输入组件450、输出组件460、通信接口470等)可以在确定分数之后执行一个或多个动作。
过程600可以包括附加实现,诸如,下文所描述的任何单种实现或实现的任何组合和/或结合本文中的其他地方所描述的一个或多个其他过程。
在一些实现中,特征提取引擎使用以下中的至少一者来处理数据:标准化技术、令牌化技术、基于文本的数值特征建模技术或潜在特征建模技术。在一些实现中,变换引擎使用以下中的至少一者来处理数据:弱分类器技术或降维技术。
在一些实现中,采购分析平台可以基于数据中所包括的术语的集合来标识要分析的数据的子集。在一些实现中,采购分析平台可以在标识数据的子集之后,通过将该术语的集合映射至预定术语的集合来将数据的子集标准化为该预定术语的集合。
在一些实现中,采购分析平台可以在使用特征提取引擎来处理数据之后将数据分类为一种或多种分类,其中,该一种或多种分类与归纳数据相关联。在一些实现中,采购分析平台可以在使用特征提取引擎来处理数据之后使用哈希函数来处理数据,其中,哈希函数与压缩数据相关联。
尽管图6示出了过程600的示例框,但在一些实现中,与图6中所描绘的框相比,过程600可以包括附加框、更少的框、不同的框或以不同方式布置的框。附加地或备选地,过程600的框中的两个或更多个可以被并行执行。
图7是用于使用基于机器学***台来执行基于机器学***台(例如采购分析平台330)执行。在一些实现中,图7的一个或多个过程框可以由另一设备或一组设备来执行,这些设备与采购分析平台分离或包括采购分析平台,诸如客户端设备(例如客户端设备310)、服务器设备(例如服务器设备320)和计算资源(例如计算资源334)。
如图7所示,过程700可以包括接收数据,其中,该数据包括以下中的至少一者:与关联于组织的多个***相关的***数据、与关联于组织的多个请购单相关的请购单数据或与关联于组织的多个工程相关的工程数据(框710)。例如,如上文所描述,采购分析平台(例如使用计算资源334、处理器420、输入组件450、通信接口470等)可以接收数据。在一些实现中,该数据包括以下中的至少一者:与关联于组织的多个***相关的***数据、与关联于组织的多个请购单相关的请购单数据或与关联于组织的多个工程相关的工程数据。
如图7中进一步所示,过程700可以包括在接收到数据之后使用特征提取引擎来处理数据,以标识数据的特征(框720)。例如,如上文所描述,采购分析平台(例如使用计算资源334、处理器420等)可以在接收到数据之后使用特征提取引擎来处理数据,以标识数据的特征。
如图7中进一步所示,过程700可以包括在使用特征提取引擎来处理数据之后使用变换引擎来处理数据,以减小数据的大小(框730)。例如,如上文所描述,采购分析平台(例如使用计算资源334、处理器420等)可以在使用特征提取引擎来处理数据之后使用变换引擎来处理数据,以减小数据的大小。
如图7中进一步所示,过程700可以包括在使用变换引擎来处理数据之后使用机器学***台(例如使用计算资源334、处理器420等)可以在使用变换引擎来处理数据之后使用机器学习模型的集合来处理数据。
如图7中进一步所示,过程700可以包括在使用该机器学***台(例如使用计算资源334、处理器420等)可以在使用该机器学习模型的集合来处理数据之后生成与以下中的至少一者相关的推荐的集合:将与***数据相关联的多个***中的每一个、与请购单数据相关联的多个请购单中的每一个或与工程数据相关联的多个工程中的每一个分类为与组织的操作相关联的多种类别中的一种或多种;针对与请购单数据相关联的多个请购单中的每一个或与工程数据相关联的多个工程中的每一个标识可能的供应方的集合;或针对与工程数据相关联的多个工程中的每一个标识相似工程的集合。
如图7中进一步所示,过程700可以包括在生成该推荐的集合之后执行一个或多个动作(框760)。例如,如上文所描述,采购分析平台(例如使用计算资源334、处理器420、存储器430、存储组件440、输入组件450、输出组件460、通信接口470等)可以在生成该推荐的集合之后执行一个或多个动作。
过程700可以包括附加实现,诸如,下文所描述的任何单种实现或实现的任何组合和/或结合本文中的其他地方所描述的一个或多个其他过程。
在一些实现中,采购分析平台可以基于来自该机器学***台可以执行与多个***相关的分析,可以向***发送消息以针对与多个请购单相关联的一个或多个项目发出订单,或者可以向与多个工程中关联于工程的个体相关联的设备发送消息,其中,该消息包括标识该相似工程的集合的信息。
在一些实现中,采购分析平台可以基于在数据中标识的术语的集合来标识要分析的数据的子集;并且可以在标识数据的子集之后,通过将术语映射到预定术语的集合来将数据的子集标准化为该预定术语的集合。在一些实现中,采购分析平台可以在使用特征提取引擎来处理数据之后将数据分类为一种或多种分类,其中,该一种或多种分类与归纳数据相关联,并且可以与对数据进行分类相关联地使用哈希函数来处理数据,其中,哈希函数与压缩数据相关联。在一些实现中,采购分析平台可以在使用该机器学习模型的集合来处理数据之前从服务器设备接收该机器学习模型的集合。
尽管图7示出了过程700的示例框,但在一些实现中,与图7中所描绘的框相比,过程700可以包括附加框、更少的框、不同的框或以不同方式布置的框。附加地或备选地,过程700的框中的两个或更多个可以被并行执行。
根据一些实现,示例1:一种方法,包括:由设备接收数据,其中数据包括以下中的至少一者:与关联于组织的多个***相关的***数据,与关联于组织的多个请购单相关的请购单数据,或者与关联于组织的多个工程相关的工程数据;由设备在接收到数据之后使用预处理技术来处理数据,其中预处理技术包括以下中的至少一者:图像处理技术,或者文本处理技术;由设备在使用预处理技术来处理数据之后使用特征提取引擎来处理数据,以标识数据的特征;由设备在使用特征提取引擎来处理数据之后使用变换引擎来处理数据,以减小数据的大小;由设备在使用变换引擎来处理数据之后使用机器学习模型的集合来处理数据,其中机器学习模型的集合与以下中的至少一者相关:将与***数据相关联的多个***中的每个***、与请购单数据相关联的多个请购单中的每个请购单或与工程数据相关联的多个工程中的每个工程分类为与组织的操作相关联的多种类别中的一种或多种类别,针对与请购单数据相关联的多个请购单中的每个请购单或与工程数据相关联的多个工程中的每个工程标识可能的供应方的集合,或者针对与工程数据相关联的多个工程中的每个工程标识相似工程的集合;以及由设备在使用机器学习模型的集合来处理数据之后执行一个或多个动作。
根据一些实现,示例2:根据示例1的方法,还包括:基于来自机器学习模型的集合的输出,针对多个***中的每个***、多个请购单中的每个请购单或多个工程中的每个工程确定分数的集合,其中分数的集合指示以下中的至少一者:多个***中的每个***、多个请购单中的每个请购单或多个工程中的每个工程要被分类为的多种类别中的一种或多种类别,针对多个请购单中的每个请购单或多个工程中的每个工程的可能的供应方的集合,或者针对多个工程中的每个工程的相似工程的集合。
根据一些实现,示例3:根据示例2的方法,还包括:基于分数的集合,生成与以下中的至少一者相关的推荐的集合:对多个***进行分类,标识可能的供应方的集合,标识相似工程的集合,或者执行一个或多个动作。
根据一些实现,示例4:根据示例1的方法,其中机器学习模型的集合包括以下中的至少一者:梯度提升机器学习模型,或者广义线性模型。
根据一些实现,示例5:根据示例1的方法,其中执行一个或多个动作包括:生成包括信息的报告,信息标识以下中的至少一者:多种类别中的一种或多种类别,可能的供应方的集合,或者相似工程的集合;以及在生成报告之后经由客户端设备输出报告以供显示。
根据一些实现,示例6:根据示例1的方法,其中执行一个或多个动作包括:基于与可能的供应方的集合相关联的相应分数,选择可能的供应方的集合中的供应方,其中相应分数从机器学习模型的集合被输出;以及在选择供应方之后,向与供应方相关联的采购***发送针对一个或多个项目的电子订单。
根据一些实现,示例7:根据示例6的方法,其中执行一个或多个动作包括:向与递送一个或多个项目相关联的车辆发送标识针对一个或多个项目的递送位置的信息。
根据一些实现,示例8:一种设备,包括:一个或多个存储器;以及一个或多个处理器,一个或多个处理器被通信地耦合至一个或多个存储器,一个或多个处理器用以:接收数据,其中数据与关联于组织的多个***、多个请购单或多个工程相关;在接收到数据之后使用预处理技术来处理数据,其中预处理技术包括以下中的至少一者:图像处理技术,或者文本处理技术;在使用预处理技术来处理数据之后使用特征提取引擎来处理数据,以标识数据的特征;在使用特征提取引擎来处理数据之后使用变换引擎来处理数据,以减小数据的大小;在使用变换引擎来处理数据之后使用机器学习模型的集合来处理数据,其中机器学习模型的集合与以下中的至少一者相关:将多个***中的每个***、多个请购单中的每个请购单或多个工程中的每个工程分类为与组织的操作相关联的多种类别中的一种或多种类别,针对多个请购单中的每个请购单或多个工程中的每个工程标识可能的供应方的集合,或者针对多个工程中的每个工程标识相似工程的集合;基于来自机器学习模型的集合的输出,确定针对数据的分数,其中分数标识多种类别中的一种或多种类别、可能的供应方的集合或相似工程的集合;以及在确定分数之后执行一个或多个动作。
根据一些实现,示例9:根据示例8的设备,其中特征提取引擎使用以下中的至少一者来处理数据:标准化技术,令牌化技术,基于文本的数值特征建模技术,或者潜在特征建模技术。
根据一些实现,示例10:根据示例8的设备,其中变换引擎使用以下中的至少一者来处理数据:弱分类器技术,或者降维技术。
根据一些实现,示例11:根据示例8的设备,其中一个或多个处理器在使用特征提取引擎来处理数据时用以:基于数据中所包括的术语的集合来标识要分析的数据的子集。
根据一些实现,示例12:根据示例11的设备,其中一个或多个处理器在使用特征提取引擎来处理数据时用以:在标识数据的子集之后,通过将术语的集合映射至预定术语的集合来将数据的子集标准化为预定术语的集合。
根据一些实现,示例13:根据示例8的设备,其中一个或多个处理器在使用变换引擎来处理数据时用以:在使用特征提取引擎来处理数据之后将数据分类成一种或多种分类,其中一种或多种分类与归纳数据相关联。
根据一些实现,示例14:根据示例8的设备,其中一个或多个处理器在使用变换引擎来处理数据时用以:在使用特征提取引擎来处理数据之后,使用哈希函数来处理数据,其中哈希函数与压缩数据相关联。
根据一些实现,示例15:一种存储指令的非瞬态计算机可读介质,指令包括:一个或多个指令,一个或多个指令在由一个或多个处理器执行时使一个或多个处理器:接收数据,其中数据包括以下中的至少一者:与关联于组织的多个***相关的***数据,与关联于组织的多个请购单相关的请购单数据,或者与关联于组织的多个工程相关的工程数据;在接收到数据之后使用特征提取引擎来处理数据,以标识数据的特征;在使用特征提取引擎来处理数据之后使用变换引擎来处理数据,以减小数据的大小;在使用变换引擎来处理数据之后使用机器学习模型的集合来处理数据;在使用机器学习模型的集合来处理数据之后生成与以下中的至少一者相关的推荐的集合:将与***数据相关联的多个***中的每个***、与请购单数据相关联的多个请购单中的每个请购单或与工程数据相关联的多个工程中的每个工程分类为与组织的操作相关联的多种类别中的一种或多种类别,针对与请购单数据相关联的多个请购单中的每个请购单或与工程数据相关联的多个工程中的每个工程标识可能的供应方的集合,或者针对与工程数据相关联的多个工程中的每个工程标识相似工程的集合;以及在生成推荐的集合之后执行一个或多个动作。
根据一些实现,示例16:根据示例15的非瞬态计算机可读介质,其中一个或多个指令在由一个或多个处理器执行时还使一个或多个处理器:基于来自机器学习模型的集合的输出,针对多个***中的每个***、多个请购单中的每个请购单或多个工程中的每个工程确定分数的集合,其中分数的集合指示以下中的至少一者:多个***中的每个***要被分类为的多种类别中的一种或多种类别,针对请购单中的每个请购单或相似工程的集合中的每个相似工程的可能的供应方的集合,或者针对多个工程中的每个工程的相似工程的集合。
根据一些实现,示例17:根据示例15的非瞬态计算机可读介质,其中使一个或多个处理器执行一个或多个动作的一个或多个指令使一个或多个处理器:执行与多个***相关的分析,向***发送消息以发出针对与多个请购单相关联的一个或多个项目的订单,或者向与关联于多个工程中的一个工程的个体相关联的设备发送消息,其中消息包括标识相似工程的集合的信息。
根据一些实现,示例18:根据示例15的非瞬态计算机可读介质,其中使一个或多个处理器使用特征提取引擎来处理数据的一个或多个指令使一个或多个处理器:基于数据中所标识的术语的集合,标识要分析的数据的子集;以及在标识数据的子集之后,通过将术语映射至预定术语的集合来将数据的子集标准化为预定术语的集合。
根据一些实现,示例19:根据示例15的非瞬态计算机可读介质,其中使一个或多个处理器使用变换引擎来处理数据的一个或多个指令使一个或多个处理器:在使用特征提取引擎来处理数据之后将数据分类成一种或多种分类,其中一种或多种分类与归纳数据相关联;以及与对数据进行分类相关联地使用哈希函数来处理数据,其中哈希函数与压缩数据相关联。
根据一些实现,示例20:根据示例15的非瞬态计算机可读介质,其中一个或多个指令在由一个或多个处理器执行时还使一个或多个处理器:在使用机器学习模型的集合来处理数据之前,从服务器设备接收机器学习模型的集合。
前述公开内容提供了说明和描述,但并不旨在详尽地展现实现或将实现限制于所公开的精确形式。可以鉴于以上公开内容做出修改和改变,并且可以从实现的实践中获取这些修改和改变。
如本文所使用,术语“组件”旨在被广泛地解释为硬件、固件和/或硬件和软件的组合。
在本文中结合阈值描述了一些实现。如本文所使用的,取决于上下文,满足阈值可以指:值大于阈值、多于阈值、高于阈值、大于或等于阈值、小于阈值、少于阈值、低于阈值、少于或等于阈值、等于阈值等。
明显的是,本文中所描述的***和/或方法可以以不同形式的硬件、固件或硬件和软件的组合来实现。用于实现这些***和/或方法的实际专用控制硬件或软件代码不限制实现。因此,本文中在不参考具体软件代码的情况下描述了***和/或方法的操作和行为——应理解,可以基于本文中的描述将软件和硬件设计为实现***和/或方法。
即使在权利要求书中叙述了和/或在说明书中公开了特征的特定组合,但这些组合不旨在限制各种实现的公开内容。实际上,可以以权利要求书中未具体叙述和/或说明书中未公开的方式组合许多这些特征。尽管下面列出的每个从属权利要求可以仅直接从属于一项权利要求,但各种实现的公开内容包括每个从属权利要求结合权利要求集中的每个其他权利要求。
除非另有明确描述,否则本文中所使用的元件、动作或指令不应被解释为关键的或必需的。此外,如本文中所使用的,冠词“一”和“一个”旨在包括一个或多个项目并且可以与“一个或多个”互换地使用。此外,如本文中所使用的,术语“集合”旨在包括一个或多个项目(例如相关项目、不相关项目、相关项目与不相关项目的组合等),并且可以与“一个或多个”互换地使用。在仅旨在表示一个项目的情况下,使用短语“仅一个”或类似语言。此外,如本文中所使用的,术语“具有(has)”、“具有(have)”、“具有(having)”等旨在作为开放式术语。此外,除非另有明确陈述,否则短语“基于”旨在表示“至少部分地基于”。

Claims (17)

1.一种基于机器学习的分析方法,包括:
由设备接收数据,
其中所述数据包括以下中的至少一者:
与关联于组织的多个***相关的***数据,
与关联于所述组织的多个请购单相关的请购单数据,或
与关联于所述组织的多个工程相关的工程数据;
由所述设备在接收到所述数据之后使用预处理技术来处理所述数据,
其中所述预处理技术包括以下中的至少一者:
图像处理技术,或者
文本处理技术;
由所述设备在使用所述预处理技术来处理所述数据之后使用特征提取引擎来处理所述数据,以标识所述数据的特征;
由所述设备在使用所述特征提取引擎来处理所述数据之后使用变换引擎来处理所述数据,以减小所述数据的大小;
由所述设备在使用所述变换引擎来处理所述数据之后使用机器学习模型的集合来处理所述数据,
其中所述机器学习模型的集合与以下中的至少一者相关:
将与所述***数据相关联的所述多个***中的每个***、与所述请购单数据相关联的所述多个请购单中的每个请购单或与所述工程数据相关联的所述多个工程中的每个工程分类为与所述组织的操作相关联的多种类别中的一种或多种类别,针对与所述请购单数据相关联的所述多个请购单中的每个请购单或与所述工程数据相关联的所述多个工程中的每个工程标识可能的供应方的集合,或者
针对与所述工程数据相关联的所述多个工程中的每个工程标识相似工程的集合;以及
由所述设备在使用所述机器学习模型的集合来处理所述数据之后执行一个或多个动作,其中执行所述一个或多个动作包括:
基于与所述可能的供应方的集合相关联的相应分数,选择所述可能的供应方的集合中的供应方,
其中所述相应分数从所述机器学习模型的集合被输出,
在选择所述供应方之后,向与所述供应方相关联的采购***发送针对一个或多个项目的电子订单,以及
向与递送所述一个或多个项目相关联的车辆发送标识针对所述一个或多个项目的递送位置的信息。
2.根据权利要求1所述的方法,还包括:
基于来自所述机器学习模型的集合的输出,针对所述多个***中的每个***、所述多个请购单中的每个请购单或所述多个工程中的每个工程确定分数的集合,
其中所述分数的集合指示以下中的至少一者:
所述多个***中的每个***、所述多个请购单中的每个请购单或所述多个工程中的每个工程要被分类为的所述多种类别中的所述一种或多种类别,
针对所述多个请购单中的每个请购单或所述多个工程中的每个工程的所述可能的供应方的集合,或者
针对所述多个工程中的每个工程的所述相似工程的集合。
3.根据权利要求2所述的方法,还包括:
基于所述分数的集合,生成与以下中的至少一者相关的推荐的集合:
对所述多个***进行分类,
标识所述可能的供应方的集合,
标识所述相似工程的集合,或者
执行所述一个或多个动作。
4.根据权利要求1所述的方法,其中所述机器学习模型的集合包括以下中的至少一者:
梯度提升机器学习模型,或者
广义线性模型。
5.根据权利要求1所述的方法,其中执行所述一个或多个动作包括:
生成包括信息的报告,所述信息标识以下中的至少一者:
所述多种类别中的所述一种或多种类别,
所述可能的供应方的集合,或者
所述相似工程的集合;以及
在生成所述报告之后经由客户端设备输出所述报告以供显示。
6.一种基于机器学习的分析设备,包括:
一个或多个存储器;以及
一个或多个处理器,所述一个或多个处理器被通信地耦合至所述一个或多个存储器,所述一个或多个处理器用以:
接收数据,
其中所述数据与关联于组织的多个***、多个请购单或多个工程相关;
在接收到所述数据之后使用预处理技术来处理所述数据,
其中所述预处理技术包括以下中的至少一者:
图像处理技术,或者
文本处理技术;
在使用所述预处理技术来处理所述数据之后使用特征提取引擎来处理所述数据,以标识所述数据的特征;
在使用所述特征提取引擎来处理所述数据之后使用变换引擎来处理所述数据,以减小所述数据的大小;
在使用所述变换引擎来处理所述数据之后使用机器学习模型的集合来处理所述数据,
其中所述机器学习模型的集合与以下中的至少一者相关:
将所述多个***中的每个***、所述多个请购单中的每个请购单或所述多个工程中的每个工程分类为与所述组织的操作相关联的多种类别中的一种或多种类别,
针对所述多个请购单中的每个请购单或所述多个工程中的每个工程标识可能的供应方的集合,或者
针对所述多个工程中的每个工程标识相似工程的集合;
基于来自所述机器学习模型的集合的输出,确定针对所述数据的分数,
其中所述分数标识所述多种类别中的所述一种或多种类别、所述可能的供应方的集合或所述相似工程的集合;以及
在确定所述分数之后执行一个或多个动作,其中执行所述一个或多个动作包括:
基于所述分数来选择所述可能的供应方的集合中的供应方,其中所述分数与所述可能的供应方的集合相关联,
在选择所述供应方之后,向与所述供应方相关联的采购***发送针对一个或多个项目的电子订单,以及
向与递送所述一个或多个项目相关联的车辆发送标识针对所述一个或多个项目的递送位置的信息。
7.根据权利要求6所述的设备,其中所述特征提取引擎使用以下中的至少一者来处理所述数据:
标准化技术,
令牌化技术,
基于文本的数值特征建模技术,或者
潜在特征建模技术。
8.根据权利要求6所述的设备,其中所述变换引擎使用以下中的至少一者来处理所述数据:
弱分类器技术,或者
降维技术。
9.根据权利要求6所述的设备,其中所述一个或多个处理器在使用所述特征提取引擎来处理所述数据时用以:
基于所述数据中所包括的术语的集合来标识要分析的所述数据的子集。
10.根据权利要求9所述的设备,其中所述一个或多个处理器在使用所述特征提取引擎来处理所述数据时用以:
在标识所述数据的所述子集之后,通过将所述术语的集合映射至预定术语的集合来将所述数据的所述子集标准化为所述预定术语的集合。
11.根据权利要求6所述的设备,其中所述一个或多个处理器在使用所述变换引擎来处理所述数据时用以:
在使用所述特征提取引擎来处理所述数据之后将所述数据分类成一种或多种分类,
其中所述一种或多种分类与归纳所述数据相关联。
12.根据权利要求6所述的设备,其中所述一个或多个处理器在使用所述变换引擎来处理所述数据时用以:
在使用所述特征提取引擎来处理所述数据之后,使用哈希函数来处理所述数据,
其中所述哈希函数与压缩所述数据相关联。
13.一种存储指令的非瞬态计算机可读介质,所述指令包括:
一个或多个指令,所述一个或多个指令在由一个或多个处理器执行时使所述一个或多个处理器:
接收数据,
其中所述数据包括以下中的至少一者:
与关联于组织的多个***相关的***数据,
与关联于所述组织的多个请购单相关的请购单数据,或
与关联于所述组织的多个工程相关的工程数据;
在接收到所述数据之后使用特征提取引擎来处理所述数据,以标识所述数据的特征;
在使用所述特征提取引擎来处理所述数据之后使用变换引擎来处理所述数据,以减小所述数据的大小;
在使用所述变换引擎来处理所述数据之后使用机器学习模型的集合来处理所述数据;
在使用所述机器学习模型的集合来处理所述数据之后生成与以下中的至少一者相关的推荐的集合:
将与所述***数据相关联的所述多个***中的每个***、与所述请购单数据相关联的所述多个请购单中的每个请购单或与所述工程数据相关联的所述多个工程中的每个工程分类为与所述组织的操作相关联的多种类别中的一种或多种类别,
针对与所述请购单数据相关联的所述多个请购单中的每个请购单或与所述工程数据相关联的所述多个工程中的每个工程标识可能的供应方的集合,或者
针对与所述工程数据相关联的所述多个工程中的每个工程标识相似工程的集合;以及
在生成所述推荐的集合之后执行一个或多个动作,
其中使所述一个或多个处理器执行所述一个或多个动作的所述一个或多个指令使所述一个或多个处理器:
执行与所述多个***相关的分析,
向***发送消息以发出针对与所述多个请购单相关联的一个或多个项目的订单,或者
向与个体相关联的设备发送消息,所述个体与所述多个工程中的一个工程相关联,其中所述消息包括标识所述相似工程的集合的信息。
14.根据权利要求13所述的非瞬态计算机可读介质,其中所述一个或多个指令在由所述一个或多个处理器执行时还使所述一个或多个处理器:
基于来自所述机器学习模型的集合的输出,针对所述多个***中的每个***、所述多个请购单中的每个请购单或所述多个工程中的每个工程确定分数的集合,
其中所述分数的集合指示以下中的至少一者:
所述多个***中的每个***要被分类为的所述多种类别中的所述一种或多种类别,
针对所述请购单中的每个请购单或所述相似工程的集合中的每个相似工程的所述可能的供应方的集合,或者
针对所述多个工程中的每个工程的所述相似工程的集合。
15.根据权利要求13所述的非瞬态计算机可读介质,其中使所述一个或多个处理器使用所述特征提取引擎来处理所述数据的所述一个或多个指令使所述一个或多个处理器:
基于所述数据中所标识的术语的集合,标识要分析的所述数据的子集;以及
在标识所述数据的所述子集之后,通过将所述术语映射至预定术语的集合来将所述数据的所述子集标准化为所述预定术语的集合。
16.根据权利要求13所述的非瞬态计算机可读介质,其中使所述一个或多个处理器使用所述变换引擎来处理所述数据的所述一个或多个指令使所述一个或多个处理器:
在使用所述特征提取引擎来处理所述数据之后将所述数据分类成一种或多种分类,
其中所述一种或多种分类与归纳所述数据相关联;以及
与对所述数据进行分类相关联地使用哈希函数来处理所述数据,
其中所述哈希函数与压缩所述数据相关联。
17.根据权利要求13所述的非瞬态计算机可读介质,其中所述一个或多个指令在由所述一个或多个处理器执行时还使所述一个或多个处理器:
在使用所述机器学习模型的集合来处理所述数据之前,从服务器设备接收所述机器学习模型的集合。
CN202010091280.7A 2019-03-01 2020-02-13 基于机器学***台 Active CN111639516B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/290,396 US20200279219A1 (en) 2019-03-01 2019-03-01 Machine learning-based analysis platform
US16/290,396 2019-03-01

Publications (2)

Publication Number Publication Date
CN111639516A CN111639516A (zh) 2020-09-08
CN111639516B true CN111639516B (zh) 2023-09-15

Family

ID=72236751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010091280.7A Active CN111639516B (zh) 2019-03-01 2020-02-13 基于机器学***台

Country Status (2)

Country Link
US (1) US20200279219A1 (zh)
CN (1) CN111639516B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200279180A1 (en) * 2019-05-17 2020-09-03 Mengjie Yu Artificial intelligence customer support case management system
US11605137B2 (en) * 2019-09-11 2023-03-14 Oracle International Corporation Expense report submission interface
US11461648B2 (en) * 2020-03-04 2022-10-04 International Business Machines Corporation Standardizing disparate data points
US11423468B2 (en) * 2020-07-30 2022-08-23 Sap Se Intelligent cosourcing in an e-procurement system
CN112488751B (zh) * 2020-11-28 2023-05-26 广东电网有限责任公司 基于偏离度的预算偏离预警方法、装置、终端、存储介质
US11550813B2 (en) * 2021-02-24 2023-01-10 International Business Machines Corporation Standardization in the context of data integration
CN113643116B (zh) * 2021-08-23 2023-10-27 中远海运科技(北京)有限公司 基于财务凭证数据的公司分类方法、计算机可读介质
US20230325900A1 (en) * 2022-04-06 2023-10-12 Capital One Services, Llc Modified ordering recommendations

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002007008A1 (en) * 2000-04-28 2002-01-24 Ubink Cornelis Hubertus Johann Network procurement system
US8959155B1 (en) * 2009-07-17 2015-02-17 Aryaka Networks, Inc. Data compression through redundancy removal in an application acceleration environment
WO2017060850A1 (en) * 2015-10-07 2017-04-13 Way2Vat Ltd. System and methods of an expense management system based upon business document analysis
CN107292823A (zh) * 2017-08-20 2017-10-24 平安科技(深圳)有限公司 电子装置、***分类的方法及计算机可读存储介质
CN109286653A (zh) * 2017-07-21 2019-01-29 埃森哲环球解决方案有限公司 智能云工程平台

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100169234A1 (en) * 2009-01-01 2010-07-01 Wizbill Ltd Method for Capturing the Essence of Product and Service Offers of Service Providers
US8879846B2 (en) * 2009-02-10 2014-11-04 Kofax, Inc. Systems, methods and computer program products for processing financial documents
US20120316981A1 (en) * 2011-06-08 2012-12-13 Accenture Global Services Limited High-risk procurement analytics and scoring system
US11328255B2 (en) * 2015-06-30 2022-05-10 Coupa Software Incorporated Automated computer-based prediction of rejections of requisitions
US20170293695A1 (en) * 2016-04-12 2017-10-12 Ebay Inc. Optimizing similar item recommendations in a semi-structured environment
US20180130019A1 (en) * 2016-06-21 2018-05-10 0934781 B.C. Ltd System and method for Managing user and project nodes in a graph database
US10296880B2 (en) * 2016-11-21 2019-05-21 Lisa Therese Miller Invoice analytics system
US10380520B2 (en) * 2017-03-13 2019-08-13 Accenture Global Solutions Limited Automated ticket resolution
US10846640B2 (en) * 2017-06-01 2020-11-24 Autodesk, Inc. Architecture, engineering and construction (AEC) risk analysis system and method
US11734328B2 (en) * 2018-08-31 2023-08-22 Accenture Global Solutions Limited Artificial intelligence based corpus enrichment for knowledge population and query response

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002007008A1 (en) * 2000-04-28 2002-01-24 Ubink Cornelis Hubertus Johann Network procurement system
US8959155B1 (en) * 2009-07-17 2015-02-17 Aryaka Networks, Inc. Data compression through redundancy removal in an application acceleration environment
WO2017060850A1 (en) * 2015-10-07 2017-04-13 Way2Vat Ltd. System and methods of an expense management system based upon business document analysis
CN109286653A (zh) * 2017-07-21 2019-01-29 埃森哲环球解决方案有限公司 智能云工程平台
CN107292823A (zh) * 2017-08-20 2017-10-24 平安科技(深圳)有限公司 电子装置、***分类的方法及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Shin H K.Machine Learning Based Automatic Categorization Model for Text Lines in Invoice Documents.《Journal of Korea Multimedia Society》.2010,第13卷(第12期),第1786-1797页. *

Also Published As

Publication number Publication date
US20200279219A1 (en) 2020-09-03
CN111639516A (zh) 2020-09-08

Similar Documents

Publication Publication Date Title
CN111639516B (zh) 基于机器学***台
AU2019261735B2 (en) System and method for recommending automation solutions for technology infrastructure issues
US11928567B2 (en) System and method for improving machine learning models by detecting and removing inaccurate training data
US11640563B2 (en) Automated data processing and machine learning model generation
US11087245B2 (en) Predictive issue detection
US11087088B2 (en) Automated and optimal encoding of text data features for machine learning models
US11562315B2 (en) Detecting an issue related to a report
CN111553759A (zh) 一种产品信息推送方法、装置、设备及存储介质
US20200110842A1 (en) Techniques to process search queries and perform contextual searches
CN110866799B (zh) 使用人工智能监视在线零售平台的***和方法
CN110059137A (zh) 事务分类***
CN116883181B (zh) 基于用户画像的金融服务推送方法、存储介质及服务器
WO2022039803A1 (en) Identifying noise in verbal feedback using artificial text from non-textual parameters and transfer learning
US11921821B2 (en) System and method for labelling data for trigger identification
US20220292393A1 (en) Utilizing machine learning models to generate initiative plans
CN112988699B (zh) 模型训练方法、数据标签的生成方法及装置
CN113312552A (zh) 数据处理方法、装置、电子设备和介质
CN112329427B (zh) 短信样本的获取方法和装置
US11928128B2 (en) Construction of a meta-database from autonomously scanned disparate and heterogeneous sources
US20230368013A1 (en) Accelerated model training from disparate and heterogeneous sources using a meta-database
US11822564B1 (en) Graphical user interface enabling interactive visualizations using a meta-database constructed from autonomously scanned disparate and heterogeneous sources
US11727464B2 (en) Utilizing machine learning models to determine and recommend new releases from cloud providers to customers
US20240160847A1 (en) Systems and methods for semantic separation of multiple intentions in text data using reinforcement learning
CN117556822A (zh) 基于文本的智能研判方法及装置、设备、存储介质
Rofik et al. Improvement accuracy of gradient boosting in app rating prediction on *** playstore

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant