CN110334131A - 用于机器学习模型的特征抽取的方法和装置 - Google Patents

用于机器学习模型的特征抽取的方法和装置 Download PDF

Info

Publication number
CN110334131A
CN110334131A CN201910617284.1A CN201910617284A CN110334131A CN 110334131 A CN110334131 A CN 110334131A CN 201910617284 A CN201910617284 A CN 201910617284A CN 110334131 A CN110334131 A CN 110334131A
Authority
CN
China
Prior art keywords
module
data
public characteristic
calling interface
characteristic abstraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910617284.1A
Other languages
English (en)
Inventor
张�浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xi'an Notice Network Technology Co Ltd
Original Assignee
Xi'an Notice Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xi'an Notice Network Technology Co Ltd filed Critical Xi'an Notice Network Technology Co Ltd
Priority to CN201910617284.1A priority Critical patent/CN110334131A/zh
Publication of CN110334131A publication Critical patent/CN110334131A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Stored Programmes (AREA)

Abstract

本公开涉及一种用于机器学习模型的特征抽取的方法,包括:提供公共特征抽取模块,公共特征抽取模块具有第一调用接口和第二调用接口;线上模块经由第一调用接口调用公共特征抽取模块,对第一输入数据进行特征抽取以获取第一特征数据;以及线下模块经由第二调用接口调用公共特征抽取模块,对第二输入数据进行特征抽取以获取第二特征数据,其中,第一特征数据和第二特征数据用于输入到机器学习模型。本公开的方法至少具有以下有益技术效果之一:线上模块和线下模块采用同一个公共特征抽取模块进行特征抽取,保证了特征抽取结果的一致性,同时避免重复劳动,节省人力。

Description

用于机器学习模型的特征抽取的方法和装置
技术领域
本公开涉及计算机领域,具体地,涉及一种用于机器学习模型的特征抽取的方法、装置、存储介质和电子设备。
背景技术
在广告投放领域,往往需要对用户的点击率进行预估。传统的点击率预估方法在线下对历史广告投放日志进行数据挖掘和模型训练,学习得到机器学习预估模型,并利用机器学习预估模型在线上对用户的点击率进行预估。上述线下和线上的过程均需要对用户数据进行特征抽取,然而,线下和线上采用不同的程序语言实现特征抽取,容易导致特征抽取结果不一致的情况,从给机器学习预估模型带来不利影响。
发明内容
在下文中将给出关于本公开的简要概述,以便提供关于本公开的某些方面的基本理解。应当理解,此概述并不是关于本公开的穷举性概述。它并不是意图确定本公开的关键或重要部分,也不是意图限定本公开的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
根据本公开的第一方面,提供了一种用于机器学习模型的特征抽取的方法,包括:
提供公共特征抽取模块,公共特征抽取模块具有第一调用接口和第二调用接口;
线上模块经由第一调用接口调用公共特征抽取模块,对第一输入数据进行特征抽取以获取第一特征数据;以及
线下模块经由第二调用接口调用公共特征抽取模块,对第二输入数据进行特征抽取以获取第二特征数据,
其中,第一特征数据和第二特征数据用于输入到机器学习模型。
在一个实施例中,公共特征抽取模块和线上模块是第一程序语言实现的,第一调用接口是编译链接接口;
线下模块是第二程序语言实现的,第二调用接口是跨语言接口。
在一个实施例中,方法还包括:
提供数据结构一致化模块,数据结构一致化模块用于对第一输入数据和第二输入数据进行数据结构一致化处理。
在一个实施例中,公共特征抽取模块具有可配置参数,可配置参数的组合映射到待抽取的特征。
在一个实施例中,线下模块用于向机器学习模型提供用于训练的第二特征数据,线上模块用于向训练后的机器学习模型提供第一特征数据。
根据本公开的第二方面,提供了一种用于机器学习模型的特征抽取的装置,包括:
公共特征抽取模块,公共特征抽取模块具有第一调用接口和第二调用接口;
线上模块,被配置用于经由第一调用接口调用公共特征抽取模块,对第一输入数据进行特征抽取以获取第一特征数据;以及
线下模块,被配置用于经由第二调用接口调用公共特征抽取模块,对第二输入数据进行特征抽取以获取第二特征数据;
其中,第一特征数据和第二特征数据用于输入到机器学习模型。
在一个实施例中,装置还包括:
数据结构一致化模块,被配置用于对第一输入数据和第二输入数据进行数据结构一致化处理。
根据本公开的第三方面,提供一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器执行如第一方面的方法。
根据本公开的第四方面,提供一种计算机可读介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行如第一方面的方法。
本公开的技术方案至少具有以下技术效果之一:线上模块和线下模块采用同一个公共特征抽取模块进行特征抽取,保证了特征抽取结果的一致性,同时避免重复劳动,节省人力。
附图说明
本公开可以通过参考下文中结合附图所给出的描述而得到更好的理解,附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分。在附图中:
图1是根据本公开实施例的特征抽取***的示意图;
图2是线上点击率预估方法的流程示意图;
图3是训练点击率预估模型的方法的流程示意图;
图4是实现本公开实施例的电子设备的结构示意图。
具体实施方式
在下文中将结合附图对本公开的示例性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施例的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中可以做出很多特定于实施例的决定,以便实现开发人员的具体目标,并且这些决定可能会随着实施例的不同而有所改变。
在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本公开,在附图中仅仅示出了与根据本公开的方案密切相关的装置结构,而省略了与本公开关系不大的其他细节。
应理解的是,本公开并不会由于如下参照附图的描述而只限于所描述的实施形式。在本文中,在可行的情况下,实施例可以相互组合、不同实施例之间的特征替换或借用、在一个实施例中省略一个或多个特征。
本公开的实施例提供了一种用于机器学习模型的特征抽取方法,包括:提供公共特征抽取模块,公共特征抽取模块具有第一调用接口和第二调用接口;线上模块经由第一调用接口调用公共特征抽取模块,对第一输入数据进行特征抽取以获取第一特征数据;以及线下模块经由第二调用接口调用公共特征抽取模块,对第二输入数据进行特征抽取以获取第二特征数据,其中,第一特征数据和第二特征数据用于输入到机器学习模型。
根据本公开的实施例,线上模块和线下模块采用同一个公共特征抽取模块进行特征抽取,保证了特征抽取结果的一致性,同时避免重复劳动,节省人力。
以下结合附图来详细描述本公开的实施例及其优点。
图1示出了根据本公开实施例的特征抽取***100的示意图。特征抽取***100包括线上模块110、线下模块120、公共特征抽取模块130和数据结构一致化模块140。以下对各个模块的功能进行详细描述。
公共特征抽取模块130具有第一调用接口131和第二调用接口132,线上模块110经由第一调用接口131调用公共特征抽取模块130,对第一输入数据进行特征抽取以获取第一特征数据,线下模块120经由第二调用接口132调用公共特征抽取模块130,对第二输入数据进行特征抽取以获取第二特征数据,第一特征数据和第二特征数据用于输入到机器学***台,第二程序语言例如可以采用Java、Scala或Python语言,第二调用接口132可以为JNI接口,也可以为其他任何能够跨语言调用的接口,此处不作具体限定。
图2示出了线上点击率预估方法200的流程示意图。方法200开始于步骤210,获取点击率预估模型。
然后,在步骤220,获取第一输入数据。这里,第一输入数据可以包括广告文件中的广告属性信息和服务器请求中的用户属性信息。
然后,在步骤230,对第一输入数据进行特征抽取,得到第一特征数据。该步骤可以由公共特征抽取模块130执行。
然后,在步骤240,将第一特征数据输入到点击率预估模型中,得到预估结果。这里,根据点击率预估模型中存储的第一特征数据与分值的对应关系,输出用户的点击率预估结果,并对预估结果进行日志记录。
图3示出了训练点击率预估模型的方法300的流程示意图。方法300开始于步骤310,获取第二输入数据。这里,第二输入数据可以为广告投放日志数据,广告投放日志数据中可以包括广告ID、用户ID等。
然后,在步骤320,对第二输入数据进行特征抽取,得到第二特征数据。该步骤可以由公共特征抽取模块130执行。
然后,在步骤330,基于第二特征数据训练得到点击率预估模型。
然后,在步骤340,对点击率预估模型进行离线评估,得到评估结果;这里,离线评估可采用计算模型评估指标的方式,例如可以为计算模型评估指标AUC(area under thecurve)的值。
然后,在步骤350,根据评估结果判断点击率预估模型是否正常,则正常,则输出点击率预估模型,否则,返回步骤320。
考虑到线上模块110和线下模块120采用不同的程序语言实现的,且均需要调用公共特征抽取模块130,为了提高程序运行的安全性、可移植性和保密性,可以对公共特征抽取模块130进行封装,形成封装文件,该封装文件可以为SO文件,SO文件可以是动态链接库。
数据结构一致化模块140用于对第一输入数据和第二输入数据进行数据结构一致化处理。考虑到第一输入数据和第二输入数据的获取来源不同,二者数据结构存在不一致的情况,在这里,可以对第一输入数据和第二输入数据均采用protobuf(序列化数据数据结构协议)进行数据填充,实现第一输入数据和第二输入数据的数据结构相同。在其他实施例中,数据结构一致化处理还可以采用Apache Thrift、Hadoop PRC等,此处不作具体限定。
本公开的实施例提供了一种用于机器学习模型的特征抽取方法,包括:提供公共特征抽取模块,公共特征抽取模块具有第一调用接口和第二调用接口;线上模块经由第一调用接口调用公共特征抽取模块,对第一输入数据进行特征抽取以获取第一特征数据;以及线下模块经由第二调用接口调用公共特征抽取模块,对第二输入数据进行特征抽取以获取第二特征数据,其中,第一特征数据和第二特征数据用于输入到机器学习模型,线下模块用于向机器学习模型提供用于训练的第二特征数据,线上模块用于向训练后的机器学习模型提供第一特征数据。
本实施例中,公共特征抽取模块和线上模块是第一程序语言实现的,第一调用接口是编译链接接口,考虑到线上处理需要提供高性能服务,短时间内完成模块计算,第一程序语言可以采用C、C++或Go语言;线下模块是第二程序语言实现的,第二调用接口是跨语言接口,考虑到线下处理需要处理海量日志数据,处理数据可以借助Hadoop分布式平台,第二程序语言例如可以采用Java、Scala或Python语言,第二调用接口可以为JNI接口,也可以为任何其他能够跨语言调用的接口,此处不作具体限定。第一输入数据可以包括广告文件中的广告属性信息和服务器请求中的用户属性信息。第二输入数据可以为广告投放日志数据,广告投放日志数据中可以包括广告ID、用户ID等。
根据本公开的实施例,线上模块和线下模块采用同一个公共特征抽取模块进行特征抽取,保证了特征抽取结果的一致性,同时避免重复劳动,节省人力。
根据本公开的另一实施例,用于机器学习模型的特征抽取方法,还包括:
提供数据结构一致化模块,数据结构一致化模块用于对第一输入数据和第二输入数据进行数据结构一致化处理。这里,考虑到第一输入数据和第二输入数据的获取来源不同,二者数据结构存在不一致的情况,在这里,可以对第一输入数据和第二输入数据均采用protobuf(序列化数据数据结构协议)进行数据填充,在其他实施例中,数据结构一致化处理还可以采用Apache Thrift、Hadoop PRC等,此处不作具体限定。
为了提高公共特征抽取模块对特征抽取逻辑的可配置度,公共特征抽取模块可以具有可配置参数,可配置参数的组合映射到待抽取的特征。也就是说,实现公共特征抽取模块的代码中包括特征与代号的映射关系。例如,单个特征可以采用字母表示,组合特征可以采用多个字母进行组合表示,从而保证特征抽取的逻辑可配置度较高。举例来说,单个特征可以为广告ID、也可以为用户ID,广告ID用Ai表示,用户ID用Ui表示,组合特征可以为用户ID和广告ID的组合,可以用AiUi表示。上述映射关系的建立避免了特征抽取过程中根据抽取特征的不同,需要多次修改代码带来的麻烦。
本公开第二方面还提供一种用于机器学习模型的特征抽取的装置,包括:公共特征抽取模块、线上模块以及线下模块。公共特征抽取模块具有第一调用接口和第二调用接口。线上模块被配置用于经由第一调用接口调用公共特征抽取模块,对第一输入数据进行特征抽取以获取第一特征数据。线下模块被配置用于经由第二调用接口调用公共特征抽取模块,对第二输入数据进行特征抽取以获取第二特征数据;其中,第一特征数据和第二特征数据用于输入到机器学习模型。
本实施例中,公共特征抽取模块和线上模块是第一程序语言实现的,第一调用接口是编译链接接口,考虑到线上处理需要提供高性能服务,短时间内完成模块计算,第一程序语言可以采用C、C++或Go语言;线下模块是第二程序语言实现的,第二调用接口是跨语言接口,考虑到线下处理需要处理海量日志数据,处理数据可以借助Hadoop分布式平台,第二程序语言例如可以采用Java、Scala或Python语言,第二调用接口可以为JNI接口,也可以为任何其他能够跨语言调用的接口,此处不作具体限定。第一输入数据可以包括广告文件中的广告属性信息和服务器请求中的用户属性信息。第二输入数据可以为广告投放日志数据,广告投放日志数据中可以包括广告ID、用户ID等。
根据本公开的实施例,线上模块和线下模块采用同一个公共特征抽取模块进行特征抽取,保证了特征抽取结果的一致性,同时避免重复劳动,节省人力。
根据本公开的另一实施例,用于机器学习模型的特征抽取装置,还包括:
数据结构一致化模块,数据结构一致化模块被配置用于对第一输入数据和第二输入数据进行数据结构一致化处理。这里,考虑到第一输入数据和第二输入数据的获取来源不同,二者数据结构存在不一致的情况,在这里,可以对第一输入数据和第二输入数据均采用protobuf(序列化数据数据结构协议)进行数据填充,在其他实施例中,数据结构一致化处理还可以采用Apache Thrift、Hadoop PRC等,此处不作具体限定。
图4示出了根据本公开实施例的电子设备400的结构示意图。如图4所示,电子设备400包括中央处理单元(CPU)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储部分408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有电子设备操作所需的各种程序和数据。CPU401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
以下部件连接至I/O接口405:包括键盘、鼠标等的输入部分406;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分407;包括硬盘等的存储部分408;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至I/O接口405。可拆卸介质411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器410上,以便于从其上读出的计算机程序根据需要被安装入存储部分408。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,包括承载指令的在计算机可读介质,在这样的实施例中,该指令可以通过通信部分409从网络上被下载和安装,和/或从可拆卸介质411被安装。在该指令被中央处理单元(CPU)401执行时,执行本发明中描述的各个方法步骤。
综上所述,本发明从代码一致性、配置参数一致性和数据格式一致性的方面保证了线上模块和线下模块的特征提取的一致性和通用型,能够真正做到线上线下特征抽取逻辑完全一致。以下的表1列出了本发明和现有技术的比对。
表1
尽管已经描述了示例实施例,但是对于本领域技术人员来说显而易见的是,在不脱离本发明构思的精神和范围的情况下,可以进行各种改变和修改。因此,应当理解,上述示例实施例不是限制性的,而是说明性的。

Claims (10)

1.一种用于机器学习模型的特征抽取的方法,包括:
提供公共特征抽取模块,所述公共特征抽取模块具有第一调用接口和第二调用接口;
线上模块经由所述第一调用接口调用所述公共特征抽取模块,对第一输入数据进行特征抽取以获取第一特征数据;以及
线下模块经由所述第二调用接口调用所述公共特征抽取模块,对第二输入数据进行特征抽取以获取第二特征数据,
其中,所述第一特征数据和所述第二特征数据用于输入到机器学习模型。
2.根据权利要求1所述的方法,其中,
所述公共特征抽取模块和所述线上模块是第一程序语言实现的,所述第一调用接口是编译链接接口;
所述线下模块是第二程序语言实现的,所述第二调用接口是跨语言接口。
3.根据权利要求1所述的方法,还包括:
提供数据结构一致化模块,所述数据结构一致化模块用于对所述第一输入数据和所述第二输入数据进行数据结构一致化处理。
4.根据权利要求1所述的方法,其中,所述公共特征抽取模块具有可配置参数,所述可配置参数的组合映射到待抽取的特征。
5.一种用于机器学习模型的特征抽取的装置,包括:
公共特征抽取模块,所述公共特征抽取模块具有第一调用接口和第二调用接口;
线上模块,被配置用于经由所述第一调用接口调用所述公共特征抽取模块,对第一输入数据进行特征抽取以获取第一特征数据;以及
线下模块,被配置用于经由所述第二调用接口调用所述公共特征抽取模块,对第二输入数据进行特征抽取以获取第二特征数据;
其中,所述第一特征数据和所述第二特征数据用于输入到机器学习模型。
6.根据权利要求5所述的装置,其中,所述公共特征抽取模块和所述线上模块是第一程序语言实现的,所述第一调用接口是编译链接接口;
所述线下模块是第二程序语言实现的,所述第二调用接口是跨语言接口。
7.根据权利要求5所述的装置,还包括:
数据结构一致化模块,被配置用于对所述第一输入数据和所述第二输入数据进行数据结构一致化处理。
8.根据权利要求5所述的装置,其中,所述公共特征抽取模块具有可配置参数,所述可配置参数的组合映射到待抽取的特征。
9.一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1至4中任一项所述的方法。
10.一种计算机可读介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行如权利要求1至4中任一所述的方法。
CN201910617284.1A 2019-07-09 2019-07-09 用于机器学习模型的特征抽取的方法和装置 Pending CN110334131A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910617284.1A CN110334131A (zh) 2019-07-09 2019-07-09 用于机器学习模型的特征抽取的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910617284.1A CN110334131A (zh) 2019-07-09 2019-07-09 用于机器学习模型的特征抽取的方法和装置

Publications (1)

Publication Number Publication Date
CN110334131A true CN110334131A (zh) 2019-10-15

Family

ID=68144923

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910617284.1A Pending CN110334131A (zh) 2019-07-09 2019-07-09 用于机器学习模型的特征抽取的方法和装置

Country Status (1)

Country Link
CN (1) CN110334131A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110313953A1 (en) * 2010-06-18 2011-12-22 Microsoft Corporation Automated Classification Pipeline Tuning Under Mobile Device Resource Constraints
CN104102639A (zh) * 2013-04-02 2014-10-15 腾讯科技(深圳)有限公司 基于文本分类的推广触发方法和装置
CN105677353A (zh) * 2016-01-08 2016-06-15 北京物思创想科技有限公司 特征抽取方法、机器学习方法及其装置
US20160203221A1 (en) * 2014-09-12 2016-07-14 Lithium Technologies, Inc. System and apparatus for an application agnostic user search engine
CN108108821A (zh) * 2017-12-29 2018-06-01 广东欧珀移动通信有限公司 模型训练方法及装置
CN108287913A (zh) * 2018-02-07 2018-07-17 霍尔果斯智融未来信息科技有限公司 一种数据可回溯的大规模离散型特征挖掘的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110313953A1 (en) * 2010-06-18 2011-12-22 Microsoft Corporation Automated Classification Pipeline Tuning Under Mobile Device Resource Constraints
CN104102639A (zh) * 2013-04-02 2014-10-15 腾讯科技(深圳)有限公司 基于文本分类的推广触发方法和装置
US20160203221A1 (en) * 2014-09-12 2016-07-14 Lithium Technologies, Inc. System and apparatus for an application agnostic user search engine
CN105677353A (zh) * 2016-01-08 2016-06-15 北京物思创想科技有限公司 特征抽取方法、机器学习方法及其装置
CN108108821A (zh) * 2017-12-29 2018-06-01 广东欧珀移动通信有限公司 模型训练方法及装置
CN108287913A (zh) * 2018-02-07 2018-07-17 霍尔果斯智融未来信息科技有限公司 一种数据可回溯的大规模离散型特征挖掘的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
董书超: "基于逻辑回归模型的广告点击率预估***的设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Similar Documents

Publication Publication Date Title
CN110058922B (zh) 一种提取机器学习任务的元数据的方法、装置
US7367011B2 (en) Method, system and program product for developing a data model in a data mining system
CA2925015C (en) System and method for testing data representation for different mobile devices
CN110245089A (zh) 压力测试方法、装置、设备及计算机可读存储介质
US11256484B2 (en) Utilizing natural language understanding and machine learning to generate an application
US9652209B2 (en) Static analysis and reconstruction of deep link handling in compiled applications
JP2009009584A (ja) コンピュータ・ネットワーク上におけるコンピュータ・プログラムの記憶と転送を制御する方法とシステム
CN108984399A (zh) 检测界面差异的方法、电子设备和计算机可读介质
CN110443222A (zh) 用于训练脸部关键点检测模型的方法和装置
CN108255706A (zh) 自动化测试脚本的编辑方法、装置、终端设备及存储介质
CN113826070A (zh) 工作流引擎工具
CN106855926A (zh) 安卓***下的恶意代码检测方法、***及一种移动终端
CN111797020A (zh) 基于动态字节码的mock数据方法及装置
CN109975688A (zh) 用于异构芯片的通用评测方法和装置
CN109376079A (zh) 接口调用的测试方法及服务器
CN109739526A (zh) 代码更新方法和装置
CN109492749B (zh) 在局域网中实现神经网络模型线上服务的方法及装置
WO2022198835A1 (zh) 电子地图的测试方法、装置、电子设备及存储介质
CN107423091A (zh) 用于车载设备的usb驱动程序加载方法及其装置
CN110334131A (zh) 用于机器学习模型的特征抽取的方法和装置
US20210272023A1 (en) Information processing system and information processing method
CN114218261A (zh) 数据查询方法、装置、存储介质以及电子设备
CN114546434A (zh) 一种应用更新方法、装置、电子设备及存储介质
Flora-Holmquist et al. The virtual finite-state machine design and implementation paradigm
CN111651191A (zh) 应用于微服务构架的单应用打包方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191015