CN104850592B - 生成模型文件的方法和装置 - Google Patents

生成模型文件的方法和装置 Download PDF

Info

Publication number
CN104850592B
CN104850592B CN201510204727.6A CN201510204727A CN104850592B CN 104850592 B CN104850592 B CN 104850592B CN 201510204727 A CN201510204727 A CN 201510204727A CN 104850592 B CN104850592 B CN 104850592B
Authority
CN
China
Prior art keywords
model file
data
bias term
weight vectors
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510204727.6A
Other languages
English (en)
Other versions
CN104850592A (zh
Inventor
龙飞
陈志军
张涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to CN201510204727.6A priority Critical patent/CN104850592B/zh
Publication of CN104850592A publication Critical patent/CN104850592A/zh
Application granted granted Critical
Publication of CN104850592B publication Critical patent/CN104850592B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开是关于一种生成模型文件的方法和装置,属于数据分类领域。所述方法包括:获取支持向量机SVM模型的第一模型文件,所述第一模型文件中包括超平面的指示信息,所述指示信息包括多个支持向量、系数向量和偏置项;将所述多个支持向量组成支持矩阵;计算所述支持矩阵与所述系数向量的乘积,得到权重向量;根据所述权重向量和所述偏置项,生成第二模型文件,所述第二模型文件用于对数据进行分类。本公开生成的第二模型文件能够用于对数据进行分类,且第二模型文件中无需存储系数向量以及大量的支持向量,大大减小了模型文件的数据量。

Description

生成模型文件的方法和装置
技术领域
本公开是关于数据分类领域,具体来说是关于生成模型文件的方法和装置。
背景技术
SVM(Support Vector Machine,支持向量机)是一种常用的分类模型,可以广泛应用于图像识别等多种领域。
若要应用SVM模型对数据进行分类,先要获取多个样本数据,对多个样本数据进行训练,得到一个超平面,再应用该超平面,对未知类别的数据进行分类,如果该数据位于超平面的第一侧,则确定该数据属于第一类,如果该数据位于超平面的第二侧,则确定该数据属于第二类。
在实际应用过程中,训练完成时可以根据训练结果生成一个模型文件,该模型文件中包括训练出的多个支持向量、系数向量和偏置项,该多个支持向量、系数向量和偏置项用于表示SVM模型的超平面。当要对数据进行分类时,可以获取该模型文件中存储的多个支持向量、系数向量和偏置项,根据该多个支持向量、系数向量和偏置项以及该数据的特征向量进行计算,得到该数据的分类结果。
发明内容
为了解决相关技术中存在的问题,本公开提供了一种生成模型文件的方法和装置。所述技术方案如下:
根据本公开实施例的第一方面,提供了一种生成模型文件的方法,所述方法包括:
获取支持向量机SVM模型的第一模型文件,所述第一模型文件中包括超平面的指示信息,所述指示信息包括多个支持向量、系数向量和偏置项;
将所述多个支持向量组成支持矩阵;
计算所述支持矩阵与所述系数向量的乘积,得到权重向量;
根据所述权重向量和所述偏置项,生成第二模型文件,所述第二模型文件用于对数据进行分类。
在另一实施例中,所述根据所述权重向量和所述偏置项,生成第二模型文件之后,所述方法还包括:
获取所述第二模型文件中包含的权重向量和偏置项;
获取待分类数据的特征向量;
根据所述权重向量、所述偏置项和所述特征向量,计算所述数据的分类值,所述分类值用于表示所述数据的分类结果。
在另一实施例中,所述根据所述权重向量、所述偏置项和所述特征向量,计算所述数据的分类值,包括:
根据所述权重向量、所述偏置项和所述特征向量,应用以下公式,计算所述数据的分类值:
L=wT·x+b;
其中,L用于表示所述数据的分类值,w用于表示所述权重向量,x用于表示所述特征向量,b用于表示所述偏置项。
在另一实施例中,所述获取所述第二模型文件中包含的权重向量和偏置项,包括:
调用所述第二模型文件的指定接口;
通过所述指定接口,获取所述第二模型文件中包含的权重向量和偏置项。
在另一实施例中,所述方法还包括:
当所述第一模型文件中包括多个超平面的指示信息时,执行计算每个超平面的权重向量的步骤;
根据所述多个超平面的权重向量和偏置项,生成所述第二模型文件。
根据本公开实施例的第二方面,提供了一种生成模型文件的装置,所述装置包括:
第一获取模块,用于获取支持向量机SVM模型的第一模型文件,所述第一模型文件中包括超平面的指示信息,所述指示信息包括多个支持向量、系数向量和偏置项;
矩阵创建模块,用于将所述多个支持向量组成支持矩阵;
第一计算模块,用于计算所述支持矩阵与所述系数向量的乘积,得到权重向量;
文件生成模块,用于根据所述权重向量和所述偏置项,生成第二模型文件,所述第二模型文件用于对数据进行分类。
在另一实施例中,所述装置还包括:
第二获取模块,用于获取所述第二模型文件中包含的权重向量和偏置项;
所述第二获取模块,还用于获取待分类数据的特征向量;
第二计算模块,用于根据所述权重向量、所述偏置项和所述特征向量,计算所述数据的分类值,所述分类值用于表示所述数据的分类结果。
在另一实施例中,所述第二计算模块用于根据所述权重向量、所述偏置项和所述特征向量,应用以下公式,计算所述数据的分类值:
L=wT·x+b;
其中,L用于表示所述数据的分类值,w用于表示所述权重向量,x用于表示所述特征向量,b用于表示所述偏置项。
在另一实施例中,所述第二获取模块用于调用所述第二模型文件的指定接口;通过所述指定接口,获取所述第二模型文件中包含的权重向量和偏置项。
在另一实施例中,所述第一计算模块,还用于当所述第一模型文件中包括多个超平面的指示信息时,计算每个超平面的权重向量;
所述文件生成模块,还用于根据所述多个超平面的权重向量和偏置项,生成所述第二模型文件。
根据本公开实施例的第三方面,提供了一种生成模型文件的装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取支持向量机SVM模型的第一模型文件,所述第一模型文件中包括超平面的指示信息,所述指示信息包括多个支持向量、系数向量和偏置项;
将所述多个支持向量组成支持矩阵;
计算所述支持矩阵与所述系数向量的乘积,得到权重向量;
根据所述权重向量和所述偏置项,生成第二模型文件,所述第二模型文件用于对数据进行分类。
本公开的实施例提供的技术方案可以包括以下有益效果:
本实施例提供的方法和装置,通过根据第一模型文件中超平面的多个支持向量、系数向量和偏置项,计算出权重向量,根据该权重向量和该偏置项,生成第二模型文件,能够以该权重向量和偏置项来表示SVM模型的超平面,则该第二模型文件能够用于对数据进行分类。且第二模型文件中无需存储系数向量以及大量的支持向量,大大减小了模型文件的数据量。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种生成模型文件的方法的流程图;
图2A是根据一示例性实施例示出的一种生成模型文件的方法的流程图;
图2B是根据一示例性实施例示出的分类流程示意图;
图3是根据一示例性实施例示出的一种生成模型文件的装置的框图;
图4是根据一示例性实施例示出的一种用于生成模型文件的装置的框图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,下面结合实施方式和附图,对本公开做进一步详细说明。在此,本公开的示意性实施方式及其说明用于解释本公开,但并不作为对本公开的限定。
在对本公开实施例进行详细说明之前,先对SVM模型的超平面进行如下介绍:
在对样本数据进行训练之后,可以生成一个模型文件,模型文件中包括超平面的所有支持向量SV、一个系数向量alpha和一个偏置项b。该模型文件存储的多个支持向量、系数向量和该偏置项可以用于表示该超平面。其中,样本数据越多,模型文件中的SV越多,模型文件的数据量越大。
实际上,该多个支持向量中的每个支持向量与该系数向量的乘积可以组成一个权重向量,该权重向量和该偏置项也可以用于表示该超平面,该超平面的方程可以表示为:wT·x+b=m,w用于表示该权重向量,wT用于表示该权重向量的转置,b用于表示该偏置项,m用于表示预设阈值。
对数据进行分类时,如果数据的向量x0满足wT·x0+b=m,则该数据位于该第一超平面上,如果x0满足wT·x0+b>m,则该数据属于第一类,而如果x0满足wT·x0+b<m,则该数据属于第二类。
本公开实施例提供一种生成模型文件的方法和装置,以下结合附图对本公开进行详细说明。
图1是根据一示例性实施例示出的一种生成模型文件的方法的流程图,如图1所示,生成模型文件的方法用于数据处理装置中,包括以下步骤:
在步骤101中,获取SVM模型的第一模型文件,该第一模型文件中包括超平面的指示信息,该指示信息包括多个支持向量、系数向量和偏置项。
在步骤102中,将该多个支持向量组成支持矩阵。
在步骤103中,计算该支持矩阵与该系数向量的乘积,得到权重向量。
在步骤104中,根据该权重向量和该偏置项,生成第二模型文件,该第二模型文件用于对数据进行分类。
本实施例提供的方法,通过根据第一模型文件中超平面的多个支持向量、系数向量和偏置项,计算出权重向量,根据该权重向量和该偏置项,生成第二模型文件,能够以该权重向量和偏置项来表示SVM模型的超平面,则该第二模型文件能够用于对数据进行分类。且第二模型文件中无需存储系数向量以及大量的支持向量,大大减小了模型文件的数据量。
在另一实施例中,该根据该权重向量和该偏置项,生成第二模型文件之后,该方法还包括:
获取该第二模型文件中包含的权重向量和偏置项;
获取待分类数据的特征向量;
根据该权重向量、该偏置项和该特征向量,计算该数据的分类值,该分类值用于表示该数据的分类结果。
在另一实施例中,该根据该权重向量、该偏置项和该特征向量,计算该数据的分类值,包括:
根据该权重向量、该偏置项和该特征向量,应用以下公式,计算该数据的分类值:
L=wT·x+b;
其中,L用于表示该数据的分类值,w用于表示该权重向量,x用于表示该特征向量,b用于表示该偏置项。
在另一实施例中,该获取该第二模型文件中包含的权重向量和偏置项,包括:
调用该第二模型文件的指定接口;
通过该指定接口,获取该第二模型文件中包含的权重向量和偏置项。
在另一实施例中,该方法还包括:
当该第一模型文件中包括多个超平面的指示信息时,执行计算每个超平面的权重向量的步骤;
根据该多个超平面的权重向量和偏置项,生成该第二模型文件。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
图2A是根据一示例性实施例示出的一种生成模型文件的方法的流程图,如图2A所示,该生成模型文件的方法用于数据处理装置中,包括以下步骤:
在步骤201中,该数据处理装置获取SVM模型的第一模型文件,该第一模型文件中包括超平面的指示信息,该指示信息包括多个支持向量、系数向量和偏置项。
本实施例中,该数据处理装置用于对SVM模型的第一模型文件进行处理,生成第二模型文件,且该数据处理装置还可以用于基于该第二模型文件,对数据进行分类。该数据处理装置可以为计算机或服务器等设备,本实施例对此不做限定。
当SVM模型训练完成后,可以生成该第一模型文件,该第一模型文件中包括超平面的指示信息,即该超平面的多个支持向量,系数向量和偏置项,该指示信息用于唯一确定该超平面。例如,该超平面的指示信息可以结构体的形式存储在该第一模型文件中,结构体中包括多个支持向量、系数向量和偏置项。或者,该指示信息还可以类(class)的形式存储在该第一模型文件中,本实施例对此不做限定。
该数据处理装置可以获取该第一模型文件,对该第一模型文件中的多个支持向量和该系数向量进行处理。例如,该数据处理装置可以调用该第一模型文件的接口,获取该第一模型文件。
其中,该第一模型文件可以由该数据处理装置通过训练生成,也可以由其他设备通过训练生成后,发送给该数据处理装置,本实施例对此不做限定。
在步骤202中,该数据处理装置将该多个支持向量组成支持矩阵,计算该支持矩阵与该系数向量的乘积,得到权重向量,根据该权重向量和该偏置项,生成第二模型文件,该第二模型文件用于对数据进行分类。
该数据处理装置获取到该第一模型文件时,获取该第一模型文件中包含的多个支持向量、该系数向量和该偏置项,并将该多个支持向量组成支持矩阵,计算该支持矩阵与该系数向量的乘积,得到超平面的权重向量。
该权重向量和该偏置项能够表示该SVM模型的超平面,例如,该超平面的方程可以表示为:wT·x+b=m,w用于表示该权重向量,wT用于表示该权重向量的转置,b用于表示该偏置项,m用于表示该超平面的预设阈值,该预设阈值可以为0、0.5或其他数值,本实施例对此不做限定。
该权重向量和该偏置项可以用于对数据进行分类,该数据处理装置能够根据该权重向量和该偏置项,生成该第二模型文件,使得该第二模型文件中包含该权重向量和该偏置项,后续过程中根据第二模型文件中的该权重向量和该偏置项,可以对数据进行分类。
例如,该数据处理装置可以根据该权重向量和该偏置项,生成一个结构体,该结构体中包含该权重向量和该偏置项,并根据该结构体,生成该第二模型文件,使得该权重向量和该偏置项以结构体的形式存储在该第二模型文件中。
另外,该第二模型文件可以为txt(text,文本)格式或者XML(Extensible MarkupLanguage,可扩展标记语言)格式等,本实施例对此不做限定。
该第一模型文件中包括多个支持向量、系数向量和偏置项,而该第二模型文件中包括权重向量和该偏置项。因此,与该第一模型文件相比,该第二模型文件的数据量更小。
例如,该第一模型文件中支持向量的个数为n,每个支持向量的维度个数为d,则该数据处理装置可以将该多个支持向量组成支持矩阵,使得该支持矩阵的每一列即为一个支持向量,该支持矩阵即为d行n列的矩阵。该系数向量的维度个数为n,则计算该支持矩阵与该系数向量的乘积后,所得到的权重向量的维度个数为d。该第一模型文件中包括该系数向量、该偏置项和n个支持向量,且每个支持向量的维度个数为d,也即是该第一模型文件中共存储了n×d+2个数据。而该第二模型文件中仅包括该权重向量和该偏置项,该权重向量的维度个数为d,也即是该第二模型文件共存储了d+1个数据,则可以确定,该第二模型文件的数据量小于该第一模型文件的数据量。尤其是在实际应用时,支持向量的个数n往往很大,该第二模型文件的数据量要远远小于该第一模型文件的数据量。
需要说明的是,本实施例仅以该第一模型文件中的一个超平面的指示信息为例进行说明,而在实际应用中,每个超平面用于区分两个不同类别的数据,在多分类场景下,SVM模型中训练出多个超平面,该第一模型文件中可以包括多个超平面的指示信息,每个超平面的指示信息均包括多个支持向量、系数向量和偏置项。则该数据处理装置获取每个超平面的指示信息,对于每个超平面,将该超平面的多个支持向量组成支持矩阵,计算该支持矩阵与该系数向量的乘积,得到权重向量,从而得到每个超平面的权重向量和偏置项,再根据该多个超平面的权重向量和偏置项,生成该第二模型文件,使得该第二模型文件中包括多个超平面中的每个超平面的权重向量和偏置项。
在步骤203中,该数据处理装置获取到待分类的数据时,获取该数据的特征向量,获取该第二模型文件中包含的权重向量和偏置项,根据该权重向量、该偏置项和该特征向量,计算该数据的分类值,该分类值用于表示该数据的分类结果。
当该数据处理装置获取到待分类的数据时,获取该数据的特征向量,并获取该第二模型文件中包含的权重向量和偏置项。例如,该数据处理装置可以调用该第二模型文件的指定接口,通过该指定接口,获取该第二模型文件中包含的权重向量和偏置项。
之后,该数据处理装置根据该权重向量、该偏置项和该特征向量,计算该数据的分类值。例如,该数据处理装置计算该权重向量的转置与该特征向量的乘积,并计算该乘积与该偏置项之和,作为该数据的分类值,也即是,该数据处理装置根据该权重向量、该偏置项和该特征向量,可以应用以下公式,计算该数据的分类值:
L=wT·x+b;
其中,L用于表示该数据的分类值,w用于表示该权重向量,wT用于表示该权重向量的转置,x用于表示该特征向量,b用于表示该偏置项。
该分类值用于表示该数据的分类结果,当该数据的分类值大于该超平面的预设阈值时,表示该数据属于第一类,当该数据的分类值小于该超平面的预设阈值时,表示该数据属于第二类。
另外,在多分类场景下,该第二模型文件中包括多个超平面的权重向量和偏置项时,该数据处理装置获取该第二模型文件中多个超平面的权重向量和偏置项,基于该多个超平面的权重向量和偏置项,对数据进行分类。
该第二模型文件中包括多个超平面,一个超平面对应于两个类别,且该超平面用于区分对应两个类别的数据。那么,在进行分类时,该数据处理装置可以依次根据每个超平面,从该超平面对应的两个类别中确定数据所属的类别,从而最终确定该数据所属的类别。
参见图2B,以0-9这10个类别为例,10个类别中每两个类别对应一个超平面,则该第二模型文件中包括45个超平面的权重向量和偏置项。该数据处理装置可以将10个类别分成5组:(0,1)、(2,3)、(4,5)、(6,7)、(8,9)。根据每组对应的超平面进行分类后,分别确定该数据所属的类别为:0、3、4、7、8,则继续将5个类别分成3组:(0,3)、(4,7)、8,根据每组对应的超平面进行分类后,分别确定该数据所属的类别为:0、4、8,则继续将3个类别分成2组:(0,4)、8,根据每组对应的超平面进行分类后,分别确定该数据所属的类别为4和8,根据4和8对应的超平面进行分类后,最终确定该数据所属的类别为8。
基于上述举例,该第一模型文件中包括45个超平面的支持向量、系数向量和偏置项,而该第二模型文件中包括45个超平面的权重向量和偏置项。由于该第一模型文件中每个超平面的支持向量数目很多,则通过对比可知,该第二模型文件的数据量要远远小于该第一模型文件的数据量。
通过实际应用可以确定,该第一模型文件的数据量随着样本数据个数的增加而增加,甚至可以达到几十兆或几百兆,而该第二模型文件的数据量仅在100k至300k之间,远远小于该第一模型文件的数据量。
由于该第一模型文件的数据量较大,所占用的存储空间较大,因此,该第一模型文件对该数据处理装置的存储空间要求较高,在手机等存储空间较小的设备上很难实现数据分类。且,基于该第一模型文件进行分类时,需要计算出该权重向量,再根据该权重向量对数据进行分类,分类速度较慢。
而该第二模型文件的数据量很小,所占用的存储空间也很小,在手机等存储空间较小的设备上也可以实现数据分类,而无需受限于设备的存储空间。且,该第二模型文件中已包含超平面的权重向量,基于该第二模型文件进行分类时,直接根据该权重向量对数据进行分类即可,分类速度较快。
需要说明的是,本实施例仅以由该数据处理装置生成第二模型文件后,基于该第二模型文件对数据进行分类为例进行说明,而在实际应用中,该数据处理装置生成第二模型文件后,还可以由其他的装置基于该第二模型文件对数据进行分类。
以分类装置用于进行分类为例,该数据处理装置生成该第二模型文件后,在网站服务器上发布该第二模型文件,或者向该分类装置发送该第二模型文件,则该分类装置可以获取该第二模型文件,并安装该第二模型文件,当该分类装置要对数据进行分类时,可以调用该第二模型文件的指定接口,通过该指定接口,获取该第二模型文件,并基于该第二模型文件对数据进行分类。
例如,该数据处理装置生成该第二模型文件后,可以根据该第二模型文件,生成LibSVM安装包,并发布该LibSVM安装包,该分类装置可以获取该LibSVM安装包,安装该LibSVM安装包,并调用该指定接口,获取该LibSVM安装包中的该第二模型文件,基于该第二模型文件对数据进行分类。
本实施例提供的方法,通过根据第一模型文件中超平面的多个支持向量、系数向量和偏置项,计算出权重向量,根据该权重向量和该偏置项,生成第二模型文件,能够以该权重向量和偏置项来表示SVM模型的超平面,则该第二模型文件能够用于对数据进行分类。且第二模型文件中无需存储系数向量以及大量的支持向量,大大减小了模型文件的数据量。该第二模型文件对存储空间的要求较小,无需受限于存储空间的限制。且通过预先计算出超平面的权重向量,在进行分类时无需计算权重向量,直接根据该权重向量和该偏置项计算数据的分类值即可,提高了分类速度。
图3是根据一示例性实施例示出的一种生成模型文件的装置的框图。参见图3,该装置包括第一获取模块301,矩阵创建模块302、第一计算模块303和文件生成模块304。
第一获取模块301被配置为用于获取支持向量机SVM模型的第一模型文件,该第一模型文件中包括超平面的指示信息,该指示信息包括多个支持向量、系数向量和偏置项;
矩阵创建模块302被配置为用于将该多个支持向量组成支持矩阵;
第一计算模块303被配置为用于计算该支持矩阵与该系数向量的乘积,得到权重向量;
文件生成模块304被配置为用于根据该权重向量和该偏置项,生成第二模型文件,该第二模型文件用于对数据进行分类。
本实施例提供的装置,通过根据第一模型文件中超平面的多个支持向量、系数向量和偏置项,计算出权重向量,根据该权重向量和该偏置项,生成第二模型文件,能够以该权重向量和偏置项来表示SVM模型的超平面,则该第二模型文件能够用于对数据进行分类。且第二模型文件中无需存储系数向量以及大量的支持向量,大大减小了模型文件的数据量。
在另一实施例中,该装置还包括:
第二获取模块被配置为用于获取该第二模型文件中包含的权重向量和偏置项;
该第二获取模块还被配置为用于获取待分类数据的特征向量;
第二计算模块被配置为用于根据该权重向量、该偏置项和该特征向量,计算该数据的分类值,该分类值用于表示该数据的分类结果。
在另一实施例中,该第二计算模块被配置为用于根据该权重向量、该偏置项和该特征向量,应用以下公式,计算该数据的分类值:
L=wT·x+b;
其中,L用于表示该数据的分类值,w用于表示该权重向量,x用于表示该特征向量,b用于表示该偏置项。
在另一实施例中,该第二获取模块被配置为用于调用该第二模型文件的指定接口;通过该指定接口,获取该第二模型文件中包含的权重向量和偏置项。
在另一实施例中,该第一计算模块303还被配置为用于当该第一模型文件中包括多个超平面的指示信息时,计算每个超平面的权重向量;
该文件生成模块304还被配置为用于根据该多个超平面的权重向量和偏置项,生成该第二模型文件。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
需要说明的是:上述实施例提供的生成模型文件的装置在生成模型文件时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将数据处理装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的生成模型文件的装置与生成模型文件的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图4是根据一示例性实施例示出的一种用于生成模型文件的装置400的框图。例如,装置400可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图4,装置400可以包括以下一个或多个组件:处理组件402,存储器404,电源组件406,多媒体组件408,音频组件410,输入/输出(I/O)的接口412,传感器组件414,以及通信组件416。
处理组件402通常控制装置400的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件402可以包括一个或多个处理器420来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件402可以包括一个或多个模块,便于处理组件402和其他组件之间的交互。例如,处理组件402可以包括多媒体模块,以方便多媒体组件408和处理组件402之间的交互。
存储器404被配置为存储各种类型的数据以支持在装置400的操作。这些数据的示例包括用于在装置400上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件406为装置400的各种组件提供电力。电源组件406可以包括电源管理***,一个或多个电源,及其他与为装置400生成、管理和分配电力相关联的组件。
多媒体组件408包括在所述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件408包括一个前置摄像头和/或后置摄像头。当装置400处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
音频组件410被配置为输出和/或输入音频信号。例如,音频组件410包括一个麦克风(MIC),当装置400处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中,音频组件410还包括一个扬声器,用于输出音频信号。
I/O接口412为处理组件402和***接口模块之间提供接口,上述***接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件414包括一个或多个传感器,用于为装置400提供各个方面的状态评估。例如,传感器组件414可以检测到装置400的打开/关闭状态,组件的相对定位,例如该组件为装置400的显示器和小键盘,传感器组件414还可以检测装置400或装置400一个组件的位置改变,用户与装置400接触的存在或不存在,装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件414还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置400可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件416经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,该通信组件416还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述图1和图2所示实施例中的生成模型文件的方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器404,上述指令可由装置400的处理器420执行以完成上述方法。例如,该非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当该存储介质中的指令由数据处理装置的处理器执行时,使得数据处理装置能够执行一种生成模型文件的方法,该方法包括:
获取支持向量机SVM模型的第一模型文件,该第一模型文件中包括超平面的指示信息,该指示信息包括多个支持向量、系数向量和偏置项;
将该多个支持向量组成支持矩阵;
计算该支持矩阵与该系数向量的乘积,得到权重向量;
根据该权重向量和该偏置项,生成第二模型文件,该第二模型文件用于对数据进行分类。
在另一实施例中,该根据该权重向量和该偏置项,生成第二模型文件之后,该方法还包括:
获取该第二模型文件中包含的权重向量和偏置项;
获取待分类数据的特征向量;
根据该权重向量、该偏置项和该特征向量,计算该数据的分类值,该分类值用于表示该数据的分类结果。
在另一实施例中,该根据该权重向量、该偏置项和该特征向量,计算该数据的分类值,包括:
根据该权重向量、该偏置项和该特征向量,应用以下公式,计算该数据的分类值:
L=wT·x+b;
其中,L用于表示该数据的分类值,w用于表示该权重向量,x用于表示该特征向量,b用于表示该偏置项。
在另一实施例中,该获取该第二模型文件中包含的权重向量和偏置项,包括:
调用该第二模型文件的指定接口;
通过该指定接口,获取该第二模型文件中包含的权重向量和偏置项。
在另一实施例中,该方法还包括:
当该第一模型文件中包括多个超平面的指示信息时,执行计算每个超平面的权重向量的步骤;
根据该多个超平面的权重向量和偏置项,生成该第二模型文件。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (9)

1.一种生成模型文件的方法,其特征在于,所述方法包括:
获取支持向量机SVM模型的第一模型文件,所述第一模型文件中包括超平面的指示信息,所述指示信息包括多个支持向量、系数向量和偏置项;
将所述多个支持向量组成支持矩阵;
计算所述支持矩阵与所述系数向量的乘积,得到权重向量;
根据所述权重向量和所述偏置项,生成第二模型文件,所述第二模型文件用于对数据进行分类;
获取所述第二模型文件中包含的权重向量和偏置项;
获取待分类数据的特征向量;
根据所述权重向量、所述偏置项和所述特征向量,计算所述数据的分类值,所述分类值用于表示所述数据的分类结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述权重向量、所述偏置项和所述特征向量,计算所述数据的分类值,包括:
根据所述权重向量、所述偏置项和所述特征向量,应用以下公式,计算所述数据的分类值:
L=wT·x+b;
其中,L用于表示所述数据的分类值,w用于表示所述权重向量,x用于表示所述特征向量,b用于表示所述偏置项。
3.根据权利要求1所述的方法,其特征在于,所述获取所述第二模型文件中包含的权重向量和偏置项,包括:
调用所述第二模型文件的指定接口;
通过所述指定接口,获取所述第二模型文件中包含的权重向量和偏置项。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述第一模型文件中包括多个超平面的指示信息时,执行计算每个超平面的权重向量的步骤;
根据所述多个超平面的权重向量和偏置项,生成所述第二模型文件。
5.一种生成模型文件的装置,其特征在于,所述装置包括:
第一获取模块,用于获取支持向量机SVM模型的第一模型文件,所述第一模型文件中包括超平面的指示信息,所述指示信息包括多个支持向量、系数向量和偏置项;
矩阵创建模块,用于将所述多个支持向量组成支持矩阵;
第一计算模块,用于计算所述支持矩阵与所述系数向量的乘积,得到权重向量;
文件生成模块,用于根据所述权重向量和所述偏置项,生成第二模型文件,所述第二模型文件用于对数据进行分类;
第二获取模块,用于获取所述第二模型文件中包含的权重向量和偏置项;
所述第二获取模块,还用于获取待分类数据的特征向量;
第二计算模块,用于根据所述权重向量、所述偏置项和所述特征向量,计算所述数据的分类值,所述分类值用于表示所述数据的分类结果。
6.根据权利要求5所述的装置,其特征在于,所述第二计算模块用于根据所述权重向量、所述偏置项和所述特征向量,应用以下公式,计算所述数据的分类值:
L=wT·x+b;
其中,L用于表示所述数据的分类值,w用于表示所述权重向量,x用于表示所述特征向量,b用于表示所述偏置项。
7.根据权利要求5所述的装置,其特征在于,所述第二获取模块用于调用所述第二模型文件的指定接口;通过所述指定接口,获取所述第二模型文件中包含的权重向量和偏置项。
8.根据权利要求5所述的装置,其特征在于,
所述第一计算模块,还用于当所述第一模型文件中包括多个超平面的指示信息时,计算每个超平面的权重向量;
所述文件生成模块,还用于根据所述多个超平面的权重向量和偏置项,生成所述第二模型文件。
9.一种生成模型文件的装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取支持向量机SVM模型的第一模型文件,所述第一模型文件中包括超平面的指示信息,所述指示信息包括多个支持向量、系数向量和偏置项;
将所述多个支持向量组成支持矩阵;
计算所述支持矩阵与所述系数向量的乘积,得到权重向量;
根据所述权重向量和所述偏置项,生成第二模型文件,所述第二模型文件用于对数据进行分类;
获取所述第二模型文件中包含的权重向量和偏置项;
获取待分类数据的特征向量;
根据所述权重向量、所述偏置项和所述特征向量,计算所述数据的分类值,所述分类值用于表示所述数据的分类结果。
CN201510204727.6A 2015-04-27 2015-04-27 生成模型文件的方法和装置 Active CN104850592B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510204727.6A CN104850592B (zh) 2015-04-27 2015-04-27 生成模型文件的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510204727.6A CN104850592B (zh) 2015-04-27 2015-04-27 生成模型文件的方法和装置

Publications (2)

Publication Number Publication Date
CN104850592A CN104850592A (zh) 2015-08-19
CN104850592B true CN104850592B (zh) 2018-09-18

Family

ID=53850237

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510204727.6A Active CN104850592B (zh) 2015-04-27 2015-04-27 生成模型文件的方法和装置

Country Status (1)

Country Link
CN (1) CN104850592B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107231566B (zh) 2016-03-25 2020-12-18 阿里巴巴集团控股有限公司 一种视频转码方法、装置和***
CN111258584B (zh) * 2018-11-30 2022-02-08 上海寒武纪信息科技有限公司 通用机器学习二级模型文件解析方法、装置、存储介质
JP7386706B2 (ja) 2018-06-08 2023-11-27 シャンハイ カンブリコン インフォメーション テクノロジー カンパニー リミテッド 汎用機械学習モデル、モデルファイルの生成および解析方法
CN111260071B (zh) * 2018-11-30 2022-04-08 上海寒武纪信息科技有限公司 通用机器学习模型文件解析方法、装置、存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106262A (zh) * 2013-01-28 2013-05-15 新浪网技术(中国)有限公司 文档分类、支持向量机模型生成的方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101382934B (zh) * 2007-09-06 2010-08-18 华为技术有限公司 多媒体模型检索方法、装置及***

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106262A (zh) * 2013-01-28 2013-05-15 新浪网技术(中国)有限公司 文档分类、支持向量机模型生成的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
支持向量机理论及其应用分析;方瑞明;《中国电力出版社》;20071031;第4-6页 *

Also Published As

Publication number Publication date
CN104850592A (zh) 2015-08-19

Similar Documents

Publication Publication Date Title
CN104753766B (zh) 表情发送方法及装置
CN109117862B (zh) 图像标签识别方法、装置及服务器
CN109189950B (zh) 多媒体资源分类方法、装置、计算机设备及存储介质
CN105955618B (zh) 信息显示方法及装置
CN109389162B (zh) 样本图像筛选方法和装置、电子设备及存储介质
CN107239535A (zh) 相似图片检索方法及装置
CN109522424A (zh) 数据的处理方法、装置、电子设备及存储介质
CN105809174B (zh) 识别图像的方法及装置
CN105117384A (zh) 分类器训练方法、类型识别方法及装置
CN104636453B (zh) 非法用户资料识别方法及装置
CN105426878B (zh) 人脸聚类方法及装置
CN104850592B (zh) 生成模型文件的方法和装置
CN105404863A (zh) 人物特征识别方法及***
CN104899610A (zh) 图片分类方法及装置
CN105469104B (zh) 文本信息相似度的计算方法、装置及服务器
CN108038102A (zh) 表情图像的推荐方法、装置、终端及存储介质
CN108831508A (zh) 语音活动检测方法、装置和设备
CN106802808A (zh) 悬浮按钮控制方法及装置
CN105824955A (zh) 短信聚类方法及装置
CN111259967A (zh) 图像分类及神经网络训练方法、装置、设备及存储介质
CN105335714A (zh) 照片处理方法、装置和设备
CN104850855B (zh) 计算置信度的方法和装置
CN109409414B (zh) 样本图像确定方法和装置、电子设备及存储介质
CN105551047A (zh) 图片内容的检测方法和装置
CN108268667A (zh) 音频文件聚类方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant