CN105404848A - 识别装置以及识别装置的控制方法 - Google Patents

识别装置以及识别装置的控制方法 Download PDF

Info

Publication number
CN105404848A
CN105404848A CN201510535915.7A CN201510535915A CN105404848A CN 105404848 A CN105404848 A CN 105404848A CN 201510535915 A CN201510535915 A CN 201510535915A CN 105404848 A CN105404848 A CN 105404848A
Authority
CN
China
Prior art keywords
recognizer
classification results
recognition device
fiduciary level
age
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510535915.7A
Other languages
English (en)
Inventor
入江淳
高际睦起
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Publication of CN105404848A publication Critical patent/CN105404848A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/24765Rule-based classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/178Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Sorting Of Articles (AREA)

Abstract

本发明涉及识别装置以及识别装置的控制方法。识别装置具有:数据取得部件,取得输入数据;特征量取得部件,取得与所述输入数据对应的特征量;多个识别器,基于被输入的特征量,进行类分类;识别部件,将所述取得的特征量,分别输入到所述多个识别器,基于获得的多个分类结果,生成作为单一的分类结果的第二分类结果;以及可靠度生成部件,基于所述多个分类结果的偏差,生成对于所述第二分类结果的可靠度。

Description

识别装置以及识别装置的控制方法
技术领域
本发明涉及识别装置以及识别装置的控制方法。
背景技术
近年来,正在研究通过分析图像而直接或间接识别在该图像中包含的各种信息的技术。例如,基于在人物的脸中包含的图像(脸图像),能够识别该人物的性别、年龄、表情等。
例如,在专利文献1中,公开了从图像提取特征量,并基于该特征量,估计人物的年龄的年龄估计装置。具体来说,将从图像中取得的特征量,输入到用于进行基于年龄的类分类的多类识别器,基于该识别器的输出而决定估计年龄,并将其输出。
现有技术文献
专利文献
专利文献1:特许第5287333号公报
在基于所取得的特征量进行类分类时,其分类精度大幅依赖于所使用的识别器的精度。因此,已知基于识别器的输出,算出表示分类结果何种程度可信的值的方法。例如,在专利文献1中记载的装置中,基于识别器输出的从属概率(帰属確率),求出可靠度,并基于该可靠度,算出年龄的误差(±n岁)。
在专利文献1中记载的装置中,利用将多个二类识别器进行组合而构成的多类识别器,估计年龄。另一方面,有利用多个多类识别器进行分类的方法。例如,利用通过不同的方法进行分类的多个多类识别器、或者通过不同的学习数据学习后的多个多类识别器,进行年龄的估计,并整合所输出的多个结果,获得估计年龄。这样的方法被称为集成学习,被用作提高分类精度的方法。
但是,若并用多个识别器,则分别从具有不同的精度的多个识别器获得结果,因此难以求出整体的可靠度。
发明内容
本发明鉴于上述的课题而完成,其目的在于,在利用多个识别器进行类分类的识别装置中,算出对于分类结果的可靠度。
为了解决上述课题,本发明的识别装置的特征在于,具有:数据取得部件,取得输入数据;特征量取得部件,取得与所述输入数据对应的特征量;多个识别器,基于被输入的特征量,进行类分类;识别部件,将所述取得的特征量,分别输入到所述多个识别器,基于获得的多个分类结果,生成作为单一的分类结果的第二分类结果;以及可靠度生成部件,基于所述多个分类结果的偏差,生成对于所述第二分类结果的可靠度。
输入数据典型的是图像,但并不限定于此。
特征量取得部件是从输入数据取得特征量的部件。特征量可以与输入数据整体对应,也可以仅与输入数据的一部分对应。例如,当输入数据为图像的情况下,可以仅从该图像中包含的一部分区域取得特征量。
识别器是基于被输入的特征量而进行类分类的部件。分类目标的类只要与输入数据的内容相关,则可以是任意的类。例如,在输入数据为包括人物的脸的图像(以下,记为脸图像)的情况下,可以是对应的人物的年龄、性别、脸朝向、特定的表情(喜、哀、怒等)的程度等。
识别部件是基于从各识别器获得的多个分类结果而生成单一的分类结果(第二分类结果)的部件。例如,当识别对象为年龄的情况下,从多个识别器分别取得估计年龄,基于该多个估计年龄而生成单一的估计年龄。单一的分类结果例如通过取与多个分类结果对应的值的平均值或中间值、众数值等而生成,也可以通过其他的方法来生成。
可靠度生成部件是生成对于第二分类结果的可靠度的部件。对于第二分类结果的可靠度能够基于多个识别器输出的分类结果的偏差而决定。
例如,所述可靠度生成部件可以将所述可靠度决定为所述多个分类结果的偏差的大小与所述可靠度的大小具有负相关。
在多个识别器输出的分类结果分散在宽范围的情况下,意味着作为整体其识别精度低。从而,也可以在分类结果的偏差大的情况下,将对于第二分类结果的可靠度设为较低,在分类结果的偏差小的情况下,将对于第二分类结果的可靠度设为较大。
此外,其特征也可以设为,所述识别器是多类识别器,输出与分类结果的类对应的值即类值。
多类识别器是指从多个类中,输出对被输入的特征量最适合的类(似然性最高的类)的识别器。多类识别器可以是单一的识别器,也可以是将多个二类识别器进行了组合的识别器。
此外,其特征也可以设为,所述可靠度生成部件基于多个所述识别器输出的类值的方差或者标准差,生成对于所述第二分类结果的可靠度。
分类结果的偏差能够由类值的方差或标准差来表示。
此外,其特征也可以设为,所述可靠度生成部件利用多个所述识别器输出的类值的中间值或者众数值,求出所述方差或标准差。
若在求出方差或标准差时利用类值的平均,则在存在输出了异常值(与其他的识别器的输出相差较大的分类结果)的识别器的情况下,存在所生成的可靠度不准确的顾虑。因此,通过利用类值的中间值或众数值,能够抑制这样的噪声的影响。
此外,本发明的识别装置的特征也可以设为:进一步具有评价部件,其分别评价所述多个识别器的精度,所述识别部件或者可靠度生成部件基于所述评价的结果,对所述多个分类结果进行加权后,生成所述第二分类结果或可靠度。
识别器的精度高意味着该识别器输出的类值接近真值。从而,通过基于识别器的精度,对该识别器输出的结果进行加权,从而能够更准确地求出第二分类结果或可靠度。
此外,其特征也可以设为,所述评价部件利用测试数据分别评价各识别器的精度,其特征也可以设为,所述评价部件基于学习了所述多个识别器时的学习样本数,评价各识别器的精度。
识别器的精度可以利用测试数据(即,知道正解的数据)而评价,也可以基于学习样本数而评价。例如,进行学习样本数越多的识别器其精度越高的评价。
此外,其特征也可以设为,所述输入数据是图像。本发明的识别装置能够适当应用于识别在图像中包含的现象的装置。
此外,其特征也可以设为,所述识别器进行分类的对象是图像中包含的人物的属性或者状态中的至少任一个。
人物的属性例如是该人物的年龄、年代、性别、人种等,状态是脸的朝向、视线的方向、特定的表情的程度等。当然也可以是除此之外的属性、状态。
另外,本发明能够特定为包含上述部件的至少一部分的识别装置。此外,本发明还能够特定为上述识别装置的控制方法。此外,本发明还能够特定为控制上述识别装置的程序。上述处理、部件只要不产生技术上的矛盾,可自由组合而实施。
根据本发明,在利用多个识别器进行类分类的识别装置中,能够算出对于分类结果的可靠度。
附图说明
图1是第一实施方式的年龄估计装置的***结构图。
图2是说明识别部的详细的结构的图。
图3是说明在图像中包含的脸区域的图。
图4是表示估计年龄的分布例的图。
图5是表示估计年龄的分布例的第二图。
图6(A)~(B)是对用户提供的画面的例子。
图7是第一实施方式的年龄估计装置进行的处理的流程图。
标号说明
10年龄估计装置
11图像取得部
12特征量取得部
13识别部
130A~P识别器
131提供年龄计算部
132评价值计算部
14输入输出部
具体实施方式
(第一实施方式)
<***结构>
以下,参照附图说明本发明的优选实施方式。
第一实施方式的年龄估计装置是基于在图像中包含的人物的脸来估计该人物的年龄的装置。图1是本实施方式的年龄估计装置10的***结构图。
年龄估计装置10由图像取得部11、特征量取得部12、识别部13、输入输出部14构成。
图像取得部11是取得处理对象的图像(脸图像)的部件,典型的是被称为固定硬盘驱动或闪速存储器等的存储装置。另外,图像取得部11也可以是从装置的外部取得图像的部件(例如,接口装置或无线通信装置),也可以是由镜头和拍摄元件拍摄图像的部件。
特征量取得部12是取得与图像取得部11所取得的图像对应的特征量的部件。具体来说,从构成所取得的图像的像素中,提取与人脸对应的区域(脸区域),并取得在该脸区域中包含的特征量的集合(特征量向量)。另外,特征量取得部12取得的特征量也可以是与脸区域对应的特征量的集合,也可以是仅与在脸区域中包含的一部分像素对应的特征量的集合。
识别部13是基于被输入的特征量,输出分类结果(作为被摄体的人物的估计年龄)和对于该分类结果的评价值(表示估计年龄何种程度可靠的值)的部件。更具体来说,识别部13包含多个多类识别器,基于该多个识别器输出的结果,生成单一的分类结果与对于该分类结果的评价值。
图2是说明本实施方式的识别部13的结构的图。在识别部13中包含的多个识别器(识别器130A~130P)是分别由多个SVM(支持向量机)构成的多类识别器。SVM是二类识别器,因此通过组合多个,实现多类识别器。这些识别器是通过教师数据事先进行了学习的识别器。
另外,在本实施方式中,虽然将SVM进行组合而构成了多类识别器,但各识别器也可以通过将SVM以外的二类识别器进行组合而实现。此外,关于多类识别器的构成方法,也可以采用公知的方法。例如,可以利用使用将年龄的范围分成两部分的多个二类识别器,通过二叉查找来缩小范围的方法,也可以利用基于从多个二类识别器取得的从属概率,估计真值的方法等。
此外,各识别器也可以分别由单一的多类识别器实现。
作为具体的算法,能够采用利用了多个决策树的随机森林、由多个弱识别器构成的增强(Boosting)、在增强中根据误分类率进行加权的AdaBoost、以及它们的组合等。如果能够从多个类中决定与特征量对应的类,则各识别器利用的算法可以是任意的算法。
此外,各识别器优选是分别通过不同的方法(算法)进行识别的识别器或者分别通过不同的学习数据进行学习的识别器。
在本实施方式中,利用识别器130A~130P这16个识别器,取得多个分类结果,提供年龄计算部131(识别部件)基于该多个分类结果,生成单一的分类结果(第二分类结果)。此外,评价值计算部132(可靠度生成部件)基于该多个分类结果的偏差,算出表示对于该第二分类结果的可靠度的评价值。在本实施方式中,算出可靠度(评价值),使得多个分类结果的偏差的大小与第二分类结果的可靠度的大小具有负相关。例如,可以算出评价值,使得表示多个分类结果的偏差的值(方差、标准差等)在其可取的范围内成为最小值时可靠度最大,表示偏差的值成为最大值时可靠度最小,表示偏差的值取最小值与最大值之间的值时根据表示偏差的值的大小,可靠度连续或者阶段性地变小。关于分类结果的生成以及评价值计算的具体方法将在后面叙述。
输入输出部14是接受用户进行的输入操作,对用户提示信息的部件。具体来说,由触摸面板及其控制部件、液晶显示器及其控制部件构成。触摸面板以及液晶显示器在本实施方式中由一个触摸面板显示器构成。
另外,以上说明的各部件可以由专门设计的硬件来实现,也可以由软件模块来实现。此外,也可以由FPGA(现场可编程门阵列)或ASIC(专用集成电路)等实现,也可以由它们的组合来实现。
在所述的部件作为软件模块来构成的情况下,在辅助存储装置中存储的程序被加载到主存储装置中,通过由CPU执行,各部件起到作用(CPU、辅助存储装置、主存储装置均未图示)。
<年龄估计处理的概要>
接着,说明年龄估计装置10进行的年龄估计处理的概要。年龄估计装置10进行的处理可分为基于脸图像取得特征量的阶段以及基于该特征量估计年龄的阶段。
(1)特征量取得阶段
首先,说明基于脸图像取得特征量的阶段(特征量取得阶段)。与脸图像对应的特征量通过由特征量取得部12执行以下的处理而取得。
首先,特征量取得部12从图像取得部11取得脸图像,从该脸图像中检测包含人脸的区域(脸区域)。在图3的例子中,标号30是脸图像,标号31是所检测到的脸区域。脸区域的检测能够例如通过利用了纹理信息的模式匹配或者利用了与脸整体的轮廓对应的模板的模板匹配而进行。除此之外,也可以进行基于构成脸的器官的模板匹配,也可以提取表示脸的一部分的区域或点,基于提取结果判定脸区域。除此之外,也可以通过检测脸图像中的肤色区域而判定脸区域。检测脸区域的处理可以通过已知的任意方法来进行。
接着,在所检测到的脸区域上配置多个特征点。特征点例如基于脸的器官(例如,眼睛、鼻子、鼻孔、嘴、眉、下巴、额头等)的位置而配置。检测对象的器官可以预先设定,也可以动态地决定。
然后,基于所检测到的器官的位置,配置特征点。另外,特征点优选越接近器官越密集,越远离越稀疏地配置。此外,当某种程度知道对象人物的属性的情况下,也可以根据该属性变更特征点的配置方法。
接着,基于所配置的特征点,算出特征量。特征量能够基于例如通过Gabor滤波器等滤波器处理而获得的值而算出。
另外,在本例中,在检测到脸区域后,配置特征点,利用该特征点算出了特征量,但也可以通过其他的方法来取得特征量。例如,可以从所取得的脸区域算出直接特征量。
在本阶段中,获得与脸区域对应的多维特征量(以下,记为特征量向量)。
(2)年龄估计阶段
特征量取得部12取得的特征量向量分别输入到识别部13具有的多个识别器130A~130P,在各识别器中,进行基于该特征量向量的类分类。分类的结果(各识别器输出的类。在本实施方式中为作为被摄体的人物的估计年龄)分别输入到提供年龄计算部131以及评价值计算部132。即,提供年龄计算部131以及评价值计算部132中分别被输入16个估计年龄。
图4是利用直方图示出了16个识别器分别输出的估计年龄与该估计年龄的分布的例子。
接着,提供年龄计算部131基于所取得的多个估计年龄,算出并输出对用户提供的单一的估计年龄(以下,记为提供年龄)。具体来说,作为提供年龄而输出所取得的多个估计年龄的平均值。例如,在图4的例子的情况下,平均值成为31.1。另外,提供年龄不一定是平均值。例如,也可以是中间值(Median)、众数值(mode)等。在图4的例子的情况下,中间值成为30.5,众数值成为30.0。提供年龄只要是基于从各识别器取得的多个估计年龄而算出的值,并不特别限定其计算方法。
接着,评价值计算部132基于所取得的多个估计年龄而算出评价值,并将其输出。评价值是与对于提供年龄的可靠度相关联的值,例如能够如下定义。另外,σ是标准差,n是2以上的整数。
(模式1)将方差值(σ2)或标准差值(σ)设为评价值。
(模式2)将模式1的整数倍的值、即nσ2或nσ设为评价值。
(模式3)将方差值的倒数(1/σ2)或标准差值的倒数(1/σ)设为评价值。
(模式4)将模式3的整数倍的值、即n/σ2或n/σ设为评价值。
在模式1以及模式2的情况下,表示评价值越大则可靠度越低(提供年龄的估计精度越低),在模式3以及模式4的情况下,表示评价值越大则可靠度越高(提供年龄的估计精度越高)。
在第一实施方式的情况下,其中,利用方差值(σ2)作为评价值。在将方差值设为评价值的情况下,在图4的例子中,评价值成为6.8,但在如图5所示那样估计年龄存在偏差的情况下,评价值成为12.9,可知年龄的估计精度低。
所算出的评价值可以直接提供给用户,但也可以进行标准化(例如,置换为取0~100的范围的分数)以便取规定的范围。图6(A)是将评价值置换为分数的情况下的画面例。用于将评价值变换为分数的方法并没有特别限定。此外,也可以将用于将评价值变换为分数的数据例如预先存储在评价值计算部132。
<处理流程图>
图7是本实施方式的年龄估计装置10进行的年龄估计处理的流程图。该处理通过用户的操作(例如,读入所存储的图像的操作)而开始。
首先,在步骤S11中,图像取得部11取得脸图像。在本实施方式中,从存储装置取得预先存储的图像,但也可以经由通信部件或拍摄部件而取得图像。
接着,在步骤S12中,特征量取得部12通过前述的处理而从该脸图像取得特征量向量。
在步骤S13中,识别部13将通过特征量取得部12取得的特征量向量输入到各识别器。
接着,在步骤S14中,提供年龄计算部131取得从各识别器输出的估计年龄,从而算出平均值,并将其设为提供年龄。
接着,在步骤S15中,评价值计算部132取得从各识别器输出的估计年龄,从而算出方差值,并将其设为评价值。
然后,在步骤S16中,输入输出部14将提供年龄与评价值(或者,基于评价值而生成的分数)通过画面而提供给用户。
如以上说明那样,第一实施方式的年龄估计装置利用多个多类识别器进行类的分类,并基于多个分类结果,生成并提示单一的估计年龄以及对于该估计年龄的评价值。由此,用户能够掌握被显示的估计年龄是何种程度可信赖的值。
(第二实施方式)
第二实施方式是在对识别部13具有的各识别器的输出进行了加权后,算出提供年龄以及评价值的实施方式。
第二实施方式的年龄估计装置的结构与第一实施方式相同,因此省略详细的说明,仅说明处理的不同点。
在第二实施方式中,在提供年龄计算部131算出提供年龄时,以及在评价值计算部132算出评价值时,对每个识别器乘以权重后进行处理。
对各识别器提供的权重优选与该识别器的精度对应。具体来说,识别器的精度越高权重越大,精度越差权重越小。例如,用于学习的数据的数目越多,可以看做是精度越高的识别器,将权重设为较大。此外,也可以利用预先知道正解的评价用的数据进行测试,并设为成绩越好的识别器其权重越大。
除此之外,在利用随机森林的情况下,还可以根据树的深度来估计识别器的精度的好坏。例如,与树浅的情况相比,在树深的情况下,可以将权重设为更大。
在第二实施方式中,通过如此利用基于识别器的精度的权重,能够提高提供年龄以及评价值的计算精度。另外,在本实施方式中,在提供年龄的计算以及评价值的计算中分别利用相同的权重,但权重也可以分别不同。此外,也可以仅在其中任一个处理中利用权重。
(变形例)
上述的实施方式终归是一例,本发明在不脱离其宗旨的范围内可适当变更而实施。
例如,在各实施方式中,举出了估计年龄的装置的例子,但估计的对象可以是性别、脸部朝向(脸相对于照相机的方位角以及仰角)、视线的方向、特定的表情的程度(例如,喜、怒、哀、惊、恐怖、厌恶、无表情)等,也可以是除此之外的对象。
此外,在实施方式的说明中,举出了以数值方式输出分类结果的识别器的例子,但识别器也可以不是直接输出数值的识别器。但是,由于需要算出方差和标准差,因此此时,需要追加将分类结果置换为数值的处理。
此外,在各实施方式中,设为对识别部13具有的多个识别器分别输入由特征量取得部12取得的特征量向量,但各识别器无需利用在该特征量向量中包含的所有维而进行识别,例如,也可以在各识别器中筛选特征量向量,并仅利用规定维的特征量进行识别。
此外,特征量取得部12也可以利用不同的方法取得多个特征量向量,对每个识别器输入不同的特征量向量。
此外,在各实施方式中,举出了利用评价值或者分数提示可靠度的例子,但也可以将评价值变换为相对于年龄的误差(±n岁)的形式而提示,例如,可以将评价值与误差之间的关系利用表格或数学式来保持,利用该信息,求出具体的年龄的范围。图6(B)是将评价值置换为相对于年龄的误差的情况下的画面例。
此外,用于算出评价值的方差值或标准差值一般来说利用各识别器输出的估计年龄的平均值来求出,但也可以代替平均值而利用中间值或众数值。即,可以利用与中间值或众数值之间的差的平方和来求出。
此外,在各实施方式中,举出了通过画面将提供年龄以及评价值提示给用户的装置,但也可以设为代替输入输出部而设置通信部件,将提供年龄以及评价值发送给其他装置的结构。
此外,在各实施方式中,将单一的图像作为输入数据而进行了年龄的估计,但成为输入数据的图像也可以是与动图像的帧对应的图像。此外,也可以是语音或其他的二进制数据等。只要能够算出特征量,对象可以是任意的对象。
此外,在各实施方式中,定义了作为与可靠度相关的值的评价值,作为偏差与评价值之间的关系,例示了模式1~4,但只要基于各识别器进行了分类的结果的偏差而决定可靠度,则可以采用其他的方法。

Claims (10)

1.一种识别装置,其特征在于,具有:
数据取得部件,取得输入数据;
特征量取得部件,取得与所述输入数据对应的特征量;
多个识别器,基于被输入的特征量,进行类分类;
识别部件,将所述取得的特征量,分别输入到所述多个识别器,基于获得的多个分类结果,生成作为单一的分类结果的第二分类结果;以及
可靠度生成部件,基于所述多个分类结果的偏差,生成对于所述第二分类结果的可靠度。
2.如权利要求1所述的识别装置,其特征在于,
所述识别器是多类识别器,输出与分类结果的类对应的值即类值。
3.如权利要求2所述的识别装置,其特征在于,
所述可靠度生成部件基于多个所述识别器输出的类值的方差或者标准差,生成对于所述第二分类结果的可靠度。
4.如权利要求3所述的识别装置,其特征在于,
所述可靠度生成部件利用多个所述识别器输出的类值的中间值或者众数值,求出所述方差或标准差。
5.如权利要求1至4的任一项所述的识别装置,其特征在于,
进一步具有评价部件,其分别评价所述多个识别器的精度,
所述识别部件或者可靠度生成部件基于所述评价的结果,对所述多个分类结果进行加权后,生成所述第二分类结果或可靠度。
6.如权利要求5所述的识别装置,其特征在于,
所述评价部件利用测试数据分别评价各识别器的精度。
7.如权利要求5所述的识别装置,其特征在于,
所述评价部件基于学习了所述多个识别器时的学习样本数,评价各识别器的精度。
8.如权利要求1所述的识别装置,其特征在于,
所述输入数据是图像。
9.如权利要求8所述的识别装置,其特征在于,
所述识别器进行分类的对象是图像中包含的人物的属性或者状态中的至少任一个。
10.一种识别装置的控制方法,所述识别装置具有基于被输入的特征量进行类分类的多个识别器,其特征在于,所述识别装置的控制方法包含:
数据取得步骤,取得输入数据;
特征量取得步骤,取得与所述输入数据对应的特征量;
识别步骤,将所述取得的特征量分别输入到所述多个识别器,基于获得的多个分类结果,生成作为单一的分类结果的第二分类结果;以及
可靠度生成步骤,基于所述多个分类结果的偏差,生成对于所述第二分类结果的可靠度。
CN201510535915.7A 2014-09-05 2015-08-27 识别装置以及识别装置的控制方法 Pending CN105404848A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014181638A JP6361387B2 (ja) 2014-09-05 2014-09-05 識別装置および識別装置の制御方法
JP2014-181638 2014-09-05

Publications (1)

Publication Number Publication Date
CN105404848A true CN105404848A (zh) 2016-03-16

Family

ID=53938168

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510535915.7A Pending CN105404848A (zh) 2014-09-05 2015-08-27 识别装置以及识别装置的控制方法

Country Status (5)

Country Link
US (1) US9691007B2 (zh)
EP (1) EP2993624A3 (zh)
JP (1) JP6361387B2 (zh)
KR (1) KR101725651B1 (zh)
CN (1) CN105404848A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108573485A (zh) * 2017-03-08 2018-09-25 卡西欧计算机株式会社 识别装置、识别方法以及程序存储介质
CN109086680A (zh) * 2018-07-10 2018-12-25 Oppo广东移动通信有限公司 图像处理方法、装置、存储介质和电子设备
CN109100990A (zh) * 2017-06-21 2018-12-28 欧姆龙株式会社 控制装置、记录媒体及控制***
CN110537188A (zh) * 2017-04-12 2019-12-03 株式会社日立制作所 物体识别装置、物体识别***以及物体识别方法
CN110598683A (zh) * 2018-06-13 2019-12-20 富士施乐株式会社 信息处理装置、信息处理方法

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI618562B (zh) * 2016-04-27 2018-03-21 寶凱電子企業股份有限公司 具影像資料判斷功能之遊戲機
KR101931128B1 (ko) 2017-01-25 2018-12-20 한국과학기술원 사물 인터넷 환경에서 디바이스의 신뢰도를 평가하는 방법과 장치, 및 컴퓨터 판독가능 매체
CN108985133B (zh) * 2017-06-01 2022-04-12 北京中科奥森数据科技有限公司 一种人脸图像的年龄预测方法及装置
US10502443B2 (en) 2017-07-18 2019-12-10 Ademco Inc. Smart human machine interface
CN108108668B (zh) * 2017-12-01 2021-04-27 北京小米移动软件有限公司 基于图像的年龄预测方法及装置
US10747989B2 (en) * 2018-08-21 2020-08-18 Software Ag Systems and/or methods for accelerating facial feature vector matching with supervised machine learning
JPWO2020203240A1 (zh) * 2019-03-29 2020-10-08
CN111209977B (zh) * 2020-01-16 2024-01-05 北京百度网讯科技有限公司 分类模型的训练和使用方法、装置、设备和介质
JP7377971B2 (ja) * 2020-05-22 2023-11-10 富士フイルム株式会社 画像データ処理装置及び画像データ処理システム
JP7520582B2 (ja) * 2020-06-10 2024-07-23 日立造船株式会社 情報処理装置、判定方法、および情報処理プログラム
CN113095388B (zh) * 2021-04-01 2023-06-30 福建师范大学 基于双层分类算法的固废塑料材质识别方法
US20230094651A1 (en) 2021-09-30 2023-03-30 Konica Minolta Business Solutions U.S.A., Inc. Extracting text from an image
JP7251590B1 (ja) 2021-10-07 2023-04-04 株式会社Sumco 機械学習の評価方法及び機械学習による推定モデルの生成方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060120609A1 (en) * 2004-12-06 2006-06-08 Yuri Ivanov Confidence weighted classifier combination for multi-modal identification
CN1973300A (zh) * 2004-08-04 2007-05-30 精工爱普生株式会社 对象图像检测装置、面部图像检测程序及面部图像检测方法
CN101809619A (zh) * 2007-09-28 2010-08-18 Nec软件有限公司 属性估计***、年龄估计***、性别估计***、年龄和性别估计***和属性估计方法
US20100250473A1 (en) * 2009-03-27 2010-09-30 Porikli Fatih M Active Learning Method for Multi-Class Classifiers

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5287333A (en) 1976-01-17 1977-07-21 Agency Of Ind Science & Technol Multi-dimensional irregular signal generator
DE19955919C1 (de) * 1999-11-20 2001-05-31 Daimler Chrysler Ag Verfahren zur Erkennung von Objekten in Bildern auf der Bildpixelebene
US7720289B2 (en) * 2005-12-14 2010-05-18 Mitsubishi Electric Research Laboratories, Inc. Method for constructing covariance matrices from data features
JP5287333B2 (ja) * 2008-02-25 2013-09-11 オムロン株式会社 年令推定装置
JP5218139B2 (ja) * 2009-02-19 2013-06-26 株式会社デンソー 血圧測定装置及びプログラム並びに記録媒体
JP5257274B2 (ja) * 2009-06-30 2013-08-07 住友電気工業株式会社 移動体検出装置、移動体検出方法及びコンピュータプログラム
US8644624B2 (en) * 2009-07-28 2014-02-04 Samsung Electronics Co., Ltd. System and method for indoor-outdoor scene classification
CN102549617B (zh) 2009-10-05 2014-10-08 富士通株式会社 生物体信息处理装置、生物体信息处理方法以及生物体信息处理用计算机程序
US8594385B2 (en) * 2011-04-19 2013-11-26 Xerox Corporation Predicting the aesthetic value of an image
JP5320443B2 (ja) * 2011-07-19 2013-10-23 富士フイルム株式会社 高速判別装置および高速判別装置を高速化する方法、並びに高速判別装置プログラム
US8498491B1 (en) * 2011-08-10 2013-07-30 Google Inc. Estimating age using multiple classifiers
US9031293B2 (en) 2012-10-19 2015-05-12 Sony Computer Entertainment Inc. Multi-modal sensor based emotion recognition and emotional interface

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1973300A (zh) * 2004-08-04 2007-05-30 精工爱普生株式会社 对象图像检测装置、面部图像检测程序及面部图像检测方法
US20060120609A1 (en) * 2004-12-06 2006-06-08 Yuri Ivanov Confidence weighted classifier combination for multi-modal identification
CN101809619A (zh) * 2007-09-28 2010-08-18 Nec软件有限公司 属性估计***、年龄估计***、性别估计***、年龄和性别估计***和属性估计方法
US20100250473A1 (en) * 2009-03-27 2010-09-30 Porikli Fatih M Active Learning Method for Multi-Class Classifiers

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108573485A (zh) * 2017-03-08 2018-09-25 卡西欧计算机株式会社 识别装置、识别方法以及程序存储介质
CN108573485B (zh) * 2017-03-08 2022-10-14 卡西欧计算机株式会社 识别装置、识别方法以及程序存储介质
CN110537188A (zh) * 2017-04-12 2019-12-03 株式会社日立制作所 物体识别装置、物体识别***以及物体识别方法
CN110537188B (zh) * 2017-04-12 2023-02-28 株式会社日立制作所 物体识别装置、物体识别***以及物体识别方法
CN109100990A (zh) * 2017-06-21 2018-12-28 欧姆龙株式会社 控制装置、记录媒体及控制***
US10977576B2 (en) 2017-06-21 2021-04-13 Omron Corporation Control device, recording medium, and control system
CN109100990B (zh) * 2017-06-21 2021-09-03 欧姆龙株式会社 控制装置、记录媒体及控制***
CN110598683A (zh) * 2018-06-13 2019-12-20 富士施乐株式会社 信息处理装置、信息处理方法
CN110598683B (zh) * 2018-06-13 2023-08-08 富士胶片商业创新有限公司 信息处理装置、信息处理方法
CN109086680A (zh) * 2018-07-10 2018-12-25 Oppo广东移动通信有限公司 图像处理方法、装置、存储介质和电子设备

Also Published As

Publication number Publication date
KR101725651B1 (ko) 2017-04-10
EP2993624A2 (en) 2016-03-09
US9691007B2 (en) 2017-06-27
JP2016057701A (ja) 2016-04-21
EP2993624A3 (en) 2016-04-27
US20160070987A1 (en) 2016-03-10
JP6361387B2 (ja) 2018-07-25
KR20160029655A (ko) 2016-03-15

Similar Documents

Publication Publication Date Title
CN105404848A (zh) 识别装置以及识别装置的控制方法
US11775056B2 (en) System and method using machine learning for iris tracking, measurement, and simulation
US10438059B2 (en) Image recognition method, image recognition apparatus, and recording medium
CN104123543B (zh) 一种基于人脸识别的眼球运动识别方法
US9633044B2 (en) Apparatus and method for recognizing image, and method for generating morphable face images from original image
US9639779B2 (en) Feature point detection device, feature point detection method, and computer program product
US20130251246A1 (en) Method and a device for training a pose classifier and an object classifier, a method and a device for object detection
US8498454B2 (en) Optimal subspaces for face recognition
US10706326B2 (en) Learning apparatus, image identification apparatus, learning method, image identification method, and storage medium
KR101288447B1 (ko) 시선 추적 장치와 이를 이용하는 디스플레이 장치 및 그 방법
JP6351243B2 (ja) 画像処理装置、画像処理方法
US11380010B2 (en) Image processing device, image processing method, and image processing program
JP6822482B2 (ja) 視線推定装置、視線推定方法及びプログラム記録媒体
KR20160053833A (ko) 개선된 데이터 비교 방법
JP5214679B2 (ja) 学習装置、方法及びプログラム
CN111723762B (zh) 人脸属性识别方法、装置、电子设备及存储介质
CN112541394A (zh) 黑眼圈及鼻炎识别方法、***及计算机介质
CN113436735A (zh) 基于人脸结构度量的体重指数预测方法、设备和存储介质
CN108805181B (zh) 一种基于多分类模型的图像分类装置及分类方法
US20160140395A1 (en) Adaptive sampling for efficient analysis of ego-centric videos
WO2015131710A1 (zh) 人眼定位方法及装置
CN113706580B (zh) 一种基于相关滤波***的目标跟踪方法、***、设备及介质
Nikisins et al. Reduced complexity automatic face recognition algorithm based on local binary patterns
US20240019931A1 (en) Methods and systems for eye-gaze location detection and accurate collection of eye-gaze data
Peter et al. Analysis of gender recognition methods' robustness

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160316