CN111797860A - 特征提取方法、装置、存储介质及电子设备 - Google Patents

特征提取方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN111797860A
CN111797860A CN201910282155.1A CN201910282155A CN111797860A CN 111797860 A CN111797860 A CN 111797860A CN 201910282155 A CN201910282155 A CN 201910282155A CN 111797860 A CN111797860 A CN 111797860A
Authority
CN
China
Prior art keywords
panoramic data
data matrix
panoramic
matrix
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910282155.1A
Other languages
English (en)
Other versions
CN111797860B (zh
Inventor
何明
陈仲铭
黄粟
刘耀勇
陈岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201910282155.1A priority Critical patent/CN111797860B/zh
Publication of CN111797860A publication Critical patent/CN111797860A/zh
Application granted granted Critical
Publication of CN111797860B publication Critical patent/CN111797860B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例公开了一种特征提取方法、装置、存储介质及电子设备,其中,本申请实施例获取当前的第一全景数据矩阵和预设维数;从第一全景数据矩阵中获取维数等于预设维数的第二全景数据矩阵;计算第二全景数据矩阵的信息量;若信息量小于预设阈值,则增大预设维数,并基于增大后的预设维数,返回执行从第一全景数据矩阵中获取维数等于预设维数的第二全景数据矩阵的步骤;若信息量不小于预设阈值,则对第二全景数据矩阵进行分解,获取特征向量,本实施例不仅保证了特征提取的时效性,且由于第二全景数据中有丰富的特征信息,能够提高特征提取的质量,无需对全部的数据进行特征提取,有效降低特征提取的计算量。

Description

特征提取方法、装置、存储介质及电子设备
技术领域
本申请涉及数据处理技术领域,具体涉及一种特征提取方法、装置、存储介质及电子设备。
背景技术
在进行特征提取时,作为特征提取的对象,有些数据的数量会随着时间递增,现有的特征提取方式一般是对新增加的数据和已有的数据同时进行处理,作为最新的特征,或者直接从新数据中进行特征的提取,现有特征提取方法缺乏灵活性,导致特征提取的质量和效率低下。
发明内容
本申请实施例提供了一种特征提取方法、装置、存储介质及电子设备,能够提高特征提取的质量和效率。
第一方面,本申请实施例了提供了的一种特征提取方法,包括:
获取当前的第一全景数据矩阵和预设维数,其中,所述第一全景数据矩阵的数据量随时间递增;
从所述第一全景数据矩阵中获取维数等于所述预设维数的第二全景数据矩阵,其中,所述第二全景数据矩阵包含所述第一全景数据矩阵的最新增量全景数据;
计算所述第二全景数据矩阵的信息量;
若所述信息量小于预设阈值,则增大所述预设维数,并基于增大后的所述预设维数,返回执行从所述第一全景数据矩阵中获取维数等于所述预设维数的第二全景数据矩阵的步骤;
若所述信息量不小于所述预设阈值,则对所述第二全景数据矩阵进行分解,获取特征向量。
第二方面,本申请实施例了提供了的一种特征提取装置,包括:
数据获取模块,用于获取当前的第一全景数据矩阵和预设维数,其中,所述第一全景数据矩阵的数据量随时间递增;
矩阵提取模块,用于从所述第一全景数据矩阵中获取维数等于所述预设维数的第二全景数据矩阵,其中,所述第二全景数据矩阵包含所述第一全景数据矩阵的最新增量全景数据;
信息量计算模块,用于计算所述第二全景数据矩阵的信息量;
维数更新模块,用于若所述信息量小于预设阈值,则增大所述预设维数;
所述矩阵提取模块,还用于在所述维数更新模块增大所述预设维数后,基于增大后的所述预设维数,从所述第一全景数据矩阵中获取维数等于所述预设维数的第二全景数据矩阵;
特征提取模块,用于若所述信息量不小于所述预设阈值,则对所述第二全景数据矩阵进行分解,获取特征向量。
第三方面,本申请实施例提供的存储介质,其上存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如本申请任一实施例提供的特征提取方法。
第四方面,本申请实施例提供了一种电子设备,包括处理器和存储器,所述存储器有计算机程序,所述处理器通过调用所述计算机程序,用于执行如本申请任一实施例提供的特征提取方法。
本申请实施例提供的技术方案,获取数据量随时间递增的第一全景数据矩阵,以及预设维数,从第一全景数据矩阵从提取维数等于预设数列的第二全景数据矩阵,其中,获取到的第二全景数据矩阵的维数小于第一全景数据矩阵的维数,且其中包含有第一全景数据矩阵中的最新增量全景数据。接下来,计算第二全景数据矩阵的信息量,若信息量小于预设阈值,则增大预设维数,按照增大后的预设维数重新从第一全景数据矩阵中提取第二全景数据矩阵,直至第二全景数据矩阵的信息量不小于预设阈值,对第二全景数据矩阵进行矩阵分解,获取特征向量,这种特征提取方法,灵活性高,不仅作为特征提取对象的第二全景数据矩阵中包含有最新的增量数据,保证了特征提取的时效性,且由于第二全景数据中有丰富的特征信息,能够提高特征提取的质量,无需对全部的数据进行特征提取,有效降低特征提取的计算量。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的特征提取方法的全景感知架构示意图。
图2为本申请实施例提供的特征提取方法的流程示意图。
图3为本申请实施例提供的特征提取装置的结构示意图。
图4为本申请实施例提供的电子设备的第一种结构示意图。
图5为本申请实施例提供的电子设备的第二种结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本申请的保护范围。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
参考图1,图1为本申请实施例提供的特征提取方法的全景感知架构示意图。所述特征提取方法应用于电子设备。所述电子设备中设置有全景感知架构。所述全景感知架构为电子设备中用于实现所述特征提取方法的硬件和软件的集成。
其中,全景感知架构包括信息感知层、数据处理层、特征抽取层、情景建模层以及智能服务层。
信息感知层用于获取电子设备自身的信息或者外部环境中的信息。所述信息感知层可以包括多个传感器。例如,所述信息感知层包括距离传感器、磁场传感器、光线传感器、加速度传感器、指纹传感器、霍尔传感器、位置传感器、陀螺仪、惯性传感器、姿态感应器、气压计、心率传感器等多个传感器。
其中,距离传感器可以用于检测电子设备与外部物体之间的距离。磁场传感器可以用于检测电子设备所处环境的磁场信息。光线传感器可以用于检测电子设备所处环境的光线信息。加速度传感器可以用于检测电子设备的加速度数据。指纹传感器可以用于采集用户的指纹信息。霍尔传感器是根据霍尔效应制作的一种磁场传感器,可以用于实现电子设备的自动控制。位置传感器可以用于检测电子设备当前所处的地理位置。陀螺仪可以用于检测电子设备在各个方向上的角速度。惯性传感器可以用于检测电子设备的运动数据。姿态感应器可以用于感应电子设备的姿态信息。气压计可以用于检测电子设备所处环境的气压。心率传感器可以用于检测用户的心率信息。
数据处理层用于对信息感知层获取到的数据进行处理。例如,数据处理层可以对信息感知层获取到的数据进行数据清理、数据集成、数据变换、数据归约等处理。
其中,数据清理是指对信息感知层获取到的大量数据进行清理,以剔除无效数据和重复数据。数据集成是指将信息感知层获取到的多个单维度数据集成到一个更高或者更抽象的维度,以对多个单维度的数据进行综合处理。数据变换是指对信息感知层获取到的数据进行数据类型的转换或者格式的转换等,以使变换后的数据满足处理的需求。数据归约是指在尽可能保持数据原貌的前提下,最大限度的精简数据量。
特征抽取层用于对数据处理层处理后的数据进行特征抽取,以提取所述数据中包括的特征。提取到的特征可以反映出电子设备自身的状态或者用户的状态或者电子设备所处环境的环境状态等。
其中,特征抽取层可以通过过滤法、包装法、集成法等方法来提取特征或者对提取到的特征进行处理。
过滤法是指对提取到的特征进行过滤,以删除冗余的特征数据。包装法用于对提取到的特征进行筛选。集成法是指将多种特征提取方法集成到一起,以构建一种更加高效、更加准确的特征提取方法,用于提取特征。
情景建模层用于根据特征抽取层提取到的特征来构建模型,所得到的模型可以用于表示电子设备的状态或者用户的状态或者环境状态等。例如,情景建模层可以根据特征抽取层提取到的特征来构建关键值模型、模式标识模型、图模型、实体联系模型、面向对象模型等。
智能服务层用于根据情景建模层所构建的模型为用户提供智能化的服务。例如,智能服务层可以为用户提供基础应用服务,可以为电子设备进行***智能优化,还可以为用户提供个性化智能服务。
此外,全景感知架构中还可以包括多种算法,每一种算法都可以用于对数据进行分析处理,所述多种算法可以构成算法库。例如,所述算法库中可以包括马尔科夫算法、隐形狄利克雷分布算法、贝叶斯分类算法、支持向量机、K均值聚类算法、K近邻算法、条件随机场、残差网络、长短期记忆网络、卷积神经网络、循环神经网络等算法。
基于上述全景感知构架,数据处理层通过信息感知层和/或者其他方式采集的全景数据进行处理,比如,对获取的全景数据进行数据清理、数据集成等,又比如,获取待全景数据,并根据全景数据的时间信息和数据类型,构建第一全景数据矩阵。接下来,特征抽取层按照本申请实施例提供的特征提取方案从第一全景数据矩阵中提取特征。例如,获取数据量随时间递增的第一全景数据矩阵,以及预设维数;从第一全景数据矩阵从提取维数等于预设数列的第二全景数据矩阵,其中,获取到的第二全景数据矩阵的维数小于第一全景数据矩阵的维数,且其中包含有第一全景数据矩阵中的最新增量全景数据。接下来,计算第二全景数据矩阵的信息量,若信息量小于预设阈值,则增大预设维数,按照增大后的预设维数重新从第一全景数据矩阵中提取第二全景数据矩阵,直至第二全景数据矩阵的信息量不小于预设阈值,对第二全景数据矩阵进行矩阵分解,获取特征向量,这种特征提取方法,灵活性高,不仅作为特征提取对象的第二全景数据矩阵中包含有最新的增量数据,保证了特征提取的时效性,且由于第二全景数据中有丰富的特征信息,能够提高特征提取的质量,无需对全部的数据进行特征提取,有效降低特征提取的计算量。其中,抽取的特征可以作为情景建模层中的如贝叶斯分类算法、支持向量机等模型的输入数据,或者,抽取的特征还可以作为智能服务层中模型或者算法的输入。
本申请实施例提供一种特征提取方法,该特征提取方法的执行主体可以是本申请实施例提供的特征提取装置,或者集成了该特征提取装置的电子设备,其中该特征提取装置可以采用硬件或者软件的方式实现。其中,电子设备可以是智能手机、平板电脑、掌上电脑、笔记本电脑、或者台式电脑等设备。
请参照图2,图2为本申请实施例提供的特征提取方法的流程示意图。本申请实施例提供的特征提取方法的具体流程可以如下:
步骤101、获取当前的第一全景数据矩阵和预设维数,其中,所述第一全景数据矩阵的数据量随时间递增。
本申请实施例中的第一全景数据矩阵是根据全部全景数据构建的,其中,全景数据是指用户使用电子设备的过程中,由电子设备采集的相关数据,例如,全景数据主要包括环境数据、用户行为数据、终端运行数据以及设备硬件信息四大类数据,每一大类数据又包括多个类型的数据,其中,环境数据主要包括时间、地点、天气、声音、光照等,用户行为数据包括应用程序被打开的时间、地点以及开启频次等,终端运行数据包括终端的运行状态,如移动数据网络的开关状态、无线热点的连接状态、当前运行的应用程序等,设备硬件信息主要包括设备中集成的传感器采集到的数据,如运动传感器、光线传感器、温度传感器以及湿度传感器等采集的数据。
每个全景数据都有对应的数据类型和时间信息,时间信息为采集到该数据的时间,例如,按照记录的环境数据对应的时间、用户行为数据对应的行为发生时间、终端运行数据对应的时间等,对各个类型的全景数据进行存储。将收集的全景数据,按照数据类型和时间信息两个维度构成第一全景数据矩阵。
具体地,在获取当前的第一全景数据矩阵和预设维数之前,所述方法还包括:
获取待处理的全景数据,并根据所述全景数据的时间信息和数据类型,构建所述第一全景数据矩阵;
定时或者实时地获取增量全景数据,根据所述增量全景数据的时间信息和数据类型,使用所述增量全景数据更新所述第一全景数据矩阵。
以下实施例中,以第一全景数据矩阵的行为数据类型维度、列为时间维度为例进行说明。即第一全景数据矩阵的每一列为在一个时间点采集的全部类型的全景数据。用户使用电子设备的过程中,会不断的产生新的全景数据,电子设备实时或者定时地采集增量全景数据,更新第一全景数据矩阵,也就是说,第一全景数据矩阵的行数不变,列数会随着时间增加。
或者,在其他实施例中,第一全景数据矩阵的行为时间维度、列为数据类型维度,第一全景数据矩阵的行数会随时间递增,则预设维数为预设行数。
另外,在一些实施例中,可以根据实际情况设置第一全景数据矩阵的两个维度,只要该第一全景数据矩阵的一个维度或者两个维度的数据量会随着时间递增,即可适用于本实施例的特征提取方法。例如,在另一可选的实施例中,第一全景数据矩阵的一个维度为用户,随着用户数量的增加,第一全景数据矩阵的其中一个维度数会不断增加。
例如,全景数据包含有20种类型的数据,每2个小时采集一次全景数据,则要对某一时间点之前的五天的数据进行分析,则采集的全部全景数据可以构成大小为20×60的第一全景数据矩阵,在该时间点经过两天后,采集的全部全景数据可以构成大小为20×84的第一全景数据矩阵,即该矩阵中的数据量会随着时间递增。
在需要提取全景数据的特征时,获取当前的第一全景数据矩阵。同时,获取预设维数。若第一全景数据矩阵的行为数据类型维度、列为时间维度,则预设维数为预设列数。其中,预设维数用来从第一全景数据矩阵中选择包含有最新增量全景数据的数据矩阵。预设维数可以根据实际应用场景进行设置,且预设维数小于第一全景数据矩阵的维数,若预设维数为预设列数,假设根据最近三天的数据特征即可对用户行为进行分析,则可以将预设维数设置为36。
步骤102、从所述第一全景数据矩阵中获取维数等于所述预设维数的第二全景数据矩阵,其中,所述第二全景数据矩阵包含所述第一全景数据矩阵的最新增量全景数据。
获取到当前的第一全景数据矩阵和预设列数之后,根据预设列数从第一全景数据矩阵中获取包含有最新增量全景数据的第二全景数据矩阵。例如,第一全景数据矩阵的大小为m×k,预设列数为n,从第一全景数据矩阵中提取连续的n列数据,构成大小为m×n的第二全景数据矩阵,其中,n<k,且提取的n列数据为第一全景数据矩阵中时间最接近当前时间的连续n列数据。
进一步地,为了提高信息熵的计算准确度,以及后续矩阵分解的准确度,在根据所述全景数据的时间信息和数据类型,构建所述第一全景数据矩阵的步骤,以及使用所述增量全景数据更新所述第一全景数据矩阵的步骤之前,均对各类型的全景数据进行标准化处理。
步骤103、计算所述第二全景数据矩阵的信息量。
为了保证从第二全景数据矩阵中提取的特征向量有较高的质量,需要该矩阵中的数据包含足够多的信息量。接下来,通过计算第二全景数据矩阵的信息熵来衡量第二全景数据矩阵是否有足够的信息量。其中,信息熵能够用来衡量信息的价值,信息熵越大,则说明全景特征中包含的信息量越大,提取到的特征的质量越高,信息熵越小,则说明全景特征中包含的信息量越小,提取到的特征的质量越低。故在一些实施例中,步骤103、计算所述第二全景数据矩阵的信息量包括:计算所述第二全景数据矩阵的信息熵,用所述信息熵表示所述信息量。
其中,计算第二全景数据矩阵的信息熵的步骤包括:
获取所述第二全景数据矩阵中包含的m×n个数据,其中所述第二全景数据矩阵为m行、n列的矩阵;根据数据在对应的各个数据分段上的概率,计算所述m×n个数据的信息熵;将所述m×n个数据的信息熵的均值作为所述第二全景数据矩阵的信息熵。
具体地,可以按照如下公式计算第二全景数据矩阵的信息熵:
Figure BDA0002022016750000081
第二全景数据矩阵中包含的数据的总数量为m×n,Ii表示m×n个数据中的第i个数据的信息熵。d为第i个数据的数据分段数量,p(fij)表示第i个数据在其第j个数据分段上的概率大小。此处的概率数据可以通过大数据统计得到。例如,采集大量用户的各个类型的全景数据,针对每个类型的全景数据,统计该数据的所有可能取值,根据所有的可能取值,生成多个数据分段,以及数据在各个数据分段上的概率分布。在计算某一个数据的信息熵时,先确定该数据对应的数据分段,进而根据概率分布查找该数据分段对应的概率值,作为所述p(fij)。若第二全景数据矩阵中的数据大多分布在概率较小的数据分段,则其包含的信息价值较小,若直接从中提取特征向量,则得到的特征向量的质量也会较低,反之,若第二全景数据矩阵中的数据大多分布在概率较大的数据分段,则从矩阵中获取的特征向量的质量会较高。
步骤104、若所述信息量小于预设阈值,则增大所述预设维数,并基于增大后的所述预设维数,返回执行步骤102。
预先设置信息熵的判断阈值Igiven,该预设阈值一般为一个经验值,可以根据实际应用场景进行调整。其中,预设阈值越大,则说明对第二全景数据矩阵的信息量要求越高。若计算得到的信息熵I小于预设阈值Igiven,则增大所述预设维数,并基于增大后的所述预设维数,返回执行步骤102。
例如,第一全景数据矩阵的大小为20×84,预设列数为20,则第一次获取的第二全景数据矩阵的大小为20×20,该矩阵中包含有第一全景数据矩阵中的最新的20列数据。计算该矩阵中的20×20个数据的信息熵,若小于预设阈值Igiven,则增大预设列数,比如将预设列数增大为30,则再次从第一全景数据矩阵中提取最新的30列数据,生成大小为20×30的第二全景数据矩阵。按照这样的方式循环往复,直至生成的第二全景数据矩阵的信息熵不小于预设阈值Igiven,将此时的第二全景数据矩阵作为特征提取的直接对象。
其中,关于增大所述维数的方式,可以有多种实现方式,例如,在一些实施例中,若所述信息量小于预设阈值,则增大所述预设维数的步骤包括:若所述信息量小于预设阈值,则按照预设公差增大所述预设维数。比如,预设列数每次增加10,直至生成的第二全景数据矩阵的信息熵不小于预设阈值Igiven
或者,在其他实施例中,若所述信息量小于预设阈值,则增大所述预设维数的步骤包括:若所述信息量小于预设阈值,则计算所述信息量与所述预设阈值之间的差值;根据预设差值与维数增量之间的映射关系,查找与计算得到的差值对应的维数增量,其中,所述预设差值与维数增量之间的成正比;根据查找到的维数增量,增大所述预设维数。
当计算得到的信息量与预设阈值之间的差值较大时,需要增加更多的维数来提高第二全景数据矩阵的信息量,通过这种方式,可以提高扩充第二全景数据矩阵的速度,进而提高特征提取的效率。
步骤105、若所述信息量不小于所述预设阈值,则对所述第二全景数据矩阵进行分解,获取特征向量。
若计算得到的信息熵I不小于预设阈值Igiven,则说明第二全景数据矩阵中的信息量足以支撑提取高质量的特征向量。接下来采用矩阵分解的方式,从第二全景数据矩阵中提取特征向量,作为全景特征。
其中,针对大小为m×n的第二全景数据矩阵,可以采用特征值分解或者奇异值分解等方式获取特征向量,例如,在一些可选的实施例中,若需要从第二全景数据矩阵提取数据类型和时间两个维度的特征向量,则可以采用奇异值分解的方式对第二全景数据矩阵进行分解。
例如,在一些实施例中,所述第二全景数据矩阵的行为数据类型维度、列为时间维度;步骤105、若所述信息量不小于所述预设阈值,则对所述第二全景数据矩阵进行分解,获取特征向量包括:对所述第二全景数据矩阵进行奇异值分解,生成基于数据类型维度的第一特征向量和基于时间维度的第二特征向量。
具体地,对所述第二全景数据矩阵进行奇异值分解,生成基于数据类型维度的第一特征向量和基于时间维度的第二特征向量的步骤包括:
对所述第二全景数据矩阵进行奇异值分解,获取m×m的左奇异矩阵和n×n的右奇异矩阵;提取所述左奇异矩阵的列向量作为所述第一特征向量,并提取所述右奇异矩阵的列向量作为所述第二特征向量。
奇异值分解的计算公式如下:M=D*Z*T,即将一个复杂矩阵用更小更简单的几个子矩阵的相乘来表示,这些小矩阵能够描述矩阵所体现出的重要特性,因此,本申请实施例中采用奇异值分解的方式来从第二全景数据矩阵中获取特征向量。其中,M为第二全景数据矩阵,D为分解得到的左奇异矩阵,T为分解得到的右奇异矩阵,上述左奇异矩阵和右奇异矩阵均为方阵,且其里面的向量正交。Z是一个除了对角线上的元素之外的元素都为0的矩阵,其中,对角线上的元素称为奇异值。
例如,第二全景数据矩阵的大小为m×n,则分解得到的左奇异矩阵的大小为m×m,右奇异矩阵的大小为n×n。此时,提取左奇异矩阵中的m个列向量作为上述第一特征向量,这m个向量为第二全景数据矩阵在数据类型维度上的特征向量,体现矩阵中的数据在数据类型维度上的特性;提取右奇异矩阵中的n个列向量作为上述第二特征向量,这n个列向量为第二全景数据矩阵在时间维度上的特征向量,体现矩阵中的数据在时间维度上的特性。
上述实施例中,第一全景数据矩阵和第二全景数据矩阵的大小只为举例说明,为了便于说明,列举了较小的数值,在实际应用中,对用户的全景类别进行分析时,全景数据的采集时间间隔较短,生成的第一全景数据矩阵会有非常大的数据量,通过本申请实施例中的特征提取方法,有效地降低了特征提取的计算量;并且采用预设维数与信息熵的方法,实现矩阵大小的自适应调整,选择既能保证特征质量,又能保证提取特征的时效性。
此外,需要说明的是,提取全景数据进行全景类别的识别的场景只为举例说明,本申请实施例的特征提取方式可以应用于除此之外的多种场景。
具体实施时,本申请不受所描述的各个步骤的执行顺序的限制,在不产生冲突的情况下,某些步骤还可以采用其它顺序进行或者同时进行。
由上可知,本申请实施例提出的特征提取方法,获取数据量随时间递增的第一全景数据矩阵,以及预设维数,从第一全景数据矩阵从提取维数等于预设数列的第二全景数据矩阵,其中,获取到的第二全景数据矩阵的维数小于第一全景数据矩阵的维数,且其中包含有第一全景数据矩阵中的最新增量全景数据。接下来,计算第二全景数据矩阵的信息量,若信息量小于预设阈值,则增大预设维数,按照增大后的预设维数重新从第一全景数据矩阵中提取第二全景数据矩阵,直至第二全景数据矩阵的信息量不小于预设阈值,对第二全景数据矩阵进行矩阵分解,获取特征向量,这种特征提取方法,灵活性高,不仅作为特征提取对象的第二全景数据矩阵中包含有最新的增量数据,保证了特征提取的时效性,且由于第二全景数据中有丰富的特征信息,能够提高特征提取的质量,无需对全部的数据进行特征提取,有效降低特征提取的计算量。
在一实施例中还提供了一种特征提取装置。请参阅图3,图3为本申请实施例提供的特征提取装置400的结构示意图。其中该特征提取装置400应用于电子设备,该特征提取装置400包括数据获取模块401、矩阵提取模块402、信息量计算模块403、维数更新模块404以及特征提取模块404,如下:
数据获取模块401,用于获取当前的第一全景数据矩阵和预设维数,其中,所述第一全景数据矩阵的数据量随时间递增;
矩阵提取模块402,用于从所述第一全景数据矩阵中获取维数等于所述预设维数的第二全景数据矩阵,其中,所述第二全景数据矩阵包含所述第一全景数据矩阵的最新增量全景数据;
信息量计算模块403,用于计算所述第二全景数据矩阵的信息量;
维数更新模块404,用于若所述信息量小于预设阈值,则增大所述预设维数;
矩阵提取模块402,还用于在维数更新模块404增大所述预设维数后,基于增大后的所述预设维数,从所述第一全景数据矩阵中获取维数等于所述预设维数的第二全景数据矩阵;
特征提取模块405,用于若所述信息量不小于所述预设阈值,则对所述第二全景数据矩阵进行分解,获取特征向量。
在一些实施例中,该特征提取装置还包括矩阵生成模块,矩阵生成模块用于获取待处理的全景数据,并根据所述全景数据的时间信息和数据类型,构建所述第一全景数据矩阵;定时或者实时地获取增量全景数据,根据所述增量全景数据的时间信息和数据类型,使用所述增量全景数据更新所述第一全景数据矩阵。
在一些实施例中,信息量计算模块403还用于:计算所述第二全景数据矩阵的信息熵,用所述信息熵表示所述信息量。
在一些实施例中,信息量计算模块403还用于:获取所述第二全景数据矩阵中包含的m×n个数据,其中所述第二全景数据矩阵为m行、n列的矩阵;
根据数据在对应的各个数据分段上的概率,计算所述m×n个数据的信息熵;
以及,将所述m×n个数据的信息熵的均值作为所述第二全景数据矩阵的信息熵。
在一些实施例中,所述第二全景数据矩阵的行为数据类型维度、列为时间维度;特征提取模块405还用于:对所述第二全景数据矩阵进行奇异值分解,生成基于数据类型维度的第一特征向量和基于时间维度的第二特征向量。
在一些实施例中,特征提取模块405还用于:对所述第二全景数据矩阵进行奇异值分解,获取m×m的左奇异矩阵和n×n的右奇异矩阵;提取所述左奇异矩阵的列向量作为所述第一特征向量,并提取所述右奇异矩阵的列向量作为所述第二特征向量。
在一些实施例中,维数更新模块404还用于:若所述信息量小于预设阈值,则按照预设公差增大所述预设维数。
具体实施时,以上各个模块可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个模块的具体实施可参见前面的方法实施例,在此不再赘述。
由上可知,本申请实施例提出的特征提取装置,获取数据量随时间递增的第一全景数据矩阵,以及预设维数,从第一全景数据矩阵从提取维数等于预设数列的第二全景数据矩阵,其中,获取到的第二全景数据矩阵的维数小于第一全景数据矩阵的维数,且其中包含有第一全景数据矩阵中的最新增量全景数据。接下来,计算第二全景数据矩阵的信息量,若信息量小于预设阈值,则增大预设维数,按照增大后的预设维数重新从第一全景数据矩阵中提取第二全景数据矩阵,直至第二全景数据矩阵的信息量不小于预设阈值,对第二全景数据矩阵进行矩阵分解,获取特征向量,这种特征提取方法,灵活性高,不仅作为特征提取对象的第二全景数据矩阵中包含有最新的增量数据,保证了特征提取的时效性,且由于第二全景数据中有丰富的特征信息,能够提高特征提取的质量,无需对全部的数据进行特征提取,有效降低特征提取的计算量。
本申请实施例还提供一种电子设备。所述电子设备可以是智能手机、平板电脑等设备。如图4所示,图4为本申请实施例提供的电子设备的第一种结构示意图。电子设备300包括处理器301和存储器302。其中,处理器301与存储器302电性连接。
处理器301是电子设备300的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或调用存储在存储器302内的计算机程序,以及调用存储在存储器302内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。
在本实施例中,电子设备300中的处理器301会按照如下的步骤,将一个或一个以上的计算机程序的进程对应的指令加载到存储器302中,并由处理器301来运行存储在存储器302中的计算机程序,从而实现各种功能:
获取当前的第一全景数据矩阵和预设维数,其中,所述第一全景数据矩阵的数据量随时间递增;
从所述第一全景数据矩阵中获取维数等于所述预设维数的第二全景数据矩阵,其中,所述第二全景数据矩阵包含所述第一全景数据矩阵的最新增量全景数据;
计算所述第二全景数据矩阵的信息量;
若所述信息量小于预设阈值,则增大所述预设维数,并基于增大后的所述预设维数,返回执行从所述第一全景数据矩阵中获取维数等于所述预设维数的第二全景数据矩阵的步骤;
若所述信息量不小于所述预设阈值,则对所述第二全景数据矩阵进行分解,获取特征向量。
在一些实施例中,获取当前的第一全景数据矩阵和预设维数的步骤之前,处理器301执行如下步骤:
获取待处理的全景数据,并根据所述全景数据的时间信息和数据类型,构建所述第一全景数据矩阵;
定时或者实时地获取增量全景数据,根据所述增量全景数据的时间信息和数据类型,使用所述增量全景数据更新所述第一全景数据矩阵。
在一些实施例中,计算所述第二全景数据矩阵的信息量时,处理器301执行如下步骤:计算所述第二全景数据矩阵的信息熵,用所述信息熵表示所述信息量。
在一些实施例中,计算所述第二全景数据矩阵的信息熵时,处理器301执行如下步骤:
获取所述第二全景数据矩阵中包含的m×n个数据,其中所述第二全景数据矩阵为m行、n列的矩阵;
根据数据在对应的各个数据分段上的概率,计算所述m×n个数据的信息熵;
将所述m×n个数据的信息熵的均值作为所述第二全景数据矩阵的信息熵。
在一些实施例中,所述第二全景数据矩阵的行为数据类型维度、列为时间维度;对所述第二全景数据矩阵进行分解,获取特征向量时,处理器301执行如下步骤:
对所述第二全景数据矩阵进行奇异值分解,生成基于数据类型维度的第一特征向量和基于时间维度的第二特征向量。
在一些实施例中,对所述第二全景数据矩阵进行奇异值分解,生成基于数据类型维度的第一特征向量和基于时间维度的第二特征向量时,处理器301执行如下步骤:
对所述第二全景数据矩阵进行奇异值分解,获取m×m的左奇异矩阵和n×n的右奇异矩阵;
提取所述左奇异矩阵的列向量作为所述第一特征向量,并提取所述右奇异矩阵的列向量作为所述第二特征向量。
在一些实施例中,若所述信息量小于预设阈值,则增大所述预设维数时,处理器301执行如下步骤:
若所述信息量小于预设阈值,则按照预设公差增大所述预设维数。
存储器302可用于存储计算机程序和数据。存储器302存储的计算机程序中包含有可在处理器中执行的指令。计算机程序可以组成各种功能模块。处理器301通过调用存储在存储器302的计算机程序,从而执行各种功能应用以及数据处理。
在一些实施例中,如图5所示,图5为本申请实施例提供的电子设备的第二种结构示意图。电子设备300还包括:射频电路303、显示屏304、控制电路305、输入单元306、音频电路307、传感器308以及电源309。其中,处理器301分别与射频电路303、显示屏304、控制电路305、输入单元306、音频电路307、传感器308以及电源309电性连接。
射频电路303用于收发射频信号,以通过无线通信与网络设备或其他电子设备进行通信。
显示屏304可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口,这些图形用户接口可以由图像、文本、图标、视频和其任意组合来构成。
控制电路305与显示屏304电性连接,用于控制显示屏304显示信息。
输入单元306可用于接收输入的数字、字符信息或用户特征信息(例如指纹),以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。其中,输入单元306可以包括指纹识别模组。
音频电路307可通过扬声器、传声器提供用户与电子设备之间的音频接口。其中,音频电路307包括麦克风。所述麦克风与所述处理器301电性连接。所述麦克风用于接收用户输入的语音信息。
传感器308用于采集外部环境信息。传感器308可以包括环境亮度传感器、加速度传感器、陀螺仪等传感器中的一种或多种。
电源309用于给电子设备300的各个部件供电。在一些实施例中,电源309可以通过电源管理***与处理器301逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。
尽管图5中未示出,电子设备300还可以包括摄像头、蓝牙模块等,在此不再赘述。
由上可知,本申请实施例提供了一种电子设备,所述电子设备获取数据量随时间递增的第一全景数据矩阵,以及预设维数,从第一全景数据矩阵从提取维数等于预设数列的第二全景数据矩阵,其中,获取到的第二全景数据矩阵的维数小于第一全景数据矩阵的维数,且其中包含有第一全景数据矩阵中的最新增量全景数据。接下来,计算第二全景数据矩阵的信息量,若信息量小于预设阈值,则增大预设维数,按照增大后的预设维数重新从第一全景数据矩阵中提取第二全景数据矩阵,直至第二全景数据矩阵的信息量不小于预设阈值,对第二全景数据矩阵进行矩阵分解,获取特征向量,这种特征提取方法,灵活性高,不仅作为特征提取对象的第二全景数据矩阵中包含有最新的增量数据,保证了特征提取的时效性,且由于第二全景数据中有丰富的特征信息,能够提高特征提取的质量,无需对全部的数据进行特征提取,有效降低特征提取的计算量。
本申请实施例还提供一种存储介质,所述存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,所述计算机执行上述任一实施例所述的特征提取方法。
需要说明的是,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过计算机程序来指令相关的硬件来完成,所述计算机程序可以存储于计算机可读存储介质中,所述存储介质可以包括但不限于:只读存储器(ROM,Read OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁盘或光盘等。
此外,本申请中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、***、产品或设备没有限定于已列出的步骤或模块,而是某些实施例还包括没有列出的步骤或模块,或某些实施例还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
以上对本申请实施例所提供的特征提取方法、装置、存储介质及电子设备进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种特征提取方法,其特征在于,包括:
获取当前的第一全景数据矩阵和预设维数,其中,所述第一全景数据矩阵的数据量随时间递增;
从所述第一全景数据矩阵中获取维数等于所述预设维数的第二全景数据矩阵,其中,所述第二全景数据矩阵包含所述第一全景数据矩阵的最新增量全景数据;
计算所述第二全景数据矩阵的信息量;
若所述信息量小于预设阈值,则增大所述预设维数,并基于增大后的所述预设维数,返回执行从所述第一全景数据矩阵中获取维数等于所述预设维数的第二全景数据矩阵的步骤;
若所述信息量不小于所述预设阈值,则对所述第二全景数据矩阵进行分解,获取特征向量。
2.如权利要求1所述的特征提取方法,其特征在于,所述获取当前的第一全景数据矩阵和预设维数的步骤之前,还包括:
获取待处理的全景数据,并根据所述全景数据的时间信息和数据类型,构建所述第一全景数据矩阵;
定时或者实时地获取增量全景数据,根据所述增量全景数据的时间信息和数据类型,使用所述增量全景数据更新所述第一全景数据矩阵。
3.如权利要求1所述的特征提取方法,其特征在于,所述计算所述第二全景数据矩阵的信息量的步骤包括:
计算所述第二全景数据矩阵的信息熵,用所述信息熵表示所述信息量。
4.如权利要求3所述的特征提取方法,其特征在于,所述计算所述第二全景数据矩阵的信息熵的步骤包括:
获取所述第二全景数据矩阵中包含的m×n个数据,其中所述第二全景数据矩阵为m行、n列的矩阵;
根据数据在对应的各个数据分段上的概率,计算所述m×n个数据的信息熵;
将所述m×n个数据的信息熵的均值作为所述第二全景数据矩阵的信息熵。
5.如权利要求4所述的特征提取方法,其特征在于,所述第二全景数据矩阵的行为数据类型维度、列为时间维度;对所述第二全景数据矩阵进行分解,获取特征向量的步骤包括:
对所述第二全景数据矩阵进行奇异值分解,生成基于数据类型维度的第一特征向量和基于时间维度的第二特征向量。
6.如权利要求5所述的特征提取方法,其特征在于,所述对所述第二全景数据矩阵进行奇异值分解,生成基于数据类型维度的第一特征向量和基于时间维度的第二特征向量的步骤包括:
对所述第二全景数据矩阵进行奇异值分解,获取m×m的左奇异矩阵和n×n的右奇异矩阵;
提取所述左奇异矩阵的列向量作为所述第一特征向量,并提取所述右奇异矩阵的列向量作为所述第二特征向量。
7.如权利要求1所述的特征提取方法,其特征在于,若所述信息量小于预设阈值,则增大所述预设维数的步骤包括:
若所述信息量小于预设阈值,则按照预设公差增大所述预设维数。
8.一种特征提取装置,其特征在于,包括:
数据获取模块,用于获取当前的第一全景数据矩阵和预设维数,其中,所述第一全景数据矩阵的数据量随时间递增;
矩阵提取模块,用于从所述第一全景数据矩阵中获取维数等于所述预设维数的第二全景数据矩阵,其中,所述第二全景数据矩阵包含所述第一全景数据矩阵的最新增量全景数据;
信息量计算模块,用于计算所述第二全景数据矩阵的信息量;
维数更新模块,用于若所述信息量小于预设阈值,则增大所述预设维数;
所述矩阵提取模块,还用于在所述维数更新模块增大所述预设维数后,基于增大后的所述预设维数,从所述第一全景数据矩阵中获取维数等于所述预设维数的第二全景数据矩阵;
特征提取模块,用于若所述信息量不小于所述预设阈值,则对所述第二全景数据矩阵进行分解,获取特征向量。
9.一种存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在计算机上运行时,使得所述计算机执行如权利要求1至7任一项所述的特征提取方法。
10.一种电子设备,包括处理器和存储器,所述存储器存储有计算机程序,其特征在于,所述处理器通过调用所述计算机程序,用于执行如权利要求1至7任一项所述的特征提取方法。
CN201910282155.1A 2019-04-09 2019-04-09 特征提取方法、装置、存储介质及电子设备 Active CN111797860B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910282155.1A CN111797860B (zh) 2019-04-09 2019-04-09 特征提取方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910282155.1A CN111797860B (zh) 2019-04-09 2019-04-09 特征提取方法、装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN111797860A true CN111797860A (zh) 2020-10-20
CN111797860B CN111797860B (zh) 2023-09-26

Family

ID=72805308

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910282155.1A Active CN111797860B (zh) 2019-04-09 2019-04-09 特征提取方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN111797860B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112347104A (zh) * 2020-11-06 2021-02-09 中国人民大学 一种基于深度强化学习的列存储布局优化方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104361238A (zh) * 2014-11-17 2015-02-18 北京信息科技大学 一种基于信息熵改进pca的故障敏感特征提取方法
CN107665479A (zh) * 2017-09-05 2018-02-06 平安科技(深圳)有限公司 一种特征提取方法、全景拼接方法及其装置、设备及计算机可读存储介质
CN107852466A (zh) * 2016-05-13 2018-03-27 深圳市赛亿科技开发有限公司 一种实现全景图像拼接的方法及***
CN108230454A (zh) * 2017-12-28 2018-06-29 瑞庭网络技术(上海)有限公司 一种全景图片的切图方法、装置及存储介质
CN108776673A (zh) * 2018-05-23 2018-11-09 哈尔滨工业大学 关系模式的自动转换方法、装置及存储介质
CN109272442A (zh) * 2018-09-27 2019-01-25 百度在线网络技术(北京)有限公司 全景球面图像的处理方法、装置、设备和存储介质
CN109460794A (zh) * 2018-11-19 2019-03-12 广东工业大学 一种数据特征提取方法、***及电子设备和存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104361238A (zh) * 2014-11-17 2015-02-18 北京信息科技大学 一种基于信息熵改进pca的故障敏感特征提取方法
CN107852466A (zh) * 2016-05-13 2018-03-27 深圳市赛亿科技开发有限公司 一种实现全景图像拼接的方法及***
CN107665479A (zh) * 2017-09-05 2018-02-06 平安科技(深圳)有限公司 一种特征提取方法、全景拼接方法及其装置、设备及计算机可读存储介质
CN108230454A (zh) * 2017-12-28 2018-06-29 瑞庭网络技术(上海)有限公司 一种全景图片的切图方法、装置及存储介质
CN108776673A (zh) * 2018-05-23 2018-11-09 哈尔滨工业大学 关系模式的自动转换方法、装置及存储介质
CN109272442A (zh) * 2018-09-27 2019-01-25 百度在线网络技术(北京)有限公司 全景球面图像的处理方法、装置、设备和存储介质
CN109460794A (zh) * 2018-11-19 2019-03-12 广东工业大学 一种数据特征提取方法、***及电子设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
范雪莉等: "基于互信息的主成分分析用于声场景分类", 声学技术 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112347104A (zh) * 2020-11-06 2021-02-09 中国人民大学 一种基于深度强化学习的列存储布局优化方法

Also Published As

Publication number Publication date
CN111797860B (zh) 2023-09-26

Similar Documents

Publication Publication Date Title
CN109299315B (zh) 多媒体资源分类方法、装置、计算机设备及存储介质
CN111797288B (zh) 数据筛选方法、装置、存储介质及电子设备
CN111797854B (zh) 场景模型建立方法、装置、存储介质及电子设备
CN111796979B (zh) 数据采集策略的确定方法、装置、存储介质及电子设备
CN113505256B (zh) 特征提取网络训练方法、图像处理方法及装置
CN111797861A (zh) 信息处理方法、装置、存储介质及电子设备
CN111797851A (zh) 特征提取方法、装置、存储介质及电子设备
CN111797849B (zh) 用户活动识别方法、装置、存储介质及电子设备
CN111800445B (zh) 消息推送方法、装置、存储介质及电子设备
CN111797079A (zh) 数据处理方法、装置、存储介质及电子设备
CN111797860B (zh) 特征提取方法、装置、存储介质及电子设备
CN111798019B (zh) 意图预测方法、装置、存储介质及电子设备
CN111797874B (zh) 行为预测方法、装置、存储介质及电子设备
CN111797261A (zh) 特征提取方法、装置、存储介质及电子设备
CN111797986A (zh) 数据处理方法、装置、存储介质及电子设备
CN112948763B (zh) 件量预测方法、装置、电子设备及存储介质
CN111797880A (zh) 数据处理方法、装置、存储介质及电子设备
CN111797876B (zh) 数据分类方法、装置、存储介质及电子设备
CN111796916A (zh) 数据分发方法、装置、存储介质及服务器
CN111797877B (zh) 数据处理方法、装置、存储介质及电子设备
CN111796314A (zh) 信息处理方法、装置、存储介质及电子设备
CN111800537B (zh) 终端使用状态的评估方法、装置、存储介质及电子设备
CN111797863A (zh) 模型训练方法、数据处理方法、装置、存储介质及设备
CN111800287B (zh) 数据处理方法、装置、存储介质及电子设备
CN111797391A (zh) 高风险进程的处理方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant