CN110852442A - 一种行为辨识及模型训练的方法和装置 - Google Patents

一种行为辨识及模型训练的方法和装置 Download PDF

Info

Publication number
CN110852442A
CN110852442A CN201911036281.5A CN201911036281A CN110852442A CN 110852442 A CN110852442 A CN 110852442A CN 201911036281 A CN201911036281 A CN 201911036281A CN 110852442 A CN110852442 A CN 110852442A
Authority
CN
China
Prior art keywords
entity object
behavior
model
training
sensor data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911036281.5A
Other languages
English (en)
Other versions
CN110852442B (zh
Inventor
张慧英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN201911036281.5A priority Critical patent/CN110852442B/zh
Publication of CN110852442A publication Critical patent/CN110852442A/zh
Application granted granted Critical
Publication of CN110852442B publication Critical patent/CN110852442B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • User Interface Of Digital Computer (AREA)
  • Image Analysis (AREA)

Abstract

本说明书实施例提供一种行为辨识及模型训练的方法和装置,其中,所述方法包括:获取训练数据,训练数据包括:具有行为交互关联的不同实体对象分别对应的传感器数据以及实体对象的隐状态;所述传感器数据是在不同实体对象的行为交互过程中采集得到;初始化多个模型参数,每个模型参数包括不同实体对象对应的参数,且模型参数中的状态转移概率包括:同一实体对象的隐状态之间的转移概率以及不同实体对象的隐状态之间的转移概率;根据模型参数进行模型训练,其中,在模型训练的演绎过程中,若一个实体对象在目标时刻缺失对应的隐状态,则使用实体对象与另一实体对象之间的隐状态的转移概率;并且当达到模型训练结束条件时,获得行为辨识模型。

Description

一种行为辨识及模型训练的方法和装置
技术领域
本说明书涉及机器学习技术领域,特别涉及一种行为辨识及模型训练的方法和装置。
背景技术
随着各种家庭娱乐设备、可穿戴设备的广泛使用,产生了大量可用于行为识别的数据。例如,在人与设备交互的场景中,如,用户使用热水器烧水,或者用户使用清洁设备打扫卫生等,可以通过温度传感器、电容传感器等多种传感器采集用户在对设备使用过程中产生的数据,进而识别用户进行的行为。
相关技术中,在根据传感器采集的数据训练用于进行行为识别的模型时,可以对训练集样本的传感器数据进行人工打标,比如,为采集的某条传感器数据打标为对应的用户行为是烧水,即这是用户在进行烧水行为时产生的。这种人工打标的方式效率较低,并且训练得到的模型在行为识别的效果上也不够好。
发明内容
有鉴于此,本说明书一个或多个实施例提供一种行为辨识及模型训练的方法和装置,以提高行为辨识的效率和准确率。
具体地,本说明书一个或多个实施例是通过如下技术方案实现的:
第一方面,提供一种行为辨识模型的训练方法,所述方法基于耦合隐马尔科夫链进行所述行为辨识模型的训练;所述方法包括:
获取训练数据,所述训练数据包括:具有行为交互关联的不同实体对象分别对应的传感器数据、以及所述实体对象的隐状态;所述传感器数据是在所述不同实体对象的行为交互过程中采集得到;
初始化多个模型参数,每个所述模型参数包括所述不同实体对象对应的参数,且所述模型参数中的状态转移概率包括:同一实体对象的隐状态之间的转移概率、以及不同实体对象的隐状态之间的转移概率;
根据所述模型参数进行模型训练,其中,在模型训练的演绎过程中,若一个实体对象在目标时刻缺失对应的隐状态,则使用所述实体对象与另一实体对象之间的隐状态的转移概率;并且当达到模型训练结束条件时,获得所述行为辨识模型。
第二方面,提供一种行为辨识方法,所述方法包括:
获取在目标时刻采集的传感器数据,所述传感器数据包括:具有行为交互关联的不同实体对象分别对应的传感器数据;且所述传感器数据是在所述不同实体对象的行为交互过程中采集得到;
通过本公开任一所述的行为辨识模型的训练方法训练得到的模型,确定在所述目标时刻所述传感器数据对应的隐状态最佳路径;
根据所述隐状态最佳路径,确定所述传感器数据对应的实体对象行为。
第三方面,提供一种行为辨识模型的训练装置,所述装置包括:
数据获取模块,用于获取训练数据,所述训练数据包括:具有行为交互关联的不同实体对象分别对应的传感器数据、以及所述实体对象的隐状态;所述传感器数据是在所述不同实体对象的行为交互过程中采集得到;
参数处理模块,用于初始化多个模型参数,每个所述模型参数包括所述不同实体对象对应的参数,且所述模型参数中的状态转移概率包括:同一实体对象的隐状态之间的转移概率、以及不同实体对象的隐状态之间的转移概率;
训练处理模块,用于根据所述模型参数进行模型训练,其中,在模型训练的演绎过程中,若一个实体对象在目标时刻缺失对应的隐状态,则使用所述实体对象与另一实体对象之间的隐状态的转移概率;并且当达到模型训练结束条件时,获得所述行为辨识模型。
第四方面,提供一种行为辨识装置,所述装置包括:
数据采集模块,用于获取在目标时刻采集的传感器数据,所述传感器数据包括:具有行为交互关联的不同实体对象分别对应的传感器数据;且所述传感器数据是在所述不同实体对象的行为交互过程中采集得到;
路径确定模块,用于通过本公开任一实施例所述的行为辨识模型的训练装置训练得到的模型,确定在所述目标时刻传感器数据对应的隐状态最佳路径;
行为确定模块,用于根据所述隐状态最佳路径,确定所述传感器数据对应的实体对象行为。
第五方面,提供一种行为辨识设备,所述设备包括存储器、处理器,所述存储器用于存储可在处理器上运行的计算机指令;所述处理器用于在执行所述计算机指令时实现本公开任一实施例所述的行为辨识方法。
本说明书一个或多个实施例的行为辨识及模型训练的方法和装置,通过在模型训练的演绎过程中,当一个实体对象的隐状态缺失时,只使用了不同实体对象的隐状态之间的转移概率,从而使得模型训练的参数减少,提高了模型训练的效率;并且,该方式也更符合实际交互场景,模型的准确率得到提高。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书至少一个实施例提供的一种模型原理示意图;
图2为本说明书至少一个实施例提供的一种行为辨识模型的训练方法的流程图;
图3为本说明书至少一个实施例提供的一种行为辨识方法的流程;
图4为本说明书至少一个实施例提供的一种行为辨识模型的训练装置;
图5为本说明书至少一个实施例提供的一种行为辨识装置。
具体实施方式
为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
如下本说明书至少一个实施例提供的行为辨识模型的训练,是基于耦合隐马尔科夫链进行,即基于耦合隐马尔科夫链训练一个行为辨识模型,并且,该方法中对传统的耦合隐马尔科夫链进行了稍微的改进,属于改进后的耦合隐马尔科夫链。
模型的训练
基于耦合隐马尔科夫链的模型,待训练的参数包括如下:状态转移概率A、输出概率B、初始概率π。即模型的参数包括A、B和π,估计和计算这些参数的过程称之为模型的训练。其中,初始概率表示模型在初始时每个隐状态的概率,输出概率表示依赖隐状态的观察值的生成概率,状态转移概率表示不同隐状态之间的转移概率。
本说明书至少一个实施例中,行为辨识的应用场景中涉及到不同实体对象之间的行为交互。举例来说,包括但不限于如下示例:
例如,当人开门或关门时,“人”作为一个实体对象,“门”作为一个实体对象,这两个实体对象之间具有行为交互,即人开关了门。
又例如,当人打开冰箱或者关闭冰箱时,“人”作为一个实体对象,“冰箱”作为一个实体对象,这两个实体对象之间具有行为交互,即人开关了冰箱。
上述两个实体对象可以称为具有行为交互关联的不同实体对象。
可以在各个实体对象上都安装传感器,通过传感器采集实体对象在进行行为交互时产生的数据。示例性的,可以在人的胳膊、腰部、脚部、腿部等身体部位安装合适的传感器,并且也在冰箱或者门等设备上也安装传感器,用于采集设备或人在行为交互的过程中产生的数据。
例如,人在用热水器烧水时,安装在人的胳膊等位置的传感器在人的行动过程中可以采集到输出数据,热水器在该过程中水的温度会升高,温度传感器可以采集到不断上升的温度。
本实施例不再详举其他示例,总之,通过人进行一些日常活动(如,开关洗碗柜、开关抽屉、喝水、打扫桌子,等),同时通过人和设备上安装的传感器,可以采集到分别属于人和设备的传感器数据。
请参见图1的示例,图1中的观察值序列11可以是人身上的传感器采集的传感器数据,该观察值序列11中的各个观察值(例如,观察值12、观察值13等)是分别在不同的时刻采集得到的传感器数据。观察值序列16可以是设备(例如,冰箱等)上安装的传感器采集的在不同时刻得到的传感器数据。
如图1所示,隐状态序列14可以是人对应的各个隐状态,即隐状态序列14和观察值序列11属于同一实体对象,该对象是人。而隐状态序列15可以是设备对应的各个隐状态,该隐状态序列15与观察值序列16也属于同一实体对象,该对象是设备。
如上述,该基于耦合隐马尔科夫链的待训练模型中,模型的训练即要学习到状态转移概率、输出概率和初始概率这些参数。由图1可见的是,这些参数都涉及到两个实体对象(本实施例以两个实体对象为例,不局限于此),暂且假设该两个实体对象分别称为第一实体对象和第二实体对象。
例如,初始概率包括第一实体对象的初始概率和第二实体对象的初始概率,输出概率包括:第一实体对象的观察值和隐状态之间的输出概率、以及第二实体对象的观察值和隐状态之间的输出概率。
如下,本实施例定义模型的参数如下:
Figure BDA0002251590470000061
Figure BDA0002251590470000062
Figure BDA0002251590470000063
如上,其中的c的取值包括1、2,当c取值为1和c取值为2时,分别表示参数属于不同的实体对象。即模型参数中的状态转移概率、输出概率和初始概率均包括不同实体对象对应的参数。s是其中一个隐状态,o是观察值。其中,s表示一个隐含状态,si∈隐含状态全集,即{s1,s2,s3,...,sN};o表示一个观察值,oi∈观察值全集,即{v1,v2,v3,...,vM};c或c’表示所属对象,c∈{1,2}且c’∈{1,2};
Figure BDA0002251590470000064
表示在时间点t,对象c的观察值;
Figure BDA0002251590470000065
表示在时间点t,对象c的隐含状态,
Figure BDA0002251590470000066
等同理表示时间点t-1,对象c′的隐含状态;
Figure BDA0002251590470000067
表示,处于隐含状态i的对象c转移到处于隐含状态j的对象c’之间的转移概率(当c=c’则表示同一对象之间的转移概率,否则表示两个不同对象交叉作用的转移概率;);表示对象c处于某一隐含状态si时,可观察到观察值为vk的概率。
其中的i表示交互状态集。这里所述的交互状态是指具有转移交互关系且分别属于不同实体对象的两个隐状态,例如,I(c,c′)表示这两个隐状态之间有交互且属于不同实体对象,是一对交互状态。请参见图1的示意,隐状态17属于实体对象人,隐状态18属于实体对象设备,这两个隐状态之间具有连接线,该连接线表示这是一对交互状态,即两个实体对象的隐状态之间具有相互影响。
本实施例的模型参数中,状态转移概率包括两种:一种是同一实体对象的隐状态之间的转移概率,比如,图1中示意的隐状态19与隐状态20之间的转移概率;另一种是不同实体对象的隐状态之间的转移概率,比如,图1中示意的隐状态19与隐状态21之间的转移概率。
此外,图1中的属于同一实体对象的观察值与隐状态之间的概率即输出概率,如观察值12与隐状态17之间连接线表示的概率。
在模型训练时,就是要求解上述的输出概率、状态转移概率和初始概率这些参数。其中,基于耦合隐马尔科夫链的模型训练,可以采用有监督训练,也可以采用无监督训练。如下的实施例以无监督训练为例。
图2示例了本说明书至少一个实施例提供的行为辨识模型的训练方法的流程图,如图2所示,该训练方法可以包括如下处理:
在步骤200中,获取训练数据,所述训练数据包括:具有行为交互关联的不同实体对象分别对应的传感器数据、以及所述实体对象的隐状态;所述传感器数据是在所述不同实体对象的行为交互过程中采集得到。
本步骤中,训练数据可以是按照前述提到的方法采集得到,比如,在人开关冰箱的过程中采集得到。该训练数据中包括不同实体对象的传感器数据。
其中,所述的实体对象的隐状态,可以是触发产生所述的传感器数据的状态。示例性的,当人行走时,设置在人的腿部和脚部的传感器将会采集到相应的数值,那么,传感器采集的数值就是观察值,而人的“行走”就相当于一种隐状态,正是因为行走才导致输出了传感器数据。各个实体对象的隐状态可以根据该模型实际应用的场景特点确定,不再赘述。
在步骤202中,初始化多个模型参数,每个所述模型参数包括所述不同实体对象对应的参数,且所述模型参数中的状态转移概率包括:同一实体对象的隐状态之间的转移概率、以及不同实体对象的隐状态之间的转移概率。
本步骤中,初始化的多个模型参数可以包括输出概率、初始概率和状态转移概率。其中,每一个参数都包括不同实体对象对应的参数,例如,初始概率包括:实体对象人的各个隐状态的初始概率、以及实体对象设备的各个隐状态的初始概率。又例如,输出概率包括:实体对象人的各个观察值与隐状态之间的输出概率、以及实体对象设备的各个观察值与隐状态之间的输出概率。
其中,状态转移概率也包括两种,一种是同一实体对象的隐状态之间的转移概率,另一种是不同实体对象的隐状态之间的转移概率。不同实体对象的隐状态之间的转移概率是表示不同的实体对象的隐状态之间存在关联和相互影响。
例如,当人在开门时,人的胳膊伸出去转动门,那么在时刻t,人的隐状态可以是“抬胳膊”,而在下一个时刻t+1,门的隐状态可以是“开始旋转”,正是因为人抬胳膊伸出去开门,才使得门开始旋转,所以这两个不同实体对象的隐状态之间具有关联。比如图1中的隐状态18和隐状态19之间就存在转移概率,可以将这种具有关联且属于不同实体对象的隐状态对称为一对交互状态。
本说明书实施例的场景是涉及到不同实体对象之间的行为交互,这种交互式场景中,不同实体对象的隐状态之间可以存在相互影响的关联。
在步骤204中,根据所述模型参数进行模型训练,其中,在模型训练的演绎过程中,若一个实体对象在目标时刻缺失对应的隐状态,则使用所述实体对象与另一实体对象之间的隐状态的转移概率。
不同的实体对象的隐状态之间可能不是一一对应的,比如,在时刻t,其中一个实体对象存在隐状态,而另一个实体对象不存在隐状态。可以参见图1中的示意,对于隐状态序列15中的隐状态18,在隐状态序列14中并不存在与之对应的隐状态,即隐状态序列14存在缺失。又例如,对于隐状态序列14中的隐状态19,在隐状态15中并不存在与之对应的隐状态,即隐状态序列15中存在隐状态缺失。
本步骤中,旨在模型的训练过程中学习参数时,对于存在隐状态缺失的情况,只需要学习不同实体对象之间的转移概率即可。请参见图1,暂且假设隐状态22是一个缺失的隐状态,实际是不存在的,当该隐状态22存在时,对于隐状态17来说,是需要同时学习隐状态17与隐状态22之间的转移概率、以及隐状态17与隐状态18之间的转移概率的。而本实施例中,由于隐状态22是缺失的状态,不需要再考虑该状态,所以对于隐状态17来说,只需要学习隐状态17与隐状态18之间的转移概率即可,从而减少了需要学习的参数的数量。
如下示例一种可以采用的实现上述目的的方式,但实际实施中不局限于此:
可以设置一个触发方程H:
Figure BDA0002251590470000091
如上,所述的单链,指的是属于其中一个实体对象的隐状态序列和观察值序列,所述的c取值为1或2,取值不同时表示属于不同的实体对象。
将上述的触发方程H,可以应用于采用前向-后向算法(forward-backwardalgorithm)训练模型参数的演绎过程中,参见如下的参数训练的计算过程:
首先,可以定义前向概率和后向概率如下:
Figure BDA0002251590470000092
Figure BDA0002251590470000093
其中,1≤i≤N(c),c=1,2.
以前向算法为例:
初始:
Figure BDA0002251590470000094
演绎:
Figure BDA0002251590470000095
如上公式,将上述的触发方程H应用到了演绎方程中,根据触发方程来看,当t+1时刻的实体对象隐状态缺失时,则等号的右边只剩下w(c),当t+1时刻的实体对象隐状态存在并未缺失时,等号的右边不再有w(c),而是剩下:
Figure BDA0002251590470000096
并且其中的H等于1。其中,ω与状态转移概率A的维度一致,初始化时可以设置为零矩阵。
通过上述公式(7),可以实现在模型训练的演绎过程中的目标时刻,若在某一个目标时刻的实体对象对应的隐状态缺失,则在状态转移概率的训练中,不再设置该缺失的隐状态相关的转移概率,包括:该缺失的隐状态所在的同一单链的转移概率,以及该缺失的隐状态所在的跨单链的转移概率,均不再迭代计算中使用,从而减少参数训练的数量。
终止:
Figure BDA0002251590470000101
在上述的公式中,1≤i,j≤N(c),t≤T,c=1,2.,其中,β是公式(2)中的参数b的集合。
此外,在模型训练过程中,还可以计算如下参数:在给定的时间点t,给定的观察值序列以及某给定的模型参数下,某个隐状态的概率计算如下:根据前向概率和后向概率,可以得出观察值序列为0且在t时刻的状态为q的概率。
Figure BDA0002251590470000102
模型训练过程中的其他公式和计算过程,不再详述,可以参见常规的前向-后向算法进行即可,并且,在该过程中,可以使用最大期望算法(Expectation-maximization,EM)用于计算模型参数集θ。
在步骤206中,当达到模型训练结束条件时,获得所述行为辨识模型。
向后算法就是把前向算法算出来的参数代入参数定义的公式,前向和后向的结合即整个迭代过程。
通过上述模型的训练,获得了各个隐状态之间的转移概率、以及隐状态和观察值之间的概率,得到了模型参数。
本实施例的方法,由于在模型训练的演绎过程中,当一个实体对象的隐状态缺失时,只使用了不同实体对象的隐状态之间的转移概率,从而使得模型训练的参数减少,提高了模型训练的效率;并且,该方式也更符合实际交互场景,模型的准确率得到提高。
模型的应用
在确定了模型的参数,得到了训练完成的行为辨识模型之后,就可以使用该模型来确定对应某一个观察值序列的隐状态的最佳路径。
图3为本说明书至少一个实施例提供的行为辨识方法的流程,可以包括:
在步骤300中,获取在目标时刻采集的传感器数据,所述传感器数据包括:具有行为交互关联的不同实体对象分别对应的传感器数据。
本步骤中,可以是通过设置的传感器,分别采集了各个实体对象的传感器数据,这些传感器数据就相当于观察值。
本实施例要识别的可以是某一个时刻下的观察值序列,例如,在某一目标时刻时,已经采集到一个观察值序列,该观察值序列可以包括由采集初始时刻至当前的目标时刻这一时间段内采集的多个观察值。本实施例要通过该观察值序列,去识别实体对象在进行何种行为,而这种行为要通过实体对象的隐状态反映。
在步骤302中,通过本说明书任一实施例提供的训练方法得到的模型,确定在所述目标时刻所述传感器数据对应的隐状态最佳路径。
通过上述的模型训练,已经得到了行为辨识模型,本步骤中,可以根据该模型,使用维特比算法确定步骤301中的观察值序列对应的隐状态最佳转换路径。具体的维特比算法的过程不再详述,均为常规算法。
在步骤304中,根据所述隐状态最佳路径,确定所述传感器数据对应的实体对象行为。隐状态的最佳转换路径,可以反映出实体对象在进行何种行为,例如,实体对象在进行开门,或者实体对象在进行烧水。
此外,在识别出实体对象的行为后,还可以基于该识别的实体对象行为,为所述传感器数据设置对应的行为标签,所述行为标签用于标识所述传感器数据是实体对象在进行所述识别的实体对象行为时采集得到。即为传感器数据打标,这种打标方式可以实现自动打标而非人工打标,并且也比较准确,数据打标的效率和准确率得到了提高。
相比较来看,基于深度学习的算法,如卷积神经网络、LSTM可以处理海量的输入数据,并通过训练神经网络参数得到高准确度的模型,但另一方面,深度学习模型需要耗费较高的运算资源,甚至运用GPU来优化性能,且模型训练调参周期长,并不适用于数据量小且行为识别分类明确的简单场景。而本说明书任一实施例提供的方法,能够通过传感器数据,利用有限的计算资源高效地推算出模型参数,并准确地做出涉及交互的行为识别。并且,相对于其他方案,该方案中的模型可解释性高、计算效率高、耗费资源少、准确性高。
如下通过一个例子表明该方法的有效性:
将此方法应用于一份IEEE公布的来自Wearable Computing Laboratory ETHZurich的标准行为识别数据集,并发现此方法,在有限计算资源的限制下提升行为识别及分类的准确率。该数据集采自包括10个模块、72个有线和无线传感器构成的监控***,实验邀请了近20个被试,每个实验对象执行5项日常活动并重复20次,获得传感器数据,并且每条传感器数据均被人工打标。
我们以F-Measure,即对精确率(Precision)和召回率加权的统计量来衡量算法的有效性。在5项高抽象度活动(休息、清洁、吃饭、早起、咖啡小憩)识别的测试中,以及在在17项细分动作(开/关门、开/关冰箱、开启/关闭洗碗柜、开/关抽屉、打扫桌子、喝水等)的识别中,平均准确率高于或位于同类算法的前列。参见如下列表的比较:
表1有效性比较
Figure BDA0002251590470000121
Figure BDA0002251590470000131
图4提供了一种行为辨识模型的训练装置,如图4所示,该装置包括:数据获取模块41、参数处理模块42和训练处理模块43。
数据获取模块41,用于获取训练数据,所述训练数据包括:具有行为交互关联的不同实体对象分别对应的传感器数据、以及所述实体对象的隐状态;所述传感器数据是在所述不同实体对象的行为交互过程中采集得到;
参数处理模块42,用于初始化多个模型参数,每个所述模型参数包括所述不同实体对象对应的参数,且所述模型参数中的状态转移概率包括:同一实体对象的隐状态之间的转移概率、以及不同实体对象的隐状态之间的转移概率;
训练处理模块43,用于根据所述模型参数进行模型训练,其中,在模型训练的演绎过程中,若一个实体对象在目标时刻缺失对应的隐状态,则使用所述实体对象与另一实体对象之间的隐状态的转移概率;并且当达到模型训练结束条件时,获得所述行为辨识模型。
在一个例子中,训练处理模块43,在用于在模型训练的演绎过程中,若一个实体对象在目标时刻缺失对应的隐状态,使用所述实体对象与另一实体对象之间的隐状态的状态转移概率时,包括:在模型训练的演绎过程中的目标时刻,若所述目标时刻的所述实体对象对应的隐状态缺失,则使用所述实体对象在所述目标时刻的隐状态向另一个实体对象在下一时刻的隐状态之间的转移概率。
在一个例子中,训练处理模块43,在用于在模型训练的演绎过程中,若一个实体对象在目标时刻缺失对应的隐状态,使用实体对象与另一实体对象之间的隐状态的状态转移概率时,包括:根据前向-后向算法,训练所述模型参数。
图5提供了一种行为辨识装置,如图5所示,该装置包括:数据采集模块51、路径确定模块52和行为确定模块53。
数据采集模块51,用于获取在目标时刻采集的传感器数据,所述传感器数据包括:具有行为交互关联的不同实体对象分别对应的传感器数据;且所述传感器数据是在所述不同实体对象的行为交互过程中采集得到;
路径确定模块52,用于通过本公开任一实施例的所述的行为辨识模型的训练装置训练得到的模型,确定在所述目标时刻所述传感器数据对应的隐状态最佳路径;
行为确定模块53,用于根据所述隐状态最佳路径,确定所述传感器数据对应的实体对象行为。
在一个例子中,行为确定模块53,还用于基于识别的实体对象行为,为所述传感器数据设置对应的行为标签,所述行为标签用于标识所述传感器数据是实体对象在进行所述识别的实体对象行为时采集得到。
在一个例子中,路径确定模块52,在用于确定在所述目标时刻所述传感器数据对应的隐状态最佳路径时,包括:使用维特比算法确定隐状态最佳路径。
本公开实施例还提供了一种行为辨识设备,所述设备包括存储器、处理器,所述存储器用于存储可在处理器上运行的计算机指令;所述处理器用于在执行所述计算机指令时实现本公开任一实施例所述的行为辨识方法。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书一个或多个实施例可提供为方法、***或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于数据处理设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的行为或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本说明书一个或多个实施例的较佳实施例而已,并不用以限制本说明书一个或多个实施例,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例保护的范围之内。

Claims (13)

1.一种行为辨识模型的训练方法,所述方法基于耦合隐马尔科夫链进行所述行为辨识模型的训练;所述方法包括:
获取训练数据,所述训练数据包括:具有行为交互关联的不同实体对象分别对应的传感器数据、以及所述实体对象的隐状态;所述传感器数据是在所述不同实体对象的行为交互过程中采集得到;
初始化多个模型参数,每个所述模型参数包括所述不同实体对象对应的参数,且所述模型参数中的状态转移概率包括:同一实体对象的隐状态之间的转移概率、以及不同实体对象的隐状态之间的转移概率;
根据所述模型参数进行模型训练,其中,在模型训练的演绎过程中,若一个实体对象在目标时刻缺失对应的隐状态,则使用所述实体对象与另一实体对象之间的隐状态的转移概率;并且当达到模型训练结束条件时,获得所述行为辨识模型。
2.根据权利要求1所述的方法,所述在模型训练的演绎过程中,若一个实体对象在目标时刻缺失对应的隐状态,使用所述实体对象与另一实体对象之间的隐状态的状态转移概率,包括:
在模型训练的演绎过程中的目标时刻,若所述目标时刻的所述实体对象对应的隐状态缺失,则使用所述实体对象在所述目标时刻的隐状态向另一个实体对象在下一时刻的隐状态之间的转移概率。
3.根据权利要求1所述的方法,所述根据所述模型参数进行模型训练,包括:根据前向-后向算法,训练所述模型参数。
4.一种行为辨识方法,所述方法包括:
获取在目标时刻采集的传感器数据,所述传感器数据包括:具有行为交互关联的不同实体对象分别对应的传感器数据;且所述传感器数据是在所述不同实体对象的行为交互过程中采集得到;
通过权利要求1至3任一所述的方法训练得到的模型,确定在所述目标时刻所述传感器数据对应的隐状态最佳路径;
根据所述隐状态最佳路径,确定所述传感器数据对应的实体对象行为。
5.根据权利要求4所述的方法,
所述方法还包括:基于识别的实体对象行为,为所述传感器数据设置对应的行为标签,所述行为标签用于标识所述传感器数据是实体对象在进行所述识别的实体对象行为时采集得到。
6.根据权利要求4所述的方法,所述确定在所述目标时刻所述传感器数据对应的隐状态最佳路径,包括:使用维特比算法确定所述隐状态最佳路径。
7.一种行为辨识模型的训练装置,所述装置包括:
数据获取模块,用于获取训练数据,所述训练数据包括:具有行为交互关联的不同实体对象分别对应的传感器数据、以及所述实体对象的隐状态;所述传感器数据是在所述不同实体对象的行为交互过程中采集得到;
参数处理模块,用于初始化多个模型参数,每个所述模型参数包括所述不同实体对象对应的参数,且所述模型参数中的状态转移概率包括:同一实体对象的隐状态之间的转移概率、以及不同实体对象的隐状态之间的转移概率;
训练处理模块,用于根据所述模型参数进行模型训练,其中,在模型训练的演绎过程中,若一个实体对象在目标时刻缺失对应的隐状态,则使用所述实体对象与另一实体对象之间的隐状态的转移概率;并且当达到模型训练结束条件时,获得所述行为辨识模型。
8.根据权利要求7所述的装置,
所述训练处理模块,在用于在模型训练的演绎过程中,若一个实体对象在目标时刻缺失对应的隐状态,使用所述实体对象与另一实体对象之间的隐状态的状态转移概率时,包括:在模型训练的演绎过程中的目标时刻,若所述目标时刻的所述实体对象对应的隐状态缺失,则使用所述实体对象在所述目标时刻的隐状态向另一个实体对象在下一时刻的隐状态之间的转移概率。
9.根据权利要求7所述的装置,
所述训练处理模块,在用于在模型训练的演绎过程中,若一个实体对象在目标时刻缺失对应的隐状态,使用所述实体对象与另一实体对象之间的隐状态的状态转移概率时,包括:根据前向-后向算法,训练所述模型参数。
10.一种行为辨识装置,所述装置包括:
数据采集模块,用于获取在目标时刻采集的传感器数据,所述传感器数据包括:具有行为交互关联的不同实体对象分别对应的传感器数据;且所述传感器数据是在所述不同实体对象的行为交互过程中采集得到;
路径确定模块,用于通过权利要求7至9任一所述的装置训练得到的模型,确定在所述目标时刻所述传感器数据对应的隐状态最佳路径;
行为确定模块,用于根据所述隐状态最佳路径,确定所述传感器数据对应的实体对象行为。
11.根据权利要求10所述的装置,
所述行为确定模块,还用于基于识别的实体对象行为,为所述传感器数据设置对应的行为标签,所述行为标签用于标识所述传感器数据是实体对象在进行所述识别的实体对象行为时采集得到。
12.根据权利要求10所述的装置,
所述路径确定模块,在用于确定在所述目标时刻所述传感器数据对应的隐状态最佳路径时,包括:使用维特比算法确定所述隐状态最佳路径。
13.一种行为辨识设备,所述设备包括存储器、处理器,所述存储器用于存储可在处理器上运行的计算机指令;所述处理器用于在执行所述计算机指令时实现权利要求4至6任一所述的方法。
CN201911036281.5A 2019-10-29 2019-10-29 一种行为辨识及模型训练的方法和装置 Active CN110852442B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911036281.5A CN110852442B (zh) 2019-10-29 2019-10-29 一种行为辨识及模型训练的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911036281.5A CN110852442B (zh) 2019-10-29 2019-10-29 一种行为辨识及模型训练的方法和装置

Publications (2)

Publication Number Publication Date
CN110852442A true CN110852442A (zh) 2020-02-28
CN110852442B CN110852442B (zh) 2022-03-15

Family

ID=69598987

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911036281.5A Active CN110852442B (zh) 2019-10-29 2019-10-29 一种行为辨识及模型训练的方法和装置

Country Status (1)

Country Link
CN (1) CN110852442B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111709765A (zh) * 2020-03-25 2020-09-25 中国电子科技集团公司电子科学研究院 一种用户画像评分方法、装置和存储介质
CN111738358A (zh) * 2020-07-24 2020-10-02 支付宝(杭州)信息技术有限公司 一种数据识别方法、装置、设备和可读介质
CN112784812A (zh) * 2021-02-08 2021-05-11 安徽工程大学 一种深蹲动作识别方法
CN113534133A (zh) * 2021-07-21 2021-10-22 西安电子科技大学 基于期望最大迭代算法的雷达多目标联合检测及跟踪方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110010176A1 (en) * 2009-07-09 2011-01-13 Yukiko Yoshiike Hmm learning device and method, program, and recording medium
CN109471436A (zh) * 2018-11-09 2019-03-15 上海理工大学 基于混合高斯-隐马尔科夫模型的换道模型参数优化方法
CN110097193A (zh) * 2019-04-28 2019-08-06 第四范式(北京)技术有限公司 训练模型的方法及***和预测序列数据的方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110010176A1 (en) * 2009-07-09 2011-01-13 Yukiko Yoshiike Hmm learning device and method, program, and recording medium
CN101950376A (zh) * 2009-07-09 2011-01-19 索尼公司 隐马尔可夫模型学习设备和方法、程序、以及记录介质
CN109471436A (zh) * 2018-11-09 2019-03-15 上海理工大学 基于混合高斯-隐马尔科夫模型的换道模型参数优化方法
CN110097193A (zh) * 2019-04-28 2019-08-06 第四范式(北京)技术有限公司 训练模型的方法及***和预测序列数据的方法及***

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111709765A (zh) * 2020-03-25 2020-09-25 中国电子科技集团公司电子科学研究院 一种用户画像评分方法、装置和存储介质
CN111738358A (zh) * 2020-07-24 2020-10-02 支付宝(杭州)信息技术有限公司 一种数据识别方法、装置、设备和可读介质
CN111738358B (zh) * 2020-07-24 2020-12-08 支付宝(杭州)信息技术有限公司 一种数据识别方法、装置、设备和可读介质
US11314897B2 (en) 2020-07-24 2022-04-26 Alipay (Hangzhou) Information Technology Co., Ltd. Data identification method, apparatus, device, and readable medium
CN112784812A (zh) * 2021-02-08 2021-05-11 安徽工程大学 一种深蹲动作识别方法
CN113534133A (zh) * 2021-07-21 2021-10-22 西安电子科技大学 基于期望最大迭代算法的雷达多目标联合检测及跟踪方法
CN113534133B (zh) * 2021-07-21 2022-10-21 西安电子科技大学 基于期望最大迭代算法的雷达多目标联合检测及跟踪方法

Also Published As

Publication number Publication date
CN110852442B (zh) 2022-03-15

Similar Documents

Publication Publication Date Title
CN110852442B (zh) 一种行为辨识及模型训练的方法和装置
Yang et al. Semisupervised multilabel deep learning based nonintrusive load monitoring in smart grids
Gawlikowski et al. A survey of uncertainty in deep neural networks
CN111027487B (zh) 基于多卷积核残差网络的行为识别***、方法、介质及设备
Ma et al. Liv: Language-image representations and rewards for robotic control
Sadegh et al. Approximate bayesian computation using markov chain monte carlo simulation: Dream (abc)
CN108108807B (zh) 学习型图像处理方法、***及服务器
CN110632572A (zh) 基于无意调相特性的雷达辐射源个体识别方法及装置
CN110797021A (zh) 混合语音识别网络训练方法、混合语音识别方法、装置及存储介质
WO2019210695A1 (zh) 模型训练和业务推荐
CN102393910B (zh) 一种基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法
WO2020088491A1 (zh) 一种运动行为模式分类方法、***以及装置
CN112699998B (zh) 一种时间序列预测方法、装置、电子设备及可读存储介质
CN110781595B (zh) 能源使用效率pue的预测方法、装置、终端及介质
CN106844788B (zh) 一种图书馆智能搜索排序方法及***
CN109740106A (zh) 基于图卷积神经网络的大规模网络介数逼近方法、存储装置及存储介质
CN112690761B (zh) 睡眠状态检测方法、装置、设备及计算机可读介质
Szot et al. Large language models as generalizable policies for embodied tasks
CN112597921A (zh) 一种基于注意力机制gru深度学习的人体行为识别方法
CN110399279B (zh) 一种用于非人智能体的智能度量方法
CN111563203A (zh) 一种基于快速非负隐特征分析的智能家居用户-服务兴趣度个性化预测装置和预测方法
CN114625969A (zh) 一种基于交互近邻会话的推荐方法
CN105740815B (zh) 一种基于深度递归分层条件随机场的人体行为识别方法
CN114091338B (zh) 一种电力负荷分解模型的建立方法及装置
JP6099099B2 (ja) 収束判定装置、方法、及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant