CN110020715B - 利用波动和脉冲信号混合编码的神经网络识别方法与装置 - Google Patents
利用波动和脉冲信号混合编码的神经网络识别方法与装置 Download PDFInfo
- Publication number
- CN110020715B CN110020715B CN201811201335.4A CN201811201335A CN110020715B CN 110020715 B CN110020715 B CN 110020715B CN 201811201335 A CN201811201335 A CN 201811201335A CN 110020715 B CN110020715 B CN 110020715B
- Authority
- CN
- China
- Prior art keywords
- neural network
- signal
- matrix
- fluctuation
- artificial neural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 122
- 238000000034 method Methods 0.000 title claims abstract description 40
- 239000011159 matrix material Substances 0.000 claims abstract description 104
- 210000002569 neuron Anatomy 0.000 claims abstract description 51
- 230000015654 memory Effects 0.000 claims abstract description 34
- 230000008569 process Effects 0.000 claims abstract description 14
- 238000012549 training Methods 0.000 claims abstract description 11
- 238000003860 storage Methods 0.000 claims abstract description 7
- 238000013507 mapping Methods 0.000 claims abstract description 4
- 238000013500 data storage Methods 0.000 claims description 26
- 238000004891 communication Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 5
- 230000008054 signal transmission Effects 0.000 claims description 3
- 230000002708 enhancing effect Effects 0.000 claims description 2
- 230000000644 propagated effect Effects 0.000 abstract description 5
- 238000013529 biological neural network Methods 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000005094 computer simulation Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 210000005171 mammalian brain Anatomy 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000007711 solidification Methods 0.000 description 1
- 230000008023 solidification Effects 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种利用波动和脉冲信号混合编码的人工神经网络识别方法。该方法包括:生成分布式人工神经网络;将原始语音或图像编码为波动信号和脉冲信号的混合信号输入给神经网络;令所述混合信号进入神经网络后,以特定速度分布式传播;利用所述混合信号依次激发特定的神经元,产生不同的特征路径,并将特征路径上的神经元映射为特征矩阵保存;多次重复编码和矩阵存储过程,取特征矩阵平均值,生成记忆矩阵,训练神经网络;根据训练后的特征矩阵数据保存特征路径;将需要识别的语音或图像输入给训练好的神经网络,生成待识别的特征矩阵;进行比对完成识别。
Description
技术领域
本发明涉及计算机软硬件、神经网络、机器学习、人工智能,具体涉及一种用于语音识别和图像识别的全新人工神经网络方法。
背景技术
目前人工智能领域用到的神经网络方法,都是基于数字计算机的人工神经网络。这种神经网络本质上都是对原始信息进行二进制编码,传递二进制数字信号。在神经网络用于智能语音和图像识别时,需要大量数据样本输入来进行训练,或者需要实时连接互联网以调用大量数据,对原始数据量的互联网环境的依赖很强。
现实的生物神经网络,尤其是哺乳动物大脑中,同时包含了模拟信号和数字信号处理功能,其中模拟信号以脑电波形式存在,数字信号以神经脉冲形式存在,二者对记忆、学习等智能行为均至关重要。生物神经网络的学习过程并不需要大量数据训练和互联网环境。但是,目前的神经网络方法尚不能将生物神经网络的融合进来。
发明内容
1.目的
为了降低目前神经网络对大数据训练和互联网环境的依赖,制造更实用的人工智能识别装置,本发明提出了一种利用波动和脉冲信号混合编码的人工神经网络识别方法,能够不依赖大数据输入而快速地学习语音或图像信号特征,并对同类型语音或图像信号进行准确识别,不依赖互联网环境。
2.技术方案
具体而言,本发明提供一种利用波动和脉冲信号混合编码的人工神经网络识别方法,其特征在于,所述方法包括以下步骤:
步骤一:生成分布式人工神经网络,该神经网络由多个单频网络组成,对所生成的分布式人工神经网络进行初始化全连通;
步骤二:将原始语音或图像编码为波动信号和脉冲信号的混合信号并输入给分布式人工神经网络;
步骤三:令所述混合信号进入分布式人工神经网络后,以特定速度分布式传播,其中在任意一个单频线路上传播混合信号,但不同单频网络之间只传播脉冲信号;
步骤四:利用所述混合信号依次激发网络中的神经元,产生不同的特征路径,并将特征路径上的神经元映射为特征矩阵保存,一个维度为时间,一个维度为频率;
步骤五:多次重复步骤二到步骤四的编码和矩阵存储过程,取特征矩阵平均值,生成记忆矩阵,训练所述分布式人工神经网络;
步骤六:根据训练后的特征矩阵数据保存特征路径;
步骤七:将需要识别的语音或图像输入给训练好的分布式人工神经网络,重复步骤二到步骤四过程,生成待识别的特征矩阵;
步骤八:对比已保存的特征矩阵和待识别的特征矩阵,获得待识别的特征矩阵与已保存的特征矩阵的符合程度数据。
优选地,所述分布式人工神经网络由多个单频网络组成,每个单频网络包括神经元和连接通道,单频网络以内的神经元互相连接,单频网络之间神经元也互相连接,每个神经网络的神经元都有一个路连接到数据储存层,在步骤二中信号传播时,单频网络以内传播混合信号,单频网络之间只传播脉冲信号。
优选地,在所述步骤一构建的分布式人工神经网络中,单个神经网络节点具有多向输入和多向输出功能,其中输入输出路径不共用。
优选地,在对语音进行编码时,声音频率编码为波动信号频率,声音振幅编码为脉冲信号个数,脉冲信号只处于波动信号波峰位置附近;在对图像进行编码时,水平扫描和竖直扫描分别编码为波动信号频率,光强编码为脉冲信号个数,脉冲信号只处于波动信号波峰位置附近。
优选地,所述步骤四包括:通过神经网络节点对混合信号的响应时序,记录信号传输特征路径。
优选地,所述步骤五包括:多次将语音或图像信号输入神经网络,将多次重复生成的特征矩阵取平均,储存为一个记忆矩阵。
优选地,所述步骤六包括:将该记忆矩阵作为识别标准,反馈给分布式人工神经网络,建立神经网络连接的特征路径。
优选地,所述步骤七包括:将需要识别的语音或图像输入给分布式人工神经网络,重复步骤二到步骤四过程,每一次需要识别的语音或图像都在数据储存层生成待识别的特征矩阵。
优选地,所述步骤六包括:加强特征路径上神经网络各节点的连通,关闭非特征路径上的神经网络各节点的连通。
本发明受现实的生物神经网络启发,以节点(神经元)连接距离作为全新的变量,使人工神经网络同时具有处理波动信号(模拟)和脉冲信号(数字)功能,在识别语音和图像时做到生物个体一样,不依赖于大数据训练和互联网环境,从而获得更实用的人工神经网络识别方法,并制造更实用的人工智能装置。
3.优点及效果
传统的人工神经网络只包含基于现有计算机的数字化神经网络,或者在电路上增加了忆阻器的脉冲神经网络(SNN)。这些方案都未引入波动信号(神经振荡),因此都没有波动信号和脉冲信号混合的编码行为。
本发明有别于传统的数字化神经网络编码方案:
(1)本发明将神经元的连接距离作为一个全新变量引入人工神经网络,增加了信息编码的自由度,即时间自由度。通过神经元的连接距离的不同,将时序以物理方式自然地编码。
(2)本发明不需要对神经网络的进行大数据量训练,更符合生物神经网络的学习模式,每一个概念都以一个特征矩阵存储,可以做到离线识别,应用在无法连接互联网的应用场景。
(3)针对固定识别一个或若干个语音或图像模式,本发明将记忆矩阵对应的神经连接方式在硬件上固化,即特征路径。不受数据丢失的影响,***更具有鲁棒性。
(4)本发明在识别时只从出现信号的神经元上开始记录特征矩阵数据,特征矩阵只取决于神经元之间的相对关系,不取决与神经元的绝对频率,因此对识别内容相同但绝对频率不同的语音信号,以及内容相同但绝对位置不同的图像信号更具有优势。
此外,本发明的优选实现方式中,对于语音和图像识别,分别具有本发明的独特优势。
在语音识别中,本发明利用波动信号和脉冲信号混合方式,将一维的声音信号编码为二维的特征矩阵,增加可识别自由度。在图像识别中,本发明通过主动镜头装置沿着图像的特征动态扫描编码,编码过程不需要记录图像本身所有像素,降低数据量依赖的同时提高识别效率。
附图说明
此处所说明的附图主要是为了方便对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
附图1为信号识别过程流程图。
附图2为波动信号和脉冲信号的混合形式的示意图。其中脉冲信号的时长固定,且远小于不同波动信号的周期。脉冲信号振幅远大于波动信号振幅。f1和f2代表两个不同频率的波动信号。
附图3为神经网络层和数据储存层的关系示意图。输入信号以波动信号和脉冲信号的混合编码形式进入神经网络层,传播特征通过脉冲信号提取到数据储存层。识别结果由数据储存层输出。
附图4为神经网络连接示意图。其中展示了较为简单的两个信号的连接方式(实线),一个是在时序(t1,t2,t3,t4……)上波动和脉冲混合信号(f1,f2,f3,f4)的连接方式,另一个是在时序(t1,t2,t3,t4……)上波动和脉冲混合信号(f4,f2,f3,f1)的连接方式。最左侧一列为感应神经元,不记录信号。其它的神经元通过脉冲信号连接到数据储存层(虚线)
图5为针对图2两个信号的数据储存层示意图。横向维度为时间顺序{t1,t2,t3,t4},纵向维度为频率顺序{f1,f2,f3,f4}。图中的矩阵元为神经元,每一个神经元都存在一个逻辑阈值,特征矩阵在数据储存层表示为对应的神经元布尔逻辑值为1,其它神经元布尔逻辑值为0。接收到的脉冲信号的神经元按箭头方向依次满足逻辑值为1的话,即实现识别。
具体实施方式
以下结合附图及其实施例对本发明进行详细说明,但并不因此将本发明的保护范围限制在实施例描述的范围之中。
本发明具体实施可采用计算机模拟实施。
计算机模拟实施所需要的设备条件是:
(1)数字计算机(包括台式计算机,笔记本电脑,智能手机和平板电脑等)
(2)模拟/数字转换器(ADC)
(3)主动扫描摄像头(用于图像采集)
(4)麦克风(用于语音采集)
(5)信号传播模拟软件(如NI系列等)
下面,对具体过程进行描述。附图1示出了本实施例的流程图。如图所示,具体包括以下步骤:
步骤一:建立神经网络,对神经网络进行初始化全连通。本发明的神经网络分成两层,底层就是神经网络层,上面有一个数据储存层。神经网络层由多个单频网络组成,单频网络以内的神经元互相连接,单频网络之间神经元也互相连接,最终生成分布式人工神经网络。每个单频网络只可以输入脉冲信号和单频的波动信号。单个神经网络节点具有多向输入和多向输出功能,其中输入输出路径不共用。波动信号和脉冲信号的混合信号可以在单频网络内部传输,但只有脉冲信号可以在单频网络之间传输。每个神经网络层的神经元都有一个路连接到数据储存层
在没有数据输入时,神经网络层一直保持全连通方式。首次输入数据后,神经网络产生记忆结果,不再保持全联通。后续所有数据输入都直接输入给产生记忆的神经网络,不再初始化全联通。
步骤二:输入信号经过波动信号和脉冲信号混合编码输入给神经网络。编码方式对于语音来说,声音频率编码为波动信号频率,声音振幅编码为脉冲信号个数,脉冲信号只处于波动信号波峰位置附近;对于图像来说,水平扫描和竖直扫描分别编码为波动信号频率,光强编码为脉冲信号个数,脉冲信号只处于波动信号波峰位置附近。
波动信号和脉冲信号混合编码如附图2所示:波动信号属于横波,振幅和传输方向相互垂直。波动信号和脉冲信号方向传输速度一致,振幅可叠加,即脉冲信号存在于波动信号的固定相位的位置,同时脉冲信号振幅远大于波动信号振幅。本发明的示意性实施例及其说明仅考虑脉冲信号处于波动信号波峰位置情况,用于解释本发明,并不构成对本发明的不当限定。
原始信号(比如语音或图像)可以通过模拟/数字转换器转换为数字信号,利用软硬件上的傅里叶分析器分解为单频信号,或者单频信号的叠加(如果同一时刻原始声音信号包含不同频率),对每一个单频信号进行混合编码。
当一个声音信号的频率为F1,振幅为A1,出现时刻为T1。该信号经过波动信号和脉冲信号混合编码后,对应的波动信号频率为f1,每个波动信号周期内脉冲信号数量为n1,在输入神经网络的时刻为t1,其中n1和A1成正比,f1和F1成正比。编码后的波动和脉冲混合信号时长与原始声音信号时长一致。
当一个图像信号输入时,需要由镜头主动扫描图像特征输入。令镜头对图像x轴正向扫描(从左至右)时,以频率f1的波动信号和每个波动信号周期内脉冲数n1编码;反向扫描(从右至左)时,以频率f2的波动信号和每个波动信号周期内脉冲数n2编码。令镜头对图像y轴正向扫描(从上至下)时,以频率f3的波动信号和每个波动信号周期内脉冲数n3编码;反向扫描(从下至上)时,以频率f4的波动信号和每个波动信号周期内脉冲数n4编码。镜头沿其它方向的扫描时,扫描方向由两种混合信号的叠加,以及各自每个波动信号周期内脉冲数占比不同决定。概括来讲,就是利用镜头对图像特征在图像所在平面的x、y的正负方向分别以不同频率进行扫描。例如从左上到右下45度扫描时,频率f1的波动信号和频率f3的波动信号同时存在,且n1和n3的比例为1∶1,以此类推。
步骤三:编码后的波动和脉冲混合信号,通过单频网络各自唯一的输入接口(如附图4的四个接口,从上至下针对f1,f2,f3,f4四个不同的波动信号频率的单频网络)进入神经网络。进入神经网络后,混合信号沿着单频网络所有可能的路径传播(附图4的水平方向),但只有脉冲信号部分可在单频网络之间传播(附图4的竖直方向)。混合信号进入神经网络的传播速度取决于***硬件配置。混合信号的传播方向取决于神经元的输入和输出方向。对单频网络内部来说,神经元的连接可传播波动信号和脉冲信号的混合信号。对单频网络之间来说,神经元的连接只传播脉冲信号。
最先传播到单频网络底部的混合信号,即一组信号时序中的第一个信号,会通过底部的神经元向数据储存层发送一个脉冲信号。如附图4a,频率为f1的波动信号率先达到f1单频网络底部(图中最右侧),由底部的神经元发送一个脉冲信号给数据储存层(虚线)。因此每个单频网络的底部神经元,都有接收单向混合信号输入并输出给数据储存层的功能。
步骤四:混合信号依次激发特定的神经元,产生不同的特征路径。并将特征路径上的神经元映射为特征矩阵保存,一个维度为时间,一个维度为频率。通过神经网络节点对混合信号的响应时序,记录信号传输特征路径。记录规则为神经网络节点对一个完整混合信号(波峰+脉冲)通过时,响应为将该信号脉冲部分输出给数据储存层,不响应为不输出脉冲给数据储存层。数据储存层接收到脉冲信号后,会将出现信号的区域储存为一个特征矩阵,即记忆矩阵。特征矩阵的矩阵元代表神经网络的节点,横向维度代表节点的时间分布,纵向维度代表节点的频率分布,矩阵元的值代表脉冲个数。
具体而言,一组混合信号的时序中,当第一个混合信号已经到达底部神经元之后,第二个混合信号还没有到达底部神经元。但当第二个混合信号此时到达的神经元,刚好收到第一个混合信号到达的底部神经元传输过来脉冲信号时,该神经元发送一个脉冲信号给数据储存层。如附图4a,该神经元为第二行(f2单频网络)右边的圆圈,满足如下关系:
a1+b12=a2+v(t2-t1)
其中v为信号的传输速度,t1和t2分别为波动部分频率f1和f2的混合信号在时序上的时间,a1和a2分别为混合信号(f1,t1)和(f2,t2)在各自单频网络内,从信号输入端的神经元到达发送脉冲信号给数据储存层的神经元之间的距离,b12为这两个神经元之间的距离。
以此类推,第三个和第四个混合信号到达的神经元,刚好收到上一个单频网络的神经元发来的脉冲信号,如附图4a,各自满足如下关系:
a2+b23=a3+v(t3-t2)
a4+b34=a4+v(t4-t3)
在数据储存层,由神经元接收到的脉冲信号在时序(t1,t2,t3,t4)上分布为(f1,f2,f3,f4)。该分布可以储存为一个特征矩阵:
其中矩阵的横轴为(t1,t2,t3,t4),纵轴为(f1,f2,f3,f4),矩阵元(n1,n2,n3,n4)分别为混合信号(f1,f2,f3,f4)在时刻(t1,t2,t3,t4)所拥有的脉冲信号数量。
同理,对于附图4b来说,因为在时序(t1,t2,t3,t4)上混合信号的分布为(f4,f2,f3,f1),该神经网络连接方式满足的方程组为:
a4+b24=a2+v(t4-t2)
a2+b23=a3+v(t3-t2)
a3+b13=a1+v(t3-t1)
附图4b在数据储存层对应的特征矩阵为:
附图5为在附图4a和附图4b两个同样时序上的混合信号叠加时,该双频叠加新号在数据储存层的直观表现。该信号对应的特征矩阵为:
以此类推,神经网络对于任何复杂的多频信号输入,也具有唯一的特征矩阵对应。
具体到真实设备,每一组信号生成的特征矩阵都可以通过电压信号转换为数字信号,直接存储在闪存,磁盘等数字存储器中。
步骤五:神经网络训练。对于比较复杂的信号来说,每次生成的特征矩阵会略有不同,存在一定的误差率,因此可以通过多次输入,生成多个特征矩阵,对这些特征矩阵取平均,回归到一个特征矩阵。该特征矩阵称为记忆矩阵。
例如对于附图5所示的双频叠加信号,最终生成的记忆矩阵为:
即每个矩阵元都为经过N次平均后的值,N为神经网络训练次数。
具体到真实设备,这些特征矩阵经过平均计算后可删除,只保留计算后的记忆矩阵。即特征矩阵可以储存在易失性存储器中,例如计算机内存等。而记忆矩阵最终会存储到非易失性存储器中,例如各类计算机硬盘。因此最终记忆矩阵所占数据量远小于训练过程所需的数据量。
步骤六:神经网络固化,即,根据训练后的特征矩阵数据保存特征路径。具体为加强特征路径上神经网络各节点的连通,关闭非特征路径上的神经网络各节点的连通。这一步目的是将对某一混合信号的记忆矩阵对应的神经网络连接固化在神经网络上,使该神经网络只适用于该混合信号。将该记忆矩阵作为识别标准,反馈给神经网络连接,即建立神经网络连接的特征路径。模拟生物神经网络记忆方式,加强特征路径上神经网络各节点的连通,硬件上课增加信道容量,同时关闭非特征路径上的神经网络各节点的连通,硬件上为切断信道。
对于步骤五生成的每一个记忆矩阵,都有唯一的神经网络连接与之对应。例如矩阵:
对应的神经网络连接即为附图4a中的实线连接。如果将该矩阵作为记忆矩阵,测固化附图4a中的实线连接,将其他的神经网络连接都切断(附图4a未显示)。同理,矩阵:
对应的神经网络连接即为附图4b中的实线连接。如果将该矩阵作为记忆矩阵,测固化附图4b中的实线连接,将其他的神经网络连接都切断(附图4b未显示)。
具体到应用场景,对于只识别单一信号的神经网络,可采取此步骤固化,提高记忆和识别效率。对于识别多种信号的神经网络,可绕过此步骤,不固化神经网络,继续保持神经网络的可塑性。
步骤七:待识别信号输入。待识别的信号输入过程为重复步骤二到步骤四的过程,先经过波动信号和脉冲信号混合编码,出现特征路径,再生成特征矩阵。
对于已经经过步骤六的神经网络,该网络只允许特定的、和固化神经网络相匹配的信号(即该信号的特征矩阵和固化神经网络对应的记忆矩阵一致)传播。如果待识别信号的特征矩阵与固化的神经网络对应的记忆矩阵相去甚远,将无法在该网络中传播。例如一个在时序(t1,t2,t3,t4)上分布为(f2,f3,f4,f1)的信号,原本应该生成的特征矩阵为:
但是在附图4a固化的神经网络中,不满足任何连接方程,因此不会有任何脉冲信号传输到数据储存层,也就是不会生成任何特征矩阵。具体到真实设备,可将此情况定义为全0矩阵。
对于已经跳过步骤六,即未经固化的神经网络来说,特征矩阵会具有不依赖信号绝对频率的灵活性。根据步骤四,第一个混合信号到达底部神经元之后,才发送脉冲信号到数据储存层,开始建立特征矩阵。例如一个待识别的信号为时序(t1,t2,t3,t4)上分布为(f1’,f2’,f3’,f4’)的混合信号,如果(f1’,f2’,f3’,f4’)与(f1,f2,f3,f4)的波动信号绝对频率不同,但是(f1’,f2’,f3’,f4’)之间的频率相对关系和(f1,f2,f3,f4)之间的频率相对关系相同,振幅也相同(即脉冲数也为n1,n2,n3,n4),则(f1’,f2’,f3’,f4’)生成的特征矩阵为:
即和(f1,f2,f3,f4)的特征矩阵相一致。
具体到识别语音信号时,如果仅仅是语音信号的绝对频率有移动,频率相对关系不变,振幅不变,那么经过该波动信号和脉冲信号混合编码的神经网络,将生成同样的特征矩阵。
具体到识别图像信号时,如果是识别部分在整个扫描区仅有位置移动,识别区内部图像各种特征的相对关系不变,那么经过该波动信号和脉冲信号混合编码的神经网络,将生成同样或非常相似的特征矩阵。如果识别区内部图像各种特征的相对关系不变,但是识别区的大小产生变化,可以通过镜头主动改变扫描速度来补偿,使生成的特征矩阵仍然保持相似性。
步骤八:信号识别。检验待识别的特征矩阵每个矩阵元数值,和已储存的记忆矩阵相对应的数值做比较,定量给出对比结果数据,设定总的对比阈值,输出数字逻辑信号(即高于阈值时为1,低于阈值时为0)。此步骤只发生在数据储存层,即只对比记忆矩阵和待识别信号的特征矩阵。通过传统的数据对比方法即可完成。
在数据比对时,可返回每个矩阵元的一对一比对结果。当矩阵元数据一致时,返回值为1;当矩阵元数据一致时,返回值为0。于是可以设置一个识别率的阈值,如0.9。当所有的矩阵元一对一的对比结果90%以上为1,即0的结果小于10%,则该识别结果就超过了0.9这个阈值,整个识别结果为真。反之,整个识别结果为伪。
由于待识别信号的特征矩阵有一定的误差率,如特征矩阵起始位置的误差。因此在识别时,可以对特征矩阵的每个矩阵元在小范围内做整体的平移,如时序上平移1-3个矩阵元后,再进行识别,反复几次,取识别率最高的结果。如特征矩阵:
当在时序上向前平移一个矩阵元之后,即可和下方的记忆矩阵
匹配,得到80%的识别结果。如果设置阈值低于80%,则该识别结果为真。
虽然上面结合本发明的优选实施例对本发明的原理进行了详细的描述,本领域技术人员应该理解,上述实施例仅仅是对本发明的示意性实现方式的解释,并非对本发明包含范围的限定。实施例中的细节并不构成对本发明范围的限制,在不背离本发明的精神和范围的情况下,任何基于本发明技术方案的等效变换、简单替换等显而易见的改变,均落在本发明保护范围之内。
Claims (9)
1.一种利用波动和脉冲信号混合编码的人工神经网络识别方法,其特征在于,所述方法包括以下步骤:
步骤一:生成分布式人工神经网络,该神经网络由多个单频网络组成,对所生成的分布式人工神经网络进行初始化全连通;
步骤二:将原始语音或图像编码为波动信号和脉冲信号的混合信号并输入给分布式人工神经网络;
步骤三:令所述混合信号进入分布式人工神经网络后,以特定速度分布式传播,其中在任意一个单频线路上传播混合信号,但不同单频网络之间只传播脉冲信号;
步骤四:利用所述混合信号依次激发网络中的神经元,产生不同的特征路径,并将特征路径上的神经元映射为特征矩阵保存,一个维度为时间,一个维度为频率;
步骤五:多次重复步骤二到步骤四的编码和矩阵存储过程,取特征矩阵平均值,生成记忆矩阵,训练所述分布式人工神经网络;
步骤六:根据训练后的特征矩阵数据保存特征路径;
步骤七:将需要识别的语音或图像输入给训练好的分布式人工神经网络,重复步骤二到步骤四过程,生成待识别的特征矩阵;
步骤八:对比已保存的特征矩阵和待识别的特征矩阵,获得待识别的特征矩阵与已保存的特征矩阵的符合程度数据。
2.根据权利要求1所述的利用波动和脉冲信号混合编码的人工神经网络识别方法,其特征在于,所述分布式人工神经网络由多个单频网络组成,每个单频网络包括神经元和连接通道,单频网络以内的神经元互相连接,单频网络之间神经元也互相连接,每个神经网络的神经元都有一个路连接到数据储存层,在步骤三中信号传播时,单频网络以内传播混合信号,单频网络之间只传播脉冲信号。
3.根据权利要求1所述的利用波动和脉冲信号混合编码的人工神经网络识别方法,其特征在于,在所述步骤一构建的分布式人工神经网络中,单个神经网络节点具有多向输入和多向输出功能,其中输入输出路径不共用。
4.根据权利要求1所述的利用波动和脉冲信号混合编码的人工神经网络识别方法,其特征在于,在对语音进行编码时,声音频率编码为波动信号频率,声音振幅编码为脉冲信号个数,脉冲信号只处于波动信号波峰位置附近;在对图像进行编码时,水平扫描和竖直扫描分别编码为波动信号频率,光强编码为脉冲信号个数,脉冲信号只处于波动信号波峰位置附近。
5.根据权利要求1所述的利用波动和脉冲信号混合编码的人工神经网络识别方法,其特征在于,所述步骤四包括:通过神经网络节点对混合信号的响应时序,记录信号传输特征路径。
6.根据权利要求1所述的利用波动和脉冲信号混合编码的人工神经网络识别方法,其特征在于,所述步骤五包括:多次将语音或图像信号输入神经网络,将多次重复生成的特征矩阵取平均,储存为一个记忆矩阵。
7.根据权利要求1所述的利用波动和脉冲信号混合编码的人工神经网络识别方法,其特征在于,所述步骤六包括:将该记忆矩阵作为识别标准,反馈给分布式人工神经网络,建立神经网络连接的特征路径。
8.根据权利要求1所述的利用波动和脉冲信号混合编码的人工神经网络识别方法,其特征在于,所述步骤七包括:将需要识别的语音或图像输入给分布式人工神经网络,重复步骤二到步骤四过程,每一次需要识别的语音或图像都在数据储存层生成待识别的特征矩阵。
9.根据权利要求1所述的利用波动和脉冲信号混合编码的人工神经网络识别方法,其特征在于,所述步骤六包括:加强特征路径上神经网络各节点的连通,关闭非特征路径上的神经网络各节点的连通。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811201335.4A CN110020715B (zh) | 2018-10-16 | 2018-10-16 | 利用波动和脉冲信号混合编码的神经网络识别方法与装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811201335.4A CN110020715B (zh) | 2018-10-16 | 2018-10-16 | 利用波动和脉冲信号混合编码的神经网络识别方法与装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110020715A CN110020715A (zh) | 2019-07-16 |
CN110020715B true CN110020715B (zh) | 2020-11-27 |
Family
ID=67188484
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811201335.4A Active CN110020715B (zh) | 2018-10-16 | 2018-10-16 | 利用波动和脉冲信号混合编码的神经网络识别方法与装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110020715B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110728974A (zh) * | 2019-10-29 | 2020-01-24 | 甘肃龙科智能科技有限公司 | 语音识别方法、装置、设备及计算机可读存储介质 |
CN112070063B (zh) * | 2020-09-28 | 2023-11-17 | 贵州省山地资源研究所 | 一种无人机用神经网络视觉识别方法 |
CN112511273B (zh) * | 2020-12-01 | 2021-12-14 | 江苏博沃汽车电子***有限公司 | 一种降低数字电路误差率的信息处理方法和装置 |
CN112686381A (zh) | 2020-12-30 | 2021-04-20 | 北京灵汐科技有限公司 | 神经网络模型、方法、电子设备及可读介质 |
CN113257282B (zh) * | 2021-07-15 | 2021-10-08 | 成都时识科技有限公司 | 语音情感识别方法、装置、电子设备以及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007115116A (ja) * | 2005-10-21 | 2007-05-10 | Hiroshima Industrial Promotion Organization | ニューロン素子およびそれを用いた情報処理方法 |
CN107092959A (zh) * | 2017-04-07 | 2017-08-25 | 武汉大学 | 基于stdp非监督学习算法的硬件友好型脉冲神经网络模型 |
CN107194426A (zh) * | 2017-05-23 | 2017-09-22 | 电子科技大学 | 一种基于Spiking神经网络的图像识别方法 |
CN108470190A (zh) * | 2018-03-09 | 2018-08-31 | 北京大学 | 基于fpga定制脉冲神经网络的图像识别方法 |
CN108615533A (zh) * | 2018-03-28 | 2018-10-02 | 天津大学 | 一种基于深度学习的高性能语音增强方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11003984B2 (en) * | 2016-05-31 | 2021-05-11 | Samsung Electronics Co., Ltd. | Timing sequence for digital STDP synapse and LIF neuron-based neuromorphic system |
US10846590B2 (en) * | 2016-12-20 | 2020-11-24 | Intel Corporation | Autonomous navigation using spiking neuromorphic computers |
-
2018
- 2018-10-16 CN CN201811201335.4A patent/CN110020715B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007115116A (ja) * | 2005-10-21 | 2007-05-10 | Hiroshima Industrial Promotion Organization | ニューロン素子およびそれを用いた情報処理方法 |
CN107092959A (zh) * | 2017-04-07 | 2017-08-25 | 武汉大学 | 基于stdp非监督学习算法的硬件友好型脉冲神经网络模型 |
CN107194426A (zh) * | 2017-05-23 | 2017-09-22 | 电子科技大学 | 一种基于Spiking神经网络的图像识别方法 |
CN108470190A (zh) * | 2018-03-09 | 2018-08-31 | 北京大学 | 基于fpga定制脉冲神经网络的图像识别方法 |
CN108615533A (zh) * | 2018-03-28 | 2018-10-02 | 天津大学 | 一种基于深度学习的高性能语音增强方法 |
Non-Patent Citations (2)
Title |
---|
"Temporal precision of spike response to fluctuating input in pulse-coupled networks of oscillating neurons";Jun-nosuke Teramae等;《arXiv》;20090622;1-10页 * |
"基于忆阻器的组合电路及神经网络研究";董哲康;《中国优秀硕士学位论文全文数据库 信息科技辑》;20151215;正文7-13页,37-45页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110020715A (zh) | 2019-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110020715B (zh) | 利用波动和脉冲信号混合编码的神经网络识别方法与装置 | |
CN111767848B (zh) | 一种基于多域特征融合的辐射源个体识别方法 | |
CN112801209B (zh) | 基于双特长教师模型知识融合的图像分类方法及存储介质 | |
Dodge et al. | Quality robust mixtures of deep neural networks | |
CN109858486B (zh) | 一种基于深度学习的数据中心云端目标识别方法 | |
CN110287770B (zh) | 一种基于卷积神经网络的水中个体目标匹配识别方法 | |
Fu et al. | Model compression for IoT applications in industry 4.0 via multiscale knowledge transfer | |
CN109259764B (zh) | 一种确定动态脑功能网络阈值方法 | |
CN115941112B (zh) | 一种便携式隐蔽通信方法、计算机设备及存储介质 | |
Li et al. | Residual quantization for low bit-width neural networks | |
CN116797796A (zh) | Drfm间歇采样下基于时频分析与深度学习的信号识别方法 | |
Nida et al. | Video augmentation technique for human action recognition using genetic algorithm | |
CN109448039B (zh) | 一种基于深度卷积神经网络的单目视觉深度估计方法 | |
CN113743317A (zh) | 基于生成对抗网络的车牌图片生成方法、介质和设备 | |
CN116106880B (zh) | 基于注意力机制和多尺度融合的水下声源测距方法和装置 | |
Wan et al. | 3D-Mask-GAN: Unsupervised Single-View 3D Object Reconstruction | |
Revi et al. | Gan-generated fake face image detection using opponent color local binary pattern and deep learning technique | |
Cai et al. | DCASE2023 task1 submission: Device simulation and time-frequency separable convolution for acoustic scene classification | |
CN106680800A (zh) | 一种双频识别声纳数据处理方法 | |
CN114462707B (zh) | 一种基于特征深度融合的Web服务多维QoS联合预测方法 | |
CN116402995A (zh) | 基于轻量级神经网络的古建筑点云语义分割方法及*** | |
Hines et al. | Application of multi-layer perceptrons to facial feature location | |
CN112966544A (zh) | 一种采用ICGAN与ResNet网络的雷达辐射源信号分类识别方法 | |
Cheng et al. | Deepeye: A compact and accurate video comprehension at terminal devices compressed with quantization and tensorization | |
Qiu et al. | A Dynamic Adjust‐Head Siamese network for object tracking |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |