CN109299725A - 一种基于张量链并行实现高阶主特征值分解的预测***和装置 - Google Patents

一种基于张量链并行实现高阶主特征值分解的预测***和装置 Download PDF

Info

Publication number
CN109299725A
CN109299725A CN201810840088.6A CN201810840088A CN109299725A CN 109299725 A CN109299725 A CN 109299725A CN 201810840088 A CN201810840088 A CN 201810840088A CN 109299725 A CN109299725 A CN 109299725A
Authority
CN
China
Prior art keywords
tensor
parallel
core
chain
transport
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810840088.6A
Other languages
English (en)
Other versions
CN109299725B (zh
Inventor
杨天若
刘华中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Ezhou Institute of Industrial Technology Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Ezhou Institute of Industrial Technology Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology, Ezhou Institute of Industrial Technology Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201810840088.6A priority Critical patent/CN109299725B/zh
Publication of CN109299725A publication Critical patent/CN109299725A/zh
Application granted granted Critical
Publication of CN109299725B publication Critical patent/CN109299725B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • G06F18/295Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于张量链并行实现高阶主特征值分解的预测***和装置,根据历史数据构建转移张量;对所述转移张量进行张量链分解,获得分布式存储的张量核,其中,根据所述张量核设计核间并行和核内并行两层并行架构,且对所述张量进行并行计算;执行高阶主特征值分解算法;判断所述高阶主特征值分解算法收敛时,获得主特征张量;根据所述主特征张量抽取不同情境下的预测目标进行排序,且挑选概率最大的前M个目标值进行预测。解决现有技术中难以满足在不同情境下的多模态预测需求,且当数据量非常巨大时难以满足实际时间响应需求的技术问题,实现了不同情境下的多模态精准预测,同时达到提升大数据计算效率的技术效果。

Description

一种基于张量链并行实现高阶主特征值分解的预测***和 装置
技术领域
本发明涉及信息处理技术领域,尤其涉及一种基于张量链并行实现高阶 主特征值分解的预测***和装置。
背景技术
大数据时代,大数据具有数据体积大、数据类型多、处理速度快、价值 密度低等特点。结合大数据分析方法和人工智能技术可有效提高预测***的 准确度和运行效率。关于离散时间的随机过程,基于马尔科夫链进行预测可 获得较好的预测效果。但是大数据时代的预测具有多模态特性,一元马尔科 夫链的预测***只能在矩阵空间进行实现。
现有技术中在不同情境下难以满足多模态的预测需求,且数据量非常巨 大时,传统的串行计算方法异常耗时,难以满足实际时间响应需求。
发明内容
本发明实施例提供了一种基于张量链并行实现高阶主特征值分解的预测 ***和装置,解决现有技术中在不同情境下难以满足多模态的预测需求,且 数据量非常巨大时,传统的串行计算方法异常耗时,难以满足实际的时间响 应需求的技术问题。
鉴于上述问题,提出了本申请实施例以便提供一种基于张量链并行实现 高阶主特征值分解的预测***和装置。
第一方面,本发明提供了一种基于张量链并行实现高阶主特征值分解的 预测***,所述***包括:
根据历史数据构建转移张量;对所述转移张量进行张量链分解获得分布 式存储的张量核,其中,根据所述张量核设计核间并行和核内并行两层并行 架构,且对所述张量进行并行计算;根据张量链并行执行高阶主特征值分解 算法;判断所述高阶主特征值分解算法收敛时,获得主特征张量;根据所述 主特征张量抽取不同情境下的预测目标进行排序,且挑选概率最大的前M个 目标值进行预测,其中M为正整数。
优选地,根据历史数据构建转移张量,还包括:
根据不同领域大数据获得影响每个预测目标变量的K个影响因素;根据 统计方法计算所述K个影响因素下各状态之间的转移概率。
优选地,所述核间并行包括垂直并行与水平并行;所述核内并行包括二 分并行与两端并行。
优选地,对所述转移张量进行张量链分解获得分布式存储的张量核,其 中,根据所述张量核设计核间并行和核内并行两层并行架构,且对所述张量 进行并行计算,还包括:
根据所述张量核之间的缩并操作执行并行,其中,所述并行采用先垂直 并行再水平并行执行爱因斯坦乘,包括:根据每一组具有相同维度的张量核, 按照垂直并行方式缩并所述张量核获得第一结果;根据所述第一结果按照水 平并行方式缩并相邻张量核获得第二结果;根据所述第二结果和相邻的张量 核进行合并操作;或,根据所述张量核之间的缩并操作执行并行,其中,所 述并行采用先水平并行再垂直并行执行爱因斯坦乘,包括:根据所述张量核 按照水平并行方式执行缩并获得第三结果;根据所述第三结果执行张量的多 模乘获得第四结果;根据所述第四结果和相邻的张量核进行合并操作。
优选地,根据张量链并行执行高阶主特征值分解算法,还包括:
对所述转移张量进行素性修正操作,获得不可约转移张量;对所述转移 张量进行张量链分解;获得初始化状态概率分布张量;根据所述初始化状态 概率分布张量进行张量链分解;根据所述张量链并行执行所述转移张量和初 始化状态概率分布张量的爱因斯坦乘;判断所述爱因斯坦乘结果是否满足收 敛条件,其中,所述收敛条件为:norm(Xn+1 -Xn )<ε,其中norm()为求范数函 数,ε为预设的收敛阈值。
第二方面,本发明提供了一种基于张量链并行实现高阶主特征值分解的 预测装置,所述装置包括:
第一构建单元,所述第一构建单元用于根据历史数据构建转移张量;
第二获得单元,所述第二获得单元用于对所述转移张量进行张量链分解 获得分布式存储的张量核,其中,根据所述张量核设计核间并行和核内并行 两层并行架构,且对所述张量进行并行计算;
第一操作单元,所述第一操作单元用于根据张量链并行执行高阶主特征 值分解算法;
第一判断单元,所述第一判断单元用于判断所述高阶主特征值分解算法 收敛时,获得主特征张量;
第二操作单元,所述第二操作单元用于根据所述主特征张量抽取不同情 境下的预测目标进行排序,且挑选概率最大的前M个目标值进行预测,其中 M为正整数。
优选地,第一获得单元,所述第一获得单元用于根据历史数据构建转移 张量,还包括:
第三获得单元,所述第三获得单元用于根据不同领域大数据获得影响每 个预测目标变量的K个影响因素;
第三操作单元,所述第三操作单元用于根据统计方法计算所述K个影响 因素下各状态之间的转移概率。
优选地,第二获得单元还包括所述核间并行包括垂直并行与水平并行; 所述核内并行包括二分并行与两端并行。
优选地,第二获得单元,所述第二获得单元用于对所述转移张量进行张 量链分解获得分布式存储的张量核,其中,根据所述张量核设计核间并行和 核内并行两层并行架构,且对所述张量进行并行计算,还包括:
第四操作单元,所述第四操作单元用于根据所述张量核之间的缩并操作 执行并行,其中,所述并行采用先垂直并行再水平并行执行爱因斯坦乘,包 括:
第四获得单元,所述第四获得单元用于根据每一组具有相同维度的张量 核,按照垂直并行方式缩并所述张量核获得第一结果;
第五获得单元,所述第五获得单元用于根据所述第一结果按照水平并行 方式缩并相邻张量核获得第二结果;
第五操作单元,所述第五操作单元用于根据所述第二结果和相邻的张量 核进行合并操作;
或,
第六操作单元,所述第六操作单元用于根据所述张量核之间的缩并操作 执行并行,其中,所述并行采用先水平并行再垂直并行执行爱因斯坦乘,包 括:
第六获得单元,所述第六获得单元用于根据所述张量核按照水平并行方 式执行缩并获得第三结果;
第七获得单元,所述第七获得单元用于根据所述第三结果执行张量的多 模乘获得第四结果;
第七操作单元,所述第七操作单元用于根据所述第四结果和相邻的张量 核进行合并操作。
优选地,第一操作单元包括根据张量链并行执行高阶主特征值分解算法, 还包括:
第八获得单元,所述第八获得单元用于对所述转移张量进行素性修正操 作,获得不可约转移张量;
第八操作单元,所述第八操作单元用于对所述转移张量进行张量链分解;
第九获得单元,所述第九获得单元用于获得初始化状态概率分布张量;
第九操作单元,所述第九操作单元用于根据所述初始化状态概率分布张 量进行张量链分解;
第十操作单元,所述第十操作单元用于根据所述张量链并行执行所述转 移张量和初始化状态概率分布张量的爱因斯坦乘;
第二判断单元,所述第二判断单元用于判断所述爱因斯坦乘结果是否满 足收敛条件,其中,所述收敛条件为:norm(Xn+ 1-Xn )<ε,其中norm()为求范 数函数,ε为预设的收敛阈值。
第三方面,本发明提供了一种基于张量链并行实现高阶主特征值分解的 预测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计 算机程序,所述处理器执行所述程序时实现以下步骤:根据历史数据构建转 移张量;对所述转移张量进行张量链分解获得分布式存储的张量核,其中, 根据所述张量核设计核间并行和核内并行两层并行架构,且对所述张量进行 并行计算;根据张量链并行执行高阶主特征值分解算法;判断所述高阶主特 征值分解算法收敛时,获得主特征张量;根据所述主特征张量抽取不同情境下的预测目标进行排序,且挑选概率最大前若干个目标值进行预测。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种 技术效果:
1.本申请实施例提供的一种基于张量链并行实现高阶主特征值分解的预 测***和装置,通过根据历史数据构建转移张量;对所述转移张量进行张量 链分解获得分布式存储的张量核,其中,根据所述张量核设计核间并行和核 内并行两层并行架构,且对所述张量进行并行计算;根据张量链并行执行高 阶主特征值分解算法;判断所述高阶主特征值分解算法收敛时,获得主特征 张量;根据所述主特征张量抽取不同情境下的预测目标进行排序,且挑选概 率最大的前M个目标值进行预测,其中M为正整数。解决现有技术中的在不 同情境下难以满足多模态的预测需求,且数据量非常巨大时,传统的串行计 算方法异常耗时,难以满足实际时间响应需求的技术问题,实现了不同情境 下各个状态的多模态精准预测,且可以提高预测精确度,同时达到提升大数 据计算效率的技术效果。
2.本申请实施例通过根据历史数据构建转移张量,还包括:根据不同领域 大数据获得影响每个预测目标变量的K个影响因素;根据统计方法计算所述 K个影响因素下各状态之间的转移概率。进一步通过在高维空间的张量表征 特点,对不同情境下的状态转移构建转移张量,可以实现不同情境下的多模 态预测。
3.本申请实施例通过根据张量链并行执行高阶主特征值分解算法,还包 括:对所述转移张量进行素性修正操作,获得不可约转移张量;对所述转移 张量进行张量链分解;获得初始化状态概率分布张量;根据所述初始化状态 概率分布张量进行张量链分解;根据所述张量链并行执行所述转移张量和初 始化状态概率分布张量的爱因斯坦乘;判断所述爱因斯坦乘结果是否满足收 敛条件,其中,所述收敛条件为:norm(Xn+ 1-Xn )<ε,其中norm()为求范数函 数,ε为预设的收敛阈值。进一步通过高阶特征值分解算法,求解转移张量的 主特征张量,表示不同状态的稳态概率分布,并基于张量链分解结果进行计 算,可以挖掘隐藏的核心特征信息,有利于提高预测精度。
4.进一步通过张量链分解结果,设计核间并行和核内并行的两层并行计 算架构,在核间并行中提出垂直并行和水平并行两种并行模式,在水平并行 模式中设计二分并行和两端并行方式,使得大规模的张量计算可以并行执行, 提高了大数据运行效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技 术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它 目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
图1为本发明实施例中一种基于张量链并行实现高阶主特征值分解的预 测***的流程示意图;
图2为本发明实施例中一种基于张量链并行实现高阶主特征值分解的预 测装置的结构示意图;
图3为本发明实施例中提供的张量链并行计算架构示意图;
图4为本发明实施例中提供的基于爱因斯坦乘进行多元状态一步转移示 意图;
图5为本发明实施例中提供的基于张量链的爱因斯坦乘进行多元状态一 步转移示意图;
图6为本发明实施例中提供的基于张量链的先垂直后水平并行实现爱因 斯坦乘示意图;
图7为本发明实施例中提供的基于张量链的先水平后垂直并行实现爱因 斯坦乘示意图;
图8为本发明实施例中提供的基于张量链的高阶主特征值分解算法流程 示意图;
图9为本发明实施例中另一种一种基于张量链并行实现高阶主特征值分 解的预测装置的结构示意图。
附图标号说明:总线300,接收器301,处理器302,发送器303,存储 器304,总线接口306。
具体实施方式
本发明实施例提供了一种基于张量链并行实现高阶主特征值分解的预测 ***和装置,本发明提供的技术方案总体思路如下:通过根据历史数据构建 转移张量;对所述转移张量进行张量链分解获得分布式存储的张量核,其中, 根据所述张量核设计核间并行和核内并行两层并行架构,且对所述张量进行 并行计算;根据张量链并行执行高阶主特征值分解算法;判断所述高阶主特 征值分解算法收敛时,获得主特征张量;根据所述主特征张量抽取不同情境 下的预测目标进行排序,且挑选概率最大的前M个目标值进行预测,其中M为正整数。解决现有技术中的在不同情境下难以满足多模态的预测需求,且 数据量非常巨大时,传统的串行计算方法异常耗时,难以满足实际时间响应 需求的技术问题,实现了不同情境下各个状态的多模态精准预测,且可以提 高预测精确度,同时达到提升大数据计算效率的技术效果。
下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理 解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说 明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以 及实施例中的技术特征可以相互组合。
实施例一
图1为本发明实施例中一种基于张量链并行实现高阶主特征值分解的预 测***的流程示意图。如图1所示,所述***包括:
步骤110:根据历史数据构建转移张量。
进一步的,根据不同领域大数据获得影响每个预测目标变量的K个影响 因素;根据统计方法计算所述K个影响因素下各状态之间的转移概率。
具体而言,根据不同领域大数据获得影响每个预测目标变量的K 个影响因素,基于历史数据,根据统计方法计算所述K个影响因素 下各状态之间的转移概率,构建转移张量。举例而言,在对城市公交 的流量预测***中,影响流量的影响因素有路线、时段(每天2小时 为一个时段),各时段每个状态由路线、时段、流量组成,则可构建 一个六阶的转移张量,即其中,每个元素 表示从当前路线i0、当前时段j0、当前流量k0转移到下一路线 i1、下一时段j1、下一流量k1的概率,且满足
步骤120:对所述转移张量进行张量链分解获得分布式存储的张量核,其 中,根据所述张量核设计核间并行和核内并行两层并行架构,且对所述张量 进行并行计算;
进一步的,所述核间并行包括垂直并行与水平并行;所述核内并行包括 二分并行与两端并行。
进一步的,根据所述张量核之间的缩并操作执行并行,其中,所述并行 采用先垂直并行再水平并行执行爱因斯坦乘,包括:根据每一组具有相同维 度的张量核,按照垂直并行方式缩并所述张量核获得第一结果;根据所述第 一结果按照水平并行方式缩并相邻张量核获得第二结果;根据所述第二结果 和相邻的张量核进行合并操作;或,根据所述张量核之间的缩并操作执行并 行,其中,所述并行采用先水平并行再垂直并行执行爱因斯坦乘,包括:根 据所述张量核按照水平并行方式执行缩并获得第三结果;根据所述第三结果执行张量的多模乘获得第四结果;根据所述第四结果和相邻的张量核进行合 并操作。
具体而言,图3为张量链并行计算架构示意图,如图3所示,对所述转 移张量进行张量链分解获得分布式存储的张量核,其中,根据所述分布式存 储的张量核设计核间并行和核内并行两层并行架构,且对所述张量进行并行 计算;其中,所述核间并行设计包括垂直并行与水平并行;所述核内并行设 计包括二分并行与两端并行。
请参考图4,爱因斯坦乘进行多元状态的一步转移的计算公式为:
其中,P是一个2K阶的状态间转移张量Si(i=1,2,…,K) 为每个状态影响因素空间大小;Xn Xn+ 1分别是当前时刻和下一时刻K阶状 态概率分布张量Xn ,本实施例中还提供基于张量链的爱因斯坦 乘实现进行多元状态一步转移,请参考图5,将标准的爱因斯坦乘操作转化为 对应张量核之间的缩并操作。为提高基于张量链的爱因斯坦乘的效率,分布 式存储的张量核之间的缩并操作可以并行执行。根据所述张量核之间的缩并 操作执行并行,其中,所述并行采用先垂直并行再水平并行执行爱因斯坦乘, 或,所述并行采用先水平并行再垂直并行执行爱因斯坦乘。
其中,基于张量链的先垂直并行再水平并行执行爱因斯坦乘的计算公式 为:
其中,CA*P B,*P为爱因斯坦乘; IM+k=Jk,k=1,2,…,P。
如图6所示,执行根据所述张量链的先垂直并行再水平并行实现爱因斯 坦乘只需要求解第M个张量核,也就是说,根据每一组具有相同维度的张量 核,按照垂直并行方式缩并所述张量核获得第一结果;根据所述第一结果按 照水平并行方式缩并相邻张量核获得第二结果;根据所述第二结果和相邻的 张量核进行合并操作。
基于张量链的先水平并行再垂直并行实现爱因斯坦乘的计算公式为:
如图7所示,执行根据所述张量链的先水平并行再垂直并行实现爱因斯 坦乘只需要求解第M个张量核,也就是说,根据所述张量核按照水平并行方 式执行缩并获得第三结果;根据所述第三结果执行张量的多模乘获得第四结 果;根据所述第四结果和相邻的张量核进行合并操作。
步骤130:根据张量链并行执行高阶主特征值分解算法;
进一步的,步骤131:对所述转移张量进行素性修正操作,获得不可约转 移张量;步骤132:对所述转移张量进行张量链分解;步骤133:获得初始化 状态概率分布张量;步骤134:根据所述初始化状态概率分布张量进行张量链 分解;步骤135:根据所述张量链并行执行所述转移张量和初始化状态概率分 布张量的爱因斯坦乘;步骤136:判断所述爱因斯坦乘结果是否满足收敛条件, 其中,所述收敛条件为:norm(Xn+1 -Xn )<ε,其中norm()为求范数函数,ε为预 设的收敛阈值。
具体而言,根据张量链并行执行高阶主特征值分解算法,请参考图8,步 骤131:对所述转移张量进行素性修正操作,获得不可约转移张量,其中所述 不可约转移张量的计算公式为P=αP+(1-α)E,其中0<α<1,E为平均概率张 量其中每一个状态之间的转移概率为步骤 132:对所述转移张量P进行张量链分解;步骤133:获得初始化状态概率分 布张量其中每一个状态的概率为步骤134:根 据所述初始化状态概率分布张量X0 进行张量链分解;步骤135:根据所述张 量链并行执行所述转移张量P和初始化状态概率分布张量X0 的爱因斯坦乘;步骤136:判断所述爱因斯坦乘结果是否满足收敛条件,其中,所述收敛条件 为:norm(Xn+1 -Xn )<ε,其中norm()为求范数函数,ε为预设的收敛阈值。如果 所述爱因斯坦乘结果不满足所述收敛条件,则重新执行步骤135。如果所述爱 因斯坦乘结果满足所述收敛条件,则步骤130结束。
步骤140:判断所述高阶主特征值分解算法收敛时,获得主特征张量;
步骤150:根据所述主特征张量抽取不同情境下的预测目标进行排序,且 挑选概率最大的前M个目标值进行预测,其中M为正整数。
具体而言,判断所述高阶主特征值分解算法收敛时,获得主特征张量, 其中所述主特征张量表示每个状态的稳态概率分布。根据所述主特征张量抽 取不同情境下的预测目标进行排序,且挑选概率最大的前M个目标值进行预 测,实现多模态精准预测,其中M为正整数,M可以是若干个目标值。举例 而言,在步骤110中假设的城市公交流量预测***中,求取的主特征张量(即 各状态的稳态概率分布)为现预测第i0路线第j0时段的客流量, 只需要在张量X中抽取向量X(i0,j0,:),选出所述向量X(i0,j0,:)中最大概率值对 应的客流量,则为预测值。
实施例2
基于与前述实施例中一种基于张量链并行实现高阶主特征值分解的预测 ***同样的发明构思,本发明还提供一种基于张量链并行实现高阶主特征值 分解的预测装置,如图2所示,所述装置包括:
第一构建单元,所述第一构建单元用于根据历史数据构建转移张量;
第二获得单元,所述第二获得单元用于对所述转移张量进行张量链分解 获得分布式存储的张量核,其中,根据所述张量核设计核间并行和核内并行 两层并行架构,且对所述张量进行并行计算;
第一操作单元,所述第一操作单元用于根据张量链并行执行高阶主特征 值分解算法;
第一判断单元,所述第一判断单元用于判断所述高阶主特征值分解算法 收敛时,获得主特征张量;
第二操作单元,所述第二操作单元用于根据所述主特征张量抽取不同情 境下的预测目标进行排序,且挑选概率最大的前M个目标值进行预测,其中 M为正整数。
优选地,第一获得单元,所述第一获得单元用于根据历史数据构建转移 张量,还包括:
第三获得单元,所述第三获得单元用于根据不同领域大数据获得影响每 个预测目标变量的K个影响因素;
第三操作单元,所述第三操作单元用于根据统计方法计算所述K个影响 因素下各状态之间的转移概率。
优选地,第二获得单元还包括所述核间并行包括垂直并行与水平并行; 所述核内并行包括二分并行与两端并行。
优选地,第二获得单元,所述第二获得单元用于对所述转移张量进行张 量链分解获得分布式存储的张量核,其中,根据所述张量核设计核间并行和 核内并行两层并行架构,且对所述张量进行并行计算,还包括:
第四操作单元,所述第四操作单元用于根据所述张量核之间的缩并操作 执行并行,其中,所述并行采用先垂直并行再水平并行执行爱因斯坦乘,包 括:
第四获得单元,所述第四获得单元用于根据每一组具有相同维度的张量 核,按照垂直并行方式缩并所述张量核获得第一结果;
第五获得单元,所述第五获得单元用于根据所述第一结果按照水平并行 方式缩并相邻张量核获得第二结果;
第五操作单元,所述第五操作单元用于根据所述第二结果和相邻的张量 核进行合并操作;
或,
第六操作单元,所述第六操作单元用于根据所述张量核之间的缩并操作 执行并行,其中,所述并行采用先水平并行再垂直并行执行爱因斯坦乘,包 括:
第六获得单元,所述第六获得单元用于根据所述张量核按照水平并行方 式执行缩并获得第三结果;
第七获得单元,所述第七获得单元用于根据所述第三结果执行张量的多 模乘获得第四结果;
第七操作单元,所述第七操作单元用于根据所述第四结果和相邻的张量 核进行合并操作。
优选地,第一操作单元包括根据张量链并行执行高阶主特征值分解算法, 还包括:
第八获得单元,所述第八获得单元用于对所述转移张量进行素性修正操 作,获得不可约转移张量;
第八操作单元,所述第八操作单元用于对所述转移张量进行张量链分解;
第九获得单元,所述第九获得单元用于获得初始化状态概率分布张量;
第九操作单元,所述第九操作单元用于根据所述初始化状态概率分布张 量进行张量链分解;
第十操作单元,所述第十操作单元用于根据所述张量链并行执行所述转 移张量和初始化状态概率分布张量的爱因斯坦乘;
第二判断单元,所述第二判断单元用于判断所述爱因斯坦乘结果是否满 足收敛条件,其中,所述收敛条件为:norm(Xn+1 -Xn )<ε,其中norm()为求范 数函数,ε为预设的收敛阈值。
前述图1实施例1中的一种基于张量链并行实现高阶主特征值分解的预 测***的各种变化方式和具体实例同样适用于本实施例的一种基于张量链并 行实现高阶主特征值分解的预测装置,通过前述对一种基于张量链并行实现 高阶主特征值分解的预测***的详细描述,本领域技术人员可以清楚的知道 本实施例中一种基于张量链并行实现高阶主特征值分解的预测装置的实施方 法,所以为了说明书的简洁,在此不再详述。
实施例3
基于与前述实施例中一种基于张量链并行实现高阶主特征值分解的预测 ***同样的发明构思,本发明还提供一种计算机可读存储介质,其上存储有 计算机程序,该程序被处理器执行时实现前文所述一种基于张量链并行实现 高阶主特征值分解的预测***的任一方法的步骤。
其中,在图9中,总线架构(用总线300来代表),总线300可以包括任 意数量的互联的总线和桥,总线300将包括由处理器302代表的一个或多个 处理器和存储器304代表的存储器的各种电路链接在一起。总线300还可以 将诸如***设备、稳压器和功率管理电路等之类的各种其他电路链接在一起, 这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口 306在总线300和接收器301和发送器303之间提供接口。接收器301和发送 器303可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装 置通信的单元。
处理器302负责管理总线300和通常的处理,而存储器304可以被用于 存储处理器302在执行操作时所使用的信息。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种 技术效果:
1.本申请实施例提供的一种基于张量链并行实现高阶主特征值分解的预 测***和装置,通过根据历史数据构建转移张量;对所述转移张量进行张量 链分解获得分布式存储的张量核,其中,根据所述张量核设计核间并行和核 内并行两层并行架构,且对所述张量进行并行计算;根据张量链并行执行高 阶主特征值分解算法;判断所述高阶主特征值分解算法收敛时,获得主特征 张量;根据所述主特征张量抽取不同情境下的预测目标进行排序,且挑选概 率最大的前M个目标值进行预测,其中M为正整数。解决现有技术中的在不 同情境下难以满足多模态的预测需求,且数据量非常巨大时,传统的串行计 算方法异常耗时,难以满足实际时间响应需求的技术问题,实现了不同情境 下各个状态的多模态精准预测,且可以提高预测精确度,同时达到提升大数 据计算效率的技术效果。
2.本申请实施例通过根据历史数据构建转移张量,还包括:根据不同领域 大数据获得影响每个预测目标变量的K个影响因素;根据统计方法计算所述 K个影响因素下各状态之间的转移概率。进一步通过在高维空间的张量表征 特点,对不同情境下的状态转移构建转移张量,可以实现不同情境下的多模 态预测。
3.本申请实施例通过根据张量链并行执行高阶主特征值分解算法,还包 括:对所述转移张量进行素性修正操作,获得不可约转移张量;对所述转移 张量进行张量链分解;获得初始化状态概率分布张量;根据所述初始化状态 概率分布张量进行张量链分解;根据所述张量链并行执行所述转移张量和初 始化状态概率分布张量的爱因斯坦乘;判断所述爱因斯坦乘结果是否满足收 敛条件,其中,所述收敛条件为:norm(Xn+ 1-Xn )<ε,其中norm()为求范数函 数,ε为预设的收敛阈值。进一步通过高阶特征值分解算法,求解转移张量的 主特征张量,表示不同状态的稳态概率分布,并基于张量链分解结果进行计 算,可以挖掘隐藏的核心特征信息,有利于提高预测精度。
4.进一步通过张量链分解结果,设计核间并行和核内并行的两层并行计 算架构,在核间并行中提出垂直并行和水平并行两种并行模式,在水平并行 模式中设计二分并行和两端并行方式,使得大规模的张量计算可以并行执行, 提高了大数据运行效率。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或 计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、 或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个 其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘 存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产 品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图 和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程 和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、 嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通 过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流 程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的 装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设 备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器 中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或 多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上, 使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的 处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图 一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步 骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本 发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要 求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (7)

1.一种基于张量链并行实现高阶主特征值分解的预测***,其特征在于,所述***包括:
根据历史数据构建转移张量;
对所述转移张量进行张量链分解获得分布式存储的张量核,其中,根据所述张量核设计核间并行和核内并行两层并行架构,且对所述张量进行并行计算;
根据张量链并行执行高阶主特征值分解算法;
判断所述高阶主特征值分解算法收敛时,获得主特征张量;
根据所述主特征张量抽取不同情境下的预测目标进行排序,且挑选概率最大的前M个目标值进行预测,其中M为正整数。
2.如权利要求1所述的***,其特征在于,根据历史数据构建转移张量,还包括:
根据不同领域大数据获得影响每个预测目标变量的K个影响因素;
根据统计方法计算所述K个影响因素下各状态之间的转移概率。
3.如权利要求1所述的***,其特征在于,所述核间并行包括垂直并行与水平并行;所述核内并行包括二分并行与两端并行。
4.如权利要求1所述的***,其特征在于,对所述转移张量进行张量链分解获得分布式存储的张量核,其中,根据所述张量核设计核间并行和核内并行两层并行架构,且对所述张量进行并行计算,还包括:
根据所述张量核之间的缩并操作执行并行,其中,所述并行采用先垂直并行再水平并行执行爱因斯坦乘,包括:
根据每一组具有相同维度的张量核,按照垂直并行方式缩并所述张量核获得第一结果;
根据所述第一结果按照水平并行方式缩并相邻张量核获得第二结果;
根据所述第二结果和相邻的张量核进行合并操作;
或,
根据所述张量核之间的缩并操作执行并行,其中,所述并行采用先水平并行再垂直并行执行爱因斯坦乘,包括:
根据所述张量核按照水平并行方式执行缩并获得第三结果;
根据所述第三结果执行张量的多模乘获得第四结果;
根据所述第四结果和相邻的张量核进行合并操作。
5.如权利要求1所述的***,其特征在于,根据张量链并行执行高阶主特征值分解算法,还包括:
对所述转移张量进行素性修正操作,获得不可约转移张量;
对所述转移张量进行张量链分解;
获得初始化状态概率分布张量;
根据所述初始化状态概率分布张量进行张量链分解;
根据所述张量链并行执行所述转移张量和初始化状态概率分布张量的爱因斯坦乘;
判断所述爱因斯坦乘结果是否满足收敛条件,其中,所述收敛条件为:norm(Xn+1 -Xn )<ε,其中norm()为求范数函数,ε为预设的收敛阈值。
6.一种基于张量链并行实现高阶主特征值分解的预测装置,其特征在于,所述装置包括:
第一构建单元,所述第一构建单元用于根据历史数据构建转移张量;
第二获得单元,所述第二获得单元用于对所述转移张量进行张量链分解获得分布式存储的张量核,其中,根据所述张量核设计核间并行和核内并行两层并行架构,且对所述张量进行并行计算;
第一操作单元,所述第一操作单元用于根据张量链并行执行高阶主特征值分解算法;
第一判断单元,所述第一判断单元用于判断所述高阶主特征值分解算法收敛时,获得主特征张量;
第二操作单元,所述第二操作单元用于根据所述主特征张量抽取不同情境下的预测目标进行排序,且挑选概率最大的前M个目标值进行预测,其中M为正整数。
7.一种基于张量链并行实现高阶主特征值分解的预测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现以下步骤:
根据历史数据构建转移张量;
对所述转移张量进行张量链分解获得分布式存储的张量核,其中,根据所述张量核设计核间并行和核内并行两层并行架构,且对所述张量进行并行计算;
根据张量链并行执行高阶主特征值分解算法;
判断所述高阶主特征值分解算法收敛时,获得主特征张量;
根据所述主特征张量抽取不同情境下的预测目标进行排序,且挑选概率最大的前M个目标值进行预测,其中M为正整数。
CN201810840088.6A 2018-07-27 2018-07-27 一种张量链并行实现高阶主特征值分解的预测***和装置 Active CN109299725B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810840088.6A CN109299725B (zh) 2018-07-27 2018-07-27 一种张量链并行实现高阶主特征值分解的预测***和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810840088.6A CN109299725B (zh) 2018-07-27 2018-07-27 一种张量链并行实现高阶主特征值分解的预测***和装置

Publications (2)

Publication Number Publication Date
CN109299725A true CN109299725A (zh) 2019-02-01
CN109299725B CN109299725B (zh) 2021-10-08

Family

ID=65172338

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810840088.6A Active CN109299725B (zh) 2018-07-27 2018-07-27 一种张量链并行实现高阶主特征值分解的预测***和装置

Country Status (1)

Country Link
CN (1) CN109299725B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111598798A (zh) * 2020-04-27 2020-08-28 浙江工业大学 一种基于低秩张量链分解的图像修复方法
CN115759294A (zh) * 2022-11-25 2023-03-07 北京百度网讯科技有限公司 数据处理方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015042873A1 (en) * 2013-09-27 2015-04-02 Google Inc. Decomposition techniques for multi-dimensional data
CN105224507A (zh) * 2015-09-29 2016-01-06 杭州天宽科技有限公司 一种基于张量分解的缺失关联规则挖掘方法
US20170091613A1 (en) * 2015-09-30 2017-03-30 Kabushiki Kaisha Toshiba Computational device, computational method, and computer program product
CN108170639A (zh) * 2017-12-26 2018-06-15 云南大学 基于分布式环境的张量cp分解实现方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015042873A1 (en) * 2013-09-27 2015-04-02 Google Inc. Decomposition techniques for multi-dimensional data
CN105224507A (zh) * 2015-09-29 2016-01-06 杭州天宽科技有限公司 一种基于张量分解的缺失关联规则挖掘方法
US20170091613A1 (en) * 2015-09-30 2017-03-30 Kabushiki Kaisha Toshiba Computational device, computational method, and computer program product
CN108170639A (zh) * 2017-12-26 2018-06-15 云南大学 基于分布式环境的张量cp分解实现方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHONGMING CHEN,ET AL: "《Parallelized Tensor Train Learning of Polynomial Classifiers》", 《IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS》 *
廖阳: "《张量的z-特征分解及其在公交客流量的预测》", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111598798A (zh) * 2020-04-27 2020-08-28 浙江工业大学 一种基于低秩张量链分解的图像修复方法
CN111598798B (zh) * 2020-04-27 2023-09-05 浙江工业大学 一种基于低秩张量链分解的图像修复方法
CN115759294A (zh) * 2022-11-25 2023-03-07 北京百度网讯科技有限公司 数据处理方法、装置、电子设备及存储介质
CN115759294B (zh) * 2022-11-25 2023-10-24 北京百度网讯科技有限公司 数据处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN109299725B (zh) 2021-10-08

Similar Documents

Publication Publication Date Title
CN110533183B (zh) 流水线分布式深度学习中异构网络感知的任务放置方法
CN111860828B (zh) 一种神经网络的训练方法、存储介质和设备
CN110363294A (zh) 利用网络中的路径来表示神经网络以提高神经网络的性能
CN104731574B (zh) 用于识别多级工作流处理中的资源瓶颈的方法和***
CN109003132A (zh) 广告推荐方法及相关产品
CN103617150A (zh) 一种基于gpu的大规模电力***潮流并行计算***及其方法
CN106201651A (zh) 神经形态芯片的模拟器
CN107016649A (zh) 一种基于局部低秩张量估计的视觉数据补全方法
CN110188919A (zh) 一种基于长短期记忆网络的负荷预测方法
CN103365727A (zh) 一种云计算环境中的主机负载预测方法
CN112084038A (zh) 神经网络的内存分配方法及装置
CN108768716A (zh) 一种微服务路径选择方法及装置
CN111091247A (zh) 基于深度神经网络模型融合的电力负荷预测方法、装置
CN108205704A (zh) 一种神经网络芯片
CN110058936A (zh) 用于确定专用处理资源的资源量的方法、设备和计算机程序产品
CN107463448A (zh) 一种深度学习权值更新方法和***
CN113516246A (zh) 参数优化方法、量子芯片的控制方法及装置
CN109299725A (zh) 一种基于张量链并行实现高阶主特征值分解的预测***和装置
CN115437795A (zh) 一种异构gpu集群负载感知的显存重计算优化方法及***
CN104536831B (zh) 一种基于多目标优化的多核SoC软件映射方法
CN111651208B (zh) 面向异构众核并行计算机的模态并行计算方法及***
CN117875504A (zh) 溃坝预测及其模型训练方法、装置、电子设备及存储介质
CN116167445B (zh) 量子测量模式的处理方法、装置及电子设备
CN110390342A (zh) 时间序列预测方法和装置
Yang et al. Trust-based scheduling strategy for cloud workflow applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant