CN114022366B - 基于数据流架构的图像尺寸调整装置、调整方法及设备 - Google Patents

基于数据流架构的图像尺寸调整装置、调整方法及设备 Download PDF

Info

Publication number
CN114022366B
CN114022366B CN202210007701.2A CN202210007701A CN114022366B CN 114022366 B CN114022366 B CN 114022366B CN 202210007701 A CN202210007701 A CN 202210007701A CN 114022366 B CN114022366 B CN 114022366B
Authority
CN
China
Prior art keywords
data
unit
image
operation unit
input end
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210007701.2A
Other languages
English (en)
Other versions
CN114022366A (zh
Inventor
梁监天
蔡权雄
牛昕宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Corerain Technologies Co Ltd
Original Assignee
Shenzhen Corerain Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Corerain Technologies Co Ltd filed Critical Shenzhen Corerain Technologies Co Ltd
Priority to CN202210007701.2A priority Critical patent/CN114022366B/zh
Publication of CN114022366A publication Critical patent/CN114022366A/zh
Application granted granted Critical
Publication of CN114022366B publication Critical patent/CN114022366B/zh
Priority to PCT/CN2023/070762 priority patent/WO2023131252A1/zh
Priority to US18/301,985 priority patent/US20230252600A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4007Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)

Abstract

本发明实施例公开了一种基于数据流架构的图像尺寸调整装置、调整方法及设备。该装置包括:第一乘法运算单元、第二乘法运算单元、第一数据寄存单元、第二数据寄存单元、第一加法运算单元和第二加法运算单元,各个单元的输入输出端口按照设定的数据流向进行连接。本发明实施例所提供的技术方案,通过在数据流架构中构建用于调整图像尺寸的专用单元,并控制待计算的图像数据依次流经不同的计算单元,避免了调用CPU进行基于指令集的计算,实现了图像数据的快速计算,并释放了CPU的计算压力,从而实现了视频及图像流的快速缩放处理,有效的减缓了AI芯片的前后处理效率低下的瓶颈问题。

Description

基于数据流架构的图像尺寸调整装置、调整方法及设备
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种基于数据流架构的图像尺寸调整装置、调整方法及设备。
背景技术
随着深度学习的快速发展,卷积神经网络已经大量应用于机器视觉应用,例如图像识别与图像分类。基于数据流架构的人工智能芯片,由于其极高的芯片利用率,正在越来越多的场景中得到应用。为了提高数据流架构AI芯片的端到端效率,需要对视频、图像流相关数据进行前后端计算处理,比如将图像放大或缩小(resize)为与后续模块相匹配的尺寸。
在传统的计算体系架构中,需要使用CPU基于指令集进行图像的resize功能,由于resize运算数据量大,会占用较多CPU资源,从而降低整个AI***的端到端性能,导致消耗更多的计算时间成本,影响整体的计算效率。
发明内容
本发明实施例提供一种基于数据流架构的图像尺寸调整装置、调整方法及设备,以释放CPU的计算压力,实现极高效率的运算。
第一方面,本发明实施例提供了一种基于数据流架构的图像尺寸调整装置,该装置包括:第一乘法运算单元、第二乘法运算单元、第一数据寄存单元、第二数据寄存单元、第一加法运算单元和第二加法运算单元;其中,
所述第一乘法运算单元的第一输入端用于接收待计算的图像数据,第二输入端用于接收第一图像位置系数,所述第一乘法运算单元的输出端分别与所述第一数据寄存单元的输入端和所述第一加法运算单元的第三输入端连接,所述第一数据寄存单元的输出端与所述第一加法运算单元的第四输入端连接,所述第一加法运算单元的输出端与所述第二乘法运算单元的第五输入端连接,所述第二乘法运算单元的第六输入端用于接收第二图像位置系数,所述第二乘法运算单元的输出端分别与所述第二数据寄存单元的输入端和所述第二加法运算单元的第七输入端连接,所述第二数据寄存单元的输出端与所述第二加法运算单元的第八输入端连接,所述第二加法运算单元的输出端用于输出所述图像数据的计算结果;所述第一数据寄存单元用于在串行运算中存储所述第一乘法运算单元上一次的运算结果,所述第二数据寄存单元用于在串行运算中存储所述第二乘法运算单元上一次的运算结果。
可选的,在所述第一加法运算单元和所述第二乘法运算单元之间,还包括第一数据选择单元和第一数据分配单元,在所述第一数据选择单元和所述第一数据分配单元之间,还包括第三数据寄存单元和第三加法运算单元;其中,
所述第一加法运算单元的输出端与所述第一数据选择单元的输入端连接,所述第一数据分配单元的输出端与所述第二乘法运算单元的输入端连接,所述第一数据选择单元的第一输出端直接与所述第一数据分配单元的第九输入端连接,所述第一数据分配单元的第十输入端与所述第三加法运算单元的输出端连接,所述第一数据选择单元的第二输出端分别与所述第三数据寄存单元的输入端和所述第三加法运算单元的第十一输入端连接,所述第三数据寄存单元的输出端与所述第三加法运算单元的第十二输入端连接;
在所述第二加法运算单元之后,还包括第二数据选择单元和第二数据分配单元,在所述第二数据选择单元和所述第二数据分配单元之间,还包括第四数据寄存单元和第四加法运算单元;其中,
所述第二加法运算单元的输出端与所述第二数据选择单元的输入端连接,所述第二数据分配单元的输出端用于输出所述图像数据的计算结果,所述第二数据选择单元的第三输出端直接与所述第二数据分配单元的第十三输入端连接,所述第二数据分配单元的第十四输入端与所述第四加法运算单元的输出端连接,所述第二数据选择单元的第四输出端分别与所述第四数据寄存单元的输入端和所述第四加法运算单元的第十五输入端连接,所述第四数据寄存单元的输出端与所述第四加法运算单元的第十六输入端连接。
可选的,若所述第一数据选择单元和所述第一数据分配单元选择使用所述第一输出端到所述第九输入端的数据流向,且所述第二数据选择单元和所述第二数据分配单元选择使用所述第三输出端到所述第十三输入端的数据流向,则所述图像尺寸调整装置采用双线性插值方法。
可选的,若所述第一数据选择单元和所述第一数据分配单元选择使用所述第二输出端到所述第十输入端的数据流向,且所述第二数据选择单元和所述第二数据分配单元选择使用所述第四输出端到所述第十四输入端的数据流向,则所述图像尺寸调整装置采用三次插值方法。
第二方面,本发明实施例还提供了一种图像尺寸调整方法,该方法应用于本发明任意实施例所提供的基于数据流架构的图像尺寸调整装置,包括:
获取待计算的图像数据及所需的图像位置系数,所述图像位置系数包括行方向上的第一图像位置系数和列方向上的第二图像位置系数;
根据预设时序要求,将所述图像数据和所述图像位置系数输入到所述图像尺寸调整装置的对应端口中;
根据所选择的图像尺寸调整算法控制所述图像尺寸调整装置中的数据流向,并通过所述图像尺寸调整装置得到完成放缩后的计算结果。
可选的,所述根据所选择的图像尺寸调整算法控制所述图像尺寸调整装置中的数据流向,并通过所述图像尺寸调整装置得到完成放缩后的计算结果,包括:
若所述图像尺寸调整算法为双线性插值方法,则使用如下公式进行计算:
Figure DEST_PATH_IMAGE001
其中,
Figure 100002_DEST_PATH_IMAGE002
表示新图像的像素数据,
Figure DEST_PATH_IMAGE003
Figure 100002_DEST_PATH_IMAGE004
表示所述第一图像位置系数,
Figure DEST_PATH_IMAGE005
Figure 100002_DEST_PATH_IMAGE006
表示 所述第二图像位置系数,
Figure DEST_PATH_IMAGE007
Figure 100002_DEST_PATH_IMAGE008
Figure DEST_PATH_IMAGE009
Figure 100002_DEST_PATH_IMAGE010
表示原图像的4个像素数据。
可选的,所述根据所选择的图像尺寸调整算法控制所述图像尺寸调整装置中的数据流向,并通过所述图像尺寸调整装置得到完成放缩后的计算结果,包括:
若所述图像尺寸调整算法为三次插值方法,则使用如下公式进行计算:
Figure DEST_PATH_IMAGE011
其中,
Figure 920971DEST_PATH_IMAGE002
表示新图像的像素数据,
Figure 103691DEST_PATH_IMAGE003
Figure 352269DEST_PATH_IMAGE004
Figure 100002_DEST_PATH_IMAGE012
Figure DEST_PATH_IMAGE013
表示所述第一图像位置系数,
Figure 311260DEST_PATH_IMAGE005
Figure 922370DEST_PATH_IMAGE006
Figure 100002_DEST_PATH_IMAGE014
Figure DEST_PATH_IMAGE015
表示所述第二图像位置系数,
Figure 807150DEST_PATH_IMAGE007
Figure 667658DEST_PATH_IMAGE008
Figure 132138DEST_PATH_IMAGE009
Figure 269858DEST_PATH_IMAGE010
Figure 100002_DEST_PATH_IMAGE016
Figure DEST_PATH_IMAGE017
Figure 100002_DEST_PATH_IMAGE018
Figure DEST_PATH_IMAGE019
Figure 100002_DEST_PATH_IMAGE020
Figure DEST_PATH_IMAGE021
Figure 100002_DEST_PATH_IMAGE022
Figure DEST_PATH_IMAGE023
Figure 100002_DEST_PATH_IMAGE024
Figure DEST_PATH_IMAGE025
Figure 100002_DEST_PATH_IMAGE026
Figure DEST_PATH_IMAGE027
表示原图像的16个像素数据。
可选的,所述获取所需的图像位置系数,包括:
通过前级模块根据预设图像放缩比例及所述图像尺寸调整算法计算所述图像位置系数。
第三方面,本发明实施例还提供了一种计算机设备,该计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所提供的图像尺寸调整方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所提供的图像尺寸调整方法。
本发明实施例提供了一种基于数据流架构的图像尺寸调整装置,包括第一乘法运算单元、第二乘法运算单元、第一数据寄存单元、第二数据寄存单元、第一加法运算单元和第二加法运算单元,各个单元的输入输出端口按照设定的数据流向进行连接,通过在数据流架构中构建用于调整图像尺寸的专用单元,并控制待计算的图像数据依次流经不同的计算单元,避免了调用CPU进行基于指令集的计算,实现了图像数据的快速计算,并释放了CPU的计算压力,从而实现了视频及图像流的快速缩放处理,有效的减缓了AI芯片的前后处理效率低下的瓶颈问题。
附图说明
图1为本发明实施例一提供的基于数据流架构的图像尺寸调整装置的结构示意图;
图2为本发明实施例一提供的另一种基于数据流架构的图像尺寸调整装置的结构示意图;
图3为本发明实施例二提供的图像尺寸调整方法的流程图;
图4为本发明实施例三提供的计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
此外,术语“第一”、“第二”等可在本文中用于描述各种方向、动作、步骤或元件等,但这些方向、动作、步骤或元件不受这些术语限制。这些术语仅用于将第一个方向、动作、步骤或元件与另一个方向、动作、步骤或元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一输入端称为第二输入端,且类似地,可将第二输入端称为第一输入端。第一输入端和第二输入端两者都是输入端,但其不是同一输入端。术语“第一”、“第二”等不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
实施例一
图1为本发明实施例一提供的基于数据流架构的图像尺寸调整装置的结构示意图,本实施例可适用于对视频及图像流相关数据进行前后端计算处理的情况。如图1所示,该图像尺寸调整装置包括:第一乘法运算单元11、第二乘法运算单元12、第一数据寄存单元13、第二数据寄存单元14、第一加法运算单元15和第二加法运算单元16;其中,所述第一乘法运算单元11的第一输入端111用于接收待计算的图像数据,第二输入端112用于接收第一图像位置系数,所述第一乘法运算单元11的输出端113分别与所述第一数据寄存单元13的输入端131和所述第一加法运算单元15的第三输入端151连接,所述第一数据寄存单元13的输出端132与所述第一加法运算单元15的第四输入端152连接,所述第一加法运算单元15的输出端153与所述第二乘法运算单元12的第五输入端121连接,所述第二乘法运算单元12的第六输入端122用于接收第二图像位置系数,所述第二乘法运算单元12的输出端123分别与所述第二数据寄存单元14的输入端141和所述第二加法运算单元16的第七输入端161连接,所述第二数据寄存单元14的输出端142与所述第二加法运算单元16的第八输入端162连接,所述第二加法运算单元16的输出端163用于输出所述图像数据的计算结果;所述第一数据寄存单元13用于在串行运算中存储所述第一乘法运算单元11上一次的运算结果,所述第二数据寄存单元14用于在串行运算中存储所述第二乘法运算单元12上一次的运算结果。
具体的,可以根据约定的时序要求分别从该装置中第一乘法运算单元11的第一输入端111、第二输入端112和第二乘法运算单元12的第六输入端122输入待计算的图像数据、第一图像位置系数和第二图像位置系数,则该装置可以采用双线性插值方法对输入的图像数据进行计算,以得到放缩后的计算结果。在此之前,可以根据预设图像缩放比例由前级模块先行计算得到行与列方向上对应的第一图像位置系数和第二图像位置系数。其中,双线性插值方法可以采用如下公式进行计算:
Figure 309227DEST_PATH_IMAGE001
其中,
Figure 657032DEST_PATH_IMAGE002
表示计算结果,即新图像的像素数据,
Figure 659623DEST_PATH_IMAGE003
Figure 651850DEST_PATH_IMAGE004
表示第一图像位置系数,
Figure 409590DEST_PATH_IMAGE005
Figure 120057DEST_PATH_IMAGE006
表示第二图像位置系数,
Figure 660760DEST_PATH_IMAGE007
Figure 632127DEST_PATH_IMAGE008
Figure 436135DEST_PATH_IMAGE009
Figure 274645DEST_PATH_IMAGE010
表示原图像中对应所需的4个像素数据。则可以 通过第一乘法运算单元11分别计算
Figure 100002_DEST_PATH_IMAGE028
Figure DEST_PATH_IMAGE029
Figure 100002_DEST_PATH_IMAGE030
Figure DEST_PATH_IMAGE031
,再通过第一加法运算 单元15计算得到
Figure 100002_DEST_PATH_IMAGE032
Figure DEST_PATH_IMAGE033
,再通过第二乘法运算单元12计算得 到
Figure 100002_DEST_PATH_IMAGE034
Figure DEST_PATH_IMAGE035
,最后即可通过第二加法运算单元16 计算得到
Figure 9252DEST_PATH_IMAGE002
并进行输出,其中的加法运算可以分别通过第一数据寄存单元13和第二数据寄 存单元14存储其前级单元上一次运算结果来实现。然后通过控制待计算的图像数据依次进 入并流经各个计算单元,即可完成整张图像的计算。
在上述技术方案的基础上,可选的,如图2所示,在所述第一加法运算单元15和所述第二乘法运算单元12之间,还包括第一数据选择单元21和第一数据分配单元22,在所述第一数据选择单元21和所述第一数据分配单元22之间,还包括第三数据寄存单元23和第三加法运算单元24;其中,所述第一加法运算单元15的输出端153与所述第一数据选择单元21的输入端211连接,所述第一数据分配单元22的输出端223与所述第二乘法运算单元12的输入端121连接,所述第一数据选择单元21的第一输出端212直接与所述第一数据分配单元22的第九输入端221连接,所述第一数据分配单元22的第十输入端222与所述第三加法运算单元24的输出端243连接,所述第一数据选择单元21的第二输出端213分别与所述第三数据寄存单元23的输入端231和所述第三加法运算单元24的第十一输入端241连接,所述第三数据寄存单元23的输出端232与所述第三加法运算单元24的第十二输入端242连接;在所述第二加法运算单元16之后,还包括第二数据选择单元25和第二数据分配单元26,在所述第二数据选择单元25和所述第二数据分配单元26之间,还包括第四数据寄存单元27和第四加法运算单元28;其中,所述第二加法运算单元16的输出端163与所述第二数据选择单元25的输入端251连接,所述第二数据分配单元26的输出端263用于输出所述图像数据的计算结果,所述第二数据选择单元25的第三输出端252直接与所述第二数据分配单元26的第十三输入端261连接,所述第二数据分配单元26的第十四输入端262与所述第四加法运算单元28的输出端283连接,所述第二数据选择单元25的第四输出端253分别与所述第四数据寄存单元27的输入端271和所述第四加法运算单元28的第十五输入端281连接,所述第四数据寄存单元27的输出端272与所述第四加法运算单元28的第十六输入端282连接。
进一步可选的,若所述第一数据选择单元21和所述第一数据分配单元22选择使用所述第一输出端212到所述第九输入端221的数据流向,且所述第二数据选择单元25和所述第二数据分配单元26选择使用所述第三输出端252到所述第十三输入端261的数据流向,则所述图像尺寸调整装置采用双线性插值方法。以及,可选的,若所述第一数据选择单元21和所述第一数据分配单元22选择使用所述第二输出端213到所述第十输入端222的数据流向,且所述第二数据选择单元25和所述第二数据分配单元26选择使用所述第四输出端253到所述第十四输入端262的数据流向,则所述图像尺寸调整装置采用三次插值方法。
具体的,可以通过成组的数据选择单元和数据分配单元配合进行旁路处理,以使本实施例所提供的图像尺寸调整装置可以选择使用双线性插值方法或者三次插值方法对输入的图像数据进行计算,以得到对应放缩后的计算结果。当第一数据选择单元21和第一数据分配单元22选择使用第一输出端212到第九输入端221的数据流向,且第二数据选择单元25和第二数据分配单元26选择使用第三输出端252到第十三输入端261的数据流向时,该装置可以采用双线性插值方法对输入的图像数据进行计算,具体的计算过程如上所述,在此不再冗述。当第一数据选择单元21和第一数据分配单元22选择使用第二输出端213到第十输入端222的数据流向,且第二数据选择单元25和第二数据分配单元26选择使用第四输出端253到第十四输入端262的数据流向时,该装置可以采用三次插值方法对输入的图像数据进行计算,具体可以采用如下公式:
Figure 772808DEST_PATH_IMAGE011
其中,
Figure 639396DEST_PATH_IMAGE002
表示计算结果,即新图像的像素数据,
Figure 58876DEST_PATH_IMAGE003
Figure 269277DEST_PATH_IMAGE004
Figure 90603DEST_PATH_IMAGE012
Figure 626626DEST_PATH_IMAGE013
表示第一图像位置系 数,
Figure 533402DEST_PATH_IMAGE005
Figure 219599DEST_PATH_IMAGE006
Figure 285644DEST_PATH_IMAGE014
Figure 602355DEST_PATH_IMAGE015
表示第二图像位置系数,
Figure 619597DEST_PATH_IMAGE007
Figure 109484DEST_PATH_IMAGE008
Figure 639822DEST_PATH_IMAGE009
Figure 252069DEST_PATH_IMAGE010
Figure 133437DEST_PATH_IMAGE016
Figure 478880DEST_PATH_IMAGE017
Figure 722780DEST_PATH_IMAGE018
Figure 270042DEST_PATH_IMAGE019
Figure 389439DEST_PATH_IMAGE020
Figure 549025DEST_PATH_IMAGE021
Figure 319535DEST_PATH_IMAGE022
Figure 8005DEST_PATH_IMAGE023
Figure 660703DEST_PATH_IMAGE024
Figure 499346DEST_PATH_IMAGE025
Figure 717838DEST_PATH_IMAGE026
Figure 983734DEST_PATH_IMAGE027
表示原图像中对应所需的16个像素数据。则可以通过第一乘法运算单元11 串行计算
Figure 100002_DEST_PATH_IMAGE036
Figure DEST_PATH_IMAGE037
Figure 100002_DEST_PATH_IMAGE038
Figure DEST_PATH_IMAGE039
Figure 100002_DEST_PATH_IMAGE040
Figure DEST_PATH_IMAGE041
Figure 100002_DEST_PATH_IMAGE042
Figure DEST_PATH_IMAGE043
Figure 100002_DEST_PATH_IMAGE044
Figure DEST_PATH_IMAGE045
Figure 100002_DEST_PATH_IMAGE046
Figure DEST_PATH_IMAGE047
Figure 100002_DEST_PATH_IMAGE048
Figure DEST_PATH_IMAGE049
Figure 100002_DEST_PATH_IMAGE050
Figure DEST_PATH_IMAGE051
,再通过第一加法运算单元15将其 中的相邻乘积,串行的两两相加,分别得到
Figure 100002_DEST_PATH_IMAGE052
Figure DEST_PATH_IMAGE053
Figure 100002_DEST_PATH_IMAGE054
Figure DEST_PATH_IMAGE055
Figure DEST_PATH_IMAGE056
Figure DEST_PATH_IMAGE057
Figure DEST_PATH_IMAGE058
Figure DEST_PATH_IMAGE059
,再通过第三加法运算单元24将其中的相邻加和,串行的两两相加,分 别得到
Figure DEST_PATH_IMAGE060
Figure DEST_PATH_IMAGE061
Figure DEST_PATH_IMAGE062
Figure DEST_PATH_IMAGE063
,再通过第 二乘法运算单元12将得到的各个加和,串行的分别与
Figure 396831DEST_PATH_IMAGE005
Figure 163798DEST_PATH_IMAGE006
Figure 440059DEST_PATH_IMAGE014
Figure 876856DEST_PATH_IMAGE015
相乘,分别得到
Figure DEST_PATH_IMAGE064
Figure DEST_PATH_IMAGE065
Figure DEST_PATH_IMAGE066
Figure DEST_PATH_IMAGE067
, 再通过第二加法运算单元16将其中的相邻乘积,串行的两两相加,得到
Figure DEST_PATH_IMAGE068
Figure DEST_PATH_IMAGE069
,最后即可通过第四加法运 算单元28计算得到
Figure 195492DEST_PATH_IMAGE002
并进行输出,其中的加法运算可以分别通过第一数据寄存单元13、第 二数据寄存单元14、第三数据寄存单元23和第四数据寄存单元27存储其前级单元上一次运 算结果来实现,其中,第三数据寄存单元23可用于在串行计算中存储第一加法运算单元15 上一次的运算结果,第四数据寄存单元27可用于在串行计算中存储第二加法运算单元16上 一次的运算结果。然后通过控制待计算的图像数据依次进入并流经各个计算单元,即可完 成整张图像的计算。
本发明实施例所提供的基于数据流架构的图像尺寸调整装置,包括第一乘法运算单元、第二乘法运算单元、第一数据寄存单元、第二数据寄存单元、第一加法运算单元和第二加法运算单元,各个单元的输入输出端口按照设定的数据流向进行连接,通过在数据流架构中构建用于调整图像尺寸的专用单元,并控制待计算的图像数据依次流经不同的计算单元,避免了调用CPU进行基于指令集的计算,实现了图像数据的快速计算,并释放了CPU的计算压力,从而实现了视频及图像流的快速缩放处理,有效的减缓了AI芯片的前后处理效率低下的瓶颈问题。
实施例二
图3为本发明实施例二提供的图像尺寸调整方法的流程图。本实施例可适用于对视频及图像流相关数据进行前后端计算处理的情况,该方法可以应用于本发明任意实施例所提供的基于数据流架构的图像尺寸调整装置,具备该装置相应的方法流程和有益效果。如图3所示,具体包括如下步骤:
S31、获取待计算的图像数据及所需的图像位置系数,所述图像位置系数包括行方向上的第一图像位置系数和列方向上的第二图像位置系数。
S32、根据预设时序要求,将所述图像数据和所述图像位置系数输入到所述图像尺寸调整装置的对应端口中。
S33、根据所选择的图像尺寸调整算法控制所述图像尺寸调整装置中的数据流向,并通过所述图像尺寸调整装置得到完成放缩后的计算结果。
其中,可选的,所述根据所选择的图像尺寸调整算法控制所述图像尺寸调整装置中的数据流向,并通过所述图像尺寸调整装置得到完成放缩后的计算结果,包括:
若所述图像尺寸调整算法为双线性插值方法,则使用如下公式进行计算:
Figure 375938DEST_PATH_IMAGE001
其中,
Figure 834601DEST_PATH_IMAGE002
表示新图像的像素数据,
Figure 176720DEST_PATH_IMAGE003
Figure 25728DEST_PATH_IMAGE004
表示所述第一图像位置系数,
Figure 868919DEST_PATH_IMAGE005
Figure 57455DEST_PATH_IMAGE006
表示 所述第二图像位置系数,
Figure 226268DEST_PATH_IMAGE007
Figure 500254DEST_PATH_IMAGE008
Figure 648601DEST_PATH_IMAGE009
Figure 753961DEST_PATH_IMAGE010
表示原图像的4个像素数据。
以及,可选的,所述根据所选择的图像尺寸调整算法控制所述图像尺寸调整装置中的数据流向,并通过所述图像尺寸调整装置得到完成放缩后的计算结果,包括:
若所述图像尺寸调整算法为三次插值方法,则使用如下公式进行计算:
Figure 703462DEST_PATH_IMAGE011
其中,
Figure 323799DEST_PATH_IMAGE002
表示新图像的像素数据,
Figure 649738DEST_PATH_IMAGE003
Figure 937500DEST_PATH_IMAGE004
Figure 854641DEST_PATH_IMAGE012
Figure 368799DEST_PATH_IMAGE013
表示所述第一图像位置系数,
Figure 42969DEST_PATH_IMAGE005
Figure 60604DEST_PATH_IMAGE006
Figure 476541DEST_PATH_IMAGE014
Figure 212416DEST_PATH_IMAGE015
表示所述第二图像位置系数,
Figure 676896DEST_PATH_IMAGE007
Figure 175135DEST_PATH_IMAGE008
Figure 637341DEST_PATH_IMAGE009
Figure 985145DEST_PATH_IMAGE010
Figure 987736DEST_PATH_IMAGE016
Figure 979963DEST_PATH_IMAGE017
Figure 737704DEST_PATH_IMAGE018
Figure 182591DEST_PATH_IMAGE019
Figure 988873DEST_PATH_IMAGE020
Figure 225820DEST_PATH_IMAGE021
Figure 764248DEST_PATH_IMAGE022
Figure 602759DEST_PATH_IMAGE023
Figure 150415DEST_PATH_IMAGE024
Figure 913971DEST_PATH_IMAGE025
Figure 13514DEST_PATH_IMAGE026
Figure 432994DEST_PATH_IMAGE027
表示原图像的16个像素数据。
可选的,所述获取所需的图像位置系数,包括:
通过前级模块根据预设图像放缩比例及所述图像尺寸调整算法计算所述图像位置系数。
具体的,在需要对视频及图像流相关数据进行前后端计算处理时,首先可以通过本装置的前级模块根据预设图像放缩比例及所选择的图像尺寸调整算法计算所需的图像位置系数,然后可以同获取到的需要调整的图像数据基于约定的时序要求,对应输入到图像尺寸调整装置的相应端口中,如上所述,可以将图像数据输入到该装置中第一乘法运算单元的第一输入端,将第一图像位置系数和第二图像位置系数分别输入到该装置中第一乘法运算单元的第二输入端和第二乘法运算单元的第六输入端,再根据所选择的图像尺寸调整算法控制该装置中的数据流向,具体可以通过控制其中第一数据选择单元、第一数据分配单元、第二数据选择单元和第二数据分配单元所启用的输入输出端口来实现,从而使用该装置进行计算。计算过程具体可以采用双线性插值方法或三次插值方法,具体的计算过程可以参考上述说明,在此将不再冗述。
本发明实施例所提供的技术方案,通过在数据流架构中构建用于调整图像尺寸的专用单元,并控制待计算的图像数据依次流经不同的计算单元,避免了调用CPU进行基于指令集的计算,实现了图像数据的快速计算,并释放了CPU的计算压力,从而实现了视频及图像流的快速缩放处理,有效的减缓了AI芯片的前后处理效率低下的瓶颈问题。
实施例三
图4为本发明实施例三提供的计算机设备的结构示意图,示出了适于用来实现本发明实施方式的示例性计算机设备的框图。图4显示的计算机设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。如图4所示,该计算机设备包括处理器41、存储器42、输入装置43及输出装置44;计算机设备中处理器41的数量可以是一个或多个,图4中以一个处理器41为例,计算机设备中的处理器41、存储器42、输入装置43及输出装置44可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储器42作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的图像尺寸调整方法对应的程序指令/模块。处理器41通过运行存储在存储器42中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的图像尺寸调整方法。
存储器42可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器42可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器42可进一步包括相对于处理器41远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置43可用于获取待计算的图像数据及所需的图像位置系数,以及产生与计算机设备的用户设置和功能控制有关的键信号输入等。输出装置44可用于向后续模块传输计算结果等等。
实施例四
本发明实施例四还提供一种包含计算机可执行指令的存储介质,该计算机可执行指令在由计算机处理器执行时用于执行一种图像尺寸调整方法,该方法包括:
获取待计算的图像数据及所需的图像位置系数,所述图像位置系数包括行方向上的第一图像位置系数和列方向上的第二图像位置系数;
根据预设时序要求,将所述图像数据和所述图像位置系数输入到所述图像尺寸调整装置的对应端口中;
根据所选择的图像尺寸调整算法控制所述图像尺寸调整装置中的数据流向,并通过所述图像尺寸调整装置得到完成放缩后的计算结果。
存储介质可以是任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括:安装介质,例如CD-ROM、软盘或磁带装置;计算机***存储器或随机存取存储器,诸如DRAM、DDR RAM、SRAM、EDO RAM、兰巴斯(Rambus)RAM等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的计算机***中,或者可以位于不同的第二计算机***中,第二计算机***通过网络(诸如因特网)连接到计算机***。第二计算机***可以提供程序指令给计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机***中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的图像尺寸调整方法中的相关操作。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory, ROM)、随机存取存储器(RandomAccess Memory, RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种基于数据流架构的图像尺寸调整装置,其特征在于,包括:第一乘法运算单元、第二乘法运算单元、第一数据寄存单元、第二数据寄存单元、第一加法运算单元和第二加法运算单元;其中,
所述第一乘法运算单元的第一输入端用于接收待计算的图像数据,第二输入端用于接收第一图像位置系数,所述第一乘法运算单元的输出端分别与所述第一数据寄存单元的输入端和所述第一加法运算单元的第三输入端连接,所述第一数据寄存单元的输出端与所述第一加法运算单元的第四输入端连接,所述第一加法运算单元的输出端与所述第二乘法运算单元的第五输入端连接,所述第二乘法运算单元的第六输入端用于接收第二图像位置系数,所述第二乘法运算单元的输出端分别与所述第二数据寄存单元的输入端和所述第二加法运算单元的第七输入端连接,所述第二数据寄存单元的输出端与所述第二加法运算单元的第八输入端连接,所述第二加法运算单元的输出端用于输出所述图像数据的计算结果;所述第一数据寄存单元用于在串行运算中存储所述第一乘法运算单元上一次的运算结果,所述第二数据寄存单元用于在串行运算中存储所述第二乘法运算单元上一次的运算结果。
2.根据权利要求1所述的基于数据流架构的图像尺寸调整装置,其特征在于,在所述第一加法运算单元和所述第二乘法运算单元之间,还包括第一数据选择单元和第一数据分配单元,在所述第一数据选择单元和所述第一数据分配单元之间,还包括第三数据寄存单元和第三加法运算单元;其中,
所述第一加法运算单元的输出端与所述第一数据选择单元的输入端连接,所述第一数据分配单元的输出端与所述第二乘法运算单元的输入端连接,所述第一数据选择单元的第一输出端直接与所述第一数据分配单元的第九输入端连接,所述第一数据分配单元的第十输入端与所述第三加法运算单元的输出端连接,所述第一数据选择单元的第二输出端分别与所述第三数据寄存单元的输入端和所述第三加法运算单元的第十一输入端连接,所述第三数据寄存单元的输出端与所述第三加法运算单元的第十二输入端连接;
在所述第二加法运算单元之后,还包括第二数据选择单元和第二数据分配单元,在所述第二数据选择单元和所述第二数据分配单元之间,还包括第四数据寄存单元和第四加法运算单元;其中,
所述第二加法运算单元的输出端与所述第二数据选择单元的输入端连接,所述第二数据分配单元的输出端用于输出所述图像数据的计算结果,所述第二数据选择单元的第三输出端直接与所述第二数据分配单元的第十三输入端连接,所述第二数据分配单元的第十四输入端与所述第四加法运算单元的输出端连接,所述第二数据选择单元的第四输出端分别与所述第四数据寄存单元的输入端和所述第四加法运算单元的第十五输入端连接,所述第四数据寄存单元的输出端与所述第四加法运算单元的第十六输入端连接。
3.根据权利要求2所述的基于数据流架构的图像尺寸调整装置,其特征在于,若所述第一数据选择单元和所述第一数据分配单元选择使用所述第一输出端到所述第九输入端的数据流向,且所述第二数据选择单元和所述第二数据分配单元选择使用所述第三输出端到所述第十三输入端的数据流向,则所述图像尺寸调整装置采用双线性插值方法。
4.根据权利要求2所述的基于数据流架构的图像尺寸调整装置,其特征在于,若所述第一数据选择单元和所述第一数据分配单元选择使用所述第二输出端到所述第十输入端的数据流向,且所述第二数据选择单元和所述第二数据分配单元选择使用所述第四输出端到所述第十四输入端的数据流向,则所述图像尺寸调整装置采用三次插值方法。
5.一种图像尺寸调整方法,应用于如权利要求2所述的基于数据流架构的图像尺寸调整装置,其特征在于,包括:
获取待计算的图像数据及所需的图像位置系数,所述图像位置系数包括行方向上的第一图像位置系数和列方向上的第二图像位置系数;
根据预设时序要求,将所述图像数据和所述图像位置系数输入到所述图像尺寸调整装置的对应端口中;
根据所选择的图像尺寸调整算法控制所述图像尺寸调整装置中的数据流向,并通过所述图像尺寸调整装置得到完成放缩后的计算结果。
6.根据权利要求5所述的图像尺寸调整方法,其特征在于,所述根据所选择的图像尺寸调整算法控制所述图像尺寸调整装置中的数据流向,并通过所述图像尺寸调整装置得到完成放缩后的计算结果,包括:
若所述图像尺寸调整算法为双线性插值方法,则使用如下公式进行计算:
Figure DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE004
表示新图像的像素数据,
Figure DEST_PATH_IMAGE006
Figure DEST_PATH_IMAGE008
表示所述第一图像位置系数,
Figure DEST_PATH_IMAGE010
Figure DEST_PATH_IMAGE012
表示所述第二图像位置系数,
Figure DEST_PATH_IMAGE014
Figure DEST_PATH_IMAGE016
Figure DEST_PATH_IMAGE018
Figure DEST_PATH_IMAGE020
表示原图像的4个像素数据。
7.根据权利要求5所述的图像尺寸调整方法,其特征在于,所述根据所选择的图像尺寸调整算法控制所述图像尺寸调整装置中的数据流向,并通过所述图像尺寸调整装置得到完成放缩后的计算结果,包括:
若所述图像尺寸调整算法为三次插值方法,则使用如下公式进行计算:
Figure DEST_PATH_IMAGE022
其中,
Figure 818524DEST_PATH_IMAGE004
表示新图像的像素数据,
Figure 470085DEST_PATH_IMAGE006
Figure 718664DEST_PATH_IMAGE008
Figure DEST_PATH_IMAGE024
Figure DEST_PATH_IMAGE026
表示所述第一图像位置系数,
Figure 35244DEST_PATH_IMAGE010
Figure 584037DEST_PATH_IMAGE012
Figure DEST_PATH_IMAGE028
Figure DEST_PATH_IMAGE030
表示所述第二图像位置系数,
Figure 327871DEST_PATH_IMAGE014
Figure 329325DEST_PATH_IMAGE016
Figure 997067DEST_PATH_IMAGE018
Figure 400366DEST_PATH_IMAGE020
Figure DEST_PATH_IMAGE032
Figure DEST_PATH_IMAGE034
Figure DEST_PATH_IMAGE036
Figure DEST_PATH_IMAGE038
Figure DEST_PATH_IMAGE040
Figure DEST_PATH_IMAGE042
Figure DEST_PATH_IMAGE044
Figure DEST_PATH_IMAGE046
Figure DEST_PATH_IMAGE048
Figure DEST_PATH_IMAGE050
Figure DEST_PATH_IMAGE052
Figure DEST_PATH_IMAGE054
表示原图像的16个像素数据。
8.根据权利要求5所述的图像尺寸调整方法,其特征在于,所述获取所需的图像位置系数,包括:
通过前级模块根据预设图像放缩比例及所述图像尺寸调整算法计算所述图像位置系数。
9.一种计算机设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求5-8中任一所述的图像尺寸调整方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求5-8中任一所述的图像尺寸调整方法。
CN202210007701.2A 2022-01-06 2022-01-06 基于数据流架构的图像尺寸调整装置、调整方法及设备 Active CN114022366B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202210007701.2A CN114022366B (zh) 2022-01-06 2022-01-06 基于数据流架构的图像尺寸调整装置、调整方法及设备
PCT/CN2023/070762 WO2023131252A1 (zh) 2022-01-06 2023-01-05 基于数据流架构的图像尺寸调整结构、调整方法及图像缩放方法和装置
US18/301,985 US20230252600A1 (en) 2022-01-06 2023-04-17 Image size adjustment structure, adjustment method, and image scaling method and device based on streaming architecture

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210007701.2A CN114022366B (zh) 2022-01-06 2022-01-06 基于数据流架构的图像尺寸调整装置、调整方法及设备

Publications (2)

Publication Number Publication Date
CN114022366A CN114022366A (zh) 2022-02-08
CN114022366B true CN114022366B (zh) 2022-03-18

Family

ID=80069856

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210007701.2A Active CN114022366B (zh) 2022-01-06 2022-01-06 基于数据流架构的图像尺寸调整装置、调整方法及设备

Country Status (1)

Country Link
CN (1) CN114022366B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023131252A1 (zh) * 2022-01-06 2023-07-13 深圳鲲云信息科技有限公司 基于数据流架构的图像尺寸调整结构、调整方法及图像缩放方法和装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286226A (zh) * 2008-05-23 2008-10-15 杭州华三通信技术有限公司 一种缩小图像的数字滤波方法和装置
CN101483036A (zh) * 2008-01-10 2009-07-15 扬智科技股份有限公司 图像缩小装置及其缩小方法
CN107656899A (zh) * 2017-09-27 2018-02-02 深圳大学 一种基于fpga的模板卷积实现方法和***
CN108986033A (zh) * 2018-07-26 2018-12-11 西安电子科技大学 基于双线性插值算法处理的图像缩放方法
CN109902063A (zh) * 2019-02-01 2019-06-18 京微齐力(北京)科技有限公司 一种集成有二维卷积阵列的***芯片
CN110223232A (zh) * 2019-06-06 2019-09-10 电子科技大学 一种基于双线性插值算法的视频图像放大方法
CN111178495A (zh) * 2018-11-10 2020-05-19 杭州凝眸智能科技有限公司 用于检测图像中极小物体的轻量卷积神经网络
CN111724304A (zh) * 2020-06-12 2020-09-29 深圳市爱协生科技有限公司 一种图像缩放方法、装置、终端设备及存储介质
CN113091699A (zh) * 2021-03-31 2021-07-09 中煤科工集团重庆研究院有限公司 一种基于视频图像的微小位移放大方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101483036A (zh) * 2008-01-10 2009-07-15 扬智科技股份有限公司 图像缩小装置及其缩小方法
CN101286226A (zh) * 2008-05-23 2008-10-15 杭州华三通信技术有限公司 一种缩小图像的数字滤波方法和装置
CN107656899A (zh) * 2017-09-27 2018-02-02 深圳大学 一种基于fpga的模板卷积实现方法和***
CN108986033A (zh) * 2018-07-26 2018-12-11 西安电子科技大学 基于双线性插值算法处理的图像缩放方法
CN111178495A (zh) * 2018-11-10 2020-05-19 杭州凝眸智能科技有限公司 用于检测图像中极小物体的轻量卷积神经网络
CN109902063A (zh) * 2019-02-01 2019-06-18 京微齐力(北京)科技有限公司 一种集成有二维卷积阵列的***芯片
CN110223232A (zh) * 2019-06-06 2019-09-10 电子科技大学 一种基于双线性插值算法的视频图像放大方法
CN111724304A (zh) * 2020-06-12 2020-09-29 深圳市爱协生科技有限公司 一种图像缩放方法、装置、终端设备及存储介质
CN113091699A (zh) * 2021-03-31 2021-07-09 中煤科工集团重庆研究院有限公司 一种基于视频图像的微小位移放大方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种用于高速数据流的并行数字下变频方法;史秀花 等;《制导与引信》;20150630;第36卷(第2期);49-53,59 *
基于行列不同插值算法的图像缩放引擎的设计;蔡泽锋等;《液晶与显示》;20090815(第04期);131-135 *

Also Published As

Publication number Publication date
CN114022366A (zh) 2022-02-08

Similar Documents

Publication Publication Date Title
KR102443546B1 (ko) 행렬 곱셈기
JP7007488B2 (ja) ハードウェアベースのプーリングのシステムおよび方法
JP7256914B2 (ja) ベクトル縮小プロセッサ
CN109213962B (zh) 运算加速器
CN104915322B (zh) 一种卷积神经网络硬件加速方法
CN107680028B (zh) 用于缩放图像的处理器和方法
CN114092336B (zh) 基于双线性插值算法的图像缩放方法、装置、设备及介质
CN110738308B (zh) 一种神经网络加速器
US11983616B2 (en) Methods and apparatus for constructing digital circuits for performing matrix operations
EP4010794A1 (en) Tensor-based hardware accelerator including a scalar-processing unit
CN111898733A (zh) 一种深度可分离卷积神经网络加速器架构
CN111583095B (zh) 图像数据存储方法、图像数据处理方法、***及相关装置
WO2022226721A1 (zh) 一种矩阵乘法器及矩阵乘法器的控制方法
US20200134433A1 (en) Integrated circuit
CN114022366B (zh) 基于数据流架构的图像尺寸调整装置、调整方法及设备
EP3729254B1 (en) A programmable multiply-add array hardware
CN110147252A (zh) 一种卷积神经网络的并行计算方法及装置
CN114461978B (zh) 数据处理方法、装置、电子设备及可读存储介质
CN112905530A (zh) 片上架构、池化计算加速器阵列、单元以及控制方法
CN108491924B (zh) 一种面向人工智能计算的神经网络数据串行流水处理装置
CN112836813A (zh) 一种用于混合精度神经网络计算的可重构脉动阵列***
CN115310037A (zh) 矩阵乘法计算单元、加速单元、计算***和相关方法
CN110414672B (zh) 卷积运算方法、装置及***
CN116822616A (zh) 一种用于大语言模型中Softmax函数训练的装置
CN114327639A (zh) 基于数据流架构的加速器、加速器的数据存取方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant