CN106095392A - 混洗模式生成方法和装置 - Google Patents

混洗模式生成方法和装置 Download PDF

Info

Publication number
CN106095392A
CN106095392A CN201610443245.0A CN201610443245A CN106095392A CN 106095392 A CN106095392 A CN 106095392A CN 201610443245 A CN201610443245 A CN 201610443245A CN 106095392 A CN106095392 A CN 106095392A
Authority
CN
China
Prior art keywords
shuffle
mode
instruction
shuffle mode
generates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610443245.0A
Other languages
English (en)
Other versions
CN106095392B (zh
Inventor
汪文祥
刘天义
吴瑞阳
沈海华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Loongson Technology Corp Ltd
Original Assignee
Loongson Technology Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Loongson Technology Corp Ltd filed Critical Loongson Technology Corp Ltd
Priority to CN201610443245.0A priority Critical patent/CN106095392B/zh
Publication of CN106095392A publication Critical patent/CN106095392A/zh
Application granted granted Critical
Publication of CN106095392B publication Critical patent/CN106095392B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Executing Machine-Instructions (AREA)

Abstract

本发明提供一种混洗模式生成方法和装置,其中,混洗模式生成方法包括:获取混洗模式生成指令的输入操作数;混洗模式生成指令用于为混洗指令生成混洗模式;输入操作数包括:生成模式和基础偏移量;根据生成模式获取与生成模式相对应的偏移向量;根据所述偏移向量中的各个偏移值和所述基础偏移量,生成混洗模式;将混洗模式存储在混洗模式生成指令的输出操作数所指示的寄存器中。本发明提供的混洗模式生成方法,可以简化混洗模式设计的难度,提高混洗模式编程的灵活性。

Description

混洗模式生成方法和装置
技术领域
本发明涉及计算机数据处理领域,尤其涉及一种混洗模式生成方法和装置。
背景技术
随着多媒体应用的发展,处理器越来越多的计算任务都来自于数字图像处理领域,基于图像的应用成为服务器、桌面计算机、个人移动设备以及嵌入式设备中不可忽视的工作负载。针对数字图像处理软件的实际情况,对指令集架构进行更新,在处理器中加入对应用中常用操作的指令支持,是处理器发展的一个主要方向,同时也是处理器针对特定应用提升性能的简单且有效的方法,因此,越来越多的处理器中增加了单指令多数据流(Single Instruction Multiple Data,简称SIMD)结构,以支持规则数据集合上的同种操作。
目前,SIMD处理器中普遍引入了混洗指令,混洗指令是指按照特定图像处理算法要求的数据格式进行混洗,然后,用一条运算指令对向量寄存器中的元素同时进行操作,这样就在硬件层面大大优化了多媒体处理和矩阵运算中操作数集合的快速生成。例如:在无互锁流水线级的微处理器(Million Instructions Per Second,简称MIPS)向量指令架构中,混洗指令具体为VSHF.B wd,ws,wt,其中,ws和wt均为源寄存器,wd既是目的寄存器,同时也是模式控制寄存器,wd中包括混洗模式,所谓混洗模式,是指结果数据中各元素在源数据中的位置索引。在寄存器为128位的情况下,ws、wt和wd均包含有16个字节,wd中包括有16个混洗模式字节,则运行混洗指令VSHF.B wd,ws,wt之后,新生成的目的寄存器wd,是按照wd中16个混洗模式字节的模式要求,从ws和wt拼接后的256位(也即32个字节)中选择16个字节形成的目标向量。
但是,混洗指令VSHF.B wd,ws,wt在对数据元素进行混洗操作时,往往需要程序员提前设计1到16个甚至更多的混洗模式的字节,过程繁琐,使得混洗模式编程的灵活性受限。
发明内容
本发明提供一种混洗模式生成方法和装置,通过混洗模式生成指令为混洗指令自动生成混洗模式,简化了混洗模式设计的难度,提高了混洗模式编程的灵活性。
本发明提供的混洗模式生成方法,包括:
获取混洗模式生成指令的输入操作数;所述混洗模式生成指令用于为混洗指令生成混洗模式;所述输入操作数包括:生成模式和基础偏移量;
根据所述生成模式获取与所述生成模式相对应的偏移向量;
根据所述偏移向量中的各个偏移值和所述基础偏移量,生成所述混洗模式;
将所述混洗模式存储在所述混洗模式生成指令的输出操作数所指示的寄存器中。
本发明提供的混洗模式生成装置,包括:
第一获取模块,用于获取混洗模式生成指令的输入操作数;所述混洗模式生成指令用于为混洗指令生成混洗模式;所述输入操作数包括:生成模式和基础偏移量;
第二获取模块,用于根据所述生成模式获取与所述生成模式相对应的偏移向量;
混洗模式生成模块,用于根据所述偏移向量中的各个偏移值和所述基础偏移量,生成所述混洗模式;
存储模块,用于将所述混洗模式存储在所述混洗模式生成指令的输出操作数所指示的寄存器中。
本发明提供一种混洗模式生成方法和装置,其中,混洗模式生成方法包括:获取混洗模式生成指令的输入操作数,根据生成模式获取与生成模式相对应的偏移向量,根据偏移向量中的各个偏移值和基础偏移量,生成混洗模式,将混洗模式存储在混洗模式生成指令的输出操作数所指示的寄存器中。本发明提供的混洗模式生成方法,通过调用混洗模式生成指令,根据生成模式和基础偏移量就可以获取到与生成模式相对应的混洗模式,大大简化了混洗模式的设计复杂度,同时提高了混洗模式生成的灵活性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的混洗模式生成方法的流程图;
图2为本发明实施例二提供的混洗模式生成方法的流程图;
图3A为本发明实施例三提供的混洗模式生成方法的一种工作流程图;
图3B为本发明实施例三提供的混洗模式生成方法的另一种工作流程图;
图3C为本发明实施例三提供的混洗模式生成方法的又一种工作流程图;
图4为本发明实施例一提供的混洗模式生成装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的混洗模式生成方法和装置,主要应用于数字图像处理过程中调用混洗指令的场景,例如:视频图像处理过程中的运动估计类操作调用混洗指令的场景,当然,本发明实施例提供的混洗模式生成方法和装置,也可以应用于除数字图像处理之外的调用混洗指令的场景。
图1为本发明实施例一提供的混洗模式生成方法的流程图,本实施例提供的混洗模式生成方法,执行主体可以为混洗模式生成装置,混洗模式生成装置可以为中央处理器(Central Processing Unit,简称CPU),或者是集成在CPU中的电路,等等。如图1所示,本实施例提供的混洗模式生成方法,可以包括:
步骤101、获取混洗模式生成指令的输入操作数。
其中,混洗模式生成指令用于为混洗指令生成混洗模式。
其中,输入操作数包括:生成模式和基础偏移量。
在本实施例中,定义了混洗模式生成指令,通过执行混洗模式生成指令从而为混洗指令生成混洗模式。具体的,混洗模式生成指令的输入操作数包括生成模式和基础偏移量,生成模式为混洗模式生成方式的索引值,基础偏移量为混洗指令中源寄存器中的基础偏移数据的位置索引值。
例如:基础偏移量为5,则混洗指令中源寄存器中的基础偏移数据的位置索引值为5,混洗模式生成指令将根据基础偏移量5生成混洗模式。
在本实施例中,获取混洗模式生成指令的输入操作数,可以有多种实现方式,例如:可以通过上层软件参数传递的方式获取,也可以通过计算过程中新生成的混洗模式生成指令的输入操作数的方式获取,等等。
需要说明的是,本实施例对于混洗模式生成指令的指令名称和操作数的名称、类型不做特别限制。例如:在MIPS向量指令架构中,混洗模式生成指令可以定义为:
VMEPATMSK.V wd,mode,u5
其中,VMEPATMSK.V表示混洗模式生成指令的指令名称,mode和u5为输入操作数,wd为输出操作数。其中,mode表示生成模式,u5表示基础偏移量,wd用于指示混洗模式生成指令的目的寄存器的编号。其中,mode和u5可以为立即数,wd可以为寄存器。
下面以具体数值为例详细说明混洗模式生成指令,例如:
VMEPATMSK.V 1,9,13
则上述混洗模式生成指令表示,以混洗指令中源寄存器中的基础偏移数据的位置索引值5为基础,按照生成方式的索引值9所指示的混洗模式生成方式生成混洗模式,其中,目的寄存器编号为1。
需要说明的是,本实施例对于混洗模式生成指令中的输入操作数和输出操作数的位数不做特别限制,位数的大小决定了输入操作数和输出操作数的数量,根据需要进行设置。
可选的,生成模式和基础偏移量均为5比特。此时,生成模式为32种,取值可以为0~31之间的任意整数,基础偏移量为32种,取值可以为0~31之间的任意整数。
可选的,输出操作数可以为5比特。
步骤102、根据生成模式获取与生成模式相对应的偏移向量。
其中,偏移向量中的元素为偏移值,偏移值是指相对于混洗指令中源寄存器中基础偏移数据的位置索引偏移的索引值。
可选的,偏移向量可以包括:基础位移量和位移向量。基础位移量是指相对于混洗指令中源寄存器中基础偏移数据的位置索引整体偏移的索引值,位移向量中的元素为位移值,位移值是指在基础位移量的基础上,相对于混洗指令中源寄存器中基础偏移数据的位置索引偏移的索引值。
需要说明的是,本实施例对于偏移向量中的偏移值、基础位移量、位移向量中的位移值的取值不做特别限制,根据需要进行设置。
步骤103、根据偏移向量中的各个偏移值和基础偏移量,生成混洗模式。
具体的,本实施例提供的混洗模式生成方法,通过获取混洗模式生成指令中的生成模式和基础偏移量,可以获取与生成模式相对应的偏移向量,根据偏移向量中的各个偏移值和基础偏移量,就可以生成混洗模式,即,在执行混洗指令之前,调用混洗模式生成指令,不需要程序员通过复杂繁琐的计算提前设计混洗模式,仅通过混洗模式生成指令中的生成模式和基础偏移量就可以获取到与生成模式相对应的混洗模式,从而大大简化了混洗模式的设计复杂度,同时提高了混洗模式生成的灵活性,降低了处理器的额外开销。
可选的,在一种具体的实现方式中,步骤103,根据偏移向量中的各个偏移值和基础偏移量,生成混洗模式,可以包括:
将偏移向量中的各个偏移值依次与基础偏移量相加,生成混洗模式。
下面以具体数值为例详细说明生成混洗模式的步骤。
假设,基础偏移量为10,偏移向量中的各个偏移值分别为:0、1、2、3、0、1、2、3、0、1、2、3、0、1、2、3。
则生成的混洗模式为:10+0、10+1、10+2、10+3、10+0、10+1、10+2、10+3、10+0、10+1、10+2、10+3、10+0、10+1、10+2、10+3,即10、11、12、13、10、11、12、13、10、11、12、13、10、11、12、13。
可选的,若偏移向量包括基础位移量和位移向量,则根据偏移向量中的各个偏移值和基础偏移量,生成混洗模式,可以包括:
将位移向量中的各个位移值依次与基础位移量以及基础偏移量相加,生成混洗模式。
下面以具体数值为例详细说明生成混洗模式的步骤。
假设,基础偏移量为6,基础位移量为8,位移向量中的各个位移值分别为:0、1、2、3、1、2、3、4、0、1、2、3、1、2、3、4。
则生成的混洗模式为:6+8+0、6+8+1、6+8+2、6+8+3、6+8+1、6+8+2、6+8+3、6+8+4、6+8+0、6+8+1、6+8+2、6+8+3、6+8+1、6+8+2、6+8+3、6+8+4,即14、15、16、17、15、16、17、18、14、15、16、17、15、16、17、18。
步骤104、将混洗模式存储在混洗模式生成指令的输出操作数所指示的寄存器中。
具体的,混洗模式生成指令的输出操作数,用于指示混洗模式生成指令的目的寄存器的编号,将混洗模式存储在输出操作数所指示的寄存器中。
可选的,本实施例提供的混洗模式生成方法,还可以包括:
根据混洗模式执行混洗指令。
本实施例提供了一种混洗模式生成方法,包括:获取混洗模式生成指令的输入操作数,根据生成模式获取与生成模式相对应的偏移向量,根据偏移向量中的各个偏移值和基础偏移量,生成混洗模式,将混洗模式存储在混洗模式生成指令的输出操作数所指示的寄存器中。本实施例提供的混洗模式生成方法,通过调用混洗模式生成指令,根据生成模式和基础偏移量就可以获取到与生成模式相对应的混洗模式,大大简化了混洗模式的设计复杂度,同时提高了混洗模式生成的灵活性,降低了处理器的额外开销。
图2为本发明实施例二提供的混洗模式生成方法的流程图,本实施例在实施例一的基础上,提供了混洗模式生成方法的另一种实现方式。如图2所示,本实施例提供的混洗模式生成方法,在实施例一中步骤101之前,还可以包括:
步骤201、获取应用软件中的数据混洗规则。
具体的,对于特定的应用软件,在数据处理过程中,对数据进行混洗操作通常会遵循一定的规则,将该规则称为数据混洗规则。
其中,本实施例对于应用软件的具体类型不特别限制,例如:应用软件可以为视频处理软件或者图像处理软件,等等。
其中,获取应用软件中的数据混洗规则,可以是获取应用软件中特定操作的数据混洗规则,例如:获取视频处理软件中运动估计类操作的数据混洗规则,其中,运动估计是视频编码和视频处理中广泛使用的技术,用于去除帧间冗余度,使得视频传输的比特数大大减少。
下面以具体示例详细说明本步骤。
例如:对于视频处理中的运动估计类操作,通常将图像按照4*4像素的大小划分为多个图像子块,对图像子块中的像素点进行数据混洗操作,在数据处理过程中,对于每个图像子块的数据混洗,通常只取图像子块的第1行的4个像素点,那么,对于视频处理中的运动估计类操作,数据混洗规则为获取每个图像子块的第1行的4个像素点。
步骤202、根据数据混洗规则生成偏移向量以及与偏移向量相对应的生成模式。
具体的,由于应用软件的数据混洗操作具有数据混洗规则,则可以根据该数据混洗规则生成偏移向量,并为该偏移向量生成与其对应的生成模式,这样,在混洗模式生成指令中,获取特定的生成模式,则对应一个可以反映出数据混洗规则的偏移向量,进而根据混洗模式生成指令中的生成模式和基础偏移量生成混洗模式,从而大大简化了混洗模式的设计复杂度,提高了混洗模式生成的灵活性。
下面以具体示例详细说明本步骤。
例如:对于视频处理中的运动估计类操作,数据混洗规则为获取每个图像子块的第1行的4个像素点,则根据该数据混洗规则可以生成偏移向量为0、1、2、3、1、2、3、4、0、1、2、3、1、2、3、4,与该偏移向量相对应的生成模式定义为1。
本实施例提供了一种混洗模式生成方法,通过获取应用软件中的数据混洗规则,根据数据混洗规则生成偏移向量以及与偏移向量相对应的生成模式,通过调用混洗模式生成指令可以生成混洗模式。本实施例提供的混洗模式生成方法,大大简化了混洗模式的设计复杂度,同时提高了混洗模式生成的灵活性。
作为本发明的实施例三,在实施例一和实施例二的基础上,将以具体示例详细说明本实施例提供的混洗模式生成方法。
图3A为本发明实施例三提供的混洗模式生成方法的一种工作流程图,图3A示出了调用混洗模式生成指令和混洗指令,生成混洗结果的一种工作流程。
如图3A所示,混洗模式生成指令可以为VMEPATMSK.V wt1,1,0,混洗指令可以为VSHF.B wt1,wr1,wr1。
其中,生成模式为1,基础偏移量为0,生成模式1对应的偏移向量为0、1、2、3、1、2、3、4、2、3、4、5、3、4、5、6,则调用混洗模式生成指令生成的混洗模式为0+0、0+1、0+2、0+3、0+1、0+2、0+3、0+4、0+2、0+3、0+4、0+5、0+3、0+4、0+5、0+6,即0、1、2、3、1、2、3、4、2、3、4、5、3、4、5、6,参见表1。
其中,S1-01和S1-03为混洗指令中的两个源操作数,S1-02表示将两个源操作数进行首尾连接,S1-04为混洗模式生成指令的输出操作数指示的寄存器,也是混洗指令的模式向量寄存器,S1-05为按照模式向量寄存器进行混洗之后,生成的目的向量寄存器。
表1
图3B为本发明实施例三提供的混洗模式生成方法的另一种工作流程图,图3B示出了调用混洗模式生成指令和混洗指令,生成混洗结果的另一种工作流程。
如图3B所示,混洗模式生成指令可以为VMEPATMSK.V wt2,2,0,混洗指令可以为VSHF.B wt2,wr1,wr1。
其中,生成模式为2,基础偏移量为0,生成模式2对应的基础位移量为4,生成模式2对应的位移向量为0、1、2、3、1、2、3、4、2、3、4、5、3、4、5、6,则调用混洗模式生成指令生成的混洗模式为0+4+0、0+4+1、0+4+2、0+4+3、0+4+1、0+4+2、0+4+3、0+4+4、0+4+2、0+4+3、0+4+4、0+4+5、0+4+3、0+4+4、0+4+5、0+4+6,即4、5、6、7、5、6、7、8、6、7、8、9、7、8、9、10,参见表2。
其中,S2-01和S2-03为混洗指令中的两个源操作数,S2-02表示将两个源操作数进行首尾连接,S2-04为混洗模式生成指令的输出操作数指示的寄存器,也是混洗指令的模式向量寄存器,S2-05~S2-08为混洗过程生成的4个字,S2-09为按照模式向量寄存器进行混洗之后,生成的目的向量寄存器。
表2
图3C为本发明实施例三提供的混洗模式生成方法的又一种工作流程图,图3C示出了调用混洗模式生成指令和混洗指令,生成混洗结果的又一种工作流程。
如图3C所示,混洗模式生成指令可以为VMEPATMSK.V wt3,0,8,混洗指令可以为VSHF.B wt3,wr1,wr1。
其中,生成模式为0,基础偏移量为8,生成模式1对应的偏移向量为0、1、2、3、0、1、2、3、0、1、2、3、0、1、2、3,则调用混洗模式生成指令生成的混洗模式为8+0、8+1、8+2、8+3、8+0、8+1、8+2、8+3、8+0、8+1、8+2、8+3、8+0、8+1、8+2、8+3,即8、9、10、11、8、9、10、11、8、9、10、11、8、9、10、11,参见表3。
其中,S3-01和S3-03为混洗指令中的两个源操作数,S3-02表示将两个源操作数进行首尾连接,S3-04为混洗模式生成指令的输出操作数指示的寄存器,也是混洗指令的模式向量寄存器,S3-05为按照模式向量寄存器进行混洗之后,生成的目的向量寄存器。
表3
图4为本发明实施例一提供的混洗模式生成装置的结构示意图,本实施例提供的混洗模式生成装置,用于执行图1~图3C所示的任一实施例提供的混洗模式生成方法。如图4所示,本实施例提供的混洗模式生成装置,可以包括:
第一获取模块11,用于获取混洗模式生成指令的输入操作数。混洗模式生成指令用于为混洗指令生成混洗模式。输入操作数包括:生成模式和基础偏移量。
第二获取模块12,用于根据生成模式获取与生成模式相对应的偏移向量。
混洗模式生成模块13,根据偏移向量中的各个偏移值和基础偏移量,生成混洗模式。
存储模块14,用于将混洗模式存储在混洗模式生成指令的输出操作数所指示的寄存器中。
可选的,混洗模式生成模块13具体用于:
将偏移向量中的各个偏移值依次与基础偏移量相加,生成混洗模式。
可选的,混洗模式生成装置还包括:第三获取模块。
第三获取模块用于:
获取应用软件中的数据混洗规则。
根据数据混洗规则生成偏移向量以及与偏移向量相对应的生成模式。
可选的,偏移向量包括:基础位移量和位移向量。
混洗模式生成模块13具体用于:
将位移向量中的各个位移值依次与基础位移量以及基础偏移量相加,生成混洗模式。
可选的,生成模式和基础偏移量均为5比特。
可选的,混洗模式生成装置还包括:混洗模块。
混洗模块用于根据混洗模式执行混洗指令。
本实施例提供的混洗模式生成装置,用于执行图1-图3C所示任一方法实施例提供的混洗模式生成方法,其技术原理和技术效果类似,此处不再赘述。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种混洗模式生成方法,其特征在于,包括:
获取混洗模式生成指令的输入操作数;所述混洗模式生成指令用于为混洗指令生成混洗模式;所述输入操作数包括:生成模式和基础偏移量;
根据所述生成模式获取与所述生成模式相对应的偏移向量;
根据所述偏移向量中的各个偏移值和所述基础偏移量,生成所述混洗模式;
将所述混洗模式存储在所述混洗模式生成指令的输出操作数所指示的寄存器中。
2.根据权利要求1所述的方法,其特征在于,在所述获取混洗模式生成指令的输入操作数之前,还包括:
获取应用软件中的数据混洗规则;
根据所述数据混洗规则生成所述偏移向量以及与所述偏移向量相对应的生成模式。
3.根据权利要求1所述的方法,其特征在于,所述偏移向量包括:基础位移量和位移向量;
所述根据所述偏移向量中的各个偏移值和所述基础偏移量,生成所述混洗模式,包括:
将所述位移向量中的各个位移值依次与所述基础位移量以及所述基础偏移量相加,生成所述混洗模式。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述生成模式和所述基础偏移量均为5比特。
5.根据权利要求1至3任一项所述的方法,其特征在于,还包括:
根据所述混洗模式执行所述混洗指令。
6.一种混洗模式生成装置,其特征在于,包括:
第一获取模块,用于获取混洗模式生成指令的输入操作数;所述混洗模式生成指令用于为混洗指令生成混洗模式;所述输入操作数包括:生成模式和基础偏移量;
第二获取模块,用于根据所述生成模式获取与所述生成模式相对应的偏移向量;
混洗模式生成模块,用于根据所述偏移向量中的各个偏移值和所述基础偏移量,生成所述混洗模式;
存储模块,用于将所述混洗模式存储在所述混洗模式生成指令的输出操作数所指示的寄存器中。
7.根据权利要求6所述的装置,其特征在于,还包括:第三获取模块;
所述第三获取模块用于:
获取应用软件中的数据混洗规则;
根据所述数据混洗规则生成所述偏移向量以及与所述偏移向量相对应的生成模式。
8.根据权利要求6所述的装置,其特征在于,所述偏移向量包括:基础位移量和位移向量;
所述混洗模式生成模块具体用于:
将所述位移向量中的各个位移值依次与所述基础位移量以及所述基础偏移量相加,生成所述混洗模式。
9.根据权利要求6至8任一项所述的装置,其特征在于,所述生成模式和所述基础偏移量均为5比特。
10.根据权利要求6至8任一项所述的装置,其特征在于,还包括:混洗模块;
所述混洗模块,用于根据所述混洗模式执行所述混洗指令。
CN201610443245.0A 2016-06-20 2016-06-20 混洗模式生成方法和装置 Active CN106095392B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610443245.0A CN106095392B (zh) 2016-06-20 2016-06-20 混洗模式生成方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610443245.0A CN106095392B (zh) 2016-06-20 2016-06-20 混洗模式生成方法和装置

Publications (2)

Publication Number Publication Date
CN106095392A true CN106095392A (zh) 2016-11-09
CN106095392B CN106095392B (zh) 2018-09-14

Family

ID=57237509

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610443245.0A Active CN106095392B (zh) 2016-06-20 2016-06-20 混洗模式生成方法和装置

Country Status (1)

Country Link
CN (1) CN106095392B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112907600A (zh) * 2021-03-10 2021-06-04 江苏禹空间科技有限公司 目标检测模型的优化方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104011645A (zh) * 2011-12-22 2014-08-27 英特尔公司 用于产生其中在连续位置中的整数相差恒定整数跨度且最小整数从零偏移整数偏移量的整数序列的处理器、方法、***和指令
CN104011643A (zh) * 2011-12-22 2014-08-27 英特尔公司 打包数据重新安排控制索引产生处理器、方法、***及指令
CN104126168A (zh) * 2011-12-22 2014-10-29 英特尔公司 打包数据重新安排控制索引前体生成处理器、方法、***及指令
CN105022609A (zh) * 2015-08-05 2015-11-04 浪潮(北京)电子信息产业有限公司 一种数据混洗方法和数据混洗单元

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104011645A (zh) * 2011-12-22 2014-08-27 英特尔公司 用于产生其中在连续位置中的整数相差恒定整数跨度且最小整数从零偏移整数偏移量的整数序列的处理器、方法、***和指令
CN104011643A (zh) * 2011-12-22 2014-08-27 英特尔公司 打包数据重新安排控制索引产生处理器、方法、***及指令
CN104126168A (zh) * 2011-12-22 2014-10-29 英特尔公司 打包数据重新安排控制索引前体生成处理器、方法、***及指令
CN105022609A (zh) * 2015-08-05 2015-11-04 浪潮(北京)电子信息产业有限公司 一种数据混洗方法和数据混洗单元

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112907600A (zh) * 2021-03-10 2021-06-04 江苏禹空间科技有限公司 目标检测模型的优化方法及***
CN112907600B (zh) * 2021-03-10 2024-05-24 无锡禹空间智能科技有限公司 目标检测模型的优化方法及***

Also Published As

Publication number Publication date
CN106095392B (zh) 2018-09-14

Similar Documents

Publication Publication Date Title
CN107438860B (zh) 用于高性能功率高效的可编程图像处理的架构
TW202025081A (zh) 用於具二維執行道陣列及二維位移暫存器之影像處理器之區塊操作
TWI752343B (zh) 用於執行絕對差計算之加總的執行單元電路、影像處理器以及方法
CN106855952B (zh) 基于神经网络的计算方法及装置
JP6967597B2 (ja) 設定可能な数のアクティブなコアを有する画像処理プロセッサおよびサポートする内部ネットワーク
CN103297767A (zh) 一种适用于多核嵌入式平台的jpeg图像解码方法及解码器
JP4637640B2 (ja) 図形描画装置
TW201709085A (zh) 處理需要相加數個乘法結果之指令
CN111414150B (zh) 游戏引擎渲染方法、装置、电子设备及计算机存储介质
CN106095392B (zh) 混洗模式生成方法和装置
CN114255153A (zh) 一种超高清图像混合处理方法和装置
TW201816715A (zh) 用於影像處理之設備及方法
CN116431315B (zh) 批处理任务的处理方法、装置、电子设备及存储介质
KR20020002334A (ko) 정렬된 simd용 범용 레지스터 파일 구조
KR101499124B1 (ko) 공유 메모리를 이용한 영상 처리 방법 및 장치
CN111803950B (zh) 网页游戏的数据处理方法、装置、电子设备及存储介质
CN1321276A (zh) 可配置的硬件块
WO2022266842A1 (zh) 一种多线程数据处理方法及装置
CN1530883A (zh) 图像处理装置
CN104750691A (zh) 一种自定义网页生成方法及装置
CN105760143A (zh) 图像处理执行代码的重构方法及装置
JP2004356673A (ja) 動きベクトル検出方法及び同方法を用いた画像処理装置
US11630667B2 (en) Dedicated vector sub-processor system
CN115861026B (zh) 数据处理方法、装置、计算机设备、存储介质
CN116109468B (zh) 图形处理单元及指令编译方法、存储介质、终端设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 100095 Building 2, Longxin Industrial Park, Zhongguancun environmental protection technology demonstration park, Haidian District, Beijing

Patentee after: Loongson Zhongke Technology Co.,Ltd.

Address before: 100095 Building 2, Longxin Industrial Park, Zhongguancun environmental protection technology demonstration park, Haidian District, Beijing

Patentee before: LOONGSON TECHNOLOGY Corp.,Ltd.