JPH04252385A - 画像処理用パイプライン構造 - Google Patents

画像処理用パイプライン構造

Info

Publication number
JPH04252385A
JPH04252385A JP875791A JP875791A JPH04252385A JP H04252385 A JPH04252385 A JP H04252385A JP 875791 A JP875791 A JP 875791A JP 875791 A JP875791 A JP 875791A JP H04252385 A JPH04252385 A JP H04252385A
Authority
JP
Japan
Prior art keywords
stage
arithmetic
pipeline
multiplication
accumulation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP875791A
Other languages
English (en)
Inventor
Yutaka Tashiro
豊 田代
Toshihiro Minami
俊宏 南
Hiroki Yamauchi
寛紀 山内
Yutaka Suzuki
豊 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP875791A priority Critical patent/JPH04252385A/ja
Publication of JPH04252385A publication Critical patent/JPH04252385A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Advance Control (AREA)
  • Complex Calculations (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、主にDSP(Degi
tal SignalProcessor)に用いられ
る演算ユニットの構造に関する。特に、画像処理の分野
で必要となる乗算および累算を基本とする1次ノルムそ
の他の複合演算をパイプライン処理により高速実行する
ための画像処理用パイプライン構造に関する。
【0002】
【従来の技術】従来のDSPにおける演算器は、乗算器
と累算器を縦続接続した2段パイプライン構造になって
いたが、従来のディジタル信号処理ではそのような構成
で十分であった。しかし、近年その需要が高まっている
画像処理その他の分野では、それに多用されている算術
あるいは論理2項演算の結果を乗累算する処理をこの2
段パイプライン構造の演算器で実現するには、2回以上
のパイプライン演算に分割して行う必要があった。
【0003】
【発明が解決しようとする課題】したがって、従来方式
ではパイプライン演算のためのプログラムの設計が別途
必要であった。さらに、パイプライン演算を分割する際
にその間で処理するデータを一時蓄積する必要があり、
それにメモリを用いた場合には、処理されるベクトル・
データの要素データ数分の読み出しおよび書き込みに用
いる電力が余計にかかっていた。
【0004】本発明は、画像処理の演算に不可欠な算術
2項演算あるいは論理2項演算の結果を乗累算する複合
演算を1本のパイプラインで実現できる画像処理用パイ
プライン構造を提供することを目的とする。
【0005】
【課題を解決するための手段】本発明は、乗累算を実現
する乗算器と累算器とを縦続に接続した2段パイプライ
ン構造において、入力信号に対して所定の加減処理を行
う加減算手段、入力信号に対して左右の算術シフトおよ
び論理シフトを行うシフト手段、入力信号に対して所定
の算術演算処理および論理演算処理を行う算術論理演算
手段の少なくとも1つを用いた複合演算ステージを前記
2段パイプライン構造の前段に備えたことを特徴とする
【0006】
【作用】本発明は、算術2項演算あるいは論理2項演算
の結果を得る複合演算ステージを従来の2段パイプライ
ン構造の前段に設け、その結果を乗累算する構造をとる
ことにより、1本のパイプラインで画像処理に必要な演
算を実現することができる。
【0007】
【実施例】図1は、本発明の第一実施例構成を示す図で
ある。図において、第一実施例では、乗算ステージ10
と累算ステージ20とを用いた従来の2段パイプライン
構造の前段に、加減算器(ASU( Adder Su
btractUnit) )を主構成とする複合演算ス
テージ30を接続する。
【0008】乗算ステージ10は、レジスタ11,12
と乗算器(MPL(MultiPLier) )13と
を有し、累算ステージ20は、レジスタ21と、累算器
(ACC(ACCumulator))22と、バレル
シフタ23と、レジスタ24,25と、セレクタ26と
を有する構成である。すなわち、レジスタ11,12の
出力信号が乗算器13の2つの入力信号となり、乗算器
13の出力信号がレジスタ21の入力信号となる。レジ
スタ21の出力信号は累算器22の一方の入力となり、
累算器22の出力信号がバレルシフタ23の入力信号と
なり、バレルシフタ23の出力信号がレジスタ24また
はレジスタ25またはその両方の入力信号となり、セレ
クタ26で選択されたレジスタ24またはレジスタ25
の出力信号が累算器22の他方の入力となる。ここで、
この乗累算ステージの入力信号をi,jとし、出力信号
をkとする。
【0009】また、それらの前段に接続される複合演算
ステージ30は、レジスタ31,32と、加減算器(A
SU)33と、セレクタ36とを有し、この複合演算ス
テージ30の入力信号をa,bとし、出力信号をcとす
る。以下、各ステージでの演算機能について説明する。 複合演算ステージ30での演算機能は、インストラクシ
ョンによる指定により、
【0010】
【数1】
【0011】の2通りである。乗算ステージ10と累算
ステージ20による乗累算ステージの演算機能は、k=
Σi・j    …(1) である。ここで、入力信号iは、 i=c である。また、入力信号jはレジスタ32を介して乗数
データαを入力として j=α とすることもできるし、またセレクタ36を制御するこ
とにより、 j=c とすることもできる。したがって、(1) 式は、k=
Σα・c k=Σc2  となり、乗累算ステージでは2通りの機能が実現される
ことがわかる。
【0012】したがって、本実施例の複合演算パイプラ
イン演算器では、
【0013】
【数2】
【0014】により示される2×2=4通りの乗累算を
基本とする複合演算が可能となる。なお、第一実施例の
構成では、用途はかなり限定されるが、画像処理におけ
る画像データのフレーム間差分その他の演算を実現する
ことができる。図2は、本発明の第二実施例構成を示す
図である。図において、第二実施例では、第一実施例の
複合演算ステージ30に対応する複合演算ステージ30
′として、加減算器(ASU( Adder Subt
ract Unit) ),算術論理演算器(ALU(
Arithmetic Logic Unit))を主
構成とすることを特徴とする。
【0015】ここで、複合演算ステージ30′は、レジ
スタ31,32と、加減算器(ASU)33と、算術論
理演算器35と、セレクタ36とを有し、この複合演算
ステージ30′の入力信号をa,b、加減算器33の出
力信号をc、算術論理演算器35の入力信号をf,g、
出力信号をhとする。以下、各ステージでの演算機能に
ついて説明する。複合演算ステージ30′の加減算器3
3での演算機能は上述したように2通りである。
【0016】算術論理演算器35での演算機能は、イン
ストラクション機能による指定により、算術演算機能と
しては、
【0017】
【数3】
【0018】となる。また、論理演算機能としては、各
対応するビットごとの演算で、 h=not f      (反転) h=not g      (反転) h=f and g   (論理積) h=f nand g  (論理積の反転)h=f o
r g    (論理和) h=f nor g   (論理和の反転)h=f e
or g   (排他的論理和)h=f enor g
  (排他的論理和の反転)となり、合わせて20通り
となる。
【0019】本実施例の複合演算ステージ30′の構成
は、本パイプライン演算器の外部端子より入力されたデ
ータが、レジスタ31またはレジスタ32またはその両
方でラッチされ、レジスタ31,32の各出力がそれぞ
れ加減算器33の入力信号a,bとなり、加減算器33
の出力信号cが算術論理演算器35の入力信号fとなり
、またレジスタ32の出力信号が算術論理演算器35の
入力信号gとなり、その出力信号hが乗算ステージ10
のレジスタ11,12に入力されて、乗累算ステージの
入力信号i,jとなるか、またはセレクタ36によりレ
ジスタ12の入力信号(乗累算ステージの入力信号j)
をレジスタ32の出力信号とするかを選択できるもので
ある。すなわち、加減算器33と算術論理演算器35の
入出力信号の間には、 f=c g=b の関係が成立し、本複合演算ステージ30′の出力とす
る算術論理演算器35の出力信号hには、2×20=4
0通りの演算結果が得られる。
【0020】一方、乗算ステージ10と累算ステージ2
0による乗累算ステージの演算機能は、上述したとおり
2通りの機能が実現されるので、本実施例の複合演算パ
イプライン演算器では、
【0021】
【数4】
【0022】を始めとする2×20×2=80通りの乗
累算を基本とする複合演算が可能となる。なお、第二実
施例の構成では、画像処理のアルゴリズムで頻繁に用い
られる画像データのフレーム間差分や1次,2次ノルム
その他の演算を実現することができる。図3は、本発明
の第三実施例構成を示す図である。
【0023】図において、第三実施例では、第一実施例
の複合演算ステージ30あるいは第二実施例の複合演算
ステージ30′に対応する複合演算ステージ30″とし
て、加減算器(ASU( Adder Subtrac
t Unit))、バレルシフタ、算術論理演算器(A
LU(Arithmetic Logic Unit)
)を主構成とすることを特徴とする。ここで、複合演算
ステージ30″は、レジスタ31,32と、加減算器(
ASU)33と、バレルシフタ34と、算術論理演算器
35と、セレクタ36とを有し、この複合演算ステージ
30″の入力信号をa,b、加減算器33の出力信号を
c、バレルシフタ34の入力信号をd、出力信号をe、
算術論理演算器35の入力信号をf,g、出力信号をh
とする。
【0024】以下、各ステージでの演算機能について説
明する。複合演算ステージ30″の加減算器33での演
算機能は上述したように2通りである。バレルシフタ3
5は、左右の算術シフトと、左右の論理シフトの機能を
有し、その演算機能は、インストラクション機能による
指定により、
【0025】
【数5】
【0026】で示される3通りの演算が可能である。算
術論理演算器35での演算機能は、上述したように20
通りとなる。本実施例の複合演算ステージ30′の構成
は、本パイプライン演算器の外部端子より入力されたデ
ータが、レジスタ31またはレジスタ32またはその両
方でラッチされ、レジスタ31,32の各出力がそれぞ
れ加減算器33の入力信号a,bとなり、加減算器33
の出力信号cがバレルシフタ35の入力信号dとなり、
その出力信号eが算術論理演算器35の入力信号fとな
り、またレジスタ32の出力信号が算術論理演算器35
の入力信号gとなり、その出力信号hが乗算ステージ1
0のレジスタ11,12に入力されて、乗累算ステージ
の入力信号i,jとなるか、またはセレクタ36により
レジスタ12の入力信号(乗累算ステージの入力信号j
)をレジスタ32の出力信号とするかを選択できるもの
である。すなわち、加減算器33と算術論理演算器35
の入出力信号の間には、 d=c f=e g=b の関係が成立し、本複合演算ステージ30″の出力とす
る算術論理演算器35の出力信号hには、2×3×20
=120 通りの演算結果が得られる。
【0027】一方、乗算ステージ10と累算ステージ2
0による乗累算ステージの演算機能は、nを有限の整数
として k=Σ2n・i・j    …(2) である。ここで、入力信号iは、 i=c である。また、入力信号jはレジスタ32を介して乗数
データαを入力として j=α とすることもできるし、またセレクタ36を制御するこ
とにより、 j=c とすることもできる。したがって、(2) 式は、k=
Σ2n・α・c k=Σ2n・c2  となり、乗累算ステージでは2通りの機能が実現される
ことがわかる。
【0028】したがって、本実施例の複合演算パイプラ
イン演算器では、
【0029】
【数6】
【0030】を始めとする2×3×20×2=240 
通りの乗累算を基本とする複合演算が可能となる。なお
、第二実施例の構成では、画像処理のアルゴリズムで用
いられる各演算を1回のパイプライン演算で実現するこ
とができる。
【0031】
【発明の効果】以上説明したように本発明は、画像処理
における1次ノルムその他の乗累算を基本とする複合演
算を1回のパイプライン演算で実行することができる。 したがって、従来2回以上のパイプライン演算に分割す
る必要があった処理に対して、プログラム設計を容易に
するとともに、メモリの読み出しおよび書き込みのため
の余分な電力消費を回避し、さらに高速処理を実現する
ことができる。
【図面の簡単な説明】
【図1】本発明の第一実施例構成を示す図である。
【図2】本発明の第二実施例構成を示す図である。
【図3】本発明の第三実施例構成を示す図である。
【符号の説明】
10  乗算ステージ 11,12  レジスタ 13  乗算器(MPL) 20  累算ステージ 21  レジスタ 22  累算器(ACC) 23  バレルシフタ 24,25  レジスタ 26  セレクタ 30,30′,30″  複合演算ステージ31,32
  レジスタ 33  加減算器(ASU) 34  バレルシフタ 35  算術論理演算器(ALU) 36  セレクタ

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  乗累算を実現する乗算器と累算器とを
    縦続に接続した2段パイプライン構造において、入力信
    号に対して所定の加減処理を行う加減算手段、入力信号
    に対して左右の算術シフトおよび論理シフトを行うシフ
    ト手段、入力信号に対して所定の算術演算処理および論
    理演算処理を行う算術論理演算手段の少なくとも1つを
    用いた複合演算ステージを前記2段パイプライン構造の
    前段に備えたことを特徴とする画像処理用パイプライン
    構造。
JP875791A 1991-01-28 1991-01-28 画像処理用パイプライン構造 Pending JPH04252385A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP875791A JPH04252385A (ja) 1991-01-28 1991-01-28 画像処理用パイプライン構造

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP875791A JPH04252385A (ja) 1991-01-28 1991-01-28 画像処理用パイプライン構造

Publications (1)

Publication Number Publication Date
JPH04252385A true JPH04252385A (ja) 1992-09-08

Family

ID=11701802

Family Applications (1)

Application Number Title Priority Date Filing Date
JP875791A Pending JPH04252385A (ja) 1991-01-28 1991-01-28 画像処理用パイプライン構造

Country Status (1)

Country Link
JP (1) JPH04252385A (ja)

Similar Documents

Publication Publication Date Title
US5991785A (en) Determining an extremum value and its index in an array using a dual-accumulation processor
US5220525A (en) Recoded iterative multiplier
US4635292A (en) Image processor
US6115729A (en) Floating point multiply-accumulate unit
US4490807A (en) Arithmetic device for concurrently summing two series of products from two sets of operands
US8239442B2 (en) Computing module for efficient FFT and FIR hardware accelerator
GB2291515A (en) Data processing using multiply-accumulate instructions.
JP3476960B2 (ja) 算術論理演算装置及び制御方法
US6675286B1 (en) Multimedia instruction set for wide data paths
JPH0231511A (ja) プロセッサ
WO1986002181A1 (en) A digital signal processor for single cycle multiply/accumulation
JPH04252385A (ja) 画像処理用パイプライン構造
CN115713104A (zh) 用于神经网络的数据处理电路、神经网络电路和处理器
US5206826A (en) Floating-point division cell
EP1936492A1 (en) SIMD processor with reduction unit
US9361268B2 (en) Splitable and scalable normalizer for vector data
JPH04252372A (ja) 可変パイプライン構造
JP3691538B2 (ja) ベクトルデータ加算方法及びベクトルデータ乗算方法
JP3336986B2 (ja) 信号処理プロセッサ及びそれに用いる丸め機能付き積和演算器
JP3068640B2 (ja) 計算装置
JPH10207863A (ja) 演算処理装置
KR100623604B1 (ko) 데이터 처리장치 및 그의 데이터 처리 방법
JPS63163674A (ja) 複合演算回路
JPH0638228B2 (ja) 加減算機能付き乗算装置
JPH02181870A (ja) ディジタル信号処理装置