JP2016181870A - 処理装置及び処理装置の制御方法 - Google Patents

処理装置及び処理装置の制御方法 Download PDF

Info

Publication number
JP2016181870A
JP2016181870A JP2015062272A JP2015062272A JP2016181870A JP 2016181870 A JP2016181870 A JP 2016181870A JP 2015062272 A JP2015062272 A JP 2015062272A JP 2015062272 A JP2015062272 A JP 2015062272A JP 2016181870 A JP2016181870 A JP 2016181870A
Authority
JP
Japan
Prior art keywords
processing
codec
processing units
ring
transfer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015062272A
Other languages
English (en)
Other versions
JP6454577B2 (ja
Inventor
植田 浩司
Koji Ueda
浩司 植田
誠二 望月
Seiji Mochizuki
誠二 望月
俊之 加谷
Toshiyuki Kaya
俊之 加谷
憲一 岩田
Kenichi Iwata
憲一 岩田
勝重 松原
Katsushige Matsubara
勝重 松原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Renesas Electronics Corp
Original Assignee
Renesas Electronics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Renesas Electronics Corp filed Critical Renesas Electronics Corp
Priority to JP2015062272A priority Critical patent/JP6454577B2/ja
Priority to US14/965,612 priority patent/US10452587B2/en
Priority to KR1020160001450A priority patent/KR20160115680A/ko
Priority to CN201610051676.2A priority patent/CN106028041B/zh
Priority to EP16162394.7A priority patent/EP3073378B1/en
Publication of JP2016181870A publication Critical patent/JP2016181870A/ja
Application granted granted Critical
Publication of JP6454577B2 publication Critical patent/JP6454577B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4063Device-to-bus coupling
    • G06F13/4068Electrical coupling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/20Handling requests for interconnection or transfer for access to input/output bus
    • G06F13/28Handling requests for interconnection or transfer for access to input/output bus using burst mode transfer, e.g. direct memory access DMA, cycle steal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5066Algorithms for mapping a plurality of inter-dependent sub-tasks onto a plurality of physical CPUs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Bus Control (AREA)
  • Memory System (AREA)
  • Discrete Mathematics (AREA)

Abstract

【課題】他の処理ユニットのデータが原因でバストラフィックが増加することを防止する処理装置及び処理装置の制御方法を提供する。
【解決手段】複数の処理ユニット401−0〜401−Mのそれぞれに対応して、処理ユニット間でデータを転送する複数の転送モジュール402−0〜402−Mを設ける。そして、複数の処理ユニット401−0〜401−M毎に、処理ユニット内のサブユニットと、処理ユニットに対応して設けた転送モジュールと、を第1のリングバス403−0〜403−Mによってリング状に接続する。さらに、複数の転送モジュール402−0〜402−Mを第2のリングバス404によってリング状に接続する。
【選択図】図13

Description

本発明は、処理装置に関し、例えば、複数の処理ユニットを備える処理装置に好適に利用できるものである。
処理装置の処理性能を向上させる手法の1つに並列処理がある。処理装置において、並列処理を実現する場合、例えば、並列処理が可能な複数の処理ユニットを設ける(例えば、特許文献1,2参照)。以下、特許文献1,2に記載の技術について説明する。
まず、特許文献1に記載の技術について図14を参照して説明する。図14は、特許文献1の図1に示された構成に相当する動画像処理装置のブロック構成例を示す図である。図14に示される動画像処理装置は、Codec_EL_0 601−0及びCodec_EL_1 601−1という2つの動画像処理ユニットを備える。Codec_EL_0 601−0及びCodec_EL_1 601−1は、複数の機能サブユニットを含む。図14では、機能サブユニットとして、可変長処理部(VLC:Variable Length Coding)6010と、周波数変換部(TRF:Transform)6011と、動き補償処理部(MC:Motion Compensation)6012と、が含まれる。Codec_EL_0 601−0及びCodec_EL_1 601−1はさらに、複数の機能サブユニットのそれぞれに接続される複数の入出力インタフェース(IO:Input-Output)605を含む。Codec_EL_0 601−0及びCodec_EL_1 601−1は、入出力インタフェース605を介して、同一のリングバスによってリング状に接続される。Codec_EL_0 601−0の末端の入出力インタフェース605は、Codec_EL_1 601−1の先端の入出力インタフェース605に接続される。また、図14に示される動画像処理装置はさらに、LM(Line Memory)602と、DMAC(Direct Memory Access Controller)603と、Mem_Cnt604と、を備える。DMAC603は、Codec_EL_0 601−0及びCodec_EL_1 601−1へビットストリームを転送するダイレクトメモリアクセスコントローラである。Mem_Cnt604は、Codec_EL_0 601−0及びCodec_EL_1 601−1へマクロブロック(MB:Macro Block)データを供給するコントローラである。LM602は、Codec_EL_0 601−0による処理結果等を格納するラインメモリである。
次に、特許文献2に記載の技術について図15を参照して説明する。図15は、特許文献2の図2に示された構成に相当する並列処理装置のブロック構成例を示す図である。図15に示される並列処理装置は、複数の処理手段(PE:Processing Element)700をリング状に接続したパイプライン型リングバス701を1つの層とし、この層を複数層備える。図15に示される並列処理装置はさらに、各層の第1列のPE700との間でパケットの授受を行うパケット制御装置703を備える。各層の第2列〜第4列の各PE700は、1つ下の層のPE700とリングバス702によって順次接続され、自層の上の層のPE700の出力を自層のパイプライン型リングバス701に取り込む機能を持つ。このように、各層を順次接続することにより、パケット制御装置703を介することなく、あるパイプライン型リングバス701から他のパイプライン型リングバス701にパケットが流れる。これにより、パケット制御装置703の負担が軽減される。また、ある層の第1列のPE700のキューが込み合っている場合、他の層からパケットを流すことも可能である。例えば、パケット制御装置703は、PE(3,4)にパケットを流す場合、PE(3,1)、PE(3,2)、PE(3,3)、PE(3,4)の太線矢印の経路でパケットを流すことが可能である。また、パケット制御装置703は、PE(3,1)のキューが込み合っている場合は、PE(1,1)、PE(1,2)、PE(2,2)、PE(2,3)、PE(3,3)、PE(3,4)の太線矢印の経路でパケットを流すことも可能である。
特開2008−42571号公報 特開平5−181817号公報
しかし、特許文献1,2に記載の技術においては、以下の課題がある。
まず、特許文献1に記載の技術の課題について図14を参照して説明する。図14に示される動画像処理装置は、Codec_EL_0 601−0とCodec_EL_1 601−1とが同一のリングバスによってリング状に接続されている。そのため、例えば、Codec_EL_0 601−0内の機能サブユニットが、Codec_EL_1 601−1を跨いで、Codec_EL_0 601−0の異なる機能サブユニットへデータを転送する場合、転送経路が長くなるという問題がある。例えば、Codec_EL_0 601−0内のTRF6011が、同じくCodec_EL_0 601−0内のVLC6010へデータを転送する場合を考える。この場合、データは、Codec_EL_1 601−1およびLM602を通過しなければならず、転送経路が長くなる。また、この場合、Codec_EL_1 601−1には、Codec_EL_0 601−0のデータが流れることになる。そのため、他方のCodec_EL_0 601−0のデータが原因で、Codec_EL_1 601−1のバストラフィックが増加するという問題がある。
次に、特許文献2に記載の技術の課題について図15を参照して説明する。図15に示される並列処理装置は、複数のPE700をリング状に接続したパイプライン型リングバス701を1つの層とし、この層を複数層備えている。このように、パイプライン型リングバス701を複数層設けることで、特許文献1に記載の技術の問題であった、リングバスの転送経路が長くなるという問題の対策は図られている。しかし、パイプライン型リングバス701上には、自層のPE700宛ではないパケットが流れてしまう。そのため、他層のパケットが原因でバストラフィックが増加するという、特許文献1に記載の技術の問題は解決されないままである。
以下では、上述した課題を含む複数の課題のうち少なくとも1つの解決に寄与することが可能な複数の実施形態が説明される。上述の課題は、本明細書に開示される実施形態が達成しようとする複数の課題の1つに過ぎないことに留意されるべきである。その他の課題と新規な特徴は、本明細書の記述および添付図面から明らかになるであろう。
一実施の形態によれば、処理装置において、複数の処理ユニットのそれぞれに対応して、処理ユニット間でデータを転送する複数の転送モジュールを設ける。そして、複数の処理ユニット毎に、処理ユニット内のサブユニットと、処理ユニットに対応して設けた転送モジュールと、を第1のリングバスによってリング状に接続する。さらに、複数の転送モジュールを第2のリングバスによってリング状に接続する。
前記一実施の形態によれば、上述した課題の解決に貢献することができる。
実施形態1の動画像符号化復号装置のブロック構成例を示す図である。 実施形態1の動画像符号化復号装置における並列処理の例を示す図である。 実施形態1の動画像処理ユニット内の機能サブユニットの例を示す図である。 従来技術において、同一の動画像処理ユニット内の機能サブユニット間でデータを転送する場合の転送経路の例を示す図である。 実施形態1において、同一の動画像処理ユニット内の機能サブユニット間でデータを転送する場合の転送経路の例を示す図である。 実施形態1において、異なる動画像処理ユニット内の機能サブユニット間でデータを転送する場合の転送経路の例を示す図である。 実施形態1の動画像符号化復号装置の変形例のブロック構成例を示す図である。 実施形態2の動画像符号化復号装置のブロック構成例を示す図である。 実施形態2の動画像符号化復号装置の変形例のブロック構成例を示す図である。 実施形態2の動画像符号化復号装置の変形例における故障検出処理の例を示す図である。 実施形態2の動画像符号化復号装置の変形例における故障検出処理の例を示す図である。 実施形態3のコアプロセッサのブロック構成例を示す図である。 実施形態1〜3を概念的に示した処理装置のブロック構成例を示す図である。 特許文献1の構成に相当する動画像処理装置のブロック構成例を示す図である。 特許文献2の構成に相当する並列処理装置のブロック構成例を示す図である。
以下では、具体的な実施形態について、図面を参照しながら詳細に説明する。説明の明確化のため、以下の記載及び図面は、適宜、省略、及び簡略化がなされている。また、様々な処理を行う機能ブロックとして図面に記載される各要素は、ハードウェア的には、CPU、メモリ、その他の回路で構成することができ、ソフトウェア的には、メモリにロードされたプログラムなどによって実現される。したがって、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、またはそれらの組合せによっていろいろな形で実現できることは当業者には理解されるところであり、いずれかに限定されるものではない。なお、各図面において、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略されている。
(1)実施形態1
(1−1)実施形態1の構成
本実施形態は、処理装置が動画像符号化復号装置である場合の例である。この動画像符号化復号装置は、処理ユニットとしての動画像処理ユニットを複数備える。
図1は、本実施形態の動画像符号化復号装置のブロック構成例を示す図である。本実施形態の動画像符号化復号装置は、Codec_EL_0 101−0及びCodec_EL_1 101−1という2つの動画像処理ユニットを備える。なお、動画像処理ユニットの個数は、複数であれば良く、図1のように2つには限定されない。
図2は、本実施形態の動画像符号化復号装置における並列処理の例を示す図である。本実施形態の動画像符号化復号装置は、例えば、図2に示されるような符号化対象画像200の符号化処理及び復号処理を行う。その際、符号化対象画像200を、X(Xは1以上の自然数)+1個の並列処理領域0〜Xに分割し、Codec_EL_0 101−0及びCodec_EL_1 101−1が各並列処理領域0〜Xを並列に処理する。例えば、Codec_EL_0 101−0は、0番目の並列処理領域0、2番目の並列処理領域2といった偶数番目の並列処理領域をシーケンシャルに処理することが考えられる。その一方で、Codec_EL_1 101−1は、1番目の並列処理領域1、3番目の並列処理領域3といった奇数番目の並列処理領域をシーケンシャルに処理することが考えられる。図2においては、H.265のような規格を想定し、コーディングツリーブロック(CTB:Coding Tree Block)201のライン単位で並列処理領域に分割している。しかし、並列処理領域の分割方法は問わない。例えば、H.264のような規格ではマクロブロック(MB)のライン単位で並列処理領域に分割することも考えられる。また、各並列処理領域0〜Xにおいては、CTB 201の単位で、処理方向202に沿って符号化処理及び復号処理が行われる。
図3は、Codec_EL_0 101−0内の機能サブユニットの例を示す図である。Codec_EL_0 101−0は、図3に示されるような複数の機能サブユニットを含む。図3の例では、機能サブユニットとして、図14と同様に、可変長処理部(VLC)1010、動き補償処理部(MC)1013、及び周波数変換部(TRF)1014を含む。図3の例ではさらに、機能サブユニットとして、整数画素精度動き予測処理部(CME:Coarse Motion Estimation)1011、小数画素精度動き予測処理部(FME:Fine Motion Estimation)1012、及びデブロッキングフィルタ処理部(DEB:DEBlocking)1015を含む。また、Codec_EL_0 101−0は、複数の機能サブユニットのそれぞれに接続される複数の入出力インタフェース(IO)113をさらに含み、複数の入出力インタフェース113は第1のリングバス111−0によってリング状に接続される。なお、Codec_EL_1 101−1も、図3と同様の構成であるとする。
図1に戻ると、本実施形態の動画像符号化復号装置はさらに、Codec_EL_0 101−0に対応して、Ctrl_0 103−0、Mem_Cnt_0 102−0、LMC(Line Memory Controller)105、及びDMAC_0 104−0を備える。また、本実施形態の動画像符号化復号装置はさらに、Codec_EL_1 101−1に対応して、Ctrl_1 103−1、Mem_Cnt_1 102−1、LCB(Line Control Block)106、及びDMAC_1 104−1を備える。また、本実施形態の動画像符号化復号装置はさらに、Line MEM107、Ctrl_Cmn108、マスタバス109、バス110を備える。
Mem_Cnt_0 102−0は、Codec_EL_0 101−0へ供給する動画像データを格納する動画像メモリ(不図示)における動画像データの読み書きを制御するコントローラである。Mem_Cnt_1 102−1は、Codec_EL_1 101−1へ供給する動画像データを格納する動画像メモリ(不図示)における動画像データの読み書きを制御するコントローラである。Line MEM107は、Codec_EL_0 101−0及びCodec_EL_1 101−1による処理結果等を格納するラインメモリ(Line Memory)であり、RAM(Random Access Memory)等で構成される。LMC105は、Line MEM107における処理結果等の読み書きを制御するモジュールである。例えば、LMC105は、Codec_EL_0 101−0による処理結果をLine MEM107に書き込む。また、LMC105は、LCB106から、Codec_EL_1 101−1による処理結果を受信して、Line MEM107に書き込む。また、LMC105は、Line MEM107からCodec_EL_0 101−0による処理結果を読み出して、LCB106に転送する。また、LMC105は、Line MEM107から、Codec_EL_1 101−1による処理結果を読み出して、Codec_EL_0 101−0に転送する。LCB106は、Codec_EL_1 101−1のデータをCodec_EL_0 101−0のLMC105へ転送するモジュールである。例えば、LCB106は、Codec_EL_1 101−1による処理結果をLMC105に転送する。また、LCB106は、LMC105から、Codec_EL_0 101−0による処理結果を受信して、Codec_EL_1 101−1に転送する。DMAC_0 104−0は、Mem_Cnt_0 102−0及びCodec_EL_0 101−0などのマスタバス109に対するバスIFとなるコントローラである。DMAC_1 104−1は、Mem_Cnt_1 102−1及びCodec_EL_1 101−1などのマスタバス109に対するバスIFとなるコントローラである。Ctrl_0 103−0は、Codec_EL_0 101−0、Mem_Cnt_0 102−0、LMC105、DMAC_0 104−0などの動作を制御するコントローラである。Ctrl_1 103−1は、Codec_EL_1 101−1、Mem_Cnt_1 102−1、LCB106、DMAC_1 104−1などの動作を制御するコントローラである。Ctrl_Cmn108は、Codec_EL_0 101−0及びCodec_EL_1 101−1の全体の制御を行うコントローラである。マスタバス109は、DMAC_0 104−0及びDMAC_1 104−1が接続されるバスである。バス110は、Ctrl_0 103−0及びCtrl_1 103−1にレジスタ設定を行うバスである。マスタバス109及びバス110は同一のバスでも構わない。また、図1では、DMAC_0 104−0及びDMAC_1 104−1は、同一のマスタバス109に接続されているが、それぞれ別のバスに接続されるような構成でも構わない。
本実施形態の動画像符号化復号装置においては、Ctrl_0 103−0、Mem_Cnt_0 102−0、Codec_EL_0 101−0内の機能サブユニット、LMC105、及びDMAC_0 104−0は、第1のリングバス111−0によってリング状に接続されている。また同様に、Ctrl_1 103−1、Mem_Cnt_1 102−1、Codec_EL_1 101−1内の機能サブユニット、LCB106、及びDMAC_1 104−1は、第1のリングバス111−1によってリング状に接続されている。第1のリングバス111−0,111−1は、転送方向が互いに反対の右回り及び左回りである2つのリングバスで構成される、双方向のリングバスである。さらに、LCB106及びLMC105は、第1のリングバス111−0,111−1とは別のリングバスである、第2のリングバス112によってリング状に接続されている。
なお、本実施形態においては、Codec_EL_0 101−0及びCodec_EL_1 101−1に複数の機能サブユニットが含まれる例を示したが、必ずしもこのような階層構造を取る必要はない。また、機能サブユニットは、図3に限定されるものではなく、動画像の符号化処理及び復号処理を行う機能を実現するものであれば、機能サブユニットの個数、種類は問わない。また、Ctrl_m(m=0,1) 103−m、Mem_Cnt_m 102−m、Codec_EL_m 101−m内の機能サブユニット、LMC105(又はLCB106)、及びDMAC_m 104−mは、本実施形態と異なる接続順であっても構わないし、動画像の符号化処理及び復号処理を行う機能を実現するものであれば、異なるモジュールで構成されても構わない。
(1−2)実施形態1の動作
以下、本実施形態の動画像符号化復号装置における転送経路を、従来技術の動画像符号化復号装置における転送経路と対比して説明する。
図4は、従来技術の動画像符号化復号装置における、同一のCodec_EL内の機能サブユニット間でデータを転送する場合の転送経路の例を示す図である。図4に示される従来技術の動画像符号化復号装置は、特許文献1に記載の技術のように、Codec_EL_0 101−0とCodec_EL_1 101−1とが同一のリングバスによってリング状に接続されている点で、本実施形態とは異なる。また、図4において、Codec_EL_1 101−1には、0番目のSub_Unit_10 1016からN(Nは1以上の自然数)番目のSub_Unit_1N 1017までのN+1個の機能サブユニットが含まれる。ここで、例えば、Codec_EL_1 101−1内のSub_Unit_1N 1017から、同じくCodec_EL_1 101−1のSub_Unit_10 1016へデータを転送する場合を考える。従来技術においては、Codec_EL_0 101−0とCodec_EL_1 101−1とが同一のリングバスによってリング状に接続されている。そのため、データは、LCB106、DMAC_1 104−1、Ctrl_0 103−0、Mem_Cnt_0 102−0、Codec_EL_0 101−0内の機能サブユニット、LMC105、DMAC_0 104−0、Ctrl_1 103−1、Mem_Cnt_1 102−1という転送経路P1を経由して、Sub_Unit_10 1016へ転送される。そのため、データは、非常に長い経路を転送されることになる。また、Ctrl_0 103−0、Mem_Cnt_0 102−0、Codec_EL_0 101−0、LMC105、DMAC_0 104−0には、他方の動画像処理ユニットであるCodec_EL_1 101−1のデータが流れることになるため、バストラフィックが増加してしまうことになる。
図5及び図6は、本実施形態の動画像符号化復号装置における転送経路の例を示す図である。本実施形態においては、第1のリングバス111−0,111−1は、右回りと左回りの2つのリングバスを持つ、双方向のリングバスである。双方向のリングバスの使用方法は様々な方法が考えられる。本実施形態においては、Codec_EL内の機能サブユニットが第1のリングバスを使用してデータを転送する場合は、右回りのリングバスを使用し、LMC105又はLCB106が第2のリングバス112を経由して受け取ったデータを第1のリングバスを使用して転送する場合は、左回りのリングバスを使用するものとする。
図5は、同一のCodec_EL内の機能サブユニット間でデータを転送する場合の転送経路の例を示す図である。前述の場合と同様に、Codec_EL_1 101−1内のSub_Unit_1N 1017から、同じくCodec_EL_1 101−1内のSub_Unit_10 1016へデータを転送する場合を考える。本実施形態においては、Codec_EL_1 101−1内の機能サブユニットは、Codec_EL_0 101−0とは独立に設けた第1のリングバス111−1によってリング状に接続されている。また、Sub_Unit_1N 1017は、第1のリングバス111−1の右回りのバスを使用してデータを転送する。そのため、データは、LCB106、DMAC_1 104−1、Ctrl_1 103−1、Mem_Cnt_1 102−1という転送経路P2を経由して、Sub_Unit_10 1016へ転送される。そのため、従来技術と比較して、転送経路を短くすることが可能である。また、Codec_EL_0 101−0側には、Codec_EL_1 101−1のデータが流れないため、Codec_EL_1 101−1のデータが原因でCodec_EL_0 101−0側のバストラフィックが増加することがない。
図6は、異なるCodec_EL内の機能サブユニット間でデータを転送する場合の転送経路の例を示す図である。例えば、図2で示される符号化対象画像200に対して動画像の符号化処理または復号処理を行う場合、上側の並列処理領域の処理結果を下側の並列処理領域の処理で参照する場合がある。このため、Codec_EL_1 101−1とCodec_EL_0 101−0の間を跨った転送が発生する。例えば、Line MEM107内のデータの転送などが該当する。そのため、Codec_EL_1 101−1及びCodec_EL_0 101−0をそれぞれ別々の第1のリングバス111−0,111−1で接続しただけでは、Codec_EL_1 101−1とCodec_EL_0 101−0間での転送を行うことができない。そのため、LCB106とLMC105とを第2のリングバス112によって接続する。これにより、Codec_EL_1 101−1とCodec_EL_0 101−0間の転送が可能になる。ここでは、図6のように、Codec_EL_1 101−1内のSub_Unit_1N 1017から、Codec_EL_0 101−0内のSub_Unit_0N 1018へデータを転送する場合を考える。この場合、データは、LCB106、LMC105という転送経路P3を経由して、Sub_Unit_0N 1018へ転送される。第2のリングバス112を経由することにより、Sub_Unit_0N 1018へのデータの転送が可能になる。Sub_Unit_1N 1017は、第1のリングバス111−1の右回りのリングバスを使用してLCB106へデータを転送する。LCB106は、第2のリングバス112を使用してLMC105へデータを転送する。LMC105は、第2のリングバス112を経由してデータを受け取ったため、前述の通り、第1のリングバス111−0の左回りのリングバスを使用してSub_Unit_0N 1018へデータを転送する。
(1−3)実施形態1の効果
特許文献1に記載の技術においては、複数の動画像処理ユニットが同一のリングバスでリング状に接続されていた。そのため、他方の動画像処理ユニットを跨いだ転送が発生し、転送経路が長くなるという問題があった。また、他方の動画像処理ユニットのデータが原因でバストラフィックが増加するという問題があった。これに対して本実施形態においては、動画像処理ユニット毎に独立に設けたリングバス(第1のリングバス)によって、動画像処理ユニット内の機能サブユニットをリング状に接続した。また、動画像処理ユニット間は別のリングバス(第2のリングバス)によってリング状に接続した。これにより、動画像処理ユニット内の転送は第1のリングバスを使用して行い、動画像処理ユニット間の転送は第2のリングバスを使用して行う構成とした。そのため、他方の動画像処理ユニットを跨いだ転送が発生しないため、転送経路を短くすることが可能となる。同時に、他方の動画像処理ユニットのバストラフィックが増加することもない。
また、特許文献1に記載の技術においては、動画像データを格納する動画像メモリの共有による小規模化のために、動画像メモリにおける動画像データの読み書きを制御するメモリコントローラであるMem_Cntや外部バスとのバスIFであるDMACは、複数の動画像処理ユニットに対して1つの構成であった。これに対して本実施形態においては、動画像メモリの共有による小規模化よりも構成可変容易性を重視して、Mem_CntやDMACを動画像処理ユニット毎に配置して、各動画像処理ユニットのリングバス(第1のリングバス)に接続する構成とした。さらに、LMC、LCBは、第1のリングバスとは別のリングバス(第2のリングバス)によって接続する構成とした。そのため、動画像処理ユニットの拡張の際は、Ctrl_Cmnの拡張と第2のリングバスの接続変更のみを行えばよい。これにより、特許文献1に記載の技術と比較して、動画像処理ユニットの拡張をより容易に行うことが可能である。
また、特許文献2に記載の技術においては、各層の複数列(第2列〜第4列)分の各PEを、他層のPEに接続していた。そのため、配線性の悪化、面積増加を招くという問題があった。これに対して本実施形態においては、LMC、LCBのみをリングバス(第2のリングバス)によって接続する構成とした。これにより、特許文献2に記載の技術と比較して、配線性の悪化、面積増加を招くことがない。
(1−4)実施形態1の変形例
図7は、本実施形態の動画像符号化復号装置の変形例のブロック構成例を示す図である。図1に示される動画像符号化復号装置においては、第1のリングバス111−0,111−1を、Codec_EL_0 101−0及びCodec_EL_1 101−1毎に独立に設けたため、特許文献1に記載の技術と比較して、転送経路を短くすることができる。また、特許文献1には、転送経路を短くする手法として、リングバス上のデータの転送方向を逆方向に変更するという手法が記載されている。しかし、本実施形態においては、上述のように転送経路を短くできるため、データの転送方向を変更するという手法は必要ない。したがって、第1のリングバス111−0,111−1は、双方向のリングバスとする必要はなく、単方向のリングバスで構成することも可能になる。
そこで、本変形例においては、双方向のリングバスであった第1のリングバス114−0,114−1の代わりに、転送方向が単方向のリングバスである第1のリングバス114−0,114−1を設けている。なお、図7においては、第1のリングバス114−0,114−1が右回りのリングバスである例を示すが、これに限定するものではない。
なお、本変形例においては、第1のリングバス114−0,114−1は、単方向のリングバスで構成されている。そのため、全てのデータが右回りに転送される。これ以外の動作は実施形態1と同様である。
本変形例においては、図1に示される構成と比較して、第1のリングバスを双方向のリングバスから単方向のリングバスに変更しているため、内部バスを1本減らすことが可能となる。これにより、さらなる回路規模の削減、配線性の向上を図ることができる。この効果は、内部バスに使用されているビットが多いほど顕著になる。
(2)実施形態2
(2−1)実施形態2の構成
本実施形態は、実施形態1の動画像符号化復号装置の変形例である。
図8は、本実施形態の動画像符号化復号装置のブロック構成例を示す図である。本実施形態の動画像符号化復号装置は、図7に示される実施形態2と比較して、LMC105、LCB106をLCB/LMC115−0,115−1に置き換えた点と、Line MEM116を追加した点と、が異なり、その他の構成は実施形態1と同様である。なお、図8においては、図7に示される単方向の第1のリングバス114−0,114−1を用いたが、図1に示される双方向の第1のリングバス111−0,111−1でも良い。
実施形態1においては、Codec_EL_0 101−0及びCodec_EL_1 101−1のそれぞれに、別の機能を持つLMC105、LCB106を配置していた。これに対して本実施形態においては、LMC105、LCB106を、LCB及びLMC両方の機能を有するモジュールであるLCB/LMC115−0,115−1に置き換える構成とした。また、実施形態1においては、LMC105のみにLine MEM107が接続されていた。これに対して本実施形態においては、両方のLCB/LMC115−0,115−1にそれぞれLine MEM107,116が接続される構成とした。また、本実施形態においては、Line MEM107は、Codec_EL_0 101−0による処理結果等を格納し、Line MEM116は、Codec_EL_1 101−1による処理結果等を格納する。LCB/LMC115−0は、Line MEM107における処理結果等の読み書きの制御等を行うモジュールである。例えば、LCB/LMC115−0は、Codec_EL_0 101−0による処理結果をLine MEM107に書き込む。また、LCB/LMC115−0は、Line MEM107から、Codec_EL_0 101−0による処理結果を読み出して、LCB/LMC115−1,またはCodec_EL_0 101−0に転送する。また、LCB/LMC115−0は、LCB/LMC115−1から、Codec_EL_1 101−1による処理結果を受信して、Codec_EL_0 101−0に転送する。LCB/LMC115−1は、Line MEM116における処理結果等の読み書きの制御等を行うモジュールである。例えば、LCB/LMC115−1は、Codec_EL_1 101−1による処理結果をLine MEM116に書き込む。また、LCB/LMC115−1は、Line MEM116から、Codec_EL_1 101−1による処理結果を読み出して、LCB/LMC115−0,またはCodec_EL_1 101−1に転送する。また、LCB/LMC115−1は、LCB/LMC115−0から、Codec_EL_0 101−0による処理結果を受信して、Codec_EL_1 101−1に転送する。
(2−2)実施形態2の動作
本実施形態においては、Codec_EL_0 101−0及びCodec_EL_1 101−1のそれぞれが、LCB/LMC及びLine MEMを備えている。そのため、Codec_EL_0 101−0及びCodec_EL_1 101−1を独立に動作させることが可能である。これにより、Codec_EL_0 101−0及びCodec_EL_1 101−1が、互いに別々の符号化処理又は復号処理を行うことも可能となる。例えば、Codec_EL_0 101−0が復号処理を行い、Codec_EL_1 101−1が符号化処理を行うことが可能となる。また、Codec_EL_0 101−0及びCodec_EL_1 101−1が互いに別々の画像の符号化処理を行うことや,互いに別々の画像の複合処理を行うことも可能となる。もちろん、前述の実施形態1,2と同様に、Codec_EL_0 101−0及びCodec_EL_1 101−1が、同じ画像の異なる並列処理領域の符号化処理及び復号処理を並列に行うことも可能である。
(2−3)実施形態2の効果
本実施形態の効果は実施形態1と同様である。ただし、本実施形態において、複数の動画像処理ユニットに別々の符号化処理又は復号処理を割り当てる場合、以下の点で優位である。
・動画像処理ユニット間の干渉による性能低下が無い。本実施形態においても、前述の実施形態1と同様に、他方の動画像処理ユニットを跨いだデータの転送は発生しない。そのため、複数の動画像処理ユニットに別々の処理を割り当てた場合、動画像処理ユニット間の干渉による性能低下は一切発生しない。
・Mem_Cnt、DMACの制御が容易である。特許文献1に記載の技術においては、Mem_Cnt、DMACは、複数の動画像処理ユニットに対して1つの構成であるため、制御が煩雑になる。これに対して本実施形態においては、Mem_Cnt、DMACは、Codec_EL1つに対して1つの構成である。そのため、Mem_Cnt、DMACは、独立に制御することが可能であるため、制御が容易となる。
・リセット、クロック停止の制御が容易である。特許文献1に記載の技術においては、Mem_Cnt、DMACは、複数の動画像処ユニットに対して1つの構成であることや、他方の動画像処理ユニットを跨いだ転送が発生することから、リセットやクロック停止の制御が難しい。これに対して本実施形態においては、複数の動画像処理ユニットに別々の処理を割り当てた場合、動画像処理ユニット間は互いに干渉しないため、リセットやクロック停止の制御を容易に行うことが可能である。
(2−4)実施形態2の変形例
本実施形態によれば、複数のCodec_ELを独立に動作させることが可能である。そのため、複数のCodec_ELに同一の符号化処理又は復号処理を割り当て、その処理結果を比較することで、Codec_ELの故障検出を行うことが可能である。
図9は、本実施形態の動画像符号化復号装置の変形例のブロック構成例を示す図である。本変形例は、図8に示された構成に対して、M(Mは1以上の自然数)+1個の動画像処理ユニット(Codec_EL_0 101−0〜Codec_EL_M 101−M)を設け、故障検出部117を追加したものに相当する。なお、図9においては、図8に示された構成要素のうちCodec_EL以外の構成要素は全て省略している。
故障検出部117は、Codec_EL_0 101−0〜Codec_EL_M 101−Mの処理結果を比較し、その比較結果を基に、Codec_EL_0 101−0〜Codec_EL_M 101−Mの故障を検出する。
以下、本変形例における故障検出処理を説明する。
図10は、M=1とし、2つのCodec_EL_0 101−0及びCodec_EL_1 101−1で故障検出を行った場合の例である。Codec_EL_0 101−0及びCodec_EL_1 101−1の処理結果を、それぞれ結果0、結果1とする。故障検出部117は、結果0、結果1を比較した結果、両者が一致した場合、Codec_EL_0 101−0及びCodec_EL_1 101−1は故障していないと判定することができる。一方、故障検出部117は、結果0、結果1を比較した結果、両者が不一致となった場合、Codec_EL_0 101−0又はCodec_EL_1 101−1のどちらかが故障していると判定することができる。
図11は、M=2とし、3つのCodec_EL_0 101−0、Codec_EL_1 101−1、及びCodec_EL_2 101−2で故障検出を行った場合の例である。Codec_EL_0 101−0、Codec_EL_1 101−1、及びCodec_EL_2 101−2の処理結果を、それぞれ結果0、結果1、結果2とする。故障検出部117は、結果0、結果1、結果2を比較した結果、例えば、結果0と結果1とが一致し、結果2のみ不一致となったとする。この場合、故障検出部117は、Codec_EL_2 101−2が故障していると判定することができる。さらにこの場合は、故障検出部117は、Codec_EL_0 101−0及びCodec_EL_1 101−1は故障していないと判定することができる。そのため、Codec_EL_0 101−0及びCodec_EL_1 101−1の処理結果である結果0及び結果1は、その後の処理において使用可能である。
(3)実施形態3
本実施形態は、処理装置がコアプロセッサである場合の例である。このコアプロセッサは、処理ユニットとしてのプロセッサグループを複数備える。
図12は、本実施形態のコアプロセッサのブロック構成例を示す図である。本実施形態のコアプロセッサは、M(Mは1以上の自然数)+1個のプロセッサグループであるProcessor_Gr_0 301−0〜Processor_Gr_M 301−Mを備える。各プロセッサグループには、N(Nは1以上の自然数)個のプロセッサPm_n(m=0,...,M。n=0,...,N−1)3010と、他のプロセッサグループへのデータの転送を行う転送モジュールとしての1つのプロセッサPm_N(m=0,...,M) 3011と、が含まれる。
本実施形態のコアプロセッサにおいては、Processor_Gr_0 301−0内のプロセッサP0_n 3010及びP0_N 3011は、第1のリングバス302−0によってリング状に接続されている。また同様に、Processor_Gr_1 301−1内のプロセッサP1_n 3010及びP1_N 3011は、第1のリングバス302−1によってリング状に接続されている。また同様に、Processor_Gr_M 301−M内のプロセッサPM_n 3010及びPM_N 3011は、第1のリングバス302−Mによってリング状に接続されている。さらに、各プロセッサグループ間のプロセッサPm_N 3011は、第1のリングバス302−0〜302−Mとは別のリングバスである、第2のリングバス303によってリング状に接続されている。
特許文献2に記載の技術においては、自層のPE宛ではないパケットが、リングバス701上を流れるため、他層のパケットが原因でバストラフィックが増加するという問題があった。これに対して本実施形態においては、密な連携が必要なプロセッサグループ内のプロセッサ、例えば、Processor_Gr_0 301−0内のプロセッサP0_0,P0_1,P0_2,...,P0_N間の通信は、第1のリングバス302−0を使用して行われる。また、プロセッサグループ間の通信は、第2のリングバス303を使用して行われる。これにより、他のプロセッサグループのデータがリングバス(第1のリングバス)上を流れることが無くなるため、他のプロセッサグループのデータが原因でバストラフィックが増加することがない。
また、特許文献2に記載の技術においては、各層の複数列(第2列〜第4列)分の各PEを、他層のPEに接続する構成であった。これに対して本実施形態においては、Pm_n 3011のみをリングバス(第2のリングバス)によって接続する構成とした。そのため、特許文献2に記載の技術と比較して、配線性の悪化、面積増加を招くことがない。
(4)実施形態1〜3の概念
図13は、前述の実施の形態1〜3を概念的に示した処理装置のブロック構成例を示す図である。図13に示される処理装置は、M(Mは1以上の自然数)+1個の処理ユニット401−0〜401−Mと、M+1個の転送モジュール402−0〜402−Mと、M+1個の第1のリングバス403−0〜403−Mと、第2のリングバス404と、を備える。
処理ユニット401−0〜401−Mは、互いに並列に処理可能な処理ユニットであり、N個(Nは1以上の自然数)のサブユニット4010を含んでいる。処理ユニット401−0〜401−Mは、動画像処理ユニットであるCodec_EL_0 101−0〜Codec_EL_M 101−M及びプロセッサグループであるProcessor_Gr_0 301−0〜Processor_Gr_M 301−Mに対応する。また、サブユニット4010は、可変長処理部(VLC)1010、整数画素精度動き予測処理部(CME)1011、小数画素精度動き予測処理部(FME)1012、動き補償処理部(MC)1013、及び周波数変換部(TRF)1014、デブロッキングフィルタ処理部(DEB)1015に対応する。また、サブユニット4010は、プロセッサPm_n(m=0,...,M。n=0,...,N−1)3010及びプロセッサPm_N(m=0,...,M) 3011に対応する。
転送モジュール402−0〜402−Mは、処理ユニット401−0〜401−Mのそれぞれに対応して設けられ、処理ユニット401−0〜401−M間のデータ転送を行うモジュールである。転送モジュール402−0〜402−Mは、LMC105、LCB106、LCB/LMC115−0,115−1、及びプロセッサPm_N(m=0,...,M) 3011に対応する。なお、図13においては、転送モジュール402−0〜402−Mは、対応する処理ユニット401の外部に設けられているが、対応する処理ユニット401の内部に設けても良い。
第1のリングバス403−0〜403−Mは、処理ユニット401−0〜401−Mのそれぞれに対応して設けられ、対応する処理ユニット401内のサブユニット4010と、その処理ユニット401に対応する転送モジュール402と、をリング状に接続するリングバスである。第1のリングバス403−0〜403−Mは、第1のリングバス111−0,111−1,114−0,114−1,302−0〜302−Mに対応する。なお、図13においては、第1のリングバス403−0〜403−Mは、右回りの単方向のリングバスとして示されているが、左回りの単方向のリングバスとしても良いし、右回り及び左回りの2つのリングバスを持つ、双方向のリングバスとしても良い。
第2のリングバス404は、転送モジュール402−0〜402−Mをリング状に接続するリングバスである。第2のリングバス404は、第2のリングバス112,303に対応する。
図13に示される処理装置においては、処理ユニット毎に独立に設けた第1のリングバスによって、処理ユニット内のサブユニットをリング状に接続する構成とした。また、処理ユニット間は、第1のリングバスとは別の第2のリングバスによってリング状に接続する構成とした。そのため、処理ユニット内の転送は第1のリングバスを使用して行われ、処理ユニット間の転送は第2のリングバスを使用して行われる構成となる。
これにより、データの転送を行う場合に、他の処理ユニットを跨いだ転送が発生しないため、転送経路を短くすることが可能となる。また、ある処理ユニットの第1のリングバスに他の処理ユニットのデータが流れることがないため、他の処理ユニットのデータが原因でバストラフィックが増加することもない。また、他の処理ユニットと接続するのは、転送モジュールのみであるため、配線性の悪化、面積増加を招くことがない。
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。
101−0 動画像処理ユニット(Codec_EL_0)
101−1 動画像処理ユニット(Codec_EL_1)
1010 可変長処理部(VLC)
1011 整数画素精度動き予測処理部(CME)
1012 小数画素精度動き予測処理部(FME)
1013 動き補償処理部(MC)
1014 周波数変換部(TRF)
1015 デブロッキングフィルタ処理部(DEB)
102−0 メモリコントローラ(Mem_Cnt_0)
102−1 メモリコントローラ(Mem_Cnt_1)
103−0 コントローラ(Ctrl_0)
103−1 コントローラ(Ctrl_1)
104−0 ダイレクトメモリアクセスコントローラ(DMAC_0)
104−1 ダイレクトメモリアクセスコントローラ(DMAC_1)
105 ラインメモリコントローラ(LMC)
106 ラインコントロールブロック(LCB)
107 ラインメモリ(Line MEM)
108 コントローラ(Ctrl_Cmn)
109 マスタバス
110 バス
111−0,111−1 第1のリングバス
112 第2のリングバス
113 入出力インタフェース(IO)
114−0,114−1 第1のリングバス
115−0,115−1 LCB/LMC
116 ラインメモリ(Line MEM)
117 故障検出部
200 符号化対象画像
201 CTB
202 処理方向
301−0〜301−M プロセッサグループ(Processor_Gr_0〜Processor_Gr_M)
3010 プロセッサ
3011 プロセッサ(転送モジュール)
302−0〜302−M 第1のリングバス
303 第2のリングバス
401−0〜401−M 処理ユニット
402−0〜402−M 転送モジュール
403−0〜403−M 第1のリングバス
404 第2のリングバス
P1,P2,P3 転送経路

Claims (14)

  1. 複数の処理ユニットと、
    前記複数の処理ユニットのそれぞれに対応して設けられ、前記処理ユニット間でデータを転送する複数の転送モジュールと、
    前記複数の処理ユニットのそれぞれに対応して設けられ、対応する前記処理ユニット内のサブユニットと、該処理ユニットに対応する前記転送モジュールと、をリング状に接続する複数の第1のリングバスと、
    前記複数の転送モジュールをリング状に接続する第2のリングバスと、を備える処理装置。
  2. 前記複数の処理ユニットのそれぞれは、動画像の符号化処理及び復号処理を行う動画像処理ユニットである、請求項1に記載の処理装置。
  3. 前記複数の処理ユニットによる処理結果を格納する1つのラインメモリをさらに備え、
    前記複数の転送モジュールのそれぞれは、前記処理ユニット間で前記処理結果を転送し、
    前記複数の転送モジュールのうちの1つの転送モジュールは、前記ラインメモリへの前記処理結果の読み書きを制御する、請求項2に記載の処理装置。
  4. 前記複数の処理ユニットのそれぞれに対応して設けられ、対応する処理ユニットによる処理結果を格納する複数のラインメモリをさらに備え、
    前記複数の転送モジュールのそれぞれは、対応するラインメモリにおける前記処理結果の読み書きを制御する、請求項2に記載の処理装置。
  5. 前記複数の処理ユニットには、互いに異なる符号化処理又は復号処理が割り当てられる、請求項4に記載の処理装置。
  6. 前記複数の処理ユニットには、互いに同一の符号化処理又は復号処理が割り当てられる、請求項4に記載の処理装置。
  7. 前記複数の処理ユニットの処理結果を比較し、比較結果に基づいて、前記複数の処理ユニットの故障を検出する故障検出部をさらに備える、請求項6に記載の処理装置。
  8. 前記複数の処理ユニットのそれぞれに対応して設けられ、対応する処理ユニットへ供給する動画像を格納する動画像メモリにおける動画像の読み書きを制御する複数のメモリコントローラと、
    前記複数の処理ユニットのそれぞれに対応して設けられ、対応する処理ユニットのバスに対するインタフェースとなる複数のダイレクトメモリアクセスコントローラと、をさらに備える、請求項2に記載の処理装置。
  9. 前記複数の処理ユニットのそれぞれは、前記サブユニットとして複数のプロセッサを備えるプロセッサグループである、請求項1に記載の処理装置。
  10. 前記複数の転送モジュールのそれぞれは、前記複数のプロセッサのうちの1つである、請求項1に記載の処理装置。
  11. 前記第1のリングバスは、転送方向が互いに反対である2つのリングバスで構成される、双方向のリングバスである、請求項1に記載の処理装置。
  12. 前記処理ユニット内のサブユニットが前記第1のリングバスを使用してデータを転送する場合と、前記転送モジュールが前記第2のリングバスを経由して受信したデータを前記第1のリングバスを使用して転送する場合と、で、使用する前記2つのリングバスが異なる、請求項11に記載の処理装置。
  13. 前記第1のリングバスは、転送方向が単方向のリングバスである、請求項1に記載の処理装置。
  14. 複数の処理ユニットを備える処理装置の制御方法であって、
    前記複数の処理ユニットのそれぞれに対応して、前記処理ユニット間でデータを転送する複数の転送モジュールを設け、
    前記複数の処理ユニット毎に、前記処理ユニット内のサブユニットと、前記処理ユニットに対応して設けた前記転送モジュールと、を第1のリングバスによってリング状に接続し、
    前記複数の転送モジュールを第2のリングバスによってリング状に接続する、制御方法。
JP2015062272A 2015-03-25 2015-03-25 処理装置及び処理装置の制御方法 Active JP6454577B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2015062272A JP6454577B2 (ja) 2015-03-25 2015-03-25 処理装置及び処理装置の制御方法
US14/965,612 US10452587B2 (en) 2015-03-25 2015-12-10 Processing apparatus and control method thereof
KR1020160001450A KR20160115680A (ko) 2015-03-25 2016-01-06 처리 장치 및 처리 장치의 제어 방법
CN201610051676.2A CN106028041B (zh) 2015-03-25 2016-01-26 处理设备及其控制方法
EP16162394.7A EP3073378B1 (en) 2015-03-25 2016-03-24 Processing apparatus and control method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015062272A JP6454577B2 (ja) 2015-03-25 2015-03-25 処理装置及び処理装置の制御方法

Publications (2)

Publication Number Publication Date
JP2016181870A true JP2016181870A (ja) 2016-10-13
JP6454577B2 JP6454577B2 (ja) 2019-01-16

Family

ID=55650216

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015062272A Active JP6454577B2 (ja) 2015-03-25 2015-03-25 処理装置及び処理装置の制御方法

Country Status (5)

Country Link
US (1) US10452587B2 (ja)
EP (1) EP3073378B1 (ja)
JP (1) JP6454577B2 (ja)
KR (1) KR20160115680A (ja)
CN (1) CN106028041B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112017004669T5 (de) 2016-09-16 2019-05-29 Kabushiki Kaisha Tokai Rika Denki Seisakusho Luminanzsteuervorrichtung, Luminanzsteuersystem und Luminanzsteuerverfahren

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI720345B (zh) * 2018-09-20 2021-03-01 威盛電子股份有限公司 多核心系統的內連線結構

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6261446A (ja) * 1985-09-11 1987-03-18 Nec Corp ト−クン2重ル−プアクセス方式
JPS6442741A (en) * 1987-08-10 1989-02-15 Nec Corp Data processor
JP2001134527A (ja) * 1999-11-05 2001-05-18 Nec Corp バススイッチ用アダプタ、バススイッチ用ブリッジ、バススイッチ、およびバススイッチシステム
JP2008042571A (ja) * 2006-08-07 2008-02-21 Renesas Technology Corp 動画符号化と動画復号とのいずれかを実行する機能モジュールおよびそれを含む半導体集積回路
JP2012103772A (ja) * 2010-11-08 2012-05-31 Renesas Electronics Corp プロセッサおよびそれを用いた画像処理システム
WO2013081579A1 (en) * 2011-11-29 2013-06-06 Intel Corporation Ring protocol for low latency interconnect switch
US20130311817A1 (en) * 2012-03-07 2013-11-21 Inho Kim Scalable, common reference-clocking architecture using a separate, single clock source for blade and rack servers
US20150006776A1 (en) * 2013-06-29 2015-01-01 Yen-Cheng Liu On-chip mesh interconnect

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3083582B2 (ja) 1991-04-30 2000-09-04 株式会社日立製作所 並列処理装置
WO2005079875A1 (en) * 2004-02-24 2005-09-01 Givaudan Sa Air purifier and volatile liquid disseminator
CN100499556C (zh) * 2007-10-17 2009-06-10 中国人民解放军国防科学技术大学 异构多核处理器高速异步互连通信网络
US20110145837A1 (en) * 2009-12-14 2011-06-16 Bower Kenneth S Filtering Broadcast Recipients In A Multiprocessing Environment
CN102291182B (zh) * 2011-09-21 2014-07-09 武汉市普林电子有限责任公司 一种具有扩容适应性和线路保护功能的环形馈线结构odn网络***
CN104393921B (zh) * 2014-11-17 2017-03-22 北方工业大学 基于环形谐振腔可调延迟的全光缓存器

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6261446A (ja) * 1985-09-11 1987-03-18 Nec Corp ト−クン2重ル−プアクセス方式
JPS6442741A (en) * 1987-08-10 1989-02-15 Nec Corp Data processor
JP2001134527A (ja) * 1999-11-05 2001-05-18 Nec Corp バススイッチ用アダプタ、バススイッチ用ブリッジ、バススイッチ、およびバススイッチシステム
JP2008042571A (ja) * 2006-08-07 2008-02-21 Renesas Technology Corp 動画符号化と動画復号とのいずれかを実行する機能モジュールおよびそれを含む半導体集積回路
JP2012103772A (ja) * 2010-11-08 2012-05-31 Renesas Electronics Corp プロセッサおよびそれを用いた画像処理システム
WO2013081579A1 (en) * 2011-11-29 2013-06-06 Intel Corporation Ring protocol for low latency interconnect switch
US20130311817A1 (en) * 2012-03-07 2013-11-21 Inho Kim Scalable, common reference-clocking architecture using a separate, single clock source for blade and rack servers
US20150006776A1 (en) * 2013-06-29 2015-01-01 Yen-Cheng Liu On-chip mesh interconnect

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112017004669T5 (de) 2016-09-16 2019-05-29 Kabushiki Kaisha Tokai Rika Denki Seisakusho Luminanzsteuervorrichtung, Luminanzsteuersystem und Luminanzsteuerverfahren

Also Published As

Publication number Publication date
US10452587B2 (en) 2019-10-22
EP3073378A1 (en) 2016-09-28
EP3073378B1 (en) 2021-11-10
JP6454577B2 (ja) 2019-01-16
US20160283430A1 (en) 2016-09-29
CN106028041B (zh) 2020-10-30
KR20160115680A (ko) 2016-10-06
CN106028041A (zh) 2016-10-12

Similar Documents

Publication Publication Date Title
JP4546413B2 (ja) 並列計算機のリダクション処理方法及び並列計算機
US9674114B2 (en) Modular decoupled crossbar for on-chip router
US8265070B2 (en) System and method for implementing a multistage network using a two-dimensional array of tiles
US10361886B2 (en) Apparatus and method for collective communication in a parallel computer system
US6681316B1 (en) Network of parallel processors to faults-tolerant towards said processors and reconfiguration method applicable to such a network
ITNA960032A1 (it) Multicalcolatore elettronico numerico parallelo multiprocessore a ridondanza di processori accoppiati
JPS62208158A (ja) マルチプロセツサシステム
Rajkumar et al. Design of 4-disjoint gamma interconnection network layouts and reliability analysis of gamma interconnection networks
JP6454577B2 (ja) 処理装置及び処理装置の制御方法
EP3008608B1 (en) Collaboration server
US10193827B2 (en) Hot carrier injection tolerant network on chip router architecture
Yunus et al. Shuffle Exchange Network in Multistage InterconnectionNetwork: A Review and Challenges
EP2282269A1 (en) Network for mutually connecting computers
JP2006260127A (ja) 結合網およびそれを用いたマルチポートメモリ
JPH03205985A (ja) マルチプロセッサ型動画像符号化装置及びバス制御方法
CN107844451B (zh) 一种级联板间流水线的“蝶式”传输方法
US20150049758A1 (en) Hot carrier injection tolerant network on chip router architecture
JP4679178B2 (ja) 通信装置及びメモリ装置
CN108632142B (zh) 节点控制器的路由管理方法和装置
US10484264B2 (en) Communication management method and information processing apparatus
WO2015141153A1 (ja) プログラマブル論理集積回路
Gu et al. Research on network fault tolerance method on chip
JP6214346B2 (ja) 二重系制御装置
Amaresh et al. Performance Analysis of Data Communication Using Hybrid NoC for Low Latency and High Throughput on FPGA
WO2020028790A1 (en) Dynamic data paths in flash drives

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180904

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181030

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181217

R150 Certificate of patent or registration of utility model

Ref document number: 6454577

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150