JP5373659B2 - 電子機器 - Google Patents

電子機器 Download PDF

Info

Publication number
JP5373659B2
JP5373659B2 JP2010033654A JP2010033654A JP5373659B2 JP 5373659 B2 JP5373659 B2 JP 5373659B2 JP 2010033654 A JP2010033654 A JP 2010033654A JP 2010033654 A JP2010033654 A JP 2010033654A JP 5373659 B2 JP5373659 B2 JP 5373659B2
Authority
JP
Japan
Prior art keywords
unit
potential
electronic device
instruction
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010033654A
Other languages
English (en)
Other versions
JP2011170606A (ja
Inventor
英史 伊部
忠信 鳥羽
健一 新保
斉 谷口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2010033654A priority Critical patent/JP5373659B2/ja
Priority to US13/522,551 priority patent/US8904233B2/en
Priority to PCT/JP2011/052704 priority patent/WO2011102270A1/ja
Publication of JP2011170606A publication Critical patent/JP2011170606A/ja
Application granted granted Critical
Publication of JP5373659B2 publication Critical patent/JP5373659B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1405Saving, restoring, recovering or retrying at machine instruction level
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Semiconductor Memories (AREA)
  • Retry When Errors Occur (AREA)
  • Measurement Of Radiation (AREA)
  • Power Sources (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Description

本発明は、ソフトエラーによって発生する不具合を回避する技術に関する。
半導体デバイスの微細化に伴い、環境放射線(地上における宇宙線中性子やα線)ソフトエラーの問題が特にSRAM(Static Random Access Memory)や論理ゲート、クロック系などについて顕在化している。地上に到達した極めて高いエネルギーを有する中性子がデバイスを構成する原子核内に突入すると、核内の核子(中性子、陽子)が衝突を繰り返し、特に高いエネルギーを持った核子は核外に放出される。
核子が核外に飛び出すだけの運動エネルギーを持ち得ない状態になると、励起状態にある残留原子核から陽子、中性子、重陽子、アルファ粒子などの軽粒子が蒸発する過程が続き、最終的に残留核も反挑エネルギーを持つためこれらの2次粒子は全てその飛程に見合った距離をデバイスの中を飛ぶことになる。
半導体パッケージなどに含まれる放射性同位元素から発生するα線や、核反応の結果発生する電荷を持った2次イオンがSRAMの”high”状態にあるストレージノードの空乏層を通過すると、電子はノードに吸収され、正孔は反対方向に流れイオンの飛跡に沿って電荷収集領域が広がるファネリングメカニズムによって当初の空乏層に発生した以上の電荷がストレージノードに収集される。データが反転するために必要な臨界電荷量以上の電荷が収集されると”high”状態が“low”状態に推移し、保持データに誤りが発生する。これをソフトエラーという。
フリップフロップについてのソフトエラー対策としては、DICE(Dual Inter-locked storage CEll)が知られている(非特許文献1参照)。DICEは、MOS型の限定と中間出力を利用した耐性化技術であり、基本的な回路構成は図10のようになる。ノード論理状態を(node1,node2,node3,node4)で示すと、初期状態は(1,0,1,0)または(0,1,0,1)のみである。仮に(1,0,1,0)の状態から,node1がエラー(0)になると、node4はpMOS、nMOSともONになるので、中間電位状態になり、次のクロック入力時に(信号入力とフィードバックに2箇所入っているが、常にどちらかがONになり、もう一方はOFFになる。)、これがnode1のnMOSのゲート電位になるが、pMOSはONを維持しているのでnode1は”1”を維持する。同様に逆の初期状態も含めどのノードがエラーを起こしても初期状態に戻る。その過程を示すと図11の状態遷移図のようになる。
また、電子システムのソフトエラー対策として、TMR(Triple Module Redundancy)、Duplication+Comparison+checkpoint(DMR、Double Module Redundancyとも呼ばれる)、およびReplication+rollback等の技術が知られている。
TMRでは、モジュールを3系統準備し、3モジュールで同じ命令を実行し、結果を多数決回路を用いて多数決で決定し、次段以降の実行を継続することにより、一つのモジュールにソフトエラーが発生しても、正常な処理が実行される。
Duplication+Comparison+checkpointでは、命令の実行フローの中にチェックポイントを必要な数だけ設け、そこでの命令実行に必要なパラメータを記憶する。2系統のモジュールで同じ命令を実行し、両者の実行結果を比較する。比較した結果、両者が一致しなければ、チェックポイント以降でエラーが発生したものとみなして、チェックポイントに戻って再び同じ処理を実行する。これにより、一方のモジュールにソフトエラーが発生しても、正常な処理が実行される。
Replication+rollbackでは、同じ命令を1つのモジュールで2回実行し、1回目の実行結果と2回目の実行結果とが一致しなければ、その命令を再度実行する。これにより、ソフトエラーが発生しても、再度正常な処理が実行される。
T.Calin, M.Nicolaidis, and R.velazco, "Upset hardened memory design for submicron CMOS technology", IEEE Trans. Nuclear Science, Vol.43, No.6, pp.2874-2878 Dec.1996
近年の半導体デバイスの微細化に伴い、隣接するノード間の距離が短くなる傾向にあり、1回のα線または核反応の結果発生した2次イオンの入射によって発生した電荷が複数のノードに影響を与えるMNU(Multi-Node Upset)が問題となっている。
上記したDICEでは、node1とnode3に同時にソフトエラーが発生すると、次のクロック時にこの状態で安定してしまうため、エラーを修復することができない。すなわち、MNUがnode1とnode3、または、node2とnode4に同時に発生するとDICEではエラーが固定されることになる。
また、TMRでは、一度に複数のモジュールでソフトエラーが発生すると、多数決でエラーの方が採用される場合があり、MNUの解決策とはなりえない。また、TMRは、1つの処理に3つのモジュールを準備して同時に動作させる必要があり、実装面積および消費電力が多くなるという問題がある。
また、Duplication+Comparison+checkpointでも、2つのモジュールの両方でソフトエラーが発生するとエラーのまま処理が進んでしまうことになり、MNUの解決策とはなりえない。また、1つの処理に2つのモジュールを準備して同時に動作させる必要があり、実装面積および消費電力が多くなる。
また、Replication+rollbackでは、同一の処理が異なるタイミングで実行されるため、いずれかの時点で複数のノードにソフトエラーが発生したとしても、それ以外の時点で実行される処理に影響がないため、MNUの問題は発生しない。しかし、Replication+rollbackでは、全ての処理を常に2度実行するため、処理時間が2倍かかってしまう。また、消費電力も2倍になってしまうという問題がある。
本発明は上記事情を鑑みてなされたものであり、本発明の目的は、実装面積、消費電力、および処理時間の増大を抑えつつ、MNUをはじめとするソフトエラーによって発生する電子機器の不具合を防止することにある。
上記課題を解決するために、本発明の電子機器は、所定数の命令毎に設けられたチェックポイントを実行する都度、演算装置内の順序回路に含まれるフリップフロップの状態を示すデータを保存し、ソフトエラーの予兆を検出した場合に、直前のチェックポイントにおける命令の実行後に保存したデータに基づいて演算装置内の順序回路に含まれるフリップフロップの状態を設定し、直前のチェックポイントに対応する命令の次の命令から実行を再開する。
また、例えば、本発明は、ソフトエラーによって発生する不具合を回避する機能を有する電子機器であって、設定されたプログラムに従って、当該電子機器が有する演算装置を用いて命令を逐次実行する命令実行部と、前記演算装置内の順序回路に含まれるフリップフロップの状態を示すデータを保持するデータ保持部と、前記演算装置を構成する半導体のウェル電位を測定する電位測定部と、前記電位測定部によって測定されたウェル電位に基づいてソフトエラーの予兆を検出する予兆検出部と、前記予兆検出部によってソフトエラーの予兆が検出されることなく、チェックポイントが対応付けられている命令が前記命令実行部によって実行された場合に、当該チェックポイントに対応する命令の実行が終了した時点における、前記演算装置内の順序回路に含まれるフリップフロップの状態を示すデータを前記データ保持部に保持させ、前記予兆検出部によってソフトエラーの予兆が検出された場合に、前記命令実行部に命令の実行停止を指示し、前記データ保持部に保持されているデータに基づいて前記演算装置内の順序回路に含まれるフリップフロップの状態を設定し、直前のチェックポイントの次の命令から命令の実行再開を前記命令実行部に指示する制御部とを備えることを特徴とする電子機器を提供する。
本発明の電子機器によれば、実装面積、消費電力、および処理時間の増大を抑えつつ、MNUをはじめとするソフトエラーによって発生する不具合を防止することができる。
本発明の一実施形態に係る電子機器10の構成を示すブロック図である。 電位測定部17の詳細な構成の一例を示す概念図である。 電子機器10のシステム構成を示す概念図である。 ソフトエラー耐性を考慮した設計手順の一例を示すフローチャートである。 ソフトエラーの発生頻度と修復費用の関係の一例を示すグラフである。 電子機器10によって実行される命令実行サイクルの一例を示すフローチャートである。 電子機器10の割り込み処理の一例を示すフローチャートである。 予兆検出部15の他の例を示すブロック図である。 予兆検出部15の他の例を示すフロック図である。 Calinによって提案された耐性ラッチDICEの構成を示す図である。 Calinによって提案された耐性ラッチDICEの状態遷移を示す図である。 SEUTの耐性化対策が微細化に伴って無力化する解析結果と、クロック系のノイズ起因でのソフトエラー率とを併せて示す図である。 新エラーモードMCBIに対応するエラービットの2次元配置パターンを示す図である。 環境中性子線とSiの核反応によって発生する2次イオンのエネルギースペクトルを示す図である。 イオンのエネルギーに対応してSi中で発生する電子(正孔)の電荷密度の計算値を示す図である。 イオンのエネルギーに対応してSi中で飛程を示す図である。 SRAMの2次元レイアウトを示す図である。 メモリセルでの飛跡に沿った電荷発生を計算するためのDCS(Dynamic Cell Shift)法の概念を示す図である。 デザインルールとSETパルス幅の関係を電荷密度の関数として示す図である。 中性子ソフトエラーへのスケーリング効果をまとめた図である。 それぞれの2次イオンがSi中で発生する電荷密度と頻度の関係を示す図である。 陽子、α、原子番号10以上の重イオン、2次イオンの全体がSi中で発生する電荷密度と頻度の関係を示す図である。 陽子、α、原子番号10以上の重イオン、2次イオンの全体がSi中で発生する総電荷と頻度の関係を130nmデバイスについて示す図である。 陽子、α、原子番号10以上の重イオン、2次イオンの全体がSi中で発生する総電荷と頻度の関係を22nmデバイスについて示す図である。 FBM(核反応58003回分。核反応は図の原点で起こす。)のスケーリングによる変化を示す図である。 SEU断面積の励起関数のスケーリングによる変化を示す図である。 MCU断面積の励起関数のスケーリングによる変化を示す図である。 MCU比率のエネルギー依存性のスケーリングによる変化を示す図である。 MCU多重度のスケーリングによる変化を示す図である。 MCBIの場合のMNUの多重度と電流値との関係を示す図である。
以下、本発明の実施の形態の概要および本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態の概要および実施の形態を説明する全図において、同一の部材には原則として同一の符号を付し、その繰り返しの説明は省略する。
本発明は、発明者が得た一連の実験やシミュレーションの新しい知見に基づいており、まずその知見について説明する。
[1.MNUモード・影響の拡大に関する実験的知見]
下記の非特許文献2には、論理デバイスでは微細化が進んでノードの間隔が近くなると発生した電荷が複数のノードにまたがって分配されるため(チャージシェア)該当するノードがMNU(Multi-Node Upset)により同時にエラーになりうることが示されている。背景技術で紹介した高耐性FF(フリップフロップ)・ラッチは空間的または時間的冗長化を基本としているが、このような冗長化対策が複数のノードを利用している場合、MNUによって耐性化策が無力になる場合があることが同文献に示されている。
非特許文献2:Seifert, N., Zhu, X., Massengill, L.W., "Impact of Scaling on Soft-Error Rates in Commercial Microprocessors," TNS, Honolulu, Hawaii, July 23-27, Vol.49, No.6, pp. 3100-3106 (2002).
図12は、そのような解析例と実測例を示したものである。図12に示すように、SEUT(Single Event Upset Tolerant)は、微細化とともにエラー率が増加し、32nmプロセスにはいると非対策FFのレベルと大きくは変わらないほど無力化することが予測されている。
その一方で、同図に実測値として示されているが、クロック系に入ったSET(Single Event Transient)が原因のエラーが大きな問題であることが指摘されている。FFには上記非特許文献2にも示されているが、これに加え、グローバルSET/RESET系に入ったSETもMNUの原因になるため、対策の必要な範囲はメモリ以上に広い。
発明者らは、そのようなMNUの原因となる別モードがあることを中性子照射実験により発見した。実験はSRAMについて行い、エラービットの2次元パターンが図13に例示するように、データパターンによって異なることを明らかにした。すなわち、”1”、”0”が縦横交互にならぶチェッカーボード(CB)パターンでは、ワード線方向に2ビット横並びのエラーがビット線方向に一ビットおきに並び、全て”0”または全て”1”のデータパターンでは、ビット線方向に一列になって連続してエラーが発生する。
発明者は、シミュレーション解析を通じて上記のMNUのメカニズムを解明し、MCBI(Multi-Coupled Bipolar Interaction)と名づけた。すなわち、p−ウェル内のpn接合をイオンが通過した場合に、p−ウェル内に発生した電子はn側に吸収され、p−ウェル内に正孔が残って電位が高くなり一部のトランジスタがON(SES:Single Event Snapback)になり電流が流れる。これが第一ステップとなって周囲の電位変化を引き起こし、寄生サイリスタがONになってp−ウェル内の多数の”High”ノードがエラーになる現象である。
SEL(Single Event Latchup)と類似するが、SELがワード線およびビット線両方向に数千ビットにもわたって拡大し、パワーサイクル(電源の再立ち上げ)をしないと修復しないことに対し、MCBIではエラーの広がりはワード線方向には最大隣接2ビットであり、ビット線方向にのみ十ビット程度延伸し、書き換えで修復できる点に大きな相違がある。
また、図30は準単色中性子源(特定の中性子エネルギーEpに幅の狭い頻度のピークを持った中性子源)で測定した電源電流Iddの変化をEp4点について示したものである。図30に示されているように、エラーが発生しない場合の電源電流値Aに対して、MCBIが発生すると、エラービットの多重度(2,3,4ビット)に対応して、B,C,Dの離散した電流ピークが現れることにも特徴がある。
複数の論理ノードが同時にエラーになるマルチノードアップセット(MNU)は、冗長系の効果を無力にしたり、複数入力の論理ゲートの入力ノードに同時にフォールトを起こす原因となる。
MCBIは、130nmプロセスのSRAMでは最大連続12ビットに及ぶものであるが、WL方向に1直線にならぶものは約2500件のMCUのうち3ビット以上の場合はなく、理論的にもMCBIを考慮していないシミュレーションで発明者が示したように、インターリーブの間隔をWL方向に3ビット以上にし、ECCを設ければ、MCBIは完全に対策できると予測できる(例えば、下記の非特許文献3参照)。
非特許文献3:E.Ibe, S.Chung, S.Wen, H.Yamaguchi, Y.Yahagi, H.Kameyama, S.Yamamoto, T.Akioka, "Spreading Diversity in Multi-cell Neutron-Induced Upsets with Device Scaling," 2006 CICC, San Jose, CA., September 10 - 13, 2006, pp. 437-444 (2006).
一方,背景技術でまとめた高耐性化FF・ラッチでは、SNU(Single Node Upset)への対応は可能であるが、DICE同様一般的にはMNUには対応できない。その点を差し置いても、面積、消費電力、スピード等のペナルテイがそれぞれ大きく、部位を限定して使用すべきである。
[2.MNUの影響の拡大に関するシミュレーションに基づく知見]
発明者は、環境中性子線による半導体デバイスのソフトエラーをMNUを含めて解析するシミュレーションコードCORIMSを既に開発済みであり、その詳細は上記非特許文献3にまとめてある。本発明に関連し、22nmプロセスまでのCMOSデバイスのソフトエラーのスケーリング効果を予測した。以下モデルの概要と解析結果を紹介する。
A.シミュレーションモデル
(i) 核破砕反応モデル
環境中性子線はもともとは銀河系核で発生した超高エネルギー宇宙線(主に陽子)が大気中の酸素や窒素などの原子核と衝突し、核破砕反応により発生するもので、エネルギーは数GeVも及ぶ。高エネルギー中性子は電荷を持たないため、ほとんどの場合、デバイスに当っても素通りする。きわめて低い確率ではあるが、半導体デバイスを構成する元素の原子核と反応すると(主にSi)、ここでも核破砕反応が起き、高エネルギーの2次イオンが発生する。
この核破砕反応は本来多体問題であるが、CORIMSではこれを2段階の相対論的2体問題のカスケードに置き換えて解く。1段目は、入射した中性子が原子核内の核子(陽子、中性子)と順次衝突・散乱を繰り返し、一部の核子が核外に放出されたりしながら、残留励起核になるまでの過程(Intra-Nuclear Cascade,INCと呼ぶ)である。2段目は、INCの後で残留励起核から軽粒子(陽子、中性子、α粒子など)が”蒸発”する過程である。
蒸発する過程は、特定の反応チャネルが特定の確率をもって放出されるが、その確率の計算にはGEMモデルを用いる。2次イオンの種類はSiから発生しうる全ての元素になるが、Mg、Al、陽子、He(α粒子)が主なものになる。地上の環境中性子線スペクトルは現在JESD89Aに開示されているものがNew York海面での国際標準スペクトルとして定められている。スペクトルの形は変わらないが、太陽活動、地磁気緯度、標高、気圧など様々な要因で変動する。特に標高の影響が大きく、航空機高度では海面の100倍程度の強度になる。CORIMSで計算したNew York海面での中性子スペクトルに対応して発生する代表的2次イオンのエネルギースペクトルを図14に、対応するエネルギー範囲のSi中の飛程、エネルギー付与密度(Linear Energy Transfer (LET):単位MeV/(mg/cm2でイオンが通過する材料の密度を掛けると単位長さ当りのエネルギー付与量が得られる。SRIMによる計算結果から電荷付与密度に換算)の計算結果を図15および図16にそれぞれ示す。
運動量保存則を満たさなければいけない関係で、運動エネルギーの大部分は軽粒子(陽子、α粒子)に付与される。重粒子については重いほど、運動エネルギーが数十MeV以下と小さくなるため、その飛程は数十μm以下になる。軽粒子では数十mmを越えることになるが、図15からわかるように軽粒子の電荷付与密度は、エネルギー10〜100MeV以上では急激に減少するため、実際には高エネルギー軽粒子のソフトエラーへの寄与はほとんど無視できることを意味する。
(ii) 電荷収集モデル”
2次イオンがSRAMの”High”データ状態にあるストレージノード直下の空乏層(pn接合)を通過すると、発生した電子・正孔対は空乏層内の電界に沿ってnMOSFETでは電子はノードに、正孔はその反対方向に流れる。発生した電荷の移動に伴って、空乏層内の電界はノードから遠方に、イオンの飛跡に沿って延び(ファネリング効果と呼ぶ)、最初の空乏層内の電荷より多くの電荷を収集するようになる。
CORIMSに実装しているモデルでは、Huのファネリングモデルを採用し、ファネリング長xcを下記の数式(1)により計算する。
Figure 0005373659
ここで、μe、μhは、それぞれ電子、正孔の移動度、Wは空乏層の厚さ、θはイオンの進行方向を天頂角で示したものである。
ファネリングによる電荷の収集効率ηは、下記の数式(2)で算出される。ここで、距離xcは指数関数的に減少すると仮定し、Lmax=4μmを用いた。
Figure 0005373659
また、トリプルウェル構造では、p−ウェル下面のpn接合を通過した場合、さらに拡散層を2次イオンが通過しない場合でも拡散ドリフトにより電荷が収集される。CORIMSでは、拡散層直下に厚さ0.1μmの仮想電荷収集領域を設け、この領域で発生した電荷も拡散層に収集されるとして計算している。
(iii) デバイスモデル
CORIMSでは、デバイスのトランジスタおよび周辺構造を、複数の層構造内に含まれる直方体のコンポーネントに分割し、レイアウトをGDS2ファイルから自動的に読み取り、深さ方向はプロファイル情報に基づいて3次元モデルを構築する。直方体コンポーネントは、頂点座標、構成する稜、面の情報に置き換え、2次イオンの通過する座標やエネルギーをCADのアルゴリズムを援用して精密に計算する。
図17にSRAMモデルの基本的な構造を示す。CORIMSに実装されているスケーリング機能を用いて、平面構造・レイアウトを全体の縮小率にあわせ相似形でスケーリングするようにし、深さ方向については一定のままと仮定した。
(iv) セルマトリックスモデル
エラービットの広がりは後述するようにSi中50μmに及ぶため、22nmまでの微細化を考慮する場合は、数千ビット以上にまたがってデバイス内を通過することになり、詳細な構造を持ったモデルをその範囲でメモリセルを配置したマトリックスモデルでは膨大な記憶容量が必要になり現実的でない。
そこで、CORIMSでは、図18に示すように、物理的なセルモデルは1個だけで、セルの端面に達した時に、2次イオンの入射位置を1ビット分シフトさせて同じ物理モデル内で計算を実行し、物理アドレスだけを対応して増減させるダイナミックシフト(DCS)モデルと称する手法を採用している。メモリマトリックスでは、隣接するセル間で電源電圧(Vdd)やグラウンド(Vss)を共有して面積を低減するため、境界線に沿ってセルのレイアウトを対称系に反転(ミラーリングとも呼称する)させる場合が多いが、このようなケースにもDCSモデルは対応している。
(v) MCBIバイポーラ効果
微細化に伴い顕著になりつつあるMCBI効果は、(1)トリプルウェル構造のCMOSFETデバイスにおいて2次イオンがp−ウェル内のpn接合を通過する際に電子がn層に流入する結果、(2)正孔が残ってp−ウェル内の電位が高くなり、隣接するトランジスタがまとめてONになり、(3)p−ウェル内の複数のノード集中的にエラーになる現象である。
電荷収集事象と同時に発生するモードであるが、発生確率は2次イオンが通過する位置、方向、エネルギーに大きく依存するため、CORIMSに厳密なモデルを組み込むことは困難である。本明細書では、従来の電荷収集モデルに限定し、バイポーラ効果を含めた解析は含めない。
(vi) SETパルス幅モデル
下記の非特許文献4に示されているSETパルス幅モデルを外挿し、22nmまでのパルス幅を電荷付与密度の関数として多項式近似し、計算できるようにした。計算結果を図19に示す。微細化が進むほどSETパルス幅は増加し、現実的な電荷付与密度(最大120fC/μm程度)の範囲では22nmプロセスでは1nsを超え、SET対策が益々重要になることが分かる。
非特許文献4:Mavis, D.G., and Eaton, P.H., " SEU and SET modeling & mitigation in deep submicron technologies," IRPS, Phoenix, Arizona, April 15-19, 2007, No.4B.1 (2007).
(vii) CORIMSの精度
CORIMSは国内3箇所での130nmSRAMのエラー率の実測値、LANSCEでのSpallation中性子源、TSL、CYRICでの(準)単色中性子スペクトルでのSRAMのエラー率測定結果と、いずれも平均20%以下の誤差で一致する結果が得られており、22nmまでの予測計算においても同程度の精度が期待できる。
B.想定ロードマップと対応する解析条件
ITRS2007などのロードマップ情報を検討し、130nmから22nmに至るSRAMの諸元を設定した。2次元のセル寸法をセル面積が世代毎に半分になるように縮小率を与えた。深さ方向はロードマップ情報が無いため、全世代で一定とした。臨界電荷量は、寄生容量に比例するので、面積に応じて減少すると仮定した。動作電圧が下がれば、臨界電荷量は動作電圧と寄生容量の積に比例するのでさらに小さくなるが、実際に動作電圧を下げることには技術的に困難な点が多いので今回はその効果は無視し、電圧は一定とした。
C.解析結果
(i) 解析結果の概要
図20にデータパターンがCB(チェッカーボード)の場合を示した。結果を以下にまとめる。
(1)SRAMのソフトエラー率はMbit当りでは1/5程度まで漸減するが、集積度の増加がそれを上回り、デバイスあたりでは130nmから継続的に増加し、22nmでは約7倍に達する。
(2)MCUの全イベント数に対する比率は世代毎に増加し、22nmでは50%弱に達する。
(3)MCUの最大サイズは45-22nmでは1Mbitに、多重度も100ビットを超える。
(4)SETパルスの平均値は65nm以降は0.25ns程度で推移する。図19から分かるように世代毎に電荷付与密度があるしきい値を超えるとSETパルスが発生し、微細化と共にこのしきい値は低下する。SETパルスが発生した場合全てエラーになると想定した上限値を図20に合わせて示した。微細化が進むほどソフトエラー率に近接してくる傾向があるが、ピーク電流値の低下や回路の複雑化によるマスキング効果の相違など考慮しなければならない点が多く、定量化のためにはより精密なモデル評価が必要である。
(ii) 2次イオン種と付与電荷密度の相関
2次イオンがストレージノードを通過したときに、ノード表面に付与した電荷密度(単位長さあたりに付与した電荷量)とその頻度(Cross section)を図21に示す。また、同じデータを陽子、α粒子以外で原子番号10以上について合計した結果を図22に示す。
(1)図には明示していないが、世代によって相違の無い結果が得られた。鋭敏領域をイオンが通過する時の電荷付与密度なので、原理的に世代間の相違は無い。約110fC/μmが最大値なので、この値に対してソフトエラー感受性の無いデバイスは完全なエラー耐性を有することになる。
(2)図22からも明らかなように、低電荷密度(約10fC/μm以下)は軽イオン(陽子、α粒子)がエラーへの寄与が支配的になる。電荷密度数十fC/μm以上は重イオンのみの寄与となる。
(iii) 2次イオン種とノードに付与した総電荷量の相関
電荷密度については世代間に相違は認められなかったが、総電荷収集量では図23、図24に22nmSRAMと130nmSRAMについて例示するように、明確な世代間相違があった。
(1)重イオン(Z>10)は多量の(最大約36fC)電荷収集の原因になるが、少量の電荷付与の確率はα粒子や陽子に比べて小さくなる。
(2)電荷収集量は世代毎に少なくなりソフトエラーは発生しにくくなる傾向になるが、130nmSRAMで最大36fCに対し22nmで最大20fC程度でその差は顕著では無い。一方、130nmでは臨界電荷量を5から10fCに増加しても大きな効果は期待できないが、22nmでは臨界電荷量10→4→2→1fCの差がそれぞれ一桁以上のソフトエラー率の差を生むことが分かる。
(3)収集電荷量が小さい範囲では、α粒子→陽子の順に寄与が大きくなる。この電荷量範囲は世代が進展するに従って低く、狭くなる。例:α粒子の寄与は130nmでは9fC以下であるのに対し、22nmでは約5fC以下。
(iv) Failed Bit Map(FBM)の変化
図25にエラービットのFBM分布の変化を示す。エラービットの距離では図25に示したように世代間で大きな変化は無かったが、FBMで見ると大きな変化になることが分かる。図の横方向がWL、縦方向がBLである。図25を見ると、130nmでは縦横数十ビット分に集中しているのに対し、22nmでは数千ビットでおよそ一桁程度影響が及ぶビット数が増加していることが分かる。これは、2次イオンの飛程が変わらない一方で、デバイスが縮小する分影響するビット数が増えることに加え、臨界電荷量の減少に対応して飛程が長く発生数も多い陽子、α粒子の影響が大きくなることに対応している。
(v) SEU断面積変化のエネルギー依存性
(1)図26に示すSEU断面積では低エネルギー中性子ほど寄与が大きい。SEU断面積が低エネルギー側でピークを持つ傾向は微細化が進行するほど顕著で、ピーク位置も低エネルギー側にシフトする。これは微細化により臨界電荷量が減少する結果、陽子の寄与が顕著になることに対応している。すなわち、陽子は全体としての発生量は他のイオンより圧倒的に大きいが、臨界電荷量が大きいうちは図22に示したように電荷付与密度が他のイオンに比べ極めて小さいためソフトエラーへの寄与は小さかったが、微細化が進んで臨界電荷量が小さくなると、陽子でも十分データを反転できるいようになったことを意味する。さらに、中性子のエネルギーが低いほど発生する陽子のエネルギーも小さいため、同じく図25からわかるように,電荷発生密度も高くなるため,エラー発生率も高くなることになる。
(2)図27に示すMCUのみの断面積は200MeV程度以上まで幅が広く、60〜100MeV程度で最大値を持つ。微細化に伴う形状の大きな変化は無い。これは、SEU断面積では軽粒子、特に陽子の寄与が大きいことに対し、MCUでは陽子の寄与はほとんど無く、重い2次イオンの寄与が大きいことに対応していると考える。すなわち、微細化に伴って臨界電荷量が小さくなる結果、発生数が大きい軽粒子の寄与がSEUでは大きくなるのに対し、MCUを起こしやすい重い2次イオンは中性子エネルギーが高いほど発生しやすいため、低エネルギー中性子の影響を受けないことに起因する。
(vi) MCU比率のエネルギー依存性
図28にMCUの全エラー数に対する比率を中性子エネルギーの関数として示す。本図からは以下が読み取れる。
(1)MCU比率は世代によらず、200MeV前後で飽和し、高エネルギー側で漸減する。
(2)世代毎にMCU比率の飽和値は高くなり、22nmでは0.5を超える。
(3)MCUの発生するエネルギーには数MeV程度のしきい値があり、微細化に伴って若干低減の傾向があるが、顕著な変化は認められなかった。
(vii) MCU多重度の世代間推移
図29にMCUの多重度(同時にエラーになるビット数)の計算結果をAll”1”のデータパターンについて示す。MCU多重度は世代毎に高い方の比率が増える方向に推移することがわかる。
(viii) 論理デバイスへの影響
以上の結果から、CMOS論理デバイスへの影響を議論する。微細化が進むほどエラー数そのものも増加するため、論理デバイスもCMOSである限りSRAM同様にエラー率は増加する。22nmでは、6トランジスタSRAMで中性子核反応1回あたり最大約100万ビット程度の範囲に影響がおよび、MCUの多重度も最大100ビット以上になる結果を示したが、トランジスタ(論理回路のノード1個分に対応)にして100万個以上の範囲で、100個以上のトランジスタが同時にエラーになることを意味している。論理回路の広い範囲で100個のノードがエラーになれば、TMR、DMR、DICEなどの冗長系や修復回路を含めた様々なシステム上のエラー対策でも無力化することは容易に推測できる。
遮蔽などの対策が無力な高エネルギー中性子線に対しては、完璧なデバイス対策がすぐに完成することは期待できないため、ソフトエラーの発生は避けられないことを前提にした上で、早急に論理回路・システムへの影響の見積もりとデバイス・コンポーネント・システムが連携し、IEC61508に準拠して危険側エラー・リスクの発生を容認できるレベルまで低減する対策技術の確立が必須である。
以上のような知見に基づき、本発明の実施の形態について以下に説明する。
図1は、本発明の一実施形態に係る電子機器10の構成を示すブロック図である。電子機器10は、データ保持部11、制御部12、命令実行部13、演算装置14、および予兆検出部15を備える。
命令実行部13は、予め電子機器10に設定されたプログラムに従って、当該プログラムに記載された命令を、CPU(Central Processing Unit)等の演算装置14を用いて順次実行する。当該プログラムには、いくつかの命令毎に、命令に予めチェックポイントが対応付けられており、命令実行部13は、チェックポイントが対応付けられている命令を実行した場合に、当該命令を識別するID(例えばプログラムカウンタの値など)を、制御部12に通知する。
また、命令実行部13は、命令の実行停止を制御部12から指示された場合に、演算装置14を用いた命令の実行を停止する。そして、命令実行部13は、命令のIDと共に実行再開を制御部12から指示された場合に、指定されたIDの命令から、命令の実行を再開する。
制御部12は、チェックポイントが対応付けられている命令のIDを命令実行部13から通知された場合に、通知されたIDを保持すると共に、演算装置14内の順序回路に含まれるそれぞれのフリップフロップの状態を読み出し、当該状態を示すデータをデータ保持部11に格納する。
また、制御部12は、ソフトエラーの予兆を検出した旨を予兆検出部15から通知された場合に、命令実行部13に命令の実行停止を指示する。そして、制御部12は、データ保持部11に格納されているデータを読み出し、当該データが示す状態となるように、演算装置14内の順序回路に含まれるそれぞれのフリップフロップの状態を設定する。
そして、制御部12は、保持しているIDに対応する命令の次に実行されるべき命令のIDを算出し、算出したIDを命令実行部13に通知することにより、当該IDに対応する命令から、命令の実行再開を命令実行部13に指示する。
予兆検出部15は、電位判定部16および電位測定部17を有する。電位測定部17は、演算装置14を構成する半導体のウェル電位を測定する。電位測定部17は、例えば図2に示すように、ADC(Analog Digital Converter)170および増幅器171を有する。
本実施形態において、演算装置14内の半導体はトリプルウェル構造であり、増幅器171はp−ウェルの電位を増幅する。ADC170は、増幅器171によって増幅された電位を示すアナログ信号をディジタルデータに変換して電位判定部16に提供する。
なお、他の形態において、演算装置14内にはツインウェル構造の半導体が含まれていてもよく、ツインウェル構造の半導体については、増幅器171はn−ウェルの電位を増幅してADC170へ送る。
電位判定部16は、電位測定部17によって測定されたウェル電位が、予め定められた電位(例えば数ボルト)を超えたか否かを判定する。電位測定部17によって測定されたウェル電位が予め定められた電位を超えた場合、電位判定部16は、ソフトエラーの予兆を検出した旨を制御部12に通知する。
図3は、電子機器10のシステム構成を示す概念図である。電子機器10は、図3に示すように、下位のデバイス層、中間のコンポーネント層、および、上位のシステム層の3層構造のシステムとして構成されている。本実施形態において、データ保持部11、制御部12、および命令実行部13は、システム層において実現され、電位判定部16は、コンポーネント層において実現され、電位測定部17は、デバイス層において実現される。
このように、本実施形態では、各階層単独でソフトエラーへの対策を実現するのではなく、複数の階層間にまたがった連携的な対策により検出・修復法の問題点を解決するものである。
図4は、ソフトエラー耐性を考慮した設計手順の一例を示すフローチャートである。
まず、システム全体としてのSER(Soft Error Rate)の目標値SERMAXを策定する(S100)。目標の策定の仕方は一般の電子システムについて冗長系を採用する場合は、下記の非特許文献5にSILレベルに基づく一般的な設定の仕方が開示されている。
非特許文献5:日本規格協会 IS C 0508 電気・電子・プログラマブル電子安全関連系の機能安全(2000)
上記非特許文献5では、ネットワークルータについては修復に要する時間を4ランクに分け、それと頻度との2指標でランク毎に設定する考え方が開示されている。図5には、電子システムの事故1件あたりの修復(事故による損害も含める)に要する費用とその頻度による設定法を概念的に示す。
(1)特定のシステムに着目して事故の実績を修復に要した費用と頻度(件数/年)としてプロットする。横軸に関して積分すれば1年当たり修復に要した総費用が計算できる。
(2)これに対して対象製品の売り上げの実績から十分利益の上がる目標総修復費用を決定する。
(3)事故例のうち、非再現で原因不明でデータの書換えやRESETで修復したものをプロットする。
(4)事故例のうち、非再現・原因不明で電源再立ち上げで修復したものをプロットする。
(3)はSELを除いたソフトエラー起因の可能性が高い。(4)はSELの可能性が高い。SELは一度発生すると致命性が高いので、修復費用は大きくなるものに集中することが図5からわかる。目標総修復費用のうちソフトエラーの目標カーブを設定し、頻度の年間総和を求め、これをシステム耐性の目標値SERMAXとする。
次に、コンポーネント毎に、種別iの論理ゲートの実装数Ni G、種別jのメモリの実装数Nj Mをリストアップし、コンポーネント毎のSERの上限SERUBを下記の数式(3)により求める(S101)。
Figure 0005373659
次に、SERUBが目標値SERMAX未満であるか否かを判定する(S102)。SERUBが目標値SERMAX以上であれば(S102:No)、影響と対策効果の大きいコンポーネント(影響が大きくても効果的な対策の選択肢の少ないコンポーネントもある)を選出する(S103)。具体的には、SERi GとNi Gの積が大きい種別のゲートを選出する。
次に、選出した種別の部品を、ソフトエラー耐性の高い部品に交換してSERUBを再度算出する(S104)。具体的には、選出した種別の部品について、SERi Gの小さいゲートに交換する。また、選出した種別の部品について、実装数Ni Gが少なくなるように回路変更することにより、SERi GとNi Gの積を少なくするようにしてもよい。
ステップS102またはS105のいずれかにおいて、SERUBが目標値SERMAX未満となった場合には、ステップS106に示す本実施形態の設計手法を実行しなくても、システム全体として目標値となるSERを満たすため、ステップS106に示す本実施形態の設計手法を実行せずに終了する。
ステップS104における対策を実行しても、なおSERUBが目標値SERMAX以上となる場合には、ステップS106に示す本実施形態の方法(LABIR:Inter-Layer Built-In Reliability)を実行する。LABIRとは、図1および図3に示したように、異なる階層に設けられた各機能が互いに連携することにより、MNUをはじめとするソフトエラーによって発生する不具合を効果的に防止する技術である。
図6は、電子機器10によって実行される命令実行サイクルの一例を示すフローチャートである。例えば、図示しない入力装置を介してユーザから指示された場合に、電子機器10は、本フローチャートに示す動作を開始する。
まず、命令実行部13は、電子機器10内に設けられた不図示のROM(Read Only Memory)等のメモリに格納されているプログラムを読み出し、当該プログラムに含まれる命令を1つ選択し(S200)、選択した命令を演算装置14を用いて実行する(S201)。
次に、命令実行部13は、選択した命令にチェックポイントが対応付けられているか否かを判定する(S202)。選択した命令にチェックポイントが対応付けられていない場合(S202:No)、命令実行部13は、ステップS205に示す処理を実行する。
一方、選択した命令にチェックポイントが対応付けられている場合(S202:Yes)、命令実行部13は、選択した命令のIDを制御部12に通知する(S203)。命令実行部13からIDの通知を受けた制御部12は、通知されたIDを保持すると共に、演算装置14内の順序回路に含まれるそれぞれのフリップフロップの状態を読み出し、当該状態を示すデータをデータ保持部11に保持させる(S204)。
次に、命令実行部13は、電子機器10内のメモリに格納されているプログラムを参照して、次に実行すべき命令が存在するか否かを判定する(S205)。次に実行すべき命令が存在しない場合(S205:No)、電子機器10は、本フローチャートに示す動作を終了する。
一方、次に実行すべき命令が存在する場合(S205:Yes)、命令実行部13は、電子機器10内のメモリに格納されているプログラムを参照して、次に実行すべき命令を選択し(S206)、再びステップS201に示した処理を実行する。
図7は、電子機器10によって実行される割り込み処理の一例を示すフローチャートである。なお、予兆検出部15は、演算装置14内の半導体のウェル電位を測定し、測定したウェル電位が予め定められた電位を超えたか否かを監視することにより、ソフトエラーの予兆の有無を判定している。
まず、制御部12は、予兆検出部15によってソフトエラーの予兆が検出されたか否かを判定する(S300)。予兆検出部15によってソフトエラーの予兆が検出された場合(S300:Yes)、制御部12は、命令実行部13に命令の実行停止を指示する(S301)。
次に、制御部12は、データ保持部11に格納されているデータを読み出し、読み出したデータが示す状態になるように、演算装置14内のそれぞれのフリップフロップの状態を設定することにより、直前のチェックポイントの命令が実行された直後のフリップフロップの状態を再現する(S302)。
次に、制御部12は、保持しているIDに対応する命令(すなわち、直前のチェックポイントに対応する命令)の次に実行されるべき命令のIDを算出し、算出したIDを命令実行部13に通知することにより、当該IDに対応する命令から、命令の実行再開を命令実行部13に指示し(S303)、再びステップS300に示した処理を実行する。
以上、本発明の実施の形態について説明した。
上記説明から明らかなように、本実施形態の電子機器10によれば、ソフトエラーの予兆が検出された場合にのみ、直前のチェックポイントに対応する命令が実行された時点のフリップフロップの状態を再現して、直前のチェックポイントに対応する命令の次の命令から、命令の実行を再開する。
ソフトエラーが発生するのは、数日に1回程度であるため、直前のチェックポイントに戻って処理を再開するオーバーヘッドによる冗長な処理時間は、通常の処理時間に対して非常に微小な時間となり、ソフトエラー対策によるシステム全体の処理時間の増大を低く抑えることができる。
また、本実施形態の電子機器10は、ソフトエラーの予兆が検出されなければ、全ての処理が1回ずつ実行されるため、全ての処理を2回実行するReplication+rollbackに比べて、ソフトエラー対策によるシステム全体の処理時間および消費電力の増大を低く抑えることができる。
また、本実施形態の電子機器10は、処理系は1つでよいため、処理系を2重にするDuplication+Comparison+checkpointや、処理系を3重にするTMRに比べて、実装面積や消費電力の増大を低く抑えることができる。
従って、本実施形態の電子機器10は、実装面積、消費電力、および処理時間の増大を抑えつつ、MNUをはじめとするソフトエラーによって発生する電子機器の不具合を防止することができる。
なお、本発明は、上記した実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。
例えば、上記した実施形態において、予兆検出部15は、演算装置14内の半導体のウェル電位を測定し、測定したウェル電位が予め定められた電位を超えたか否かを監視することにより、ソフトエラーの予兆の有無を判定するが、本発明はこれに限られない。
例えば、図8に示すように、予兆検出部15は、クロック発生器18によって生成されて演算装置14に供給されるクロック波形を監視し、クロック波形の乱れを検出した場合に、ソフトエラーの予兆を検出した旨を制御部12に通知するようにしてもよい。この場合、予兆検出部15は、信号レベル測定部19および信号レベル判定部20を備える。
信号レベル測定部19は、クロック発生器18によって生成されたクロック信号を増幅する増幅器190と、クロック発生器18によって生成されたクロック信号を所定時間(例えばクロック周期の整数倍の時間)遅延させる遅延回路191と、遅延回路191によって遅延されたクロック信号を増幅する増幅器192とを有する。
信号レベル判定部20は、増幅器190によって増幅されたクロック信号と、増幅器192によって増幅されたクロック信号の信号レベルを比較し、両信号レベルが予め定められた誤差以上異なる場合に、ソフトエラーの予兆を検出した旨を制御部12に通知する。なお、この場合、図3に示したシステム構成において、コンポーネント層では信号レベル判定部20が実現され、デバイス層では信号レベル測定部19が実現される。
また、例えば、図9に示すように、予兆検出部15は、演算装置14内のフリップフロップ140から142に供給されるSET信号およびRESET信号を監視し、プログラムに記述された命令に応じた信号状態となっていない場合に、ソフトエラーの予兆を検出した旨を制御部12に通知するようにしてもよい。この場合、予兆検出部15は、信号状態測定部21および信号状態判定部22を備える。
信号状態測定部21は、SET信号をディジタル値に変換するADC210と、RESET信号をディジタル値に変換するADC211とを有する。信号状態判定部22は、それぞれの信号レベルを監視し、プログラムに記述された命令に応じた信号状態に対応する信号レベルの範囲内にあるか否かを判定する。信号状態測定部21は、SET信号またはRESET信号が、プログラムに記述された命令に応じた信号状態に対応する信号レベルの範囲内にない場合に、ソフトエラーの予兆を検出した旨を制御部12に通知する。
なお、この場合、信号状態判定部22は、SET信号およびRESET信号のそれぞれについて、プログラムに記述された命令に応じた信号状態を知っている必要がある。そのため、信号状態判定部22は、図3におけるシステム層において実現される。また、信号状態測定部21は、図3におけるデバイス層において実現される。
また、例えば、予兆検出部15は、ウェル電位の上昇、クロック信号の乱れ、ならびに、SET信号またはリセット信号の異常を監視し、このいずれかが検出された場合に、ソフトエラーの予兆を検出した旨を制御部12に通知するようにしてもよい。これにより、より確実にソフトエラーの予兆を検出することができ、システムの信頼性を高めることができる。
図30にMCBIの場合、MNUの多重度に応じて離散的に電流値が増加することを示した。電源電流の増加は、別なエラーの兆候に他ならず、電源電位を供給する配線の電位も当然変化するので、電源からグラウンドに到る配線で、グラウンドに対して電気抵抗を有する部分の電位を測定し、図1の電位測定部17とすれば、ウェル電位を測定する図2の実施例と同等の効果を得ることができる。
10・・・電子機器、11・・・データ保持部、12・・・制御部、13・・・命令実行部、14・・・演算装置、140・・・フリップフロップ、141・・・フリップフロップ、142・・・フリップフロップ、15・・・予兆検出部、16・・・電位判定部、17・・・電位測定部、170・・・ADC、171・・・増幅器、18・・・クロック発生器、19・・・信号レベル測定部、190・・・増幅器、191・・・遅延回路、192・・・増幅器、20・・・信号レベル判定部、21・・・信号状態測定部、210・・・ADC、211・・・ADC、22・・・信号状態判定部

Claims (9)

  1. ソフトエラーによって発生する不具合を回避する機能を有する電子機器であって、
    設定されたプログラムに従って、当該電子機器が有する演算装置を用いて命令を逐次実行する命令実行部と、
    前記演算装置内の順序回路に含まれるフリップフロップの状態を示すデータを保持するデータ保持部と、
    前記演算装置を構成する半導体のウェル電位を測定する電位測定部と、
    前記電位測定部によって測定されたウェル電位に基づいてソフトエラーの予兆を検出する予兆検出部と、
    前記予兆検出部によってソフトエラーの予兆が検出されることなく、チェックポイントが対応付けられている命令が前記命令実行部によって実行された場合に、当該チェックポイントに対応する命令の実行が終了した時点における、前記演算装置内の順序回路に含まれるフリップフロップの状態を示すデータを前記データ保持部に保持させ、
    前記予兆検出部によってソフトエラーの予兆が検出された場合に、前記命令実行部に命令の実行停止を指示し、前記データ保持部に保持されているデータに基づいて前記演算装置内の順序回路に含まれるフリップフロップの状態を設定し、直前のチェックポイントの次の命令から命令の実行再開を前記命令実行部に指示する制御部と
    を備えることを特徴とする電子機器。
  2. 請求項1に記載の電子機器であって、
    前記予兆検出部は
    記電位測定部によって測定されたウェル電位が予め定められた電位を超えた場合に、ソフトエラーの予兆が検出された旨を出力する電位判定部と
    を有することを特徴とする電子機器。
  3. 請求項2に記載の電子機器であって、
    前記演算装置を構成する半導体は、
    トリプルウェル構造またはツインウェル構造であり、
    前記電位測定部は、
    トリプルウェル構造の半導体についてはp−ウェルの電位を測定し、
    ツインウェル構造の半導体についてはn−ウェルの電位を測定し、
    前記電位判定部は、
    それぞれの構造の半導体について、前記電位測定部によって測定されたウェル電位と予め定められた電位とを比較してソフトエラーの予兆の有無を検出することを特徴とする電子機器。
  4. 請求2または3に記載の電子機器であって、
    当該電子機器は、
    下位のデバイス層、中間のコンポーネント層、および、上位のシステム層の3層構造のシステムとして構成されており、
    前記電位測定部は、前記デバイス層において実現され、
    前記電位判定部は、前記コンポーネント層において実現され、
    前記命令実行部、前記データ保持部、および前記制御部は、システム層において実現されることを特徴とする電子機器。
  5. 請求1に記載の電子機器であって、
    前記予兆検出部は、
    前記演算装置に供給されるクロック信号の信号レベルを測定する信号レベル測定部と、
    前記信号レベル測定部によって測定されたクロック信号の信号レベルが予め定められた信号レベルの範囲内にない場合に、ソフトエラーの予兆が検出された旨を出力する信号レベル判定部と
    を有することを特徴とする電子機器。
  6. 請求5に記載の電子機器であって、
    当該電子機器は、
    下位のデバイス層、中間のコンポーネント層、および、上位のシステム層の3層構造のシステムとして構成されており、
    前記信号レベル測定部は、前記デバイス層において実現され、
    前記信号レベル判定部は、前記コンポーネント層において実現され、
    前記命令実行部、前記データ保持部、および前記制御部は、システム層において実現されることを特徴とする電子機器。
  7. 請求1に記載の電子機器であって、
    前記予兆検出部は、
    前記演算装置内の順序回路に含まれるフリップフロップに供給されるセット/リセット信号の状態を測定する信号状態測定部と、
    前記信号状態測定部によって測定されたセット/リセット信号の状態が、前記プログラムに従った命令の実行過程において設定されるべき状態と異なる場合に、ソフトエラーの予兆が検出された旨を出力する信号状態判定部と
    を有することを特徴とする電子機器。
  8. 請求7に記載の電子機器であって、
    当該電子機器は、
    下位のデバイス層および上位のシステム層の2層構造のシステムとして構成されており、
    前記信号状態測定部は、前記デバイス層において実現され、
    前記命令実行部、前記データ保持部、前記制御部、および前記信号状態判定部は、システム層において実現されることを特徴とする電子機器。
  9. 請求項1に記載の電子機器であって、
    前記予兆検出部は、
    前記演算装置を構成する半導体の電源からグラウンドに到る電源ラインの電位を測定する電位測定部と、
    前記電位測定部によって測定された電源ラインの電位が予め定められた電位を超えた場合に、ソフトエラーの予兆が検出された旨を出力する電位判定部と
    を有することを特徴とする電子機器。
JP2010033654A 2010-02-18 2010-02-18 電子機器 Expired - Fee Related JP5373659B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2010033654A JP5373659B2 (ja) 2010-02-18 2010-02-18 電子機器
US13/522,551 US8904233B2 (en) 2010-02-18 2011-02-09 Electronic apparatus
PCT/JP2011/052704 WO2011102270A1 (ja) 2010-02-18 2011-02-09 電子機器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010033654A JP5373659B2 (ja) 2010-02-18 2010-02-18 電子機器

Publications (2)

Publication Number Publication Date
JP2011170606A JP2011170606A (ja) 2011-09-01
JP5373659B2 true JP5373659B2 (ja) 2013-12-18

Family

ID=44482857

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010033654A Expired - Fee Related JP5373659B2 (ja) 2010-02-18 2010-02-18 電子機器

Country Status (3)

Country Link
US (1) US8904233B2 (ja)
JP (1) JP5373659B2 (ja)
WO (1) WO2011102270A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6405966B2 (ja) * 2014-12-09 2018-10-17 株式会社デンソー 電子制御装置
JP6880795B2 (ja) * 2017-02-08 2021-06-02 オムロン株式会社 制御装置およびその制御方法
JP7457322B2 (ja) 2020-03-24 2024-03-28 公立大学法人 富山県立大学 放射線検出装置、及び、それを用いた逐次比較型アナログ-デジタル変換回路
US20230204800A1 (en) * 2020-05-12 2023-06-29 Nippon Telegraph And Telephone Corporation Nuclear reaction detection device, method and program

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3601612B2 (ja) 1994-09-22 2004-12-15 富士通株式会社 半導体装置及びその製造方法
JP3324363B2 (ja) * 1995-11-01 2002-09-17 日産自動車株式会社 破損検知手段を有する半導体集積回路
JP2003046644A (ja) * 2001-07-30 2003-02-14 Oki Electric Ind Co Ltd 電子交換機のクロック補正回路
US7278080B2 (en) * 2003-03-20 2007-10-02 Arm Limited Error detection and recovery within processing stages of an integrated circuit
JP4288418B2 (ja) 2003-12-02 2009-07-01 日本電気株式会社 計算機システムおよび状態取得方法ならびに状態取得プログラム
JP4330547B2 (ja) 2005-03-17 2009-09-16 富士通株式会社 情報処理システムの制御方法、情報処理システム、情報処理システムの制御プログラム、冗長構成制御装置
JP2006339355A (ja) * 2005-06-01 2006-12-14 Nec Electronics Corp 半導体集積回路装置及びその設計方法
US7443196B2 (en) * 2005-07-15 2008-10-28 Tabula, Inc. Configuration network for a configurable IC
JP5129450B2 (ja) * 2006-01-16 2013-01-30 ルネサスエレクトロニクス株式会社 情報処理装置
US7966538B2 (en) * 2007-10-18 2011-06-21 The Regents Of The University Of Michigan Microprocessor and method for detecting faults therein
JP2009169515A (ja) * 2008-01-11 2009-07-30 Denso Corp コンピュータシステム及びシステム回復装置
US7795920B2 (en) 2008-03-31 2010-09-14 Kabushiki Kaisha Toshiba Semiconductor integrated circuit
JP5139132B2 (ja) * 2008-03-31 2013-02-06 株式会社東芝 半導体集積回路
JP5381284B2 (ja) * 2008-05-20 2014-01-08 株式会社リコー ソフトウェア開発支援装置、方法、プログラム及びコンピュータ読取可能な記録媒体

Also Published As

Publication number Publication date
JP2011170606A (ja) 2011-09-01
US8904233B2 (en) 2014-12-02
US20120304005A1 (en) 2012-11-29
WO2011102270A1 (ja) 2011-08-25

Similar Documents

Publication Publication Date Title
Kanekawa et al. Dependability in electronic systems: mitigation of hardware failures, soft errors, and electro-magnetic disturbances
Wirthlin High-reliability FPGA-based systems: Space, high-energy physics, and beyond
Mitra et al. Robust system design to overcome CMOS reliability challenges
Constantinescu Impact of deep submicron technology on dependability of VLSI circuits
Wang et al. Single event upset: An embedded tutorial
Nidhin et al. Understanding radiation effects in SRAM-based field programmable gate arrays for implementing instrumentation and control systems of nuclear power plants
Lee et al. Design framework for soft-error-resilient sequential cells
Gaspard et al. Estimation of hardened flip-flop neutron soft error rates using SRAM multiple-cell upset data in bulk CMOS
Heijmen Soft errors from space to ground: Historical overview, empirical evidence, and future trends
JP5373659B2 (ja) 電子機器
US8892967B2 (en) Measurement device and measurement method
Sterpone et al. A Novel Error Rate Estimation Approach forUltraScale+ SRAM-based FPGAs
Alghareb et al. Energy and delay tradeoffs of soft-error masking for 16-nm FinFET logic paths: Survey and impact of process variation in the near-threshold region
Jain et al. Radiation tolerant multi-bit flip-flop system with embedded timing pre-error sensing
Sootkaneung et al. Gate input reconfiguration for combating soft errors in combinational circuits
Polian et al. Transient fault characterization in dynamic noisy environments
Swift et al. Static upset characteristics of the 90nm Virtex-4QV FPGAs
Clerc et al. Space radiation and reliability qualifications on 65nm CMOS 600MHz microprocessors
Wang et al. Single event upset mitigation techniques for FPGAs utilized in nuclear power plant digital instrumentation and control
Tambara et al. Measuring failure probability of coarse and fine grain TMR schemes in SRAM-based FPGAs under neutron-induced effects
Ibe et al. Quantification and mitigation strategies of neutron induced soft-errors in CMOS devices and components
Major et al. Radpc: A novel single-event upset mitigation strategy for field programmable gate array–based space computing
Amusan Effects of single-event-induced charge sharing in sub-100 nm bulk CMOS technologies
Mutuel Appreciating the effectiveness of single event effect mitigation techniques
Smith et al. Experimental verification of the effectiveness of a new circuit to mitigate single event upsets in a Xilinx Artix-7 field programmable gate array

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120619

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130701

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130820

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130919

R151 Written notification of patent or utility model registration

Ref document number: 5373659

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees