JP6069406B2 - 放熱システム、制御方法、コンピュータ・プログラムおよび情報処理装置 - Google Patents

放熱システム、制御方法、コンピュータ・プログラムおよび情報処理装置 Download PDF

Info

Publication number
JP6069406B2
JP6069406B2 JP2015097104A JP2015097104A JP6069406B2 JP 6069406 B2 JP6069406 B2 JP 6069406B2 JP 2015097104 A JP2015097104 A JP 2015097104A JP 2015097104 A JP2015097104 A JP 2015097104A JP 6069406 B2 JP6069406 B2 JP 6069406B2
Authority
JP
Japan
Prior art keywords
heat dissipation
processor
heat
temperature
reference table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015097104A
Other languages
English (en)
Other versions
JP2016212717A (ja
Inventor
拓郎 上村
拓郎 上村
勉 長南
勉 長南
晶吾 秋山
晶吾 秋山
貴光 安達
貴光 安達
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Singapore Pte Ltd
Original Assignee
Lenovo Singapore Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Singapore Pte Ltd filed Critical Lenovo Singapore Pte Ltd
Priority to JP2015097104A priority Critical patent/JP6069406B2/ja
Publication of JP2016212717A publication Critical patent/JP2016212717A/ja
Application granted granted Critical
Publication of JP6069406B2 publication Critical patent/JP6069406B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Cooling Or The Like Of Electrical Apparatus (AREA)

Description

本発明は、複数の放熱ユニットで情報処理装置の筐体内部の温度を管理するサーマル・マネジメントに関する。
ノートブック型パーソナル・コンピュータ(ノートPC)、ワークステーションまたはサーバのようなコンピュータには、筐体に収納するデバイスが生成した熱を強制的に排出するための放熱ユニットを搭載する。放熱ユニットはヒート・シンクと放熱ファンで構成する。コンピュータが搭載するデバイスのなかで特に発熱量が大きいのはセントラル・プロセッシング・ユニット(CPU)およびグラフィックス・プロセッシング・ユニット(GPU)である。放熱システムはこれらのデバイスの温度を許容値に収めながら、筐体の温度をユーザが触れても問題がない程度まで抑制するために筐体内部から熱を排出する。
近年、複数のプロセッサを実装したり実装密度が増加したりしたことに伴い、コンピュータが複数の放熱ユニットを搭載する場合がある。特許文献1は、ヒート・シンクを通じてCPUを冷却するCPU用冷却ファンと、他の回路素子を冷却するシステム冷却ファンを搭載するパーソナル・コンピュータを開示する。CPU用冷却ファンは、隔壁部で囲まれた空間に配置されており、CPUを冷却するヒート・シンクに空気を送る。CPU用冷却ファンとシステム冷却ファンは、独立した温度制御系で回転数が制御される。
特許文献2は、プロセッサの処理能力と放熱ファンの回転による騒音を調和してユーザに最大の快適度を与えることのできるコンピュータ用の放熱システムを開示する。放熱システムは、処理能力の変更が可能なプロセッサ、放熱ファン、温度センサがコンピュータの筐体内に設けられる。回転速度設定部は閾値温度と温度センサが測定した測定温度に基づいて放熱ファンの回転速度を段階的に変更することを記載している。
特開2004−246403号公報 特開2010−39655号公報
デバイスを含めた筐体内部の温度は、発熱量と放熱量のバランスで決まる。発熱量の低減には、発熱量の多いGPUおよびCPUのようなプロセッサのパフォーマンスを低下させることが有効である。また、また放熱量は放熱ファンの回転速度を変化させて調整することができる。発熱量と放熱量を調整して、筐体の温度を管理する手法をサーマル・マネジメントという。
一般的なサーマル・マネジメントでは、プロセッサのパフォーマンスをできるだけ低下させないようにする。また一般的なサーマル・マネジメントでは騒音および消費電力の観点から、放熱ファンをできるだけ内部の温度に適応できる低い回転速度で回転させる。一般的にコンピュータが複数の放熱ユニットを搭載する場合であっても、いずれかの故障に対して完全なバックアップができるような予備機をもつことはない。
したがって、いずれかの放熱ユニットが故障した場合に、すべての放熱ユニットが正常なことを前提にしたサーマル・マネジメントで発熱量および放熱量を制御すると、急激な発熱量の増加があったときに温度が許容値を超えてシステムがシャットダウンしたり、使用中に急激にプロセッサのパフォーマンスが低下してユーザにストレスを与えたりする。
したがって、複数の放熱ファンを搭載するときには、起動時に全台数の動作状態を検査して1台でも異常を検知したときはブートを停止せざるを得なくなる。しかし、コンピュータの作業状態によっては残った正常な放熱ファンである程度システムの継続動作が可能な場合がある。特に最低限データの取り出しや緊急の処理をするために短時間でも動作を継続したい場合がある。
そこで本発明の目的は、複数の放熱ファンの一部が故障したときに情報処理装置の動作を継続する方法を提供することにある。さらに本発明の目的は、複数の放熱ファンの一部が故障したときに、残った放熱ファンでサーマル・マネジメントを実行する方法を提供することにある。さらに本発明の目的は、そのような方法を実現する放熱システム、情報処理装置およびコンピュータ・プログラムを提供することにある。
本発明の第1の態様は、情報処理装置の筐体の内部の温度を管理するためのサーマル・マネジメントを実行する放熱システムを提供する。放熱システムは、プロセッサと、それぞれが放熱ファンを含む複数の放熱ユニットと、筐体の内部の温度を検出して検出温度を出力する温度センサと、複数の放熱ユニットが正常なときに第1のサーマル・マネジメントを実行し、いずれかの放熱ユニットが故障したときに第2のサーマル・マネジメントを実行して情報処理装置の動作を継続させるコントローラとを有する。
複数の放熱ユニットが、完全な予備機を保有するときは、一部が故障しても予備機を動作させることで、情報処理装置を支障なく動作させることができる。本発明は予備の放熱ユニットを備えていない場合でも、放熱ユニットに異常があったときに第2のサーマル・マネジメントを実行することで、情報処理装置が動作を継続することができる。第2のサーマル・マネジメントでは第1のサーマル・マネジメントよりも情報処理装置の発熱量を低減させることができる。あるいは第2のサーマル・マネジメントでは第1のサーマル・マネジメントよりも検出温度に対する放熱ユニットの回転速度を上昇させることができる。
第2のサーマル・マネジメントではあらかじめ発熱量を抑制し、または放熱量を増加させておくことで、急激な温度上昇に対応でき、かつ、急激なパフォーマンスの低下を防ぐことができる。第1のサーマル・マネジメントにおいてコントローラが参照する第1の参照テーブルと、第2のサーマル・マネジメントにおいてコントローラが参照する第2の参照テーブルとを有し、情報処理装置は、放熱ユニットの動作状態に応じて第1の参照テーブルまたは第2の参照テーブルのいずれかを参照可能に設定することができる。このとき情報処理装置はブート中に放熱ユニットの診断をして参照可能に設定することができる。
第1の参照テーブルおよび第2の参照テーブルが、検出温度に対応する複数の放熱ユニットの回転速度を記述し、第2の参照テーブルが記述する回転速度が第1の参照テーブルが記述する回転速度に比べて同一の検出温度に対して高くなるようにしてもよい。あるいは、第1の参照テーブルおよび第2の参照テーブルが、検出温度に対応するプロセッサのパフォーマンス・ステップを記述し、第2の参照テーブルが記述するパフォーマンス・ステップが第1の参照テーブルが記述するパフォーマンス・ステップに比べて同一の検出温度に対して低くなるようにしてもよい。
本発明の第2の態様では、放熱システムが、第1のプロセッサと第2のプロセッサを含む複数のプロセッサと、第1のプロセッサに熱的に結合した第1の放熱ユニットと第2のプロセッサに熱的に結合した第2の放熱ユニットを含む複数の放熱ユニットとを含む。さらに、第1のプロセッサの温度を検出する第1の温度センサと第2のプロセッサの温度を検出する第2の温度センサを含む複数の温度センサと、複数の放熱ユニットが正常なときに第1のサーマル・マネジメントを実行し、いずれかの放熱ユニットが故障したときに第2のサーマル・マネジメントを実行するコントローラとを有する。
このとき、第1のプロセッサと第2のプロセッサをヒート・パイプで結合させておくと、一方の放熱ユニットが故障しても他方の放熱ユニットが、一方の放熱ユニットに熱的に結合しているプロセッサを効率よく放熱することができる。第1のプロセッサがCPUで第2のプロセッサがGPUのときに、第2のサーマル・マネジメントは第1のサーマル・マネジメントに比べてCPUとGPUの動作クロックを低下させることができる。第2のサーマル・マネジメントにおいて、第1の放熱ユニットが故障したときにCPUの動作クロックを低下させ、第2の放熱ユニットが故障したときにGPUの動作クロックを低下させるようにしてもよい。
本発明により、複数の放熱ファンを含む放熱システムの一部が故障したときに情報処理装置の動作を継続する方法を提供することができた。さらに本発明により、複数の放熱ファンの一部が故障したときに、残った放熱ファンでサーマル・マネジメントを実行する方法を提供することができた。さらに本発明により、そのような方法を実現する放熱システム、情報処理装置およびコンピュータ・プログラムを提供することができた。
情報処理装置10の概略の機能ブロック図である。 情報処理装置10の内部の模式的な平面図である。 放熱ユニット101〜301の平面図である。 正常時に使用するサーマル・アクション・テーブル61の構成の一例を説明するための図である。 異常時に使用するサーマル・アクション・テーブル63の構成の一例を説明するための図である。 放熱システムの動作を示すフローチャートである。
[情報処理装置]
図1は、ワークステーションまたはノートPCのような情報処理装置10の概略の機能ブロック図である。I/Oコントローラ13には、GPU11、CPU21、31、HDD33、ODD35、ファームウェアROM37およびエンベデッド・コントローラ(EC)17が接続されている。GPU11は、描画処理を専用に行うプロセッサで、CPU21、31は情報処理装置10の中枢機能を相互に分担して担うプロセッサである。CPU21、31は、OS、BIOSまたはUEFIのようなシステム・ファームウェア、デバイス・ドライバ、あるいはアプリケーション・プログラムなどを実行する。以後、GPU11、CPU21、31を総称するときは、単にプロセッサということにする。
プロセッサは情報処理装置10が搭載するデバイスの中で消費電力が大きく、よって発熱量も多い。一例においてプロセッサは、スピード・ステップという技術およびスロットリングという技術に対応している。スピード・ステップは米国インテル(登録商標)社が開発した、プロセッサの動作電圧および動作周波数の値を自由に設定できる技術である。スピード・ステップでは、システムが所定の状態のときに許可する最大の動作周波数をシステム・ファームウェアがプロセッサのレジスタに設定することにより、実際に当該プロセッサが動作する動作周波数を段階的に低減させることができる。
プロセッサは動作周波数を低減させるときに同時に当該動作周波数でプロセッサが動作するのに必要な値まで動作電圧を低減させる。プロセッサは、スピード・ステップを実行するときに、EC17に指示してDC/DCコンバータ19に、プロセッサの電圧を設定した最大動作周波数に適合するよう変更させる。スピード・ステップによりプロセッサの消費電力および発熱量が低減する。
スロットリングは、プロセッサを一定間隔で動作および停止させて間欠動作をさせることにより平均的な処理速度を切り替える機能である。スロットリングを実行するには、システム・ファームウェアがプロセッサのレジスタにスロットリングの有効/無効の設定およびデューティ比(スロットリング率)を設定する。スピード・ステップもスロットリングも段階的にプロセッサの処理能力および発熱量を変化させることができる。
また、スピード・ステップとスロットリングとを併用し、スピード・ステップによる最低の動作周波数を維持したままでスロットリングに移行することもできる。本発明においてこれらの技術を、プロセッサの処理能力を複数の段階に変化させて発熱量を調整するために利用する。以後、スピード・ステップおよびスロットリングまたはいずれか一方により変化するプロセッサの処理能力の各段階を、パフォーマンス・ステップということにする。パフォーマンス・ステップが100%のときは、処理能力が低下していない状態であり、特にこの状態をプロセッサの通常状態ということにする。
プロセッサは、パフォーマンス・ステップが高いほど、かつ、使用率が高いほど発熱量が多くなる。プロセッサが生成した熱はそれ自体の温度を上昇させるとともに、筐体内部の温度も上昇させる。ファームウェアROM37は、不揮発性で記憶内容の電気的な書き替えが可能なメモリであり、I/Oデバイスを制御したり電源および筐体内の温度を管理したりするシステム・ファームウェア、および起動時にハードウェアの試験や初期化を行うPOST(Power-On Self Test)コードなどを格納する。
EC17は、8〜16ビットのCPU、ROM、RAMなどで構成されたマイクロ・コンピュータであり、さらにA/D入力端子、D/A出力端子、タイマー、およびディジタル入出力端子などを備えている。EC17には、それらの入出力端子を介して、放熱ファン駆動回路107〜307、温度センサ51a〜51f、およびDC/DCコンバータ19が接続されており、プロセッサとは独立してファームウェアを実行して、情報処理装置10の内部の動作環境を管理することができる。EC17のROMには、サーマル・マネジメントを行うプログラムとEC17が参照するサーマル・アクション・テーブル(TAT)61、63を格納している。
放熱ファン駆動回路107〜307には遠心式の放熱ファン103〜303が接続されている。放熱ファン駆動回路107〜307は、EC17の指示で対応する放熱ファン103〜303の回転速度をステップ状にPWM制御する。電源ユニット39は、電池および充電器などを含み、DC/DCコンバータ19に電力を供給する。DC/DCコンバータ19は、各デバイスに所定の電圧で電力を供給する。
[放熱構造]
図2は、情報処理装置10の筐体の内部を模式的に示した平面図である。筐体の内部には放熱ユニット101〜301および、ヒート・パイプ111、211、311、411a〜411cに加えて、図1に示したデバイスを含む多数の電子部品を収納している。図3は、放熱ユニット101〜301の平面図である。放熱ユニット101〜301のサイズすなわち放熱量は、発熱体であるGPU11、CPU21、31の発熱量に適合するように、適宜選択することができる。放熱ユニット101〜301は、それぞれ放熱ファン103〜303とヒート・シンク105〜305で構成している。放熱ファン103〜303は、薄型のチャンバと軸に複数のブレードが取り付けられたファン・モータで構成している。
ヒート・シンク105〜305は、チャンバの側面に形成した開口に位置が整合するようにチャンバに直接取り付けられている。放熱ユニット101〜301は、ファン・モータが回転すると、チャンバの上面と下面に形成した吸入口から周囲の空気を取り込んでヒート・シンク105〜305の複数のフィンの間を通過するように排出してヒート・パイプと熱交換する。
図2に戻って各プロセッサは、それぞれの受熱板(図示せず)と熱的に結合している。GPU11の受熱板とヒート・シンク105は、ヒート・パイプ111で熱的に結合している。GPU11の受熱板とCPU21、31の受熱板はそれぞれヒート・パイプ411a、411bでCPU21、31の受熱板と熱的に結合している。CPU21の受熱板とCPU31の受熱板は、ヒート・パイプ411cで熱的に結合している。CPU21の受熱板とヒート・シンク205はヒート・パイプ211で熱的に結合し、CPU31の受熱板とヒート・シンク305はヒート・パイプ311で熱的に結合している。
筐体には、温度管理が必要な位置に複数の温度センサ51a〜51fを配置している。EC17は、温度センサ51a〜51fの検出温度とTAT61、63を利用してサーマル・マネジメントを実行する。EC17は、サーマル・マネジメントにおいて、温度センサ51a〜51fの検出温度に基づいて、TAT61、63のいずれかを参照して放熱ファン103〜303の回転速度およびプロセッサのパフォーマンス・ステップを制御する。
温度センサ51a〜51fの位置および個数は、本発明を説明するために例示したものである。温度センサ51a〜51fは、外付け型として対象となるデバイスの近辺に配置するか、または埋め込み型として当該デバイスのダイの中に形成する。GPU11およびCPU21、31をそれぞれ管理する温度センサ51a、51c、51eは埋め込み型で、その他のデバイスおよび筐体を管理する温度センサ51b、51d、51fは外付け型である。一例において外付け型の温度センサ51b、51d、51fは、マザーボードに取り付けられている。
放熱ユニット101〜301は、ヒート・シンク105〜305の排出口が、筐体の側壁に形成した排気口に位置が整合するように配置している。筐体には、図示しない位置に吸気口が形成されている。放熱ユニット101〜301が動作すると吸気口から外気が流入し、内部の暖気がヒート・シンク105〜305を通過して熱交換しながら排気口から排出される。
放熱ユニット101は主としてGPU11の熱を排出し、放熱ユニット201は主としてCPU21の熱を排出し、放熱ユニット301は主としてCPU31の熱を排出する。温度センサ51a、51bは、放熱ユニット101の動作による影響を強く受け、温度センサ51c、51dは放熱ユニット201の動作による影響を強く受け、温度センサ51e、51fは放熱ユニット301の動作による影響を強く受ける。
放熱ユニット101、GPU11および温度センサ51a、51bを第1の放熱系統といい、放熱ユニット201、GPU21および温度センサ51c、51dを第2の放熱系統といい、放熱ユニット301、GP31および温度センサ51e、51fを第3の放熱系統ということにする。ただし、発熱源である各プロセッサが相互にヒート・パイプ411a〜411cで熱的に結合しているため、各放熱系統は他の放熱系統の熱も排出できるようになっている。
[TAT]
図4は、すべての放熱ファン103〜303が正常なときにEC17が参照するTAT61の一例を示し、図5は1台の放熱ファンが故障して残り2台が正常なときにEC17が参照するTAT63の一例を示している。故障したときに参照するTAT63は、故障台数ごとに複数作成しておいてもよい。TAT61、63には、放熱ファン103〜303の回転速度に対して、高速(H)から最低速(LL)までの4段階の回転ステージを定義している。各回転ステージに対応して、放熱ファン103にはq1〜q4の回転速度を設定し、放熱ファン203にはr1〜r4の回転速度を設定し、放熱ファン303にはs1〜s4の回転速度を設定している。
TAT61では、一例として温度センサ51aに、各回転ステージに対応させて回転速度およびパフォーマンスを制御するために、高い方から順番に温度T0a〜T5aを設定している。他の温度センサ51b〜51fにも同様に高い方から順番に温度を設定している。温度T0a〜T5fは、回転速度を上昇させる制御と下降させる制御の間にヒステリシスを備えている。
これに対しTAT63では、一例として温度センサ51aに、回転ステージに対応させて回転速度およびパフォーマンスを制御するために、高い方から順番に温度T1a〜T6aを設定している。TAT63の温度は、TAT61に対して1列だけ左にシフトしており、結果として、TAT63を参照するとTAT61を参照した場合に比べて温度が上昇したときに回転速度は早めに上昇し、温度が下降したときに回転速度が低下しにくくなる。
TAT61、63には、各プロセッサに、回転ステージに対応させて一例として30%〜100%のパフォーマンス・ステップを段階的に設定している。TAT61では、温度上昇によって回転ステージが高速(H)に到達し、さらに温度上昇が続く場合にパフォーマンス・ステップが低下するが、TAT63では、回転ステージが中速(M)に到達したときにパフォーマンス・ステップが低下する。結果として、TAT63を参照すると、TAT61を参照する場合に比べて、温度が上昇したときにパフォーマンス・ステップは早めに低下し、温度が下降したときに一パフォーマンス・ステップは回復しにくくなる。
TAT61は、温度が上昇し始めると最初に放熱ファン103〜303を動作させ、放熱ファン103〜303が最大の回転速度Hに到達してもさらに温度上昇が続く場合にプロセッサのパフォーマンス・ステップを低下させるパフォーマンス優先のクーリング方式に対応する。TAT63は、温度が上昇し始めると最初にプロセッサのパフォーマンス・ステップを低減させ、パフォーマンス・ステップを所定値まで低下させても温度上昇が続く場合に放熱ファン103〜303を動作させる静粛性優先のクーリング方式の要素を取り込んでいる。TAT63では、最低の回転ステージ(LL)の段階でパフォーマンス・ステップを下げるようにしてもよい。
[サーマル・マネジメント]
つぎに、図6のフローチャートを参照して、放熱システムが回転ステージとパフォーマンス・ステップを制御する方法を説明する。放熱システムは、放熱ファン103〜303、放熱ファン駆動回路107〜307、TAT61、63、TAT61、63のいずれかを参照可能に設定するシステム・ファームウェア、およびTAT61、63を参照して回転ステージおよびパフォーマンス・ステップを制御するEC17などで構成する。放熱ファン103〜303は、通常の使用環境では、すべてのプロセッサが同時に最大の負荷で動作したときに、パフォーマンスを低下させないでも最大の回転ステージで動作して放熱できるが、いずれかの放熱ユニットが故障したときは、すべてのプロセッサを同時に最大の負荷で動作させることができない。
ブロック401で情報処理装置10の電源を起動する。ブロック403でブートを開始すると最初にPOSTコードが各デバイスの検査および初期化を行う。POSTコードは、放熱ファン103〜303を動作させて、回転速度や電流値などの戻り値を確認する。ブロック405でPOSTコードがいずれかの放熱ファン103〜303に異常を検出するとブロック407に移行する。
TAT63を使ったサーマル・マネジメントでは、1台が故障しても2台の放熱ファンでシステムの動作を継続させることができる。システム・ファームウェアは、POSTコードから異常を発見した放熱ファンの数がたとえば放熱ファン203の1台である場合は、ブロック407でEC17がTAT63を参照するように設定する。以後、EC17は、TAT63を参照して放熱ファン103、303の回転速度の制御とプロセッサのパフォーマンス・ステップの制御をする。
もし、2台以上の放熱ファンが故障した場合は、TAT63では適切に制御できないため、この時点でブートを中止し、システム・ファームウェアは画面にそれを知らせる表示をする。ブロック409でシステム・ファームウェアは、故障した放熱ファン203をシステムが認識しないようにする。ブロック411で、OSのブートが完了する。ブロック413で、OS上で動作するプログラムが、画面に放熱ファン203が故障したことおよびパフォーマンスが低下することを示す表示をする。
情報処理装置10は、1台の放熱ファン203が故障してもブートを完了するため、ユーザはパフォーマンスが低いながらも情報処理装置10を使用することができる。したがって、ユーザは緊急のときにデータを読み出したり、メールを送ったりする最低限の作業ができるようになる。ブロック415でEC17は、TAT63を参照して放熱ファン103、303の回転速度およびプロセッサのパフォーマンス・ステップを制御する。ブロック417でEC17は、現在の回転ステージに対する温度センサ51a〜51fの検出温度とTAT63に基づいて回転ステージの変更の必要性を判断する。
回転ステージの変更が必要な場合はブロック419に移行する。EC17は、温度センサ51a〜51fのいずれかが現在の回転ステージに対応する温度を越えると、放熱ファン103、303の回転ステージを同時にそれぞれ1段上げるように放熱ファン駆動回路107、307を制御する。EC17は、すべての温度センサ51a〜51fの検出温度が現在の回転ステージに対応する温度より下がると、放熱ファン103、303の回転ステージを同時にそれぞれ1段下げるように放熱ファン駆動回路107、307を制御する。
ブロック421でEC17は、現在のパフォーマンス・ステップに対する温度センサ51a〜51fの検出温度とTAT63に基づいてパフォーマンス・ステップの変更の必要性を判断する。パフォーマンス・ステップの変更が必要な場合はブロック423に移行する。EC17は、温度センサ51a〜51fのいずれかが各プロセッサについて現在のパフォーマンス・ステップに対応する温度を越えると、システム・ファームウェアを通じて当該プロセッサのパフォーマンス・ステップを1段下げる。EC17は、すべての温度センサ51a〜51fの検出温度が各プロセッサについて、現在のパフォーマンス・ステップ対応する温度より下がると、システム・ファームウェアを通じて当該プロセッサのパフォーマンス・ステップを1段上げる。
ブロック405で放熱ファン103〜303に異常がないときは、ブロック451でシステム・ファームウェアはEC17にTAT61を参照するように設定する。ブロック453でEC17はTAT61を参照して放熱ファン103〜303の回転速度およびプロセッサのパフォーマンス・ステップを制御する。放熱ファン203が故障したときにEC17がTAT61を参照して回転速度およびパフォーマンス・ステップを制御する場合は、急激にプロセッサの負荷が増えたような場合に追従できなくなってシステムがサスペンド状態に移行したり、動作中に急にパフォーマンスが低下して使いにくかったりする。本実施の形態ではあらかじめ故障を検出した放熱ファン103〜303の台数に応じてそれに対応できるTATを利用することで、そのような問題を回避することができる。
これまで、TAT61、63の設定をブート中にシステム・ファームウェアが行う例を説明したが、TAT61、63の設定は、OS上で動作するプログラムが、システム・ファームウェアを通じて放熱ファンの状態を確認してから実行するようにしてもよい。3つの放熱系統を例示して説明したが、本発明はこれに限定するものではなく、複数の放熱系統を備える放熱システムに適用できる。
パフォーマンス・ステップの制御を、すべてのプロセッサに対して実行する例を説明したが、最初に故障した放熱ファンが帰属する放熱系統に含まれるプロセッサだけに対してパフォーマンス・ステップの制御を行い、当該プロセッサが最低のパフォーマンス・ステップまで低下した後に、残りのプロセッサのパフォーマンス・ステップを制御するようにしてもよい。たとえば、故障した放熱ファン203を含む第2の放熱系統に帰属するCPU21のパフォーマンス・ステップを優先的に低下させ、さらに温度上昇が続く場合に、GPU11、CPU31のパフォーマンス・ステップを低下させることができる。
これまで本発明について図面に示した特定の実施の形態をもって説明してきたが、本発明は図面に示した実施の形態に限定されるものではなく、本発明の効果を奏する限り、これまで知られたいかなる構成であっても採用することができることはいうまでもないことである。
10 情報処理装置
11 GPU
21、31 CPU
51a〜51f 温度センサ
101、201、301 放熱ユニット
103、203、303 放熱ファン
105、205、305 ヒート・シンク
111、211、311、411a〜411c ヒート・パイプ
61 正常時のサーマル・アクション・テーブル(TAT)
63 異常時のサーマル・アクション・テーブル(TAT)

Claims (13)

  1. 情報処理装置の筐体の内部の温度を管理するためのサーマル・マネジメントを実行する放熱システムであって、
    プロセッサと、
    それぞれが放熱ファンを含む複数の放熱ユニットと、
    前記筐体の内部の温度を検出して検出温度を出力する温度センサと、
    前記検出温度に対応する前記複数の放熱ユニットの回転速度を記述した第1の参照テーブルと、
    同一の前記検出温度に対して前記第1の参照テーブルが記述する前記回転速度より高い回転速度を記述した第2の参照テーブルと
    前記複数の放熱ユニットが正常なときに前記第1の参照テーブルを参照して第1のサーマル・マネジメントを実行し、いずれかの前記放熱ユニットが故障したときに前記第2の参照テーブルを参照して第2のサーマル・マネジメントを実行し、前記情報処理装置の動作を継続させるコントローラと
    を有する放熱システム。
  2. 前記情報処理装置は、ブート中に前記放熱ユニットの診断をして前記第1の参照テーブルまたは前記第2の参照テーブルを参照可能に設定する請求項1に記載の放熱システム。
  3. 情報処理装置の筐体の内部の温度を管理するためのサーマル・マネジメントを実行する放熱システムであって、
    プロセッサと、
    それぞれが放熱ファンを含む複数の放熱ユニットと、
    前記筐体の内部の温度を検出して検出温度を出力する温度センサと、
    前記検出温度に対応する前記プロセッサのパフォーマンス・ステップを記述した第1の参照テーブルと、
    同一の前記検出温度に対して前記第1の参照テーブルが記述する前記パフォーマンス・ステップより低いパフォーマンス・ステップを記述した第2の参照テーブルと
    前記複数の放熱ユニットが正常なときに前記第1の参照テーブルを参照して第1のサーマル・マネジメントを実行し、いずれかの前記放熱ユニットが故障したときに前記第2の参照テーブルを参照して第2のサーマル・マネジメントを実行し、前記情報処理装置の動作を継続させるコントローラと
    を有する放熱システム。
  4. 前記情報処理装置は、ブート中に前記放熱ユニットの診断をして前記第1の参照テーブルまたは前記第2の参照テーブルを参照可能に設定する請求項3に記載の放熱システム。
  5. 情報処理装置の筐体の内部の温度を管理するためのサーマル・マネジメントを実行する放熱システムであって、
    第1のプロセッサと第2のプロセッサを含む複数のプロセッサと、
    前記第1のプロセッサに熱的に結合した第1の放熱ユニットと前記第2のプロセッサに熱的に結合した第2の放熱ユニットを含む複数の放熱ユニットと、
    前記第1のプロセッサの温度を検出する第1の温度センサと前記第2のプロセッサの温度を検出する第2の温度センサを含む複数の温度センサと、
    前記温度センサが検出した温度に対応する前記第1の放熱ユニットと前記第2の放熱ユニットの回転速度を記述した第1の参照テーブルと、
    同一の前記検出した温度に対して前記第1の参照テーブルが記述する前記第1の放熱ユニットと前記第2の放熱ユニットの前記回転速度より高い回転速度を記述した第2の参照テーブルと
    前記複数の放熱ユニットが正常なときに前記第1の参照テーブルを参照して第1のサーマル・マネジメントを実行し、いずれかの前記放熱ユニットが故障したときに前記第2の参照テーブルを参照して第2のサーマル・マネジメントを実行するコントローラと
    を有する放熱システム。
  6. 前記第1のプロセッサと前記第2のプロセッサがヒート・パイプで結合している請求項5に記載の放熱システム。
  7. 前記第1のプロセッサがCPUで前記第2のプロセッサがGPUであって、前記第2のサーマル・マネジメントは前記第1のサーマル・マネジメントに比べて前記CPUと前記GPUの動作クロックを低下させる請求項5に記載の放熱システム。
  8. 前記第1のプロセッサがCPUで前記第2のプロセッサがGPUであって、前記第2のサーマル・マネジメントにおいて、前記第1の放熱ユニットが故障したときに前記CPUの動作クロックを低下させ、前記第2の放熱ユニットが故障したときに前記GPUの動作クロックを低下させる請求項5に記載の放熱システム。
  9. 情報処理装置の筐体の内部の温度を管理するためのサーマル・マネジメントを実行する放熱システムであって、
    第1のプロセッサと第2のプロセッサを含む複数のプロセッサと、
    前記第1のプロセッサに熱的に結合した第1の放熱ユニットと前記第2のプロセッサに熱的に結合した第2の放熱ユニットを含む複数の放熱ユニットと、
    前記第1のプロセッサの温度を検出する第1の温度センサと前記第2のプロセッサの温度を検出する第2の温度センサを含む複数の温度センサと、
    前記温度センサが検出した温度に対応する前記第1のプロセッサと前記第2のプロセッサのパフォーマンス・ステップを記述した第1の参照テーブルと、
    同一の前記検出した温度に対して前記第1の参照テーブルが記述する前記第1のプロセッサと前記第2のプロセッサの前記パフォーマンス・ステップより低いパフォーマンス・ステップを記述した第2の参照テーブルと
    前記複数の放熱ユニットが正常なときに前記第1の参照テーブルを参照して第1のサーマル・マネジメントを実行し、いずれかの前記放熱ユニットが故障したときに前記第2の参照テーブルを参照して第2のサーマル・マネジメントを実行するコントローラと
    を有する放熱システム。
  10. 前記第1のプロセッサと前記第2のプロセッサがヒート・パイプで結合している請求項9に記載の放熱システム。
  11. 前記第1のプロセッサがCPUで前記第2のプロセッサがGPUであって、前記第2のサーマル・マネジメントは前記第1のサーマル・マネジメントに比べて前記CPUと前記GPUの動作クロックを低下させる請求項10に記載の放熱システム。
  12. 前記第2のサーマル・マネジメントにおいて、前記第1の放熱ユニットが故障したときに前記CPUの動作クロックを低下させ、前記第2の放熱ユニットが故障したときに前記GPUの動作クロックを低下させる請求項11に記載の放熱システム。
  13. 請求項1から請求項12のいずれかに記載の放熱システムを搭載する情報処理装置。
JP2015097104A 2015-05-12 2015-05-12 放熱システム、制御方法、コンピュータ・プログラムおよび情報処理装置 Active JP6069406B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015097104A JP6069406B2 (ja) 2015-05-12 2015-05-12 放熱システム、制御方法、コンピュータ・プログラムおよび情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015097104A JP6069406B2 (ja) 2015-05-12 2015-05-12 放熱システム、制御方法、コンピュータ・プログラムおよび情報処理装置

Publications (2)

Publication Number Publication Date
JP2016212717A JP2016212717A (ja) 2016-12-15
JP6069406B2 true JP6069406B2 (ja) 2017-02-01

Family

ID=57551362

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015097104A Active JP6069406B2 (ja) 2015-05-12 2015-05-12 放熱システム、制御方法、コンピュータ・プログラムおよび情報処理装置

Country Status (1)

Country Link
JP (1) JP6069406B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6454748B2 (ja) 2016-05-18 2019-01-16 レノボ・シンガポール・プライベート・リミテッド ユーザの存否を認定する方法、デバイスの制御方法および電子機器
CN106886482B (zh) * 2017-04-21 2019-11-26 仁怀市云侠网络科技有限公司 电脑机箱温度检测装置
JP2021101326A (ja) * 2020-09-11 2021-07-08 富士通クライアントコンピューティング株式会社 電子機器
JP7176031B2 (ja) * 2021-03-22 2022-11-21 株式会社日立製作所 情報処理装置及び情報処理装置のファン制御方法
CN116827843B (zh) * 2023-08-30 2023-11-14 湖北华特信息技术有限公司 一种基于大数据技术的通信检测方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009059801A (ja) * 2007-08-30 2009-03-19 Toshiba Corp 電子機器
JP2009187347A (ja) * 2008-02-07 2009-08-20 Panasonic Corp 情報処理装置およびそのcpu用冷却ファンの故障診断方法
JP2013092822A (ja) * 2011-10-24 2013-05-16 Hitachi Ltd 情報処理装置及び冷却方法
JP2014154748A (ja) * 2013-02-12 2014-08-25 Nec Saitama Ltd ファン制御システム、ファン制御方法およびファン制御プログラム

Also Published As

Publication number Publication date
JP2016212717A (ja) 2016-12-15

Similar Documents

Publication Publication Date Title
JP6069406B2 (ja) 放熱システム、制御方法、コンピュータ・プログラムおよび情報処理装置
JP4384182B2 (ja) ファン回転速度制御方法
JP5177896B2 (ja) ファンの動的回転数制御装置、ファンの動的回転数制御方法及びファンの動的回転数制御プログラム
JP6044235B2 (ja) コンテナ型データセンタ、空調制御プログラム及び空調制御方法
CN104122910A (zh) 整体机柜风墙控制***及方法
TWI515549B (zh) 目標裝置的過熱保護方法、過熱保護裝置、及其資訊處理系統
WO2010018635A1 (ja) 冷却方法及び計算機
US10390463B2 (en) Backflow prevention for computing devices
JP2008165803A (ja) ブレードサーバ管理システム
JP2007226617A (ja) 電子機器の冷却システム、コンピュータおよび冷却方法
JP2013165270A (ja) サーバーの温度制御システム
JP2006294180A (ja) ストレージ装置、ストレージ装置のファン制御方法およびファン制御プログラム
TW201918151A (zh) 電子裝置以及散熱方法
JP6038222B1 (ja) 放熱構造、排出方法、放熱システムおよび情報処理装置
JP2013168107A (ja) 情報処理装置、異常検出方法、及び、プログラム
CN110442225B (zh) 电源分配板、模块化机箱***及其运作方法
US20120279688A1 (en) Heat dissipating module and heat dissipating method thereof
US20130130610A1 (en) Information processing apparatus and method of controlling a cooling fan
CN107390852A (zh) 一种控制方法、电子设备及计算机可读存储介质
TWI727679B (zh) 運算裝置、雙轉子風扇及散熱系統
JP2014142840A (ja) 情報処理装置、消費電力制御方法、及びプログラム
US20180115273A1 (en) Method for controlling a fan module of a server rack and controller unit for implementing the same
CN109708265B (zh) 一种室外机中风机的启动方法及室外机
JP6800935B2 (ja) 電子システムでのファンの制御方法
JP2018094802A (ja) 電子機器と、当該電子機器における冷却ファンの制御方法、及びプログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161226

R150 Certificate of patent or registration of utility model

Ref document number: 6069406

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250