JP5354579B2 - プロセス監視機能を有する情報処理装置、プロセス監視方法、およびプロセス監視プログラム - Google Patents

プロセス監視機能を有する情報処理装置、プロセス監視方法、およびプロセス監視プログラム Download PDF

Info

Publication number
JP5354579B2
JP5354579B2 JP2009004900A JP2009004900A JP5354579B2 JP 5354579 B2 JP5354579 B2 JP 5354579B2 JP 2009004900 A JP2009004900 A JP 2009004900A JP 2009004900 A JP2009004900 A JP 2009004900A JP 5354579 B2 JP5354579 B2 JP 5354579B2
Authority
JP
Japan
Prior art keywords
function
state
abnormality
state value
processes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009004900A
Other languages
English (en)
Other versions
JP2010165036A (ja
Inventor
裕久 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2009004900A priority Critical patent/JP5354579B2/ja
Publication of JP2010165036A publication Critical patent/JP2010165036A/ja
Application granted granted Critical
Publication of JP5354579B2 publication Critical patent/JP5354579B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Description

この発明はプロセス監視機能を有する情報処理装置、プロセス監視方法、およびプロセス監視プログラムに関し、特に、マルチタスクオペレーションシステムのプロセス監視を行なうプロセス監視機能を有する情報処理装置、プロセス監視方法、およびプロセス監視プログラムに関する。
従来、マルチタスクオペレーティングシステムにおいて、プロセス監視の方法、および異常検出の方法の提案が各種行なわれている。その方法として、具体的には、(1)ウォッチドッグタイマを用いる方法、(2)被監視プロセスに問合せを行ない、応答がない場合や想定した稼働状態と異なる場合に異常と判定する方法、(3)プロセス停止回数が基準値以上になった場合に異常と判定する方法、(4)CPU(Central Processing Unit)の高負荷状態を検出し、その原因となっているプロセスを異常と判定する方法、(5)被監視プロセスに定期的にシステムコールをさせ、コールが検出されない場合に異常と判定する方法、などが挙げられる。たとえば、特開2001−56772号公報(以下、特許文献1)は、上記(2)の方法でプロセス異常を検出し、異常と検出されたプロセスを再起動させる技術を開示している。
しかし、役割の異なるプロセスが混在した場合、その異常判定方法を一元化することは困難であり、精度のよい異常判定は難しい。また、被監視プロセスが正常動作している場合でも、複数プロセスから構成される機能では矛盾した(異常な)状態の場合の検出ができない。
特開2001−56772号公報
しかしながら、マルチタスクオペレーティングシステムにおいては役割の異なるプロセスが混在する場合があるのに対して、特許文献1に開示されているように、異常検出方法は一元化されている。そのため、特許文献1に開示されているような従来の方法では、役割の異なるプロセスに適用するのが困難であり、精度よく異常を検出できない場合がある、という問題があった。
また、複数のプロセスから構成されている1つの機能について、特許文献1に開示されているような従来の方法では、プロセスごとの異常の検出は可能であっても、機能全体としての異常の検出を行なうものではない。そのため、各プロセスは正常に動作していると検出された場合であっても、機能全体として矛盾が生じ、異常が発生している場合にはその判定がなされない、という問題があった。
さらに、従来の方法では、異常が検出された場合、正常なプロセスが含まれている場合であっても、異常が検出されたプロセス、またはシステム全体のどちらかの再起動がなされてしまい、非効率である、という問題があった。
本発明はこのような問題に鑑みてなされたものであって、役割の異なる複数のプロセスが混在している場合に、精度よく異常を検出し、効率的に対処することが可能なプロセス監視機能を有する情報処理装置、プロセス監視方法、およびプロセス監視プログラムを提供することを目的とする。
上記目的を達成するために、本発明のある局面に従うと、情報処理装置はプロセス監視機能を有し、機能を構成するプロセス間の関係を示す情報を記憶する第1の記憶手段と、機能の状態ごとに、各プロセスの正常に稼動している際の状態を示す値である状態値を正常状態値として記憶する第2の記憶手段と、稼動中の機能と稼動中の機能の状態とを特定する第1の特定手段と、第1の記憶手段に記憶されている情報に基づいて、稼動中の機能を構成するプロセスを特定し、そのプロセスの状態を示す状態値を取得する取得手段と、稼動中の機能を構成するプロセスの状態値と、そのプロセスについての第2の記憶手段に記憶されている稼動中の機能の状態に応じた正常状態値とを比較することで、稼動中の機能を構成するプロセスの中から異常を検出する検出手段と、第1の記憶手段に記憶されている機能を構成するプロセス間の関係と、検出手段で異常が検出されたプロセスとに基づいて、再起動させるプロセスの範囲を特定する第2の特定手段と、第2の特定手段で特定された範囲に含まれるプロセスを再起動させるための処理を行なう再起動処理手段とを備える。
好ましくは、情報処理装置は、プロセスごとに、当該プロセスの状態値を記憶する第3の記憶手段をさらに備え、取得手段は、第3の記憶手段から稼動中の機能を構成するプロセスについての状態値を抽出する。
好ましくは、情報処理装置は、稼動中の機能を示す情報と稼動中の機能の状態とを示す情報とを記憶する第4の記憶手段をさらに備え、第1の特定手段は、第4の記憶手段から情報を取得する。
好ましくは、第1の記憶手段に記憶されている情報は、機能を構成するプロセスの上位・下位関係を示す情報であり、第2の特定手段は、稼動中の機能を構成するプロセスの上位・下位関係において、少なくとも、検出手段で異常が検出されたプロセスに連結された、プロセス以下のプロセスの範囲を再起動させる範囲と特定する。
好ましくは、第2の特定手段は、再起動処理手段での再起動後の検出手段での検出手段に応じて再起動させる範囲を変更する。
本発明の他の局面に従うと、プロセス監視方法はプロセス監視機能を有する情報処理装置におけるプロセス監視方法であって、情報処理装置は、機能を構成するプロセス間の関係を示す情報を記憶する第1の記憶手段と、機能の状態ごとに、各プロセスの正常に稼動している際の状態を示す値である状態値を正常状態値として記憶する第2の記憶手段とを含み、稼動中の機能と稼動中の機能の状態とを特定するステップと、第1の記憶手段に記憶されている情報に基づいて、稼動中の機能を構成するプロセスを特定し、プロセスの状態を示す状態値を取得するステップと、稼動中の機能を構成するプロセスの状態値と、そのプロセスについての第2の記憶手段に記憶されている稼動中の機能の状態に応じた正常状態値とを比較することで、稼動中の機能を構成するプロセスの中から異常を検出するステップと、第1の記憶手段に記憶されている機能を構成するプロセス間の関係と、検出するステップで異常が検出されたプロセスとに基づいて、再起動させるプロセスの範囲を特定するステップと、特定された範囲に含まれるプロセスを再起動させるための処理を行なうステップとを備える。
本発明のさらに他の局面に従うと、プロセス監視プログラムはコンピュータにプロセス監視処理を実行させるためのプログラムであって、コンピュータは、機能を構成するプロセス間の関係を示す情報を記憶する第1の記憶手段と、機能の状態ごとに、各プロセスの正常に稼動している際の状態を示す値である状態値を正常状態値として記憶する第2の記憶手段とを含み、稼動中の機能と稼動中の機能の状態とを特定するステップと、第1の記憶手段に記憶されている情報に基づいて、稼動中の機能を構成するプロセスを特定し、そのプロセスの状態を示す状態値を取得するステップと、稼動中の機能を構成するプロセスの状態値と、プロセスについての第2の記憶手段に記憶されている稼動中の機能の状態に応じた正常状態値とを比較することで、稼動中の機能を構成するプロセスの中から異常を検出するステップと、第1の記憶手段に記憶されている機能を構成するプロセス間の関係と、検出するステップで異常が検出されたプロセスとに基づいて、再起動させるプロセスの範囲を特定するステップと、特定された範囲に含まれるプロセスを再起動させるための処理を行なうステップとを実行させる。
本発明によると、役割の異なる複数のプロセスが存在する場合であっても、精度よく異常状態を検出することができる。さらに、異常の生じているプロセスを検出した場合、必要最小限のプロセスのみの再起動を行なうため、システム全体に与える影響を最小限にすることができる。
実施の形態にかかるHGW(ホームゲートウェイ)を含んだプロセス監視システムの構成の具体例を示す図である。 実施の形態にかかるHGWでのプロセス監視機能の構成の具体例を示すブロック図である。 実施の形態にかかるHGWで記憶している、機能を構成するプロセス間の関係、および機能の状態ごとの正常な稼動時のプロセスの状態値の具体例を示す図である。 実施の形態にかかるHGWで記憶している、機能を構成するプロセス間の関係、および機能の状態ごとの正常な稼動時のプロセスの状態値の具体例を示す図である。 実施の形態にかかるHGWで実行される、プロセス監視処理の流れの具体例を示すフローチャートである。 異常が検出されたプロセスと、再起動させるプロセスとの関係の具体的を示す図である。
以下に、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部品および構成要素には同一の符号を付してある。それらの名称および機能も同じである。
以下の実施の形態においては、プロセス監視機能を有する情報処理装置をホームゲートウェイ(以下、HGW)としている。しかしながら、プロセス監視機能を有する情報処理装置は当該装置に限定されない。プロセス監視機能を有する情報処理装置は、HGWの他、一般的なコンピュータや携帯電話機などであってもよい。
図1は、実施の形態にかかるHGW100を含んだプロセス監視システム(以下、システム)の構成の具体例を示す図である。図1を参照して、システムにおいて、HGW100は、デジタルテレビジョンや、アナログ電話機や、IP(Internet Protocol)電話機などの家庭内の電子機器300A,300B,300C…に接続されている。HGW100は、インターネットを通じて他の装置からこれら電子機器300A,300B,300C…に送信されるパケットを中継し、またこれら電子機器300A,300B,300C…からインターネットを通じて他の装置に送信されるパケットを中継するための処理を行なう。
図2は、HGW100でのプロセス監視機能の構成の具体例を示すブロック図である。図2に示される各機能は、HGW100に含まれる図示しないCPUがROMなどの記憶部に記憶されているプログラムを読み出して実行することで、主にCPUに形成される機能であるが、少なくとも一部がハードウェア構成で実現されてもよい。
図2を参照して、HGW100は、CPUがアプリケーションを実行することで形成される動作システムとしてのOS(Operating System)101と監視対象となる複数のプロセス102とを備える。プロセス監視機能は、プロセス状態共有メモリ103と、機能状態記憶部104と、稼動状態記憶部105と、取得部106と、抽出部107と、異常検出部108と、再起動処理部109とを含む。
プロセス102は、各機能を実現するためのアプリケーションを構成する各種プロセスが該当する。機能としては、HGW100に接続されている電子機器300A,300B,300C…の各々を動作させるための機能が該当する。具体的には、電子機器300Bがアナログ電話機である場合、アナログ電話機である電子機器300Bを動作させるための機能を構成するプロセスには、アナログ電話機を起動させる、つまりSIP(Session Initiation Protocol)でセッションを開始するプロセス、アナログの電話回線を用いて音声データの授受を行なうプロセス、およびアナログ電話機での通話を終了させるプロセスが含まれる。
各機能には、1以上の状態が存在する。具体的には、電子機器300Bがアナログ電話機である場合、電子機器300Bを動作させるための機能には、状態として、アナログ電話機である電子機器300Bを待機中とする状態、およびアナログ電話機である電子機器300Bを通話中とする状態が存在する。各状態は、当該機能に関連するプロセスが、予め規定された状態となることで実現される。プロセスの状態とは、たとえば、当該プロセスの実行のために占有しているCPUの割合や、使用しているメモリ量などで定義される。プロセス状態共有メモリ103は、プロセスごとの状態を記憶するためのメモリであって、プロセス102が、各々、所定のタイミングで書き込む自身の稼動状態を示す情報を記憶する。以降、プロセスの稼動状態を示す情報、たとえばCPUの占有率や、メモリの使用量などを示す値を「状態値」と称する。プロセス状態共有メモリ103に記憶されている各プロセスの状態値は、当該プロセスの現在の状態値と言える。
機能状態記憶部104は、予め、図3に示されるように、機能ごとに、構成するプロセスの情報として、当該機能を構成するプロセス間の関係、および当該機能の状態ごとの正常な稼動時のプロセスの稼動状態を示す情報である状態値を記憶している。プロセス間の関係とは、上位・下位関係を指し、具体例としては、図3に、プロセス間の関係がツリー形状で記憶される例が示されている。図3を参照して、機能ごとのプロセスの情報として、当該機能を構成するプロセスごとに、プロセスを特定する情報であるプロセスID(Process ID)、CPUの占有率(%CPU)、実メモリの使用量(RSS)、仮想メモリの使用量(VSS)、プロセス直下に位置するプロセスである子プロセスの実メモリの使用量(C_RSS)、および子プロセスの仮想メモリの使用量(C_VSS)などが記憶され、これらが、プロセスの構成に従ってツリー形状で記憶される。
具体的に、これらの情報を記憶する構成として、機能情報記憶部104は状態マップ記憶部1041および正常稼動状態記憶部1042を含む。状態マップ記憶部1041および正常稼動状態記憶部1042で記憶される情報の具体例が図4に示される。すなわち、図4を参照して、状態マップ記憶部1041は、機能を構成するプロセス(P1〜P4)とそれらの間の関係とを、たとえばツリー形状で記憶している。以降、状態マップ記憶部1041に記憶されている、機能を構成するプロセスとそれらの間の関係とを示す情報を「状態マップ」と称する。正常稼動状態記憶部1042は、当該機能に存在する状態ごとに、当該機能を構成する各プロセスについての、正常に稼動している場合の稼動状態値を記憶している。
稼動状態記憶部105は、稼動中の機能の情報を記憶する。稼動中の機能の情報は、HGW100のCPUにおいて、アプリケーションが実行される際に、その実行に伴って逐次書き込まれるものであって、稼動中の機能を特定する情報、および当該機能の状態を特定する情報を含む。
取得部106は、稼動状態記憶部105に記憶されている情報から、現在稼動中の機能を特定する情報および当該機能の状態を特定する情報を取得し、これらを抽出部107に入力する。抽出部107は、現在稼動中の機能を構成するプロセスの状態マップを状態マップ記憶部1041から抽出し、さらに、現在稼動中の機能を構成するプロセスの、現在の状態についての、正常稼動状態記憶部1042に記憶されている状態値、つまり、正常稼動時の状態値を抽出し、異常検出部108に入力する。また、抽出部107は、現在稼動中の機能を構成するプロセスについて、プロセス状態共有メモリ103に記憶されている現在の状態値を抽出し、異常検出部108に入力する。
HGW100のCPUが基本ソフトウェアであるOSを実行することで実現する、ハードウェアを抽象化したインタフェースをアプリケーションに提供する機能を、ここではOS101と称する。OS101は、所定のタイミングで、現在CPUにおいて実行されているアプリケーションにおいて、実行しているプロセスを示す情報をプロセス情報として、異常検出部108に入力する。
異常検出部108は、抽出部107で抽出された現在稼動中の機能を構成するプロセスについての、正常稼動時の状態値をしきい値として用い、現在の状態値をしきい値と比較することで、正常に稼動していないプロセスを検出、つまり異常を検出し、異常状態であるプロセスを検出する。さらに、抽出部107で抽出された現在稼動中の機能を構成するプロセスについての状態マップと、OS101からのプロセス情報とを用いて、異常状態であるプロセスの、当該機能を構成するプロセス間の関係中での位置を検出する。検出結果は、再起動処理部109に入力される。再起動処理部109は、検出結果に基づいて当該機能を構成するプロセスのうち、再起動させるプロセスの範囲を特定し、当該範囲に含まれるプロセスを再起動させるための処理を実行する。
図2に示されたプロセス監視機能の構成では、OS101がプロセス情報を異常検出部108に入力するものとしているが、他の例として、OS101が、現在CPUにおいて実行されているアプリケーションにおいて実行している各プロセスに対して、当該アプリケーションが実現する機能を特定する情報を渡し、各プロセスが自身の状態値と共に、自身が用いられている現在稼動中の機能をプロセス状態共有メモリ103に書き込んでもよい。この場合、抽出部107は、プロセスごとに、当該プロセスが用いられている現在稼動中の機能をプロセス状態共有メモリ103から読取り、現在稼動中の機能を構成するプロセスの状態マップを状態マップ記憶部1041から抽出する。
図5は、HGW100で実行される、プロセス監視処理の流れの具体例を示すフローチャートである。図5のフローチャートに示される処理は、HGW100に含まれる図示しないCPUがROMなどの記憶部に記憶されているプログラムを読み出し、図2に示される各機能を制御することで実現される。図5のフローチャートに示される処理は、所定のタイミング、たとえば、一定の時間間隔や、所定の操作が行なわれたタイミングなどに自動的に実行される。
図5を参照して、取得部106において稼動状態記憶部105から、現在の稼動中の機能を示す情報が取得される(ステップ(S)101)。抽出部107において、S101で取得された、現在の稼動中の機能を構成するプロセスの状態マップ、および当該機能が正常に稼動している状態での各プロセスの状態値が抽出される(S103)。さらに、抽出部107において、S101で取得された、現在の稼動中の機能を構成するプロセスの、現在の状態値がプロセス状態共有メモリ103から抽出される(S105)。
異常検出部108において、OS101から実行中のアプリケーションにおいて実行されているプロセスを示す情報を取得し(S107)、S103〜S107で得られた情報に基づいて、すべてのプロセスが現在稼動している機能として正常に稼動している状態であるか否かを判断することで異常を検出する(S109)。すなわち、異常検出部108は、S107で取得されたCPUで実行しているプロセスとS105で抽出された現在の状態値と比較すること、およびS103で抽出された現在の稼動中の機能を構成するプロセスの正常稼動状態時の状態値をしきい値として、S105で抽出された現在の状態値と比較することで、現在稼動している機能として正常に稼動していないプロセスを検出する。
再起動処理部109は、S109での検出結果より、S103で抽出された状態マップを参照して、稼動中の機能としては正常に稼動していないと検出されたプロセスの、当該機能を構成するプロセス間の関係における位置を特定し、その位置に基づいて再起動させるプロセスの範囲を特定して(S111)、当該範囲に含まれるプロセスを再起動させるための処理を実行する(S113)。たとえば、稼動中の機能を構成するプロセスP1、プロセスP2、およびプロセスP3がその順で連結された構造である場合であって、図6(A)に示されるように、その最下位にあるプロセスP3に異常が検出された場合には、S109で再起動処理部109は、再起動させるプロセスの範囲として、異常が検出されたプロセスP3のみを含む範囲を特定するが、図6(B)に示されるように、中間に位置するプロセスP2に異常が検出された場合には、S109で再起動処理部109は、異常が検出されたプロセスP2以降の範囲、つまりプロセスP2に加えて、それよりも下位に位置し、プロセスP2での処理を受けてさらなる処理を行なうプロセスに相当する、プロセスP3を含む範囲を、再起動させるプロセスの範囲として特定する。またたとえば、稼動中の機能を構成するプロセスP1〜P6が図6(C)に表わされたような分岐を含んだツリー形状表わされる関係である場合であって、図6(C)に示されるように、分岐の一方側の最上位に位置するプロセスP4に異常が検出された場合には、S109で再起動処理部109は、異常が検出されたプロセスP4以降の範囲、つまりプロセスP4に加えて、それよりも下位に位置するプロセスP5およびプロセスP6を含む範囲を再起動させるプロセスの範囲として特定する。
なお、上の処理が行なわれて特定された範囲に含まれるプロセスが再起動された後も、引き続きプロセス監視が続けられる。そのため、プロセスの再起動後も異常が検出された場合には、上記S111で特定された再起動させるプロセスの範囲が適切でない可能性が考えられる。そこで、好ましくは、再起動処理部109は学習機能を備えて、プロセスの再起動後も異常が検出された場合には先のS111で特定された範囲よりも広い範囲、すなわち、さらに上位側のプロセス以降の範囲を再起動させるプロセスの範囲と特定する。
以上の説明のように、HGW100では、機能状態記憶部104にて機能の状態ごとに、機能を構成するプロセスの正常に稼動している状態での状態値を記憶し、その状態値をしきい値として用いて、当該機能が稼動している状態での当該機能を構成するプロセスの異常を監視している。1つプロセスが複数の機能に用いられるときには、ある機能稼動時には正常な状態値であっても、他の機能稼動時には異常な状態値である場合、ということも有り得、またその逆もあり得る。具体的には、上述の、アナログ電話機で通話を行なう機能を構成するプロセスのうちのSIPでセッションを開始するプロセス、およびアナログの電話回線を用いて音声データの授受を行なうプロセスに着目すると、両者のプロセスの状態値が正常値であるときには両プロセスとも正常と検出され、当該機能は正常に稼動している。前者のプロセスが待機中を示す状態値でかつ後者のプロセスが稼動中を示す状態値である場合には、いずれも、当該プロセスの状態値が正常である場合には、異常が検出されないが、アナログ電話機で通話を行なう機能の通話中の状態としては矛盾しており、異常が発生している。つまり、このように、機能の状態を考慮しないプロセスとしての正常/異常の判断だけでは、機能として矛盾が生じている場合であっても、各プロセスは正常と判断されて、当該機能の異常が正確に検出されないことも有り得る。
それに対して、HGW100では、機能の状態を考慮してプロセスの正常/異常を判断するため、稼動している機能において当該プロセスが正常であるか異常であるか、を判断することができる。
さらに、HGW100では、機能状態記憶部104にて機能を構成するプロセスとそれらの関係とを状態マップとして記憶し、異常が検出されたプロセスの稼動中の機能での他のプロセスとの位置関係に応じて、再起動するプロセスの範囲を特定している。
これらのことにより、HGW100では、正確に異常を検出して機能を適切に稼動させることができると共に、不必要な再起動を抑えて最小限のプロセスのみを再起動することができる。そのため、HGW100ではプロセス異常がシステム全体に与える影響を最小限にすることができ、効率的なシステムの稼動を実現することができる。
さらに、HGW100におけるプロセス監視方法、およびプロセス監視処理をコンピュータに実行させるプログラムを提供することもできる。このようなプログラムは、コンピュータに付属するフレキシブルディスク、CD−ROM(Compact Disk-Read Only Memory)、ROM(Read Only Memory)、RAM(Random Access Memory)およびメモリカードなどのコンピュータ読取り可能な記録媒体にて記録させて、プログラム製品として提供することもできる。あるいは、コンピュータに内蔵するハードディスクなどの記録媒体にて記録させて、プログラムを提供することもできる。また、ネットワークを介したダウンロードによって、プログラムを提供することもできる。
なお、本発明にかかるプログラムは、コンピュータのオペレーティングシステム(OS)の一部として提供されるプログラムモジュールのうち、必要なモジュールを所定の配列で所定のタイミングで呼出して処理を実行させるものであってもよい。その場合、プログラム自体には上記モジュールが含まれずOSと協働して処理が実行される。このようなモジュールを含まないプログラムも、本発明にかかるプログラムに含まれ得る。
また、本発明にかかるプログラムは他のプログラムの一部に組込まれて提供されるものであってもよい。その場合にも、プログラム自体には上記他のプログラムに含まれるモジュールが含まれず、他のプログラムと協働して処理が実行される。このような他のプログラムに組込まれたプログラムも、本発明にかかるプログラムに含まれ得る。
提供されるプログラム製品は、ハードディスクなどのプログラム格納部にインストールされて実行される。なお、プログラム製品は、プログラム自体と、プログラムが記録された記録媒体とを含む。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
100 HGW、101 OS、102 プロセス、103 プロセス状態共有メモリ、104 機能状態記憶部、105 稼動状態記憶部、106 取得部、107 抽出部、108 異常検出部、109 再起動処理部、300A,300B,300C… 電子機器、1041 状態マップ記憶部、1042 正常稼動状態記憶部。

Claims (7)

  1. 機能を構成するプロセス間の関係を示す情報を記憶する第1の記憶手段と、
    前記機能の状態ごとに、各プロセスの正常に稼動している際の状態を示す値である状態値を正常状態値として記憶する第2の記憶手段と、
    稼動中の機能と前記稼動中の機能の状態とを特定する第1の特定手段と、
    前記第1の記憶手段に記憶されている前記情報に基づいて、前記稼動中の機能を構成するプロセスを特定し、前記プロセスの状態を示す状態値を取得する取得手段と、
    前記稼動中の機能を構成するプロセスの状態値と、前記プロセスについての前記第2の記憶手段に記憶されている前記稼動中の機能の状態に応じた前記正常状態値とを比較することで、前記稼動中の機能を構成するプロセスの中から異常を検出する検出手段と、
    前記第1の記憶手段に記憶されている前記機能を構成するプロセス間の関係と、前記検出手段で異常が検出されたプロセスとに基づいて、再起動させるプロセスの範囲を特定する第2の特定手段と、
    前記第2の特定手段で特定された範囲に含まれるプロセスを再起動させるための処理を行なう再起動処理手段とを備える、プロセス監視機能を有する情報処理装置。
  2. プロセスごとに、当該プロセスの状態値を記憶する第3の記憶手段をさらに備え、
    前記取得手段は、前記第3の記憶手段から前記稼動中の機能を構成するプロセスについての前記状態値を抽出する、請求項1に記載のプロセス監視機能を有する情報処理装置。
  3. 稼動中の機能を示す情報と前記稼動中の機能の状態とを示す情報とを記憶する第4の記憶手段をさらに備え、
    前記第1の特定手段は、前記第4の記憶手段から前記情報を取得する、請求項1または2に記載のプロセス監視機能を有する情報処理装置。
  4. 前記第1の記憶手段に記憶されている前記情報は、機能を構成するプロセスの上位・下位関係を示す情報であり、
    前記第2の特定手段は、前記稼動中の機能を構成するプロセスの上位・下位関係において、少なくとも、前記検出手段で異常が検出されたプロセスに連結された、前記プロセス以下のプロセスの範囲を前記再起動させる範囲と特定する、請求項1〜3のいずれかに記載のプロセス監視機能を有する情報処理装置。
  5. 前記第2の特定手段は、前記再起動処理手段での再起動後の前記検出手段での検出手段に応じて前記再起動させる範囲を変更する、請求項1〜4のいずれかに記載のプロセス監視機能を有する情報処理装置。
  6. プロセス監視機能を有する情報処理装置におけるプロセス監視方法であって、
    前記情報処理装置は、
    機能を構成するプロセス間の関係を示す情報を記憶する第1の記憶手段と、
    前記機能の状態ごとに、各プロセスの正常に稼動している際の状態を示す値である状態値を正常状態値として記憶する第2の記憶手段とを含み、
    稼動中の機能と前記稼動中の機能の状態とを特定するステップと、
    前記第1の記憶手段に記憶されている前記情報に基づいて、前記稼動中の機能を構成するプロセスを特定し、前記プロセスの状態を示す状態値を取得するステップと、
    前記稼動中の機能を構成するプロセスの状態値と、前記プロセスについての前記第2の記憶手段に記憶されている前記稼動中の機能の状態に応じた前記正常状態値とを比較することで、前記稼動中の機能を構成するプロセスの中から異常を検出するステップと、
    前記第1の記憶手段に記憶されている前記機能を構成するプロセス間の関係と、前記検出するステップで異常が検出されたプロセスとに基づいて、再起動させるプロセスの範囲を特定するステップと、
    前記特定された範囲に含まれるプロセスを再起動させるための処理を行なうステップとを備える、プロセス監視方法。
  7. コンピュータにプロセス監視処理を実行させるためのプログラムであって、
    前記コンピュータは、
    機能を構成するプロセス間の関係を示す情報を記憶する第1の記憶手段と、
    前記機能の状態ごとに、各プロセスの正常に稼動している際の状態を示す値である状態値を正常状態値として記憶する第2の記憶手段とを含み、
    稼動中の機能と前記稼動中の機能の状態とを特定するステップと、
    前記第1の記憶手段に記憶されている前記情報に基づいて、前記稼動中の機能を構成するプロセスを特定し、前記プロセスの状態を示す状態値を取得するステップと、
    前記稼動中の機能を構成するプロセスの状態値と、前記プロセスについての前記第2の記憶手段に記憶されている前記稼動中の機能の状態に応じた前記正常状態値とを比較することで、前記稼動中の機能を構成するプロセスの中から異常を検出するステップと、
    前記第1の記憶手段に記憶されている前記機能を構成するプロセス間の関係と、前記検出するステップで異常が検出されたプロセスとに基づいて、再起動させるプロセスの範囲を特定するステップと、
    前記特定された範囲に含まれるプロセスを再起動させるための処理を行なうステップとを実行させる、プロセス監視プログラム。
JP2009004900A 2009-01-13 2009-01-13 プロセス監視機能を有する情報処理装置、プロセス監視方法、およびプロセス監視プログラム Expired - Fee Related JP5354579B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009004900A JP5354579B2 (ja) 2009-01-13 2009-01-13 プロセス監視機能を有する情報処理装置、プロセス監視方法、およびプロセス監視プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009004900A JP5354579B2 (ja) 2009-01-13 2009-01-13 プロセス監視機能を有する情報処理装置、プロセス監視方法、およびプロセス監視プログラム

Publications (2)

Publication Number Publication Date
JP2010165036A JP2010165036A (ja) 2010-07-29
JP5354579B2 true JP5354579B2 (ja) 2013-11-27

Family

ID=42581165

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009004900A Expired - Fee Related JP5354579B2 (ja) 2009-01-13 2009-01-13 プロセス監視機能を有する情報処理装置、プロセス監視方法、およびプロセス監視プログラム

Country Status (1)

Country Link
JP (1) JP5354579B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111385651A (zh) * 2018-12-29 2020-07-07 深圳Tcl数字技术有限公司 基于中间件的自动修复方法、装置、智能电视及存储介质

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5729767B2 (ja) * 2012-01-06 2015-06-03 Kddi株式会社 スマートフォンの動作安定化方法、動作安定化プログラム及び動作安定化装置。
JP6481355B2 (ja) * 2014-12-18 2019-03-13 日本電気株式会社 プロセス管理装置、方法及びプログラム
CN110825396B (zh) * 2019-10-31 2023-07-25 Oppo(重庆)智能科技有限公司 异常处理方法及相关设备
JP6991294B1 (ja) 2020-10-09 2022-01-12 三菱電機株式会社 制御装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001056772A (ja) * 1999-08-18 2001-02-27 Oki Electric Ind Co Ltd 障害監視システム
JP2005135333A (ja) * 2003-10-31 2005-05-26 Canon Inc プログラム監視装置、プログラム監視方法、プログラム、記憶媒体、及び情報取得システム
JP2008040750A (ja) * 2006-08-04 2008-02-21 Toshiba Corp 遠隔監視制御装置及びシステム
JP4504346B2 (ja) * 2006-12-25 2010-07-14 富士通株式会社 トラブル要因検出プログラム、トラブル要因検出方法およびトラブル要因検出装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111385651A (zh) * 2018-12-29 2020-07-07 深圳Tcl数字技术有限公司 基于中间件的自动修复方法、装置、智能电视及存储介质

Also Published As

Publication number Publication date
JP2010165036A (ja) 2010-07-29

Similar Documents

Publication Publication Date Title
CN103201724B (zh) 在高可用性虚拟机环境中提供高可用性应用程序
JP5354579B2 (ja) プロセス監視機能を有する情報処理装置、プロセス監視方法、およびプロセス監視プログラム
CN102141947B (zh) 一种对采用嵌入式操作***的计算机应用***中异常任务的处理方法及***
TWI229796B (en) Method and system to implement a system event log for system manageability
JP5259714B2 (ja) 実行順序決定装置、実行順序決定プログラム、実行順序決定回路及び情報処理装置
JP5093259B2 (ja) Biosとbmcとの間の通信パス強化方法、その装置及びそのプログラム
JP5198154B2 (ja) 障害監視システム及びデバイスと監視装置並びに障害監視方法
JP2006259869A (ja) マルチプロセッサシステム
CN109639818B (zh) 一种云环境下的服务发现方法、装置、服务器和存储介质
CA2589878A1 (en) Electronic apparatus and restarting method thereof
US8935562B2 (en) Failover of interrelated services on multiple devices
CN106997313B (zh) 一种应用程序的信号处理方法、***及终端设备
CN110502399B (zh) 故障检测方法及装置
CN111782522A (zh) 追踪消息的输出方法、电子设备及存储介质
JP6421516B2 (ja) サーバ装置、冗長構成サーバシステム、情報引継プログラム及び情報引継方法
JP6168628B1 (ja) 障害解析装置、障害解析システム、障害解析方法、及び障害解析用プログラム
JP2004013714A (ja) 通信端末装置、デバッグ情報通知システム及びコンピュータ・プログラム
JP2007207213A (ja) ワイヤレスデバイスのリアルタイム診断に適用する診断情報収集手法
JP2005092708A (ja) ソフトウェア更新システム及びソフトウェア更新方法並びにコンピュータプログラム
JP2005332030A (ja) コントローラ
JP4635993B2 (ja) 起動診断方式、起動診断方法およびプログラム
CN102622322B (zh) 一种利用黑匣子获取崩溃信息的方法、黑匣子及服务器
US8234487B2 (en) Server apparatus and startup control method
JP2007088811A (ja) 無線基地局装置
JP5734107B2 (ja) プロセス障害判定復旧装置、プロセス障害判定復旧方法、プロセス障害判定復旧プログラム、および記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130724

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130730

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130821

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees