JP6616854B2

JP6616854B2 - 移行単位分析装置、移行単位分析方法及び移行単位分析プログラム

Info

Publication number: JP6616854B2
Application number: JP2018017104A
Authority: JP
Inventors: 九月貞光; 賢一先山; 究加藤; 淳中元; 信之間中; 暢之二村; 雅章近藤
Original assignee: FUTURE CORPORATION
Current assignee: FUTURE CORPORATION
Priority date: 2018-02-02
Filing date: 2018-02-02
Publication date: 2019-12-04
Anticipated expiration: 2038-02-02
Also published as: JP2019133556A

Description

本発明は、旧システムから新システムへのシステム移行において、人の判断基準等に合う最適な移行単位を分析する技術に関する。

企業や役所には様々なソフトウェアシステムが導入されているが、機能追加等が発生した場合、既存の旧システムを新システムへ移行するシステム移行が行われる。従来は当該システム移行を人手で行っており、例えば１０人月等、多くの人手を必要としていた。それ故、システム移行に係る人手の作業コストを削減し、又はシステム移行の完全自動化が望まれている。

Xiaojin Zhu、外２名、"Semi-Supervised Learning Using Gaussian Fields and Harmonic Functions"、Proceedings of the Twentieth International Conference on Machine Learning (ICML-2003)、Washington DC、2003年

しかしながら、システム移行を行うにあたり、システムを構成するプログラムやデータベース間の関連性を一見して把握することは難しいため、どのサブシステム単位で移行するべきかを決定すること、つまり移行単位分析を行うことは容易ではない。

この点、例えば機能プログラムとデータベース間の参照回数を元に移行単位分析を行うことも考えられるが、単純な参照回数による移行単位分析では人が思い描く分割結果に合致しない可能性がある。

その一方で、システムを構成する構成要素（プログラムやデータベース等）間の関連性をグラフで表現し、非特許文献１を用いてグラフベースの分類法を活用することも考えられる。しかし、移行単位分析において、どのようなグラフを入力とすべきか、グラフをどのような入力として表現すべきか、どのような付加情報を付与すべきか、どのようなグラフ分類法が適切であるか、といった問題が残る。

本発明は、上記事情を鑑みてなされたものであり、システム移行に係る人手の作業コストを最小化しつつ、人手の移行単位分析結果に近い分類結果を得ることを第１の目的とする。人手の作業コストを零としつつ、高精度なクラスタリング結果を得ることを第２の目的とする。

以上の課題を解決するため、請求項１に係移行単位分析装置は、システムを構成する複数の構成要素を構成要素間の関連性に基づき結合したグラフを形成するグラフ形成部と、前記複数の構成要素に対して一の移行単位とする一部の構成要素を教示した利用者の教師データと、前記グラフに含まれる構成要素間の結合情報とを用いて、一の移行単位に含める構成要素を決定するグラフ制御部と、を備え、前記結合情報は、構成要素間の参照の種類に応じた参照の重要度と、構成要素の配置位置の同異と、の複数の結合情報であり、前記グラフ制御部は、前記複数の結合情報のうち一方の結合情報を用いて一の移行単位に含める構成要素を決定し、当該決定した結果をもとに他方の結合情報を更に用いて一の移行単位に含める構成要素を再決定して、前記複数の結合情報に基づく複数のグラフを統合的な１つのグラフとして処理することを特徴とする。

請求項２に係移行単位分析装置は、システムを構成する複数の構成要素を構成要素間の関連性に基づき結合したグラフを形成するグラフ形成部と、前記グラフに含まれる構成要素間の結合情報を用いて、一の移行単位に含める構成要素を決定するグラフ制御部と、を備え、前記結合情報は、構成要素間の参照の種類に応じた参照の重要度と、構成要素の配置位置の同異と、の複数の結合情報であり、前記グラフ制御部は、前記複数の結合情報のうち一方の結合情報を用いて一の移行単位に含める構成要素を決定し、当該決定した結果をもとに他方の結合情報を更に用いて一の移行単位に含める構成要素を再決定して、前記複数の結合情報に基づく複数のグラフを統合的な１つのグラフとして処理することを特徴とする。

請求項３に係移行単位分析装置は、請求項１又は２に記載の移行単位分析装置において、前記グラフ制御部は、前記結合情報として構成要素の属性の同異を更に用いて、一の移行単位に含める構成要素を再決定することを特徴とする。

請求項４に係移行単位分析装置は、請求項１乃至３のいずれかに記載の移行単位分析装置において、前記グラフ制御部は、前記結合情報として構成要素間の参照の有無を更に用いて、一の移行単位に含める構成要素を決定することを特徴とする。

請求項５に係移行単位分析装置は、請求項１乃至４のいずれかに記載の移行単位分析装置において、前記グラフ制御部は、グラフベースのｅｍｂｅｄｄｉｎｇ法又はニューラルネットワークを用いて、一の移行単位に含める構成要素を決定することを特徴とする。

請求項６に係移行単位分析方法は、移行単位分析装置で行う移行単位分析方法において、前記移行単位分析装置は、システムを構成する複数の構成要素を構成要素間の関連性に基づき結合したグラフを形成するグラフ形成ステップと、前記複数の構成要素に対して一の移行単位とする一部の構成要素を教示した利用者の教師データと、前記グラフに含まれる構成要素間の結合情報とを用いて、一の移行単位に含める構成要素を決定するグラフ制御ステップと、を行い、前記結合情報は、構成要素間の参照の種類に応じた参照の重要度と、構成要素の配置位置の同異と、の複数の結合情報であり、前記グラフ制御ステップでは、前記複数の結合情報のうち一方の結合情報を用いて一の移行単位に含める構成要素を決定し、当該決定した結果をもとに他方の結合情報を更に用いて一の移行単位に含める構成要素を再決定して、前記複数の結合情報に基づく複数のグラフを統合的な１つのグラフとして処理することを特徴とする。

請求項７に係移行単位分析方法は、移行単位分析装置で行う移行単位分析方法において、前記移行単位分析装置は、システムを構成する複数の構成要素を構成要素間の関連性に基づき結合したグラフを形成するグラフ形成ステップと、前記グラフに含まれる構成要素間の結合情報を用いて、一の移行単位に含める構成要素を決定するグラフ制御ステップと、を行い、前記結合情報は、構成要素間の参照の種類に応じた参照の重要度と、構成要素の配置位置の同異と、の複数の結合情報であり、前記グラフ制御ステップでは、前記複数の結合情報のうち一方の結合情報を用いて一の移行単位に含める構成要素を決定し、当該決定した結果をもとに他方の結合情報を更に用いて一の移行単位に含める構成要素を再決定して、前記複数の結合情報に基づく複数のグラフを統合的な１つのグラフとして処理することを特徴とする。
請求項８に係移行単位分析方法は、請求項６又は７に記載の移行単位分析方法において、前記グラフ制御ステップでは、前記結合情報として構成要素の属性の同異を更に用いて、一の移行単位に含める構成要素を再決定することを特徴とする。

請求項９に係移行単位分析プログラムは、請求項１乃至５のいずれかに記載の移行単位分析装置としてコンピュータを機能させることを特徴とする。

本発明によれば、システム移行に係る人手の作業コストを最小化しつつ、人手の移行単位分析結果に近い分類結果を得ることができる。人手の作業コストを零としつつ、高精度なクラスタリング結果を得ることができる。

第１の実施形態に係る移行単位分析装置の構成を示す図である。第１の実施形態に係る移行単位分析方法の処理フロー（第１の動作例）を示す図である。第１の動作例によるノード分類の例を示す図である。第１の実施形態に係る移行単位分析方法の処理フロー（第２の動作例）を示す図である。第２の動作例によるノード分類の例を示す図である。第１の実施形態に係る移行単位分析方法の処理フロー（第３の動作例）を示す図である。第３の動作例によるノード分類の例を示す図である。第１の実施形態に係る移行単位分析方法の処理フロー（第４の動作例）を示す図である。第４の動作例によるノード分類の例を示す図である。第２の実施形態に係る移行単位分析装置の構成を示す図である。第２の実施形態に係る移行単位分析方法の処理フローを示す図である。第２の実施形態によるノード分類の例を示す図である。グラフ分類部によるノード分類の例を示す図である。

以下、本発明を実施する一実施の形態について図面を用いて説明する。

＜＜本発明の特徴＞＞
本発明は、旧システムから新システムへのシステム移行において、後述する第１の特徴から第６の特徴を用いて移行単位分析を行う。移行単位分析とは、どのサブシステム単位で移行を行うべきかを決定すること、すなわち、システムを構成する複数の構成要素から一の移行単位に含める構成要素を決定することである。

第１の特徴は、人手で移行単位に関する部分的な教示（教師データ）を与えることで、高精度な移行単位分析用の分類を行うことにある。

第２の特徴は、教師データを用いることなく、移行単位をコンピュータが自動で推定することで、高精度な移行単位分析用のクラスタリングを行うことにある。

第３の特徴は、グラフベースのｅｍｂｅｄｄｉｎｇ法又はニューラルネットワークを用いることで、高精度に移行単位を分類・クラスタリングすることにある。

第４の特徴は、構成要素間の参照の有無を元に、移行単位を分類・クラスタリングすることにある。更に、構成要素間の参照の種類の相違による参照の重要度を元に、より高精度に移行単位を分類・クラスタリングすることにある。

第５の特徴は、構成要素のファイル配置関係の同異を元に、移行単位を分類・クラスタリングすることにある。また、第４の特徴を併用して１つの結合したグラフとみなすことで、更に高精度に移行単位を分類・クラスタリングすることにある。

第６の特徴は、構成要素の属性の同異を元に、より更に高精度に移行単位を分類・クラスタリングすることにある。

第３の特徴から第６の特徴は、いずれか１つの特徴のみを用いてもよいし、いずれか２つ以上の特徴を組み合わせて用いてもよいし、全ての特徴を用いてもよい。２つ以上の特徴を用いる場合、それぞれの特徴を利用する順番を任意に入れ替えてもよい。いずれの特徴を用いるか、どの順番で各特徴を用いるかについては、移行単位分析装置の利用者により任意に決定される。

また、第３の特徴で用いるグラフベースのｅｍｂｅｄｄｉｎｇ法及びニューラルネットワークは、学習方法の例であり、他の方法を用いてもよい。いずれの方法を用いるかについても利用者により任意に決定される。

なお、第１の特徴における分類処理と第２の特徴におけるクラスタリング処理は、いずれも対象データ（構成要素）を分割する処理をいうが、対象データに対して教師データが有るか無いかに違いがある。分類とは、教師データがあることを前提とし、当該教師データとして示された正解に従って対象データを分ける処理をいう。一方、クラスタリングとは、教師データがないことを前提とし、対象データから属性を抽出して当該属性を次元軸としたＮ次元空間を定義し、当該空間に対して対象データをプロットしていき、当該空間内で距離が近いもの同士をグループ化して分ける処理をいう。

＜＜第１の実施形態＞＞
第１の実施形態では、システム移行に係る人手の作業コストを最小化しつつ、人手の移行単位分析結果に近い分類結果を得るという第１の目的を達成するため、第１の特徴、第３の特徴〜第６の特徴を用いる。

＜移行単位分析装置１の構成＞
図１は、第１の実施形態に係る移行単位分析装置の構成を示す図である。当該移行単位分析装置１は、グラフ形成部１１と、グラフ分類部１２と、グラフｅｍｂｅｄｄｉｎｇ部１３と、を備えて構成される。

グラフ形成部１１は、移行対象システムに関するシステム情報を入力し、当該システム情報に含まれる所定の情報に基づき、移行対象システムを構成する構成要素間をエッジで結んだグラフを形成する機能を備える。所定の情報とは、例えば、各構成要素の処理順や構成要素間の参照関係等である。

グラフ分類部１２は、グラフ内の構成要素に対して人手で教示された移行単位に関する教師データ、グラフの生データ（グラフ形成部１１で形成されたグラフのグラフ構造情報（構成要素の参照・非参照関係を有する参照・非参照グラフ構造情報を含む）、構成要素の階層的な配置関係を示すファイル配置情報、構成要素が持つ属性情報）、グラフｅｍｂｅｄｄｉｎｇ部１３で行われたグラフｅｍｂｅｄｄｉｎｇ結果を用いて、グラフ内の複数の構成要素を分類する分類処理を行い、当該処理結果を移行対象システムの移行単位分析結果として出力する機能を備える。

グラフｅｍｂｅｄｄｉｎｇ部１３は、参照・非参照グラフ構造情報、ファイル配置情報、属性情報を用い、かつ、グラフベースのｅｍｂｅｄｄｉｎｇ法又はニューラルネットワークを用いて、グラフ内の複数の構成要素についてｅｍｂｅｄｄｉｎｇ処理を行い、その処理結果をグラフ分類部１２に出力する機能を備える。ｅｍｂｅｄｄｉｎｇ処理とは、構成要素間の参照の有無、構成要素間の参照の種類の相違による参照の重要度、構成要素のファイル配置関係の同異、構成要素の属性の同異に基づき、移行単位システムを構成する複数の構成要素を併せる（埋め込む）処理をいう。

かかる移行単位分析装置１の構成は、装置構成の一例であり、例えば、グラフ分類部１２とグラフｅｍｂｅｄｄｉｎｇ部１３とを併せて一のグラフ制御部で実現してもよい。また、上記構成以外に、移行単位分析装置１は、移行対象システムのシステム情報を入力して移行単位分析結果を出力する通信インタフェース、教師データを入力する制御インタフェース（マウス、キーボード、タッチパネル等）、入力及び形成した情報を記憶する記憶部、当該情報を表示する表示部（モニタ等）を備えている。

＜移行単位分析装置１の動作＞
移行単位分析装置１で行う移行単位分析方法の動作について説明する。以降、構成要素の例として機能プログラムとデータベースを用いる。機能プログラムについては機能ノード、データベースについてはＤＢノードと呼ぶ。

〔第１の動作例〕
第１の動作例では、第１の特徴のみを用いる場合について説明する。第１の特徴は、人手で移行単位に関する部分的な教示を与え、当該部分的な教示に基づきグラフ内のノードを分類することにある。

図２は、移行単位分析方法の処理フロー（第１の動作例）を示す図である。

ステップＳ１０１；
グラフ形成部１１は、移行対象システムに関するシステム情報を入力し、当該システム情報に含まれる所定の情報に基づき、当該移行対象システムを構成する機能ノードとＤＢノードとの間をエッジで結んだグラフを形成する。所定の情報とは、例えば各ノードの処理順やノード間の参照関係等であり、少なくともノード間の関連性を示す情報であればよい。その他、第４の特徴、第５の特徴、第６の特徴を用いて形成されたグラフ内のノード間の結合情報でもよい。グラフの例を図３の左側に示す。当該グラフは、Ｆ１〜Ｆ４の機能ノードとＤＢａ〜ＤＢｆのＤＢノードで構成され、例えばＦ１はＤＢａとＤＢｂとそれぞれ関連するためにエッジで結合されている。

ステップＳ１０２；
移行単位分析装置１の利用者が、ある程度の数のクラスを指定し、ステップＳ１０１で形成されたグラフ内の機能ノードとＤＢノードに対して、部分的に、所定のクラスに該当するノードを指定する教示を与える。当該教示が教師データである。図３の左側に示すように、例えば、Ｆ２とＤＢｃが同じクラスＡであることと、Ｆ３とＤＢｅが同じクラスＢであることを教示する。その後、グラフ分類部１２は、利用者より与えられた教師データを入力する。

ステップＳ１０３；
グラフ分類部１２は、ステップＳ１０１で形成されたグラフのグラフ構造情報と、ステップＳ１０３で与えられた教師データとを用いて、当該グラフ内のエッジ情報（結合情報）と教師データとを元に、教師データとして与えられたノード以外のノードを分類し、移行単位分析結果として出力する。図３の右側に示すように、例えば、Ｆ２に結合するＤＢｄについてはクラスＡに分類し、ＤＢｅに結合するＦ４や当該Ｆ４に結合するＤＢｆについてはクラスＢに分類する。例えば、｛Ｆ２，ＤＢｃ，ＤＢｄ｝をクラスＡとし、｛Ｆ１，Ｆ３，Ｆ４，ＤＢａ，ＤＢｂ，ＤＢｅ，ＤＢｆ｝をクラスＢとして分類し、それぞれを一の移行単位として出力する。

以上より、第１の動作例によれば、複数のノードに対して一の移行単位とする一部のノードを教示した利用者の教師データと、グラフに含まれるノード間の結合情報とを用いて、一の移行単位に含めるノードを決定するので、人手の移行単位分析結果に近い分類結果を得ることができる。

（第１の動作例の変形例）
第１の動作例では、移行単位システムが持つオリジナルの情報に基づいて構成されたグラフを用いる場合を例に説明したが、第４の特徴から第６の特徴のうちいずれか１つ以上の特徴を用いて形成されたグラフ、第３の特徴を用いてグラフｅｍｂｅｄｄｉｎｇ部１３から出力されたグラフを用いてもよい。グラフに対して複数の特徴を重畳的に適用することにより、単一の特徴のみを適用する場合よりも、高精度な移行単位分析用の分類を行うことができ、より人の直感に合う分類結果を得ることができる。

〔第２の動作例〕
第２の動作例では、第１の特徴と第３の特徴と第４の特徴を用いる場合について説明する。第３の特徴は、グラフベースのｅｍｂｅｄｄｉｎｇ法又はニューラルネットワークを用いることにある。当該第３の特徴は、最後に説明する。第４の特徴は、構成要素間の参照の有無、及び構成要素間の参照の種類の相違による参照の重要度を元に、移行単位を分類することにある。本動作例は、参照関係がある構成要素群は一の移行単位とし、参照関係がある場合でも参照の重要度（構成要素間の結合度）が弱い構成要素群は分けるという考え方に基づいている。

図４は、移行単位分析方法の処理フロー（第２の動作例）を示す図である。

ステップＳ２０１；
グラフ形成部１１は、移行対象システムに関するシステム情報を入力し、ノード間の参照の有無に基づき、当該移行対象システムにおいて機能ノードからＤＢノードへのリンクをエッジで結んだグラフを形成する。

ステップＳ２０２；
グラフｅｍｂｅｄｄｉｎｇ部１３は、ステップＳ２０１で形成されたグラフの参照・非参照グラフ構造情報を用いて、グラフ内のリンク情報（参照・非参照情報）を元に、グラフ内のノードを分類する。図５の左側に示すように、例えば、｛Ｆ１，Ｆ３，Ｆ４｝→｛ＤＢａ，ＤＢｂ，ＤＢｅ，ＤＢｆ｝というクラスＡと、｛Ｆ２｝→｛ＤＢｃ，ＤＢｄ｝というクラスＢとに分類する。

ステップＳ２０３；
グラフｅｍｂｅｄｄｉｎｇ部１３は、ステップＳ２０１で形成されたグラフからリンクの種類（参照の種類）を特定し、その種類を元に参照の結合度の弱いリンクは重要でないリンクとみなして、当該結合度の弱いリンクを除いたリンクを元にノードを分類する。参照の種類について説明する。機能ノードとＤＢノードの場合、その間の参照関係には、例えば、ｃ（ｃｒｅａｔｅ；データベースを作成すること）、ｒ（ｒｅａｄ；データを読むこと）、ｕ（ｕｐｄａｔｅ；データベースを書き換えること）、ｄ（ｄｅｌｅｔｅ；データを削除すること）の４種類があるとする。移行単位分析において、データの参照を示すｒはデータを更新するｃ，ｕ，ｄよりもノード間の結合度は弱く、一の移行単位とする優先度は低い。そこで、ｒの参照関係を持つリンクについては、ないものとみなす。その結果、図５の右側に示すように、例えば、Ｆ３からＤＢａへの破線で示されたリンクの種類がｒであれば、当該リンクを除外し、｛Ｆ１｝→｛ＤＢａ，ＤＢｂ｝というクラスＡと、｛Ｆ２｝→｛ＤＢｃ，ＤＢｄ｝というクラスＢと、｛Ｆ３，Ｆ４｝→｛ＤＢｅ，ＤＢｆ｝というクラスＣとに分類して、それぞれを一の移行単位として出力する。その後、グラフｅｍｂｅｄｄｉｎｇ部１３は、当該分類結果を、グラフｅｍｂｅｄｄｉｎｇ結果としてグラフ分類部１２に出力する。

ステップＳ２０４；
グラフ分類部１２は、グラフｅｍｂｅｄｄｉｎｇ部１３から出力されたグラフｅｍｂｅｄｄｉｎｇ結果と、利用者より与えられた教師データとを用いて、グラフ内のリンク情報と教師データとを元に、ステップＳ１０３と同様の処理を行う。

以上より、第２の動作例によれば、ノード間の参照の有無と、ノード間の参照の種類の相違による参照の重要度とを用いて、一の移行単位に含めるノードを決定するので、より高精度に移行単位を分類することができ、システム移行に係る人手の作業コストを最小化しつつ、人手の移行単位分析結果に近い分類結果を得ることができる。

〔第３の動作例〕
第３の動作例では、第１の特徴、第３の特徴から第５の特徴を用いる場合について説明する。第５の特徴は、ノードのファイル配置関係の同異を元に、移行単位を分類することにある。本動作例は、ノードファイルが配置されている位置が同一のノード群（同一フォルダに含まれるノード群）は一の移行単位とするという考え方に基づいている。

図６は、移行単位分析方法の処理フロー（第３の動作例）を示す図である。第２の動作例において第４の特徴を用いて行われたステップＳ２０３の分類結果（図５の右図）を用いる。

ステップＳ３０１；
グラフｅｍｂｅｄｄｉｎｇ部１３は、移行対象システムに関するシステム情報からノードのファイル配置情報を取得し、ノードのファイルパスやディレクトリ構造に基づき、機能ノードが属する上位のディレクトリを特定する。例えば、図５の右側に示したＦ１，Ｆ２の機能ノードは同じＤ０１のディレクトリに属し、Ｆ３，Ｆ４の機能ノードは同じＤ０２のディレクトリに属するとする。

ステップＳ３０２；
グラフｅｍｂｅｄｄｉｎｇ部１３は、ステップＳ３０１で特定したディレクトのＩＤを用いて、ディレクトリが同じクラス又はノードについては結合し、ディレクトリが異なるクラス又はノードについては分割する。図７に示すように、例えば、Ｄ０１のクラスＡとクラスＢを結合して｛Ｆ１，Ｆ２｝→｛ＤＢａ，ＤＢｂ，ＤＢｃ，ＤＢｄ｝という新たなクラスＡに分類し、Ｄ０２のクラスＣについてはクラスＢに名称変更して｛Ｆ３，Ｆ４｝→｛ＤＢｅ，ＤＢｆ｝というクラスＢに分類する。その後、グラフｅｍｂｅｄｄｉｎｇ部１３は、当該分類結果を、グラフｅｍｂｅｄｄｉｎｇ結果としてグラフ分類部１２に出力する。

ステップＳ３０３；
グラフ分類部１２は、グラフｅｍｂｅｄｄｉｎｇ部１３から出力されたグラフｅｍｂｅｄｄｉｎｇ結果と、利用者より与えられた教師データとを用いて、グラフ内のリンク情報と教師データとを元に、ステップＳ１０３と同様の処理を行う。

以上より、第３の動作例によれば、ノードの配置位置の同異情報を用いるので、更に高精度に移行単位を分類することができ、システム移行に係る人手の作業コストを最小化しつつ、人手の移行単位分析結果に近い分類結果を得ることができる。また、第４の特徴に基づくグラフを基礎として第５の特徴を用いて分類処理を行うので、第４の特徴と第５の特徴とに基づく１つの結合したグラフが形成されることから、更に高精度に移行単位を分類することができる。

（第３の動作例の変形例１）
第３の動作例では、第４の特徴を用いて分類したグラフを用いる場合について説明したが、移行単位システムが持つオリジナルの情報に基づいて構成されたグラフ（ステップＳ１０１で形成したグラフ）を用いてもよい。この場合、ステップＳ３０２では、クラスの結合処理ではなく、上層のディレクトリが同一であるノードを包含する包含処理を行うこととなる。

（第３の動作例の変形例２）
移行単位分析装置１の利用者は、第４の特徴である参照関係のｒの種類に対する重みＷ１と、第５の特徴であるファイルパスに対する重みＷ２とに対して、移行単位分析を行う優先度・重要度を設定可能である。Ｗ１よりもＷ２の方が大きい場合、先に第５の特徴を用いて分類し、その後に第４の特徴を用いて分類してもよい。

〔第４の動作例〕
第４の動作例では、第１の特徴と第３の特徴と第６の特徴を用いる場合について説明する。第６の特徴は、ノードの属性の同異を元に、移行単位を分類することにある。本動作例は、属性が同一のノード群については一の移行単位とするという考え方に基づいている。

図８は、移行単位分析方法の処理フロー（第４の動作例）を示す図である。

ステップＳ４０１；
グラフ形成部１１は、移行対象システムに関するシステム情報を入力し、当該システム情報に含まれる所定の情報に基づき、当該移行対象システムを構成する機能ノードとＤＢノードとの間をエッジで結んだグラフを形成する。

ステップＳ４０２；
グラフｅｍｂｅｄｄｉｎｇ部１３は、移行対象システムに関するシステム情報を入力し、当該システム情報に含まれるノードの属性情報を参照して、機能ノードに対して付与されている属性の種別を特定する。図９の左側に示すように、例えば、Ｆ１，Ｆ２にはマスタに関する機能であることを示す属性１が付与され、Ｆ３，Ｆ４の機能ノードにはトランザクションに関する機能であることを示す属性２が付与されているとする。

ステップＳ４０３；
グラフｅｍｂｅｄｄｉｎｇ部１３は、ステップＳ４０１で形成されたグラフのグラフ構造情報と、ステップＳ４０２で特定されたノードの属性情報とを用いて、ノードの属性種別を元に、グラフ内のノードを分類する。例えば、Ｆ１，Ｆ２を一のクラスとし、Ｆ３，Ｆ４を一のクラスとする。このとき、グラフ構造情報に含まれるエッジ情報を併せて用いて分類してもよい。

ステップＳ４０４；
移行単位分析装置１の利用者が、ある程度の数のクラスを指定し、グラフ内の機能ノードとＤＢノードとに対して、部分的に、所定のクラスに該当するノードを指定する教示を与える。図９の左側に示すように、例えば、Ｆ２とＤＢｃとが同じクラスＡであることと、Ｆ３とＤＢｅとが同じクラスＢであることを、教師データとして与える。その後、グラフ分類部１２は、利用者より与えられた教師データを入力する。

ステップＳ４０５；
グラフ分類部１２は、ステップＳ４０３で分類された分類結果と、ステップＳ４０４で与えられた教師データとを用いて、グラフ内のノードを分類し、移行単位分析結果として出力する。図９の右側に示すように、例えば、｛Ｆ１，Ｆ２，ＤＢｂ，ＤＢｃ，ＤＢｄ｝をクラスＡとし、｛Ｆ３，Ｆ４，ＤＢａ，ＤＢｅ，ＤＢｆ｝をクラスＢとして、それぞれを一の移行単位として出力する。Ｆ１，Ｆ２にはエッジによる結合関係はないが、属性の種類が同一のため、一の移行単位に含まれることとなる。

以上より、第４の動作例によれば、構成要素の属性の同異情報を用いるので、より更に高精度に移行単位を分類することができ、システム移行に係る人手の作業コストを最小化しつつ、人手の移行単位分析結果に近い分類結果を得ることができる。

（第４の動作例の変形例１）
第４の動作例では、移行単位システムが持つオリジナルの情報に基づいて構成されたグラフを用いる場合について説明したが、第４の特徴を用いて分類したグラフ（ステップＳ２０２，Ｓ２０３によるグラフ）、第４の特徴と第５の特徴を併せて用いて分類したグラフ（ステップＳ３０３によるグラフ）、第５の特徴のみを用いて分類したグラフのうちいずれのグラフを用いてもよい。

（第４の動作例の変形例２）
移行単位分析装置１の利用者は、ノードの属性情報に対して重みＷ３を設定可能である。第４の特徴に係る重みＷ１や第５の特徴に係る重みＷ２との大小関係に基づき、各特徴を用いて行う分類処理の優先度を変更可能である。

（第４の動作例の変形例３）
第４の動作例では、マスタやトランザクションを属性情報の例に用いて説明したが、他の属性情報を用いてもよい。

＜＜第２の実施形態＞＞
次に、第２の実施形態について説明する。第２の実施形態では、人手の作業コストを零としつつ、高精度なクラスタリング結果を得るという第２の目的を達成するため、第２の特徴から第６の特徴を用いる。

＜移行単位分析装置の構成＞
図１０は、第２の実施形態に係る移行単位分析装置の構成を示す図である。移行単位分析装置１は、グラフ形成部１１と、グラフｅｍｂｅｄｄｉｎｇ部１３と、グラフクラスタリング部１４と、を備えて構成される。グラフ形成部１１とグラフｅｍｂｅｄｄｉｎｇ部１３は、第１の実施形態で説明した機能と同様の機能を持つ。

グラフクラスタリング部１４は、教師データを用いることなく、移行対象システムのグラフ構造情報（参照・非参照グラフ構造情報を含む）、ファイル配置情報、属性情報、グラフｅｍｂｅｄｄｉｎｇ結果を用いて、グラフ内の複数の構成要素をクラスタリングするクラスタリング処理を行い、その処理結果を移行対象システムの移行単位分析結果として出力する機能を備える。

＜移行単位分析装置１の動作＞
移行単位分析装置１で行う移行単位分析方法の動作について説明する。ここでは、第２の特徴を用いる場合についてのみ説明する。第３の特徴から第６の特徴を用いる場合の動作については、第１の実施形態と同様である。

図１１は、移行単位分析方法の処理フローを示す図である。

ステップＳ５０１；
グラフ形成部１１は、移行対象システムに関するシステム情報を入力し、当該システム情報に含まれる所定の情報に基づき、当該移行対象システムを構成する機能ノードとＤＢノードとの間をエッジで結んだグラフを形成する。グラフの例を図１２の左側に示す。

ステップＳ５０２；
グラフクラスタリング部１４は、ステップＳ５０１で形成されたグラフのグラフ構造情報を用いて、当該グラフ内のエッジ情報（結合情報）を元に、ノードをクラスタリングし、移行単位分析結果として出力する。図１２の右側に示すように、例えば、｛Ｆ２，ＤＢｃ，ＤＢｄ｝をクラスＡとし、｛Ｆ１，Ｆ３，Ｆ４，ＤＢａ，ＤＢｂ，ＤＢｅ，ＤＢｆ｝をクラスＢとしてクラスタリングし、それぞれを一の移行単位として出力する。

以上より、本動作例によれば、グラフに含まれるノード間の結合情報を用いて、一の移行単位に含めるノードを決定するので、人手の作業コストを零としつつ、高精度なクラスタリング結果を得ることができる。

＜＜各処理部の具体的な処理動作＞＞
移行単位分析装置１を構成する各処理部の処理を具体的に説明する。詳しくは、先の非特許文献１、後述する非特許文献２，３，４等に記載されているため、本願明細書では処理の概要を説明するに留める。当業者であれば、非特許文献１から非特許文献４、当該非特許文献の関連文献等を参照すれば、各処理部を当然に実施可能である。

＜グラフｅｍｂｅｄｄｉｎｇ部１３の処理＞
グラフｅｍｂｅｄｄｉｎｇ部１３の処理について説明する。グラフｅｍｂｅｄｄｉｎｇ部１３は、参照・非参照グラフ構造情報、ファイル配置情報、属性情報を入力とし、グラフベースのｅｍｂｅｄｄｉｎｇ法又はニューラルネットワークを用いて演算を行った後、グラフｅｍｂｅｄｄｉｎｇ結果をグラフ分類部１２に出力する。

〔グラフベースのｅｍｂｅｄｄｉｎｇ法を用いる場合〕
グラフベースのｅｍｂｅｄｄｉｎｇ法を用いる方法について説明する。例えば、「node2vec: Scalable Feature Learning for Networks」（Aditya Grover、外１名、Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining - KDD、2016年）（以降、非特許文献２という）に記載されたnode2vec等のグラフに対するｅｍｂｅｄｄｉｎｇ法を用いる。これにより、各グラフノードの稠密な連続値ベクトル表現を得ることができる。

当該非特許文献２には、オブジェクト集合の特徴を学習する方法が示されており、特定のタスク特有のものはなく、任意のタスクに適用可能であり、かつ、方向性の有無、重みの有無に関わらず適用可能である。それ故、第４の特徴で用いるノード間の参照関係、第５の特徴で用いるノードのファイル配置関係、第６の特徴で用いるノードの属性情報についても、非特許文献２の手法を適用することができる。

例えば、参照・非参照グラフ構造情報から機能ノードとＤＢノードとノード間のエッジ情報を抽出し、ノードの集合をＶ、エッジの集合をＥとして、マッピング関数をｆ：Ｖ→Ｒ^ｄと定義する。そして、ノードの類似性を保持したまま、ノードからｄ次元の特徴へのマッピングすることを考える。具体的には、ノード間の参照の有無、ノード間の参照の種類の相違による参照の重要度、ノードの配置位置の同異、ノードの属性の同異に基づき、類似するノードが近くに存在するようにノードの埋め込みを学習する。

例えば、ノードｕ∈Ｖが与えられたとき、近傍サンプリングＳから導かれるノードｕの近傍ノードをＮ_Ｓ（ｕ）と定義する。当該近傍ノードＮ_Ｓ（ｕ）を予測することによって最適な重みを見つけることとなる。それ故、式（１）の目的関数を最適化することとなる。

式（１）は、非特許文献２の「3.FEATURE LEARNING FRAMEWORK」に記載された（１）の式と同じである。式（１）は、ｆによって与えられた特徴表現を条件とするノードｕのネットワーク近傍Ｎ_Ｓを観測する対数確率を最大化することと同じである。最適化問題を扱いやすくするため、非特許文献２では、式（１）に含まれるＰ_ｒを、式（２），式（３）のように定義している。式（２），式（３）も非特許文献２の同項に記載された式と同じである。

また、非特許文献２には、式（１）の目的関数を最適化するに際し、近傍ノードの分類を決定する具体的な方法として、幅優先探索方法（Breadth-first Sampling）、深さ優先探索方法（Depth-first Sampling）、幅優先探索方法と深さ優先探索方法を円滑に補間するための柔軟な近傍サンプリングを用いるnode2vec法（ランダムウォーク）が記載されており、これらの方法を用いることにより、ノードを分類・クラスタリングすることができる。node2vec法は、幅優先探索方法や深さ優先探索方法よりも、空間的及び時間的要件の両方において計算的に効率的である。

より詳しくは、非特許文献２を参照されたい。本発明の当業者であれば、当該非特許文献２を参照することにより、グラフベースのｅｍｂｅｄｄｉｎｇ法を用いて、各実施形態で説明した第３の特徴から第６の特徴を演算可能である。

〔ニューラルネットワークを用いる場合〕
ニューラルネットワークを用いる方法について説明する。ニューラルネットワークとは、人の脳の学習機構をソフトウェアで模倣した手法であり、例えば、入力層と出力層で構成され、層間はニューロン同士の繋がりの強さを示す重みで表現される。入力層に入力されたデータに対して重みをかけて閾値以上であれば出力層へ出力し、重みの値を変更して同様の処理を繰り返し実行する。

入力層と出力層をノードとみなし、重みとして例えばノードの参照関係の有無に基づき分類・クラスタリングの処理を行い、次にノードファイルの配置位置の同異に基づき同様の処理を行い、最後にノードの属性の同異に基づき同様の処理を行えばよい。それ故、ニューラルネットワークを用いた場合でも、第３の特徴から第６の特徴を演算可能である。

＜グラフ分類部１２の処理＞
グラフ分類部１２の処理について説明する。グラフ分類部１２は、教師データを元に、グラフの生データとグラフｅｍｂｅｄｄｉｎｇ結果とを用いて、グラフ内のノードを分類する。例えば、非特許文献１に記載されたGraph Propagation法、「Semi-Supervised Classification with Graph Convolutional Networks」（Thomas N. Kipf、外１名、Published as a conference paper at ICLR、2017年）（以降、非特許文献３という）に記載されたＧＣＮ（Graph Convolutional Networks）法を用いて、各ノードのクラスを推定する。

非特許文献３のＧＣＮ法では、まず、式（４）に示すように、ノード（Ｘ）に対して畳み込み処理（Ａ（＾））を行い、ＧＣＮの重み（Ｗ）を与えた後に、ＲｅＬＵ関数で非線形化処理を行い、その処理結果をｓｏｆｔｍａｘ関数で改変する処理を行う。式（４）は、非特許文献３の「3 SEMI-SUPERVISED NODE CLASSIFICATION」に記載された（９）の式と同じである。

Ａ（＾）はＮ×Ｎのラプラシアン行列（Ｎはノード数）、ＸはＮ×Ｃの素性行列（Ｃは素性種類数）、Ｗ^（０）はＣ×Ｈの重み行列（Ｈは隠れ層のノード数）、Ｗ^（１）はＨ×Ｆの重み行列（Ｆはクラス数）、ＲｅＬＵはＲｅＬＵ関数、ｓｏｆｔｍａｘはｓｏｆｔｍａｘ関数である。式（４）の右辺を計算することにより、Ｎ×Ｆの行列で表される分類結果Ｚが算出される。式（４）の演算過程のイメージを図１３に示す。

その後、正解データ（教師データ）Ｙに対して損失Ｌ（Ｙ_{ｆ（ｆ＝１〜Ｆ）}，Ｚ_{ｆ（ｆ＝１〜Ｆ）}）を定義した式（５）の損失関数を定義し、当該損失Ｌを、複数のＹと複数のＺとの組に対して計算し、その総和が最小化されるようにクラスＦを決定する。式（５）は、非特許文献３の同項に記載された（１０）の式と同じである。

なお、式（５）に示された一部変数の記号は非特許文献３の（１０）の式と異なるが、これは単に数式を作成する上で使用可能な記号の制限による明細書作成上の都合によるものである。

＜グラフクラスタリング部１４の処理＞
グラフクラスタリング部１４の処理について説明する。グラフクラスタリング部１４は、教師データを用いることなく、グラフの生データとグラフｅｍｂｅｄｄｉｎｇ結果とを用いて、グラフ内のノードをクラスタリングする。例えば、「Fast unfolding of communities in large networks」（Vincent D. Blondel、外３名、2008年）（以降、非特許文献４という）に記載された多段階最適化を用いてクラスタリング可能である。なお、クラスタリング処理については、具体的な処理を説明せずとも当業者によれば実現可能なため、ここでの説明は省略する。詳しくは非特許文献４を参照されたい。

以上、本発明の実施形態について説明した。本実施形態で説明した移行単位分析装置１は、ＣＰＵ、メモリ、ハードディスク等を備えたコンピュータで実現可能である。移行単位分析装置１としてコンピュータを機能させるための移行単位分析プログラム、当該移行単位分析プログラムの記憶媒体を作成することも可能である。

１…移行単位分析装置
１１…グラフ形成部
１２…グラフ分類部（グラフ制御部）
１３…グラフｅｍｂｅｄｄｉｎｇ部（グラフ制御部）
１４…グラフクラスタリング部（グラフ制御部）

Claims

システムを構成する複数の構成要素を構成要素間の関連性に基づき結合したグラフを形成するグラフ形成部と、
前記複数の構成要素に対して一の移行単位とする一部の構成要素を教示した利用者の教師データと、前記グラフに含まれる構成要素間の結合情報とを用いて、一の移行単位に含める構成要素を決定するグラフ制御部と、を備え、
前記結合情報は、構成要素間の参照の種類に応じた参照の重要度と、構成要素の配置位置の同異と、の複数の結合情報であり、
前記グラフ制御部は、
前記複数の結合情報のうち一方の結合情報を用いて一の移行単位に含める構成要素を決定し、当該決定した結果をもとに他方の結合情報を更に用いて一の移行単位に含める構成要素を再決定して、前記複数の結合情報に基づく複数のグラフを統合的な１つのグラフとして処理することを特徴とする移行単位分析装置。
システムを構成する複数の構成要素を構成要素間の関連性に基づき結合したグラフを形成するグラフ形成部と、
前記グラフに含まれる構成要素間の結合情報を用いて、一の移行単位に含める構成要素を決定するグラフ制御部と、を備え、
前記結合情報は、構成要素間の参照の種類に応じた参照の重要度と、構成要素の配置位置の同異と、の複数の結合情報であり、
前記グラフ制御部は、
前記複数の結合情報のうち一方の結合情報を用いて一の移行単位に含める構成要素を決定し、当該決定した結果をもとに他方の結合情報を更に用いて一の移行単位に含める構成要素を再決定して、前記複数の結合情報に基づく複数のグラフを統合的な１つのグラフとして処理することを特徴とする移行単位分析装置。
前記グラフ制御部は、
前記結合情報として構成要素の属性の同異を更に用いて、一の移行単位に含める構成要素を再決定することを特徴とする請求項１又は２に記載の移行単位分析装置。
前記グラフ制御部は、
前記結合情報として構成要素間の参照の有無を更に用いて、一の移行単位に含める構成要素を再決定することを特徴とする請求項１乃至３のいずれかに記載の移行単位分析装置。
前記グラフ制御部は、
グラフベースのｅｍｂｅｄｄｉｎｇ法又はニューラルネットワークを用いて、一の移行単位に含める構成要素を決定することを特徴とする請求項１乃至４のいずれかに記載の移行単位分析装置。
移行単位分析装置で行う移行単位分析方法において、
前記移行単位分析装置は、
システムを構成する複数の構成要素を構成要素間の関連性に基づき結合したグラフを形成するグラフ形成ステップと、
前記複数の構成要素に対して一の移行単位とする一部の構成要素を教示した利用者の教師データと、前記グラフに含まれる構成要素間の結合情報とを用いて、一の移行単位に含める構成要素を決定するグラフ制御ステップと、を行い、
前記結合情報は、構成要素間の参照の種類に応じた参照の重要度と、構成要素の配置位置の同異と、の複数の結合情報であり、
前記グラフ制御ステップでは、
前記複数の結合情報のうち一方の結合情報を用いて一の移行単位に含める構成要素を決定し、当該決定した結果をもとに他方の結合情報を更に用いて一の移行単位に含める構成要素を再決定して、前記複数の結合情報に基づく複数のグラフを統合的な１つのグラフとして処理することを特徴とする移行単位分析方法。
移行単位分析装置で行う移行単位分析方法において、
前記移行単位分析装置は、
システムを構成する複数の構成要素を構成要素間の関連性に基づき結合したグラフを形成するグラフ形成ステップと、
前記グラフに含まれる構成要素間の結合情報を用いて、一の移行単位に含める構成要素を決定するグラフ制御ステップと、を行い、
前記結合情報は、構成要素間の参照の種類に応じた参照の重要度と、構成要素の配置位置の同異と、の複数の結合情報であり、
前記グラフ制御ステップでは、
前記複数の結合情報のうち一方の結合情報を用いて一の移行単位に含める構成要素を決定し、当該決定した結果をもとに他方の結合情報を更に用いて一の移行単位に含める構成要素を再決定して、前記複数の結合情報に基づく複数のグラフを統合的な１つのグラフとして処理することを特徴とする移行単位分析方法。
前記グラフ制御ステップでは、
前記結合情報として構成要素の属性の同異を更に用いて、一の移行単位に含める構成要素を再決定することを特徴とする請求項６又は７に記載の移行単位分析方法。
請求項１乃至５のいずれかに記載の移行単位分析装置としてコンピュータを機能させることを特徴とする移行単位分析プログラム。