JP7420252B2

JP7420252B2 - スケーリング実行装置、スケーリング実行方法及びプログラム

Info

Publication number: JP7420252B2
Application number: JP2022534880A
Authority: JP
Inventors: 健太篠原; 紀貴堀米; 真生上野
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2020-07-10
Filing date: 2020-07-10
Publication date: 2024-01-23
Anticipated expiration: 2040-07-10
Also published as: JPWO2022009432A1; WO2022009432A1

Description

本発明は、ＣＰＵ（Central Processing Unit）によるアプリケーションの実行環境をパッケージ化したコンテナを、コンテナが実行される計算資源上に効率的に配置するスケーリング実行装置、スケーリング実行方法及びプログラムに関する。

アプリケーション（ＡＰＬ）をコンテナ単位で後述の計算資源上にデプロイ（配置）したＡＰＬコンテナが存在する。このＡＰＬコンテナを計算資源上に必要に応じて増設又は減設するスケーリングを行うアプリケーションの管理システムがある（非特許文献１）。

計算資源は、これに配置されたＡＰＬコンテナを実行する物理サーバや仮想マシン（ＶＭ：Virtual Machine）又はプロジェクト（Project）等による計算環境であり、１又は複数のＡＰＬコンテナを一括りの単位に纏めたものである。このＡＰＬコンテナは、計算資源として稼働する（非特許文献２）。

計算資源としてのＡＰＬコンテナ毎に、サーバ等のＣＰＵの使用量と、ＡＰＬコンテナが計算可能な処理量であるスループットとによるメトリクスを用いて、スケーリングを実行する機能が存在する（非特許文献３）。

図８に、サーバ１０に構成される計算資源１１上にＡＰＬコンテナ１２が１つ配置された場合の構成を示す。つまり、計算資源１１としての１つのＡＰＬコンテナ１２は、サーバメトリクス１３としてのＣＰＵを２０％使用して実現されている。また、ＡＰＬコンテナ１２に係るＡＰＬコンテナメトリクス１４（各図において、「コンテナメトリクス１４」と記載）は、ＣＰＵの使用量が２０％、スループットが１０００である。この場合のサーバ上の合計スループットは１０００となる。なお、ＣＰＵの使用量は、使用率（例えば２０％）で表す。

このようなＡＰＬコンテナメトリクス１４において、ＣＰＵが２０％程度になった際にＡＰＬコンテナを増設するスケーリング機能により、ＡＰＬコンテナを増やすことができる。この増設により計算資源１１のスループットを向上できる。

このような増設により、例えば図９に示すように、計算資源１１上に、第１ＡＰＬコンテナ１２ａ、第２ＡＰＬコンテナ１２ｂ及び第３ＡＰＬコンテナ１２ｃを配置したとする。この３つのＡＰＬコンテナ１２ａ～１２ｃの全ては、サーバメトリクス１３としてのＣＰＵを６０％使用して実現される。また、各ＡＰＬコンテナ１２ａ～１２ｃに係る第１ＡＰＬコンテナメトリクス１４ａ、第２ＡＰＬコンテナメトリクス１４ｂ及び第３ＡＰＬコンテナメトリクス１４ｃは、ＣＰＵの使用量が＝２０％、スループット＝９００である。この際、サーバ１０上の合計スループットは９００×３＝２７００となる。

kubernetes，［online］，［令和２年７月３日検索］，インターネット〈URL: https://kubernetes.io/〉 Red Hat Resource quotas per project，［online］，2020，［令和２年７月３日検索］，インターネット〈URL: https://docs.openshift.com/container-platform/4.1/applications/quotas/quotas-setting-per-project.html〉 kubernetes Horizontal Pod Autoscaler，［online］，June 19,2020，［令和２年７月３日検索］，インターネット〈URL: https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/〉

ところで、図１０に示すように、計算資源１１に第１～第６ＡＰＬコンテナ１２ａ～１２ｆを配置し、この６つのＡＰＬコンテナ１２ａ～１２ｆを稼働させることで、計算資源１１において最大の合計スループット＝４２００を得るスケーリングが可能となるとする。このようなスケーリングを実行する構成を、従来のスケーリングポリシで実現するためには、後述する事前の設計、チューニング及び検証が人手により必要であるため、柔軟性に欠け、容易に実現できないという課題があった。

図１０の例では、第１～第６ＡＰＬコンテナ１２ａ～１２ｆの第１～第６ＡＰＬコンテナメトリクス１４ａ～１４ｆが各々１１．７％程度の最適値になる様にスケーリングを実施すればよい。しかし、その最適値はＡＰＬコンテナ１２ａ～１２ｆの特性だけでなく、計算資源１１のリソース上限にも依存するため、容易に実現でない事前設計が必要となる。

また、計算資源１１上にＡＰＬコンテナを多く配置しすぎると、パフォーマンスが一切向上せず、又は、パフォーマンスが低下する可能性がある。このため、最適な数のＡＰＬコンテナを配置することが必要となるが、従来のスケーリング実行方法によるチューニングでは、次のように、それを容易に実現できない。

図１０に示す計算資源１１としての６つのＡＰＬコンテナ１２ａ～１２ｆを、例えば１つ増やして７つのＡＰＬコンテナにしたとする。６つでは、１つのＡＰＬコンテナのスループット＝７００であり、合計スループットが、６×７００＝４２００である。

しかし、７つでは、各ＡＰＬコンテナのスループットが７００よりも低い例えば５００となってしまう。この理由は、計算資源１１上で各ＡＰＬコンテナがＣＰＵを使って同時に動くので待ち合わせ等が発生し、各ＡＰＬコンテナのスループットが下がってしまうためである。このように、ＡＰＬコンテナを所定以上の７つに増やすと、全ＡＰＬコンテナの合計スループット（７×５００＝３５００）が、増設前（４２００）よりも下がってしまう現象が生じる。このため、容易にチューニングができず、検証も容易にできなくなる。

本発明は、このような事情に鑑みてなされたものであり、サーバ等のＣＰＵに係る計算資源上にＡＰＬコンテナを容易にスケーリングすることを課題とする。

上記課題を解決するため、本発明のスケーリング実行装置は、ＣＰＵ（Central Processing Unit）によるアプリケーションの実行環境をパッケージ化したコンテナが配置され、当該コンテナによる計算処理が実行される計算資源から、当該コンテナに係るスループット以外のＣＰＵ使用量を含むメトリクス値と、当該コンテナのスループットであるパフォーマンス値とを取得する取得部と、前記取得部により前記コンテナのメトリクス値とパフォーマンス値とが関連付けられて記録される記録部と、前記記録部に記録されたコンテナのパフォーマンス値の最大値又は最大値を１倍未満の所定倍数とした値を閾値と定め、前記計算資源に配置されたコンテナのメトリクス値に対するパフォーマンス値が、当該閾値を超えた際にコンテナを増設する判定実行部と、を備え、前記記録部に、前記計算資源に複数のコンテナが配置されている際の各コンテナに係る前記メトリクス値を累積した計算資源メトリクス値と、前記パフォーマンス値を累積した合計パフォーマンス値とが関連付けられて記録されていると共に、前記関連付けによる特性カーブの情報が記録されている場合に、前記判定実行部は、前記記録部に記録された全数ｈより少ない数ｇのコンテナまでを累積した計算資源メトリクス値と合計パフォーマンス値との関連付けによる前記特性カーブ上の交点であるｇ特性点から、全数ｈのコンテナまでを累積した計算資源メトリクス値と合計パフォーマンス値との関連付けによる前記特性カーブ上の交点であるｈ特性点までの合計パフォーマンス値の増加量に、予め定められた所定値を掛けた値を期待増加量と定め、期待増加量に、前回の閾値決定処理で得られた前回閾値を足し合わせた値を新規閾値と定め、前記判定実行部は、前記計算資源上の全数ｈのコンテナの合計パフォーマンス値が、前記新規閾値を超えた際にコンテナを増設することを特徴とする。

本発明によれば、サーバ等のＣＰＵに係る計算資源上にＡＰＬコンテナを容易にスケーリングできる。

本発明の実施形態に係るスケーリング実行装置の構成を示すブロック図である。１ＡＰＬコンテナに係るＡＰＬコンテナメトリクス値とパフォーマンス値との関係を示すグラフである。複数のＡＰＬコンテナに係る計算資源メトリクス値と合計パフォーマンス値との関係を示すグラフである。図３に示す破線枠Ｆｃ内の特性点ｃ２，ｃ３間の特性カーブｋ２の傾きｍを示す図である。スケーリング実行装置を実現するコンピュータの構成を示すブロック図である。計算資源に１つのＡＰＬコンテナが配置されている場合のスケーリング実行装置の処理を説明するためのフローチャートである。計算資源に２つ以上のＡＰＬコンテナが配置されている場合のスケーリング実行装置の処理を説明するためのフローチャートである。サーバに構成される計算資源上にＡＰＬコンテナが１つ配置された場合の構成を示す図である。サーバに構成される計算資源上にＡＰＬコンテナが３つ配置された場合の構成を示す図である。サーバに構成される計算資源上にＡＰＬコンテナが６つ配置された場合の構成を示す図である。

以下、本発明の実施形態を、図面を参照して説明する。但し、本明細書の全図において機能が対応する構成部分には同一符号を付し、その説明を適宜省略する。
＜実施形態の構成＞
図１は、本発明の実施形態に係るスケーリング実行装置の構成を示すブロック図である。

図１に示すスケーリング実行装置（実行装置ともいう）２０は、サーバ等のＣＰＵによる計算資源上にＡＰＬコンテナを増設又は減設するスケーリングを行うものである。実行装置２０は、図８～図１０に示すサーバ１０内に配置されている。この他、実行装置２０は、サーバ１０に通信接続されていてもよい。

実行装置２０は、例えば図８に示す計算資源１１上のＡＰＬコンテナ１２を、図９に示すように３つのＡＰＬコンテナ１２ａ～１２ｃに増設し、又は、図９の３つのＡＰＬコンテナ１２ａ～１２ｆを図８に示す１つのＡＰＬコンテナ１２に減設するスケーリングを行う。なお、ＡＰＬコンテナ１２は、請求項記載のコンテナを構成する。

この実行装置２０は、コンテナメトリクス取得部２１と、計算資源メトリクス取得部２２と、スケーリング判定実行部（判定実行部ともいう）２３と、コンテナ特性記録部（記憶部ともいう）２４とを備えて構成されている。コンテナメトリクス取得部２１及び計算資源メトリクス取得部２２は、請求項記載の取得部を構成する。

計算資源メトリクス取得部２２は、計算資源１１上に配置されたＡＰＬコンテナに応じて、計算資源１１となるサーバ１０のＣＰＵに係るサーバメトリクス１３を取得する。例えば、図８に示すように、計算資源１１上に１つのＡＰＬコンテナ１２が配置された場合、このＡＰＬコンテナ１２のＣＰＵ使用量（２０％）に係るサーバ１０のＣＰＵの使用量（２０％）を取得する。

コンテナメトリクス取得部２１は、計算資源１１（図８参照）のＡＰＬコンテナ１２からＡＰＬコンテナメトリクス１４を取得する。ＡＰＬコンテナメトリクス１４は、ＣＰＵの使用量（２０％）及びメモリ使用量、並びにＡＰＬが計算可能なスループット（１０００）を含むものである。

更に説明すると、コンテナメトリクス取得部２１は、常時作動しており、あるタイミングで、図１に示す１つのＡＰＬコンテナ１２に係るＣＰＵ使用量等のＡＰＬコンテナメトリクス値（図２の横軸）と、縦軸に示すＡＰＬコンテナ１２のスループットであるパフォーマンス値（図２の縦軸）とを取得する。但し、図２に示すＡＰＬコンテナメトリクス値は、ＡＰＬコンテナ１２に係るＣＰＵ使用量等であり、スループットを含まないものとする。

図２はＡＰＬコンテナのＡＰＬコンテナメトリクス値とパフォーマンス値との関係によるＡＰＬコンテナ特性カーブｋ１（特性カーブｋ１）を示す。この特性カーブｋ１によれば、ＡＰＬコンテナメトリクスが１２％の時に、パフォーマンス値が７００であり、２０％の時に１０００である。コンテナメトリクス取得部２１で取得されたＡＰＬコンテナ１２のＡＰＬコンテナメトリクス値とパフォーマンス値とは、関連付けられて記録部２４に記録される。

更に、コンテナメトリクス取得部２１は、例えば図１０に示す計算資源１１上の各ＡＰＬコンテナ１２ａ～１２ｆに係るＣＰＵ使用量等のＡＰＬコンテナメトリクス値を累積した計算資源メトリクス値（図３の横軸）と、各ＡＰＬコンテナ１２ａ～１２ｃのスループットを累積した合計パフォーマンス値（図３の縦軸）とを取得する。但し、図３に示す横軸の計算資源メトリクス値は、計算資源１１のＡＰＬコンテナ１２に係るＣＰＵ使用量等であり、スループットを含まないものとする。また、図１０に示す各ＡＰＬコンテナ１２ａ～１２ｆは同じＡＰＬコンテナであっても、異なるＡＰＬコンテナであってもよい。

図３には、計算資源１１の全てのＡＰＬコンテナ１２ａ～１２ｆによる計算資源メトリクス値（メトリクス値）と合計パフォーマンス値との関係による計算資源特性カーブｋ２（特性カーブｋ２）を示す。

その特性カーブｋ２には、各ＡＰＬコンテナ１２ａ～１２ｆの累積されるメトリクス値と、累積される合計パフォーマンス値との交点である特性点をｃ１，ｃ２，ｃ３，ｃ４，ｃ５，ｃ６で示す。ｃ１は第１ＡＰＬコンテナ１２ａの特性点、ｃ２は特性点ｃ１に累積される第２ＡＰＬコンテナ１２ｂの特性点、ｃ３は特性点ｃ２に累積される第３ＡＰＬコンテナ１２ｃの特性点である。ｃ４は特性点ｃ３に累積される第４ＡＰＬコンテナ１２ｄの特性点、ｃ５は特性点ｃ４に累積される第５ＡＰＬコンテナ１２ｅの特性点、ｃ６は特性点ｃ５に累積される第６ＡＰＬコンテナ１２ｆの特性点である。

例えば、計算資源１１に１つのＡＰＬコンテナ１２ａが配置されている場合、メトリクス値が最高値の２０％の時に、合計パフォーマンス値が１０００となる。また、６つ全てのＡＰＬコンテナ１２ａ～１２ｃが配置されている場合は、メトリクス値が最高値の７０％の時に合計パフォーマンス値が４２００となる。このような、コンテナメトリクス取得部２１で取得された複数のＡＰＬコンテナ１２ａ～１２ｃのＡＰＬコンテナメトリクス値と合計パフォーマンス値とは、関連付けられて記録部２４に記録される。

図３に示す特性カーブｋ２は、計算資源１１においてＡＰＬコンテナ１２ａ～１２ｆが増える程に合計パフォーマンス値が増加するものの、この増加に伴い合計パフォーマンス値の増加率が小さくなり、メトリクス値に対する傾斜角度が緩くなっている。言い換えれば、特性カーブｋ２は、計算資源１１にＡＰＬコンテナ１２ａ～１２ｆを多く配置しすぎると、合計パフォーマンス値がＡＰＬコンテナを増加した割には向上しなくなることを表す。

コンテナ特性記録部２４は、ＡＰＬコンテナ単位でＡＰＬコンテナメトリクス値とパフォーマンス値とを関連付けて記録する。また、記録部２４は、計算資源１１の全ＡＰＬコンテナ１２ａ～１２ｆ（図１０参照）を合計したＡＰＬコンテナメトリクス値と、全ＡＰＬコンテナ１２ａ～１２ｆの合計パフォーマンス値とを関連付けて記録する。

スケーリング判定実行部（判定実行部ともいう）２３は、後述のようにパフォーマンス閾値（閾値ともいう）を定め、図３に示す合計パフォーマンス値が閾値を超えた際に、計算資源１１（図１０参照）へのＡＰＬコンテナ１２の増設を実行する。この増設は、計算資源１１に配置されたＡＰＬコンテナ１２の合計パフォーマンス値が限界値（最大値）を超えると処理できなくなるので、閾値を超えた際に、ＡＰＬコンテナ１２の増設を実行するものである。また、判定実行部２３は、合計パフォーマンス値が閾値以下となった際にＡＰＬコンテナ１２の減設を実行する。

例えば、図１０に示す計算資源１１に１つの第１ＡＰＬコンテナ１２ａのみが配置されているとする。この場合、判定実行部２３は、図３に示すＡＰＬコンテナ１２ａの特性点ｃ１に係る合計パフォーマンス値の最大値＝１０００、又は、その最大値＝１０００を１倍未満の所定倍数とした値（例えば０．９倍の値である９００）をパフォーマンス閾値と定める。そして、判定実行部２３は、合計パフォーマンス値の最大値が閾値を超えた際に、ＡＰＬコンテナ１２ｂの増設を実行する。

また、判定実行部２３は、初期時における合計パフォーマンス値の最大値の取得方法として、ＡＰＬコンテナ１２の稼働開始から、本来の最大値とならない一定期間内の最大値を使用してパフォーマンス閾値を定め、スケーリングを実行してもよい。この他、図３に示すように、計算資源メトリクス値の増分に対する合計パフォーマンス値の増分が減少する傾向を利用してスケーリングを行ってもよい。

次に、図１０に示す計算資源１１に、２つ以上のＡＰＬコンテナ１２ａ～１２ｆが配置されている場合の判定実行部２３の処理について説明する。

判定実行部２３は、コンテナ特性記録部２４に記録されている全数ｈより少ない数ｇのＡＰＬコンテナ１２に対応する図３に示す特性点ｃ２の合計パフォーマンス値から、全数ｈのＡＰＬコンテナ１２に対応する特性点ｃ３の合計パフォーマンス値までの増加量に予め定められた所定値（例えば、固定値の０．６）を掛けた値を、期待する合計パフォーマンス値の増加量（期待増加量）と定める。次に、判定実行部２３は、その期待増加量に、前回求めたパフォーマンス閾値（前回閾値）を足し合わせた値を、新規のパフォーマンス閾値（新規閾値）と定め、この新規閾値を合計パフォーマンス値が超えた際に、特性点ｃ４に係るＡＰＬコンテナ１２の増設を実行する。但し、全数ｈより少ない数ｇは、全数ｈが３つ以上あれば、１つに限らず２つ以上でもよい。なお、特性点ｃ２は、請求項記載のｇ特性点に対応する。特性点ｃ３は、請求項記載のｈ特性点に対応する。

但し、上記の前回閾値は、特性点ｃ１の合計パフォーマンス値から特性点ｃ２の合計パフォーマンス値までの増加量を用いて、上記新規閾値と同様に求めた閾値である。

次に、新規閾値を合計パフォーマンス値が超えた際にＡＰＬコンテナ増設を行う具体例について説明する。

具体例として、図１０に示す計算資源１１上に第１～第３ＡＰＬコンテナ１２ａ～１２ｃが３つ配置された状態を想定する。まず、判定実行部２３によって、直近の合計パフォーマンス値の増加量が分かる。例えば、図３に示すように、特性点ｃ２に係る２つのＡＰＬコンテナ１２ａ，１２ｂから、特性点ｃ３に係る３つ目のＡＰＬコンテナ１２ｃを増加した際の合計パフォーマンス値の増加量が分かる。

次に、判定実行部２３は、その増加量に所定値（例えば０．６）を掛けて求めた期待増加量に、前回の２つ目のＡＰＬコンテナ１２ｂから３つ目のＡＰＬコンテナ１２ｃを増加した際に求めた前回閾値を足し合わせて新規閾値を求める。判定実行部２３は、その新規閾値を、第３ＡＰＬコンテナ１２ｃの合計パフォーマンス値が超えたと判定した際に、特性点ｃ４に係る第４ＡＰＬコンテナ１２ｄを増加する。

この判定実行部２３によるＡＰＬコンテナ１２の増設により、次のような処理が可能となる。但し、ＡＰＬコンテナ１２単位のＣＰＵ使用量等のメトリクス値（計算資源メトリクス値）が、例えば図１０に示す１１．７％であることが増設に最適な条件であるとする。

上述した判定実行部２３の処理によれば、上記の最適な条件をシステム管理者が知らなくても、判定実行部２３が、最適な台数のＡＰＬコンテナ１２となるまで、自動的に１つずつＡＰＬコンテナ１２を増設するスケールアウトが可能となる。

但し、上述した所定値は、固定値でもよいし、ＡＰＬコンテナ数が増えるに従い減少する値でもよい。例えば、図３に特性カーブｋ２で示すように、ＡＰＬコンテナ数が増える程に、合計パフォーマンス値の増加量が減少してゆくので、この徐々に減少する過程を踏まえて、所定値を例えば０．６と定めてもよい。

また、所定値は、ＡＰＬコンテナ増加前（前回）の増加量だけでなく、前々回の増加量を更に用いて定めてもよい。例えば、特性点ｃ３から特性点ｃ４に上げる新規閾値として、前回の特性点ｃ２から特性点ｃ３に上げる時の増加量だけでなく、前々回の特性点ｃ１から特性点ｃ２に上げる時の増加量も加味して新規閾値を定める。即ち、増加量は前々回から前回、今回と、ＡＰＬコンテナ数が増加するに従い小さくなって行くので、この変動傾向を用いて所定値を定めてもよい。

更に、所定値は、図４に一例を示す傾きｍを用いて定めてもよい。図４は、図３に示す破線枠Ｆｃ内の特性点ｃ２，ｃ３間の特性カーブｋ２の傾きｍを示す図である。図４に示すように、特性点ｃ２，ｃ３間における計算資源メトリクス値の増加量Δｘに対する合計パフォーマンス値の増加量Δｙの比率が、特性カーブｋ２の傾きｍとなる。この傾きｍをパラメータとして用いて、所定値を定めてもよい。

例えば、図３に示す０から特性点ｃ１までの特性カーブｋ２が最も急峻となる時の傾きｍを「１」とした際に、これよりも緩くなる特性点ｃ２から特性点ｃ３までの傾きｍの「０．６」を、所定値と定めてもよい。

この他、判定実行部２３は、上述したようにパフォーマンス閾値が一度でも決定された場合、この決定以降のスケーリング判定において、その決定済みの閾値を用いてＡＰＬコンテナ１２の増設又は減設を行ってもよい。又は、増設又は減設の都度、閾値を決定してもよい。

＜ハードウェア構成＞
上述した実施形態に係るスケーリング実行装置２０は、例えば図５に示すような構成のコンピュータ１００によって実現される。図５に示すコンピュータ１００は、ＣＰＵ（Central Processing Unit）１０１、ＲＯＭ（Read Only Memory）１０２、ＲＡＭ（Random Access Memory）１０３、ＨＤＤ（Hard Disk Drive）１０４、入出力Ｉ／Ｆ（Inter Face）１０５、通信Ｉ／Ｆ（Inter Face）１０６、及びメディアＩ／Ｆ１０７を有する。

ＣＰＵ１０１は、ＲＯＭ１０２又はＨＤＤ１０４に記憶されたプログラムに基づき作動し、各機能部の制御を行う。ＲＯＭ１０２は、コンピュータ１００の起動時にＣＰＵ１０１により実行されるブートプログラムや、コンピュータ１００のハードウェアに係るプログラム等を記憶する。

ＣＰＵ１０１は、入出力Ｉ／Ｆ１０５を介して、プリンタやディスプレイ等の出力装置１１１及び、マウスやキーボード等の入力装置１１０を制御する。ＣＰＵ１０１は、入出力Ｉ／Ｆ１０５を介して、入力装置１１０からデータを取得し、又は、生成したデータを出力装置１１１へ出力する。

ＨＤＤ１０４は、ＣＰＵ１０１により実行されるプログラム及び当該プログラムによって使用されるデータ等を記憶する。通信Ｉ／Ｆ１０６は、通信網１１２を介して図示せぬ他の装置からデータを受信してＣＰＵ１０１へ出力し、また、ＣＰＵ１０１が生成したデータを、通信網１１２を介して他の装置へ送信する。

メディアＩ／Ｆ１０７は、記録媒体１１３に格納されたプログラム又はデータを読み取り、ＲＡＭ１０３を介してＣＰＵ１０１へ出力する。ＣＰＵ１０１は、目的の処理に係るプログラムを、メディアＩ／Ｆ１０７を介して記録媒体１１３からＲＡＭ１０３上にロードし、ロードしたプログラムを実行する。記録媒体１１３は、ＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto Optical disk）等の光磁気記録媒体、磁気記録媒体、導体メモリテープ媒体又は半導体メモリ等である。

例えば、コンピュータ１００が実施形態に係るスケーリング実行装置２０として機能する場合、コンピュータ１００のＣＰＵ１０１は、ＲＡＭ１０３上にロードされたプログラムを実行することにより、スケーリング実行装置２０の機能を実現する。また、ＨＤＤ１０４には、ＲＡＭ１０３内のデータが記憶される。ＣＰＵ１０１は、目的の処理に係るプログラムを記録媒体１１３から読み取って実行する。この他、ＣＰＵ１０１は、他の装置から通信網１１２を介して目的の処理に係るプログラムを読み込んでもよい。

＜実施形態の動作＞
次に、本実施形態に係るスケーリング実行装置２０によるＡＰＬコンテナ増設の動作を説明する。

最初に、図８に示すように、計算資源１１に、１つのＡＰＬコンテナ１２が配置されている場合の判定実行部２３の処理について、図６のフローチャートを参照して説明する。

図６に示すステップＳ１において、図８に示す計算資源１１として１つのＡＰＬコンテナ１２が配置されたとする。

ステップＳ２において、計算資源メトリクス取得部２２は、計算資源１１上に配置されたＡＰＬコンテナ１２から、計算資源１１となるサーバ１０のＣＰＵの使用量（２０％）に係るサーバメトリクス１３を取得する。

ステップＳ３において、コンテナメトリクス取得部２１は、計算資源１１の１つのＡＰＬコンテナ１２に係る図２に横軸で示すＣＰＵ使用量等のＡＰＬコンテナメトリクス値と、図２に縦軸で示すＡＰＬコンテナ１２のスループットであるパフォーマンス値とを取得する。

ステップＳ４において、コンテナメトリクス取得部２１は、上記ステップＳ３で取得したＡＰＬコンテナ１２単位のＡＰＬコンテナメトリクス値とパフォーマンス値とを関連付けて、記録部２４に記録する。

ステップＳ５において、スケーリング判定実行部２３は、図２に示すＡＰＬコンテナ１２のパフォーマンス値の最大値＝１０００の所定倍数の値（例えば０．９倍の値である９００）をパフォーマンス閾値と定める。

ステップＳ６において、判定実行部２３は、ＡＰＬコンテナ１２の合計パフォーマンス値の最大値が、閾値を超えたか否かを判断する。この判断の結果、超えた際に、ステップＳ７において、判定実行部２３は、ＡＰＬコンテナ１２の増設を実行する。

次に、図１０に示すように、計算資源１１に、２つ以上のＡＰＬコンテナ１２ａ～１２ｆが配置されている場合の判定実行部２３の処理について、図７に示すフローチャートを参照して説明する。

但し、図１０に示す計算資源１１において第１～第３ＡＰＬコンテナ１２ａ～１２ｃが配置されているとする。この際に、コンテナ特性記録部２４（図１）には、３つのＡＰＬコンテナ１２ａ～１２ｃに係るＡＰＬコンテナメトリクス値を累積した計算資源メトリクス値（図３の横軸参照）と、パフォーマンス値を累積した合計パフォーマンス値（図３の縦軸参照）とが関連付けられて記録されている。この記録には、図３に示す特性カーブｋ２上の特性点ｃ１，ｃ２，ｃ３の情報も含まれている。また、その記録は、コンテナメトリクス取得部２１及び計算資源メトリクス取得部２２によって行われたとする。

図７に示すステップＳ１１において、判定実行部２３は、記録部２４から必要な情報を読み込んで、パフォーマンス閾値としての新規閾値を、次のように決定する。即ち、判定実行部２３は、図３に示す特性点ｃ２の合計パフォーマンス値から、特性点ｃ３の合計パフォーマンス値までの増加量に予め定められた所定値＝０．６を掛けた値を、期待する合計パフォーマンス値の増加量（期待増加量）と定める。次に、判定実行部２３は、その期待増加量に前回閾値を足し合わせた値を、新規閾値と定める。

ステップＳ１２において、判定実行部２３は、３つのＡＰＬコンテナ１２ａ～１２ｃの合計パフォーマンス値が、上記の新規閾値を超えたか否かを判定する。超えたと判定された場合、ステップＳ１３において、判定実行部２３は、第４ＡＰＬコンテナ１２ｄの増設を実行する。

この増設後、ステップＳ１４において、判定実行部２３は、４つのＡＰＬコンテナ１２ａ～１２ｄの合計パフォーマンス値が新規閾値以下となったか否かを判定する。新規閾値以下となったと判定された場合、ステップＳ１５において、判定実行部２３は、第４ＡＰＬコンテナ１２ｄを減設する処理を行う。

＜実施形態の効果＞
このような本実施形態のスケーリング実行装置２０によれば、次のような効果が得られる。

（１ａ）実行装置２０は、ＣＰＵによるアプリケーションの実行環境をパッケージ化したＡＰＬコンテナ１２が配置され、ＡＰＬコンテナ１２による計算処理が実行される計算資源１１から、ＡＰＬコンテナ１２に係るスループット以外のＣＰＵ使用量を含むメトリクス値と、ＡＰＬコンテナ１２のスループットであるパフォーマンス値とを取得するコンテナメトリクス取得部２１及び計算資源メトリクス取得部２２による取得部を備える。

また、実行装置２０は、取得部によりＡＰＬコンテナ１２のメトリクス値とパフォーマンス値とが関連付けられて記録される記録部２４を備える。更に、実行装置２０は、記録部２４に記録されたＡＰＬコンテナ１２のパフォーマンス値の最大値又は最大値を１倍未満の所定倍数とした値を閾値と定め、計算資源１１に配置されたＡＰＬコンテナ１２のメトリクス値に対するパフォーマンス値が、当該閾値を超えた際にＡＰＬコンテナ１２を増設する判定実行部２３を備える構成とした。

この構成によれば、自動的にＡＰＬコンテナ１２を増設するスケーリングが可能となる。つまり、サーバ等のＣＰＵに係る計算資源１１上にＡＰＬコンテナ１２を容易にスケーリングできる。

（２ａ）記録部２４に、計算資源１１に複数のＡＰＬコンテナ１２が配置されている際の各ＡＰＬコンテナ１２に係るメトリクス値を累積した計算資源メトリクス値と、パフォーマンス値を累積した合計パフォーマンス値とが関連付けられて記録されていると共に、関連付けによる特性カーブｋ２の情報が記録されている。

この場合に、判定実行部２３は、記録部２４に記録された全数ｈより少ない数ｇのＡＰＬコンテナ１２までを累積した計算資源メトリクス値と合計パフォーマンス値との関連付けによる特性カーブｋ２上の交点であるｇ特性点から、全数ｈのＡＰＬコンテナ１２までを累積した計算資源メトリクス値と合計パフォーマンス値との関連付けによる特性カーブ上の交点であるｈ特性点までの合計パフォーマンス値の増加量に、予め定められた所定値を掛けた値を期待増加量と定める。次に、判定実行部２３は、その期待増加量に、前回の閾値決定処理で得られた前回閾値を足し合わせた値を新規閾値と定める。そして、判定実行部２３は、計算資源１１上の全数ｈのＡＰＬコンテナ１２の合計パフォーマンス値が、新規閾値を超えた際にＡＰＬコンテナ１２を増設する構成とした。

この構成によれば、計算資源１１において、最適な台数のＡＰＬコンテナ１２となるまで、自動的に１つずつＡＰＬコンテナ１２を増設するスケーリングが可能となる。

（３ａ）判定実行部２３は、計算資源１１上の全ＡＰＬコンテナ１２の合計パフォーマンス値が、新規閾値以下となった際にＡＰＬコンテナ１２を減設する構成とした。

この構成によれば、計算資源１１において、最適な台数のＡＰＬコンテナ１２となるまで、自動的に１つずつＡＰＬコンテナ１２を減設するスケーリングが可能となる。

（４ａ）所定値は、特性カーブｋ２上の特性点間における計算資源メトリクス値の増加量Δｘに対する合計パフォーマンス値の増加量Δｙの比率である特性カーブｋ２の傾きをパラメータとして定める構成とした。

この構成によれば、特性カーブの傾きをパラメータとして所定値を定めるので、新規閾値を適正に定めることができる。このため、ＡＰＬコンテナ１２の増設又は減設を適正に行うことができる。

また、本実施形態のコンピュータで実行されるプログラムについて説明する。コンピュータは、ＣＰＵによるアプリケーションの実行環境をパッケージ化したＡＰＬコンテナ１２を、ＡＰＬコンテナ１２が実行される計算資源１１上に効率的に配置する処理を行うスケーリング実行装置２０であるとする。

このプログラムは、上記コンピュータを、ＣＰＵによるアプリケーションの実行環境をパッケージ化したＡＰＬコンテナ１２が配置され、当該ＡＰＬコンテナ１２による計算処理が実行される計算資源１１から、ＡＰＬコンテナ１２に係るスループット以外のＣＰＵ使用量を含むメトリクス値と、ＡＰＬコンテナ１２のスループットであるパフォーマンス値とを取得する手段、取得によるＡＰＬコンテナ１２のメトリクス値とパフォーマンス値とが関連付けられて記録部に記録される手段、記録されたＡＰＬコンテナ１２のパフォーマンス値の最大値又は最大値を１倍未満の所定倍数とした値を閾値と定め、計算資源１１に配置されたＡＰＬコンテナ１２のメトリクス値に対するパフォーマンス値が、当該閾値を超えた際にＡＰＬコンテナ１２を増設する手段として機能させる。

このプログラムによれば、上述したスケーリング実行装置２０の効果と同様に、自動的にＡＰＬコンテナ１２を増設するスケーリングを行うことができる。

＜効果＞
（１）ＣＰＵ（Central Processing Unit）によるアプリケーションの実行環境をパッケージ化したコンテナが配置され、当該コンテナによる計算処理が実行される計算資源から、当該コンテナに係るスループット以外のＣＰＵ使用量を含むメトリクス値と、当該コンテナのスループットであるパフォーマンス値とを取得する取得部と、前記取得部により前記コンテナのメトリクス値とパフォーマンス値とが関連付けられて記録される記録部と、前記記録部に記録されたコンテナのパフォーマンス値の最大値又は最大値を１倍未満の所定倍数とした値を閾値と定め、前記計算資源に配置されたコンテナのメトリクス値に対するパフォーマンス値が、当該閾値を超えた際にコンテナを増設する判定実行部とを備えることを特徴とするスケーリング実行装置である。

この構成によれば、自動的にコンテナを増設するスケーリングが可能となる。つまり、サーバ等のＣＰＵに係る計算資源上にコンテナを容易にスケーリングできる。

（２）前記記録部に、前記計算資源に複数のコンテナが配置されている際の各コンテナに係る前記メトリクス値を累積した計算資源メトリクス値と、前記パフォーマンス値を累積した合計パフォーマンス値とが関連付けられて記録されていると共に、前記関連付けによる特性カーブの情報が記録されている場合に、前記判定実行部は、前記記録部に記録された全数ｈより少ない数ｇのコンテナまでを累積した計算資源メトリクス値と合計パフォーマンス値との関連付けによる前記特性カーブ上の交点であるｇ特性点から、全数ｈのコンテナまでを累積した計算資源メトリクス値と合計パフォーマンス値との関連付けによる前記特性カーブ上の交点であるｈ特性点までの合計パフォーマンス値の増加量に、予め定められた所定値を掛けた値を期待増加量と定め、期待増加量に、前回の閾値決定処理で得られた前回閾値を足し合わせた値を新規閾値と定め、前記判定実行部は、前記計算資源上の全数ｈのコンテナの合計パフォーマンス値が、前記新規閾値を超えた際にコンテナを増設することを特徴とする上記（１）に記載のスケーリング実行装置である。

この構成によれば、計算資源において、最適な台数のコンテナとなるまで、自動的に１つずつコンテナを増設するスケーリングが可能となる。

（３）前記判定実行部は、前記計算資源上の全コンテナの合計パフォーマンス値が、前記新規閾値以下となった際にコンテナを減設することを特徴とする上記（２）に記載のスケーリング実行装置である。

この構成によれば、計算資源において、最適な台数のコンテナとなるまで、自動的に１つずつコンテナを減設するスケーリングが可能となる。

（４）前記所定値は、前記特性カーブ上の特性点間における前記計算資源メトリクス値の増加量Δｘに対する前記合計パフォーマンス値の増加量Δｙの比率である特性カーブの傾きをパラメータとして定めることを特徴とする上記（２）又は（３）に記載のスケーリング実行装置である。

この構成によれば、特性カーブの傾きをパラメータとして所定値を定めるので、新規閾値を適正に定めることができる。このため、コンテナの増設又は減設を適正に行うことができる。

その他、具体的な構成について、本発明の主旨を逸脱しない範囲で適宜変更が可能である。

２０スケーリング実行装置
２１コンテナメトリクス取得部（取得部）
２２計算資源メトリクス取得部（取得部）
２３スケーリング判定実行部（判定実行部）
２４コンテナ特性記録部（記録部）
ｃ１～ｃ６特性点
ｋ１，ｋ２特性カーブ

Claims

ＣＰＵ（Central Processing Unit）によるアプリケーションの実行環境をパッケージ化したコンテナが配置され、当該コンテナによる計算処理が実行される計算資源から、当該コンテナに係るスループット以外のＣＰＵ使用量を含むメトリクス値と、当該コンテナのスループットであるパフォーマンス値とを取得する取得部と、
前記取得部により前記コンテナのメトリクス値とパフォーマンス値とが関連付けられて記録される記録部と、
前記記録部に記録されたコンテナのパフォーマンス値の最大値又は最大値を１倍未満の所定倍数とした値を閾値と定め、前記計算資源に配置されたコンテナのメトリクス値に対するパフォーマンス値が、当該閾値を超えた際にコンテナを増設する判定実行部と、を備え、
前記記録部に、前記計算資源に複数のコンテナが配置されている際の各コンテナに係る前記メトリクス値を累積した計算資源メトリクス値と、前記パフォーマンス値を累積した合計パフォーマンス値とが関連付けられて記録されていると共に、前記関連付けによる特性カーブの情報が記録されている場合に、
前記判定実行部は、前記記録部に記録された全数ｈより少ない数ｇのコンテナまでを累積した計算資源メトリクス値と合計パフォーマンス値との関連付けによる前記特性カーブ上の交点であるｇ特性点から、全数ｈのコンテナまでを累積した計算資源メトリクス値と合計パフォーマンス値との関連付けによる前記特性カーブ上の交点であるｈ特性点までの合計パフォーマンス値の増加量に、予め定められた所定値を掛けた値を期待増加量と定め、期待増加量に、前回の閾値決定処理で得られた前回閾値を足し合わせた値を新規閾値と定め、
前記判定実行部は、前記計算資源上の全数ｈのコンテナの合計パフォーマンス値が、前記新規閾値を超えた際にコンテナを増設する
ことを特徴とするスケーリング実行装置。
前記判定実行部は、前記計算資源上の全コンテナの合計パフォーマンス値が、前記新規閾値以下となった際にコンテナを減設する
ことを特徴とする請求項１に記載のスケーリング実行装置。
前記所定値は、前記特性カーブ上の特性点間における前記計算資源メトリクス値の増加量Δｘに対する前記合計パフォーマンス値の増加量Δｙの比率である特性カーブの傾きをパラメータとして定める
ことを特徴とする請求項１又は２に記載のスケーリング実行装置。
スケーリング実行装置によるスケーリング実行方法であって、
前記スケーリング実行装置は、
ＣＰＵによるアプリケーションの実行環境をパッケージ化したコンテナが配置され、当該コンテナによる計算処理が実行される計算資源から、当該コンテナに係るスループット以外のＣＰＵ使用量を含むメトリクス値と、当該コンテナのスループットであるパフォーマンス値とを取得する取得ステップと、
前記取得による前記コンテナのメトリクス値とパフォーマンス値とが関連付けられて記録部に記録される記憶ステップと、
前記記録されたコンテナのパフォーマンス値の最大値又は最大値を１倍未満の所定倍数とした値を閾値と定め、前記計算資源に配置されたコンテナのメトリクス値に対するパフォーマンス値が、当該閾値を超えた際にコンテナを増設する判定実行ステップと、を実行し、
前記記録部に、前記計算資源に複数のコンテナが配置されている際の各コンテナに係る前記メトリクス値を累積した計算資源メトリクス値と、前記パフォーマンス値を累積した合計パフォーマンス値とが関連付けられて記録されていると共に、前記関連付けによる特性カーブの情報が記録されている場合に、
前記判定実行ステップにおいて、前記記録部に記録された全数ｈより少ない数ｇのコンテナまでを累積した計算資源メトリクス値と合計パフォーマンス値との関連付けによる前記特性カーブ上の交点であるｇ特性点から、全数ｈのコンテナまでを累積した計算資源メトリクス値と合計パフォーマンス値との関連付けによる前記特性カーブ上の交点であるｈ特性点までの合計パフォーマンス値の増加量に、予め定められた所定値を掛けた値を期待増加量と定め、期待増加量に、前回の閾値決定処理で得られた前回閾値を足し合わせた値を新規閾値と定め、前記計算資源上の全数ｈのコンテナの合計パフォーマンス値が、前記新規閾値を超えた際にコンテナを増設する
ことを特徴とするスケーリング実行方法。
コンピュータを、請求項１～３の何れか１項に記載のスケーリング実行装置として機能させるためのプログラム。