JP6866724B2 - 分散コンピューティングシステム、処理選択装置、処理選択方法及びプログラム - Google Patents
分散コンピューティングシステム、処理選択装置、処理選択方法及びプログラム Download PDFInfo
- Publication number
- JP6866724B2 JP6866724B2 JP2017062286A JP2017062286A JP6866724B2 JP 6866724 B2 JP6866724 B2 JP 6866724B2 JP 2017062286 A JP2017062286 A JP 2017062286A JP 2017062286 A JP2017062286 A JP 2017062286A JP 6866724 B2 JP6866724 B2 JP 6866724B2
- Authority
- JP
- Japan
- Prior art keywords
- cost
- processing
- checkpoint
- user
- distributed computing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Retry When Errors Occur (AREA)
Description
・インスタンスを利用するためのリソースの空き状況に関わらず、確実に利用できるが利用料金が高いプラン(オンデマンドインスタンス)
・インスタンスを利用するためのリソースに空きがあるときのみ利用できるが利用料金が安いプラン(スポットインスタンス、オンデマンドインスタンスに比べ30%〜90%割引)
続いて、本発明の第1の実施形態について図面を参照して詳細に説明する。図2は、本発明の第1の実施形態の分散コンピューティングシステムの構成を示す図である。図2を参照すると、管理端末1と、クラウドサービス(基盤)4とが、ネットワーク8を介して接続された構成が示されている。
(1)リスタートした場合の費用(第1の費用)
この費用は、図4の情報を用いて、以下の式により算出できる。
第1の費用=ストレージに保存したサイズ(GB)×ストレージ利用料金($/GB)
(2)最初からやり直す場合の費用(第2の費用)
この費用は、図3の情報を用いて、以下の式により算出できる。
第2の費用=現時点での市場価格($/時間・台)×インスタンスの台数×インスタンスの停止までに処理した時間
なお、後に説明するように、現時点での市場価格($/時間・台)は、ユーザが入力した入札価格と必ずしも一致しないが、分散処理の再開の条件が、入札価格>市場価格となっているため、大きな差異は生じない。同様に、計算装置6の負荷の変化等により、インスタンスの停止までに処理した時間も変わる可能性があるが、上記(1)リスタートした場合の費用(第1の費用)との比較に必要な精度があれば問題ない。
A.「最初から実行した場合の料金」=現時点での市場価格×インスタンス台数×インスタンス停止までに処理した時間
B.「チェックポイント・リスタート時の料金」=ストレージに退避させたサイズ×ストレージの利用料金
(1)「チェックポイント・リスタート時の料金」の方が安い例
計算実行コストデータ記憶部2、ストレージ読み出しコストデータ記憶部3から読み出したデータは、図3、図4の値であるとする。この場合、上記料金A、Bはそれぞれ次の通り算出される。
A.「最初から実行した際の料金」=1($/時間・台)×100 (台)×2(時間)=200($)
B.「チェックポイント・リスタート時の料金」=2000(GB)×0.08($/GB)=160($)
この場合、AがBよりも大きいので、中断時のデータを読み取り再開する方がコストは安くなるので「チェックポイント・リスタート」の方法で処理を行う。
計算実行コストデータ記憶部2、ストレージ読み出しコストデータ記憶部3から読み出したデータは、図6、図7の値であるとする。この場合、上記料金A、Bはそれぞれ次の通り算出される。
A.「最初から実行した際の料金」=0.6($/時間・台)×100 (台)×2(時間)=120($)
B.「チェックポイント・リスタート時の料金」=2000 (GB)×0.08($/GB)=160($)
この場合、AがBよりも小さく、最初から処理を行った方が安いので、「最初から処理を実行」する。ただし、このように何度か最初から処理を行った場合、利用料金が高いプランを用いて確実に一度で処理を終わらせたほうが安い場合があり得るため、「最大再開回数」を適切に設定することが必要になる。
続いて、本発明の第2の実施形態について図面を参照して詳細に説明する。本発明の第2の実施形態は、第1の実施形態のストレージ退避動作に変更を加えたものであり、基本的な構成及び動作は、第1の実施形態と同様である。以下、第1の実施形態との相違点を中心に説明する。
具体的には、以下の通り、「チェックポイント・リスタート時の料金」の額が1/3となる。
2A.「最初から実行した際の料金」=0.6($/時間・台)×100 (台)×2(時間)=120($)
2B.「チェックポイント・リスタート時の料金」=2000/3 (GB)×0.08($/GB)=53.34($)
[第1の形態]
(上記第1の視点による処理選択装置参照)
[第2の形態]
上記した処理選択装置が計算する前記第1の費用は、所定のストレージに退避させた処理途中のデータを読み出す費用を含んで計算されることが好ましい。
[第3の形態]
上記した処理選択装置において、
前記分散コンピューティングシステムを構成する計算装置に冗長配置されていたデータの中から必要なデータを選択して退避し、前記退避したデータを読み出すものとして前記第1の費用を計算することが好ましい。
[第4の形態]
上記した処理選択装置において、
前記処理の中断は、前記分散コンピューティングサービスに対する利用者の入札価格が、市場価格より低くなったことを契機に実施され、
市場価格が、前記利用者の入札価格より低くなったことを契機に前記第1、第2の費用の計算を実行するものとすることができる。
[第5の形態]
上記した処理選択装置において、
前記第2の費用は、利用するインスタンスの台数に、インスタンス停止までの所要時間と、所定の単価とを乗じて計算されることが好ましい。
[第6の形態]
上記した処理選択装置において、
前記利用者に対し、前記第1の費用と、前記第2の費用とをそれぞれ提示し、前記利用者から中断した処理の継続方法を受け付ける手段に代えて、
前記第1の費用と、前記第2の費用とのうち、安い方を選択し、
チェックポイントからリスタートするか否かを決定する手段を備える構成とすることができる。
[第7の形態]
上記した処理選択装置において、
前記利用者から、前記チェックポイントからリスタートする回数の上限の設定を受け付け、
前記チェックポイントからリスタートするか否かを決定した結果、前記チェックポイントからリスタートする回数が上限に達した段階で処理を終了する構成を採ることができる。
[第8の形態]
(上記第2の視点による分散コンピューティングシステム参照)
[第9の形態]
(上記第3の視点による処理選択方法参照)
[第10の形態]
(上記第4の視点によるプログラム参照)
なお、上記第8〜第10の形態は、第1の形態と同様に、第2〜第7の形態に展開することが可能である。
2 計算実行コストデータ記憶部
3 ストレージ読み出しコストデータ記憶部
4 クラウドサービス(基盤)
5 管理サーバ
6、6−1〜6−6 計算装置
7 ストレージ
8 ネットワーク
9 クラウドサービスのネットワーク
10A 処理選択装置
11A 第1の費用計算手段
12A 第2の費用計算手段
13A 処理選択受付手段
20A 分散コンピューティングシステム
Claims (10)
- 従量課金型の分散コンピューティングサービスを利用中に中断した処理を、チェックポイントからリスタートした場合の第1の費用を計算する手段と、
前記チェックポイントからリスタートせずに、最初から前記処理を実行し直した場合の第2の費用を計算する手段と、
利用者に対し、前記第1の費用と、前記第2の費用とをそれぞれ提示し、前記利用者から中断した処理の継続方法を受け付ける手段と、
を備える分散コンピューティングシステムの処理選択装置。 - 前記第1の費用は、所定のストレージに退避させた処理途中のデータを読み出す費用を含んで計算される請求項1の処理選択装置。
- 前記分散コンピューティングシステムを構成する計算装置に冗長配置されていたデータの中から処理再開に必要なデータを選択して退避し、前記退避したデータを読み出すものとして前記第1の費用を計算する請求項1の処理選択装置。
- 前記処理の中断は、前記分散コンピューティングサービスに対する利用者の入札価格が、市場価格より低くなったことを契機に実施され、
市場価格が、前記利用者の入札価格より低くなったことを契機に前記第1、第2の費用の計算を実行する請求項1から3いずれか一の処理選択装置。 - 前記第2の費用は、利用するインスタンスの台数に、インスタンス停止までの所要時間と、所定の単価とを乗じて計算される請求項1から4いずれか一の処理選択装置。
- 前記利用者に対し、前記第1の費用と、前記第2の費用とをそれぞれ提示し、前記利用者から中断した処理の継続方法を受け付ける手段に代えて、
前記第1の費用と、前記第2の費用とのうち、安い方を選択し、
チェックポイントからリスタートするか否かを決定する手段を備える請求項1から5いずれか一の処理選択装置。 - 前記利用者から、前記チェックポイントからリスタートする回数の上限の設定を受け付け、
前記チェックポイントからリスタートするか否かを決定した結果、前記チェックポイントからリスタートする回数が上限に達した段階で処理を終了する請求項6の処理選択装置。 - 従量課金型の分散コンピューティングサービスを利用中に中断した処理を、チェックポイントからリスタートした場合の第1の費用を計算する手段と、
前記チェックポイントからリスタートせずに、最初から前記処理を実行し直した場合の第2の費用を計算する手段と、
利用者に対し、前記第1の費用と、前記第2の費用とをそれぞれ提示し、前記利用者から中断した処理の継続方法を受け付ける手段と、
を備える分散コンピューティングシステムの処理選択装置と、
前記処理選択装置が受け付けた処理の継続方法に従って、分散コンピューティングサービスを提供する管理装置と、を含む分散コンピューティングシステム。 - 分散コンピューティングシステムの処理選択装置が、
従量課金型の分散コンピューティングサービスを利用中に中断した処理を、チェックポイントからリスタートした場合の第1の費用を計算するステップと、
前記チェックポイントからリスタートせずに、最初から前記処理を実行し直した場合の第2の費用を計算するステップと、
利用者に対し、前記第1の費用と、前記第2の費用とをそれぞれ提示し、前記利用者から中断した処理の継続方法を受け付けるステップと、
を含む分散コンピューティングシステムの処理選択方法。 - 分散コンピューティングシステムの処理選択装置を構成するコンピュータに、
従量課金型の分散コンピューティングサービスを利用中に中断した処理を、チェックポイントからリスタートした場合の第1の費用を計算する処理と、
前記チェックポイントからリスタートせずに、最初から前記処理を実行し直した場合の第2の費用を計算する処理と、
利用者に対し、前記第1の費用と、前記第2の費用とをそれぞれ提示し、前記利用者から中断した処理の継続方法を受け付ける処理と、
を実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017062286A JP6866724B2 (ja) | 2017-03-28 | 2017-03-28 | 分散コンピューティングシステム、処理選択装置、処理選択方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017062286A JP6866724B2 (ja) | 2017-03-28 | 2017-03-28 | 分散コンピューティングシステム、処理選択装置、処理選択方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018165860A JP2018165860A (ja) | 2018-10-25 |
JP6866724B2 true JP6866724B2 (ja) | 2021-04-28 |
Family
ID=63922748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017062286A Active JP6866724B2 (ja) | 2017-03-28 | 2017-03-28 | 分散コンピューティングシステム、処理選択装置、処理選択方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6866724B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7206981B2 (ja) * | 2019-02-07 | 2023-01-18 | 日本電気株式会社 | クラスタシステム、その制御方法、サーバ、及びプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02201654A (ja) * | 1989-01-31 | 1990-08-09 | Nec Corp | タイムシェアリングシステムのブレーク割り込み制御方式 |
JP3072048B2 (ja) * | 1996-03-19 | 2000-07-31 | 株式会社東芝 | 計算機システムおよび計算機システムのソフトウェア故障回復方法 |
US9483785B1 (en) * | 2012-05-07 | 2016-11-01 | Amazon Technologies, Inc. | Utilizing excess resource capacity for transcoding media |
JP6123626B2 (ja) * | 2013-10-08 | 2017-05-10 | 富士通株式会社 | 処理再開方法、処理再開プログラムおよび情報処理システム |
-
2017
- 2017-03-28 JP JP2017062286A patent/JP6866724B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018165860A (ja) | 2018-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9280390B2 (en) | Dynamic scaling of a cluster of computing nodes | |
US9374243B1 (en) | Managing operational throughput for shared resources | |
US10447789B2 (en) | Distributed flow control | |
US8612330B1 (en) | Managing bandwidth for shared resources | |
US8533103B1 (en) | Maintaining latency guarantees for shared resources | |
US9755988B2 (en) | Method and system for arbitraging computer resources in a cloud computing environment | |
JP5448032B2 (ja) | リソース管理装置、リソース管理プログラム、およびリソース管理方法 | |
US8321558B1 (en) | Dynamically monitoring and modifying distributed execution of programs | |
US8296419B1 (en) | Dynamically modifying a cluster of computing nodes used for distributed execution of a program | |
JP5334226B2 (ja) | スケジュール管理方法及びスケジュール管理サーバ | |
EP3350702B1 (en) | Probabilistic throttling | |
US10037501B2 (en) | Energy management costs for a data center | |
CN105204924A (zh) | 管理程序执行能力的私有使用 | |
RU2697700C2 (ru) | Равноправное разделение системных ресурсов в исполнении рабочего процесса | |
KR20140111672A (ko) | 가상 머신 풀에서의 리소스 가격 책정 기법 | |
US8881182B1 (en) | Deferred API calls | |
US11915054B2 (en) | Scheduling jobs on interruptible cloud computing instances | |
CN111275415A (zh) | 资源通道的切换方法、装置、设备及存储介质 | |
US20100192153A1 (en) | Selecting executing requests to preempt | |
JP6866724B2 (ja) | 分散コンピューティングシステム、処理選択装置、処理選択方法及びプログラム | |
US11025703B1 (en) | Scheduled execution of instances | |
US9971683B1 (en) | Automatic computer memory management coordination across a group of servers | |
JP6915345B2 (ja) | クラウド管理装置、クラウド管理方法、及びプログラム | |
JP6823257B2 (ja) | ジョブ監視プログラム、ジョブ監視装置及びジョブ監視方法 | |
JP6815975B2 (ja) | Api管理システムおよびapi管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200206 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210112 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210219 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210309 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210322 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6866724 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |