TWI510931B

TWI510931B - 用於一叢集運算系統之主裝置、從屬裝置及其運算方法

Info

Publication number: TWI510931B
Application number: TW103129437A
Authority: TW
Inventors: Chi-Tien Yeh; xing-yu Chen; Yuh-Jye Lee; Hsing-Kuo Pao
Original assignee: Inst Information Industry
Priority date: 2014-08-27
Filing date: 2014-08-27
Publication date: 2015-12-01
Also published as: US20160062929A1; CN105511955A; TW201608382A; JP6001690B2; JP2016048536A

Description

用於一叢集運算系統之主裝置、從屬裝置及其運算方法

本發明關於一種主裝置、從屬裝置及其運算方法。更具體而言，本發明關於一種用於一叢集運算系統之主裝置、從屬裝置及其運算方法。

對於巨量資料運算(big data computations)而言，叢集運算技術是一種相當有效的解決方案。一般而言，叢集運算乃指將多個運算單元聚集為一叢集，並透過該等運算單位的協同合作來完成一項工作(job)。在運作上，一叢集運算系統通常包含一主裝置(master device)及複數從屬裝置(slave devices)，其中該主裝置用以分配一工作給該等從屬裝置，而各該從屬裝置用以產生容器(containers)以執行對應至該工作之被分配的任務。因此，為了避免資源浪費，在進行巨量資料運算時，一叢集運算系統必須適當地進行資源分配。

普遍來說，傳統的叢集運算系統會因以下問題而無法有效地進行資源分配。首先，傳統的從屬裝置所產生的容器，其容器規格(包含中央處理單元規格及記憶體規格)都是固定的，故容易因工作的特性不同，而造成資源浪費。例如，當一工作的運算需求低於一容器的規格，則該容器將因無法完整被利用而造成資源浪費。再者，由於每一個容器的容器規格都是固定的，傳統的從屬裝置所能產生的容器總數也是固定的，故容易造成資源閒置。例如，當運算一工作所需的容器數量低於容器總數，則多餘的容器數量將造成資源閒置。另外，由於每一個容器的容器規格都是固定的，故當複數從屬裝置具有不同的裝置效能時，將容易造成資源分配不當。例如，當二從屬裝置的容器規格相同但裝置效能不同時，則因二者處理效率不同而造成資源分配不當。

有鑑於此，如何針對傳統的叢集運算系統提供一種有效的資源分配技術，確實為本發明所屬技術領域的一項重大需求。

本發明之一目的乃是針對傳統的叢集運算系統提供一種有效的資源分配技術。

為達上述目的，本發明提供一種用於一叢集運算系統(cluster computing system)之主裝置(master device)。該主裝置包含一連接介面及一處理器。該連接介面用以與至少一從屬裝置(slave device)連接。該處理器電性連接至該連接介面，並用以接收該從屬裝置的裝置資訊，根據該裝置資訊及一工作(job)為該從屬裝置選擇一資源特徵模型，根據該資源特徵模型估測該從屬裝置的一容器組態參數，傳送該容器組態參數至該從屬裝置，以及分配該工作至該從屬裝置。

為達上述目的，本發明亦提供一種用於一叢集運算系統之從屬裝置。該從屬裝置包含一連接介面及一處理器。該連接介面用以與一主裝置連接。該處理器電性連接至該連接介面，並用以傳送裝置資訊至該主裝置，自該主裝置接收該主裝置分配的一工作和一容器組態參數，根據該容器組態參數產生至少一容器以運算該工作，以及根據對應至該工作之工作資訊(job information)及一規格檔(metric file)建立一資源特徵模型。

為達上述目的，本發明更提供一種用於一叢集運算系統中一主裝置的運算方法。該主裝置包含一連接介面及一處理器，且該連接介面用以與至少一從屬裝置連接。該運算方法包含下列步驟：(A)由該處理器接收該從屬裝置的裝置資訊；(B)由該處理器根據該裝置資訊及一工作為該從屬裝置選擇一資源特徵模型；(C)由該處理器根據該資源特徵模型估測該從屬裝置的一容器組態參數；(D)由該處理器傳送該容器組態參數至該從屬裝置；以及(E)由該處理器分配該工作至該從屬裝置。

為達上述目的，本發明還提供一種用於一叢集運算系統中一從屬裝置的運算方法。該從屬裝置包含一連接介面及一處理器，且該連接介面用以與一主裝置連接。該運算方法包含下列步驟：(A)由該處理器傳送裝置資訊至該主裝置；(B)由該處理器自該主裝置接收該主裝置分配的一工作和一容器組態參數； (C)由該處理器根據該容器組態參數產生至少一容器以運算該工作；以及(D)由該處理器根據對應至該工作之工作資訊及一規格檔建立一資源特徵模型。

綜上所述，本發明提供了一種用於一叢集運算系統之主裝置、從屬裝置及其運算方法。根據本發明，一主裝置接收各個從屬裝置所傳送的裝置資訊，根據該裝置資訊及一工作為各個從屬裝置選擇一資源特徵模型，根據各個資源特徵模型估測相對應的從屬裝置的一容器組態參數，傳送各個容器組態參數至相對應的從屬裝置，以及分配該工作至該等從屬裝置。根據本發明，一從屬裝置傳送其裝置資訊至一主裝置，自該主裝置接收該主裝置分配的一工作和一容器組態參數，根據該容器組態參數產生至少一容器以運算該工作，以及根據對應至該工作之工作資訊及一規格檔建立一資源特徵模型。

據此，本發明的從屬裝置所產生的容器，其容器規格可被動態調整，故不會因工作的特性不同，而造成資源浪費。再者，由於本發明的每一個容器的容器規格不再是固定的，故本發明的從屬裝置的容器總數也可被動態調整，故不會造成資源閒置。另外，由於本發明的從屬裝置所產生的容器，其容器規格與容器總數可被動態調整，故即使複數從屬裝置具有不同的裝置效能，也不會造成資源分配不當。

於參閱圖式及隨後描述的實施方式後，本發明所屬技術領域中具有通常知識者便可更瞭解本發明之目的、技術手段及所達功效。

1‧‧‧叢集運算系統

11‧‧‧主裝置

111‧‧‧連接介面

113‧‧‧處理器

1131‧‧‧資源管理器

1133‧‧‧工作管理器

1135‧‧‧最佳資源模組

1135a‧‧‧工作資訊檢索器

1135b‧‧‧有效節點檢驗器

1135c‧‧‧模型載入器

1135d‧‧‧最佳資源預測器

1135e‧‧‧最佳容器數量預測器

1137‧‧‧模型管理器

1137a‧‧‧請求處理器

1137b‧‧‧模型檢索器

1137c‧‧‧同質模型引擎

1137d‧‧‧同質節點引擎

13‧‧‧從屬裝置

1331‧‧‧從屬管理器

1333‧‧‧容器

1335‧‧‧模型產生器

1335a‧‧‧工作完成偵測器

1335b‧‧‧工作資訊檢索器

1335c‧‧‧支援向量迴歸模組產生器

1337‧‧‧工作狀態收集器

1337a‧‧‧硬體性能收集器

1337b‧‧‧工作狀態收集器

1337c‧‧‧規格整合器

1339‧‧‧規格檔

131‧‧‧連接介面

133‧‧‧處理器

15‧‧‧分散式檔案系統

21‧‧‧工作

22‧‧‧裝置資訊

23‧‧‧資源特徵模型

24‧‧‧容器組態參數

25‧‧‧工作資訊

26‧‧‧狀態資訊

S21、S23、S25、S27、S29、S31、S33、S35、S37‧‧‧步驟

以下是針對圖式所記載之簡單說明，並非用以限定本發明，其中：第1圖為本發明之一實施例之一叢集運算系統的一結構例示圖；第2圖為第1圖所示叢集運算系統中主裝置與單一從屬裝置的一運作例示圖；第3圖為第2圖所示主裝置中最佳資源模組的一運作例示圖；第4圖為第2圖所示主裝置中模型管理器的一運作例示圖；第5圖為第2圖所示主裝置中模型產生器的一運作例示圖；第6圖為第2圖所示主裝置中工作狀態收集器的一運作例示圖；以及第7圖為本發明之一實施例之用於一叢集運算系統中一主裝置及一從屬裝置之運算方法的一例示圖。

以下將透過實施例來解釋本發明的內容，惟以下實施例並非用以限制本發明須在如其所述的環境、應用、結構、流程或步驟方能實施。換言之，以下實施例的說明僅為闡釋本發明，而非用以限制本發明。於圖式中，與本發明非直接相關的元件皆已省略而未繪示，且各元件之間的尺寸關僅為求容易瞭解，而非用以限制實際實施的比例。

本發明之一實施例(簡稱「第一實施例」)為一種叢集運算系統。第1圖為所述叢集運算系統的一結構例示圖。如第1圖所示，叢集運算系統1可包含一主裝置11及至少一從屬裝置13(即一個或複數個從屬裝置)。主裝置可包含一連接介面111及一處理器113，且連接介面111與處理器113可直接或間接地電性連接，且相互通訊。各個從屬裝置13可包含一連接介面131及一處理器133，且連接介面131與處理器133可直接或間接地電性連接，且相互通訊。主裝置11的連接介面111可與各個從屬裝置13的連接介面111經由各種媒介(未繪示於圖)相互連接且通訊。因應不同的媒介(例如網路、排線等等)，主裝置11的連接介面111可與各個從屬裝置13的連接介面111可經由各種有線或無線的途徑，彼此相互連接且通訊。主裝置11及從屬裝置13中的每一個可以是一***立的電腦，或者是一台電腦內獨立的運算單元。

叢集運算系統1可選擇性地包含一分散式檔案系統15。分散式檔案系統15乃是由多個從屬裝置13各自提供一部份資源(例如儲存空間)所共同建構而成的一個檔案系統。分散式檔案系統15為主裝置11與從屬裝置13所共享。具體而言，經由主裝置11的連接介面111以及各個從屬裝置13的連接介面131彼此之間的連接，主裝置11以及各個從屬裝置13可存取分散式檔案系統15內的資料。換言之，主裝置11及各個從屬裝置13可儲存資料至分散式檔案系統15，也可自分散式檔案系統15讀取資料。可選擇地，主裝置11亦可透過其他介面或方式而直接存取分散式檔案系統15 內的資料。

如第1圖所示，當叢集運算系統1需要運算一工作21(例如一演算法)時，主裝置11可要求從屬裝置13傳送其裝置資訊22至主裝置11。或者，從屬裝置13可定期主動傳送其裝置資訊22至主裝置11。更具體而言，各個從屬裝置13可透過其連接介面131傳送其裝置資訊22至主裝置11，而主裝置11可透過其連接介面111接收各個從屬裝置13所傳送的裝置資訊22。因此，在叢集運算系統1需要運算一工作21時，主裝置11的處理器113可先行取得所有從屬裝置13傳送的裝置資訊22。工作21可以是主裝置11自行產生的，也可以是從主裝置外的其他裝置輸入的。從屬裝置13的裝置資訊22可包含其硬體、軟體、及運算能力等資訊。

在取得所有從屬裝置13傳送的裝置資訊22後，主裝置11的處理器113可根據各個裝置資訊22及工作21為相對應的從屬裝置13選擇一資源特徵模型23。各個資源特徵模型23可視需求而包含各種特徵模型，例如但不限於一中央處理單元特徵模型、一記憶體特徵模型、一網路特徵模型、一磁碟輸入輸出(Disk IO)特徵模型等等。中央處理單元特徵模型可用以估測一容器運作一工作所需的中央處理單元規格，而記憶體特徵模型可用以估測該容器運作該工作所需的記憶體規格。網路特徵模型可用以估測該容器運作該工作所需的網路規格，而磁碟輸入輸出特徵模型可用以估測該容器運作該工作所需的磁碟輸入輸出規格。

若叢集運算系統1包含分散式檔案系統15，主裝置11 的處理器113可為各個從屬裝置13從分散式檔案系統15內選出資源特徵模型23。舉例而言，分散式檔案系統15可預先儲存複數資源特徵模型樣本；而針對各個從屬裝置13，主裝置11的處理器113可根據相對應的裝置資訊22及工作21而從該等資源特徵模型樣本中選出資源特徵模型23。

若叢集運算系統1不包含分散式檔案系統15，主裝置11的處理器113亦可根據其他來源提供的資源特徵模型樣本，為各個從屬裝置13選出資源特徵模型23。舉例而言，主裝置11可包含一用以預先儲存複數資源特徵模型樣本的儲存器(未繪示於圖)，或自其他裝置預先取得複數資源特徵模型樣本；而針對各個從屬裝置13，主裝置11的處理器113可根據相對應的裝置資訊22及工作21而從該等資源特徵模型樣本中選出資源特徵模型23。前述資源特徵模型樣本可以是資源特徵模型23本身或與其相關的資訊。

無論叢集運算系統1是否包含分散式檔案系統15，若可取得的資源特徵模型樣本的數量過多(例如高過一門檻值)，主裝置11的處理器113可選擇性地將複數資源特徵模型樣本分割為複數群組，並從各該群組中選擇一資源特徵模型樣本作為一資源特徵模型代表。舉例而言，主裝置11的處理器113可利用K-means演算法，將複數資源特徵模型樣本分割為複數群組。然後，針對各個從屬裝置13，主裝置11的處理器113可根據相對應的裝置資訊22及工作21而從該等資源特徵模型代表中選出資源特徵模型23。前述資源特徵模型樣本可以是資源特徵模型23本身或與其相關的資訊。

針對各個從屬裝置13，主裝置11的處理器113可根據相對應的裝置資訊22及工作21，選擇一相應資源特徵模型、一相似資源特徵模型及一預設資源特徵模型其中之一作為資源特徵模型23，其中相應資源特徵模型優先於相似資源特徵模型而被選擇，且相似資源特徵模型優先於預設資源特徵模型而被選擇。具體而言，針對各個從屬裝置13，主裝置11的處理器113可先根據相對應的裝置資訊22及工作21判斷是否存有一相應資源特徵模型(即完全對應至裝置資訊22及工作21的一資源特徵模型)。若是，主裝置11的處理器113選擇該相應資源特徵模型作為資源特徵模型23。若否，主裝置11的處理器113根據相對應的裝置資訊22及工作21判斷是否存有一相似資源特徵模型(即相似對應至裝置資訊22及工作21的一資源特徵模型)。若是，主裝置11的處理器113選擇該相似資源特徵模型作為資源特徵模型23。若否，主裝置11的處理器113選擇一預設資源特徵模型(即預先設定的一資源特徵模型)作為資源特徵模型23。

主裝置11的處理器113可根據各個資源特徵模型23估測相對應的從屬裝置13的一容器組態參數24。各個容器組態參數24可包含一容器數量及一容器規格，而各個容器規格可視需要而包含各種規格，例如但不限於：一中央處理單元規格、一記憶體規格、一網路規格、一磁碟輸入輸出(Disk IO)規格等等。具體而言，主裝置11的處理器113可根據各個資源特徵模型23，估測相對應的從屬裝置13在運算任務21時，開啟一容器所需的各種規格，例如一中央處理單元規格、一記憶體規格、一網路規格、一磁碟輸入輸出規格等等。然後，主裝置11的處理器113可根據該從屬裝置13的裝置資訊22、估測的該等規格(例如該中央處理單元規格、該記憶體規格、該網路規格、該磁碟輸入輸出規格等等)，估測該從屬裝置13所需開啟的一容器數量。

舉例而言，若主裝置11的處理器113估測一從屬裝置13在運算任務21時，開啟一容器所需的一中央處理單元規格與一記憶體規格分別為10億赫茲(1GHz)與10億位元組(1GB)，且裝置資訊22指出了該從屬裝置13的中央處理單元能力及記憶體能力分別為40億赫茲(4GHz)與40億位元組(4GB)，則主裝置11的處理器113估測該從屬裝置13運算任務21的容器數量為4個。

主裝置11的處理器113可透過連接介面111傳送各個容器組態參數24至相對應的從屬裝置13，以及分配工作21至這些從屬裝置13。若叢集運算系統1中只有單一可用的從屬裝置13，則工作21會由該單個從屬裝置13獨自進行運算。若叢集運算系統1中有複數可用的從屬裝置13，則工作21會由這些從屬裝置13共同進行運算。對於後者，主裝置11的處理器113會把工作21區分為複數任務(tasks)，並將該等任務分配到這些從屬裝置13。如何將工作21區分為複數任務並分配給多個從屬裝置13已屬本發明所屬技術領域中具有通常知識者所熟知，於此不多贅述。

各個從屬裝置13的處理器133可透過連接介面131接收來自主裝置11所分配的工作21(或主裝置分配的對應至工作21的任務)和相對應的容器組態參數24。然後，各個從屬裝置13的處理器133可根據接收到的容器組態參數24，產生至少一容器以運算工作21(或主裝置分配的對應至工作21的任務)。在叢集運算系統1中，各個從屬裝置13具有一規格檔(metric file)，用以儲存各種本地資料。因此，在該至少一容器運算工作21(或主裝置分配的對應至工作21的任務)的過程中，從屬裝置13的處理器133可收集該至少一容器的工作狀態，並將該工作狀態的狀態資訊儲存至該規格檔。

在運算完工作21(或主裝置分配的對應至工作21的任務)後，各個從屬裝置13的處理器133可根據對應至工作21之工作資訊(job information)及其規格檔建立一資源特徵模型23。舉例而言，各個從屬裝置13的處理器133可根據對應至工作21之工作資訊及其規格檔，利用一支援向量迴歸(Support Vector Regression；SVR)模組產生器建立一資源特徵模型。如同前述，資源特徵模型23可視需求而包含各種特徵模型，例如但不限於一中央處理單元特徵模型、一記憶體特徵模型、一網路特徵模型、一磁碟輸入輸出(Disk IO)特徵模型等等。

若叢集運算系統1包含分散式檔案系統15，主裝置11的處理器113可預先儲存對應至工作21的工作資訊至分散式檔案系統21，而各個從屬裝置13的處理器133可從分散式檔案系統15中取得對應至工作21的工作資訊。

若叢集運算系統1不包含分散式檔案系統15，各個從屬裝置13的處理器133亦可透過其他途徑取得對應至工作21的工作資訊。舉例而言，各個從屬裝置13的處理器133可經由連接介面131與連接介面111自主裝置11取得對應至工作21的工作資訊。另舉例而言，各個從屬裝置13可包含一用以預先儲存對應至工作21的工作資訊的儲存器(未繪示於圖)，或自其他裝置預先取得對應至工作21的工作資訊。

對本發明所屬技術領域中具有通常知識者而言，主裝置11與多個從屬裝置13與之間的互動可藉由類推得知，故以下將以第2圖為本實施例之一範例，進一步說明叢集運算系統1中主裝置11與單一從屬裝置13之間的互動，惟此舉僅為了易於說明，並非用以限制本發明。第2圖為叢集運算系統1中主裝置11與單一從屬裝置13的一運作例示圖，且第2圖所示的從屬裝置13可以是第1圖中所示複數從屬裝置13中的任一個。

如第2圖所示，主裝置11可選擇性地包含以下構件來協同完成連接介面111與處理器113之前述功能：一資源管理器(resource manager)1131、一工作管理器(job manager)1133、一最佳資源模組(optimal resource module)1135及一模型管理器(model manager)1137。另外，從屬裝置13可選擇性地包含以下構件來協同完成連接介面131與處理器133之前述功能：一從屬管理器(slave manager)1331、至少一容器(container)1333、一模型產生器(model generator)1335、一工作狀態收集器(working status collector)1337及一規格檔1339。

首先，當主裝置11接收到工作21時，資源管理器1131會開啟工作管理器1133，並將工作21交付給工作管理器1133處理。同時，資源管理器1131可自從屬管理器1331取得其裝置資訊 22，並將裝置資訊22傳送至工作管理器1133。然後，工作管理器1133傳送工作21及裝置資訊22至最佳資源模組1135。在取得工作21及裝置資訊22後，最佳資源模組1135會根據工作21及裝置資訊22向模型管理器1137取得資源特徵模型23。同時，最佳資源模組1135可將對應至工作21的工作資訊25儲存到分散式檔案系統15。然後，最佳資源模組1135會根據資源特徵模型23估測從屬裝置13的容器組態參數24，並將容器組態參數24傳送至工作管理器1133。最後，工作管理器1133將容器組態參數24傳送至資源管理器1131。

在取得容器組態參數24之後，資源管理器1131會傳送容器組態參數24至從屬管理器1331，並分配工作21至從屬管理器1331。從屬管理器1331會根據容器組態參數24產生至少一容器1333以運算工作21(或資源管理器1131分配的對應至工作21的任務)。從屬管理器1331可根據容器組態參數24決定容器1333的數量以及容器1333的中央處理單元規格以及記憶體規格。在容器1333運算工作21(或資源管理器1131分配的對應至工作21的任務)的過程中，工作狀態收集器1337收集容器1333運算工作21(或資源管理器1131分配的對應至工作21的任務)的工作狀態，並將對應至該工作狀態的狀態資訊26儲存至規格檔1339。狀態資訊26可包含但不限於：各個容器1333的中央處理單元消耗量及記憶體消耗量。

在容器1333運算工作21(或資源管理器1131分配的對應至工作21的任務)後，模型產生器1335可根據對應至工作21(或資源管理器1131分配的對應至工作21的任務)之工作資訊25及規格檔1339建立及/ 或更新資源特徵模型23。舉例而言，模型產生器1335可根據工作資訊25及規格檔1339，利用一支援向量迴歸模組產生器建立資源特徵模型23。模型產生器1335可自分散式檔案系統15取得工作資訊25及/或自從屬管理器1331取得工作資訊25。自分散式檔案系統15取得工作資訊25可包含但不限於：資料大小、Map/Reduce拆解數量等。自從屬管理器1331取得工作資訊25可包含但不限於：各容器運算Map/Reduce的資訊等。自規格檔1339取得的資訊可包含但不限於：狀態資訊26、運算過程中的硬體效能資訊等。

第3圖、第4圖、第5圖及第6圖分別為最佳資源模組1135、模型管理器1137、模型產生器1335及工作狀態收集器1337的一具體運作例示圖。然而，於本發明之其他實施例，第2圖所示的最佳資源模組1135、模型管理器1137、模型產生器1335及工作狀態收集器1337的運作可不需完全遵循第3-6圖所示之內容，並且可在不脫離本發明之精神的情況下，進行適當的調整、改變、及/或置換等處置。

如第3圖所示，最佳資源模組1135可包含一工作資訊檢索器(job information retriever)1135a、一有效節點檢驗器(available node inspector)1135b、一模型載入器(model loader)1135c、一最佳資源預測器(optimal resource predictor)1135d、及一最佳容器數量預測器(optimal container number predictor)1135e。在工作管理器1133獲取工作21後，工作資訊檢索器1135a會接收以下資料：工作名稱(例如一演算法名稱)、輸入資料大小及全部Map/Reduce任務，並將輸入資料大小及全部Map/Reduce任務儲存到分散式檔案系統15。當叢集運算系統1中出現可用節點(即可用的從屬裝置13)時，有效節點檢驗器1135b會收到此節點的名稱。然後，模型載入器1135c會根據工作名稱與此節點的名稱至模型管理器1137中尋找相符的資源特徵模型23。

最佳資源預測器1135d可藉由資源特徵模型23預測對應到此節點之一容器的中央處理單元規格與一記憶體規格，而最佳容器數量預測器1135e可根據該中央處理單元規格與該記憶體規格預測此節點之容器數量。因此，透過最佳資源預測器1135d及最佳容器數量預測器1135e的上述運作，最佳資源模組1135可估測出此節點的容器組態參數24，並將容器組態參數24傳送到工作管理器1133。

如第4圖所示，模型管理器1137可包含一請求處理器(request handler)1137a、一模型檢索器(model retriever)1137b、一同質模型引擎(homogeneous model engine)1137c及一同質節點引擎(homogeneous node engine)1137d。當最佳資源模組1135提出尋找資源特徵模型23的請求後，請求處理器1137a會根據最佳資源模組1135傳送的工作名稱與節點名稱，從分散式檔案系統15或其他來源所儲存的複數資源特徵模型樣本中選出資源特徵模型23。舉例而言，請求處理器1137a可選擇一相應資源特徵模型、一相似資源特徵模型及一預設資源特徵模型其中之一作為資源特徵模型23。

同質模型引擎1137c可包含一模型資訊檢索器(未繪示於圖)、一模型群組器(未繪示於圖)及一群組決定器(未繪示於圖)。當資源特徵模型樣本的數量過高(例如超過一門檻值)，該模型資訊檢索器會截取各個資源特徵模型樣本的各項資訊，而該模型群組器會根據這些資訊，將該等資源特徵模型樣本分割為複數群組。例如，該模型群組器可利用K-means演算將該等資源特徵模型樣本分割為複數群組。另外，可選擇地，該模型群組器可從各該群組中選擇一資源特徵模型樣本作為一資源特徵模型代表，而請求處理器1137a可根據最佳資源模組1135傳送的工作名稱與節點名稱，從該等資源特徵模型代表中選出資源特徵模型23。當出現一新資源特徵模型樣本時，該群組決定器會根據該新資源特徵模型樣本的各項資訊，將該新資源特徵模型樣本加入最適合的群組中。

同質節點引擎1137d可包含一節點資訊檢索器(未繪示於圖)、一節點群組器(未繪示於圖)、一群組決定器(未繪示於圖)及一群組模型產生器(未繪示於圖)。當節點(即從屬裝置13)的數量過高(例如超過一門檻值)，該節點資訊檢索器會截取各個節點的各項資訊(例如硬體資訊)，而該節點群組器會根據這些資訊，將該等節點分割為複數群組。例如，該節點群組器可利用K-means演算將該等節點分割為複數群組。當出現一新節點時，該群組決定器會根據該新節點的各項資訊，將該新節點加入最適合的群組中。另外，該群組模型產生器會擷取該新節點所屬群組中的訓練資料，透過一支援向量迴歸模組產生器為該新節點建立資源特徵模型23，並將資源特徵模型23儲存至分散式檔案系統15。於其他實施例，同質節點引擎1137d可與同質模型引擎1137c合併在一起。

如第5圖所示，模型產生器1335可包含一工作完成偵測器(job finished detector)1335a、一工作資訊檢索器(job information retriever)1335b及一支援向量迴歸模組產生器(support vector regression model generator)1335c。工作完成偵測器1335a用以偵測工作21(或資源管理器1131分配的對應至工作21的任務)是否已經完成。在工作21(或資源管理器1131分配的對應至工作21的任務)完成後，工作資訊檢索器1335b會從分散式檔案系統15取得對應至工作21的工作資訊25以及從規格檔1339取得各項資訊(包含狀態資訊26)。然後，支援向量迴歸模組產生器1335c會根據工作資訊25及規格檔1339的各項資訊，建立並儲存資源特徵模型23至分散式檔案系統15。

支援向量迴歸模組產生器1335c的輸入資料可包含但不限於：來自工作資訊檢索器1335b的歷史工作資料集大小、來自工作資訊檢索器1335b的歷史工作總共Map任務數量、來自工作資訊檢索器1335b的歷史工作總共Reduce任務數量、歷史工作中節點被分配之Map容器數量、歷史工作中節點被分配之Reduce容器數量、歷史工作中單一任務的中央處理單元使用量及歷史工作中單一任務的記憶體使用量等。歷史工作中單一任務的中央處理單元使用量等於中央處理單元使用量除以運行的Map與Reduce數量，而歷史工作中單一任務的記憶體使用量等於記憶體使用量除以運行的Map與Reduce數量。工作資訊25及規格檔1339的各項資訊可包含但不限於：輸入資料大小、被分配的Map任務、被分配的Reduce 任務、被分配的Map槽、被分配的Reduce槽、每任務之平均中央處理單元使用量及每任務之平均記憶體使用量等。

如第6圖所示，工作狀態收集器1337可包含一硬體性能收集器(hardware performance collector)1337a、一工作狀態收集器(task status collector)1337b及一規格整合器(metric aggregator)1337c。硬體性能收集器1337a用以收集容器1333中的中央處理單元使用量以及記憶體使用量，而工作狀態收集器1337b用以收集容器1333中的被分被的Map槽、被分配的Reduce槽、運算中的Map任務以及運算中的Reduce任務。規格整合器1337c用以整合硬體性能收集器1337a與工作狀態收集器1337b所收集的資訊至規格檔1339。整合至規格檔1339的資訊包含但不限於：被分被的Map槽、被分配的Reduce槽及每任務之平均中央處理單元使用量、每任務之平均記憶體使用量等。每任務之平均中央處理單元使用量等於中央處理單元使用量除以運算中的Map任務以及運算中的Reduce任務，而每任務之平均記憶體使用量等於記憶體使用量除以運算中的Map任務以及運算中的Reduce任務。

第3-6圖所分別例示的最佳資源模組1135、模型管理器1137、模型產生器1335及工作狀態收集器1337，僅為本實施例的一範例，並非用以限制本發明。

本發明的另一實施例(簡稱「第二實施例」)為一種用於一叢集運算系統中一主裝置及一從屬裝置的運算方法。該叢集運算系統、該主裝置及該從屬裝置可分別視為對應至前述實施例之叢集運算系統1、主裝置11及從屬裝置13。第7圖為一種用於一叢集運算系統中一主裝置及一從屬裝置之運算方法的一例示圖。

針對該主裝置，本實施例所述運算方法包含：步驟S21，由該主裝置之一處理器接收該從屬裝置的裝置資訊；步驟S23，由該主裝置之該處理器根據該裝置資訊及一工作為該從屬裝置選擇一資源特徵模型；步驟S25，由該主裝置之該處理器根據該資源特徵模型估測該從屬裝置的一容器組態參數；步驟S27，由該主裝置之該處理器傳送該容器組態參數至該從屬裝置；以及步驟S29，由該主裝置之該處理器分配該工作至該從屬裝置。步驟S21-S29的呈現順序並非用以限制本發明，且在不脫離本發明之精神的前提下，可以適當地進行調整。

作為該運算系統之一範例，該叢集運算系統更包含一分散式檔案系統，該主裝置與該從屬裝置共享該分散式檔案系統，且該步驟S23包含下列步驟：由該主裝置之該處理器根據該裝置資訊及該工作為該從屬裝置從該分散式檔案系統內選出該資源特徵模型。於該範例中，該運算方法可選擇地更包含以下步驟：由該主裝置之該處理器儲存對應至該工作的工作資訊至該分散式檔案系統。

作為該運算系統之一範例，該資源特徵模型包含一中央處理單元特徵模型及一記憶體特徵模型，該容器組態參數包含一容器數量及一容器規格，且該容器規格包含一中央處理單元規格及一記憶體規格。

作為該運算系統之一範例，步驟S23包含下列步驟：由該主裝置之該處理器根據該裝置資訊及該工作為該從屬裝置選擇一相應資源特徵模型、一相似資源特徵模型及一預設資源特徵模型其中之一作為該資源特徵模型，其中該相應資源特徵模型優先於該相似資源特徵模型而被選擇，且該相似資源特徵模型優先於該預設資源特徵模型而被選擇。

作為該運算系統之一範例，步驟S23包含下列步驟：由該主裝置之該處理器分割複數資源特徵模型樣本為複數群組；從各該群組中選擇一資源特徵模型樣本作為一資源特徵模型代表；以及根據該裝置資訊及該工作從該等資源特徵模型代表中為該從屬裝置選擇該資源特徵模型。

針對該從屬裝置，本實施例所述運算方法包含：步驟S31，由該從屬裝置之該處理器傳送裝置資訊至該主裝置；步驟S33，由該從屬裝置之該處理器自該主裝置接收該主裝置分配的一工作和一容器組態參數；步驟S35，由該從屬裝置之該處理器根據該容器組態參數產生至少一容器以運算該工作；以及步驟S37，由該從屬裝置之該處理器根據對應至該工作之工作資訊及一規格檔建立一資源特徵模型。步驟S31-S37的呈現順序並非用以限制本發明，且在不脫離本發明之精神的前提下，可以適當地進行調整。

作為該運算系統之一範例，該叢集運算系統更包含一分散式檔案系統，該主裝置與該從屬裝置共享該分散式檔案系統，且步驟S37包含下列步驟：由該從屬裝置之該處理器根據該工作資訊及該規格檔在該分散式檔案系統內建立該資源特徵模型。於該範例中，該運算方法可選擇地更包含以下步驟：由該從屬裝置之該處理器從該分散式檔案系統中取得該工作資訊。

作為該運算系統之一範例，該運算方法更包含以下步驟：由該從屬裝置之該處理器收集該容器運算該工作的工作狀態，並將對應至該工作狀態的狀態資訊儲存至該規格檔。

作為該運算系統之一範例，步驟S37包含下列步驟：由該處理器根據該工作資訊及該規格檔，利用一支援向量迴歸模組產生器建立一資源特徵模型。

第二實施例之運算方法本質上包含了與前述實施例之主裝置11及從屬裝置13之各項運作相對應的所有步驟。由於本發明所屬技術領域中具有通常知識者可根據前述實施例的相關揭示，而直接瞭解未記載於第二實施例之運算方法。

除了上述揭示內容，第二實施例之運算方法還包含了與前述實施例之主裝置11及從屬裝置13之其他運作相對應的步驟。由於本發明所屬技術領域中具有通常知識者可根據第一實施例的相關揭示而直接瞭解第二實施例之運算方法如何執行這些未揭示於第二實施例之相對應的步驟，於此不多贅述。

上述實施例並非用來限制本發明的實施方式，且任何熟悉此技術者可輕易完成的改變或均等性的安排皆不脫離本發明。本發明的範圍以申請專利範圍為準。

S21、S23、S25、S27、S29、S31、S33、S35、S37‧‧‧步驟

Claims

一種用於一叢集運算系統(cluster computing system)之主裝置(master device)，包含：一連接介面，用以與至少一從屬裝置(slave device)連接；以及一處理器，電性連接至該連接介面，並用以接收該至少一從屬裝置中的每一個的裝置資訊，根據對應的裝置資訊及一工作(job)為該至少一從屬裝置中的每一個選擇一資源特徵模型，根據對應的資源特徵模型估測該至少一從屬裝置中的每一個的一容器組態參數，傳送對應的容器組態參數至該至少一從屬裝置中的每一個，以及分配該工作至該至少一從屬裝置中的每一個，俾該至少一從屬裝置中的每一個根據對應的容器組態參數產生一容器以運算該工作；其中各該容器組態參數包含一容器數量及一容器規格。
如請求項1所述之主裝置，其中該叢集運算系統更包含一分散式檔案系統(distribution file system)，該主裝置與該至少一從屬裝置中的每一個共享該分散式檔案系統，該處理器為該至少一從屬裝置中的每一個從該分散式檔案系統內選出對應的資源特徵模型。
如請求項2所述之主裝置，其中該處理器更儲存對應至該工作的工作資訊至該分散式檔案系統。
如請求項1所述之主裝置，其中該資源特徵模型包含一中央處理單元特徵模型及一記憶體特徵模型，且該容器規格包含一中央處理單元規格及一記憶體規格。
如請求項1所述之主裝置，其中該處理器選擇一相應資源特徵模型、一相似資源特徵模型及一預設資源特徵模型其中之一作為各該資源特徵模型，該相應資源特徵模型優先於該相似資源特徵模型而被選擇，且該相似資源特徵模型優先於該預設資源特徵模型而被選擇。
如請求項1所述之主裝置，其中該處理器更分割複數資源特徵模型樣本為複數群組，從各該群組中選擇一資源特徵模型樣本為一資源特徵模型代表，以及從該等資源特徵模型代表中為該至少一從屬裝置中的每一個選擇對應的資源特徵模型。
一種用於一叢集運算系統之從屬裝置，包含：一連接介面，用以與一主裝置連接；以及一處理器，電性連接至該連接介面，並用以傳送裝置資訊至該主裝置，自該主裝置接收該主裝置分配的一工作和該主裝置估測的一容器組態參數，根據該容器組態參數產生至少一容器以運算該工作，以及根據對應至該工作之工作資訊(job information)及一規格檔(metric file)建立一資源特徵模型；其中該容器組態參數包含一容器數量及一容器規格。
如請求項7所述之從屬裝置，其中該叢集運算系統更包含一分散式檔案系統，該主裝置與該從屬裝置共享該分散式檔案系統，該處理器在該分散式檔案系統內建立該資源特徵模型。
如請求項8所述之從屬裝置，其中該處理器更從該分散式檔案系統中取得該工作資訊。
如請求項7所述之從屬裝置，其中該處理器更收集該容器運算該工作的工作狀態，並將對應至該工作狀態的狀態資訊儲存至該規格檔。
如請求項7所述之從屬裝置，其中該資源特徵模型包含一中央處理單元特徵模型及一記憶體特徵模型，且該容器規格包含一中央處理單元規格及一記憶體規格。
如請求項7所述之從屬裝置，其中該處理器根據該工作資訊及該規格檔，利用一支援向量迴歸模組產生器建立一資源特徵模型。
一種用於一叢集運算系統中一主裝置的運算方法，該主裝置包含一連接介面與一處理器，該連接介面用以與至少一從屬裝置連接，該運算方法包含下列步驟：(A)由該處理器接收該至少一從屬裝置中的每一個的裝置資訊；(B)由該處理器根據對應的裝置資訊及一工作為該至少一從屬裝置中的每一個選擇一資源特徵模型；(C)由該處理器根據對應的資源特徵模型估測該至少一從屬裝置中的每一個的一容器組態參數，該容器組態參數包含一容器數量及一容器規格；(D)由該處理器傳送對應的容器組態參數至該至少一從屬裝置中的每一個；以及(E)由該處理器分配該工作至該從屬裝置，俾該至少一從屬裝置的每一個根據該容器組態參數產生一容器以運算該工作。
如請求項13所述之運算方法，其中該叢集運算系統更包含一分散式檔案系統，該主裝置與該至少一從屬裝置中的每一個共享該分散式檔案系統，且該步驟(B)包含下列步驟：由該處理器根據該裝置資訊及該工作為該至少一從屬裝置中的每一個從該分散式檔案系統內選出對應的資源特徵模型。
如請求項14所述之運算方法，更包含下列步驟：(F)由該處理器儲存對應至該工作的工作資訊至該分散式檔案系統。
如請求項13所述之運算方法，其中該資源特徵模型包含一中央處理單元特徵模型及一記憶體特徵模型，且該容器規格包含一中央處理單元規格及一記憶體規格。
如請求項13所述之運算方法，其中該步驟(B)包含下列步驟：由該處理器根據對應的裝置資訊及該工作為該至少一從屬裝置中的每一個選擇一相應資源特徵模型、一相似資源特徵模型及一預設資源特徵模型其中之一作為各該資源特徵模型，其中該相應資源特徵模型優先於該相似資源特徵模型而被選擇，且該相似資源特徵模型優先於該預設資源特徵模型而被選擇。
如請求項13所述之運算方法，其中該步驟(B)包含下列步驟：由該處理器分割複數資源特徵模型樣本為複數群組；從各該群組中選擇一資源特徵模型樣本作為一資源特徵模型代表；以及根據對應的裝置資訊及該工作從該等資源特徵模型代表中為該至少一從屬裝置中的每一個選擇對應的資源特徵模型。
一種用於一叢集運算系統中一從屬裝置的運算方法，該從屬裝置包含一連接介面與一處理器，該連接介面用以與一主裝置連接，該運算方法包含下列步驟：(A)由該處理器傳送裝置資訊至該主裝置；(B)由該處理器自該主裝置接收該主裝置分配的一工作和該主裝置估測的一容器組態參數，該容器組態參數包含一容器數量及一容器規格；(C)由該處理器根據該容器組態參數產生至少一容器以運算該工作；以及(D)由該處理器根據對應至該工作之工作資訊及一規格檔建立一資源特徵模型。
如請求項19所述之運算方法，其中該叢集運算系統更包含一分散式檔案系統，該主裝置與該從屬裝置共享該分散式檔案系統，且該步驟(D)包含下列步驟：由該處理器根據該工作資訊及該規格檔在該分散式檔案系統內建立該資源特徵模型。
如請求項20所述之運算方法，更包含下列步驟：(E)由該處理器從該分散式檔案系統中取得該工作資訊。
如請求項19所述之運算方法，更包含下列步驟：(F)由該處理器收集該容器運算該工作的工作狀態，並將對應至該工作狀態的狀態資訊儲存至該規格檔。
如請求項19所述之運算方法，其中該資源特徵模型包含一中央處理單元特徵模型及一記憶體特徵模型，且該容器規格包含一中央處理單元規格及一記憶體規格。
如請求項19所述之運算方法，其中該步驟(D)包含下列步驟：由該處理器根據該工作資訊及該規格檔，利用一支援向量迴歸模組產生器建立一資源特徵模型。