TWI777154B - 用於預測離職率的電子裝置和方法 - Google Patents

用於預測離職率的電子裝置和方法 Download PDF

Info

Publication number
TWI777154B
TWI777154B TW109113664A TW109113664A TWI777154B TW I777154 B TWI777154 B TW I777154B TW 109113664 A TW109113664 A TW 109113664A TW 109113664 A TW109113664 A TW 109113664A TW I777154 B TWI777154 B TW I777154B
Authority
TW
Taiwan
Prior art keywords
machine learning
learning model
generate
prediction result
subset
Prior art date
Application number
TW109113664A
Other languages
English (en)
Other versions
TW202141368A (zh
Inventor
劉又齊
姜亭安
Original Assignee
和碩聯合科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 和碩聯合科技股份有限公司 filed Critical 和碩聯合科技股份有限公司
Priority to TW109113664A priority Critical patent/TWI777154B/zh
Priority to CN202110183039.1A priority patent/CN113554208A/zh
Priority to US17/192,756 priority patent/US20210334681A1/en
Publication of TW202141368A publication Critical patent/TW202141368A/zh
Application granted granted Critical
Publication of TWI777154B publication Critical patent/TWI777154B/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Arrangements For Transmission Of Measured Signals (AREA)

Abstract

提供一種用於預測離職率的電子裝置和方法,其中所述方法包含:接收人力資源資料;根據人力資源資料產生特徵資料集合;將特徵資料集合的第一子集合輸入至第一機器學習模型以產生第一預測結果;將特徵資料集合的第二子集合輸入至第二機器學習模型以產生第二預測結果;以及將第一預測結果、第二預測結果和特徵資料集合的第三子集合輸入至第三機器學習模型以產生第一離職率預測結果。

Description

用於預測離職率的電子裝置和方法
本發明是有關於一種電子裝置和方法,且特別是有關於一種用於預測離職率的電子裝置和方法。
目前,人力資源管理者通常是根據公司內部的歷史招募狀況以及管理者的主觀意識去決定人力資源的調整策略。若該公司的歷史招募狀況不穩定,則管理者將無法評估出適當的調整策略。此外,除了公司本身的營運狀況之外,員工離職的原因也時常受到公司外部因素的影響。舉例來說,當市場釋出大量的高薪工作機會時,就算公司本身的營運狀況良好,員工提出離職的機率仍然會增加。另一方面,傳統的人力資源管理方法僅能根據歷史資料來預測員工的離職率,而無法根據獎金政策的變化而動態地根據新的獎金政策來重新預測員工的離職率。
本發明提供一種用於預測離職率的電子裝置和方法,可 根據人力資源資料來預測公司的員工的離職率。
本發明的一種用於預測離職率的電子裝置,包括處理器、儲存媒體以及收發器。儲存媒體儲存多個模組。處理器耦接儲存媒體和收發器,並且存取和執行多個模組,其中多個模組包括資料收集模組、資料探勘模組以及離職率預估模組。資料收集模組通過收發器接收人力資源資料。資料探勘模組根據人力資源資料來產生特徵資料集合,其中特徵資料集合包括第一子集合、第二子集合及第三子集合。離職率預估模組將第一子集合輸入至第一機器學習模型以產生第一預測結果,將第二子集合輸入至第二機器學習模型以產生第二預測結果,將第一預測結果、第二預測結果和第三子集合輸入至第三機器學習模型以產生第一離職率預測結果。
在本發明的一實施例中,上述的特徵資料集合更包括第四子集合,並且多個模組更包括獎金政策模擬模組。獎金政策模擬模組將特徵資料集合的第四子集合以及獎金政策輸入至第四機器學習模型產生第三預測結果,並且將第三預測結果以及獎金政策輸入至第五機器學習模型以產生第二離職率預測結果。
在本發明的一實施例中,上述的獎金政策模擬模組基於獎金政策被更新,並且根據更新的獎金政策產生更新的第二離職率預測結果。
在本發明的一實施例中,上述的離職率預估模組對第一子集合進行時間序列交叉驗證以產生第一預測結果。
在本發明的一實施例中,上述的第一子集合包括多個特徵資料,離職率預估模組根據多個特徵資料配對產生多個組合以分別產生多個效能指標,選擇多個組合中對應於最高的效能指標的組合,並且將組合輸入至第一機器學習模型以產生第一預測結果。
在本發明的一實施例中,上述的獎金政策模擬模組對第四子集合進行時間序列交叉驗證以產生第三預測結果。
在本發明的一實施例中,上述的第四子集合包括多個特徵資料,獎金政策模擬模組根據多個特徵資料配對產生多個組合以分別產生多個效能指標,選擇多個組合中對應於最高的效能指標的組合,並且將所述組合輸入至所述第四機器學習模型以產生第三預測結果。
在本發明的一實施例中,上述的人力資源資料包括員工基本資料、打卡資訊、內部招募政策、員工產能資訊以及市場獎金政策的至少其中之一。
在本發明的一實施例中,上述的特徵資料集合包括平均每日產能變化量、整體員工工作量指標、各年資區間的人數比例、就業市場獎金的行情、可在特定時間點前領獎的人員的人數比例、可在特定時間點後領獎的人員的人數比例、尚未領獎人員的人數比例以及尚未領獎人員的獎金與市場獎金的差額中的至少其中之一。
在本發明的一實施例中,上述的第一機器學習模型包括 線性回歸模型、線性支持向量回歸模型以及徑向支持向量回歸模型的其中之一,並且第三機器學習模型包括第二線性回歸模型。
本發明的一種用於預測離職率的方法,包括:接收人力資源資料;根據人力資源資料產生特徵資料集合;將特徵資料集合的第一子集合輸入至第一機器學習模型以產生第一預測結果;將特徵資料集合的第二子集合輸入至第二機器學習模型以產生第二預測結果;以及將第一預測結果、第二預測結果和特徵資料集合的第三子集合輸入至第三機器學習模型以產生第一離職率預測結果。
在本發明的一實施例中,上述的方法更包括:將特徵資料集合的第四子集合以及獎金政策輸入至第四機器學習模型產生第三預測結果,並且將第三預測結果以及獎金政策輸入至第五機器學習模型以產生第二離職率預測結果。
在本發明的一實施例中,上述的方法更包括:基於獎金政策被更新而根據更新的獎金政策產生更新的第二離職率預測結果。
在本發明的一實施例中,上述的將特徵資料集合的第一子集合輸入至第一機器學習模型以產生第一預測結果的步驟包括:對第一子集合進行時間序列交叉驗證以產生第一預測結果。
在本發明的一實施例中,上述的第一子集合包括多個特徵資料,並且將特徵資料集合的第一子集合輸入至第一機器學習模型以產生第一預測結果的步驟包括:根據多個特徵資料配對產 生多個組合以分別產生多個效能指標;選擇多個組合中對應於最高的效能指標的組合;以及將組合輸入至第一機器學習模型以產生第一預測結果。
在本發明的一實施例中,上述的將特徵資料集合的第四子集合以及獎金政策輸入至第四機器學習模型來產生第三預測結果的步驟包括:對第四子集合進行時間序列交叉驗證以產生第三預測結果。
在本發明的一實施例中,上述的將特徵資料集合的第四子集合以及獎金政策輸入至第四機器學習模型來產生第三預測結果的步驟包括:根據多個特徵資料配對產生多個組合以分別產生多個效能指標;選擇多個組合中對應於最高的效能指標的組合;以及將組合輸入至第四機器學習模型產生第三預測結果。
在本發明的一實施例中,上述的人力資源資料包括員工基本資料、打卡資訊、內部招募政策、員工產能資訊以及市場獎金政策的至少其中之一。
在本發明的一實施例中,上述的特徵資料集合包括平均每日產能變化量、整體員工工作量指標、各年資區間的人數比例、就業市場獎金的行情、可在特定時間點前領獎的人員的人數比例、可在特定時間點後領獎的人員的人數比例、尚未領獎人員的人數比例以及尚未領獎人員的獎金與市場獎金的差額中的至少其中之一。
在本發明的一實施例中,上述的第一機器學習模型包括 線性回歸模型、線性支持向量回歸模型以及徑向支持向量回歸模型的其中之一,並且第三機器學習模型包括第二線性回歸模型。
基於上述,本發明可通過具有分層結構的機器學習模型架構來產生離職率預測結果,以提高離職率預測結果之準確率。
100:電子裝置
110:處理器
120:儲存媒體
121:資料收集模組
122:資料探勘模組
123:離職率預估模組
124:獎金政策模擬模組
125:資訊顯示模組
130:收發器
301:特徵資料集合
302、303、501:特徵資料集合的子集合
304、305、306、310、503、504、505、509:機器學習模型
307、308、309、506、507、508:預測結果
311:第一離職率預測結果
40:特徵資料
410、430、450:訓練資料
420、440、460:測試資料
502:獎金政策
510:第二離職率預測結果
S201、S202、S203、S204、S205、S206、S207、S208:步驟
圖1根據本發明的實施例繪示一種用於預測離職率的電子裝置的示意圖。
圖2根據本發明的實施例繪示一種用於預測離職率的方法的流程圖。
圖3根據本發明的實施例繪示根據特徵資料集合產生第一離職率預測結果的示意圖。
圖4根據本發明的實施例繪示對特徵資料的多個組合中的特定組合進行時間序列交叉驗證(time series cross-validation)的示意圖。
圖5根據本發明的實施例繪示根據獎金政策產生第二離職率預測結果的示意圖。
圖1根據本發明的實施例繪示一種用於預測離職率的電子裝置100的示意圖。電子裝置100可包括處理器110、儲存媒體 120以及收發器130。
處理器110例如是中央處理單元(central processing unit,CPU),或是其他可程式化之一般用途或特殊用途的微控制單元(micro control unit,MCU)、微處理器(microprocessor)、數位信號處理器(digital signal processor,DSP)、可程式化控制器、特殊應用積體電路(application specific integrated circuit,ASIC)、圖形處理器(graphics processing unit,GPU)、影像訊號處理器(image signal processor,ISP)、影像處理單元(image processing unit,IPU)、算數邏輯單元(arithmetic logic unit,ALU)、複雜可程式邏輯裝置(complex programmable logic device,CPLD)、現場可程式化邏輯閘陣列(field programmable gate array,FPGA)或其他類似元件或上述元件的組合。處理器110可耦接至儲存媒體120以及收發器130,並且存取和執行儲存於儲存媒體120中的多個模組和各種應用程式。
儲存媒體120例如是任何型態的固定式或可移動式的隨機存取記憶體(random access memory,RAM)、唯讀記憶體(read-only memory,ROM)、快閃記憶體(flash memory)、硬碟(hard disk drive,HDD)、固態硬碟(solid state drive,SSD)或類似元件或上述元件的組合,而用於儲存可由處理器110執行的多個模組或各種應用程式。在本實施例中,儲存媒體120可儲存包括資料收集模組121、資料探勘模組122、離職率預估模組123、獎金政策模擬模組124以及資訊顯示模組125等多個模組,其功 能將於後續說明。
收發器130以無線或有線的方式傳送及接收訊號。收發器130還可以執行例如低噪聲放大、阻抗匹配、混頻、向上或向下頻率轉換、濾波、放大以及類似的操作。
圖2根據本發明的實施例繪示一種用於預測離職率的方法的流程圖,其中所述方法可由如圖1所示的電子裝置100實施。
在步驟S201中,資料收集模組121可通過收發器130來接收人力資源資料。舉例來說,收發器130可通訊連接至一輸入裝置或一人機介面。使用者可通過所述輸入裝置或所述人機介面將人力資源資料上傳至收發器130。人力資源資料可包含例如員工基本資料、打卡資訊、內部招募政策、員工產能資訊或市場獎金政策等,但本發明不限於此。
在步驟S202中,資料探勘模組122可根據人力資源資料來產生特徵資料集合。舉例來說,資料探勘模組122可對人力資源資料進行資料探勘(data mining)來產生特徵資料集合。特徵資料集合可包含例如平均每日產能變化量、整體員工工作量指標、各年資區間的人數比例、就業市場獎金的行情(例如:就業市場獎金第三四分位數)或獎金政策等至少其中之一特徵資料,其中獎金政策例如包含可在特定時間點前領獎的人員的人數比例、可在所述特定時間點後領獎的人員的人數比例、尚未領獎人員的人數比例或尚未領獎人員的獎金與市場獎金的差額等,但本發明不限於此。
員工產能資訊包含例如員工所負責之產線的產量。產量會受到市場的狀況影響。在市場萎縮時,員工的離職率將會增加。換句話說,產量較難以有效地反映出公司的營運狀況。因此,為了降低市場狀況對單一員工之離職率計算的影響,資料探勘模組122可利用員工產能資訊來計算出員工的平均每日產能變化量。相較於產量來說,平均每日產能變化量與員工的離職率之間的相關性較為顯著。
即將離職的員工時常會有經常曠職的狀況發生。因此,資料探勘模組122可通過員工的打卡資訊來即時地判斷員工是否經常地曠職,從而可推斷出該員工離職的機率。此外,資料探勘模組122還可從打卡資訊中計算員工的工作時數或加班時數等資訊,從而根據各個員工的工作時數或加班時數來計算出整體員工工作量指標。
目前的獎金政策多以員工的工作天數或年資來計算獎金。當員工的工作天數或年資到達一閾值時,該員工即可獲得獎金。員工的離職高峰往往發生在獎金發放完後的一段時間內。獎金的發放時間或金額等資訊會顯著地影響員工的離職率,因此,資料探勘模組122可根據員工基本資料、打卡資訊或市場獎金政策等資訊來產生與離職率顯著地相關的特徵資料,其中所述特徵資料例如是各年資區間的人數比例、就業市場獎金的行情(例如:就業市場獎金第三四分位數)、可在特定時間點前領獎的人員的人數比例(例如:可在N天之內領獎的人數佔全公司員工的比例,其 中N為任意正整數)、可在所述特定時間點後領獎的人員的人數比例(例如:可在N天之後但M天之內領獎的人數佔全公司員工的比例,其中M為大於N的任意正整數)、尚未領獎人員的人數比例或尚未領獎人員的獎金與市場獎金的差額。
在步驟S203,離職率預估模組123可根據特徵資料集合產生第一離職率預測結果。圖3根據本發明的實施例繪示根據特徵資料集合301產生第一離職率預測結果311的示意圖。離職率預估模組123可將特徵資料集合301輸入至多個機器學習模型。在本實施例中,所述多個機器學習模型例如為機器學習模型304、機器學習模型305以及機器學習模型306等三個機器學習模型,但本發明不限於此。例如,所述多個機器學習模型的數量可為一個、二個或超過三個。
離職率預估模組123可將特徵資料集合301的子集合302輸入至機器學習模型304以產生預測結果307。機器學習模型304例如是線性回歸(linear regression)模型、線性支持向量回歸(linear support vector regression,linear SVR)模型或徑向支持向量回歸(radial SVR)模型,但本發明不限於此。
子集合302可包括多個特徵資料。在機器學習模型304的訓練和應用過程中,離職率預估模組123可根據所述多個特徵資料配對產生多個組合(例如:包含平均每日產能變化量以及整體員工工作量指標等特徵資料的第一組合,或包含整體員工工作量指標、各年資區間的人數比例以及就業市場獎金的行情等特徵 資料的第二組合)以產生分別對應於多個組合的多個效能指標,並且從多個組合中挑選出具有最高的效能指標的組合。離職率預估模組123可根據具有最高的效能指標的組合來訓練機器學習模型304,並且將該組合輸入至訓練好的機器學習模型304以產生預測結果307,其中所述效能例如關聯於混淆矩陣(confusion matrix)中的元素,諸如召回率(recall rate)、精準度(precision)、缺失率(miss rate)或準確度(accuracy)等。
具體來說,離職率預估模組123可先對多個特徵資料(例如:包含於子集合302中的多個特徵資料)配對產生多個組合並對多個組合的每一者進行時間序列交叉驗證。圖4根據本發明的實施例繪示對特徵資料的多個組合中的特定組合進行時間序列交叉驗證的示意圖。
在進行首次的時間序列交叉驗證#1時,離職率預估模組123可從對應於多個組合中的特定組合的至少一特徵資料40中擷取出訓練資料410以及測試資料420,其中訓練資料410可不同於測試資料420。接著,離職率預估模組123可利用訓練資料410來訓練機器學習模型,並且利用測試資料420來計算對應於訓練資料410的機器學習模型的效能值。接著,離職率預估模組123可進行第二次的時間序列交叉驗證#2。
在進行第二次的時間序列交叉驗證#2時,離職率預估模組123可從對應於多個組合中的特定組合的至少一特徵資料40中擷取出訓練資料430以及測試資料440,其中訓練資料430可不同 於訓練資料410以及測試資料440,並且測試資料440可不同於測試資料420。接著,離職率預估模組123可利用訓練資料430來訓練機器學習模型,並且利用測試資料440來計算對應於訓練資料430的機器學習模型的效能值。值得注意的是,在一實施例中,對應於當前時間序列交叉驗證的訓練資料可以是對應於前一次時間序列交叉驗證的訓練資料和測試資料的組合。舉例來說,對應於第二次的時間序列交叉驗證#2的訓練資料430可以是對應於首次的時間序列交叉驗證#1的訓練資料410和測試資料420的組合。
以此類推,在利用訓練資料450以及測試資料460進行完第N次(N為任意的正整數)的時間序列交叉驗證後,離職率預估模組123可根據N次的時間序列交叉驗證的結果產生N個效能值,並且根據所述N個效能值來決定根據該特定組合所訓練出的機器學習模型的效能指標。
基於與上述的時間序列交叉驗證的步驟相同的方法,離職率預估模組123可產生分別對應於多個組合的每一者的多個效能指標,其中所述多個組合的每一者分別為一或多個特徵資料(例如:子集合302中的多個特徵資料)的組合。離職率預估模組123可根據所述多個效能指標而從多個組合中挑選出對應於最高效能指標的最佳組合(例如:具有最高的準確度的組合,其中該組合包含一或多種特徵資料)。接著,離職率預估模組123可根據對應於所述最佳組合的至少一特徵資料來訓練機器學習模型304,並且利用機器學習模型304來產生預測結果307。離職率預估模組123 可通過時間序列交叉驗證以及最佳組合的挑選來從眾多的特徵資料中過濾出能顯著地影響離職率的至少一特徵資料。如此,可大幅地降低機器學習模型304所需消耗的運算量。
基於與機器學習模型304相同的方法,離職率預估模組123可將特徵資料集合301的子集合302輸入至機器學習模型305以產生預測結果308,其中機器學習模型305例如是與機器學習模型304相異的機器學習模型。同樣地,離職率預估模組123可將特徵資料集合301的子集合302輸入至機器學習模型306以產生預測結果309,其中機器學習模型306例如是與機器學習模型304以及機器學習模型304相異的機器學習模型。輸入至機器學習模型304的子集合302、輸入至機器學習模型305的子集合302以及輸入至機器學習模型306的子集合302可以是相同的或相異的。
在產生預測結果307、預測結果308以及預測結果309後,離職率預估模組123可將預測結果307、預測結果308、預測結果309以及特徵資料集合301的子集合303輸入至機器學習模型310,其中子集合303可相同或相異於子集合302。機器學習模型310例如為線性回歸模型,但本發明不限於此。機器學習模型310可根據預測結果307、預測結果308、預測結果309以及子集合303來產生第一離職率預測結果311。
回到圖2,在步驟S204中,獎金政策模擬模組124可根據特徵資料集合301的子集合501以及獎金政策502產生第二離職率預測結果510。具體來說,獎金政策模擬模組124可將特徵資 料集合301的子集合501以及獎金政策502(或更新的獎金政策502)輸入至機器學習模型503以產生用於計算第二離職率預測結果510的預測結果506,其中子集合501可相同或相異於子集合302(或子集合303)。圖5根據本發明的實施例繪示根據獎金政策502(例如:加薪、額外獎金、員工配股或分紅等)產生第二離職率預測結果510的示意圖。機器學習模型503例如是線性回歸模型、線性支持向量回歸模型或徑向支持向量回歸模型,但本發明不限於此。
特徵資料集合301的子集合501可包括多個特徵資料。在機器學習模型503的訓練和應用過程中,獎金政策模擬模組124可根據所述多個特徵資料配對產生多個組合(例如:包含平均每日產能變化量、整體員工工作量指標以及額外獎金等特徵資料的第一組合,或包含整體員工工作量指標、各年資區間的人數比例、就業市場獎金的行情以及額外獎金等特徵資料的第二組合)以產生分別對應於多個組合的多個效能指標,並且從多個組合中挑選出具有最高的效能指標的組合。獎金政策模擬模組124可根據具有最高的效能指標的組合來訓練機器學習模型503,進而產生第二離職率預測結果510,其中所述效能例如關聯於混淆矩陣中的元素,諸如召回率、精準度、缺失率或準確度等。
具體來說,獎金政策模擬模組124可先對子集合501中的多個特徵資料配對產生多個組合並對多個組合的每一者進行如圖4所示的時間序列交叉驗證。在對多個組合中的特定組合進行 完N次(N為任意的正整數)的時間序列交叉驗證後,獎金政策模擬模組124可根據N次的時間序列交叉驗證的結果產生N個效能值,並且根據所述N個效能值來決定根據該特定組合所訓練出的機器學習模型的效能指標。
基於與上述的時間序列交叉驗證的步驟相同的方法,獎金政策模擬模組124可產生分別對應於多個組合的每一者的多個效能指標,其中所述多個組合的每一者分別為一或多個特徵資料的組合。獎金政策模擬模組124可根據所述多個效能指標而從多個組合中挑選出對應於最高效能指標的最佳組合(例如:具有最高的準確度的組合,其中該組合包含一或多種特徵資料)。接著,獎金政策模擬模組124可根據對應於所述最佳組合的至少一特徵資料以及獎金政策502(或更新的獎金政策502)來訓練機器學習模型503,並且將所述至少一特徵資料以及獎金政策502(或更新的獎金政策502)輸入至機器學習模型503以產生預測結果506。獎金政策模擬模組124可通過時間序列交叉驗證以及最佳組合的挑選來從眾多的特徵資料中過濾出能顯著地影響離職率的至少一特徵資料。如此,可大幅地降低機器學習模型503所需消耗的運算量。
基於與機器學習模型503相同的方法,獎金政策模擬模組124可將特徵資料集合301的子集合501以及獎金政策502(或更新的獎金政策502)輸入至機器學習模型504以產生預測結果507,其中機器學習模型504例如是與機器學習模型503相異的機 器學習模型。同樣地,獎金政策模擬模組124可將特徵資料集合301的子集合501以及獎金政策502(或更新的獎金政策502)輸入至機器學習模型505以產生預測結果508,其中機器學習模型505例如是與機器學習模型503以及機器學習模型504相異的機器學習模型。輸入至機器學習模型503的子集合501、輸入至機器學習模型504的子集合501以及輸入至機器學習模型505的子集合501可以是相同的或相異的。
在產生預測結果506、預測結果507以及預測結果508後,獎金政策模擬模組124可將預測結果506、預測結果507、預測結果508以及獎金政策502(或更新的獎金政策502)輸入至機器學習模型509。機器學習模型509例如為線性回歸模型,但本發明不限於此。機器學習模型509可根據預測結果506、預測結果507、預測結果508以及獎金政策502(或更新的獎金政策502)來產生第二離職率預測結果510。在一實施例中,第二離職率預測結果510可作為更新獎金政策502的參考資料。獎金政策模擬模組124可根據第二離職率預測結果510來更新獎金政策502。
回到圖2,在步驟S205中,獎金政策模擬模組124可判斷是否更新獎金政策502。舉例來說,獎金政策模擬模組124可響應於第二離職率預測結果510指示離職率大於閾值而決定更新獎金政策502,並且響應於第二離職率預測結果510指示離職率小於或等於閾值而決定不更新獎金政策502。若獎金政策模擬模組124決定更新獎金政策502,則進入步驟S206。若獎金政策模擬模組 124決定不更新獎金政策502,則進入步驟S208。
在步驟S206中,獎金政策模擬模組124可更新獎金政策502。舉例來說,獎金政策模擬模組124可根據儲存於儲存媒體120中的預設規則或訓練好的機器學習模型以基於第二離職率預測結果510來更新獎金政策502。另一方面,更新獎金政策502也可以是由使用者根據第二離職率預測結果510而決定的。例如,使用者可通過鍵盤或觸控螢幕等輸入裝置將更新的獎金政策502輸入至電子裝置100。電子裝置100可通過收發器130接收更新的獎金政策502。在更新完獎金政策502後,獎金政策模擬模組124可根據更新的獎金政策502以重新執行步驟S204。更具體來說,在更新完獎金政策502後,獎金政策模擬模組124可根據先前所產生的對應於所述最佳組合的至少一特徵資料以及更新的獎金政策502來訓練機器學習模型503(或機器學習模型504、機器學習模型505)。
在步驟S207中,資訊顯示模組125可顯示第一離職率預測結果311。具體來說,資訊顯示模組125可通過收發器130將第一離職率預測結果311的相關資訊傳送至外部輸出裝置(例如:顯示器),從而通過外部輸出裝置來顯示第一離職率預測結果311以供人力資源管理者作為決定人力資源的調整策略的參考。
在步驟S208中,資訊顯示模組125可顯示第二離職率預測結果510。具體來說,資訊顯示模組125可通過收發器130將第二離職率預測結果510的相關資訊傳送至外部輸出裝置(例如: 顯示器),從而通過外部輸出裝置來顯示第二離職率預測結果510以供人力資源管理者作為決定人力資源的調整策略的參考。
在一實施例中,資訊顯示模組125可產生對應於第一離職率預測結果311以及第二離職率預測結果510的綜合判斷結果,並且通過收發器130以傳送所述綜合判斷結果至外部輸出裝置,從而通過外部輸出裝置來顯示所述綜合判斷結果以供人力資源管理者作為決定人力資源的調整策略的參考。
綜上所述,本發明可根據基於人工智慧以及大數據的預測模型來進行員工離職率的預測。本發明可通過具有分層結構的機器學習模型架構來產生離職率預測結果。在預測離職率時,本發明不僅考量了公司的內部因素,更考量了公司的內部因素以及新的獎金政策。如此,本發明可基於包含了公司的內部因素與外部因素的大數據來改善離職率預測結果的準確度,令人力資源管理者能基於更準確的離職率預測結果為公司決定最佳的人力資源調整策略。
S201、S202、S203、S204、S205、S206、S207、S208:步驟

Claims (18)

  1. 一種用於預測離職率的電子裝置,包括:收發器;儲存媒體,儲存多個模組;以及處理器,耦接所述儲存媒體和所述收發器,並且存取和執行所述多個模組,其中所述多個模組包括:資料收集模組,通過所述收發器接收人力資源資料;資料探勘模組,根據所述人力資源資料產生特徵資料集合,其中所述特徵資料集合包括第一子集合、第二子集合及第三子集合;以及離職率預估模組,將所述第一子集合輸入至第一機器學習模型以產生第一預測結果,將第二子集合輸入至第二機器學習模型以產生第二預測結果,將所述第一預測結果、所述第二預測結果和所述第三子集合輸入至第三機器學習模型以產生第一離職率預測結果,其中所述離職率預估模組對所述第一子集合進行時間序列交叉驗證以產生所述第一預測結果。
  2. 如請求項1所述的電子裝置,其中所述特徵資料集合更包括第四子集合,並且所述多個模組更包括:獎金政策模擬模組,將所述第四子集合以及獎金政策輸入至第四機器學習模型產生第三預測結果,並且將所述第三預測結果以及所述獎金政策輸入至第五機器學習模型以產生第二離職率預 測結果。
  3. 如請求項2所述的電子裝置,其中所述獎金政策模擬模組基於所述獎金政策被更新而根據更新的所述獎金政策產生更新的所述第二離職率預測結果。
  4. 如請求項1所述的電子裝置,其中所述第一子集合包括多個特徵資料,所述離職率預估模組根據所述多個特徵資料配對產生多個組合以分別產生多個效能指標,選擇所述多個組合中對應於最高的效能指標的組合,並且將所述組合輸入至所述第一機器學習模型以產生所述第一預測結果。
  5. 如請求項2所述的電子裝置,其中所述獎金政策模擬模組對所述第四子集合進行時間序列交叉驗證以產生所述第三預測結果。
  6. 如請求項2所述的電子裝置,其中所述第四子集合包括多個特徵資料,所述獎金政策模擬模組根據所述多個特徵資料配對產生多個組合以分別產生多個效能指標,選擇所述多個組合中對應於最高的效能指標的組合,並且將所述組合輸入至所述第四機器學習模型以產生所述第三預測結果。
  7. 如請求項1所述的電子裝置,其中所述人力資源資料包括員工基本資料、打卡資訊、內部招募政策、員工產能資訊以及市場獎金政策的至少其中之一。
  8. 如請求項1所述的電子裝置,其中所述特徵資料集合包括平均每日產能變化量、整體員工工作量指標、各年資區間的人 數比例、就業市場獎金的行情、可在特定時間點前領獎的人員的人數比例、可在所述特定時間點後領獎的人員的人數比例、尚未領獎人員的人數比例以及尚未領獎人員的獎金與市場獎金的差額中的至少其中之一。
  9. 如請求項1所述的電子裝置,其中所述第一機器學習模型包括線性回歸模型、線性支持向量回歸模型以及徑向支持向量回歸模型的其中之一,並且所述第三機器學習模型包括第二線性回歸模型。
  10. 一種用於預測離職率的方法,包括:接收人力資源資料;根據所述人力資源資料產生特徵資料集合;將所述特徵資料集合的第一子集合輸入至第一機器學習模型以產生第一預測結果;將所述特徵資料集合的第二子集合輸入至第二機器學習模型以產生第二預測結果;以及將所述第一預測結果、所述第二預測結果和所述特徵資料集合的第三子集合輸入至第三機器學習模型以產生第一離職率預測結果,其中將所述特徵資料集合的所述第一子集合輸入至所述第一機器學習模型以產生所述第一預測結果的步驟包括:對所述第一子集合進行時間序列交叉驗證以產生所述第一預測結果。
  11. 如請求項10所述的方法,更包括:將所述特徵資料集合的第四子集合以及獎金政策輸入至第四機器學習模型產生第三預測結果,並且將所述第三預測結果以及所述獎金政策輸入至第五機器學習模型以產生第二離職率預測結果。
  12. 如請求項11所述的方法,更包括:基於所述獎金政策被更新而根據更新的所述獎金政策產生更新的所述第二離職率預測結果。
  13. 如請求項10所述的方法,其中所述第一子集合包括多個特徵資料,並且將所述特徵資料集合的所述第一子集合輸入至所述第一機器學習模型以產生所述第一預測結果的步驟包括:根據所述多個特徵資料配對產生多個組合以分別產生多個效能指標;選擇所述多個組合中對應於最高的效能指標的組合;以及將所述組合輸入至所述第一機器學習模型以產生所述第一預測結果。
  14. 如請求項11所述的方法,其中將所述特徵資料集合的所述第四子集合以及所述獎金政策輸入至所述第四機器學習模型來產生所述第三預測結果的步驟包括:對所述第四子集合進行時間序列交叉驗證以產生所述第三預測結果。
  15. 如請求項11所述的方法,其中所述第四子集合包括多個特徵資料,並且將所述特徵資料集合的所述第四子集合以及所述獎金政策輸入至所述第四機器學習模型來產生所述第三預測結果的步驟包括:根據所述多個特徵資料配對產生多個組合以分別產生多個效能指標;選擇所述多個組合中對應於最高的效能指標的組合;以及將所述組合輸入至所述第四機器學習模型產生所述第三預測結果。
  16. 如請求項10所述的方法,其中所述人力資源資料包括員工基本資料、打卡資訊、內部招募政策、員工產能資訊以及市場獎金政策的至少其中之一。
  17. 如請求項10所述的方法,其中所述特徵資料集合包括平均每日產能變化量、整體員工工作量指標、各年資區間的人數比例、就業市場獎金的行情、可在特定時間點前領獎的人員的人數比例、可在所述特定時間點後領獎的人員的人數比例、尚未領獎人員的人數比例以及尚未領獎人員的獎金與市場獎金的差額中的至少其中之一。
  18. 如請求項10所述的方法,其中所述第一機器學習模型包括線性回歸模型、線性支持向量回歸模型以及徑向支持向量回歸模型的其中之一,並且所述第三機器學習模型包括第二線性回歸模型。
TW109113664A 2020-04-23 2020-04-23 用於預測離職率的電子裝置和方法 TWI777154B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW109113664A TWI777154B (zh) 2020-04-23 2020-04-23 用於預測離職率的電子裝置和方法
CN202110183039.1A CN113554208A (zh) 2020-04-23 2021-02-08 用于预测离职率的电子装置和方法
US17/192,756 US20210334681A1 (en) 2020-04-23 2021-03-04 Electronic device and method for turnover rate prediction

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW109113664A TWI777154B (zh) 2020-04-23 2020-04-23 用於預測離職率的電子裝置和方法

Publications (2)

Publication Number Publication Date
TW202141368A TW202141368A (zh) 2021-11-01
TWI777154B true TWI777154B (zh) 2022-09-11

Family

ID=78101680

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109113664A TWI777154B (zh) 2020-04-23 2020-04-23 用於預測離職率的電子裝置和方法

Country Status (3)

Country Link
US (1) US20210334681A1 (zh)
CN (1) CN113554208A (zh)
TW (1) TWI777154B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230131099A1 (en) * 2021-10-22 2023-04-27 Sap Se Machine learning based performance prediction
TWI807780B (zh) * 2022-04-15 2023-07-01 和碩聯合科技股份有限公司 離職率預測方法及其電子裝置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140180756A1 (en) * 2012-12-21 2014-06-26 Roth Staffing Companies, L.P. Method and System for Modeling Workforce Turnover Propensity
CN106022708A (zh) * 2016-05-09 2016-10-12 陈包容 一种预测员工离职的方法
CN108280542A (zh) * 2018-01-15 2018-07-13 深圳市和讯华谷信息技术有限公司 一种用户画像模型的优化方法、介质以及设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140180756A1 (en) * 2012-12-21 2014-06-26 Roth Staffing Companies, L.P. Method and System for Modeling Workforce Turnover Propensity
CN106022708A (zh) * 2016-05-09 2016-10-12 陈包容 一种预测员工离职的方法
CN108280542A (zh) * 2018-01-15 2018-07-13 深圳市和讯华谷信息技术有限公司 一种用户画像模型的优化方法、介质以及设备

Also Published As

Publication number Publication date
CN113554208A (zh) 2021-10-26
TW202141368A (zh) 2021-11-01
US20210334681A1 (en) 2021-10-28

Similar Documents

Publication Publication Date Title
Von Hippel et al. The data revolution comes to higher education: identifying students at risk of dropout in Chile
TWI777154B (zh) 用於預測離職率的電子裝置和方法
US9861308B2 (en) Method and system for monitoring stress conditions
WO2017215403A1 (zh) 一种用户信用评估方法、装置及存储介质
US11151418B2 (en) Interactive modeling application adapted for execution via distributed computer-based systems
US20160100826A1 (en) Predicted menstruation start date calculation apparatus, program, and body analysis apparatus
CN113222403B (zh) 基于大数据的电力调节方法、装置、存储介质及电子设备
WO2018113469A1 (zh) 一种资源分配方法和装置
Giannetti A framework for improving process robustness with quantification of uncertainties in Industry 4.0
Ieva et al. A semiparametric bivariate probit model for joint modeling of outcomes in STEMI patients
CN116883065A (zh) 商户风险预测方法及装置
WO2023106960A1 (ru) Способ прогнозирования наступления медицинского события в здоровье человека
JP2013182471A (ja) プラントオペレーションの負荷評価装置
CN112766576A (zh) 一种基于数据库的参数结果预测方法及***
Panfilov et al. SOLUTION OF FORECASTING PROBLEMS USING NEURAL NETWORKS FOR REGIONAL OPERATIONAL CONTROL CENTERS
JP5826893B1 (ja) 変化点予測装置、変化点予測方法、及びコンピュータプログラム
CN116542495B (zh) 一种基于数据挖掘的智能供水调度方法、装置及电子设备
US20150262204A1 (en) Sales and fundraising computer management system with staged display.
Xiao et al. Complexity-based Financial Stress Evaluation
WO2021240714A1 (ja) 心理状態分析方法、心理状態分析装置及びプログラム
Guerin et al. Cost-benefit analysis
CN116486997A (zh) 健康管理积分计算方法及装置、存储介质、计算机设备
JP2022175422A (ja) コンピュータプログラム、情報処理装置、及び情報処理方法
Lo Online customer identification based on Bayesian model of interpurchase times and recency
Nazarov et al. Development of Fuzzy Model for Calculating the Poverty of the Region

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent