TWI526856B

TWI526856B - 服務需求分析系統、方法與電腦可讀取記錄媒體

Info

Publication number: TWI526856B
Application number: TW103136496A
Authority: TW
Inventors: 蔡其杭; 陳棅易; 朱俊諺; 鄭少樺
Original assignee: 財團法人資訊工業策進會
Priority date: 2014-10-22
Filing date: 2014-10-22
Publication date: 2016-03-21
Also published as: JP6016872B2; US9652472B2; JP2016085717A; TW201616376A; US20160117345A1

Description

服務需求分析系統、方法與電腦可讀取記錄媒體

本揭示內容為有關於需求分析系統、方法與電腦可讀取媒體，特別是一種有關於服務需求分析系統、方法與電腦可讀取媒體。

隨著網際網路的進步，越來越多提供服務的廠商將營業資訊公告於網路黃頁或是類似網站(如奇集集、518等)，使用者透過搜尋網際網路的內容，找尋符合需求的服務供應者，由於網路上資訊豐富且更新快速，使用者能夠享有更多的選擇。另外，也有針對特定產業的媒合平台網站(如5945呼叫師父等)，使用者透過填寫特定格式的需求單，再由媒合平台網站以人力分析所填寫之需求單內容，找到符合使用者需求的服務供應者。

在搜尋網路黃頁與類似網站時，使用者係輸入特定關鍵字尋找服務供應者，搜尋引擎則藉由輸入之關鍵字延伸搜尋結果，形成關鍵字集合以確保搜尋資訊沒有遺漏。而使用媒合平台網站時，媒合平台網站則根據特定的服務類型訂定需求單格式，使使用者可以根據所列之屬性欄位填入對應資訊，確保服務需求被精準的表示，以便媒合平台網站的服務人員找尋符合服務需求的服務供應者。

然而，上述方案均有不便之處，首先，若使用者使用網路黃頁或類似網站，需訂出多個精準的關鍵字以確保搜尋結果之相關性，因關鍵字所代表的語意無法僅由單一字詞表達，例如使用者輸入「玉山」時，可能欲搜尋玉山銀行，亦有可能欲搜尋位於南投的玉山。另外網路資訊過多，因此使用者往往需在大量搜尋結果中，自行聯絡服務供應者以約定服務時間與地點，過程十分繁瑣。而使用媒合平台網站時，媒合平台網站則需以人力進行分析服務需求，使用者僅能接受媒合平台網站所提供之服務供應者。

因此，亟需一種服務需求分析系統與方法，來解決傳統服務需求分析方法使用網路黃頁等網站以及媒合平台網站所造成的搜尋困難、人力耗費以及時間地點安排缺乏效率的問題。

本揭示內容之一態樣為一種服務需求分析系統，包含服務供應資料庫與分析伺服器。服務供應資料庫內含服務供應者資訊。分析伺服器連接至服務供應資料庫，且連接至用戶端裝置。分析伺服器包含處理器與記憶體，且記憶體儲存至少一指令，處理器執行指令以進行以下動作，包括自用戶端裝置接收需求字串，進行斷詞處理與過濾以得到需求關鍵字，計算需求關鍵字任兩者間之關聯數值，根據需求關鍵字與關聯數值進行分群，以將該些需求關鍵字分為多個需求關鍵字群組，並建立各需求關鍵字群組內之語意階層架構供搜尋服務供應資料庫使用，以取得一個或多個符合需求字串的服務供應者資訊，傳送該些服務供應者資訊至用戶端裝置，使用戶端裝置呈現符合需求字串的服務供應者資訊於用戶端裝置。

於一實施例中，分析伺服器之處理器進行分群之動作包含根據該些需求關鍵字及該些關聯數值建構一需求關鍵字網路圖，並透過下限閥值對該些關聯數值進行過濾，以調整該需求關鍵字網路圖的連接關係，以利進行分群。

於一實施例中，分析伺服器之處理器進行建立該些需求關鍵字群組每一者內之語意階層架構之動作，且該動作包含確認需求關鍵字群組中任兩者間之關聯方向性，以及根據關聯方向性判斷每一需求關鍵字群組中之概念根關鍵字。

於一實施例中，分析伺服器之處理器進行之動作包含自用戶端裝置取得行事曆資訊與地點資訊，並根據行事曆資訊與地點資訊過濾呈現於用戶端裝置的服務供應者資訊。

於一實施例中，分析伺服器之處理器進行之動作包含自需求字串中取得時間資訊與地點資訊，並根據時間資訊與地點資訊過濾呈現於用戶端裝置的服務供應者資訊。

該服務供應資料庫以階層式結構儲存該些筆服務供應者資訊，該分析伺服器執行軟體以該些語意階層架構在該服務供應資料庫中進行階層式搜尋。

本揭示內容之另一態樣為一種服務需求分析方法，包含以下步驟：自用戶端裝置接收需求字串，對需求字串進行斷詞處理與過濾，得到多個需求關鍵字；計算需求關鍵字任兩者間之關聯數值，並根據需求關鍵字與關聯數值進行分群，以將多個需求關鍵字分為一或多個需求關鍵字群組；建立需求關鍵字群組每一者內之語意階層架構，利用語意階層架構在服務供應資料庫內進行搜尋，以取得符合需求字串的服務供應者資訊；以及傳送服務供應者資訊至用戶端裝置，使得用戶端裝置呈現符合需求字串的服務供應者資訊。

於一實施例中，服務需求分析方法中將需求關鍵字分為需求關鍵字群組之步驟包含：根據需求關鍵字與關聯數值建構一需求關鍵字網路圖，並透過下限閥值對關聯數值進行過濾，以調整需求關鍵字網路圖的連接關係，以利進行分群。

於一實施例中，建立需求關鍵字群組每一者內之語意階層架構之步驟包含：確認需求關鍵字群組中任兩者間之關聯方向性；以及根據關聯方向性判斷每一需求關鍵字群組中之概念根關鍵字。

於一實施例中，服務需求分析方法更包含：自用戶端裝置中取得行事曆資訊與地點資訊，並根據行事曆資訊與地點資訊過濾呈現於用戶端裝置的服務供應者資訊。

於一實施例中，服務需求分析方法更包含：自需求字串中取得時間資訊與地點資訊，並根據時間資訊與地點資訊過濾呈現於用戶端裝置的服務供應者資訊。

於一實施例中，服務需求分析方法之搜尋服務供應資料庫的步驟中，以語意階層架構在服務供應資料庫中進行階層式搜尋，且服務供應資料庫以階層式結構儲存該些筆服務供應者資訊。

本揭示內容之又一態樣為一種電腦可讀取記錄媒體，儲存一電腦程式，用以執行一種服務需求分析方法，包含以下步驟：自用戶端裝置接收需求字串，對需求字串進行斷詞處理與過濾，得到多個需求關鍵字；計算需求關鍵字任兩者間之關聯數值，並根據需求關鍵字與關聯數值進行分群，以將多個需求關鍵字分為一或多個需求關鍵字群組；建立需求關鍵字群組每一者內之語意階層架構，利用語意階層架構在服務供應資料庫內進行搜尋，以取得符合需求字串的服務供應者資訊；以及傳送該些服務供應者資訊至用戶端裝置，使得用戶端裝置呈現符合需求字串的服務供應者資訊。

綜上所述，透過應用上述之實施例，可解決傳統透過網路黃頁以及媒合平台網站提供服務時之問題，讓使用者能夠以自然語言輸入服務需求，而無需找尋精確關鍵字，並且以自然語言輸入亦提供語境以自動化服務需求分析過程，以語意分析結果進行精確的搜尋，省卻媒合平台以人工進行分析所耗費的人力。再者，可透過時間與地點資訊過濾符合服務需求之服務供應者，進一步省去使用者需自行與服務供應者協調進行服務的時間與地點的繁瑣過程。

100‧‧‧服務需求分析系統

110‧‧‧分析伺服器

112‧‧‧處理器

114‧‧‧記憶體

120‧‧‧服務供應資料庫

130‧‧‧用戶端裝置

132‧‧‧處理元件

134‧‧‧顯示元件

136‧‧‧儲存元件

138‧‧‧輸入元件

140‧‧‧語料庫

210‧‧‧需求字串

220‧‧‧需求關鍵字

230‧‧‧需求關鍵字網路圖

240‧‧‧語意階層架構

250/260‧‧‧需求關鍵字群組

251‧‧‧陽台

252‧‧‧壁癌

253‧‧‧維修

261‧‧‧廚房

262‧‧‧水管

263‧‧‧漏水

264‧‧‧水槽

265‧‧‧更換

300‧‧‧服務需求分析方法

S310~S380‧‧‧步驟

410‧‧‧需求字串

420‧‧‧字串處理模組

422‧‧‧斷詞模組

424‧‧‧文字過濾分類模組

430‧‧‧關聯計算過濾模組

440‧‧‧服務需求分析模組

442‧‧‧關鍵字分群模組

444‧‧‧動態分群驗證模組

446‧‧‧關聯方向性確認模組

448‧‧‧概念根節點判別模組

450‧‧‧使用者資訊模組

460‧‧‧資訊媒合模組

470‧‧‧資訊呈現模組

〔圖1〕係說明根據本揭示內容第一實施例之服務需求分析系統的示意圖；〔圖2〕係說明根據本揭示內容第一實施例的需求字串處理的資料示意圖；〔圖3〕係說明根據本揭示內容第二實施例之服務需求分析方法的流程圖；以及〔圖4〕係說明根據本揭示內容第三實施例之實作服務需求分析方法的軟體架構圖。

以下將以圖式及詳細說明清楚揭露技術內容，其目的並非用以限制本揭示內容，另外，任何所屬技術領域中具有通常知識者在瞭解所列實施例後，當可由本揭示內容所教示之技術，加以改變及修飾，並不脫離本揭示內容之精神與範圍。

圖1為根據本揭示內容第一實施例所繪示之服務需求分析系統的示意圖。服務需求分析系統100包含一分析伺服器110、一服務供應資料庫120以及一用戶端裝置130。服務供應資料庫120內儲存有多筆服務供應者的資訊，例如裝修服務廠商、冷氣維修服務廠商、以及抓漏廠商等，分析伺服器110接收使用者透過用戶端裝置130輸入的需求字串，且需求字串係以自然語言表達之服務需求，例如「我家馬桶壞了不停沖水，需要維修」，分析伺服器110以自動化方式對需求字串進行分析處理，讓使用者不需自行訂定關鍵字，也能夠取得精準的搜尋結果。

具體而言，分析伺服器110自需求字串中取得使用者需要的服務需求之類別以及服務需求細節等資訊，接著根據服務需求分析的結果搜尋服務供應資料庫120，取得符合使用者輸入之需求字串的多筆服務供應者資訊，並將所得服務供應者資訊呈現於用戶端裝置130。以下將詳細說明各元件之功能與服務需求分析系統100之運作流程。

分析伺服器110包含一處理器112與一記憶體114。用戶端裝置130連線至分析伺服器110，使用者在用戶端裝置130所輸入之需求字串係透過連線傳送至分析伺服器110。記憶體114上儲存有至少一指令，處理器112執行指令以處理所接收之需求字串。

分析伺服器110為一伺服器(Server)、一工作站(Workstation)或一個人電腦(Personal Computer)，處理器112為一中央處理器(Central Processing Unit)或微控制器(Microcontroller)，記憶體114為一硬碟(Hard Disk)、光碟(Optical Disc)、或一快閃記憶體(Flash Memory)。

用戶端裝置130包含一處理元件132、一顯示元件134、一儲存元件136與一輸入元件138。於一實施例中，用戶端裝置130為一智慧型手機(Smart phone)或一平板電腦(Tablet)，處理元件132為一微處理器(Microprocessor)，顯示元件134為一液晶螢幕(LCD)或一有機發光二極體(OLED)螢幕，儲存元件136為一SD記憶卡或一快閃記憶體(Flash Memory)，輸入元件138為一實體鍵盤或與顯示元件134結合為一觸控螢幕(Touchscreen)。於另一實施例中，用戶端裝置130為一個人主機(Personal Computer)，處理元件132為一中央處理器(Central Processing Unit)，顯示元件134為一液晶螢幕(LCD)或一發光二極體(LED)螢幕，儲存元件136為一硬碟(Hard Disk)、光碟(Optical Disc)或一固態硬碟(SSD)，輸入元件138為一鍵盤滑鼠組。

圖2為根據本揭示內容第一實施例的需求字串處理的資料示意圖。使用者以自然語言輸入需求字串210，接著分析伺服器110對需求字串210進行斷詞處理(Chinese Word Segmentation)，並過濾掉斷詞結果中不重要的字詞，如介詞、連接詞、語助詞、以及代名詞等，再過濾掉時間詞、地方詞與位置詞，以取出多個需求關鍵字220。

於本實施例中，需求字串210為「我家廚房水管壞了，嚴重漏水，水槽需要更換，還有陽台的壁癌也需要維修」，而取出之需求關鍵字220為[廚房，水管，漏水，水槽，更換，陽台，壁癌，維修]。

於一實施例中，分析伺服器110使用中央研究院所開發的中文斷詞系統(Chinese Knowledge and Information Processing,CKIP)進行斷詞，並利用其詞性判斷結果進行過濾。於另一實施例中，分析伺服器110使用全文搜尋引擎Lucene內建的中文分詞器進行斷詞。以上所舉斷詞系統僅為示例，本領域具通常知識者可自行選用適當的斷詞引擎，並不限於本揭示內容所舉示例。

分析伺服器110在取得需求關鍵字220後，計算需求關鍵字220中任兩者間之關聯數值，此關聯數值為任兩個關鍵字間語意相似度(Semantic Similarity)或語意相關度(Semantic Relatedness)的量化結果，於本實施例中，分析伺服器110又連接至一語料庫(Corpus)140，並使用正規化Google距離(Normalized Google Distance,NGD)量化任兩個關鍵字間的共現(Co-occurrence)程度作為語意相似度。舉例而言，若有兩個需求關鍵字t1與t2，正規化Google距離之計算公式如下：

其中g(t1)與g(t2)分別代表單獨以t1和t2為關鍵字在語料庫140中進行搜尋所得的搜尋結果數，而g(t1,t2)代表以t1和t2同時作為關鍵字進行搜尋所得的搜尋結果數，而N則為語料庫140中的資料總數。

於一實施例中，以Google搜尋引擎可存取資料作為語料庫140，利用Google搜尋結果以計算關鍵字間的NGD作為關聯數值。於另一實施例中，以維基百科(Wikipedia)所有條目作為語料庫140，並以Solr搜尋伺服器進行搜尋，以計算需求關鍵字220間的關聯數值。於又一實施例中，本領域具通常知識者亦可選擇其他與語意分析有關的開源程式庫(Open Source Library)，如語意量化程式庫(Semantic Measure Library)等，來量化兩個關鍵字間的語意相關度作為關聯數值。

傳統上，為理解需求字串中的需求關鍵字，需要將需求關鍵字220與人工建立的本體論(Ontology)網路進行比對，以了解需求字串210所要表達之語意內容，然而，若需求字串210所使用詞彙與本體論網路使用詞彙稍有不同，則會造成比對困難。另外，建立跨領域的本體論網路需大量人工介入，並不經濟。因此，本揭示內容提供自動化分群以及取出需求字串210中核心概念的方法。

分析伺服器110執行分群分析(Clustering Analysis)，根據需求關鍵字220與關聯數值對需求關鍵字220進行分群。分群演算法種類繁多，包含結構式分群(Hierarchical Clustering)演算法、K-means及其衍生演算法以及圖論分群(Graph Clustering)演算法，本領域具通常知識者可視其需要選用適合的分群演算法。

於一實施例中，分析伺服器110利用K-means演算法來進行分群，首先隨機找出K個關鍵字作為起始的分群質心，接著將各關鍵字歸類到關聯數值最大的分群質心，全部的關鍵字皆分類完成後，計算出新的分群質心位置，重複上述兩個步驟迭代運算至分群質心位置不再改變為止。實作上需求關鍵字群組250/260的分群質心間的關聯數值小於某一門檻值，而需求關鍵字群組250/260內的各需求關鍵字與分群質心間的關聯數值均大於另一門檻值，表示所得分群結果各需求關鍵字群組間差異大，而群組內差異小。

於另一實施例中，將每一需求關鍵字視為一節點，各節點間以一邊(edge)相連，形成一需求關鍵字網路圖230，需求關鍵字網路圖230為一無向圖(Undirected Graph)。分析伺服器110接著處理需求關鍵字網路圖230，將關聯數值低於一下限閥值的兩個需求關鍵字間的相連邊移除，以利進行接下來的分群步驟，請參照圖2之需求關鍵字網路圖230，水槽和壁癌間並無連接邊，係因經過下限閥值之過濾所致。於一實施例中，下限閥值訂為0.1，以濾除語意相關度較低的節點間的相連邊。於另一實施例中，下限閥值定為0.5。以上所舉數值僅為示例，並非用以限定本發明，本領域具通常知識者可視其需要調整下限閥值。

分析伺服器110採用K-core分群演算法處理需求關鍵字網路圖230以進行分群，需注意到，K-core分群演算法移除需求關鍵字網路圖230中不重要的連接邊與節點，使所產生之子圖(Subgraph)中每一節點皆與至少K個其他節點有連接關係，各個子圖即屬於同一需求關鍵字群組。

在又一實施例中，由於分析伺服器110進行K-core演算法之結果與過濾需求關鍵字網路圖230時使用的下限閥值有關，若下限閥值設定過低，則K-core演算法無法準確分離不同概念的文字，因此使用動態分群驗證來調整過濾需求關鍵字網路圖230所使用的下限閥值。首先將需求關鍵字220中任兩個需求關鍵字間的關聯數值由小而大排序為一關聯數值序列，接著利用二分搜尋(Binary Search)的概念，先以關聯數值序列的中位數(Median Value)作為下限閥值過濾需求關鍵字網路圖230，接著分析伺服器110以K為2執行K-core演算法，若可以分出兩個核心概念以上，則以關聯數值序列的第三四分位數(Third Quartile)作為下限閥值過濾需求關鍵字網路圖230，若亦能分出兩個概念以上，則以第三四分位數為下限閥值。若使用中位數無法分出兩個核心概念以上，則以第一四分位數(First Quartile)作為下限閥值過濾需求關鍵字網路圖230，若以第一四分位數亦不能分出兩個核心概念以上，則判斷需求字串210中僅具一個核心概念。

需求關鍵字220可分為多個需求關鍵字群組250/260。分析伺服器110更進一步建立需求關鍵字群組250/260內之語意階層架構240，也就是說需求關鍵字群組250/260僅為需求關鍵字的集合，但語意階層架構240內各需求關鍵字間的關聯具有方向性，並以關聯方向性找出各需求關鍵字群組250/260內最重要的概念根關鍵字。

於一實施例中，結合正規Google距離與條件機率之概念以確認需求關鍵字群組間需求關鍵字t1與t2關聯的方向性，判斷時所使用之數學算式如下：

g(t1,t2)、g(t1)與g(t2)函數之定義如NGD計算公式中定義，其中CP(t1→t2)代表當需求關鍵字t2出現在語料庫140之一文件中時，該文件同時出現需求關鍵字t1的機率，因此，當CP(t1→t2)較CP(t2→t1)大時，表示需求關鍵字t2為需求關鍵字t1之下位需求關鍵字，因此需求關鍵字t1指向需求關鍵字t2。

於另一實施例中，使用PageRank演算法評估需求關鍵字群組250/260內需求關鍵字間的關聯方向性與概念根關鍵字，PageRank演算法係分析網頁間彼此引用的關係，當一個網頁被引用的次數越多，表示越為基本與重要，PageRank值亦越高因此適用於尋找需求關鍵字群組250/260內之概念根關鍵字，計算PageRank之算式如下：

其中PageRank(t1)為需求關鍵字t1的PageRank值，而d為阻尼係數，官方預設為0.85，N為一需求關鍵字群組內之需求關鍵字總數量，B(t1)為該需求關鍵字群組內與需求關鍵字t1相連的所有需求關鍵字，而O(t2)則為該需求關鍵字群組內需求關鍵字t2的連線邊數。

於又一實施例中，需求字串210亦包含一標題部分，分析伺服器110結合詞彙頻率(Term Frequency,TF)的概念與K近鄰(K Nearest Neighbor,KNN)演算法建立關聯方向性並找出概念根關鍵字，使用詞彙頻率的概念可量化兩個需求關鍵字在語料庫140所含資料中於同一句子內出現的頻率，若兩個需求關鍵字在同一句子中出現的頻率高，表示此兩個需求關鍵字相關程度高。具體而言，本實施例中亦強化需求字串210中標題部分的重要性，若兩個需求關鍵字同時出現於標題或關鍵字中，則將兩需求關鍵字t _i與t _j間之一第二關聯數值r _ij設為1，若兩個需求關鍵字並無同時出現在標題或關鍵字中，則根據語料庫140以下列式子計算第二關聯數值r _ij：

其中g(t _i)和g(t _j)分別為以需求關鍵字t _i和需求關鍵字t _j為關鍵字之TF-IDF(Term frequency-inverse document frequency)數值，而g(t _i,t _j)代表需求關鍵字t _i和需求關鍵字t _j的TF-IDF(Term frequency-inverse document frequency)數值，亦即，需求關鍵字t _i和需求關鍵字t _j同時出現在需求字串中，與語料庫140中同時具備這兩個關鍵字的文件數目。

分析伺服器110根據上述第二關聯數值r _ij，分別建立需求關鍵字群組250/260之一加權連通圖(weighted connected graph)，同一需求關鍵字群組內每一需求關鍵字視為一節點，兩節點間之邊權重為第二關聯數值r _ij，而點權重為需求關鍵字在語料庫140中TF-IDF(Term frequency-inverse document frequency)的加總以及該需求關鍵字與需求關鍵字群組中其他需求關鍵字之第二關聯數值的平均。分析伺服器110對需求關鍵字群組250內每一需求關鍵字取K個第二關聯數值最高的相鄰需求關鍵字，形成一候選關鍵字群組，接著於候選關鍵字群組所對應之子圖中，以TF-IDF數值作為上述條件機率所使用的函數以判斷需求關鍵字間的關聯方向性，或是採用PageRank演算法，在子圖中建立兩需求關鍵字間的關聯方向性，並根據關聯方向性判斷概念根關鍵字。分析伺服器110 對需求關鍵字群組260內之需求關鍵字亦以同樣方式處理，以得出語意階層架構。

圖2中繪示需求關鍵字群組250/260的語意階層架構240，分析伺服器110在建立語意階層架構240後，根據語意階層架構240在服務資供應資料庫120進行搜尋，以取得符合需求字串210的服務供應者資訊，並在用戶端裝置130呈現符合需求字串210的服務供應者資訊。需求關鍵字群組250之概念根關鍵字為陽台251，壁癌252與維修253均指向陽台251，而需求關鍵字群組260之概念根關鍵字則為廚房261，廚房261之下又分為水管262與水槽264，漏水263指向水管262，且更換265指向水槽264。

於一實施例中，服務供應資料庫120內各服務供應者資訊中包含可提供服務的時段以及服務區域範圍等資訊，分析伺服器110自用戶端裝置130取得使用者之行事曆資訊與地點資訊，並根據行事曆資訊與地點資訊過濾呈現於用戶端裝置130的服務供應者資訊，行事曆資訊為使用者利用手機行事曆功能所紀錄之行程計畫安排，行事曆資訊亦可為如Google日曆(Google Calendar)等雲端行事曆，地點資訊則為使用者之住址與工作地址等資訊。

於另一實施例中，服務供應資料庫120內各服務供應者資訊中亦包含可提供服務的時段以及服務區域範圍等資訊，分析伺服器110在進行斷詞處理與過濾時，將需求字串210中的時間資訊和地點資訊保留，並根據需求字串210中的時間資訊和地點資訊過濾呈現於用戶端裝置130的服務供應者資訊。舉例而言，使用者在需求字串210中加入時間資訊與地點資訊為「我家廚房水管壞了，嚴重漏水，水槽需要更換，還有陽台的壁癌也需要維修，禮拜二和禮拜三下午可以，地址xx區xx路x號」，而分析伺服器110在根據需求關鍵字220進行完需求分析後，將需求字串210內的地址作為地點資訊，而「禮拜二和禮拜三下午」則作為時間資訊，過濾呈現於用戶端裝置130之服務供應者資訊。

上述之服務供應資料庫120與語料庫140，其具體實施方式，可儲存於同一儲存裝置，例如電腦硬碟、或其他電腦可讀取之紀錄媒體等，亦可分別儲存於不同的儲存裝置，或者是以雲端資料庫的方式來實施，本領域具通常知識者在不超出本揭示內容之精神的情況下，可依應用需求自行訂定。

圖3為根據本揭示內容第二實施例所繪示之服務需求分析方法的流程圖。服務需求分析方法300包含數個步驟，以分析使用者以自然語言所輸入之需求字串，並提供符合需求字串之服務供應者供使用者選擇。為了方便及清楚說明，以下對於服務需求分析方法300的說明以圖1所示的服務需求分析系統100為例，但本揭示內容並不以此為限。

於步驟S310中，分析伺服器110自用戶端裝置130接收需求字串，並進行斷詞處理以及過濾斷詞處理之結果，以取得多個需求關鍵字。對需求字串進行斷詞處理的細節如圖1說明文字所述，於此不再贅述。

於步驟S320中，分析伺服器110計算需求關鍵字間的關聯數值，關聯數值為計算兩個需求關鍵字間語意相關度的量化結果。於一實施例中，可採用正規化Google距離(NGD)演算法計算。於另一實施例中，採用其他量化語意相關度的方法計算。

於步驟S330中，分析伺服器110以需求關鍵字與需求關鍵字任兩者間的關聯數值，建立需求關鍵字網路圖，需求關鍵字網路圖中之節點分別代表由需求字串中取出之需求關鍵字，而當需求關鍵字間的關聯數值大於一下限閥值決定，則對應之節點間有邊相連。

於一實施例中，分析伺服器110將過濾需求關鍵字網路圖之連接邊的下限閥值設為一固定的預設數值，數值範圍訂在0.1~0.2間。於另一實施例中，分析伺服器110以需求關鍵字間關聯數值的分布範圍設定下限閥值，舉例而言，以第一四分位數或中位數作為下限閥值。

於步驟S340中，分析伺服器110根據需求關鍵字及其關聯數值，將需求關鍵字進行分群以取得需求關鍵字群組。於一實施例中，分析伺服器110以正規化Google距離作為距離計算的演算法，採用K-means演算法進行分群。於另一實施例中，分析伺服器110以需求關鍵字網路圖為基礎，以K-core演算法進行分群，且分析伺服器110調整下限閥值，以判斷所有需求關鍵字均屬於單一需求關鍵字群組，對應至同一概念，或者分屬多個對應至不同概念的需求關鍵字群組，細節如圖2之說明文字，於此不再贅述。

於步驟S350中，分析伺服器110建立所分出之需求關鍵字群組內之語意階層架構，建立語意階層架構時，先找出需求關鍵字群組內任兩個需求關鍵字間之關聯方向性，亦即，兩個需求關鍵字間何者較為上位，下位的需求關鍵字指向上位的需求關鍵字。舉例而言，在「廚房261」與「水槽264」兩需求關鍵字間，兩者為高度相關，且後者位於前者之中，故關聯方向性為自「水槽264」指向「廚房261」。關聯方向性確定之後，每一需求關鍵字群組內最上位的概念根關鍵字即為其他需求關鍵字均指向的需求關鍵字。建立需求關鍵字群組中任兩者間之關聯方向性的細節如上所述，此處不再贅述。

於步驟S360中，分析伺服器110根據需求字串分析結果搜尋服務供應資料庫120，取得符合需求字串的服務供應者資訊。於一實施例中，分析伺服器110根據需求關鍵字群組中的語意階層結構在服務供應資料庫120內進行階層式搜尋，以需求關鍵字群組中之概念根關鍵字搜尋服務供應者資訊之類別，接著將需求關鍵字群組中之其他需求關鍵字作為限制條件，過濾符合概念根關鍵字所描述之類別的服務供應者資訊，且服務供應資料庫120以階層式結構儲存服務供應者資訊，舉例而言，服務供應資料庫120中之服務供應者資訊分為廚房類別與陽台類別，於廚房類別中又分為水管類別、水槽類別、濾水器類別和瓦斯管線類別等。

於步驟S370中，分析伺服器110於用戶端裝置130分別呈現符合需求字串中不同需求關鍵字群組的服務供應者資訊，在符合不同需求關鍵字群組的服務供應者資訊重覆時合併顯示。於一實施例中，所呈現之服務供應者資訊包含廠商名稱、可配合時間、可服務地區、價位以及評價等。

於步驟S380中，分析伺服器110根據時間與地點資訊進一步過濾步驟S370中所得符合需求字串的服務供應者資訊。於一實施例中，分析伺服器110取得用戶端裝置130上之行事曆資訊與使用者之公司/住家地址等地點資訊，並與服務供應者資訊作一匹配，或過濾無法在行事曆資訊中空閒時間配合之服務供應者。於另一實施例中，分析伺服器110將需求字串中有關時間與地點的部分保留，並以需求字串中所述之時間資訊與地點資訊過濾步驟S370所得之服務供應者資訊。

圖4係說明根據本揭示內容第三實施例之實作服務需求分析方法的軟體架構圖。實做服務需求分析方法的軟體儲存於一電腦可讀取記錄媒體之上，一電腦處理器讀取軟體並執行。軟體包含字串處理模組420、關聯計算過濾模組430、服務需求分析模組440、使用者資訊模組450、資訊媒合模組460以及資訊呈現模組470。字串處理模組420對需求字串410進行初步處理分析取得需求關鍵字，關聯計算過濾模組430計算需求關鍵字間的語意相關度，服務需求分析模組440分析需求關鍵字，資訊媒合模組460根據分析結果取得符合需求字串410描述的服務供應者，使用者資訊模組450則為進一步調整過濾資訊媒合模組460所得之服務供應者資訊，資訊呈現模組470並將服務供應者資訊呈現給使用者。以下將個別說明各模組之功能。

字串處理模組420又包含斷詞模組422以及文字過濾分類模組424。因中文詞和詞之間書寫時，並不會以空白區分，因此斷詞模組422以中文斷詞(Chinese Word Segmentation)演算法將需求字串410切為多個「能夠獨立運用，具有完整語意的最小語言成分」的詞彙，斷詞模組422可使用開源程式庫(Open source library)或現成的斷詞引擎，或自行以遺傳演算法(Genetic algorithm)等演算法實作斷詞模組422。文字過濾分類模組424則根據詞性與類別來過濾斷詞模組422所產生之多個詞彙，於一實施例中，文字過濾分類模組424將屬於時間地點人物的詞彙保留，並將屬於事物的詞彙作為需求關鍵字傳送至關聯計算過濾模組430，不屬於上述兩者的詞彙則捨棄不用。

需求字串410經過字串處理模組420的初步處理分析後，將詞性與類別屬於事物的多個需求關鍵字傳送至關聯計算模組430。這些需求關鍵字包含使用者輸入需求字串410時所欲表達的服務需求之條件，關聯計算過濾模組430計算任兩個需求關鍵字之間的關聯數值，以量化兩需求關鍵字間之語意相關度。於本實施例中，關聯計算過濾模組430根據需求關鍵字與關聯數值建立一需求關鍵字網路圖，關聯數值係使用正規Google距離演算法計算，並用一下限閥值過濾關聯數值以決定任兩個需求關鍵字於需求關鍵字網路圖中是否有連接邊，若關聯數值大於下限閥值，表示兩者關聯緊密，於需求關鍵字網路圖中以一連接邊相連。關聯計算過濾模組430亦可選用其他演算法來計算關聯數值，實施細節如圖2說明文字所述，於此不再贅述。

計算完任兩個需求關鍵字間之關聯數值後，本揭示內容在不事先建立本體論(Ontology)網路的情況下，以服務需求分析模組440自動化分析需求關鍵字，找出需求字串內所包含服務之類別與限制條件，並以分析之結果搜尋服務供應資料庫120，以找出符合需求字串410描述的服務供應者，如此一來可省去使用者自行輸入多個相關連的精準關鍵字之麻煩。

服務需求分析模組440又包含關鍵字分群模組442、動態分群驗證模組444、關聯方向性確認模組446以及概念根節點判別模組448。關鍵字分群模組442可使用多種演算法進行分群分析(Clustering Analysis)，於本實施例中，關鍵字分群模組442使用以圖論為基礎的K-core演算法對需求關鍵字網路圖進行分群。須注意到，使用者輸入之需求字串410有可能僅包含一個需求概念，無法區分出多個需求關鍵字群組，故動態分群驗證模組444根據需求字串410中各需求關鍵字的關聯數值分佈，動態調整下限閥值的大小，以不同的下限閥值進行分群以確認需求關鍵字是否可分為多個群組，具體實施細節如圖2之說明文字所述，於此不再贅述。

關聯方向性確認模組446與概念根節點判別模組448則建立各需求關鍵字群組中之語意階層關係，關聯方向性確認模組446建立需求關鍵字群組中任兩個需求關鍵字間的關聯方向性，關聯方向性由較不重要的下位的需求關鍵字指向較重要的上位的需求關鍵字，關聯方向性確認模組446採用PageRank演算法、TF-IDF演算法或K近鄰演算法來決定關聯方向性，實施方式如圖2之說明文字所述，此處不再贅述。於另一實施例中，關聯方向性確認模組446查詢根據語意以階層方式儲存詞彙的WordNet網站，以決定關聯方向性。概念根節點判別模組448則根據關聯方向性確認模組446所判斷的關聯方向性，找出需求關鍵字群組中最重要的概念根關鍵字，亦即最上位或最重要的需求關鍵字。

資訊媒合模組460接收服務需求分析模組440產生之需求關鍵字群組與其語意階層架構，以在服務供應資料庫120中進行階層式搜尋，利用各需求關鍵字群組的概念根關鍵字搜尋服務供應者之類別，再以其他需求關鍵字作為限制條件進行搜尋，以取得符合需求字串410描述之服務供應者資訊。

於另一實施例中，使用者資訊模組450取得使用者之行事曆資訊與使用者之住家地址或工作地址等地點資訊，在字串處理模組420之斷詞結果中並無時間與地點相關詞彙時，以行事曆資訊與地點資訊過作為時間地點的限制條件，在字串處理模組420之斷詞結果中有時間與地點相關詞彙時，使用者資訊模組450以斷詞結果中的時間資訊與地點資訊作為限制條件，資訊媒合模組460根據自使用者資訊模組450所取得的限制條件進一步過濾符合使用者輸入的需求字串410的服務供應者資訊。

資訊呈現模組470於用戶端裝置130呈現服務供應者資訊，且所呈現之服務供應者資訊符合需求字串410描述以及符合使用者資訊模組450產生的時間地點限制條件，如此一來，使用者僅需瀏覽時間與服務區域可配合的服務供應者，省去需逐一確認和協調的繁瑣過程。

如上所述之實做服務需求分析方法的軟體內各模組420~470，其具體實施方式可為軟體、硬體與/或軔體。舉例來說，若以執行速度及精確性為首要考量，則該等模組基本上可選用硬體與/或軔體為主；若以設計彈性為首要考量，則該等模組基本上可選用軟體為主；或者，該等模組可同時採用軟體、硬體及軔體協同作業。應瞭解到，以上所舉的這些例子並沒有所謂孰優孰劣之分，亦並非用以限制本揭示內容，熟習此項技藝者當視當時需要，彈性選擇該等模組的具體實施方式。舉例來說，該等模組可整合至中央處理器執行。

本揭示內容所提供之服務需求分析系統與方法可解決使用者透過傳統的網路黃頁以及媒合平台網站尋找需要服務時之問題，讓使用者能夠以自然語言輸入服務需求，而無需費神設定精確關鍵字。使用自然語言輸入亦可提供語境，供服務需求分析系統與方法自動化地以語意分析需求字串內的服務需求類別與限制條件，以進行精確的搜尋，省卻媒合平台以人工進行分析所耗費的人力。再者，提供一種結合使用者時間與地點資訊過濾符合需求字串的服務供應者，進一步省去使用者需自行與服務供應者協調進行服務的時間與地點的繁瑣過程。另外，本揭示內容不限定於搜尋工商服務的應用，亦可用以搜尋文化或娛樂活動，使用者可輸入「我每個禮拜二晚上有空，想要進修有關心靈成長的課程，預算為xx元」的需求字串，而由服務需求分析系統搜尋資料庫中符合使用者輸入需求字串的課程資訊。不論應用於何種應用情境，本揭示內容之技術方案均提供上述之優點。

雖然本揭示內容已以實施方式揭露如上，然其並非用以限定本揭示內容，任何熟習此技藝者，在不脫離本揭示內容之精神和範圍內，當可作各種之更動與潤飾，因此本揭示內容之保護範圍當視後附之申請專利範圍所界定者為準。