TW202018529A - 查詢服務之系統與方法 - Google Patents

查詢服務之系統與方法 Download PDF

Info

Publication number
TW202018529A
TW202018529A TW107139680A TW107139680A TW202018529A TW 202018529 A TW202018529 A TW 202018529A TW 107139680 A TW107139680 A TW 107139680A TW 107139680 A TW107139680 A TW 107139680A TW 202018529 A TW202018529 A TW 202018529A
Authority
TW
Taiwan
Prior art keywords
query
data
name
client
keyword
Prior art date
Application number
TW107139680A
Other languages
English (en)
Other versions
TWI698756B (zh
Inventor
翁健欽
Original Assignee
中華電信股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 中華電信股份有限公司 filed Critical 中華電信股份有限公司
Priority to TW107139680A priority Critical patent/TWI698756B/zh
Publication of TW202018529A publication Critical patent/TW202018529A/zh
Application granted granted Critical
Publication of TWI698756B publication Critical patent/TWI698756B/zh

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一種查詢服務之系統與方法,係利用互動裝置與客戶端進行自動化對答,以取得該客戶端的查詢資訊,後續再透過語音辨識裝置、關鍵字分析判定裝置及大數據分析裝置自動化分析該查詢資料,以取得該查詢資訊所對應的推薦店家資料。

Description

查詢服務之系統與方法
本發明係有關一種查詢服務技術,尤指一種自動化查詢服務之系統與方法。
傳統的電話查詢服務屬高人力密集度且重複性質極高的服務,由查詢服務人員詢問客戶,聽取完問題之後,才能開始進行查詢服務,且過程中有可能會遇到新進人員,若新進人員訓練不足而無法快速找到該問題所對應的答案時,會耽誤了不少查詢服務的時間;其次,當線上之查詢服務人員的話務繁忙時,會導致欲查詢之客戶必須再線上等待查詢服務人員的接通才能進行查詢服務,而浪費不少等待時間。
因此,如何自動化的進行電話查詢服務且精確且快速地提供答案即為目前所亟待解決的課題之一。
為克服習知技術之缺失,本發明係提供查詢服務之系統,係包括:互動裝置,係取得客戶端要求查詢服務所發出的查詢資訊,其中,該查詢資料包含語音查詢資料;語 音辨識裝置,係將該互動裝置所取得該查詢資訊中的語音查詢資料轉換成文字查詢資料;關鍵字分析判定裝置,係接收該文字查詢資料,並從字典檔資料庫中找出與該文字查詢資料相同的資料,以得到關鍵字特徵,其中,該關鍵字特徵包含招牌名稱、縣市名稱、路名或行業別;以及大數據分析裝置,係接收該關鍵字分析判定裝置所得的該關鍵字特徵,且該大數據分析裝置係包含:工商店家資料庫,係儲存工商店家資料,該工商店家資料包含招牌名稱、縣市名稱、路名或行業別;工商店家比對模組,係從該工商店家資料庫中找出與該關鍵字特徵中的招牌名稱之讀音相同且行業別、縣市名稱及路名之至少一相同者,以得到關聯工商店家資料;歷史查詢資料庫,係儲存該查詢服務的歷史查詢紀錄;及第一關聯店家推薦模組,係透過逆文檔頻率演算法計算該關聯店家資料於該歷史查詢資料庫中的被查詢頻率,以令被查詢頻率大於第一預設門檻值的該關聯店家資料為第一類推薦店家資料,進而推薦該第一類推薦店家資料給該客戶端。
於一實施例中,該歷史查詢紀錄包含客戶滿意度,且該大數據分析裝置更包括:第二關聯店家推薦模組,係當該第一關聯店家推薦模組無法取得該第一類推薦店家資料時,從該歷史查詢資料庫中找出與該關鍵字特徵相同且客戶滿意度為好的歷史查詢紀錄,以得到關聯歷史查詢紀錄,並將該關聯歷史查詢紀錄進行Apriori機器學習演算法計算取得一推薦值,以令該推薦值大於第二預設門檻值的該 關聯歷史查詢紀錄為第二類推薦店家資料,進而推薦該第二類推薦店家資料給該客戶端。
於一實施例中,該大數據分析裝置更包括:反饋資訊模組,係將該客戶端要求該查詢服務至推薦該推薦店家資料給該客戶端之間的處理過程儲存成該歷史查詢資料庫中的該歷史查詢紀錄。
於一實施例中,該查詢資訊更包含該客戶端之話機線路所在縣市,且該文字查詢資料中無縣市名稱或路名時,該關鍵字分析判定裝置將該客戶端之話機線路所在縣市納入該關鍵字特徵中。
於一實施例中,該字典檔資料庫包含縣市名稱字典檔、路名字典檔、行業名稱字典檔、招牌名稱字典檔、景點名稱字典檔、俗名簡稱字典檔、破音字字典檔或行業別同義詞字典檔。
本發明另提供一種查詢服務之方法,係包括下列步驟:(1)取得客戶端要求查詢服務的查詢資訊,其中,該查詢資料包含語音查詢資料;(2)將該查詢資訊中的語音查詢資料轉換成文字查詢資料;(3)從字典檔資料庫中找出與該文字查詢資料相同的資料,並將該相同的資料中的贅詞過濾,以得到關鍵字特徵,其中,該關鍵字特徵包含招牌名稱、縣市名稱、路名或行業別;(4)從該工商店家資料庫中找出與該關鍵字特徵中的招牌名稱之讀音相同且行業別、縣市名稱及路名之至少一相同者,以得到關聯工商店家資料;(5)利用逆文檔頻率演算法計算該關聯店家資料於 歷史查詢資料庫中的被查詢頻率,以令被查詢頻率大於第一預設門檻值的該關聯店家資料為第一類推薦店家資料;以及(6)將該推薦店家資料推薦給該客戶端。
於一實施例中,當該步驟(5)無法利用該逆文檔頻率演算法取得該第一類推薦店家資料時,則從該歷史查詢資料庫中找出與該關鍵字特徵相同且客戶滿意度為好的歷史查詢紀錄,以得到關聯歷史查詢紀錄,進而將該關聯歷史查詢紀錄進行Apriori機器學習演算法計算取得一推薦值,以令該推薦值大於第二預設門檻值的該關聯歷史查詢紀錄為第二類推薦店家資料。
於一實施例中,該方法更包括下列步驟:(7)將該客戶端要求該查詢服務至推薦該推薦店家資料給該客戶端之間的處理過程儲存成該歷史查詢資料庫中的該歷史查詢紀錄。
於一實施例中,該查詢資訊更包含該客戶端之話機線路所在縣市,且該語音查詢資料中無縣市名稱或路名時,令該關鍵字分析判定部將該客戶端之話機線路所在縣市納入該關鍵字特徵中。
於一實施例中,該字典檔資料庫包含縣市名稱字典檔、路名字典檔、行業名稱字典檔、招牌名稱字典檔、景點名稱字典檔、俗名簡稱字典檔、破音字字典檔或行業別同義詞字典檔。
由上可知,本發明透過互動裝置進行自動化對答,主動對客戶端問候,並取得客戶端的查詢資訊,降低客戶端 等候太久的不良感受,後續再透過語音辨識裝置、關鍵字分析判定裝置及大數據分析裝置將客戶端的查詢資料的自動化分析取得該查詢資訊所對應的推薦店家資料,以改善客服人員訓練程度不一,容易造成查詢錯誤,且人員離職流動率高,造成學習成本大幅提高的問題,且該大數據分析裝置中的反饋資訊模組係同時將系統及客服人員的處理結果回饋至歷史查詢資料庫中,藉此提高由該歷史查詢資料庫中產出推薦店家資料的正確率,並精確且快速地回覆至客戶端。
1‧‧‧互動裝置
2‧‧‧語音辨識裝置
3‧‧‧關鍵字分析判定裝置
4‧‧‧大數據分析裝置
5‧‧‧文字轉語音模組
6‧‧‧客戶端
7‧‧‧交換機
8‧‧‧客服人員
11‧‧‧中控模組
12‧‧‧互動模組
21‧‧‧信號處理模組
22‧‧‧語言分類模組
23‧‧‧語音轉文字模組
24‧‧‧發音字典檔
31‧‧‧字典檔資料庫
32‧‧‧語意分析模組
33‧‧‧分詞處理模組
34‧‧‧關鍵字擷取模組
41‧‧‧工商店家資料庫
42‧‧‧工商店家比對模組
43‧‧‧歷史查詢資料庫
44‧‧‧第一關聯店家推薦模組
45‧‧‧第二關聯店家推薦模組
46‧‧‧反饋資訊模組
100‧‧‧系統
200‧‧‧方法
S201~S208‧‧‧步驟
第1圖為本發明之查詢服務之系統之示意圖;以及第2圖為本發明之查詢服務之方法之步驟流程圖。
以下藉由特定的具體實施例說明本發明之實施方式,熟悉此技藝之人士可由本說明書所揭示之內容輕易地瞭解本發明之其他優點及功效。
須知,本說明書所附圖式所繪示之結構、比例、大小等,均僅用以配合說明書所揭示之內容,以供熟悉此技藝之人士之瞭解與閱讀,並非用以限定本發明可實施之限定條件,故不具技術上之實質意義,任何結構之修飾、比例關係之改變或大小之調整,在不影響本發明所能產生之功效及所能達成之目的下,均應仍落在本發明所揭示之技術內容得能涵蓋之範圍內。同時,本說明書中所引用之如「第一」、「第二」及「一」等之用語,亦僅為便於敘述之明瞭, 而非用以限定本發明可實施之範圍,其相對關係之改變或調整,在無實質變更技術內容下,當視為本發明可實施之範疇。
請參閱第1圖所示,係本發明之查詢服務之系統100之示意圖。該系統係包括互動裝置1、語音辨識裝置2、關鍵字分析判定裝置3、大數據分析裝置4及文字轉語音模組5,其中,互動裝置1、語音辨識裝置2、關鍵字分析判定裝置3、大數據分析裝置4可實作在相同設備中彼此電性連接,亦可實作在不同設備中彼此電性連接。
互動裝置1係於客戶端6向系統100要求查詢服務時,與客戶端6進行對話互動,其中,互動裝置1係包含中控模組11及互動模組12。
於一實施例中,客戶端6係透過交換機7向系統100提出查詢服務的要求,但不以此為限。
於一實施例中,客戶端6係為市內電話機或行動裝置,但不以此為限。
中控模組11,係接收客戶端6向系統100要求該查詢服務所發出的查詢資訊,並負責整個該查詢作業中系統100與客戶端6互動的流程控制。
於一實施例中,該查詢資訊包含客戶端6的進線號碼、話機線路所在縣市、進線裝置、進線查詢時間及語音查詢資料。
互動模組12,係內建一對答語句自動生成模型,並令該對答語句自動生成模型產生與客戶端6對話互動的對話 字串,該對答語句自動生成模型係內建自然人聊天所需的語料庫,該語料庫內容包含了大量的上下文(context)及回覆(response),當客戶端6的該語音查詢資料轉換成文字查詢資料並輸入該對答語句自動生成模型時,該對答語句自動生成模型會拆解比對輸入的上下文,並從該語料庫中選擇最佳的回覆為該對話字串。此互動模組12的主要功能是為了與客戶端6保持互動,引導客戶端回答問題。
於一實施例中,該對答語句自動生成模型透過機器學習演算法訓練產生,其中,該機器學習演算法包含長短期記憶(LSTN)或遞歸神經網絡(RNN)。
文字轉語音模組5,係接收互動模組12所產生的該對話字串,並將該對話字串轉換成對話語音,以將該對話語音傳送至客戶端6。
於一實施例中,文字轉語音模組5係透過交換機7將該回覆語音傳送至客戶端6。
在客戶端6向系統100提出查詢服務的要求時,中控模組11先呼叫互動模組12產出對話字串,並將該對話字串透過5 TTS文字轉語音元件將該對話字串轉為語音播放至客戶端6,引導客戶回答問題。過程中會不斷呼叫語音辨識裝置2來分析客戶端6的回答,並確認是否有產出辨識結果,並重複此問答過程數次,若語音辨識裝置2辨識結果可產出查詢用的文字查詢資料,則繼續交付後台(即關鍵字分析判定裝置及大數據分析裝置)進行查詢流程;若過程中無法辨識出有效資訊,或者語意分析後的意圖並非查 詢,就會將此話務轉交客服人員8服務。
語音辨識裝置2,係接收互動裝置1所取得該查詢資訊,以將該查詢資訊中的語音查詢資料轉換成該文字查詢資料,其中,語音辨識裝置2包含信號處理模組21、語音轉文字模組23及發音字典檔24。
信號處理模組21,係使用數位訊號處理(Digital Signal Processing,DSP)去除掉該語音查詢資料中的雜訊。
發音字典檔24,係儲存詞彙的發音組合,以依據該組合提供單字轉音素或音素轉單字的應用,其中,該音素為語言中的最小發音單位,例如國語的注音符號或英語的音標,但不以此為限。
於一實施例中,發音字典檔24係為國語或英語的發音字典檔,亦可為其他語系的發音字典檔,但不限於此。
語音轉文字模組23,係將已去除掉雜訊的該語音查詢資料轉換成該文字查詢資料。
於一實施例中,語音轉文字模組23係根據己經訓練好的聲學模型(HMM)及發音字典檔24,並配合使用神經網路模型BPNN(Backpropagation Neural Network)建立一第一類神經網路來對已去除掉雜訊的該語音查詢資料轉換成單字組合,接著,依據已訓練好的語言模型及配合該神經網路模型BPNN建立第二類神經網路來對該單字組合轉換成完整的文字句子,並令該完整的文字句子為該文字查詢資料。
於該第一類神經網路中,神經網路模型BPNN配合聲 學模型的作用是將已去除掉雜訊的該語音查詢資料換成複數個該音素,神經網路模型BPNN配合發音字典檔24的作用是將該複數個音素轉換成複數個字或詞的該單字組合。
於該第二類神經網路中,神經網路模型BPNN配合語言模型的作用是將字或詞(例如該單字組合)轉換成該文字句子。
於一實施例中,語音辨識裝置2更包括語言分類模組22,但不以此為限。
語言分類模組22,係依據該第一類神經網路來對已去除掉雜訊的該語音查詢資料進行語言分類,其中,該語言分類為國語或英語,但不限於此。
於一實施例中,語言分類模組22係整合在語音轉文字模組23,以供該第一類神經網路來對已去除掉雜訊的該語音查詢資料進行該語言分類及產生該單字組合,但不限於此。
關鍵字分析判定裝置3,係接收語音轉文字模組23所得的該文字查詢資料,以從該文字查詢資料中找出關鍵字特徵,其中,關鍵字分析判定裝置3包含字典檔資料庫31、語意分析模組32、分詞處理模組33、關鍵字擷取模組34。
字典檔資料庫31,係包含縣市名稱字典檔、路名字典檔、行業名稱字典檔、招牌名稱字典檔、景點名稱字典檔、破音字字典檔、俗名簡稱字典檔(例如:行天宮=恩主宮等資訊)或行業別同義詞字典檔,其中,同義詞字典檔的內容就是記錄中文詞彙可能的轉換,例如小吃店的同義詞也可 以稱呼為餐廳、飲食店及簡餐,而iPhone的同義詞為哀鳳、愛瘋、智慧手機、蘋果,但不以此為限。
語意分析模組32,係從該文字查詢資料中辨識客戶端6的查詢意圖,其查詢意圖的辨識方式係從主詞及動詞去判斷,例如:我想要查、請幫我查、我要查、我想查、幫我找或我想找等等,即可認定具有該查詢意圖,但不以此為限。
由於系統100的任務很明確,就是請客戶端6提供店家名稱或景點名稱,然後幫客戶端6進行查詢相關電話資訊,因此客戶端6問句偏向短問句,諸如:我想要查XXX餐廳的電話、幫我查XX醫院的電話、我要找最近上過新聞的XXX的電話、可以幫我找XXX嗎或我想知道XX的電話等等,問法有很多種,但是其意圖都是一樣的,因此語意分析模組32僅需要進行判斷該文字查詢資料是否為查詢即可,若無法判斷查詢意圖,則由中控模組11控制將與客戶端6進行的對話互動轉交客服人員8處理。
分詞處理模組33,係對該文字查詢資料進行不同字元數的切詞,以得到不同字元數的詞語組合,然後比對字典檔資料庫31中是否有相符的該詞語組合出現,並將比對相符的該詞語組合輸出為關鍵字陣列。
關鍵字擷取模組34,係將該關鍵字陣列中的贅詞刪除,以得到該關鍵字特徵,其中,該關鍵字特徵包含招牌名稱、縣市名稱、路名或行業別,該贅詞為一般對話裡常出現高頻率詞彙,例如主詞(你、我、他、小姐、先生、你好、)、 嘆詞(ㄟ、啊、呀、喔、哦、噢、唷、喲…)、動詞(想要、想查、想知道、幫我找、請幫我、告訴我、…)等等,但不以此為限。關鍵字擷取模組34的目的在於將自然人交談時所用的贅詞過濾,僅留下可能是店家名稱的關鍵字。
於一實施例中,關鍵字分析判定裝置3更包括從語音辨識裝置2接收該查詢資訊,且當分詞處理模組33無法從字典檔資料庫31的縣市名稱字典檔或路名字典檔中比對出相符的該詞語組合時(即該文字查詢資料中沒有縣市名稱或路名),關鍵字擷取模組34將該查詢資訊中的該客戶端之話機線路所在縣市納入該關鍵字特徵中,但不以此為限。
大數據分析裝置4,係接收關鍵字擷取模組34所得的該關鍵字特徵,以依據該關鍵字特徵從大數據分析裝置4內的資料庫中找出推薦店家資料給該客戶端6,其中,大數據分析裝置4包含工商店家資料庫41、工商店家比對模組42、歷史查詢資料庫43、第一關聯店家推薦模組44、第二關聯店家推薦模組45及反饋資訊模組46。
工商店家資料庫41,係儲存工商店家資料,該工商店家資料包含招牌名稱、縣市名稱、路名或行業別。
於一實施例中,工商店家資料庫41為特殊設計的資訊聚合大表,每日由網路爬蟲程式自動從經濟部商業司取得登記有案的工商店家招牌名稱,並整合比對104查號台內登記為有效使用中,尚未拆機的工商店家資料,由專業人員進行讀音(即注音符號)編排分類以及行業別分類,但不 以此為限。
工商店家比對模組42,係從工商店家資料庫41中找出與該關鍵字特徵中的招牌名稱之讀音相同的工商店家資料,以得到招牌同音的工商店家資料,且比對出該招牌同音的工商店家資料具有與該關鍵字特徵的行業別、縣市名稱及路名之至少一相同時,令該至少一相同的該招牌同音的工商店家資料為到關聯工商店家資料。
歷史查詢資料庫43,係儲存該查詢服務的歷史查詢紀錄,該歷史查詢紀錄包含客戶端6所查詢的該文字查詢資料與所對應回覆的答案,以及來電總結記錄客戶端6是否對該答案的滿意度。
第一關聯店家推薦模組44,係透過逆文檔頻率(IDF)演算法計算該關聯店家資料於歷史查詢資料庫43中的被查詢頻率,以令被查詢頻率大於第一預設門檻值的該關聯店家資料為第一類推薦店家資料,進而將該第一類推薦店家資料透過文字轉語音模組5語音推薦給該客戶端6。
逆文檔頻率(IDF)計算公式如下,其中D表示該歷史查詢紀錄內,行業別為餐廳類的查詢記錄總筆數,Dw表示招牌名稱w出現在多少筆資料中,透過下列公式:
Figure 107139680-A0101-12-0012-1
第二關聯店家推薦模組45,係當第一關聯店家推薦模組44無法取得該第一類推薦店家資料時,從歷史查詢資料庫43中找出與該關鍵字特徵相同且客戶滿意度為好的歷 史查詢紀錄,以得到關聯歷史查詢紀錄,並利用Apriori機器學習演算法計算取得該關聯歷史查詢紀錄的特徵值,且令該特徵值符合預設推薦條件的該關聯歷史查詢紀錄為第二類推薦店家資料,以將該第二類推薦店家資料透過文字轉語音模組5語音推薦給該客戶端6。
該Apriori機器學習演算法計算公式如下:
Figure 107139680-A0101-12-0013-2
X為客戶端6查詢的店家X,Y為從該歷史查詢紀錄中找出的店家Y(即為該第二類推薦店家資料),support、confidence及Lift為該特徵值,其中,frq是計算店家在該歷史查詢紀錄內被查詢的次數,frq(X)是指店家X在該歷史查詢紀錄內被查詢的次數,frq(X,Y)是指同時包含店家X和店家Y在該歷史查詢紀錄內被查詢的次數,N為該歷史查詢紀錄的所有查詢次數,Support是支持度即代表該所有查詢次數N中,X與Y同時出現的比例,Supp(X)即為在該所有查詢次數N中,店家X出現的比例,Supp(Y)即為在該所有查詢次數N中,店家Y出現的比例,Confidence是信心度即代表所有出現店家X的查詢中所同時伴隨查詢店家Y的比例,Lift是增益值,Lift值小於1代表店家X與Y兩者是負相關,等於1代表店家X與Y兩者是無關, 大於1代表店家X與Y兩者是正相關,其中,當Lift值為正相關且support值和confidence值都超過該第二預設門檻值之後,則此關聯規則成立,則可將店家Y進行推薦給客戶端6。
當大數據分析裝置4中的各模組無法依據該關鍵字特徵找出該第一類推薦店家資料及第二類推薦店家資料時,則由中控模組11控制將與客戶端6進行的對話互動轉交客服人員8處理,並將處理所得的第三類推薦店家資料告知客戶端6。
反饋資訊模組46,係將該客戶端6要求該查詢服務至推薦各該推薦店家資料給該客戶端6之間的處理過程儲存成該歷史查詢資料庫中的該歷史查詢紀錄。
請參閱第2圖,係本發明之查詢服務之方法200之步驟流程圖。該方法包括下列步驟:在步驟S201中,取得該客戶端6要求該查詢服務的查詢資訊,其中,該查詢資料包含客戶端6的進線號碼、話機線路所在縣市、進線裝置、進線查詢時間及語音查詢資料。
於一實施例中,該步驟S201係利用互動模組12生成對話字串,並透過文字轉語音模組5將該對話字串轉換成對話語音傳送至客戶端6,藉此引導客戶端6回答問題,以從該回答問題中取得該查詢資訊,但不以此為限。
在步驟S202中,將該查詢資訊中的語音查詢資料轉換成文字查詢資料。
於一實施例中,該步驟S202係透過語音辨識裝置2 將該查詢資訊中的語音查詢資料轉換成文字查詢資料。
在步驟S203中,從字典檔資料庫31中找出與該文字查詢資料相同的資料,並將該相同的資料中的贅詞過濾,以得到關鍵字特徵,其中,該關鍵字特徵包含招牌名稱、縣市名稱、路名或行業別。
該步驟S203係進一步包含下列步驟:利用分詞處理模組33對具有查詢意圖的該文字查詢資料進行不同字元數的切詞,以得到不同字元數的詞語組合,然後比對字典檔資料庫31中是否有相同的該詞語組合出現,並將比對相同的該詞語組合輸出為關鍵字陣列;以及
利用關鍵字擷取模組34將該關鍵字陣列中的贅詞刪除,以得到該關鍵字特徵。
於一實施例中,該步驟S203一開始係利用語意分析模組32從該文字查詢資料中辨識客戶端6的查詢意圖,若有,則進行利用分詞處理模組33之步驟,若無,則回到步驟S201重新取得另一該查詢資訊,但不以此為限。
於一實施例中,當分詞處理模組33無法從字典檔資料庫31的縣市名稱字典檔或路名字典檔中比對出相符的該詞語組合時(即該文字查詢資料中沒有縣市名稱或路名),令關鍵字擷取模組34將該查詢資訊中的該客戶端之話機線路所在縣市納入該關鍵字特徵中,但不以此為限。
在步驟S204中,從工商店家資料庫41中找出與該關鍵字特徵中的招牌名稱之讀音相同且行業別、縣市名稱及 路名之至少一相同者,以得到關聯工商店家資料。
於一實施例中,該步驟S204係透過工商店家比對模組42從工商店家資料庫41中找出與該關鍵字特徵中的招牌名稱之讀音相同的工商店家資料,以得到招牌同音的工商店家資料,且比對出該招牌同音的工商店家資料具有與該關鍵字特徵的行業別、縣市名稱及路名之至少一相同時,令該至少一相同的該招牌同音的工商店家資料為到關聯工商店家資料。
在步驟S205中,利用逆文檔頻率演算法計算該關聯店家資料於歷史查詢資料庫中的被查詢頻率,以令被查詢頻率大於第一預設門檻值的該關聯店家資料為第一類推薦店家資料。
於一實施例中,該步驟S205係透過第一關聯店家推薦模組44執行。
在步驟S206中,當該步驟S205無法利用該逆文檔頻率演算法取得該第一類推薦店家資料時,則從該歷史查詢資料庫中找出與該關鍵字特徵相同且客戶滿意度為好的歷史查詢紀錄,以得到關聯歷史查詢紀錄,進而將該關聯歷史查詢紀錄進行Apriori機器學習演算法計算取得一推薦值,以令該推薦值大於第二預設門檻值的該關聯歷史查詢紀錄為第二類推薦店家資料。
於一實施例中,該步驟S206係透過第二關聯店家推薦模組45執行。
於一實施例中,當該步驟S206無法依據該關鍵字特徵 找出該第二類推薦店家資料時,則由中控模組11控制將與客戶端6進行的對話互動轉交客服人員8處理,並將處理所得的第三類推薦店家資料推薦給客戶端6。
在步驟S207中,將該推薦店家資料推薦給該客戶端6。
於一實施例中,係由中控模組11將該步驟S205所得的該第一類推薦店家資料推薦給該客戶端6,當該步驟S205無法取得該第一類推薦店家資料時,則將該步驟S206所得的該第二類推薦店家資料推薦給該客戶端6,若該步驟S206也無法取得該第二類推薦店家資料時,則由客服人員8將該第三類推薦店家資料推薦給客戶端6,但不以此為限。
在步驟S208中,將該客戶端要求該查詢服務至推薦該推薦店家資料給該客戶端之間的處理過程儲存成該歷史查詢資料庫中的該歷史查詢紀錄。
於一實施例中,該步驟S208係由中控模組11或客服人員8所執行。
本發明之查詢服務之系統與方法係適用於104查號台,下列提供一情境實例說明本發明之查詢服務之系統與方法:客戶(即客戶端6)打電話至104查號台後,話務被交換機7分配到互動裝置1,並呼叫中控模組11啟動標準的對話流程,首先由互動模組12問候客戶並引導客戶回答問題,並由中控模組11從交換機7取得該客戶進線的相關資 訊,得到X集合(即該查詢資訊)為={X1客戶進線號碼=0910XXXXXX,X2話機線路所在縣市=台北大安區,X3=手機進線,X4客戶進線查詢時間=20XX/04/23 11:45,X5=客戶透過電話筒所回答的問題語音多媒體檔案}。
將X5交由語音辨識裝置2進行處理,透過信號處理模組21處理過後,得到較為清晰且無背景音雜訊的數位訊號X5',然後呼叫語言分類模組22比對聲學模型、發音字典檔24後,確認X5'是中文發音之後,則將X5'交給語音轉文字模組23處理得到Y集合(即該文字查詢資料)為{Y1客戶問題字串=喂,小姐你好,我想要查中和區中山路上的鼎泰豐餐廳,請幫我查訂位電話,謝謝}。
將Y集合送到關鍵字分析判定裝置3,先呼叫語意分析模組32對字串集合Y進行語意分析,分析其目的意圖是否為查詢,若是,開始呼叫字典檔資料庫31(路名字典、行業名稱字典、景點名稱字典、招牌名稱字典)、分詞處理模組33進行中文分詞比對作業,將中文語句切割為不同字元數的詞語組合,並透過關鍵字擷取模組34過濾該詞語組合中之自然人交談所使用的主詞、動詞、嘆詞、語助詞等贅詞(例如:喂,小姐你好,我想要查、請幫我查、謝謝),經過上述過濾、比對處理作業後及各字典檔比對結果可得到下列表1所示之關鍵字特徵:『鼎泰豐』、『頂泰風』、『頂太峰』、『新北市中和區』、『中山路』、『餐廳』。
Figure 107139680-A0101-12-0019-3
產出查詢資料庫所需使用關鍵字特徵Y'={Y'1店家名稱=鼎泰豐、頂泰風或頂太峰,Y'2店家所在的縣市=新北市中和區,Y'3店家所在的路段名稱=中山路,Y'4店家的行業別=餐廳};此時將交換機7所得之資訊X集合與查詢用Y'集合輸入至工商店家比對模組42去比對工商店家資料庫41中的資料,由於Y'1工商店家招牌大多屬於中文,若僅透過聲學模型進行音轉字處理,則會因為同音異字、破音字的因素,造成候選組合案例相當多,而不知該輸出哪一個候選組合,因此需預先將Y'1店家名稱先轉為注音符號『ㄉ一ㄥˇㄊㄞ`ㄈㄥ』,並且將此注音符號比對工商店家資料庫41裡的店家讀音欄位,會發現具有相同讀音的店家有『頂太峰登山用品店』、『頂泰風泰式料理』、『鼎泰豐小籠包』等同音異字的招牌,且客戶詢問的行業別名稱是『餐廳』,為一般性餐飲業的泛稱,並非是工商店家資料庫41所註冊的店家行業別『小籠包』、『登山用品』、『泰式料理』,因此還需要將行業別資料比對字典檔資料庫31內的行業別同義詞字典進行比對。
假若客戶所詢問的行業別(即表1所示的餐廳),透過 行業別同義詞字典對照後發現與該相同讀音的店家在工商店家資料庫41內所登記的行業別名稱相同(如餐廳的同義字等於小籠包或料理),則信心度為60,比對完行業別同義字後接著比對縣市及路名,假若該相同讀音的店家在工商店家資料庫41內所登記的縣市與客戶所詢問的縣市(如表1所示的新北市中和區)相同但不同路名時,則信心度為70,再而,假若該相同讀音的店家在工商店家資料庫41內所登記的縣市及路名與客戶所詢問的縣市及路名(如表1所示的中山路)相同時,則信心度為90,並取信心度最高的該相同讀音的店家於工商店家資料庫41中的資料(即該工商店家資料)為該關聯工商店家資料。
在本案例中客戶詢問鼎泰豐餐廳,但是工商店家資料庫41內記載,客戶註冊的資料,並沒有鼎泰豐餐廳,經過比對同義詞字典檔之後,發現業別餐廳的同義詞含有小籠包以及料理,因此在招牌名稱的定義裡,鼎泰豐餐廳=鼎泰豐小籠包以及鼎泰豐餐廳=頂泰風泰式料理餐廳。
一般而言,在同一條路上要出現兩筆同音異字的招牌名稱,機率是相當低,很少會有這樣的情形,此例屬於極端的案例,主要是展示本方法可解決客戶不清楚店家名稱、不清楚店家所在路名的情況下,亦可找出相關店家。甚至客戶開車出門在不知道自己位置的情況下,本發明透過查詢參數可判斷出客戶是透過手機門號查詢,可透過基地台的註冊表,可反查基地台所在資訊,間接得知客戶所在的 區域,例如『台北市大安區』。若客戶透過市話進線,則可更精準的知道裝機地址,可更精準的協助客戶,進行的地理位置附近的店家檢索。
接下來將這些同音異字的招牌名稱(即該關聯工商店家資料),輸入至第一關聯店家推薦模組44,透過內建的IDF演算法統計分析這些同音異字的招牌名稱在歷史查詢資料庫43內的被查詢頻率,最後得到結果Z{店家名稱、店家名稱相似度、店家登記電話}的集合,並依照IDF分數來排序,如下列表2所示。
Figure 107139680-A0101-12-0021-4
上述案例產出的結果為{Z1=鼎泰豐小籠包,Z2=10.38},{Z'1=頂泰風泰式料理,Z'2=7.11};其中{Z1=鼎泰豐小籠包,Z2是IDF數值=10.38}的分數較高,透過綜合評比之後,假設Z1及Z2都超過預設門檻值,第一關 聯店家推薦模組44會將Z1的店家名稱以及此店家登記的電話結果送至中控模組11,並透過文字轉語音模組5播放訊息:『您好,您剛詢問位在{新北市}{中和區}{中山路}的{鼎泰豐餐廳},登記的電話是{02-XXXX-XXXX}』,另外一筆較為相近的是在{新北市}{中和區}{中山路}的{頂泰風泰式料理},登記的電話是{02-XXXX-YYYY}。
由上可知,本發明透過互動裝置進行自動化對答,主動對客戶端問候,並取得客戶端的查詢資訊,降低客戶端等候太久的不良感受,後續再透過語音辨識裝置、關鍵字分析判定裝置及大數據分析裝置將客戶端的查詢資料的自動化分析取得該查詢資訊所對應的推薦店家資料,以改善客服人員訓練程度不一,容易造成查詢錯誤,且人員離職流動率高,造成學習成本大幅提高的問題,且該大數據分析裝置中的反饋資訊模組係同時將系統及客服人員的處理結果回饋至歷史查詢資料庫中,藉此提高由該歷史查詢資料庫中產出推薦店家資料的正確率。
1‧‧‧互動裝置
2‧‧‧語音辨識裝置
3‧‧‧關鍵字分析判定裝置
4‧‧‧大數據分析裝置
5‧‧‧文字轉語音模組
6‧‧‧客戶端
7‧‧‧交換機
8‧‧‧客服人員
11‧‧‧中控模組
12‧‧‧互動模組
21‧‧‧信號處理模組
22‧‧‧語言分類模組
23‧‧‧語音轉文字模組
24‧‧‧發音字典檔
31‧‧‧字典檔資料庫
32‧‧‧語意分析模組
33‧‧‧分詞處理模組
34‧‧‧關鍵字擷取模組
41‧‧‧工商店家資料庫
42‧‧‧工商店家比對模組
43‧‧‧歷史查詢資料庫
44‧‧‧第一關聯店家推薦模組
45‧‧‧第二關聯店家推薦模組
46‧‧‧反饋資訊模組
100‧‧‧系統

Claims (10)

  1. 一種查詢服務之系統,係包括:互動裝置,係取得客戶端要求查詢服務所發出的查詢資訊,其中,該查詢資料包含語音查詢資料;語音辨識裝置,係將該互動裝置所取得該查詢資訊中的語音查詢資料轉換成文字查詢資料;關鍵字分析判定裝置,係接收該文字查詢資料,並從字典檔資料庫中找出與該文字查詢資料相同的資料,以得到關鍵字特徵,其中,該關鍵字特徵包含招牌名稱、縣市名稱、路名或行業別;以及大數據分析裝置,係接收該關鍵字分析判定裝置所得的該關鍵字特徵,且該大數據分析裝置係包含:工商店家資料庫,係儲存工商店家資料,該工商店家資料包含招牌名稱、縣市名稱、路名或行業別;工商店家比對模組,係從該工商店家資料庫中找出與該關鍵字特徵中的招牌名稱之讀音相同且行業別、縣市名稱及路名之至少一相同者,以得到關聯工商店家資料;歷史查詢資料庫,係儲存該查詢服務的歷史查詢紀錄;及第一關聯店家推薦模組,係透過逆文檔頻率演算法計算該關聯店家資料於該歷史查詢資料庫中的被查詢頻率,以令被查詢頻率大於第一預設 門檻值的該關聯店家資料為第一類推薦店家資料,進而推薦該第一類推薦店家資料給該客戶端。
  2. 如申請專利範圍第1項所述之系統,其中,該歷史查詢紀錄包含客戶滿意度,且該大數據分析裝置更包括:第二關聯店家推薦模組,係當該第一關聯店家推薦模組無法取得該第一類推薦店家資料時,從該歷史查詢資料庫中找出與該關鍵字特徵相同且客戶滿意度為好的歷史查詢紀錄,以得到關聯歷史查詢紀錄,並將該關聯歷史查詢紀錄進行Apriori機器學習演算法計算取得特徵值,以令該特徵值符合預設推薦條件的該關聯歷史查詢紀錄為第二類推薦店家資料,進而推薦該第二類推薦店家資料給該客戶端。
  3. 如申請專利範圍第1或2項所述之系統,其中,該大數據分析部更包括:反饋資訊模組,係將該客戶端要求該查詢服務至推薦該推薦店家資料給該客戶端之間的處理過程儲存成該歷史查詢資料庫中的該歷史查詢紀錄。
  4. 如申請專利範圍第1或2項所述之系統,其中,該查詢資訊更包含該客戶端之話機線路所在縣市,且該文字查詢資料中無縣市名稱或路名時,該關鍵字分析判定裝置將該客戶端之話機線路所在縣市納入該關鍵字特徵中。
  5. 如申請專利範圍第1項所述之系統,其中,該字典檔資料庫包含縣市名稱字典檔、路名字典檔、行業名稱字典 檔、招牌名稱字典檔、景點名稱字典檔、俗名簡稱字典檔、破音字字典檔或行業別同義詞字典檔。
  6. 一種查詢服務之方法,係包括下列步驟:(1)取得客戶端要求查詢服務的查詢資訊,其中,該查詢資料包含語音查詢資料;(2)將該查詢資訊中的語音查詢資料轉換成文字查詢資料;(3)從字典檔資料庫中找出與該文字查詢資料相同的資料,並將該相同的資料中的贅詞過濾,以得到關鍵字特徵,其中,該關鍵字特徵包含招牌名稱、縣市名稱、路名或行業別;(4)從該工商店家資料庫中找出與該關鍵字特徵中的招牌名稱之讀音相同且行業別、縣市名稱及路名之至少一相同者,以得到關聯工商店家資料;(5)利用逆文檔頻率演算法計算該關聯店家資料於歷史查詢資料庫中的被查詢頻率,以令被查詢頻率大於第一預設門檻值的該關聯店家資料為第一類推薦店家資料;以及(6)將該推薦店家資料推薦給該客戶端。
  7. 如申請專利範圍第6項所述之方法,其中,當該步驟(5)無法利用該逆文檔頻率演算法取得該第一類推薦店家資料時,則從該歷史查詢資料庫中找出與該關鍵字特徵相同且客戶滿意度為好的歷史查詢紀錄,以得到關聯歷史查詢紀錄,進而將該關聯歷史查詢紀錄進行Apriori 機器學習演算法計算取得特徵值,以令該特徵值符合預設推薦條件的該關聯歷史查詢紀錄為第二類推薦店家資料。
  8. 如申請專利範圍第6或7項所述之方法,其中,該方法更包括下列步驟:(7)將該客戶端要求該查詢服務至推薦該推薦店家資料給該客戶端之間的處理過程儲存成該歷史查詢資料庫中的該歷史查詢紀錄。
  9. 如申請專利範圍第6或7項所述之方法,其中,該查詢資訊更包含該客戶端之話機線路所在縣市,且該語音查詢資料中無縣市名稱或路名時,令該關鍵字分析判定部將該客戶端之話機線路所在縣市納入該關鍵字特徵中。
  10. 如申請專利範圍第6項所述之方法,其中,該字典檔資料庫包含縣市名稱字典檔、路名字典檔、行業名稱字典檔、招牌名稱字典檔、景點名稱字典檔、俗名簡稱字典檔、破音字字典檔或行業別同義詞字典檔。
TW107139680A 2018-11-08 2018-11-08 查詢服務之系統與方法 TWI698756B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW107139680A TWI698756B (zh) 2018-11-08 2018-11-08 查詢服務之系統與方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW107139680A TWI698756B (zh) 2018-11-08 2018-11-08 查詢服務之系統與方法

Publications (2)

Publication Number Publication Date
TW202018529A true TW202018529A (zh) 2020-05-16
TWI698756B TWI698756B (zh) 2020-07-11

Family

ID=71895769

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107139680A TWI698756B (zh) 2018-11-08 2018-11-08 查詢服務之系統與方法

Country Status (1)

Country Link
TW (1) TWI698756B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI759003B (zh) * 2020-12-10 2022-03-21 國立成功大學 語音辨識模型的訓練方法
TWI766457B (zh) * 2020-11-27 2022-06-01 國立臺北護理健康大學 用於語言之分析系統及上傳分析方法
TWI769834B (zh) * 2020-05-28 2022-07-01 日商杰富意鋼鐵股份有限公司 資訊檢索系統
TWI769835B (zh) * 2020-05-28 2022-07-01 日商杰富意鋼鐵股份有限公司 資訊檢索系統
TWI799835B (zh) * 2021-04-16 2023-04-21 兆豐國際商業銀行股份有限公司 為商家指派服務銀行分行的電子裝置和方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8140335B2 (en) * 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
TW201115368A (en) * 2009-10-28 2011-05-01 Chunghwa Telecom Co Ltd Business information system of interest index using voice for number dearching and method thereof
US8756248B1 (en) * 2012-06-26 2014-06-17 C. Joseph Rickrode Rapid access information database (RAID) system and method for mobile entity data aggregation
CN103049853B (zh) * 2012-12-19 2016-12-14 胡绍珠 店铺真伪识别装置及验证方法
US9942334B2 (en) * 2013-01-31 2018-04-10 Microsoft Technology Licensing, Llc Activity graphs

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI769834B (zh) * 2020-05-28 2022-07-01 日商杰富意鋼鐵股份有限公司 資訊檢索系統
TWI769835B (zh) * 2020-05-28 2022-07-01 日商杰富意鋼鐵股份有限公司 資訊檢索系統
TWI766457B (zh) * 2020-11-27 2022-06-01 國立臺北護理健康大學 用於語言之分析系統及上傳分析方法
TWI759003B (zh) * 2020-12-10 2022-03-21 國立成功大學 語音辨識模型的訓練方法
TWI799835B (zh) * 2021-04-16 2023-04-21 兆豐國際商業銀行股份有限公司 為商家指派服務銀行分行的電子裝置和方法

Also Published As

Publication number Publication date
TWI698756B (zh) 2020-07-11

Similar Documents

Publication Publication Date Title
TWI698756B (zh) 查詢服務之系統與方法
US11341970B2 (en) Personal directory service
US10431214B2 (en) System and method of determining a domain and/or an action related to a natural language input
US8041568B2 (en) Business listing search
US7890326B2 (en) Business listing search
US8010343B2 (en) Disambiguation systems and methods for use in generating grammars
Wang et al. An introduction to voice search
US7680661B2 (en) Method and system for improved speech recognition
US7103553B2 (en) Assistive call center interface
US20060069564A1 (en) Method of weighting speech recognition grammar responses using knowledge base usage data
US20060143007A1 (en) User interaction with voice information services
US20030191639A1 (en) Dynamic and adaptive selection of vocabulary and acoustic models based on a call context for speech recognition
AU2015261693A1 (en) Disambiguating heteronyms in speech synthesis
KR100818979B1 (ko) 채팅 에이전트를 위한 대화 관리 장치 및 그 방법
US7949651B2 (en) Disambiguating residential listing search results
JP2015153108A (ja) 音声会話支援装置、及び音声会話支援方法及びプログラム
US20060069563A1 (en) Constrained mixed-initiative in a voice-activated command system
US20080240396A1 (en) Semi-supervised training of destination map for call handling applications
CN111899140A (zh) 基于话术水平提升的客服培训方法及***
JP2017134686A (ja) 解析システム、解析方法、及び解析プログラム
Callejas et al. Implementing modular dialogue systems: A case of study
Wang et al. Voice search
CN108877781B (zh) 一种智能语音搜索影片的方法及***
KR20090071635A (ko) 사업체 목록 탐색
CN113822029A (zh) 客服辅助方法、装置和***