TWI807172B

TWI807172B - 基於智慧互動的主動風控方法和系統

Info

Publication number: TWI807172B
Application number: TW109106896A
Authority: TW
Inventors: 姚磊; 應亦豐; 李娜; 張哲
Original assignee: 開曼群島商創新先進技術有限公司
Priority date: 2019-08-07
Filing date: 2020-03-03
Publication date: 2023-07-01
Also published as: WO2021022790A1; CN110598982B; CN110598982A; TW202107382A

Abstract

本揭露提供了一種基於智慧互動的主動風控方法，包括：獲取風險實施者的聯繫方式；基於風險實施者的聯繫方式進行與風險實施者的主動互動並產生主動互動記錄；處理主動互動記錄並提取風險特徵；根據風險特徵將風險歸類；以及按照風險的類別對風險進行不同的風險控制。

Description

基於智慧互動的主動風控方法和系統

本揭露主要關於風險控制，尤其關於主動風險控制。

隨著網際網路應用逐步深入到人們生活中的各個方面，用戶面臨的風險程度和種類都在不斷增加，這些風險中以非法侵佔用戶資金最為突出。目前第三方支付蓬勃發展、交易過程逐步便捷，而相對地，人們對風險防範的意識還沒有隨之提升，最終表現為受侵害案件頻繁發生。傳統上的風險控制方案，是對已發生的案件進行深入分析，獲取其中出現的電話號碼和作案手法，然後根據這些特徵進行風險控制。從用戶保護的角度上看，此時用戶已經受到侵害，損失已經造成，極大降低了用戶體驗。通過分析當前風險可以發現，第三方支付在整個風險過程中是資金轉移的管道，風險發生的主要場所都在支付過程外。同時，資金轉移的收益方，即收款的媒體較多為新出現媒體，通過傳統的風險控制方案無法在案件發生前進行識別。本領域需要一種高效的基於智慧互動的主動風控方法和系統，能夠在風險發生之前及時發現風險實施者，從而降低風險實施者作案的效率並降低用戶受侵害的可能性。

為解決上述技術問題，本揭露提供了一種高效的基於智慧互動的主動風控方案。此方案能夠主動出擊，事前識別。本方案還具備智慧互動的能力，通過使用智慧互動的模型來代替人工主動與風險實施者通過各種聯繫方式交流，可以實現全天候的高效率工作。同時，通過互動代理的設計，可以無限的擴展機器並行工作能力，提升處理輸送量。本方案還能夠實現自動化的風險控制。基於所獲得的風險媒體和風險過程，可以自動進入到後面的處理平臺、自動配置相關決策動作，從而大大提升風險防禦的效果。在本揭露一實施例中，提供了一種基於智慧互動的主動風控方法，包括：獲取風險實施者的聯繫方式；基於風險實施者的聯繫方式進行與風險實施者的主動互動並產生主動互動記錄；處理主動互動記錄並提取風險特徵；根據風險特徵將風險歸類；以及按照風險的類別對風險進行不同的風險控制。在本揭露的另一實施例中，獲取風險實施者的聯繫方式進一步包括：採集與風險相關的原始資料；對原始資料進行語義分析；根據語義分析結果標定風險程度並確定處理優先順序；以及按照處理優先順序提取風險實施者的聯繫方式。在本揭露的又一實施例中，風險實施者的聯繫方式包括電話號碼、即時通信帳號、網路發佈帳號以及電子郵箱。在本揭露的另一實施例中，基於風險實施者的聯繫方式進行與風險實施者的主動互動進一步包括：基於風險實施者的聯繫方式主動聯繫風險實施者；接收風險實施者發出的資訊；分析風險實施者發出的資訊以識別互動主題；基於互動主題確認風險實施者的意圖；以及根據風險實施者的意圖自動產生回應。在本揭露的另一實施例中，基於風險實施者的聯繫方式進行與風險實施者的主動互動通過互動代理進行。在本揭露的又一實施例中，處理主動互動記錄並提取風險特徵進一步包括：將主動互動記錄進行多媒體格式轉換；對轉換後的主動互動記錄進行語義分析；以及基於語義分析結果進行風險過程挖掘以提取風險特徵。在本揭露的另一實施例中，風險特徵包括風險媒體特徵、風險行為特徵、風險時間特徵以及風險地域特徵。在本揭露一實施例中，提供了一種基於智慧互動的主動風控系統，包括：獲取模組，獲取風險實施者的聯繫方式；主動互動模組，基於風險實施者的聯繫方式進行與風險實施者的主動互動並產生主動互動記錄；特徵提取模組，處理主動互動記錄並提取風險特徵；以及歸類控制模組，根據風險特徵將風險歸類，並按照風險的類別對風險進行不同的風險控制。在本揭露的另一實施例中，獲取模組獲取風險實施者的聯繫方式進一步包括：採集與風險相關的原始資料；對原始資料進行語義分析；根據語義分析結果標定風險程度並確定處理優先順序；以及按照處理優先順序提取風險實施者的聯繫方式。在本揭露的又一實施例中，風險實施者的聯繫方式包括電話號碼、即時通信帳號、網路發佈帳號以及電子郵箱。在本揭露的另一實施例中，主動互動模組基於風險實施者的聯繫方式進行與風險實施者的主動互動進一步包括：基於風險實施者的聯繫方式主動聯繫風險實施者；接收風險實施者發出的資訊；分析風險實施者發出的資訊以識別互動主題；基於互動主題確認風險實施者的意圖；以及根據風險實施者的意圖自動產生回應。在本揭露的另一實施例中，主動互動模組基於風險實施者的聯繫方式進行與風險實施者的主動互動通過主動互動模組中的互動代理進行。在本揭露的又一實施例中，特徵提取模組處理主動互動記錄並提取風險特徵進一步包括：將主動互動記錄進行多媒體格式轉換；對轉換後的主動互動記錄進行語義分析；以及基於語義分析結果進行風險過程挖掘以提取風險特徵。在本揭露的另一實施例中，風險特徵包括風險媒體特徵、風險行為特徵、風險時間特徵以及風險地域特徵。在本揭露一實施例中，提供了一種儲存有指令的電腦可讀儲存媒體，當這些指令被執行時使得機器執行如前所述的方法。提供本概述以便以簡化的形式介紹以下在詳細描述中進一步描述的一些概念。本概述並不旨在標識所要求保護主題的關鍵特徵或必要特徵，也不旨在用於限制所要求保護主題的範圍。

為使得本揭露的上述目的、特徵和優點能更加明顯易懂，以下結合附圖對本揭露的具體實施方式作詳細說明。在下面的描述中闡述了很多具體細節以便於充分理解本揭露，但是本揭露還可以採用其它不同於在此描述的其它方式來實施，因此本揭露不受下文公開的具體實施例的限制。近年來，伴隨行動網際網路、虛擬實境等技術的飛速發展，網際網路金融的服務模式日趨多樣化。通過虛擬網路實現的產品交易，越來越多的線上交易開始體現出用最少的互動、最具個性化的引導來促成交易。在客戶享受靈活便捷服務的同時，受侵害風險呈現出更加隱蔽、專業的特點，發展出更多的作案手法和表現形式。受侵害風險多指利用第三方身份、虛假證件和資料，有團隊、有組織地進行惡意騙貸。受侵害的對象有使用者、諸如銀行的金融機構、諸如應用程式APP的平臺等等。在受侵害物件為使用者的情況下，從行為模式來說，網路犯罪行為可進一步分為電信犯罪行為和網路傳銷犯罪活動。電信犯罪行為是指犯罪分子通過電話、簡訊和網路方式，編造虛假資訊、設置騙局，對受害者實施遠端、非接觸式侵害的行為。網路傳銷犯罪活動是利用網路等手段進行傳銷犯罪活動。它相比於電信犯罪行為更加隱秘，利用普通人愛財心理發展下線，發展速度非常快，受害者數量多且廣泛，往往對社會造成嚴重影響。傳統風險防控通常採用被動風控和人力風控等方法。人力風控通過人工對發生的風險進行識別和總結，依賴專家規則、黑名單庫等，需要累積相關經驗，且無法保持長時間、高效率的工作。在與風險實施者對抗過程中，處於被動防守，時效性較低。而被動風控一般根據已經發生的案件，進行全面分析後將風險風控配置到即時防控體系中。此時該風險物件已經實施成功，使用者已產生了資金損失，成功後的媒體(例如，風險實施帳戶或帳號、手機號碼碼等)存活時間短，很容易被棄用。顯然，這些方法已經不能適應新的風險挑戰。本揭露提出了一種基於智慧互動的主動風控方案。由於溝通是所有風險行為的起點，目前常見的溝通管道是通過電話號碼打電話或發簡訊進行電信互動，以及基於即時通信帳號、網路發佈帳號以及電子郵箱進行線上互動，因此在溝通過程中，需要知道對方的聯繫方式。通過風險資料的主動識別，挖掘出風險實施者的聯繫方式，繼而發起主動互動。根據互動過程記錄，能夠識別出其中的關鍵行為特徵，由此能夠識別出常用風險手法、並能及時發現新的風險手法。最後根據這些常用和新的風險手法，進行相應的風險防控和策略佈局。在下文中，將針對用戶受到電信犯罪行為侵害的場景進行詳細描述。然而，所屬技術領域中具有通常知識者可以理解，本揭露的技術方案同樣適用於關於網路傳銷犯罪活動，諸如銀行、保險機構等的金融機構受到侵害，以及諸如應用程式APP等的平臺受到侵害以及其他場景下的侵害。下文將基於附圖具體描述根據本揭露各個實施例的基於智慧互動的主動風控方法和系統。基於智慧互動的主動風控方法 圖1示出根據本揭露一實施例的基於智慧互動的主動風控方法100的流程圖。在102，獲取風險實施者的聯繫方式。風險實施者想要對用戶實施侵害，其必定需要通過一定的手段與受害者進行溝通，達到非法佔有受害者錢財的目的，因此溝通是所有風險行為的起點。以電信犯罪行為為例，近年來層出不窮的電信犯罪行為有：金融理財相關侵害行為(例如，虛假中獎、獎勵、退款；證券相關；***相關；保險相關；保證金相關等)、***相關侵害行為、虛假招聘/兼職相關侵害行為、身份冒充相關侵害行為、虛假購物相關侵害行為、網遊交易相關侵害行為、和虛擬商品相關侵害行為等等。一般情況下，風險實施者會在公開場所發佈自己的聯繫方式，等待使用者主動與其進行聯繫。就電信犯罪行為而言，風險實施者的聯繫方式包括電話號碼、即時通信帳號、網路發佈帳號以及電子郵箱等等。所屬技術領域中具有通常知識者可以理解，風險實施者採用任何其他聯繫方式是可能的，並且隨著網路和通信技術的進步，風險實施者當然有可能選擇新的或先進的聯繫方式，這些聯繫方式也被納入本揭露的技術方案內。在本揭露一實施例中，採用爬蟲工具來收集潛在風險實施者的聯繫方式。爬蟲工具是在開放網路中(如論壇、廣告聯盟、分類資訊網站等)進行主動採集和挖掘，形成有潛在風險的聯繫方式集合(例如，電話號碼集合、即時通信帳號集合、網路發佈帳號集合以及郵箱集合等)。通過爬蟲工具，根據一定的風險識別規則和聯繫方式採集規則，可以定期到各個公開場所採集疑似有風險的聯繫方式。爬蟲工具所採集的未經處理的原始資料可被輸出以供進一步分析。在本揭露另一實施例中，可採用第三方提供的疑似風險實施者資料庫。所屬技術領域中具有通常知識者可以理解，可採用各種辦法來收集潛在風險實施者的聯繫方式，以上兩個實施例的描述並不構成對本揭露技術方案的限定。進一步地，風險實施者在公開場所發佈自己的聯繫方式時，其發佈內容往往含有其他有價值資訊，例如具有‘中獎’、‘獎勵’、‘退款’、‘招聘’、‘兼職’等敏感詞，或者含有可疑連結等。所採集或收集到的未經處理的原始資料可被處理，以提取出潛在風險實施者的聯繫方式。這一過程將在下文中參照圖2的示意圖和圖3的流程圖進行描述。在104，基於風險實施者的聯繫方式進行與風險實施者的主動互動並產生主動互動記錄。基於風險實施者的聯繫方式，機器人能夠進行大規模的主動出擊。在本揭露一實施例中，機器人是互動代理，其後端連接相應的智慧互動模型。所屬技術領域中具有通常知識者可以理解，機器人是主動出擊的實體，其可以有各種不同的實現方式。在下文中，將以互動代理和智慧互動模型為例展開描述。互動代理在智慧互動模型和風險實施者之間建立資訊通道，是訊息的中轉節點。智慧互動模型則具備自動互動能力，能夠不被對方識別為機器且支援針對特定場景的有傾向性的引導，從而獲取希望得到的風險資訊。互動代理還支援通過參數調整來扮演不同的人物設定。智慧互動模型包含互動主題理解、對方意圖確認、自動產生回應三個部分，主要包括兩個模型：能夠理解風險實施者發過來的資訊並得到對方意圖的互動意圖理解模型；以及根據對方意圖自動產生對應回復的回應產生模型。通過互動代理和智慧互動模型，與風險實施者的主動互動可基於風險實施者的聯繫方式來進行。這一過程將在下文中參照圖4的示意圖和圖5的流程圖進行描述。該與風險實施者的主動互動被記錄下來並保存為主動互動記錄。在106，處理主動互動記錄並提取風險特徵。主動互動記錄通常包含完整的風險過程，可以從中發現有價值的風險資料，總結出風險的關鍵點和顯著手法，是下一步分析和防控的基礎。處理主動互動記錄可包括格式統一轉換、互動過程語義理解和風險過程挖掘。對風險過程的挖掘將獲取相關於風險場景的風險特徵。風險特徵包括風險媒體特徵、風險行為特徵、風險時間特徵、風險地域特徵等。所屬技術領域中具有通常知識者可以理解，針對不同風險場景，可提取不同的風險媒體特徵、風險行為特徵、風險時間特徵、風險地域特徵，還可提供不同的其他風險特徵。處理主動互動記錄並提取風險特徵的具體過程將在下文中參照圖6的示意圖和圖7的流程圖進行描述。在108，根據風險特徵將風險歸類。就電信犯罪行為而言，風險分為內部風險和外部風險。外部風險主要包括當事人侵害、第三方侵害以及洗錢侵害，內部風險主要包括未經授權的行為與侵害。根據以上所提取的風險特徵，可將風險進行歸類。風險時間特徵和風險地域特徵通常有助於結合風險行為特徵和風險媒體特徵來將風險歸類。風險媒體特徵描述在風險發生過程中風險實施者與使用者發生資訊溝通、資金轉移等時所使用的工具和管道。風險行為特徵描述在風險發生過程中風險實施者的行為與正常行為有一定區分度的行為點集合。當各個風險特徵顯示風險在系統內部發生，則將風險歸類為內部風險；而當各個風險特徵顯示風險在系統外部發生，則將風險歸類為外部風險。根據風險特徵將風險歸類的過程將在下文中結合具體示例進行說明。在110，按照風險的類別對風險進行不同的風險控制。對於內部風險，基於不同的風險特徵，建立有針對性的保護體系。舉例而言，可在系統內的不同層面進行進一步的風險控制。在外部管道層進一步監控交易發生前的客戶存取、會話可疑行為；交易發生中的交易對手是否在可疑名單中。在內部管道層監控業務違規與可疑操作。在產品服務層監控產品服務內的侵害交易以及跨產品的侵害交易。在資料整合層監控跨產品、管道的組合/複雜侵害交易。而對於外部風險，由於存在本系統內無法獨立處理的資料，因此將風險資料輸出以對外提供風險服務，例如，將可疑電話號碼推送給電信營運商、將可疑銀行卡/帳戶推送給相關銀行等等。圖2示出根據本揭露一實施例的獲取潛在風險實施者的聯繫方式的過程的示意圖。獲取潛在風險實施者的聯繫方式的過程實際上是風險實施者主動識別的過程。用戶在受到侵害前，風險實施者必需通過一定手段與受害者進行溝通，從而逐步達到非法佔有受害者錢財的目的，因此溝通是所有風險行為的起點。目前常見的溝通管道是通過電話號碼來打電話或發簡訊，通過即時通信帳號發送文字、圖片、視訊等，通過網路發佈帳號互動，以及通過電子郵箱發送連結等等。因此在溝通過程中，需要知道對方的聯繫方式。通過風險資料的主動識別，可挖掘出風險實施者的聯繫方式，為主動互動建立資料基礎。在本揭露一實施例中，可採用爬蟲工具收集風險資料。爬蟲工具在開放網路(例如論壇、廣告聯盟、分類資訊網站等)中進行主動採集和挖掘，形成有潛在風險的聯繫方式集合。一般情況下，風險實施者會在公開場所發佈自己的聯繫方式，等待使用者主動與其進行聯繫。通過爬蟲工具，根據風險識別規則和聯繫方式採集規則，可以定期到各個公開場所採集疑似有風險的聯繫方式。爬蟲採集的是未經處理的原始資料，輸出給風險理解平臺進行進一步分析。可以理解，可採用其他工具來收集風險資料。在本揭露另一實施例中，可採用第三方提供的疑似風險實施者資料庫。所屬技術領域中具有通常知識者可以理解，可採用各種辦法來收集潛在風險實施者的聯繫方式，以上兩個實施例的描述並不構成對本揭露技術方案的限定。風險識別規則和聯繫方式採集規則可事先設定，或者可逐步學習和積累。風險識別規則和聯繫方式採集規則可以是簡單規則、規則集，也可以是規則樹、規則流等，甚至還可以是納入了自然語言模型和深度學習演算法的識別引擎，以針對不同風險場景識別出風險並採集到含有風險資訊的相應原始資料。舉例而言，與電信犯罪行為相關地，風險識別規則和聯繫方式採集規則可設定關聯於金融理財相關侵害行為(例如，虛假中獎、獎勵、退款；證券相關；***相關；保險相關；保證金相關等)、***相關侵害行為、虛假招聘/兼職相關侵害行為、身份冒充相關侵害行為、虛假購物相關侵害行為、網遊交易相關侵害行為、和虛擬商品相關侵害行為等等的關鍵字，依據這些關鍵字來建立規則並隨著電信犯罪行為的變異而適應性地動態更新規則。在本揭露一實施例中，爬蟲工具發現一網路發佈帳號發佈針對某地高考生的潛在虛假獎勵訊息，聲稱收到大學錄取通知書的學生將一次性獲得助學金2800元，並留下了電話號碼以供符合條件的學子們電話或簡訊聯繫。爬蟲工具依據關鍵字“助學金”，採集到包含網路發佈帳號、電話號碼、“助學金”獲取條件以及“助學金金額”等等的原始資料。風險理解平臺被用來處理爬蟲工具採集的原始資料。針對含有風險資訊的相應原始資料，可進行風險語義理解、風險程度標定和風險實施者聯繫方式提取。風險語義理解對爬蟲工具採集的原始資料進行語義分析，根據自然語言理解模型及其中設計的參數和臨限值，確認是否為風險資料，並對資料做分詞、主題特徵等預處理。在虛假獎勵的實施例中，風險語義理解對所採集到的“收到大學錄取通知書的學生將一次性獲得助學金2800元”進行語義分析，基於自然語言理解模型理解存在“收到大學錄取通知書的學生”這一條件。進一步地，確認該資料可能為風險資料，並預處理該風險資料，以提取出網路發佈帳號、電話號碼、“助學金”提供機構、“助學金”獲取條件以及“助學金金額”等資訊。接著基於語義理解，對不同聯繫方式做標記，例如通過電話語言溝通、通過簡訊聯繫、即時通信應用程式互動等類型，並對可能關於的侵害類型作預判，例如虛假獎勵、物件為無獨立經濟能力的學生。由此，風險程度標定基於語義理解和可能侵害類型，判斷該風險可能造成的危害程度，從1級到5級風險程度逐漸增大，作為後面處理優先順序的依據。根據可能危害程度，按優先順序進行風險實施者聯繫方式提取，提取出風險資料中的有價值資訊，包括對方的聯繫方式等資訊，從而構成潛在風險實施者集合。圖3示出根據本揭露一實施例的獲取潛在風險實施者的聯繫方式的過程300的流程圖。在302，採集與風險相關的原始資料。在虛假獎勵的實施例中，爬蟲工具依據關鍵字“助學金”，採集到包含網路發佈帳號、電話號碼、“助學金”提供機構、“助學金”獲取條件以及“助學金金額”等等的原始資料。在304，對原始資料進行語義分析。在虛假獎勵的實施例中，風險語義理解對所採集到的“收到大學錄取通知書的學生將一次性獲得助學金2800元”進行語義分析，基於自然語言理解模型理解存在“收到大學錄取通知書的學生”這一條件。進一步地，可基於“收到大學錄取通知書的學生”這一條件對該地該年符合條件的高考生人數進行粗略統計或資料提取，並粗略計算總金額。比對該網路發佈帳號所聲稱的資助機構的財力，並搜尋該資助機構的歷史資料。然後，確認該原始資料可能為風險資料，並預處理該風險資料，以提取出網路發佈帳號、電話號碼、“助學金”提供機構、“助學金”獲取條件以及“助學金金額”等資訊。在306，根據語義分析結果標定風險程度並確定處理優先順序。根據語義分析結果，對例如通過電話語言溝通、通過簡訊聯繫、即時通信應用程式互動等類型的不同聯繫方式做標記，並對可能關於的侵害類型作預判，例如虛假獎勵、物件為無獨立經濟能力的學生。由此，基於語義理解和可能侵害類型進行風險程度標定，判斷該風險可能造成的危害程度，從1級到5級風險程度逐漸增大，作為後續處理的處理優先順序。例如，在虛假獎勵的本實施例中，將其風險程度標記為4。當然，所屬技術領域中具有通常知識者可以理解，風險程度的標定可按不同風控系統而不同，只要其可作為後續處理的優先順序提示即可。在308，按照處理優先順序提取風險實施者的聯繫方式。根據可能危害程度，按優先順序進行風險實施者聯繫方式提取，提取出風險資料中的有價值資訊，包括原始發佈途徑、對方的聯繫方式、可能侵害類型等資訊，從而構成潛在風險實施者資料集合。該潛在風險實施者資料集合可被儲存為結構化資料。圖4示出根據本揭露一實施例的與潛在風險實施者的主動互動的過程的示意圖。與潛在風險實施者的主動互動的過程主要由智慧互動平臺來進行。智慧互動平臺負責管理全部互動過程，該平臺可配置多個互動代理。平臺根據風險的不同可能侵害類型將風險分配給不同的互動代理，同時將相應的潛在風險實施者資料作為該互動代理的輸入。平臺根據潛在風險待處置任務的多少，自動控制同時工作的代理數量、每個代理的工作時長等，並即時監控代理工作情況，產生統計資料。互動代理是主動出擊的實體，其後端連接智慧互動模型。依據相連接模型的不同，互動代理分為語音代理、文件代理、即時通信代理、網路發佈回應代理等，分別處理電話語音互動、簡訊互動、即時訊息互動、網路發佈訊息互動等等。互動代理作為訊息的中轉節點，在智慧互動模型和風險實施者之間建立資訊通道。每一個互動代理均可以獨立完成主動出擊的工作。當然，多個互動代理亦可聯合進行主動出擊，以便於處置潛在的團夥風險實施者。在處理規模上，可以通過配置多個互動代理，來快速提升系統的處理輸送量。智慧互動模型具備自動互動能力，具體能力有：在受侵害場景下不被對方識別為機器；支援有傾向性的引導，從而獲取希望得到的風險資訊；以及支援通過參數調整來扮演不同的人物設定。在主動互動之前或期間，智慧互動模型可基於後臺資料和運行，為主動互動準備相關資料和資訊。以虛假獎勵的實施例為例，智慧互動模型可支援例如缺乏社會經驗的高中畢業生、相對具備社會經驗的家長、以及相對具備社會經驗的班主任老師等不同的人物設定，引導潛在風險實施者進一步說明領取助學金的方式，是否關於對方提供帳號、要求學生先行轉帳等的風險操作；並進一步引導潛在風險實施者說明提供助學金的支助機構的情況。基於該針對某地高考生的虛假獎勵訊息，智慧互動模型還可查詢該地符合“收到大學錄取通知書的學生”這一條件的學生總人數，將每人助學金2800元與總人數相乘，確定總金額。由此，來為後續的主動互動做資訊準備。基於潛在風險實施者說明的資助機構的情況，智慧互動模型可進行查詢並在後續進行相關互動，以供驗證。具體地，針對與潛在風險實施者的主動互動過程，智慧互動模型可進行互動主題理解、對方意圖確認、以及自動產生回應等。首先進行互動主題理解：在主動聯繫後接收並分析對方發送的語音、文字、圖片或視訊，理解當前處於何種互動主題。以虛假獎勵的實施例為例，可依據對方發送的資訊理解互動主題為“助學金獎勵”。接著進行對方意圖確認：對方發出的不同表述的語句，背後包含的意義可能一樣，因此需要把對方的資訊轉換為標準問題，然後識別對方的意圖，明白對方的目的。在本實施例中，面對不同設定的角色，例如學生、家長或老師，對方的表述必然不同。由此可將對方的資訊轉換成對一些標準問題的回答，諸如，獲取助學金的流程是什麼？已領取助學金的學生有多少(或者，可領取的學生共有多少)？資助機構是什麼性質的機構？學生後續需要滿足什麼條件或進行怎樣的回饋？等等。然後自動產生回應：基於對方意圖，通過自然語言產生模型，加上有相應特點的修飾語氣或詞，產生對該意圖的回應。對於簡訊互動，產生文件即可；對於語音互動，需要把內容轉化為音效檔；對於即時通信互動，需要在所使用的文字、語音或表情符、回應速度等方面保持相應個性或特點；而對於網路發佈或電子郵件互動，由於行文會相對比較自由，因此需要保持相應的行文風格。對於整個主動互動，智慧互動平臺將進行互動過程記錄，例如，語音互動代理與潛在風險實施者的電話溝通的完整過程。該記錄包含完整的風險過程，可以從中發現有價值的風險資料，總結出風險的關鍵點和顯著手法，是下一步分析和防控的基礎。圖5示出根據本揭露一實施例的與潛在風險實施者的主動互動的過程500的流程圖。在502，基於風險實施者的聯繫方式主動聯繫風險實施者。爬蟲工具發現一網路發佈帳號發佈針對某地高考生的潛在虛假獎勵訊息，聲稱收到大學錄取通知書的學生將一次性獲得助學金2800元，並留下了電話號碼以供符合條件的學子們電話或簡訊聯繫。據此，智慧互動平臺可基於風險實施者的聯繫方式主動打電話或發簡訊聯繫風險實施者。當然，智慧互動平臺可按照不同的角色設定來進行該主動互動，例如學生、家長或老師。在504，接收風險實施者發出的資訊。在506，分析風險實施者發出的資訊以識別互動主題。在接收到風險實施者發出的資訊後，分析對方發送的語音、文字、圖片或視訊，理解當前處於何種互動主題。在508，基於互動主題確認風險實施者的意圖。基於互動主題即可進行對方意圖確認。對方發出的不同表述的語句，背後包含的意義可能一樣，因此需要把對方的資訊轉換為標準問題，然後識別對方的意圖，明白對方的目的。在510，根據風險實施者的意圖自動產生回應。基於對方意圖，通過自然語言產生模型，加上有相應特點的修飾語氣或詞，產生對該意圖的回應。對於簡訊互動，產生文件即可；對於語音互動，需要把內容轉化為音效檔；對於即時通信互動，需要在所使用的文字、語音或表情符、回應速度等方面保持相應個性或特點；而對於網路發佈或電子郵件互動，由於行文會相對比較自由，因此需要保持相應的行文風格。圖6示出根據本揭露另一實施例的進行風險過程挖掘並提取風險特徵的過程的示意圖。進行風險過程挖掘並提取風險特徵的過程由風險資料處理平臺執行。針對主動互動過程記錄，風險資料處理平臺可進行多媒體格式轉換、互動記錄語義分析、風險過程挖掘、風險特徵提取和風險分類標記。需要多媒體格式統一轉換是由於主動互動過程通過電話語音、簡訊/多媒體簡訊、即時通信(包括文件、語音、視訊、表情符等)以及網路發佈互動進行，為後期處理方便起見，需進行統一轉換為文件，包括語音內容識別和圖片內容識別。以虛假獎勵的實施例為例，智慧互動模型所支援的學生、家長、以及老師等不同的人物設定進行的主動互動主要通過電話和簡訊進行，因此，電話語音和簡訊文字將統一轉換為文字，其中包括語音內容識別。互動過程語義理解基於自然語言處理模型進行，以便於理解風險發生過程。在虛假獎勵的實施例中，互動主題為“助學金獎勵”，由此關注點將落到進一步領取助學金的方式，是否關於對方提供帳號、要求學生先行轉帳等風險操作，以及提供助學金的支助機構等等。由此接著進行風險過程挖掘。風險過程可以通過一系列的行為點進行刻畫，得到風險行為與正常行為有一定區分度的行為點集合。在虛假獎勵的實施例中，正常操作應當是學生提供帳號、由提供助學金的支助機構轉帳至該帳號；由此，當在主動互動過程中，出現了對方提供帳號、要求學生先行轉帳的行為點時，即為風險行為點。此外，在主動互動過程中，當問及獎勵總規模時，正常回應應當是符合統計資料的相應量級，當出現不符合相應量級的回應時即為風險行為點。當然，可以理解，還存在其他風險行為點，在此不再贅述。基於風險過程挖掘，即可提取風險特徵，例如風險時間特徵、風險地域特徵、風險行為特徵、以及風險媒體特徵。在虛假獎勵的實施例中，風險時間特徵為該網路發佈訊息發佈日期以及後續跟帖時間的時間鏈。風險地域特徵為網路發佈訊息中聲稱的地域，同時在互動過程中可進行電話號碼畫像，比對該電話號碼現方位與訊息中聲稱地域。風險行為特徵則是所刻畫的行為點形成的風險行為點集合。風險媒體特徵是在風險行為發生過程中，風險實施者與使用者發生資訊溝通、資金轉移等時所使用的工具、管道等。對方提供的銀行帳號或支付APP的帳號為資金轉移時的工具或管道。基於風險特徵，可將風險歸類並標記。當各個風險特徵顯示風險在系統內部發生時，將風險歸類為內部風險；而當各個風險特徵顯示風險在系統外部發生時，將風險歸類為外部風險。在虛假獎勵的實施例中，風險媒體特徵顯示風險侵害者使用的資金轉移管道在系統外部，由此將風險歸類為外部風險。主動互動記錄的處理使得有價值資訊點通過語義分析來識別，從而進一步地能夠得到常用風險手法，並能及時發現新的風險手法，識別出其中的關鍵行為特徵。圖7示出根據本揭露另一實施例的進行風險過程挖掘並提取風險特徵的過程700的示意圖。在702，將主動互動記錄進行多媒體格式轉換。將主動互動記錄統一轉換為文件，其中包括語音內容識別和圖片內容識別。在704，對轉換後的主動互動記錄進行語義分析。語義分析基於自然語言處理模型針對轉換後的主動互動記錄進行，以便於理解風險發生過程。在706，基於語義分析結果進行風險過程挖掘以提取風險特徵。風險過程可以通過一系列的行為點進行刻畫，得到風險行為與正常行為有一定區分度的行為點集合。基於風險過程挖掘，即可提取風險特徵，例如風險媒體特徵、風險行為特徵、風險時間特徵以及風險地域特徵。基於智慧互動的主動風控系統 圖8示出根據本揭露一實施例的基於智慧互動的主動風控系統800的方塊圖。系統800包括獲取模組802、主動互動模組804、特徵提取模組806以及歸類控制模組808。獲取模組802獲取風險實施者的聯繫方式。風險實施者想要對用戶實施侵害，其必定需要通過一定的手段與受害者進行溝通，達到非法佔有受害者錢財的目的，因此溝通是所有風險行為的起點。一般情況下，風險實施者會在公開場所發佈自己的聯繫方式，等待使用者主動與其進行聯繫。就電信犯罪行為而言，風險實施者的聯繫方式包括電話號碼、即時通信帳號、網路發佈帳號以及電子郵箱等等。在本揭露一實施例中，採用爬蟲工具來收集潛在風險實施者的聯繫方式。在本揭露另一實施例中，可採用第三方提供的疑似風險實施者資料庫。所屬技術領域中具有通常知識者可以理解，可採用各種辦法來收集潛在風險實施者的聯繫方式，以上兩個實施例的描述並不構成對本揭露技術方案的限定。主動互動模組804基於風險實施者的聯繫方式進行與風險實施者的主動互動並產生主動互動記錄。基於風險實施者的聯繫方式，能夠進行大規模的主動出擊。在本揭露一實施例中，主動互動模組804採用互動代理在智慧互動模型和風險實施者之間建立資訊通道，作為訊息的中轉節點。主動互動模組804所採用的智慧互動模型則具備自動互動能力，能夠不被對方識別為機器且支援針對特定場景的有傾向性的引導，從而獲取希望得到的風險資訊。互動代理還支援通過參數調整來扮演不同的人物設定。智慧互動模型包含互動主題理解、對方意圖確認、自動產生回應三個部分，主要包括兩個模型：能夠理解風險實施者發過來的資訊並得到對方意圖的互動意圖理解模型；以及根據對方意圖自動產生對應回復的回應產生模型。該與風險實施者的主動互動被記錄下來並保存為主動互動記錄。特徵提取模組806處理主動互動記錄並提取風險特徵。主動互動記錄通常包含完整的風險過程，可以從中發現有價值的風險資料，總結出風險的關鍵點和顯著手法，是下一步分析和防控的基礎。處理主動互動記錄可包括格式統一轉換、互動過程語義理解和風險過程挖掘。對風險過程的挖掘將獲取相關於風險場景的風險特徵。風險特徵包括風險媒體特徵、風險行為特徵、風險時間特徵、風險地域特徵等。所屬技術領域中具有通常知識者可以理解，針對不同風險場景，可提取不同的風險媒體特徵、風險行為特徵、風險時間特徵、風險地域特徵，還可提供不同的其他風險特徵。歸類控制模組808根據風險特徵將風險歸類。根據所提取的風險特徵，可將風險進行歸類。風險時間特徵和風險地域特徵通常有助於結合風險行為特徵和風險媒體特徵來將風險歸類。風險媒體特徵描述在風險發生過程中風險實施者與使用者發生資訊溝通、資金轉移等時所使用的工具和管道。風險行為特徵描述在風險發生過程中風險實施者的行為與正常行為有一定區分度的行為點集合。當各個風險特徵顯示風險在系統內部發生，則將風險歸類為內部風險；而當各個風險特徵顯示風險在系統外部發生，則將風險歸類為外部風險。進一步，歸類控制模組808按照風險的類別對風險進行不同的風險控制。對於內部風險，基於不同的風險特徵，建立有針對性的保護體系。而對於外部風險，由於存在本系統內無法獨立處理的資料，因此將風險資料輸出以對外提供風險服務。本揭露提出了一種用於基於智慧互動的主動風險控制方案，此方案能夠主動出擊，事前識別。傳統上的風險資訊是通過使用者舉報獲得，即在風險發生後獲取。同時，此時獲取的媒體由於已經作案成功，生命週期很短，很難在後面的防控中發揮較大作用。而本揭露的技術方案通過主動出擊，可以在風險發生前獲得相關資訊，即在沒有實際損失前獲取，做到提前防控。本方案還具備智慧互動的能力，通過使用智慧互動的模型來代替人工主動與風險實施者通過各種聯繫方式交流，可以實現全天候的高效率工作。同時，通過互動代理的設計，可以無限的擴展機器並行工作能力，提升處理輸送量。本方案還能夠實現自動化的風險控制。基於所獲得的風險媒體和風險過程，可以自動進入到後面的處理平臺、自動配置相關決策動作，從而大大提升風險防禦的效果。以上描述的基於智慧互動的主動風控方法和系統的各個步驟和模組可以用硬體、軟體、或其組合來實現。如果在硬體中實現，結合本發明描述的各種說明性步驟、模組、以及電路可用通用處理器、數位訊號處理器(DSP)、特殊應用積體電路(ASIC)、現場可程式設計閘陣列(FPGA)、或其他可程式設計邏輯元件、硬體元件、或其任何組合來實現或執行。通用處理器可以是處理器、微處理器、控制器、微控制器、或狀態機等。如果在軟體中實現，則結合本發明描述的各種說明性步驟、模組可以作為一條或多條指令或代碼儲存在電腦可讀媒體上或進行傳送。實現本發明的各種操作的軟體模組可駐留在儲存媒體中，如RAM、快閃記憶體、ROM、EPROM、EEPROM、暫存器、硬碟、可移磁碟、CD-ROM、雲端儲存等。儲存媒體可耦合到處理器以使得該處理器能從/向該儲存媒體讀寫資訊，並執行相應的程式模組以實現本發明的各個步驟。而且，基於軟體的實施例可以通過適當的通信手段被上載、下載或遠端地存取。這種適當的通信手段包括例如網際網路、全球資訊網、內部網路、軟體應用程式、電纜(包括光纖電纜)、磁通信、電磁通信(包括RF、微波和紅外線通信)、電子通信或者其他這樣的通信手段。還應注意，這些實施例可能是作為被描繪為流程圖、流圖、結構圖、或方塊圖的過程來描述的。儘管流程圖可能會把諸操作描述為順序過程，但是這些操作中有許多操作能夠並行或併發地執行。另外，這些操作的次序可被重新安排。所公開的方法、裝置和系統不應以任何方式被限制。相反，本發明涵蓋各種所公開的實施例(單獨和彼此的各種組合和子組合)的所有新穎和非顯而易見的特徵和方面。所公開的方法、裝置和系統不限於任何具體態樣或特徵或它們的組合，所公開的任何實施例也不要求存在任一個或多個具體優點或者解決特定或所有技術問題。上面結合附圖對本發明的實施例進行了描述，但是本發明並不局限於上述的具體實施方式，上述的具體實施方式僅僅是示意性的，而不是限制性的，所屬技術領域中具有通常知識者在本發明的啟示下，在不脫離本發明宗旨和申請專利範圍所保護的範圍情況下，還可做出很多更改，這些均落在本發明的保護範圍之內。

100:主動風控方法 102:步驟 104:步驟 106:步驟 108:步驟 110:步驟 300:獲取潛在風險實施者的聯繫方式的過程 302:步驟 304:步驟 306:步驟 308:步驟 500:與潛在風險實施者的主動互動的過程 502:步驟 504:步驟 506:步驟 508:步驟 510:步驟 700:進行風險過程挖掘並提取風險特徵的過程 702:步驟 704:步驟 706:步驟 800:系統 802:獲取模組 804:主動互動模組 806:特徵提取模組 808:歸類控制模組

本揭露的以上發明內容以及下面的具體實施方式在結合附圖閱讀時會得到更好的理解。需要說明的是，附圖僅作為所請求保護的發明的示例。在附圖中，相同的附圖標記代表相同或類似的元素。 [圖1]示出根據本揭露一實施例的基於智慧互動的主動風控方法的流程圖； [圖2]示出根據本揭露一實施例的獲取潛在風險實施者的聯繫方式的過程的示意圖； [圖3]示出根據本揭露一實施例的獲取潛在風險實施者的聯繫方式的過程的流程圖； [圖4]示出根據本揭露一實施例的與潛在風險實施者的主動互動的過程的示意圖； [圖5]示出根據本揭露一實施例的與潛在風險實施者的主動互動的過程的流程圖； [圖6]示出根據本揭露另一實施例的進行風險過程挖掘並提取風險特徵的過程的示意圖； [圖7]示出根據本揭露另一實施例的進行風險過程挖掘並提取風險特徵的過程的流程圖； [圖8]示出根據本露一實施例的基於智慧互動的主動風控系統的方塊圖。

Claims

一種基於智慧互動的主動風控方法，包括：透過爬蟲工具根據風險識別規則和聯繫方式採集規則在開放網路中獲取風險實施者在公開場所發佈的聯繫方式；透過互動代理基於所述風險實施者在公開場所發佈的聯繫方式進行與所述風險實施者的主動互動並產生主動互動記錄，其中，所述互動代理的後端連接智慧互動模型，所述智慧互動模型具備如下自動互動能力：在受侵害場景下不被對方識別為機器；支援有傾向性的引導，從而獲取希望得到的風險資訊；以及支援通過參數調整來扮演不同的人物設定；處理所述主動互動記錄並提取風險特徵；根據所述風險特徵將風險歸類；以及按照所述風險的類別對所述風險進行不同的風險控制；其中，處理主動互動記錄並提取風險特徵包括：將所述主動互動記錄進行多媒體格式轉換；對轉換後的所述主動互動記錄進行語義分析；基於語義分析結果進行風險過程挖掘以提取風險特徵。
如請求項1所述的方法，其中，獲取風險實施者的聯繫方式進一步包括：採集與所述風險相關的原始資料；對原始資料進行語義分析；根據語義分析結果標定風險程度並確定處理優先順序；以及按照所述處理優先順序提取所述風險實施者的聯繫方式。
如請求項1所述的方法，其中，所述風險實施者的聯繫方式包括電話號碼、即時通信帳號、網路發佈帳號以及電子郵箱。
如請求項1所述的方法，其中，基於所述風險實施者的聯繫方式進行與所述風險實施者的主動互動進一步包括：基於所述風險實施者的聯繫方式主動聯繫所述風險實施者；接收所述風險實施者發出的資訊；分析所述風險實施者發出的資訊以識別互動主題；基於所述互動主題確認所述風險實施者的意圖；以及根據所述風險實施者的意圖自動產生回應。
如請求項1所述的方法，其中，所述風險特徵包括風險媒體特徵、風險行為特徵、風險時間特徵以及風險地域特徵。
一種基於智慧互動的主動風控系統，包括：獲取模組，透過爬蟲工具根據風險識別規則和聯繫方式採集規則在開放網路中獲取風險實施者在公開場所發佈的聯繫方式；主動互動模組，透過互動代理基於所述風險實施者在公開場所發佈的聯繫方式進行與所述風險實施者的主動互動並產生主動互動記錄，其中，所述互動代理的後端連接智慧互動模型，所述智慧互動模型具備如下自動互動能力：在受侵害場景下不被對方識別為機器；支援有傾向性的引導，從而獲取希望得到的風險資訊；以及支援通過參數調整來扮演不同的人物設定；特徵提取模組，處理所述主動互動記錄並提取風險特徵；以及歸類控制模組，根據所述風險特徵將風險歸類，並按照所述風險的類別對所述風險進行不同的風險控制；其中，處理主動互動記錄並提取風險特徵包括：將所述主動互動記錄進行多媒體格式轉換；對轉換後的所述主動互動記錄進行語義分析；基於語義分析結果進行風險過程挖掘以提取風險特徵。
如請求項6所述的系統，其中，所述獲取模組獲取風險實施者的聯繫方式進一步包括：採集與所述風險相關的原始資料；對原始資料進行語義分析；根據語義分析結果標定風險程度並確定處理優先順序；以及按照所述處理優先順序提取所述風險實施者的聯繫方式。
如請求項7所述的系統，其中，所述風險實施者的聯繫方式包括電話號碼、即時通信帳號、網路發佈帳號以及電子郵箱。
如請求項7所述的系統，其中，所述主動互動模組基於所述風險實施者的聯繫方式進行與所述風險實施者的主動互動進一步包括：基於所述風險實施者的聯繫方式主動聯繫所述風險實施者；接收所述風險實施者發出的資訊；分析所述風險實施者發出的資訊以識別互動主題；基於所述互動主題確認所述風險實施者的意圖；以及根據所述風險實施者的意圖自動產生回應。
如請求項6所述的系統，其中，所述風險特徵包括風險媒體特徵、風險行為特徵、風險時間特徵以及風險地域特徵。
一種儲存有指令的電腦可讀儲存媒體，當所述指令被執行時使得機器執行如請求項1-5中任一項所述的方法。