TWI615724B - 基於電子資訊的關鍵字提取的資訊推送、搜尋方法及裝置 - Google Patents
基於電子資訊的關鍵字提取的資訊推送、搜尋方法及裝置 Download PDFInfo
- Publication number
- TWI615724B TWI615724B TW102107874A TW102107874A TWI615724B TW I615724 B TWI615724 B TW I615724B TW 102107874 A TW102107874 A TW 102107874A TW 102107874 A TW102107874 A TW 102107874A TW I615724 B TWI615724 B TW I615724B
- Authority
- TW
- Taiwan
- Prior art keywords
- evaluation
- product
- keyword
- commodity
- electronic information
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
- G06Q30/0625—Directed, with specific intent or strategy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本申請案係有關文本分析應用的技術領域,特別是有關一種基於電子資訊的關鍵字提取的資訊推送方法及裝置,一種基於電子資訊的評價參數提取的資訊推送方法及裝置,一種基於電子資訊的商品搜尋方法及裝置,以及,一種用戶端。
在目前的資訊時代,越來越多的資訊以電子資訊的方式出現。例如隨著互聯網的快速發展,越來越多的人喜歡在網上發展他們對事情的意見,因而在網路上出現大量包含傾向性的評論資訊。人們希望透過資訊處理手段來獲取這些電子資訊中包含的情感傾向性。
例如,在購買商品等產品之前,人們會希望先得知別人對於該產品的評價是好是壞。為滿足用戶的這種需求,在交易平臺,尤其是C2C、B2C模式的電子商務網站中,會設置評價系統,由買家基於該評價系統針對每次的交易行為給賣家進行手動評價。例如,當買家與賣家完成一筆交易後,買家按照評價系統提供的“好評”、“中評”與“差
評”的參數選項,選擇其中一個評價參數,或進一步給出相應的產品評價說明,如“衣服顏色很好,品質很棒”等。
或如,買家按照電子商務網站中設置的評價參數選項,比如,商品品質、賣家服務態度、物流速度等,在預設的等級中進行選擇,以形成針對此次交易行為的打分,然後根據分數對應到關聯的評價參數“好評”、“中評”或“差評”,或進一步給出相應的產品評價說明。
這種現有的由買家進行手動評價的方式目前產生出許多弊端,比如,某些買家在賣家的脅迫下給出好評的評價參數,但在說明欄內給出商品品質惡劣,服務態度差,物流慢的說明資訊。
再者,目前網路中會有大量的文章或評論來評價或解說一個產品,例如專門的產品試用報告(或產品使用報告),在各論壇中用戶針對某些產品的評論等,這些文章或評論,會表達作者的一種觀點,這些觀點,有正面支持的,有反面反對的,也有中立的,有些評論或者文章,會直接讓作者選擇自己的觀點,例如贊或踩之類,但是大部分的文章,比如博客、日誌、試用報告等,是沒有這種觀點選擇的。然而,這些文章或評論中的觀點,往往是最客觀的。
對於用戶而言,採用現有的由買家進行手動評價的方式顯然無法滿足評價客觀性的需求,而用戶往往在網上購物時,也不可能專門去搜尋一些文章,還認真地去通讀全文。對於系統而言,如存在與事實不符的評價參數,則會
影響到搜尋結果的準確性,例如,一些不好的商品資訊不會受到說明欄中評論資訊的影響,也會基於其所獲得的好評的評價參數,與真實的好評的商品資訊一同排在搜尋結果的前列,導致用戶需要時間和精力去分辨,甚至需要重新搜尋等,這不但加重了訪問伺服器的負擔,而且浪費了網路資源。
因此,目前需要本領域技術人員迫切解決的一個技術問題就是:提出一種基於電子資訊的關鍵字提取及處理機制,用以客觀、真實地反映產品或服務的評價資訊,提高賣家用戶監管的有效性,簡化買家用戶的網上購物操作,並減輕訪問伺服器的負擔,減少網路資源的佔用。
本申請案所要解決的技術問題是提供一種基於電子資訊的關鍵字提取的資訊推送方法,一種基於電子資訊的評價參數提取的資訊推送方法,一種基於電子資訊的商品搜尋方法,用以客觀、真實地反映產品或服務的評價資訊,提高賣家用戶監管的有效性,簡化買家用戶的網上購物操作,並減輕訪問伺服器的負擔,減少網路資源的佔用。
相應的,本申請案還提供了一種基於電子資訊的關鍵字提取的裝置,一種基於電子資訊的評價參數提取的資訊推送裝置,一種基於電子資訊的商品搜尋裝置以及一種用戶端,用以確保上述方法在實際中的應用。
為了解決上述問題,本申請案揭示一種基於電子資訊
的關鍵字提取的資訊推送方法,包括:接收商品的評價查看請求;依據所述商品的評價查看請求,獲取對應的商品評價關鍵字;返回所述對應的商品評價關鍵字;其中,所述商品評價關鍵字透過以下步驟獲得:獲取用以評價所述商品的電子資訊;將所述電子資訊分割為若干個句子;以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字。
較佳地,所述獲取用以評價所述商品的電子資訊的子步驟進一步包括:在指定的資料庫中收集用以評價所述商品的電子資訊;和/或,利用爬蟲技術來抓取用以評價所述商品的電子資訊。
較佳地,所述商品指標詞庫包括自上而下分級的多級詞庫,所述預置的商品指標詞庫係透過如下子步驟而產生:按照預設的商品主類別分別建立對應的一級商品指標詞庫;按照所述商品主類別預設的子類別,分別建立對應的二級商品指標詞庫;
當所述子類別存在有更下一級的從屬類別時,分別逐級建立對應的從屬級別商品指標詞庫;其中,各級商品指標詞庫中包括相應類別的商品集合的屬性特徵詞,所述屬性特徵詞為描述商品屬性指標的詞語。
較佳地,所述以句子為單位,將其與商品指標詞庫中的關鍵字進行匹配,從中提取出匹配成功的關鍵字的步驟為,以句子為單位,將各句子自上而下逐級與各級商品指標詞庫中的商品評價關鍵字進行匹配,獲得從各級商品指標詞庫中匹配成功的商品評價關鍵字。
較佳地,所述商品評價關鍵字還透過以下步驟而獲得:將各個句子與預置的非關鍵字詞庫中的非商品評價關鍵字進行匹配,去除各個句子中匹配成功的非商品評價關鍵字;和/或,去除各個句子中重複的詞語。
較佳地,所述方法還包括:返回所述匹配成功的商品評價關鍵字所對應的句子或句子中的部分內容。
較佳地,所述方法還包括:獲取各商品對應的商品評價關鍵字所映射的評價參數。
較佳地,所述方法還包括:統計各商品評價關鍵字所映射的不同評價參數分別所占的比例。
較佳地,所述方法還包括:返回各評價參數及所占比例。
較佳地,所述獲取各商品對應的商品評價關鍵字所映射的評價參數的步驟包括:預置多個評價參數,及各評價參數對應的商品評價關鍵字詞庫;獲取各商品對應的商品評價關鍵字,分別判斷各商品評價關鍵字所歸屬的商品評價關鍵字詞庫,將所述商品評價關鍵字詞庫所對應的評價參數,確定為各商品評價關鍵字對應的評價參數。
較佳地,所述方法還包括:依據各評價參數所占的比例提取特徵評價參數,所述特徵評價參數為所述各商品評價關鍵字所映射的評價參數所占的比例超過一定閾值的評價參數,和/或,所占比例高於其他評價參數所占比例的評價參數;參考所述特徵評價參數及其所占比例,調整該商品的搜尋排序權重。
本申請案還揭示一種基於電子資訊的評價參數提取的資訊推送方法,包括:接收商品的評價查看請求;依據所述商品的評價查看請求,獲取對應的評價參
數;返回所述對應的評價參數;其中,所述評價參數係透過以下步驟而獲得:獲取用以評價所述商品的電子資訊;將所述電子資訊分割為若干個句子;以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字;獲取各商品對應的商品評價關鍵字所映射的評價參數。
本申請案還揭示一種基於電子資訊的商品搜尋方法,包括:接收商品的搜尋請求;依據所述商品的搜尋請求,獲取對應的商品資訊及其搜尋排序權重;按照所述搜尋排序權重對所述商品資訊進行排序並返回;其中,所述搜尋排序權重參考特徵評價參數及其所占比例進行調整,所述特徵評價參數及其所占比例係透過以下步驟而獲得:獲取用以評價所述商品資訊的電子資訊;將所述電子資訊分割為若干個句子;以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關
鍵字;獲取各商品資訊對應的商品評價關鍵字所映射的評價參數;統計各商品評價關鍵字所映射的不同評價參數分別所占的比例;依據各評價參數所占的比例提取特徵評價參數,所述特徵評價參數為所述各商品評價關鍵字所映射的評價參數所占的比例超過一定閾值的評價參數,和/或,所占比例高於其他評價參數所占比例的評價參數。
本申請案還揭示一種基於電子資訊的關鍵字提取的資訊推送裝置,包括:評價查看請求接收模組,用以接收商品的評價查看請求;關鍵字提取模組,用以依據所述商品的評價查看請求,獲取對應的商品評價關鍵字;其中,所述商品評價關鍵字係透過以下方式而獲得:獲取用以評價所述商品的電子資訊;將所述電子資訊分割為若干個句子;以及,以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字;關鍵字返回模組,用以返回所述商品評價關鍵字。
本申請案還揭示一種基於電子資訊的評價參數提取的資訊推送裝置,包括:評價查看請求接收模組,用以接收商品的評價查看請求;
評價參數獲取模組,用以依據所述商品的評價查看請求,獲取對應的評價參數;其中,所述評價參數係透過以下方式而獲得:獲取用以評價所述商品的電子資訊;將所述電子資訊分割為若干個句子;以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字;以及,獲取各商品對應的商品評價關鍵字所映射的評價參數;評價參數返回模組,用於返回所述對應的評價參數。
本申請案還揭示一種基於電子資訊的商品搜尋裝置,包括:搜尋請求接收模組,用以接收商品的搜尋請求;搜尋處理模組,用以依據所述商品的搜尋請求,獲取對應的商品資訊及其搜尋排序權重;排序返回模組,用以按照所述搜尋排序權重從大至小對所述商品資訊進行排序並返回;其中,所述搜尋排序權重參考特徵評價參數及其所占比例進行調整,所述特徵評價參數及其所占比例係透過以下方式而獲得:獲取用以評價所述商品資訊的電子資訊;將所述電子資訊分割為若干個句子;以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字;獲取各商品資訊對應的商品評價關鍵字所映射的評價參數;
統計各商品評價關鍵字所映射的不同評價參數分別所占的比例;依據各評價參數所占的比例提取特徵評價參數,所述特徵評價參數為所述各商品評價關鍵字所映射的評價參數所占的比例超過一定閾值的評價參數,和/或,所占比例高於其他評價參數所占比例的評價參數。
本申請案還揭示一種用戶端,包括:請求模組,用以向伺服器提交請求,所述請求包括商品的評價查看請求,和/或,商品的搜尋請求;結果獲取模組,用以接收伺服器針對所述請求返回的處理結果,所述針對請求返回處理結果包括針對商品的評價查看請求返回的對應的商品評價關鍵字和/或評價參數,和/或,針對商品的搜尋請求返回的經過排序的商品資訊。
與現有技術相比,本申請案具有以下優點:
本申請案實施例基於用以評價所述商品的電子資訊產生商品評價關鍵字並向用戶展示,從而更能客觀、真實地反映評價資訊,提高賣家監管的有效性,並提升買家的使用體驗。並且,採用本申請案實施例所獲得的這種客觀、真實的商品評價關鍵字所形成的評價參數在作用於商品資訊時,可以採用特徵評價參數及其所占比例調整相應商品的搜尋排序權重,能確保在交易平臺中的用戶獲得更為準確的商品資訊搜尋結果,例如,具有“好評”的特徵評價參數,會使商品資訊排在搜尋結果的前列,具有“差評”的特
徵評價參數,會使該商品資訊排在搜尋結果的後面,使用戶簡單搜尋即可獲得想要的結果,無需多次提交搜尋,也無需仔細辨認其真實評價資訊,從而減輕了訪問伺服器的負擔,減少了網路資源的佔用,並提升了用戶體驗。
再者,本申請案針對用於評價所述商品的電子資訊進行分析,由於其通常使用客觀且明確的詞語以準確地表達商品的一些屬性指標,故能夠從中提取到描述商品的某些屬性指標的詞語,比如外形,品質,大小等等;因此,相對於現有技術提取形容詞進行分析的方式,本申請案提取的商品評價關鍵字更具備客觀性和準確性,故本申請案能夠有效地克服中文的二義性和不確定性的影響,從而能夠有效地提高文本分析的準確度。
此外,現有技術需要循環比對以統計所有形容詞在整個文章中出現的次數,雖然本申請案在對所有句子中商品評價關鍵字對應的評價參數進行分類判別時也有可能需要統計不同評價參數的頻度,但是,由於評價參數的類別十分有限,如僅有“好評”,“中評”,“差評”等,相對於形容詞的種類而言是寥寥可數的,故本申請案能夠避免現有技術的循環比對,從而能夠達到提高文本分析的效率。
601‧‧‧評價查看請求接收模組
602‧‧‧關鍵字提取模組
603‧‧‧關鍵字返回模組
701‧‧‧評價查看請求接收模組
702‧‧‧評價參數獲取模組
703‧‧‧評價參數返回模組
801‧‧‧搜尋請求接收模組
802‧‧‧搜尋處理模組
803‧‧‧排序返回模組
901‧‧‧請求模組
902‧‧‧結果獲取模組
圖1是本申請案的一種基於電子資訊的關鍵字提取及處理的方法實施例1的步驟流程圖;圖2是本申請案的一種基於電子資訊的關鍵字提取及
處理的方法實施例2的步驟流程圖;圖3是本申請案的一種基於電子資訊的關鍵字提取及處理的方法實施例3的步驟流程圖;圖4是本申請案的一種基於電子資訊的評價參數提取的方法實施例的步驟流程圖;圖5是本申請案的一種基於電子資訊的商品搜尋方法實施例的步驟流程圖;圖6是本申請案的一種基於電子資訊的關鍵字提取及處理的裝置實施例的結構方塊圖;圖7是本申請案的一種基於電子資訊的評價參數提取的裝置實施例的結構方塊圖;圖8是本申請案的一種基於電子資訊的商品搜尋裝置實施例的結構方塊圖;以及圖9是本申請案的一種用戶端的結構方塊圖。
為了使本申請案的上述目的、特徵和優點能夠更加明顯易懂,下面結合附圖和具體實施方式而對本申請案作進一步詳細的說明。
參考圖1,其示出了本申請案的一種基於電子資訊的關鍵字提取及處理的方法實施例1的步驟流程圖,具體可以包括如下步驟:
步驟101,接收商品的評價查看請求;所述商品的評價查看請求可以為用戶觸發的請求,也
可以系統自動觸發的請求。以在電子商務中的應用為例,用戶可以透過在商品的內容展現頁面,透過點擊“商品評價”的控制項選項發起針對某個商品的評價查看請求;或如,商品的內容展現頁面的相應位置需要展現該商品評價關鍵字,在這種情況下,當打開商品的內容展現頁面時,系統會自動觸發針對目前商品的評價查看請求。
一般而言,所述商品的評價查看請求從用戶端或瀏覽器端提交至伺服器,由伺服器接收所述商品的評價查看請求。
需要說明的是,在本申請案實施例中,所述商品不單指產品,還包括服務,虛擬產品等具有價值和使用價值的所有商品。
步驟102,依據所述商品的評價查看請求,獲取對應的商品評價關鍵字;在本申請案實施例中,所述商品評價關鍵字具體可以透過以下子步驟而獲得:子步驟S1021,獲取用以評價所述商品的電子資訊;以下對所述子步驟S1021進一步說明:在具體實現中,所述用以評價所述商品的電子資訊可以包括商品的評價資訊,商品的評論內容,商品的試用評論報告或文章,商品的使用評論報告或文章,商品的論壇交流內容等任一種評價、分析或描述該商品的電子資訊,本申請案對此不作限制。
作為本申請案實施例具體應用的一種示例,可以透過
在指定的資料庫中定向收集用以評價所述商品的電子資訊。所述指定的資料庫可以包括特定網站的資料庫或預先配置的資料庫等,本申請案對此不作限制。
為了使本領域技術人員更好地理解本申請案,以下提供兩種依據所述商品的評價查看請求,獲取用以評價所述商品的電子資訊的具體方式
方式1:在指定的資料庫中收集用以評價所述商品的電子資訊:例如,某些網站中會設置論壇資料庫,亦即,在該論壇資料庫中會包括用戶討論,評價某些商品的內容和資訊,或如,某些網站中會設置評論資料庫,亦即,在該評論資料庫中會包括用戶針對其買到的商品提交的評價資訊,在定向收集時,只需要到指定資料庫的位置,在相應的資料庫中收集包含所述商品資訊的電子資訊,即可獲得用以評價所述商品的電子資訊。
方式2:利用爬蟲技術來抓取用以評價所述商品的電子資訊:公知的是,爬蟲技術是透過網頁的鏈結位址來尋找網頁,從網站某一個頁面(通常是首頁)開始,讀取網頁的內容,找到在網頁中的其他鏈結位址,然後透過這些鏈結位址來尋找下一個網頁,這樣一直循環下去,直到把這個網站所有的網頁都抓取完為止。如果把整個互聯網當成一個網站,那麼利用爬蟲技術就可以把互聯網上所有的網頁都抓取下來。在本實施例中,可以設定一些該商品的關鍵
字,採用利用爬蟲技術的搜尋引擎,由搜尋引擎基於爬蟲技術的廣度收集原理而從網頁中提取匹配的搜尋結果,亦即,用以評價所述商品的電子資訊。
當然,上述依據所述商品的評價查看請求,獲取用以評價所述商品的電子資訊的具體方式僅僅用作示例,本申請案對此不作限制,例如,本領域技術人員還可以利用搜尋引擎透過預設的關鍵字而獲取相應商品的評論文章,並從所述商品的評論文章中提取出觀點明確且滿足預定格式內容要求的文章,作為商品的試用評論報告文章。由於試用評論報告文章觀點明確,而且有一定的格式內容要求,所以這類文章的分析較其他的文章準確度要高很多,其通常會用一些比較明確且科學的詞語,比如顏色、性能、味道、價格等能夠準確地表達商品的一些屬性指標;故也可以將試用評論報告文章作為所述用以評價所述商品的電子資訊。
子步驟S1022,將所述電子資訊分割為若干個句子;以下對所述子步驟S1022進一步說明:現有技術文本分析方法的前提是分詞處理,亦即,現有技術需要首先根據存在的詞庫將一個文章分解為若干個辭彙,然後提取其中的形容詞。而本申請案接下來要提取的是商品評價關鍵字,至於何為商品評價關鍵字,現有技術所採用的分詞處理技術是無從得知的,故如果分詞不當則會造成接下來提取商品評價關鍵字的準確性下降的問題。
在本申請案實施例中不是採用分詞分析法,而是採用分句分析法,具體而言,亦即,針對所述用於評價所述商品的電子資訊,以標點符號為分割點,分割成若干個句子,由於這些句子中的詞語是連貫性的,不會對接下來商品評價關鍵字的提取產生壞的影響,亦即,應用本申請案實施例能提高所獲取的商品評價關鍵字的準確性。
子步驟S1023,以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字。
以下對所述子步驟S1023進一步說明:由於不同商品具有其對應的屬性指標,例如外形、品質、大小等,由於不同商品的屬性指標不一樣,故在本申請案的一種較佳實施例中,所述商品指標詞庫可以包括自上而下分級的多級詞庫,所述商品指標詞庫可以透過如下子步驟而產生:子步驟S231,按照預設的商品主類別分別建立對應的一級商品指標詞庫;子步驟S232,按照所述商品主類別預設的子類別,分別建立對應的二級商品指標詞庫;子步驟S233,當所述子類別存在有更下一級的從屬類別時,分別逐級建立對應的從屬級別商品指標詞庫;其中,各級商品指標詞庫中包括相應類別的商品集合的屬性特徵詞,所述屬性特徵詞可以理解為描述商品屬性指標的詞語。例如,對於主類別為電器商品的一級商品指
標詞庫中包括用於描述功率、耗電量、操作電壓等屬性指標的屬性特徵詞,對於主類別為食品的一級商品指標詞庫中包括用以描述顏色、口感、味道等屬性指標的屬性特徵詞,例如相對於“味道”這個屬性指標的屬性特徵詞可以包括“甜”,“酸”,“鹹”。
應用本申請案實施例,對應於不同商品的主類別,首先會建立起一級商品指標詞庫,這個詞庫中會包括對應主類別商品集合的屬性特徵詞,例如,針對“手錶”的主類別設置一個一級商品指標詞庫,這個詞庫中會包括描述手錶這類商品的共同屬性指標的屬性特徵詞;對於在商品主類別下有細分子類別的商品,還可對應於不同的子類別,建立對應的二級商品指標詞庫,這個詞庫中會包括對應子類別商品集合的屬性特徵詞;例如,在手錶的主類別下,還包括電子錶和機械表兩個子類別,則可以針對電子錶和機械表兩個子類別分別設置兩個二級商品指標詞庫。將電子錶和機械表不同的屬性特徵詞分別劃分到各自對應的二級商品指標詞庫中,將電子錶和機械表共同的屬性特徵詞,歸納到他們所屬的手錶主類別的一級商品指標詞庫中。這種處理方式可以大大地減少商品指標詞庫中資料的冗餘。
如果在某個商品的子類別下,還有進一步細分的從屬類別,則還可以分別逐級建立對應的從屬級別商品指標詞庫;例如,在“食品”這個商品主類別下,具有“飲料”的子類別,在“飲料”這個子類別下,進一步有“碳酸飲料”這個從屬類別,則對應“食品”商品的集合,提取相應的屬性特
徵詞,形成一級商品指標詞庫;對應“飲料”商品的集合,提取相應的屬性特徵詞,形成二級商品指標詞庫;對於“碳酸飲料”商品的集合,提取相應的屬性特徵詞,形成三級商品指標詞庫。
本領域技術人員在實際中可以即時或定時更新所述商品指標詞庫,隨著商品指標詞庫中商品評價關鍵字的不斷添加補充,從句子中提取出匹配成功的商品評價關鍵字會越來越多,從而能夠提高關鍵字匹配的準確度。
為了減少關鍵字匹配過程中的運算量,精細化和結構化關鍵字提取過程,提高關鍵字提取的準確率,在本申請案的一種較佳實施例中,所述商品指標詞庫採用了自下而下分級的層級結構,在這種情況下,所述子步驟S1023可以為,以句子為單位,將各句子自上而下逐級與各級商品指標詞庫中的商品評價關鍵字進行匹配,獲得從各級商品指標詞庫中匹配成功的商品評價關鍵字。具體而言,可以按照如下方式進行操作:
1)確定目前句子所對應的商品指標詞庫的層級;2)將目前句子中的詞語與該層級商品指標詞庫中的商品評價關鍵字進行匹配,獲得匹配成功的商品評價關鍵字,假設為第一候選商品評價關鍵字;3)確定目前句子所對應的商品指標詞庫的下一層級;4)將目前句子中的詞語與該下一層級商品指標詞庫中的商品評價關鍵字進行匹配,獲得匹配成功的商品評價
關鍵字,假設為第二候選商品評價關鍵字;5)若該下一層級商品指標詞庫已是最下一級商品指標詞庫,亦即,該下一層級商品指標詞庫已無從屬級別的商品指標詞庫,則執行步驟6),否則返回步驟4),繼續下一層級商品指標詞庫的商品評價關鍵字的匹配及提取。
6)將所述第一候選商品評價關鍵字和第二候選商品評價關鍵字組織為目前句子匹配成功的商品評價關鍵字,亦即,目前句子匹配的關鍵字提取結果。
例如,假設存在有一種商品類別的層級結構為:食品->飲料->碳酸飲料->口感
應用本申請案實施例,產生如下分成四個層級商品指標詞庫:對應“食品”的一級商品指標詞庫,對應“飲料”的二級商品指標詞庫,對應“碳酸飲料”的三級商品指標詞庫,對應“口感”的四級商品指標詞庫,其中,假設在所述四級商品指標詞庫中包括3個商品評價關鍵字,分別是好喝、難喝、酸甜。
應用上述4層級的商品指標詞庫對句子“今天我給大家介紹一個健力寶公司最新出品的碳酸飲料,名字叫芒果多,這款飲料採用了鮮榨的芒果汁,味道酸甜,非常好喝”進行匹配,可以首先確定目前句子所對應的商品指標詞庫的層級--“飲料”層,遍歷對應“飲料”的二級商品指標詞庫,提取出匹配的商品評價關鍵字(假設本例中沒有
在此層級匹配的關鍵字),然後,確定目前句子所對應的商品指標詞庫的下一層級--“碳酸飲料”層,遍歷對應“碳酸飲料”的三級商品指標詞庫,提取出匹配的商品評價關鍵字(假設本例中沒有在此層級匹配的關鍵字),然後,確定目前句子所對應的商品指標詞庫的下一層級--“口感”層,遍歷對應“口感”的四級商品指標詞庫,提取出匹配的商品評價關鍵字“好喝”“酸甜”。
綜上,本申請案的較佳實施例可以根據商品指標詞庫中的層級去匹配句子,看某一層級的詞語能否匹配,如果可以匹配,再去匹配下一層級的詞語,直到全部匹配完畢為止。顯然這種方式可以有效地減少關鍵字匹配過程中的運算量,大大提高處理效率並節省資源。
當然,所述商品指標詞庫也可以不採用自上而下分級的多層級結構,而採用一個包含各類型商品的商品評價關鍵字的資料庫,當採用這種詞庫時,所述句子在詞庫中的匹配採用一般的遍歷及匹配文本提取的方式即可。例如,假設商品指標詞庫中儲存飲料、味道、甜、碳酸飲料、芒果、酸甜、好喝等商品評價關鍵字,以句子“這種飲料的味道很甜”為例,則可以從中提取出“飲料”、“味道”和“甜”作為匹配成功的商品評價關鍵字;以句子“今天我給大家介紹一個健力寶公司最新出品的碳酸飲料,名字叫芒果多,這款飲料採用了鮮榨的芒果汁,味道酸甜,非常好喝”為例,則可以從中提取出“碳酸飲料”、“芒果”、“味道”、“酸甜”、“好喝”作為匹配成功的商品評價關鍵字。
在實際中,句子的長短是不一樣的,對於較短的句子,可以直接將其與商品指標詞庫進行匹配,查找有沒有符合的商品評價關鍵字。對於較長的句子,如果直接匹配容易增加匹配的運算量。在這種情況下,可以在所述子步驟S1023之前,執行如下子步驟:
子步驟S1023a,將各個句子與預置的非關鍵字詞庫中的非商品評價關鍵字進行匹配,去除各個句子中匹配成功的非商品評價關鍵字。
本實施例的主要作用是去掉一些干擾語句的非商品評價關鍵字,比如“啊”、“的”、“你,我,他”等一些語氣助詞,感歎詞,介詞等等,使對商品評價關鍵字的更加地精確,減少匹配的運算量,提高匹配的效率。
在本申請案的一種較佳實施例中,在所述子步驟S1023之前,還可以執行如下子步驟:子步驟S1023b,去除每個句子中重複的詞語。
在實際中,以句子為一個長度單位來統計其中有沒有重複的詞語,如果有重複的先去掉,最後和商品指標詞庫進行匹配,查找匹配的商品評價關鍵字。
需要說明的是,上述子步驟S1023a和子步驟S1023b的技術方案可以同時採用或擇一採用,在同時採用所述子步驟S1023a和子步驟S1023b的技術方案時,本申請案對二者的執行順序不作限制。
上述子步驟S1021~S1023的處理係有關文本分析的處理過程。本申請案實施例中所採用的文本分析處理與現
有技術有較大差別,為了使本領域技術人員更好地理解本申請案,以下對此進行詳細對比說明:
現有技術的文本分析方法通常是收集產品的大量評論文章,並對每一文章進行分析,具體的分析過程包括:首先對整個文章進行分詞處理,然後提取所有的形容詞,再透過一形容詞占整個文章的權值來做相應的分析,並把分析結果與詞庫進行比對,得出該形容詞在整個文章的廣度和特徵值,如此循環直到把所有的形容詞都比對完畢為止,最終得出傾向性的分析結果。
現有技術具有如下缺陷:
一、準確度低:中文的最大特點是具有二義性和不確定性,而且中文的詞語的語義和上下文的環境有著密切的聯繫,因此,現有技術生硬地提取形容詞並不一定能準確地分析傾向,例如,有一句話“這樣的人,他怎麼會是一個壞人呢?”,其是褒義和讚揚的,但是使用現有技術的方法,其會提取出“壞人”這樣的詞語,在經過分析,就會得出這是貶義和反對的觀點。
二、效率低:現有技術需要統計所有形容詞的詞頻和權重,也就是說,這個形容詞在整個文章中出現了多少次,這個形容詞在所有的形容詞中排列的位置是多少(高頻,低頻,中頻等),這就需要大量的統計運算,其中還有關許多重複計算,這個效率是很低的。
相對於現有技術對普通的產品評論文章進行分析,本申請案針對用以評價所述商品的電子資訊進行分析,由於
其通常使用客觀且明確的詞語以準確地表達商品的一些屬性指標,故能夠從中提取到描述商品的某些屬性指標的詞語,比如外形,品質,大小等等;因此,相對於現有技術提取形容詞進行分析的方式,本申請案提取的商品評價關鍵字更具備客觀性和準確性,故本申請案能夠有效地克服中文的二義性和不確定性的影響,從而能夠有效地提高文本分析的準確度。
再者,現有技術需要循環比對以統計所有形容詞在整個文章中出現的次數,雖然本申請案在對所有句子中商品評價關鍵字對應的評價參數進行分類判別時也有可能需要統計不同評價參數的頻度,但是,由於評價參數的類別十分有限,例如僅有“好評”,“中評”,“差評”等,相對於形容詞的種類而言是寥寥可數的,故本申請案能夠避免現有技術的循環比對,從而能夠達到提高文本分析的效率。
步驟103,返回所述商品評價關鍵字;在具體實現中,可以由伺服器進行上述接收商品的評價查看請求,獲取對應的商品評價關鍵字的處理後,向用戶端或瀏覽器或其他對端設備返回所述對應的商品評價關鍵字。所述商品評價關鍵字可以預先提取出來保存在某個儲存位置,如某個資料庫中,當伺服器接到商品的評價查看請求在相應的儲存位置直接提取商品該請求對應的商品評價關鍵字並返回給對端設備即可;在實際中,也可由伺服器在接收到商品的評價查看請求時,即時獲取用以評價所述商品的電子資訊並按句匹配而得到對應的商品評價關
鍵字再返回給對端設備。本領域技術人員根據實際情況採用任一種方案均是可行的,本申請案對此無需加以限制。
本申請案實施例可由本領域技術人員依據任一種應用情況在各種用戶端,web頁面,系統介面,應用程式介面等的預設位置展示所述商品評價關鍵字。例如,在商品的展現頁面,或商品評價的展現頁面,或商品的推廣頁面等展示所述商品評價關鍵字等,本申請案對此不作限制。
在具體實現中,本申請案實施例還可以包括如下步驟:返回所述匹配成功的商品評價關鍵字所對應的句子或句子中的部分內容。
應用本申請案實施例,還可以依據實際情況把匹配成功的商品評價關鍵字及其所在的句子均返回給用戶端,瀏覽器或其他對端設備,由用戶端,瀏覽器或其他對端設備展示商品評價關鍵字及其所在的句子,以供用戶做更為詳細的參考。當然,本申請案對所述展示的方式不作限制。
進一步而言,還可以依據實際情況向用戶端,瀏覽器或其他對端設備返回所述商品評價關鍵字及其所在的句子的部分內容,例如,商品評價關鍵字為“不錯”,則可以將其與相應的句子中的部分內容(如主語)組合得到“手機不錯”進行展示;又如,商品評價關鍵字為“正規”,則可以將其與相應的句子中的部分內容(如主語)組合得到“包裝正規”進行展示;再如,商品評價關鍵字為“一般”,則可以將其與相應的句子中的部分內容(如主語)組合得
到“配件一般”進行展示,本申請案實施例對所述展示的方式及內容均不作限制。
參考圖2,其示出了本申請案的一種基於電子資訊的關鍵字提取的資訊推送方法實施例2的步驟流程圖,具體可以包括如下步驟:步驟201,接收商品的評價查看請求;步驟202,依據所述商品的評價查看請求,獲取對應的商品評價關鍵字;本步驟具體包括如下子步驟S2021~S2023:子步驟S2021,依據所述商品的評價查看請求,獲取用以評價所述商品的電子資訊;子步驟S2022,將所述電子資訊分割為若干個句子;子步驟S2023,以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字。
步驟203,返回所述商品評價關鍵字;本方法實施例2中步驟201至步驟203與上述方法實施例1的步驟101至步驟103類似,在此不再詳述。
本方法實施例2還可以包括如下步驟:步驟204,獲取各商品對應的商品評價關鍵字所映射的評價參數;作為本申請案實施例在電子在交易平臺中的應用,所述評價參數可以理解為“好評”、“中評”與“差評”,或“褒義”、“中性”和“貶義”等用以對商品作出評價的參數,在
本申請案實施例中,所述評價參數可以用來確定作者在句子中表達的觀點。
在本申請案的一種較佳實施例中,所述步驟204可以進一步包括如下子步驟:子步驟S2041,預置多個評價參數,及各評價參數對應的商品評價關鍵字詞庫;如上例,本申請案可以預置“好評”、“中評”與“差評”三個評價參數,或“褒義”、“中立”和“貶義”等諸如此類的評價參數。
子步驟S2042,獲取各商品對應的商品評價關鍵字,分別判斷各商品評價關鍵字所歸屬的商品評價關鍵字詞庫,將所述商品評價關鍵字詞庫所對應的評價參數,確定為各商品評價關鍵字對應的評價參數。
以下提供一種商品評價關鍵字詞庫內容的示例,其中,表1為評價參數“好評”所對應的商品評價關鍵字(詞庫中部分內容示例);表2為評價參數“中評”所對應的商品評價關鍵字(詞庫中部分內容示例)表3為評價參數“差評”所對應的商品評價關鍵字(詞庫中部分內容示例)。
依據所述商品評價關鍵字詞庫中,商品評價關鍵字與評價參數之間的對應關係,即可獲得所述商品評價關鍵字對應的評價參數。例如,對於從前述示例中提取出的商品評價關鍵字“好喝”,其對應的評價參數即為“好評”。需要說明的是,一個商品所對應的商品評價關鍵字所映射的評價參數可以為一個,也可以為多個。
步驟205,統計各商品評價關鍵字所映射的不同評價
參數分別所占的比例;可以理解,各商品對應的商品評價關鍵字所映射的評價參數實際上是對商品評價關鍵字賦予其包括評價參數的屬性,亦即,在本申請案的一種示例中,可將某個商品對應的商品評價關鍵字區分為好評關鍵字,中評關鍵字和/或差評關鍵字,所述步驟205實際上就是統計所述好評關鍵字在該商品對應的所有商品評價關鍵字中所占的比例,所述中評關鍵字在該商品對應的所有商品評價關鍵字中所占的比例,和/或,所述差評關鍵字在該商品對應的所有商品評價關鍵字中所占的比例。比如,統計獲得某商品A的商品評價關鍵字所映射的不同評價參數分別所占的比例為,好評:49.72%,差評:25.63%,中評:24.65%。
步驟206,返回各評價參數及所占比例。
應用本申請案實施例,可以由伺服器將各評價參數及所占比例返回給用戶端,瀏覽器或其他對端設備,由用戶端,瀏覽器或其他對端設備展示各評價參數及所占比例,以供用戶參考。本申請案實施例可由本領域技術人員依據任一種應用情況在各種用戶端,web頁面,系統介面,應用程式介面等的預設位置展示所述評價參數及所占比例。例如,在商品的展現頁面,或商品評價的展現頁面,或商品的推廣頁面等展示所述評價參數及所占比例等,本申請案對此不作限制。應用本申請案實施例,本領域技術人員還可以依據實際情況把匹配成功的商品評價關鍵字及其對應的評價參數和占比在同一頁面或不同頁面均列舉出來,
以供用戶做更為詳細的參考。當然,本申請案對所述展示的方式及內容不作限制。
參考圖3,其示出了本申請案的一種基於電子資訊的關鍵字提取的資訊推送方法實施例3的步驟流程圖,具體可以包括如下步驟:
步驟301,接收商品的評價查看請求;步驟302,依據所述商品的評價查看請求,獲取對應的商品評價關鍵字;本步驟具體包括如下子步驟S3021~S3023:子步驟S3021,依據所述商品的評價查看請求,獲取用以評價所述商品的電子資訊;子步驟S3022,將所述電子資訊分割為若干個句子;子步驟S3023,以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字。
步驟303,展示所述商品評價關鍵字;步驟304,獲取各商品對應的商品評價關鍵字所映射的評價參數;步驟305,統計各商品評價關鍵字所映射的不同評價參數分別所占的比例;本方法實施例3中步驟301至步驟303與上述方法實施例1的步驟101至步驟103類似,步驟304至步驟305與上述方法實施例2中的步驟204至步驟205類似,在此不再詳述。本方法實施例3還可以包括如下步驟:
步驟306,依據各評價參數所占的比例提取特徵評價參數;其中,所述特徵評價參數可以為所述各商品評價關鍵字所映射的評價參數所占的比例超過一定閾值的評價參數,亦即,在各商品評價關鍵字所映射的某個評價參數所占的比例超過一定閾值時,將該評價參數提取為特徵評價參數,所述閾值可以由本領域技術人員依據實際情況任意設定,如為褒義評價參數所占比例大於40%,或者,褒義、貶義和中立評價參數對應的比例閾值範圍分別為>60%,50%且60%,<50%等。
作為另一示例,所述特徵評價參數還可以為,所占比例高於其他評價參數所占比例的評價參數。亦即,在某個評價參數所占比例高於其他評價參數所占比例時,將該評價參數提取為特徵評價參數。
上述兩個特徵評價參數的判斷條件可以擇一使用或組合使用,本申請案對此不作限制。
例如,假設某商品的商品評價關鍵字映射的評價參數包括“褒義”、“中性”和“貶義”,各評價參數所占的比例為:褒義:49.72%,貶義:25.63%,中性:24.65%;由於“褒義”這個評價參數所占的比例49.72%超出一定閾值40%,且高於其他兩個評價參數所占的比例,故可以將“褒義”提取為特徵評價參數。
步驟307,參考所述特徵評價參數及其所占比例,調整該商品的搜尋排序權重。
本申請案實施例可以用於商品檢索的應用情況中。當接收到用戶發起的商品搜尋請求時,可以依據用戶輸入的搜尋關鍵字或其他資訊獲得匹配的商品搜尋結果,在向用戶返回所述商品搜尋結果時,即可針對匹配的商品資訊記錄,參考該商品對應的特徵評價參數及其所占比例對其排序位置進行調整,例如,若在商品搜尋結果中,商品A對應的特徵評價參數及其所占比例為褒義:49.72%,商品B對應的特徵評價參數及其所占比例為褒義:35.72%,則在返回的商品搜尋結果中,將商品A的搜尋結果記錄排在商品B的搜尋結果記錄之前。或如,若在商品搜尋結果中,商品C對應的特徵評價參數及其所占比例為貶義:65.82%,則將該商品C的搜尋排序權利調整為-1.0等。具體調整商品搜尋排序權重的方法由本領域技術人員任意選用即可,本申請案對此無需加以限制。
在具體實現中,還可以根據特徵評價參數對商品進行標記,如果某個商品的特徵評價參數為“好評”,則在資料庫中對該商品增加“好評”的標記,然後可以向用戶提供基於所述特徵評價參數的檢索條件或選項,當用戶選擇採用所述特徵評價參數來進行商品搜尋時,可以只針對具有所述特徵評價參數標記的商品資訊發起搜尋,例如,用戶想要檢索“好評”多的商品,系統就可以自動去搜尋標記有“好評”這個特徵評價參數的商品。
參考圖4,其示出了本申請案的一種基於電子資訊的評價參數提取的資訊推送方法實施例的步驟流程圖,具體
可以包括如下步驟:步驟401,接收商品的評價查看請求;步驟402,依據所述商品的評價查看請求,獲取對應的評價參數;其中,所述評價參數係透過以下子步驟而獲得:子步驟S4021,獲取用以評價所述商品的電子資訊;子步驟S4022,將所述電子資訊分割為若干個句子;子步驟S4023,以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字;子步驟S4024,獲取各商品對應的商品評價關鍵字所映射的評價參數;本方法實施例中步驟401與上述關鍵字提取及處理的方法實施例1的步驟101類似,本方法實施例中步驟402的子步驟S4021~S4023與上述關鍵字提取及處理的方法實施例1的子步驟S1021~S1023類似,子步驟S4024與上述關鍵字提取及處理的方法實施例2中的步驟204類似,在此不再詳述。
本申請案實施例還可以包括如下步驟:步驟403,返回所述對應的評價參數。
應用本申請案實施例,可以由伺服器將各評價參數返回給用戶端,瀏覽器或其他對端設備,由用戶端,瀏覽器或其他對端設備展示各評價參數,以供用戶參考。
作為本申請案實施例具體應用的一種較佳示例,還可
以包括如下步驟:統計各商品評價關鍵字所映射的不同評價參數分別所占的比例;返回各評價參數分別所占的比例。
上述新增的步驟與上述關鍵字提取及處理的方法實施例2中的步驟204至步驟205和206類似,在此不再詳述。
參考圖5,示出了一種基於電子資訊的商品搜尋方法實施例的步驟流程圖,具體可以包括如下步驟:
步驟501,接收商品的搜尋請求;所述商品的搜尋請求可以為由用戶端,瀏覽器或其他對端設備基於用戶操作觸發的針對商品發起的搜尋請求,可以是包含搜尋關鍵字的請求,也可以為包含其他搜尋條件的搜尋請求,例如,用戶在某電子商務網站的站內搜尋引擎中輸入“冬裝新款”,再點擊“搜尋”的預設控制項,就會產生一個商品的搜尋請求並提交至伺服器。
當然,上述請求的內容及形式僅僅用作示例,本申請案對此不作限制。
步驟502,依據所述商品的搜尋請求,獲取對應的商品資訊及其搜尋排序權重;其中,所述搜尋排序權重參考特徵評價參數及其所占比例進行調整,所述特徵評價參數及其所占比例係透過以下子步驟而獲得:子步驟S5021,獲取用以評價所述商品資訊的電子資
訊;子步驟S5022,將所述電子資訊分割為若干個句子;子步驟S5023,以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字;子步驟S5024,獲取各商品資訊對應的商品評價關鍵字所映射的評價參數;子步驟S5025,統計各商品評價關鍵字所映射的不同評價參數分別所占的比例;子步驟S5026,依據各評價參數所占的比例提取特徵評價參數,所述特徵評價參數為所述各商品評價關鍵字所映射的評價參數所占的比例超過一定閾值的評價參數,和/或,所占比例高於其他評價參數所占比例的評價參數。
本方法實施例中步驟502的子步驟S5021~S5023與上述關鍵字提取及處理的方法實施例1的子步驟S1021~S1023類似,本方法實施例中步驟502的子步驟S5024~S5025與上述關鍵字提取及處理的方法實施例2中的步驟204~205類似,本方法實施例中步驟502的子步驟S5026與上述關鍵字提取及處理的方法實施例3中的步驟306類似,在此不再詳述。
步驟503,按照所述搜尋排序權重從大至小對所述商品資訊進行排序並返回。
在本申請案實施例中,對於依據商品的搜尋請求收集的搜尋結果(商品資訊),會具有搜尋排序權重,並且該
搜尋排序權重參考了商品資訊的特徵評價參數及其所占的比例,例如,若在商品搜尋結果中,商品資訊A對應的特徵評價參數及其所占比例為褒義:49.72%,商品資訊B對應的特徵評價參數及其所占比例為褒義:35.72%,則在返回的商品搜尋結果中,將商品A的搜尋結果記錄排在商品B的搜尋結果記錄之前。針對當次商品的搜尋請求所對應的搜尋結果全部按照搜尋排序權重排序後,伺服器會將排序後的搜尋結果返回給用戶端,瀏覽器或其他對端設備。
需要說明的是,對於方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領域技術人員應該知悉,本申請案並不受所描述的動作順序的限制,因為依據本申請案,某些步驟可以採用其他順序或者同時進行。其次,本領域技術人員也應該知悉,說明書中所描述的實施例均屬於較佳實施例,所涉及的動作並不一定是本申請案所必須的。
參照圖6,其示出了本申請案的一種基於電子資訊的關鍵字提取的資訊推送裝置實施例的結構方塊圖,具體可以包括如下模組:評價查看請求接收模組601,用以接收商品的評價查看請求;關鍵字提取模組602,用以依據所述商品的評價查看請求,獲取對應的商品評價關鍵字;其中,所述商品評價關鍵字係透過以下方式而獲得:獲取用以評價所述商品的電子資訊;將所述電子資訊分割為若干個句子;以及,以
句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字;關鍵字返回模組603,用以返回所述商品評價關鍵字。
在本申請案的一種較佳實施例中,所述用`評價所述商品的電子資訊可以在指定的資料庫中收集,也可以利用爬蟲技術抓取而獲得。
作為本申請案實施例具體應用的一種示例,所述商品指標詞庫可以包括自上而下分級的多級詞庫,所述預置的商品指標詞庫可以透過如下子模組而產生:第一詞庫建立子模組,用以按照預設的商品主類別分別建立對應的一級商品指標詞庫;第二詞庫建立子模組,用以按照所述商品主類別預設的子類別,分別建立對應的二級商品指標詞庫;第三詞庫建立子模組,用以當所述子類別存在有更下一級的從屬類別時,分別逐級建立對應的從屬級別商品指標詞庫;其中,各級商品指標詞庫中可以包括相應類別的商品集合的屬性特徵詞,所述屬性特徵詞可以為描述商品屬性指標的詞語。
在這種情況下,所述以句子為單位,將其與商品指標詞庫中的關鍵字進行匹配,從中提取出匹配成功的關鍵字的處理為:以句子為單位,將各句子自上而下逐級與各級商品指
標詞庫中的商品評價關鍵字進行匹配;獲得從各級商品指標詞庫中匹配成功的商品評價關鍵字。
在本申請案的一種較佳實施例中,所述關鍵字提取模組602還可以包括如下子模組:第一提取子模組,用以將各個句子與預置的非關鍵字詞庫中的非商品評價關鍵字進行匹配,去除各個句子中匹配成功的非商品評價關鍵字;第二提取子模組,用以去除各個句子中重複的詞語;在具體實現中,本申請案實施例還可以包括如下模組:內容返回模組,用以返回所述匹配成功的商品評價關鍵字所對應的句子或句子中的部分內容。
在本申請案的另一種較佳實施例中,所述裝置實施例還可以包括如下模組:評價參數獲取模組,用以獲取各商品對應的商品評價關鍵字所映射的評價參數;比例統計模組,用以統計各商品評價關鍵字所映射的不同評價參數分別所占的比例;比例返回模組,用以展示各評價參數及所占比例,作為本申請案實施例具體應用的一種示例,所述評價參數獲取模組還可以包括如下子模組:預置子模組,用以預置多個評價參數,及各評價參數對應的商品評價關鍵字詞庫;
關鍵字獲取子模組,用以獲取各商品對應的商品評價關鍵字,分別判斷各商品評價關鍵字所歸屬的商品評價關鍵字詞庫,將所述商品評價關鍵字詞庫所對應的評價參數,確定為各商品評價關鍵字對應的評價參數。
在本申請案的一種較佳實施例中,所述裝置實施例還可以包括如下模組:特徵評價參數提取模組,用以依據各評價參數所占的比例提取特徵評價參數,所述特徵評價參數為所述各商品評價關鍵字所映射的評價參數所占的比例超過一定閾值的評價參數,和/或,所占比例高於其他評價參數所占比例的評價參數;調整模組,用以參考所述特徵評價參數及其所占比例,調整該商品的搜尋排序權重。
參考圖7,示出了本申請案的一種基於電子資訊的評價參數提取的資訊推送裝置實施例的結構方塊圖,具體可以包括如下模組:評價查看請求接收模組701,用以接收商品的評價查看請求;評價參數獲取模組702,用以依據所述商品的評價查看請求,獲取對應的評價參數;其中,所述評價參數係透過以下方式而獲得:獲取用於評價所述商品的電子資訊;將所述電子資訊分割為若干個句子;以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字;以及,獲取各商品
對應的商品評價關鍵字所映射的評價參數;評價參數返回模組703,用以返回所述對應的評價參數。
參考圖8,示出了本申請案的一種基於電子資訊的商品搜尋裝置實施例的結構方塊圖,具體可以包括如下模組:搜尋請求接收模組801,用以接收商品的搜尋請求;搜尋處理模組802,用以依據所述商品的搜尋請求,獲取對應的商品資訊及其搜尋排序權重;排序返回模組803,用以按照所述搜尋排序權重而從大至小對所述商品資訊進行排序並返回;其中,所述搜尋排序權重參考特徵評價參數及其所占比例進行調整,所述特徵評價參數及其所占比例係透過以下方式而獲得:獲取用以評價所述商品資訊的電子資訊;將所述電子資訊分割為若干個句子;以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字;獲取各商品資訊對應的商品評價關鍵字所映射的評價參數;統計各商品評價關鍵字所映射的不同評價參數分別所占的比例;依據各評價參數所占的比例提取特徵評價參數,所述
特徵評價參數為所述各商品評價關鍵字所映射的評價參數所占的比例超過一定閾值的評價參數,和/或,所占比例高於其他評價參數所占比例的評價參數。
參考圖9,示出了本申請案的一種用戶端的結構方塊圖,具體可以包括如下模組:請求模組901,用以向伺服器提交請求,所述請求包括商品的評價查看請求,和/或,商品的搜尋請求;結果獲取模組902,用以接收伺服器針對所述請求返回的處理結果,所述針對請求返回處理結果包括針對商品的評價查看請求返回的對應的商品評價關鍵字和/或評價參數,和/或,針對商品的搜尋請求返回的經過排序的商品資訊。
在本申請案實施例中,所述對應的商品評價關鍵字由伺服器係透過以下方式而獲得:獲取用以評價所述商品的電子資訊;將所述電子資訊分割為若干個句子;以及,以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字;所述評價參數由伺服器係透過以下方式而獲得:獲取用以評價所述商品的電子資訊;將所述電子資訊分割為若干個句子;以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字;以及,獲取各商品對應的商品評價關鍵字所映射的評價參數;所述搜尋排序權重由伺服器依據特徵評價參數及其所
占比例進行調整,所述特徵評價參數及其所占比例由伺服器係透過以下方式而獲得:獲取用以評價所述商品資訊的電子資訊;將所述電子資訊分割為若干個句子;以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字;獲取各商品資訊對應的商品評價關鍵字所映射的評價參數;統計各商品評價關鍵字所映射的不同評價參數分別所占的比例;依據各評價參數所占的比例提取特徵評價參數,所述特徵評價參數為所述各商品評價關鍵字所映射的評價參數所占的比例超過一定閾值的評價參數,和/或,所占比例高於其他評價參數所占比例的評價參數。
由於所述裝置實施例基本相應於前述方法實施例,故本實施例的描述中未詳盡之處,可以參見前述實施例中的相關說明,在此就不贅述了。
本領域內的技術人員應明白,本申請案的實施例可提供為方法、系統、或電腦程式產品。因此,本申請案可採用完全硬體實施例、完全軟體實施例、或結合軟體和硬體樣態的實施例的形式。而且,本申請案可採用在一個或多個其中包含有電腦可用程式碼的電腦可用儲存媒體(包括但不限於磁碟記憶體、CD-ROM、光學記憶體等)上實施
的電腦程式產品的形式。
本申請案是參照根據本申請案實施例的方法、設備(系統)、和電腦程式產品的流程圖和/或方塊圖來予以描述的。應理解可由電腦程式指令實現流程圖和/或方塊圖中的每一流程和/或方塊、以及流程圖和/或方塊圖中的流程和/或方塊的結合。可提供這些電腦程式指令到通用電腦、專用電腦、嵌入式處理機或其他可編程資料處理設備的處理器以產生一個機器,使得透過電腦或其他可編程資料處理設備的處理器執行的指令產生用以實現在流程圖一個流程或多個流程和/或方塊圖一個方塊或多個方塊中指定的功能的裝置。
這些電腦程式指令也可儲存在能引導電腦或其他可編程資料處理設備以特定方式操作的電腦可讀取記憶體中,使得儲存在該電腦可讀取記憶體中的指令產生包括指令裝置的製造產品,該指令裝置實現在流程圖一個流程或多個流程和/或方塊圖一個方塊或多個方塊中指定的功能。
這些電腦程式指令也可裝載到電腦或其他可編程資料處理設備上,使得在電腦或其他可編程設備上執行一系列操作步驟以產生電腦實現的處理,從而在電腦或其他可編程設備上執行的指令提供用以實現在流程圖一個流程或多個流程和/或方塊圖一個方塊或多個方塊中指定的功能的步驟。
儘管已描述了本申請案的較佳實施例,但本領域內的技術人員一旦得知了基本創造性概念,則可對這些實施例
做出另外的變更和修改。所以,所附申請專利範圍意欲被解釋為包括較佳實施例以及落入本申請案之申請專利範圍的所有變更和修改。
最後,還需要說明的是,在本文中,術語“包括”、“包含”或者其任何其他變型意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個......”限定的要素,並不排除在包括所述要素的過程、方法、物品或者設備中還存在有另外的相同要素。
以上對本申請案所提供的一種多資料源的資料集成處理方法,以及,一種多資料源的資料集成裝置進行了詳細介紹,本文中應用了具體個例而對本申請案的原理及實施方式進行了闡述,以上實施例的說明只是用於幫助理解本申請案的方法及其核心思想;同時,對於本領域的一般技術人員,依據本申請案的思想,在具體實施方式及應用範圍上均會有改變之處,綜上所述,本說明書內容不應被理解為對本申請案的限制。
Claims (15)
- 一種基於電子資訊的關鍵字提取的資訊推送方法,其特徵在於,包括:接收商品的評價查看請求;依據該商品的評價查看請求,獲取對應的商品評價關鍵字;返回該對應的商品評價關鍵字;其中,該商品評價關鍵字係透過以下步驟而獲得:獲取用以評價該商品的電子資訊;將該電子資訊分割為若干個句子;以及以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字。
- 如申請專利範圍第1項所述的方法,其中,該獲取用以評價該商品的電子資訊的子步驟進一步包括:在指定的資料庫中收集用以評價該商品的電子資訊;和/或,利用爬蟲技術來抓取用以評價該商品的電子資訊。
- 如申請專利範圍第1或2項所述的方法,其中,該商品指標詞庫包括自上而下分級的多級詞庫,該預置的商品指標詞庫係透過如下子步驟而產生:按照預設的商品主類別分別建立對應的一級商品指標詞庫;按照該商品主類別預設的子類別,分別建立對應的二 級商品指標詞庫;當該子類別存在有更下一級的從屬類別時,分別逐級建立對應的從屬級別商品指標詞庫;其中,各級商品指標詞庫中包括相應類別的商品集合的屬性特徵詞,該屬性特徵詞為描述商品屬性指標的詞語。
- 如申請專利範圍第3項所述的方法,其中,該以句子為單位,將其與商品指標詞庫中的關鍵字進行匹配,從中提取出匹配成功的關鍵字的步驟為,以句子為單位,將各句子自上而下逐級與各級商品指標詞庫中的商品評價關鍵字進行匹配,獲得從各級商品指標詞庫中匹配成功的商品評價關鍵字。
- 如申請專利範圍第4項所述的方法,其中,該商品評價關鍵字還透過以下步驟而獲得:將各個句子與預置的非關鍵字詞庫中的非商品評價關鍵字進行匹配,去除各個句子中匹配成功的非商品評價關鍵字;和/或,去除各個句子中重複的詞語。
- 如申請專利範圍第1項所述的方法,其中,還包括:返回該匹配成功的商品評價關鍵字所對應的句子或句子中的部分內容。
- 如申請專利範圍第1項所述的方法,其中,還包 括:獲取各商品對應的商品評價關鍵字所映射的評價參數。
- 如申請專利範圍第7項所述的方法,其中,還包括:統計各商品評價關鍵字所映射的不同評價參數分別所占的比例。
- 如申請專利範圍第8項所述的方法,其中,還包括:返回各評價參數及所占比例。
- 一種基於電子資訊的評價參數提取的資訊推送方法,其特徵在於,包括:接收商品的評價查看請求;依據該商品的評價查看請求,獲取對應的評價參數;返回該對應的評價參數;其中,該評價參數係透過以下步驟而獲得:獲取用以評價該商品的電子資訊;將該電子資訊分割為若干個句子;以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字;以及獲取各商品對應的商品評價關鍵字所映射的評價參數。
- 一種基於電子資訊的商品搜尋方法,其特徵在 於,包括:接收商品的搜尋請求;依據該商品的搜尋請求,獲取對應的商品資訊及其搜尋排序權重;按照該搜尋排序權重對該商品資訊進行排序並返回;其中,該搜尋排序權重參考特徵評價參數及其所占比例進行調整,該特徵評價參數及其所占比例係透過以下步驟而獲得:獲取用以評價該商品資訊的電子資訊;將該電子資訊分割為若干個句子;以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字;獲取各商品資訊對應的商品評價關鍵字所映射的評價參數;統計各商品評價關鍵字所映射的不同評價參數分別所占的比例;以及依據各評價參數所占的比例提取特徵評價參數,該特徵評價參數為該各商品評價關鍵字所映射的評價參數所占的比例超過一定閾值的評價參數,和/或,所占比例高於其他評價參數所占比例的評價參數。
- 一種基於電子資訊的關鍵字提取的資訊推送裝置,其特徵在於,包括:評價查看請求接收模組,用以接收商品的評價查看請 求;關鍵字提取模組,用以依據該商品的評價查看請求,獲取對應的商品評價關鍵字;其中,該商品評價關鍵字係透過以下方式而獲得:獲取用以評價該商品的電子資訊;將該電子資訊分割為若干個句子;以及,以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字;以及關鍵字返回模組,用以返回該商品評價關鍵字。
- 一種基於電子資訊的評價參數提取的資訊推送裝置,其特徵在於,包括:評價查看請求接收模組,用以接收商品的評價查看請求;評價參數獲取模組,用以依據該商品的評價查看請求,獲取對應的評價參數;其中,該評價參數係透過以下方式而獲得:獲取用以評價該商品的電子資訊;將該電子資訊分割為若干個句子;以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字;以及,獲取各商品對應的商品評價關鍵字所映射的評價參數;以及評價參數返回模組,用以返回該對應的評價參數。
- 一種基於電子資訊的商品搜尋裝置,其特徵在於,包括:搜尋請求接收模組,用於接收商品的搜尋請求;搜尋處理模組,用以依據該商品的搜尋請求,獲取對 應的商品資訊及其搜尋排序權重;排序返回模組,用以按照該搜尋排序權重而從大至小對該商品資訊進行排序並返回;其中,該搜尋排序權重參考特徵評價參數及其所占比例進行調整,該特徵評價參數及其所占比例係透過以下方式而獲得:獲取用以評價該商品資訊的電子資訊;將該電子資訊分割為若干個句子;以句子為單位,將其與預置的商品指標詞庫中的商品評價關鍵字進行匹配,從中提取出匹配成功的商品評價關鍵字;獲取各商品資訊對應的商品評價關鍵字所映射的評價參數;統計各商品評價關鍵字所映射的不同評價參數分別所占的比例;以及依據各評價參數所占的比例提取特徵評價參數,該特徵評價參數為該各商品評價關鍵字所映射的評價參數所占的比例超過一定閾值的評價參數,和/或,所占比例高於其他評價參數所占比例的評價參數。
- 一種用戶端,其特徵在於,包括:請求模組,用以向伺服器提交請求,該請求包括商品的評價查看請求,和/或,商品的搜尋請求;以及結果獲取模組,用以接收伺服器針對該請求返回的處理結果,該針對請求返回處理結果包括針對商品的評價查看請求返回的對應的商品評價關鍵字和/或評價參數,和/ 或,針對商品的搜尋請求返回的經過排序的商品資訊。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210540338.7A CN103870973B (zh) | 2012-12-13 | 2012-12-13 | 基于电子信息的关键词提取的信息推送、搜索方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201423450A TW201423450A (zh) | 2014-06-16 |
TWI615724B true TWI615724B (zh) | 2018-02-21 |
Family
ID=50909485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW102107874A TWI615724B (zh) | 2012-12-13 | 2013-03-06 | 基於電子資訊的關鍵字提取的資訊推送、搜尋方法及裝置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20140172642A1 (zh) |
JP (1) | JP2016503914A (zh) |
CN (1) | CN103870973B (zh) |
TW (1) | TWI615724B (zh) |
WO (1) | WO2014093433A1 (zh) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105373553B (zh) * | 2014-08-25 | 2018-11-13 | 苏宁易购集团股份有限公司 | 一种发送采集数据的***和方法 |
CN105450698B (zh) * | 2014-08-25 | 2019-03-12 | 苏宁易购集团股份有限公司 | 一种曝光日志采集***和方法 |
TW201619885A (zh) * | 2014-11-17 | 2016-06-01 | 財團法人資訊工業策進會 | 電子商務口碑分析系統、方法和其電腦可讀取記錄媒體 |
CN105740223B (zh) * | 2014-12-08 | 2019-04-26 | 联想(北京)有限公司 | 信息处理设备和信息处理方法 |
CN104463548B (zh) * | 2014-12-25 | 2018-07-13 | 南京大学 | 一种多因素影响下的承运量化选择方法 |
CN104715049B (zh) * | 2015-03-26 | 2017-11-28 | 无锡中科泛在信息技术研发中心有限公司 | 基于本体词库的商品评论属性词抽取方法 |
CN106294361B (zh) * | 2015-05-15 | 2019-05-21 | 株式会社理光 | 信息提供方法以及信息提供*** |
CN106651415B (zh) * | 2015-10-30 | 2021-06-08 | 北京国双科技有限公司 | 关键词质量度检测的方法及装置 |
CN107203507B (zh) * | 2016-03-17 | 2019-08-13 | 阿里巴巴集团控股有限公司 | 特征词汇提取方法及装置 |
CN107342879B (zh) * | 2016-04-29 | 2020-06-05 | 北京京东尚科信息技术有限公司 | 用于确定向网络用户进行服务评价请求的方法、装置和计算机可读存储介质 |
CN106503258B (zh) * | 2016-11-18 | 2020-05-12 | 深圳市世强元件网络有限公司 | 一种网站站内精确搜索方法 |
JP2018128925A (ja) * | 2017-02-09 | 2018-08-16 | 富士通株式会社 | 情報出力プログラム、情報出力方法及び情報出力装置 |
CN108628818B (zh) * | 2017-03-15 | 2021-10-26 | 百度在线网络技术(北京)有限公司 | 信息获取方法和装置 |
CN108984554B (zh) * | 2017-06-01 | 2021-06-29 | 北京京东尚科信息技术有限公司 | 用于确定关键词的方法和装置 |
CN107330707A (zh) * | 2017-06-15 | 2017-11-07 | 重庆柚瓣家科技有限公司 | 居家养老服务商的监管*** |
TWI640882B (zh) * | 2017-12-26 | 2018-11-11 | 七法股份有限公司 | 法學資料探勘系統及法學資料探勘方法 |
CN110245997A (zh) * | 2018-03-08 | 2019-09-17 | 阿里巴巴集团控股有限公司 | 获取商品信息的方法、装置、***、设备和存储介质 |
JP6982546B2 (ja) * | 2018-06-06 | 2021-12-17 | ヤフー株式会社 | 情報提供装置、情報提供方法、およびプログラム |
JP6679667B2 (ja) * | 2018-07-06 | 2020-04-15 | ヤフー株式会社 | 生成装置、生成方法及び生成プログラム |
CN110929175A (zh) * | 2018-08-30 | 2020-03-27 | 北京京东尚科信息技术有限公司 | 对用户评价进行评估的方法、装置、***及介质 |
CN109325182B (zh) * | 2018-10-12 | 2024-05-14 | 平安科技(深圳)有限公司 | 基于会话的信息推送方法、装置、计算机设备及存储介质 |
WO2020106438A1 (en) * | 2018-11-22 | 2020-05-28 | Yeogirl Yun | Multilingual tag-based review system |
CN111783445A (zh) * | 2019-06-26 | 2020-10-16 | 北京沃东天骏信息技术有限公司 | 数据生成方法、装置、介质及电子设备 |
JP7379174B2 (ja) | 2020-01-10 | 2023-11-14 | 日産自動車株式会社 | 評価装置及び評価方法 |
CN113254796A (zh) * | 2020-02-12 | 2021-08-13 | 林韦廷 | 网络物件标签管理方法与*** |
CN111428037B (zh) * | 2020-03-24 | 2022-09-20 | 合肥科捷通科技信息服务有限公司 | 一种分析行为政策匹配性的方法 |
WO2021220406A1 (ja) * | 2020-04-28 | 2021-11-04 | エーアイエージェント株式会社 | 商品情報提供システム |
CN112257798A (zh) * | 2020-10-29 | 2021-01-22 | 广州新奥达云科技有限公司 | 基于电商平台的商品数据预警方法、装置、计算机设备 |
CN113779371B (zh) * | 2020-11-12 | 2024-06-21 | 北京京东振世信息技术有限公司 | 评价对象的方法、装置、设备以及存储介质 |
JP6984938B1 (ja) * | 2020-12-11 | 2021-12-22 | 株式会社mov | 情報処理システム |
CN113010639A (zh) * | 2021-02-26 | 2021-06-22 | 济南浪潮高新科技投资发展有限公司 | 一种基于电商平台的商品分析方法及装置 |
CN116579351B (zh) * | 2023-07-14 | 2024-03-19 | 广州淘通科技股份有限公司 | 一种用户评价信息的分析方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI252987B (en) * | 2001-11-26 | 2006-04-11 | Fujitsu Ltd | Information analyzing method and system and recording medium |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7962461B2 (en) * | 2004-12-14 | 2011-06-14 | Google Inc. | Method and system for finding and aggregating reviews for a product |
US20070143122A1 (en) * | 2005-12-06 | 2007-06-21 | Holloway Lane T | Business method for correlating product reviews published on the world wide Web to provide an overall value assessment of the product being reviewed |
US8862591B2 (en) * | 2006-08-22 | 2014-10-14 | Twitter, Inc. | System and method for evaluating sentiment |
US7930302B2 (en) * | 2006-11-22 | 2011-04-19 | Intuit Inc. | Method and system for analyzing user-generated content |
US20080215571A1 (en) * | 2007-03-01 | 2008-09-04 | Microsoft Corporation | Product review search |
CN101515269B (zh) * | 2008-02-20 | 2011-08-31 | 中国科学院自动化研究所 | 实现观点搜索引擎排序的方法 |
JP5350472B2 (ja) * | 2008-06-19 | 2013-11-27 | ワイズ テクノロジーズ インコーポレイテッド | トピックに関する複数の製品にランクを付ける製品ランク付け方法及び製品ランク付けシステム |
WO2010036012A2 (ko) * | 2008-09-23 | 2010-04-01 | 주식회사 버즈니 | 인터넷을 이용한 의견 검색 시스템, 의견 검색 및 광고 서비스 시스템과 그 방법 |
KR101005337B1 (ko) * | 2008-09-29 | 2011-01-04 | 주식회사 버즈니 | 웹 문서에서의 의견 추출 및 분석 장치 및 그 방법 |
WO2011005876A1 (en) * | 2009-07-07 | 2011-01-13 | Logix Fusion, Inc. | Method of sharing information and positive ratings of products, services, individuals and organizations in a social network |
CN101667194A (zh) * | 2009-09-29 | 2010-03-10 | 北京大学 | 基于用户评论文本特征的自动摘要方法及其自动摘要*** |
DE112010004087T5 (de) * | 2009-12-09 | 2012-10-18 | International Business Machines Corporation | Verfahren, Computersystem und Computerprogramm zum Durchsuchen von Dokumentdaten unter Verwendung eines Suchbegriffs |
CN101833560A (zh) * | 2010-02-02 | 2010-09-15 | 哈尔滨工业大学 | 基于互联网的厂商口碑自动排序*** |
JP2012003572A (ja) * | 2010-06-18 | 2012-01-05 | Nomura Research Institute Ltd | 感性分析システム及びプログラム |
JP5541049B2 (ja) * | 2010-09-29 | 2014-07-09 | 大日本印刷株式会社 | データ生成装置、データの生成方法及びデータ生成プログラム |
JP5656542B2 (ja) * | 2010-10-06 | 2015-01-21 | 株式会社クリップス | 口コミ情報管理システム及び口コミ情報管理プログラム |
US20150089409A1 (en) * | 2011-08-15 | 2015-03-26 | Equal Media Limited | System and method for managing opinion networks with interactive opinion flows |
-
2012
- 2012-12-13 CN CN201210540338.7A patent/CN103870973B/zh active Active
-
2013
- 2013-03-06 TW TW102107874A patent/TWI615724B/zh active
- 2013-12-10 US US14/102,353 patent/US20140172642A1/en not_active Abandoned
- 2013-12-11 JP JP2015547486A patent/JP2016503914A/ja active Pending
- 2013-12-11 WO PCT/US2013/074280 patent/WO2014093433A1/en active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI252987B (en) * | 2001-11-26 | 2006-04-11 | Fujitsu Ltd | Information analyzing method and system and recording medium |
Also Published As
Publication number | Publication date |
---|---|
CN103870973A (zh) | 2014-06-18 |
JP2016503914A (ja) | 2016-02-08 |
WO2014093433A1 (en) | 2014-06-19 |
TW201423450A (zh) | 2014-06-16 |
CN103870973B (zh) | 2017-12-19 |
US20140172642A1 (en) | 2014-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI615724B (zh) | 基於電子資訊的關鍵字提取的資訊推送、搜尋方法及裝置 | |
TWI557664B (zh) | Product information publishing method and device | |
Zhao et al. | Exploring demographic information in social media for product recommendation | |
US11176142B2 (en) | Method of data query based on evaluation and device | |
TWI567673B (zh) | Sorting methods and devices for search results | |
CN105765573B (zh) | 网站通信量优化方面的改进 | |
CN103778214B (zh) | 一种基于用户评论的商品属性聚类方法 | |
JP5913736B2 (ja) | キーワードの推薦 | |
US10095782B2 (en) | Summarization of short comments | |
US8589429B1 (en) | System and method for providing query recommendations based on search activity of a user base | |
TWI689880B (zh) | 用於實現評論搜尋引擎排序的方法和裝置 | |
US20070288602A1 (en) | Interest-based communities | |
US20200294071A1 (en) | Determining user intents related to websites based on site search user behavior | |
TW201520790A (zh) | 個性化資料搜尋方法和裝置 | |
TW201546633A (zh) | 文本資訊的匹配、業務對象的推送方法和裝置 | |
US9330071B1 (en) | Tag merging | |
CN105931082B (zh) | 一种商品类目关键词提取方法和装置 | |
Guo et al. | An opinion feature extraction approach based on a multidimensional sentence analysis model | |
Zhao et al. | Online comments of multi-category commodities based on emotional tendency analysis | |
CN115880034B (zh) | 一种数据的采集分析*** | |
US20220172229A1 (en) | Product various opinion evaluation system capable of generating special feature point and method thereof | |
Das | Business intelligence through opinion mining | |
Quan et al. | Longitudinal sales responses with online reviews | |
Tamhane et al. | An Entity Based LDA for Generating Sentiment Enhanced Business and Customer Profiles from Online Reviews | |
Zhang et al. | AN APPROACH FOR PREDICTING AND RANKING CONSUMER REVIEW HELPFULNESS |