JP6781723B2 - Information analysis system and information analysis method. - Google Patents

Information analysis system and information analysis method. Download PDF

Info

Publication number
JP6781723B2
JP6781723B2 JP2018036389A JP2018036389A JP6781723B2 JP 6781723 B2 JP6781723 B2 JP 6781723B2 JP 2018036389 A JP2018036389 A JP 2018036389A JP 2018036389 A JP2018036389 A JP 2018036389A JP 6781723 B2 JP6781723 B2 JP 6781723B2
Authority
JP
Japan
Prior art keywords
target
information
frequency
word
target information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018036389A
Other languages
Japanese (ja)
Other versions
JP2019152959A (en
Inventor
林 健一
健一 林
真人 縄手
真人 縄手
憲和 松村
憲和 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Biglobe Inc
Original Assignee
Biglobe Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Biglobe Inc filed Critical Biglobe Inc
Priority to JP2018036389A priority Critical patent/JP6781723B2/en
Publication of JP2019152959A publication Critical patent/JP2019152959A/en
Application granted granted Critical
Publication of JP6781723B2 publication Critical patent/JP6781723B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報を分析する情報分析システムおよび情報分析方法に関し、特には、クチコミ情報を分析して提供する情報分析システムおよび情報分析方法に関する。 The present invention relates to an information analysis system and an information analysis method for analyzing information, and more particularly to an information analysis system and an information analysis method for analyzing and providing word-of-mouth information.

近年、旅行先、宿泊施設、飲食店、購入商品および利用サービスなどのターゲットを選択する際に、インターネット上の比較サイトなどに記載されたターゲットに関するターゲット情報を閲覧にすることが多くなっている。特に、ターゲット情報として、利用者の視点によるターゲットの評価を示すクチコミ情報が注目されている。 In recent years, when selecting targets such as travel destinations, accommodation facilities, restaurants, purchased products, and services used, it is becoming more common to browse target information related to the targets described on comparison sites on the Internet. In particular, as target information, word-of-mouth information showing the evaluation of the target from the user's point of view is attracting attention.

しかしながら、クチコミ情報のようなインターネット上で発信されている数多いターゲット情報を確認して、適切なターゲットを選択することは容易ではない。 However, it is not easy to check a large number of target information transmitted on the Internet such as word-of-mouth information and select an appropriate target.

これに対して特許文献1には、クチコミ情報などのターゲット情報から出現頻度の高い語句を抽出して、ターゲットを特定するキーワードとして設定する技術が開示されている。この技術では、キーワードを確認することで、ターゲットの特徴を把握することが可能になるため、所望のターゲットを容易に選択することができる。 On the other hand, Patent Document 1 discloses a technique of extracting words and phrases that frequently appear from target information such as word-of-mouth information and setting them as keywords for specifying the target. In this technique, it is possible to grasp the characteristics of the target by confirming the keyword, so that the desired target can be easily selected.

特開2014−191550公報JP-A-2014-191550

しかしながら、特許文献1に記載の技術では、多くの異なるターゲットに対して同じ語句がキーワードとして設定されてしまい、各ターゲットの特徴を把握することが難しくなることがある。例えば、旅行先の宿泊施設を選ぶ場合、旅行先が温泉地であれば、多くの宿泊施設に関するターゲット情報から「温泉」という語句が抽出されてしまい、その結果、多くの宿泊施設に「温泉」というキーワードが設定されてしまう。このような場合、各宿泊施設の特徴を把握することが難しく、適切なターゲットを選択することは容易ではない。 However, in the technique described in Patent Document 1, the same phrase is set as a keyword for many different targets, and it may be difficult to grasp the characteristics of each target. For example, when choosing an accommodation facility for a travel destination, if the travel destination is a hot spring area, the word "hot spring" is extracted from the target information about many accommodation facilities, and as a result, "hot spring" is used for many accommodation facilities. The keyword is set. In such a case, it is difficult to grasp the characteristics of each accommodation facility, and it is not easy to select an appropriate target.

本発明は、上記の問題を鑑みてなされたものであり、ターゲットの特徴を容易に把握することが可能な情報分析装置および情報分析方法を提供することを目的とする。 The present invention has been made in view of the above problems, and an object of the present invention is to provide an information analysis device and an information analysis method capable of easily grasping the characteristics of a target.

本発明による情報分析システムは、ターゲットに関するターゲット情報を前記ターゲットごとに蓄積する蓄積部と、各ターゲットについて、当該ターゲットである対象ターゲットに関するターゲット情報において特定語句が出現する出現度数を、他のターゲットに関するターゲット情報を含む比較ターゲット情報において前記特定語句が出現する比較度数に基づいて補正した補正度数を算出する制御部と、前記ターゲット情報、前記特定語句および前記補正度数に応じた表示データを生成する生成部と、を有する。 The information analysis system according to the present invention relates to a storage unit that stores target information about a target for each target, and for each target, the frequency of occurrence of a specific phrase appearing in the target information about the target target, which is the target, with respect to other targets. A control unit that calculates a correction frequency corrected based on the comparison frequency in which the specific word appears in the comparison target information including the target information, and a generation that generates display data according to the target information, the specific phrase, and the correction frequency. It has a part and.

本発明による情報分析方法は、ターゲットに関するターゲット情報を前記ターゲットごとに蓄積する蓄積部を有する情報分析システムによる情報分析方法であって、各ターゲットについて、当該ターゲットである対象ターゲットに関するターゲット情報において特定語句が出現する出現度数を、他のターゲットに関するターゲット情報を含む比較ターゲット情報において前記特定語句が出現する比較度数に基づいて補正した補正度数を算出するステップと、前記ターゲット情報、前記特定語句および前記補正度数に応じた表示データを生成するステップと、を含む情報分析方法。 The information analysis method according to the present invention is an information analysis method by an information analysis system having a storage unit that stores target information about the target for each target, and for each target, a specific phrase in the target information about the target target that is the target. The step of calculating the correction frequency obtained by correcting the appearance frequency in which the specific word appears based on the comparison frequency in which the specific word appears in the comparison target information including the target information about another target, and the target information, the specific word, and the correction. An information analysis method that includes steps to generate display data according to frequency.

本発明によれば、ターゲットの特徴を容易に把握することが可能になる。 According to the present invention, the characteristics of the target can be easily grasped.

本発明の第1の実施形態の情報提供システムを示す図である。It is a figure which shows the information providing system of 1st Embodiment of this invention. 本発明の第1の実施形態の分析システムを示す図である。It is a figure which shows the analysis system of 1st Embodiment of this invention. 表示データの一例を示す図である。It is a figure which shows an example of the display data. 表示データの他の例を示す図である。It is a figure which shows another example of display data. 表示データの他の例を示す図である。It is a figure which shows another example of display data. 表示データの他の例を示す図である。It is a figure which shows another example of display data. 表示データの他の例を示す図である。It is a figure which shows another example of display data. 本発明の第1の実施形態の情報提供システムの動作を説明するためのシーケンス図である。It is a sequence diagram for demonstrating the operation of the information providing system of 1st Embodiment of this invention.

以下、本発明の実施形態について図面を参照して説明する。なお、各図面において同じ機能を有するものには同じ符号を付け、その説明を省略する場合がある。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. In each drawing, those having the same function may be given the same reference numerals and the description thereof may be omitted.

(第1の実施形態)
図1は、本発明の第1の実施形態の情報提供システムを示す図である。図1に示す情報提供システム1は、Webサーバ10と、ターゲット情報格納装置20と、利用者端末30と、分析システム40とを有する。Webサーバ10、ターゲット情報格納装置20、利用者端末30および分析システム40は、ネットワーク100を介して通信可能に接続されている。Webサーバ10および利用者端末30は、図1では、それぞれ3つずつ示されているが、Webサーバ10および利用者端末30の数は、3つに限らず、適宜変更可能である。
(First Embodiment)
FIG. 1 is a diagram showing an information providing system according to the first embodiment of the present invention. The information providing system 1 shown in FIG. 1 includes a Web server 10, a target information storage device 20, a user terminal 30, and an analysis system 40. The Web server 10, the target information storage device 20, the user terminal 30, and the analysis system 40 are communicably connected via the network 100. Although the Web server 10 and the user terminal 30 are each shown in FIG. 1, the number of the Web server 10 and the user terminal 30 is not limited to three and can be changed as appropriate.

Webサーバ10は、特定のターゲットに関するターゲット情報を含むWeb情報を提供するサーバである。ターゲットは、企業などの提供者が提供する提供物である。提供物としては、宿泊施設、商店(飲食店やコンビニなど)、塾、物件(賃貸物件や分譲物件)、商品およびサービスなどが挙げられる。Web情報は、ターゲットを提供する提供者にて管理される。 The Web server 10 is a server that provides Web information including target information regarding a specific target. Targets are offerings provided by providers such as companies. Offerings include accommodations, shops (restaurants, convenience stores, etc.), cram schools, properties (rental properties, condominiums, etc.), products and services. Web information is managed by the provider who provides the target.

ターゲット情報は、例えば、ターゲットに対する評価を示す評価情報を含む。評価情報は、例えば、利用者の視点によるターゲットの評価であるクチコミを示すクチコミ情報である。また、ターゲット情報には、当該ターゲットの名称、説明などが含まれている。ただし、ターゲットの名称、説明などの情報は、ターゲット情報とは別のターゲット説明情報としても良い。なお、Webサーバ10が提供するWeb情報には、利用者が利用者端末30を介して、ターゲットに対する注文処理を行うための注文機能が含まれてもよい。注文処理は、例えば、ターゲットに対する購入注文を行う購入処理や、ターゲットに対する予約注文を行う予約処理などである。注文機能は、例えば、購入フォームや予約フォームなどである。 The target information includes, for example, evaluation information indicating an evaluation of the target. The evaluation information is, for example, word-of-mouth information indicating a word-of-mouth that is an evaluation of a target from the viewpoint of a user. In addition, the target information includes the name, description, and the like of the target. However, information such as the target name and description may be target description information different from the target information. The Web information provided by the Web server 10 may include an order function for the user to process an order for the target via the user terminal 30. The order processing includes, for example, a purchase process for placing a purchase order for a target, a reservation process for placing a pre-order for a target, and the like. The ordering function is, for example, a purchase form or a reservation form.

ターゲット情報格納装置20は、そのターゲットに関するターゲット情報をターゲットを識別するターゲット識別情報ごとに示すDB(Database:データベース)を格納する格納装置である。例えば、ターゲット識別情報は、ユニークな管理IDまたはターゲットの名称などである。ターゲット情報格納装置20は、例えば、ターゲットに対応するWebサーバ10が存在しない場合や、ターゲットの提供者とは別に、利用者からターゲット情報を収集する場合などに使用される。ターゲット情報格納装置20が格納するターゲット情報は、クチコミ情報のような特定の情報だけでもよい。なお、ターゲット情報は、アンケートフォームや電子メールなどを用いて利用者から直接投稿されたものでもよいし、アンケート用紙などに記載された情報を管理者がターゲット情報格納装置20に登録したものでもよい。 The target information storage device 20 is a storage device that stores a DB (Database) that indicates target information about the target for each target identification information that identifies the target. For example, the target identification information is a unique management ID or a target name. The target information storage device 20 is used, for example, when the Web server 10 corresponding to the target does not exist, or when the target information is collected from the user separately from the target provider. The target information stored in the target information storage device 20 may be only specific information such as word-of-mouth information. The target information may be directly posted by the user using a questionnaire form, e-mail, or the like, or the information described in the questionnaire or the like may be registered by the administrator in the target information storage device 20. ..

利用者端末30は、情報提供システム1の利用者にて使用される端末装置である。利用者端末30は、例えば、PC(personal computer)、スマートフォン、スマートTVまたはゲーム機などである。 The user terminal 30 is a terminal device used by the user of the information providing system 1. The user terminal 30 is, for example, a PC (personal computer), a smartphone, a smart TV, a game machine, or the like.

利用者端末30は、ユーザからの指示に従って、ターゲット情報の取得を要求する取得要求を分析システム40に送信する。また、利用者端末30は、分析システム40から、取得要求の応答としてターゲット情報を含む表示データを受信し、その表示データを表示する。なお、取得要求は、キーワードのような取得対象となるターゲットを検索する検索条件や、利用者の属性を示す属性情報などを含む。表示データのより詳細な説明は後述する。 The user terminal 30 transmits an acquisition request requesting acquisition of target information to the analysis system 40 according to an instruction from the user. Further, the user terminal 30 receives display data including target information from the analysis system 40 as a response to the acquisition request, and displays the display data. The acquisition request includes search conditions for searching a target to be acquired, such as a keyword, and attribute information indicating user attributes. A more detailed description of the display data will be described later.

分析システム40は、ネットワーク100上のターゲット情報の収集および分析を行い、その分析結果に応じた表示データを利用者端末30に提供する情報分析システムである。 The analysis system 40 is an information analysis system that collects and analyzes target information on the network 100 and provides display data according to the analysis result to the user terminal 30.

図2は、分析システム40の構成を示す図である。図2に示すように分析システム40は、収集装置41と、分析装置42と、提供装置43とを有する。 FIG. 2 is a diagram showing the configuration of the analysis system 40. As shown in FIG. 2, the analysis system 40 includes a collection device 41, an analysis device 42, and a providing device 43.

収集装置41は、ネットワーク100上からターゲット情報を収集して蓄積する。具体的には、収集装置41は、伝送部411と、蓄積部412と、収集部413とを有する。 The collection device 41 collects and stores target information from the network 100. Specifically, the collection device 41 has a transmission unit 411, a storage unit 412, and a collection unit 413.

伝送部411は、ネットワーク100上の各装置と接続される。蓄積部412は、種々の情報を蓄積する。 The transmission unit 411 is connected to each device on the network 100. The storage unit 412 stores various information.

収集部413は、Webサーバ10およびターゲット情報格納装置20のうちの少なくとも1つからターゲット情報を収集し、その収集したターゲット情報をターゲットごとに蓄積部412に蓄積する。より具体的には、収集部413は、ターゲット情報と、ターゲットの分析区分を示す区分情報とを、ターゲットを識別する識別情報であるターゲット識別情報ごと対応付けた収集情報を蓄積する。また、収集部413は、Webサーバ10からターゲット説明情報を収集し、ターゲット情報格納装置20からターゲット情報を収集し、ターゲット説明情報をターゲット識別情報に対応付けて収集情報に含めて蓄積部412に蓄積してもよい。 The collection unit 413 collects target information from at least one of the Web server 10 and the target information storage device 20, and stores the collected target information in the storage unit 412 for each target. More specifically, the collection unit 413 accumulates collection information in which the target information and the classification information indicating the analysis classification of the target are associated with each target identification information which is the identification information for identifying the target. Further, the collecting unit 413 collects the target explanatory information from the Web server 10, collects the target information from the target information storage device 20, associates the target explanatory information with the target identification information, includes the target explanatory information in the collected information, and stores the target in the storage unit 412. It may be accumulated.

本実施形態では、特に断りのない限り、ターゲットは宿泊施設であり、分析区分は宿泊施設が設けられた場所の地理的な区分である場合を例に説明する。地理的な区分は、例えば、市区町村などの行政区分などでもよいし、地表を所定の形状(例えば、メッシュ状)で区切った各領域などでもよい。収集部413は、例えば、ターゲット情報を分析してターゲットである宿泊施設の住所を抽出し、その住所に基づいて区分情報を生成することができる。 In the present embodiment, unless otherwise specified, the target is the accommodation facility, and the analysis category is the geographical division of the place where the accommodation facility is provided. The geographical division may be, for example, an administrative division such as a city, ward, town, or village, or may be an area in which the ground surface is divided by a predetermined shape (for example, a mesh shape). For example, the collection unit 413 can analyze the target information, extract the address of the target accommodation facility, and generate the classification information based on the address.

分析装置42は、収集装置41が収集したターゲット情報を分析する。具体的には、分析装置42は、接続部421と、記憶部422と、制御部423とを有する。 The analyzer 42 analyzes the target information collected by the collector 41. Specifically, the analyzer 42 has a connection unit 421, a storage unit 422, and a control unit 423.

接続部421は、収集装置41と接続する。記憶部422は、種々の情報を記憶する。 The connection unit 421 is connected to the collection device 41. The storage unit 422 stores various information.

制御部423は、接続部421を介して収集装置41の蓄積部412から収集情報を取得し、その収集情報を分析する。制御部423は、その分析結果を示す結果情報を提供装置43に送信する。 The control unit 423 acquires the collected information from the storage unit 412 of the collection device 41 via the connection unit 421 and analyzes the collected information. The control unit 423 transmits the result information indicating the analysis result to the providing device 43.

具体的には、先ず、制御部423は、収集情報内の各ターゲット情報から特定語句を抽出する。このとき、制御部423は、ターゲット情報内の全情報から特定語句を抽出してもよいし、ターゲット情報内の特定の分析対象情報から特定語句を抽出してもよい。分析対象情報は、例えば、クチコミ情報である。本実施形態では、制御部423は、ターゲット情報内の複数のクチコミ情報のそれぞれから特定語句を抽出する。 Specifically, first, the control unit 423 extracts a specific phrase from each target information in the collected information. At this time, the control unit 423 may extract a specific phrase from all the information in the target information, or may extract a specific phrase from the specific analysis target information in the target information. The analysis target information is, for example, word-of-mouth information. In the present embodiment, the control unit 423 extracts a specific phrase from each of the plurality of word-of-mouth information in the target information.

特定語句の抽出処理では、例えば、制御部423は、クチコミ情報内の各語句の品詞を特定し、それらの語句のうち予め定められた品詞(例えば、名詞や形容詞)の語句を特定語句として抽出する。また、制御部423は、記憶部422に予め記憶した対象語句とクチコミ情報内の各語句のマッチング処理を行い、クチコミ情報から対象語句と同じ語句を特定語句として抽出してもよい。 In the extraction process of a specific phrase, for example, the control unit 423 identifies the part of speech of each phrase in the word-of-mouth information, and extracts a predetermined part of speech (for example, a noun or an adjective) from those phrases as a specific phrase. To do. Further, the control unit 423 may perform matching processing between the target word / phrase stored in advance in the storage unit 422 and each word / phrase in the word-of-mouth information, and extract the same word / phrase as the target word / phrase from the word-of-mouth information as a specific word / phrase.

特定語句を抽出すると、制御部423は、収集情報内の各ターゲット識別情報にて識別される各ターゲットについて、特定語句ごとに、そのターゲットである対象ターゲットに関するクチコミ情報において特定語句が出現する出現度数を算出する。出現度数は、本実施形態では、特定語句を含むクチコミ情報の数である。このため、例えば、同一のクチコミ情報に特定語句が複数回出現しても、出現度数は1となる。なお、出現度数は、特定語句が出現した回数でもよい。 When the specific phrase is extracted, the control unit 423 has the frequency at which the specific phrase appears in the word-of-mouth information about the target target, which is the target, for each specific phrase for each target identified by each target identification information in the collected information. Is calculated. The appearance frequency is the number of word-of-mouth information including a specific word in the present embodiment. Therefore, for example, even if a specific word or phrase appears a plurality of times in the same word-of-mouth information, the frequency of appearance is 1. The frequency of appearance may be the number of times a specific word or phrase appears.

また、制御部423は、互いに類似する複数の類似語句の代表となる代表語句を特定語句として抽出してもよい。例えば、複数の類似語句と代表語句との対応関係を示す語句対応情報を記憶部422に予め記憶させておく。特定語句の抽出処理において、クチコミ情報内の類似語句が出現すると、制御部423は、記憶部422に記憶された語句対応情報において、出現した類似語句に対応する代表語句を、特定語句として抽出する。この場合、特定語句の出現度数は、代表語句に対応する各類似語句の出現度数の和となる。なお、類似語句は、例えば、「ラーメン」、「中華ソバ」および「拉麺」などであり、代表語句は、例えば、「ラーメン」である。この例において、対象ターゲットの各クチコミ情報から「ラーメン」2件、「中華ソバ」2件、「拉麺」1件が抽出された場合、代表語句「ラーメン」がその和の5件出現したことになる。また、代表語句は、類似語句のいずれかであってもよいし、類似語句とは別の語句でもよい。 Further, the control unit 423 may extract representative words and phrases that are representative of a plurality of similar words and phrases that are similar to each other as specific words and phrases. For example, the storage unit 422 stores in advance word / phrase correspondence information indicating the correspondence between a plurality of similar words and representative words. When a similar phrase in the word-of-mouth information appears in the extraction process of the specific phrase, the control unit 423 extracts the representative phrase corresponding to the similar phrase that appears in the phrase correspondence information stored in the storage unit 422 as the specific phrase. .. In this case, the frequency of occurrence of the specific phrase is the sum of the frequency of occurrence of each similar phrase corresponding to the representative phrase. The similar words and phrases are, for example, "ramen", "Chinese buckwheat noodles" and "ramen", and the representative words and phrases are, for example, "ramen". In this example, when 2 cases of "ramen", 2 cases of "Chinese buckwheat noodles", and 1 case of "ramen" are extracted from each word-of-mouth information of the target target, the representative phrase "ramen" appears in 5 cases of the sum. Become. Further, the representative phrase may be any of similar phrases, or may be a phrase different from the similar phrase.

また、制御部423は、特定語句の前後の文脈を解析して特定語句の使用状況を特定し、その使用状況を示す状況情報ごとに特定語句の出現度数を算出してもよい。制御部423は、例えば、使用状況を、特定語句が好意的な文脈で使用されている好意的状況と、特定語句が否定的な文脈で使用されている否定的状況のいずれかに特定する。また、制御部423は、使用状況を、好意的状況、否定的状況、および、特定語句が使用された文脈が不明な不明状況のいずれかに特定してもよい。 Further, the control unit 423 may analyze the context before and after the specific phrase to specify the usage status of the specific phrase, and calculate the frequency of occurrence of the specific phrase for each situation information indicating the usage status. The control unit 423 specifies, for example, a usage situation as either a favorable situation in which a specific phrase is used in a favorable context or a negative situation in which the specific phrase is used in a negative context. In addition, the control unit 423 may specify the usage situation as one of a favorable situation, a negative situation, and an unknown situation in which the context in which the specific phrase is used is unknown.

また、制御部423は、出現度数の算出を所定の時間間隔で繰り返し行い、同じ特定語句に対して、最新の出現度数の過去の出現度数に対する割合が所定割合以上増加した場合、その割合に応じて出現頻度を調整(例えば、増加)させてもよい。なお、過去の出現度数は、例えば、前回算出した出現度数である。 Further, the control unit 423 repeatedly calculates the appearance frequency at a predetermined time interval, and when the ratio of the latest appearance frequency to the past appearance frequency increases by a predetermined ratio or more for the same specific word, it corresponds to the ratio. The frequency of appearance may be adjusted (for example, increased). The past appearance frequency is, for example, the appearance frequency calculated last time.

対象ターゲット情報の特定語句の出現度数が算出されると、他のターゲット情報についても、各々同様に、ターゲット情報の特定語句の出現度数を算出する。各ターゲット情報の特定語句の出現度数を算出すると、制御部423は、各ターゲットについて、特定語句ごとに、その特定語句の出現度数を、他のターゲットに関するクチコミ情報を含む比較クチコミ情報において特定語句が出現する比較度数に基づいて補正した補正度数を算出する。比較クチコミ情報は、対象ターゲット情報の特定語句の出現度数を比較する比較対象となるターゲット情報が有するクチコミ情報の集合であり、比較対象となるターゲット情報の集合を比較ターゲット情報と呼ぶ。比較クチコミ情報は、クチコミ情報全体でもよいし、対象ターゲットと分析区分が同じターゲットのクチコミ情報でもよい。なお、比較クチコミ情報は、対象ターゲットに関するクチコミ情報を含んでも含まなくてもよいが、本実施形態では、対象ターゲットに関するクチコミ情報を含む。 When the appearance frequency of the specific word / phrase of the target target information is calculated, the appearance frequency of the specific word / phrase of the target information is calculated in the same manner for each of the other target information. When the frequency of occurrence of a specific phrase in each target information is calculated, the control unit 423 determines the frequency of appearance of the specific phrase for each specific phrase for each target, and the specific phrase is included in the comparative word-of-mouth information including the word-of-mouth information about other targets. The corrected correction frequency is calculated based on the comparison frequency that appears. The comparative word-of-mouth information is a set of word-of-mouth information possessed by the target information to be compared, which compares the frequency of occurrence of specific words in the target target information, and the set of target information to be compared is called the comparison target information. The comparative word-of-mouth information may be the entire word-of-mouth information, or the word-of-mouth information of a target having the same analysis category as the target target. The comparative word-of-mouth information may or may not include word-of-mouth information about the target target, but in the present embodiment, word-of-mouth information about the target target is included.

補正度数の算出処理では、制御部423は、具体的には、比較度数に対する出現度数の突出度合いを示す特徴度を算出し、その特徴度に基づいて出現度数を補正する。このとき、制御部423は、突出度合いが既定値よりも高い場合、出現度数を特徴度に応じて大きくし、突出度合いが既定値よりも低い場合、出現度数を特徴度に応じて小さくする。また、制御部423は、突出度合いが既定値よりも高い場合、出現度数の補正を行わず、突出度合いが既定値よりも低い場合、出現度数を特徴度に応じて小さくしてもよい。また、制御部423は、特定語句のうち、所定数以上の各ターゲットに関するターゲット情報に共通した共通語句の出現度数だけを補正してもよい。所定数は、予め定められていてもよいし、ターゲットの数に予め定められた比率を掛けた値でもよい。 In the correction frequency calculation process, the control unit 423 specifically calculates the characteristic degree indicating the degree of protrusion of the appearance frequency with respect to the comparative frequency, and corrects the appearance frequency based on the characteristic degree. At this time, the control unit 423 increases the appearance frequency according to the feature degree when the protrusion degree is higher than the default value, and decreases the appearance frequency according to the feature degree when the protrusion degree is lower than the default value. Further, the control unit 423 may not correct the appearance frequency when the protrusion degree is higher than the default value, and may reduce the appearance frequency according to the feature degree when the protrusion degree is lower than the default value. Further, the control unit 423 may correct only the frequency of occurrence of common words and phrases common to the target information regarding each target of a predetermined number or more among the specific words and phrases. The predetermined number may be predetermined or may be a value obtained by multiplying the number of targets by a predetermined ratio.

特徴度は、例えば、確率的コンプレキシティを用いて算出される。具体的には、特徴度ΔIは、計算式ΔI=I(D)−(I(E)+I(F))から算出される。ここでI(D)は、比較クチコミ情報に対応する確率的コンプレキシティであり、I(E)は特定語句を含む比較クチコミ情報に対応する確率的コンプレキシティであり、I(F)は特定語句を含まない比較クチコミ情報に対応する確率的コンプレキシティである。 The feature degree is calculated using, for example, stochastic complexity. Specifically, the characteristic degree ΔI is calculated from the calculation formula ΔI = I (D) − (I (E) + I (F)). Here, I (D) is a stochastic complexity corresponding to comparative word-of-mouth information, I (E) is a stochastic complex corresponding to comparative word-of-mouth information including a specific phrase, and I (F) is. It is a stochastic complexity corresponding to comparative word-of-mouth information that does not include a specific phrase.

確率的コンプレキシティは、

Figure 0006781723
から算出される。ここで、mは、確率的コンプレキシティに対応する比較クチコミ情報に含まれるクチコミ情報の数であり、m1は、確率的コンプレキシティに対応する比較クチコミ情報内の対象ターゲットに関するクチコミ情報の数である。また、H(p)は、エントロピー関数であり、具体的には、
Figure 0006781723
である。logは自然対数である。 Stochastic complexity is
Figure 0006781723
It is calculated from. Here, m is the number of word-of-mouth information included in the comparative word-of-mouth information corresponding to the stochastic complexity, and m1 is the number of word-of-mouth information about the target target in the comparative word-of-mouth information corresponding to the stochastic complexity. Is. Further, H (p) is an entropy function, and specifically,
Figure 0006781723
Is. log is the natural logarithm.

特徴度ΔIの計算式において、I(E)+I(F)は、情報量基準と呼ばれ、情報量基準が小さいほど、特定語句がターゲットの特徴的な語句を表す。 In the formula for calculating the characteristic degree ΔI, I (E) + I (F) is called an information criterion, and the smaller the information criterion, the more characteristic the specific phrase represents the target.

以下、特徴度ΔIの具体例について説明する。
(特徴度ΔIの第1の具体例)
比較クチコミ情報の数を10,000件、比較クチコミ情報における語句Aを含むクチコミ情報の数(比較度数)を1,000件とする。
Hereinafter, a specific example of the feature degree ΔI will be described.
(First specific example of characteristic degree ΔI)
The number of comparative word-of-mouth information is 10,000, and the number of word-of-mouth information including the word A in the comparative word-of-mouth information (comparison frequency) is 1,000.

このとき、対象ターゲットであるターゲットXに対するクチコミ情報の数が100件、語句Aを含むターゲットXに対するクチコミ情報の数(対象ターゲットにおける語句Aの出現度数)が30件であったとする。 At this time, it is assumed that the number of word-of-mouth information for the target X, which is the target target, is 100, and the number of word-of-mouth information for the target X including the word A (the frequency of appearance of the word A in the target target) is 30.

この場合、比較クチコミ情報に対応する確率的コンプレキシティI(D)では、m1=100、m=10,000となり、I(D)=約564.85となる。特定語句を含む比較クチコミ情報に対応する確率的コンプレキシティI(E)では、m1=30、m=1,000となり、I(E)=約138.42となる。特定語句を含まない比較クチコミ情報に対応する確率的コンプレキシティI(F)では、m1=100−30=70、m=10,000−1,000=9,000となり、I(F)=約414.46となる。したがって、特徴度ΔI=I(D)−(I(E)+I(F))=約11.97となる。 In this case, in the stochastic complexity I (D) corresponding to the comparative word-of-mouth information, m1 = 100, m = 10,000, and I (D) = about 564.85. In the stochastic complexity I (E) corresponding to the comparative word-of-mouth information including the specific word, m1 = 30, m = 1,000, and I (E) = about 138.42. In the probabilistic complexity I (F) corresponding to the comparative word-of-mouth information that does not include a specific phrase, m1 = 100-30 = 70, m = 10,000-11,000 = 9,000, and I (F) = It becomes about 414.46. Therefore, the characteristic degree ΔI = I (D) − (I (E) + I (F)) = about 11.97.

また、対象ターゲットであるターゲットYに対するクチコミ情報の数が200件、語句Aを含むターゲットYに対するクチコミ情報の数(対象ターゲットにおける語句Aの出現度数)が40件であったとする。 Further, it is assumed that the number of word-of-mouth information for the target Y, which is the target target, is 200, and the number of word-of-mouth information for the target Y including the word A (the frequency of appearance of the word A in the target target) is 40.

この場合、比較クチコミ情報に対応する確率的コンプレキシティI(D)では、m1=200、m=10,000となり、I(D)=約985.22となる。特定語句を含む比較クチコミ情報に対応する確率的コンプレキシティI(E)では、m1=40、m=1,000となり、I(E)=約171.62となる。特定語句を含まない比較クチコミ情報に対応する確率的コンプレキシティI(F)では、m1=200−40=160、m=10,000−1,000=9,000となり、I(F)=約808.12となる。したがって、特徴度ΔI=I(D)−(I(E)+I(F))=約5.48となる。 In this case, in the stochastic complexity I (D) corresponding to the comparative word-of-mouth information, m1 = 200, m = 10,000, and I (D) = about 985.22. In the stochastic complexity I (E) corresponding to the comparative word-of-mouth information including the specific word / phrase, m1 = 40, m = 1,000, and I (E) = about 171.62. In the stochastic complexity I (F) corresponding to the comparative word-of-mouth information that does not include a specific phrase, m1 = 200-40 = 160, m = 10,000-11,000 = 9,000, and I (F) = It becomes about 808.12. Therefore, the characteristic degree ΔI = I (D) − (I (E) + I (F)) = about 5.48.

この例では、ターゲットYにおける語句Aを含むクチコミ情報の数はターゲットXにおける語句Aを含むクチコミ情報の数よりも多いが、ターゲットXにおける語句Aの出現頻度がターゲットYにおける語句Aの出現頻度よりも高く、その結果、ターゲットXの特徴度ΔIがターゲットYの特徴度ΔIよりも高くなっている。 In this example, the number of word-of-mouth information including the word A in the target Y is larger than the number of word-of-mouth information including the word A in the target X, but the frequency of appearance of the word A in the target X is higher than the frequency of appearance of the word A in the target Y. As a result, the characteristic degree ΔI of the target X is higher than the characteristic degree ΔI of the target Y.

(特徴度ΔIの第2の具体例)
比較クチコミ情報の数を10,000件、語句Bを含むクチコミ情報の数(比較度数)を3,000件であるとする。
(Second specific example of characteristic degree ΔI)
It is assumed that the number of comparative word-of-mouth information is 10,000 and the number of word-of-mouth information including word B (comparison frequency) is 3,000.

このとき、対象ターゲットであるターゲットXに対するクチコミ情報の数が100件、語句Bを含むターゲットXに対するクチコミ情報の数(対象ターゲットにおける語句Bの出現度数)が40件であったとする。 At this time, it is assumed that the number of word-of-mouth information for the target X, which is the target target, is 100, and the number of word-of-mouth information for the target X including the word B (the frequency of appearance of the word B in the target target) is 40.

この場合、比較クチコミ情報に対応する確率的コンプレキシティI(D)では、m1=100、m=10,000となり、I(D)=約564.85となる。特定語句を含む比較クチコミ情報に対応する確率的コンプレキシティI(E)では、m1=40、m=3,000となり、I(E)=約216.66となる。特定語句を含まない比較クチコミ情報に対応する確率的コンプレキシティI(F)では、m1=100−40=60、m=10,000−3,000=7,000となり、I(F)=約349.95となる。したがって、特徴度ΔI=I(D)−(I(E)+I(F))=約−1.77となる。 In this case, in the stochastic complexity I (D) corresponding to the comparative word-of-mouth information, m1 = 100, m = 10,000, and I (D) = about 564.85. In the stochastic complexity I (E) corresponding to the comparative word-of-mouth information including the specific word / phrase, m1 = 40, m = 3,000, and I (E) = about 216.66. In the stochastic complexity I (F) corresponding to the comparative word-of-mouth information that does not include a specific phrase, m1 = 100-40 = 60, m = 10,000-3,000 = 7,000, and I (F) = It becomes about 349.95. Therefore, the characteristic degree ΔI = I (D) − (I (E) + I (F)) = about -1.77.

また、対象ターゲットであるターゲットZに対するクチコミ情報の数が100件、語句Bを含むターゲットZに対するクチコミ情報の数(対象ターゲットにおける語句Bの出現度数)が50件であったとする。 Further, it is assumed that the number of word-of-mouth information for the target Z, which is the target target, is 100, and the number of word-of-mouth information for the target Z including the word B (the frequency of appearance of the word B in the target target) is 50.

この場合、比較クチコミ情報に対応する確率的コンプレキシティI(D)では、m1=100、m=10,000となり、I(D)=約564.85となる。特定語句を含む比較クチコミ情報に対応する確率的コンプレキシティI(E)では、m1=50、m=3,000となり、I(E)=約258.53となる。I(F)では、m1=100−50=50、m=10,000−3,000=7,000となり、特定語句を含まない比較クチコミ情報に対応する確率的コンプレキシティI(F)=約301.56となる。したがって、特徴度ΔI=I(D)−(I(E)+I(F))=約4.76となる。 In this case, in the stochastic complexity I (D) corresponding to the comparative word-of-mouth information, m1 = 100, m = 10,000, and I (D) = about 564.85. In the stochastic complexity I (E) corresponding to the comparative word-of-mouth information including the specific word, m1 = 50, m = 3,000, and I (E) = about 258.53. In I (F), m1 = 100-50 = 50, m = 10,000-3,000 = 7,000, and the probabilistic complexity I (F) corresponding to the comparative word-of-mouth information that does not include a specific phrase is It becomes about 301.56. Therefore, the characteristic degree ΔI = I (D) − (I (E) + I (F)) = about 4.76.

この例では、語句Bのようにクチコミ情報に頻繁に出現する語句であっても、特定のターゲット(ターゲットZ)での出現度数が高いと、突出度合いを示す特徴度ΔIが高くなることが示されている。 In this example, it is shown that even if the phrase frequently appears in the word-of-mouth information such as phrase B, the characteristic degree ΔI indicating the degree of protrusion increases when the frequency of appearance at a specific target (target Z) is high. Has been done.

なお、上記の確率的コンプレキシティを用いた特徴度は、特徴度の単なる一例であって、これに限るものではない。特徴度は、例えば、比較クチコミ情報内の特定語句に対するターゲットごとの出現頻度の統計値を比較度数とした際の、比較度数に対する出現度数の割合などでもよい。統計値としては、平均値や中央値などが挙げられる。 It should be noted that the characteristic degree using the above-mentioned stochastic complexity is merely an example of the characteristic degree, and is not limited to this. The characteristic degree may be, for example, the ratio of the appearance frequency to the comparison frequency when the statistical value of the appearance frequency for each target for a specific word in the comparative word-of-mouth information is used as the comparison frequency. Examples of statistical values include mean values and median values.

例えば、第1のターゲット情報の各クチコミ情報から抽出された第1の特定語句の出現度数を65とし、第1〜s(sはターゲット情報の数)のターゲット情報の各々のクチコミ情報から抽出された第1の特定語句の出現度数の平均値(比較度数)が50とし、標準偏差を10とした場合、偏差値が65であり、既定値としての閾値を平均値+標準偏差の60とする。この場合、第1のターゲット情報から抽出された第1の特定語句の出現度数の特徴度を「(偏差値−閾値)*|偏差値−閾値|」で算出すると、特徴度は25となり、補正度数は出現度数+特徴度で90となる。仮に上記の例で、第1の特定語句の出現度数が50であった場合は、偏差値は50となり、特徴度は−100となり、補正度数は−50となる。第1のターゲット情報から抽出された第1の特定語句の出現度数が比較度数よりも大きければ特徴度が高くなり、反対に出現度数が比較度数よりも小さければ特徴度が低くなる。 For example, the frequency of occurrence of the first specific word extracted from each word-of-mouth information of the first target information is 65, and it is extracted from each word-of-mouth information of the target information of the first to s (s is the number of target information). When the average value (comparison frequency) of the appearance frequency of the first specific word is 50 and the standard deviation is 10, the deviation value is 65, and the threshold value as the default value is 60 of the mean value + standard deviation. .. In this case, if the characteristic degree of the appearance frequency of the first specific word extracted from the first target information is calculated by "(deviation value-threshold value) * | deviation value-threshold value |", the characteristic degree becomes 25, which is corrected. The frequency is 90 in terms of appearance frequency + feature frequency. If, in the above example, the frequency of appearance of the first specific word is 50, the deviation value is 50, the characteristic degree is -100, and the correction frequency is -50. If the appearance frequency of the first specific word extracted from the first target information is larger than the comparison frequency, the feature degree is high, and conversely, if the appearance frequency is smaller than the comparison frequency, the feature degree is low.

このように第1のターゲット情報から抽出された第1〜t1(t1は第1のターゲット情報の特定語句の数)の特定語句の出現度数に対する特徴度を各々算出し、更に、第2〜sのターゲット情報についても、各々のクチコミ情報から抽出された特定語句の出現度数に対する特徴度を各々算出する。そして、出現度数を特徴度で補正し補正度数を算出する。 In this way, the characteristics of the first to t1 (t1 is the number of specific words in the first target information) extracted from the first target information with respect to the appearance frequency of the specific words are calculated, and further, the second to s Also for the target information of, the characteristic degree with respect to the appearance frequency of the specific word extracted from each word-of-mouth information is calculated. Then, the appearance frequency is corrected by the feature degree and the correction frequency is calculated.

出現度数を補正した補正度数を算出すると、制御部423は、ターゲット識別情報ごとに、ターゲット情報と特定語句と補正度数とを対応付けた結果情報を生成して提供装置43に出力する。このとき、制御部423は、結果情報を記憶部422に記憶してもよい。 When the correction frequency corrected for the appearance frequency is calculated, the control unit 423 generates result information in which the target information, the specific phrase, and the correction frequency are associated with each target identification information, and outputs the result information to the providing device 43. At this time, the control unit 423 may store the result information in the storage unit 422.

提供装置43は、利用者端末30からの取得要求に応じた表示データを提供する。具体的には、提供装置43は、通信部431と、格納部432と、提供部433とを有する。 The providing device 43 provides display data in response to an acquisition request from the user terminal 30. Specifically, the providing device 43 includes a communication unit 431, a storage unit 432, and a providing unit 433.

通信部431は、ネットワーク100上の各装置と接続される。通信部431は、例えば、利用者端末30からターゲット情報の取得を要求する取得要求を受信し、分析装置42から結果情報を受信する。格納部432は、種々の情報を格納する。 The communication unit 431 is connected to each device on the network 100. The communication unit 431 receives, for example, an acquisition request requesting acquisition of target information from the user terminal 30, and receives result information from the analyzer 42. The storage unit 432 stores various information.

提供部433は、通信部431が受信した結果情報に基づいて表示データを生成する生成部である。具体的には、提供部433は、通信部431が受信した結果情報を格納部432に格納する。提供部433は、通信部431が取得要求を受信すると、格納部432に格納した結果情報に基づいて、取得要求に応じた表示データを生成して利用者端末30に送信する。 The providing unit 433 is a generating unit that generates display data based on the result information received by the communication unit 431. Specifically, the providing unit 433 stores the result information received by the communication unit 431 in the storage unit 432. When the communication unit 431 receives the acquisition request, the providing unit 433 generates display data corresponding to the acquisition request based on the result information stored in the storage unit 432 and transmits the display data to the user terminal 30.

具体的には、提供部433は、格納部432から、取得要求内の検索条件に合致するターゲット情報(ターゲット説明情報がターゲット情報とは別の情報として存在する場合は、ターゲット説明情報を検索範囲に含めてもよい)と、そのターゲット情報に対応する特定語句および補正度数を取得し、取得したターゲット情報、特定語句および補正度数に基づいて表示データを生成する。 Specifically, the providing unit 433 searches the storage unit 432 for the target information that matches the search condition in the acquisition request (if the target description information exists as information different from the target information, the target description information is searched. (May be included in), the specific phrase and correction frequency corresponding to the target information are acquired, and display data is generated based on the acquired target information, specific phrase and correction frequency.

例えば、提供部433は、ターゲット情報に対応するターゲットの名称と、そのターゲット情報に対応する特定語句のうち補正度数が所定の表示条件を満たす特定語句とを対応付けたデータを表示データとして生成する。所定の表示条件を満たす特定語句は、具体的には、補正度数が高い特定語句である高頻出語句である。高頻出語句は、補正度数が高い方から既定数分の特定語句でもよいし、補正度数が既定度数以上の特定語句でもよい。また、特定の使用状況(例えば、好意的状況)に対応する補正度数が高い特定語句を高頻出語句としてもよい。なお、ターゲット情報と高頻出語句との対応付けは、同じ表示データ内にターゲット情報と高頻出語句との対応付けたものでもよいし、複数の表示データにおいて互いにリンクを介して対応づけられたものでもよい。 For example, the providing unit 433 generates data as display data in which the name of the target corresponding to the target information and the specific word / phrase corresponding to the target information whose correction frequency satisfies a predetermined display condition are associated with each other. .. Specifically, the specific phrase satisfying a predetermined display condition is a highly frequent phrase that is a specific phrase having a high correction frequency. The high-frequency phrase may be a specific phrase for a predetermined number from the one with the highest correction frequency, or may be a specific phrase for which the correction frequency is equal to or higher than the default frequency. In addition, a specific phrase having a high correction frequency corresponding to a specific usage situation (for example, a favorable situation) may be regarded as a high frequency phrase. It should be noted that the association between the target information and the frequently-used words may be the association between the target information and the frequently-used words in the same display data, or the multiple display data are associated with each other via a link. It may be.

また、提供部433は、利用者端末30による表示データに対する操作に応じて、特定語句の補正度数および表示データの少なくとも一方を調整してもよい。 Further, the providing unit 433 may adjust at least one of the correction frequency of the specific phrase and the display data according to the operation on the display data by the user terminal 30.

また、提供部433は、利用者端末30に送信する利用者向けの表示データとは別に、ターゲットを提供する提供者向けの表示データを生成してもよい。この場合、提供部433は、例えば、所定の生成タイミングで表示データを生成して、提供者が使用する提供者端末(図示せず)に提供する。生成タイミングは、一定の時間間隔ごとでもよいし、分析システム40の管理者や提供者端末などから指示があったタイミングなどでもよい。 Further, the providing unit 433 may generate display data for the provider who provides the target, in addition to the display data for the user transmitted to the user terminal 30. In this case, the providing unit 433 generates, for example, display data at a predetermined generation timing and provides the display data to the provider terminal (not shown) used by the provider. The generation timing may be at regular time intervals, or may be the timing instructed by the administrator of the analysis system 40, the provider terminal, or the like.

以下、表示データの具体例について説明する。 A specific example of the display data will be described below.

(表示データの第1の具体例)
図3は、表示データが利用者端末30に表示された際の第1の具体例を示す図である。図3の例の場合、提供部433は、先ず、図3(a)に示す表示データ500を生成して利用者端末30に送信する。表示データ500は、提供部433が取得したターゲット情報の一覧を示す一覧情報501を含む。一覧情報501内の各ターゲット情報502a〜502cは、宿泊施設に関する宿情報(ここでは、宿の名称、宿の説明を含む)であり、そのターゲット情報内のクチコミ情報において補正度数が高い高頻出語句503が対応付けられている。
(First specific example of display data)
FIG. 3 is a diagram showing a first specific example when the display data is displayed on the user terminal 30. In the case of the example of FIG. 3, the providing unit 433 first generates the display data 500 shown in FIG. 3A and transmits it to the user terminal 30. The display data 500 includes list information 501 showing a list of target information acquired by the providing unit 433. Each target information 502a to 502c in the list information 501 is inn information related to the accommodation facility (here, the name of the inn and the description of the inn are included), and the word-of-mouth information in the target information has a high correction frequency. 503 is associated with it.

高頻出語句503のそれぞれには、対応するターゲット情報内のクチコミ情報のうち、その高頻出語句503を含むクチコミ情報へのリンクが張られている。利用者端末30にて高頻出語句503(リンク)が選択された場合、提供部433は、図3(b)に示す表示データ510を生成して利用者端末30に送信する。表示データ510は、選択された高頻出語句のリンク先のクチコミ情報511を含む。図3(b)は、ターゲット情報502cにおける高頻出語句503「ラーメン」が選択され、ターゲット情報502cに対応する宿のクチコミ情報のうち、高頻出語句503「ラーメン」が含まれるクチコミ情報が利用者端末30に送信され、利用者端末30にて表示された例が示されている。 Each of the high-frequency phrase 503 has a link to the word-of-mouth information including the high-frequency phrase 503 among the word-of-mouth information in the corresponding target information. When the frequently-used phrase 503 (link) is selected on the user terminal 30, the providing unit 433 generates the display data 510 shown in FIG. 3B and transmits it to the user terminal 30. The display data 510 includes the word-of-mouth information 511 of the link destination of the selected high-frequency phrase. In FIG. 3B, the high-frequency phrase 503 “ramen” in the target information 502c is selected, and among the word-of-mouth information of the inn corresponding to the target information 502c, the word-of-mouth information including the high-frequency phrase 503 “ramen” is used by the user. An example of being transmitted to the terminal 30 and displayed on the user terminal 30 is shown.

表示データ510の各クチコミ情報511には、選択された高頻出語句512が含まれる。クチコミ情報511では、選択された高頻出語句512を強調表示する処理が提供部433にて施されている。図の例では、高頻出語句512を太字表示することで強調しているが、強調方法は、この例に限らず、例えば、拡大表示や網掛け表示などの他の方法でもよい。なお、選択された高頻出語句512に加えて、他の高頻出語句が強調されてもよい。その際、選択された高頻出語句512と他の高頻出語句の強調方法を変えることで、選択された高頻出語句512を判別可能にしてもよい。 Each word-of-mouth information 511 of the display data 510 includes the selected high-frequency phrase 512. In the word-of-mouth information 511, the providing unit 433 performs a process of highlighting the selected frequently-used phrase 512. In the example of the figure, the high-frequency phrase 512 is emphasized by displaying it in bold, but the emphasizing method is not limited to this example, and other methods such as enlarged display and shaded display may be used. In addition to the selected high-frequency phrase 512, other high-frequency phrases may be emphasized. At that time, the selected high-frequency phrase 512 may be discriminated by changing the method of emphasizing the selected high-frequency phrase 512 and other high-frequency phrases.

(表示データの第2の具体例)
図4は、表示データが利用者端末30に表示された際の第2の具体例を示す図である。図4に示す表示データ500aは、図3(a)に示す表示データ500と比べて、高頻出語句503の表示方法が異なっている。
(Second specific example of display data)
FIG. 4 is a diagram showing a second specific example when the display data is displayed on the user terminal 30. The display data 500a shown in FIG. 4 is different from the display data 500 shown in FIG. 3A in the display method of the high-frequency phrase 503.

提供部433は、表示データ500aにおけるターゲット情報502bの高頻出語句503に、高頻出語句503の使用状況を示す状況情報504を対応付けしている。図4の例では、表示データ500aが利用者端末30に送信され、利用者端末30により、状況情報504が、高頻出語句503に使用状況に応じた網で示されて、利用者端末30にて表示される。具体的には、高頻出語句503を抽出する際に、制御部423にて、好意的状況と否定的状況とに区別されて出現度数が算出され、補正度数が算出されており、高頻出語句503が示されている枠内における網がかかっている領域の大きさと網がかかっていない領域の大きさの比が好意的状況の補正度数と否定的状況の補正度数の比となるように、表示データ500aは提供部433にて作成されている。また。状況情報504は、例えば、使用状況を濃淡で表してもよい。なお、第2の具体例の場合、制御部423は、特定語句の好意的状況と否定的状況との各出現度数からそれぞれ補正度数を算出し、算出後の好意的状況と否定的状況との各補正度数の割合から補正度数の比を算出してもよいが、特定語句の好意的状況と否定的状況との出現度数の割合を記憶しておき、好意的状況と否定的状況の出現度数の合計した値を基に、補正度数を算出し、当該出現度数の割合を補正度数の比としてもよい。 The providing unit 433 associates the high-frequency word phrase 503 of the target information 502b in the display data 500a with the situation information 504 indicating the usage status of the high-frequency word phrase 503. In the example of FIG. 4, the display data 500a is transmitted to the user terminal 30, and the status information 504 is indicated by the high-frequency phrase 503 in a network according to the usage status to the user terminal 30. Is displayed. Specifically, when extracting the high-frequency phrase 503, the control unit 423 calculates the appearance frequency and the correction frequency by distinguishing between the favorable situation and the negative situation, and the high-frequency phrase is calculated. So that the ratio of the size of the shaded area to the size of the non-shaded area within the frame shown by 503 is the ratio of the correction power of the positive situation to the correction power of the negative situation. The display data 500a is created by the providing unit 433. Also. The status information 504 may, for example, represent the usage status in shades. In the case of the second specific example, the control unit 423 calculates the correction frequency from each appearance frequency of the favorable situation and the negative situation of the specific phrase, and determines the positive situation and the negative situation after the calculation. The ratio of the correction frequency may be calculated from the ratio of each correction frequency, but the ratio of the appearance frequency of the favorable situation and the negative situation of a specific phrase is memorized, and the appearance frequency of the favorable situation and the negative situation is stored. The correction frequency may be calculated based on the total value of, and the ratio of the appearance frequency may be used as the ratio of the correction frequency.

(表示データの第3の具体例)
図5は、表示データが利用者端末30に表示された際の第3の具体例を示す図である。図5の例の場合、提供部433は、先ず、図5(a)に示す表示データ600を生成して利用者端末30に送信する。表示データ600は、比較クチコミ情報内の各ターゲット情報に含まれる高頻出語句601が、提供部433により抽出され、抽出された高頻出語句601の一覧を示す語句一覧情報602を含めて作成される。提供部433は、高頻出語句601に、その高頻出語句601を含むクチコミ情報を有するターゲット情報へのリンクを張る。高頻出語句601(リンク)が利用者端末30にて選択された場合、提供部433は、図5(b)に示す表示データ610を生成して利用者端末30に送信する。図5(b)は、高頻出語句601「ラーメン」が選択され、各ターゲット情報に対応する宿のクチコミ情報のうち、語句「ラーメン」が高頻出語句として抽出されたクチコミ情報を有するターゲット情報の一覧が提供部433により作成され、その一覧が利用者端末30に送信されて表示された例が示されている。
(Third specific example of display data)
FIG. 5 is a diagram showing a third specific example when the display data is displayed on the user terminal 30. In the case of the example of FIG. 5, the providing unit 433 first generates the display data 600 shown in FIG. 5A and transmits it to the user terminal 30. The display data 600 is created by including the phrase list information 602 showing a list of the frequently-used phrases 601 extracted by the providing unit 433 from the frequently-used phrases 601 included in each target information in the comparative word-of-mouth information. .. The providing unit 433 links the high-frequency phrase 601 to the target information having the word-of-mouth information including the high-frequency phrase 601. When the high-frequency phrase 601 (link) is selected on the user terminal 30, the providing unit 433 generates the display data 610 shown in FIG. 5B and transmits it to the user terminal 30. In FIG. 5B, the high-frequency phrase 601 “ramen” is selected, and among the word-of-mouth information of the inn corresponding to each target information, the target information having the word-of-mouth information in which the phrase “ramen” is extracted as the high-frequency phrase. An example is shown in which a list is created by the providing unit 433, and the list is transmitted to the user terminal 30 and displayed.

表示データ610は、選択された高頻出語句601を含むクチコミ情報を有するターゲット情報の一覧を示す一覧情報611を含む。一覧情報611内の各ターゲット情報612は、図3に示したターゲット情報502a〜502cと同様に、高頻出語句613を含み、高頻出語句613には、その高頻出語句613を含むクチコミ情報へのリンクが張られている。 The display data 610 includes list information 611 showing a list of target information having word-of-mouth information including the selected high-frequency phrase 601. Like the target information 502a to 502c shown in FIG. 3, each target information 612 in the list information 611 includes a high-frequency phrase 613, and the high-frequency phrase 613 includes word-of-mouth information including the high-frequency phrase 613. There is a link.

(表示データの第4の具体例)
第4の具体例では、提供部433は、表示データとして図5(a)に示す表示データ600を生成する際に、語句一覧情報602に含ませる高頻出語句601を、利用者の属性情報に応じて決定する。属性情報は、利用者端末30からの取得要求に含まれる。属性情報は、例えば、宿泊施設の利用者の年齢、人数、種別(大人または子供など)および性別などを示す。
(Fourth specific example of display data)
In the fourth specific example, when the providing unit 433 generates the display data 600 shown in FIG. 5A as the display data, the frequently-used phrase 601 included in the phrase list information 602 is used as the attribute information of the user. Decide accordingly. The attribute information is included in the acquisition request from the user terminal 30. The attribute information indicates, for example, the age, number of people, type (adult or child, etc.) and gender of the users of the accommodation facility.

具体的には、クチコミ情報に対して予めカテゴリ情報を対応付けておき、分析装置42の制御部423が結果情報を生成する際に、抽出した特定語句に、その特定語句を抽出したクチコミ情報のカテゴリ情報を対応付ける。カテゴリ情報は、例えば、ファミリー、カップル、男子旅、女子旅、一人旅または団体旅行などを示す。なお、カテゴリ情報はターゲットの種類に応じて変更される。例えば、ターゲットが物件の場合、カテゴリ情報は、ファミリー、一人暮らし、一戸建てまたはマンションなどとなる。 Specifically, the category information is associated with the word-of-mouth information in advance, and when the control unit 423 of the analyzer 42 generates the result information, the word-of-mouth information extracted from the specific words and phrases extracted. Associate category information. The category information indicates, for example, a family, a couple, a boy's trip, a girl's trip, a solo trip or a group trip. The category information is changed according to the type of target. For example, if the target is a property, the category information will be family, living alone, detached house or condominium.

提供部433は、高頻出語句から、利用者の属性情報に合致したカテゴリ情報が対応付けられた語句を選択し、その選択した語句を示す語句一覧情報602を含む表示データ600を生成する。このとき、属性情報とカテゴリ情報との対応関係を示す情報を格納部432に予め格納しておき、提供部433は、属性情報に対応するカテゴリ情報を、属性情報に合致したカテゴリ情報と判断する。例えば、提供部433は、属性情報が「大人二人、子供三人」のように「大人」と「子供」の両方を含んでいる場合、カテゴリ情報として「ファミリー」を選択する。さらに提供部433は、カテゴリ情報「ファミリー」に対応付けられた語句「アイスクリーム」、「ラーメン」などを選択し、その選択された「アイスクリーム」、「ラーメン」などの語句一覧情報602を生成して利用者端末30に送信する。語句一覧情報602内の語句が利用者端末30にて選択された場合の処理は、第3の具体例と同様である。 The providing unit 433 selects a phrase associated with the category information matching the attribute information of the user from the frequently-used phrases, and generates display data 600 including the phrase list information 602 indicating the selected phrase. At this time, information indicating the correspondence between the attribute information and the category information is stored in advance in the storage unit 432, and the providing unit 433 determines that the category information corresponding to the attribute information is the category information matching the attribute information. .. For example, the providing unit 433 selects "family" as the category information when the attribute information includes both "adult" and "child" such as "two adults and three children". Further, the providing unit 433 selects words such as "ice cream" and "ramen" associated with the category information "family", and generates word list information 602 such as the selected words "ice cream" and "ramen". And send it to the user terminal 30. The processing when the word in the word list information 602 is selected by the user terminal 30 is the same as that in the third specific example.

(表示データの第5の具体例)
第5の具体例は、提供部433が利用者端末30の操作に応じて特定語句の補正度数および表示データの少なくとも一方を調整する例である。
(Fifth specific example of display data)
A fifth specific example is an example in which the providing unit 433 adjusts at least one of the correction frequency and the display data of the specific phrase according to the operation of the user terminal 30.

例えば、提供部433は、表示データとして、ターゲットに対する注文処理を行うことが可能なWebサイトである注文サイトへのリンクを含むデータを生成する。このような表示データとしては、例えば、図3(a)に示した表示データ500の各ターゲット情報502a〜502cに、そのターゲット情報に対応するターゲットに対する予約処理を行うことが可能な注文サイトへのリンクを張ったものである。 For example, the providing unit 433 generates data including a link to an ordering site, which is a website capable of performing order processing for the target, as display data. As such display data, for example, to an ordering site capable of performing reservation processing for the targets corresponding to the target information 502a to 502c of the display data 500 shown in FIG. 3A. It is a link.

提供部433は、利用者端末30による表示データに対する操作を監視して、利用者端末30による表示データの表示履歴を示す履歴情報を取得する。そして利用者端末30の表示データから注文サイトへの移動を検知すると、提供部433は、履歴情報に基づいて、表示データおよび補正度数の少なくとも一方を調整する。 The providing unit 433 monitors the operation on the display data by the user terminal 30 and acquires the history information indicating the display history of the display data by the user terminal 30. Then, when the movement from the display data of the user terminal 30 to the ordering site is detected, the providing unit 433 adjusts at least one of the display data and the correction frequency based on the history information.

例えば、提供部433は、履歴情報として、表示データの表示中にどの高頻出語句が選択されたかの選択履歴を取得し、表示データから注文サイトへの移動を検知すると、その利用者端末30の選択履歴にて、直前に選択された高頻出語句をカウントし、一定期間中に、注文サイトへの移動直前に選択された高頻出語句の選択回数の積に応じて、高頻出語句の補正度数を調整したり、表示データに含まれる高頻出語句の強調方法を調整したりする。例えば、各利用者端末30にて注文サイトへの移動する10分前に選択された高頻出語句をカウントし、1週間の間に、選択回数が既定回数以上になった高頻出語句が発生した場合、提供部433は、その高頻出語句の補正度数を高くするか、または、その高頻出語句を他の語句よりも目立つように強調して表示する。また、提供部433は、履歴情報として、高頻出語句を含む表示データの表示時間を取得してもよい。この場合、例えば、各利用者端末30にて高頻出語句の表示された表示時間をカウントし、表示時間の積が既定時間以上になった高頻出語句が発生した場合、提供部433は、その高頻出語句の補正度数を高くするか、または、その高頻出語句を他の語句よりも目立つように強調して表示する。 For example, the providing unit 433 acquires the selection history of which frequently-used phrase is selected during the display of the display data as the history information, and when it detects the movement from the display data to the ordering site, the user terminal 30 selects the user terminal 30. In the history, the frequently-used words selected immediately before are counted, and the correction frequency of the frequently-used words is calculated according to the product of the number of times the frequently-used words selected immediately before moving to the ordering site are selected during a certain period. Adjust or adjust the method of emphasizing frequently-used words contained in the display data. For example, the frequently-used words and phrases selected 10 minutes before moving to the ordering site are counted on each user terminal 30, and the frequently-used words and phrases selected more than the predetermined number of times occur in one week. In this case, the providing unit 433 increases the correction frequency of the frequently-used phrase, or emphasizes and displays the frequently-used phrase so as to stand out more than other words. Further, the providing unit 433 may acquire the display time of the display data including the frequently-used words and phrases as the history information. In this case, for example, when the display time of the frequently-used words and phrases displayed on each user terminal 30 is counted and the product of the display times exceeds the predetermined time, the providing unit 433 determines the display time. Increase the correction frequency of high-frequency words, or emphasize the high-frequency words so that they stand out more than other words.

(表示データの第6の具体例)
第6の具体例は、第5の具体例と同様に、提供部433が利用者端末30の操作に応じて特定語句の補正度数および表示データの少なくとも一方を調整する例である。具体的には、提供部433は、表示データに含まれる高頻出語句に対する利用者端末30による所定の操作を検出し、その所定の操作に応じて特定語句の補正度数および表示データの少なくとも一方を調整する
(Sixth specific example of display data)
The sixth specific example is an example in which the providing unit 433 adjusts at least one of the correction frequency and the display data of the specific phrase according to the operation of the user terminal 30, as in the fifth specific example. Specifically, the providing unit 433 detects a predetermined operation by the user terminal 30 for a frequently-used phrase included in the display data, and adjusts at least one of the correction frequency and the display data of the specific phrase according to the predetermined operation. adjust

図6は、表示データの第6の具体例を示す図である。図6(a)に示す注文サイト700のように、ターゲットの注文時に、その注文の参考にした高頻出語句を選択する選択機能701が備わっている場合、提供部433は、注文サイト700において利用者端末30が高頻出語句を選択する操作を所定の操作として検出し、その所定の操作にて選択された高頻出語句に基づいて、表示データおよび補正度数の少なくとも一方を調整する。 FIG. 6 is a diagram showing a sixth specific example of display data. When the target ordering site 700 as shown in FIG. 6A is provided with the selection function 701 for selecting the frequently-used words and phrases referred to in the target order, the providing unit 433 is used at the ordering site 700. The user terminal 30 detects an operation of selecting a high-frequency phrase as a predetermined operation, and adjusts at least one of the display data and the correction frequency based on the high-frequency phrase selected by the predetermined operation.

例えば、提供部433は、各利用者端末30の所定の操作において高頻出語句が選択された選択回数を一定期間カウントし、その選択回数に基づいて、高頻出語句の補正度数を調整する。例えば、各利用者端末30にて選択された高頻出語句の選択回数を1カ月間カウントし、選択回数が既定回数以上になった高頻出語句が発生した場合、提供部433は、その高頻出語句の補正度数を高くするか、または、その高頻出語句を他の語句よりも目立つように強調して表示する。また、提供部433は、図6(b)に示す表示データ710ように、表示データ710内の高頻出語句711に対して、その高頻出語句が選択された選択回数712を対応付けてもよい。 For example, the providing unit 433 counts the number of times a high-frequency phrase is selected in a predetermined operation of each user terminal 30 for a certain period of time, and adjusts the correction frequency of the high-frequency phrase based on the number of selections. For example, when the number of selections of a high-frequency phrase selected on each user terminal 30 is counted for one month and a high-frequency phrase occurs in which the number of selections exceeds the predetermined number, the providing unit 433 will perform the high-frequency occurrence. Increase the correction frequency of the phrase, or emphasize the frequently-used phrase so that it stands out more than other phrases. Further, the providing unit 433 may associate the high-frequency phrase 711 in the display data 710 with the number of selections 712 in which the high-frequency phrase is selected, as in the display data 710 shown in FIG. 6 (b). ..

(表示データの第7の具体例)
図7は、提供部433が作成した表示データが表示された際の第7の具体例を示す図である。図7に示す表示データ800は、提供者向けの表示データの一例である。
(7th specific example of display data)
FIG. 7 is a diagram showing a seventh specific example when the display data created by the providing unit 433 is displayed. The display data 800 shown in FIG. 7 is an example of display data for the provider.

提供部433は、表示データ800を、特定の提供者が提供するターゲットである提供ターゲットに関する自社情報800aと、提供ターゲットと分析区分が同じ他のターゲットに関する競合他社情報800bとを含めて作成する。自社情報は、提供部433により、提供ターゲットにおいて抽出した高頻出語句801と、その高頻出語句801を含む提供ターゲットに関するクチコミ情報802とを有して作成される情報である。競合他社情報800bは、提供部433により、提供ターゲットと分析区分が同じ他のターゲットにおける高頻出語句803がターゲットごとに抽出され、抽出された高頻出語句803が各々のターゲットごとに対応付けられて表示される情報である。提供部433は作成した表示データを、所定のタイミングで提供者が使用する提供者端末(図示せず)に提供する。 The provision unit 433 creates the display data 800 including the company information 800a regarding the provision target which is the target provided by the specific provider and the competitor information 800b regarding the other target whose analysis category is the same as the provision target. The company information is information created by the provision unit 433 having the highly frequent words 801 extracted in the provision target and the word-of-mouth information 802 regarding the provision target including the high frequency words 801. In the competitor information 800b, the providing unit 433 extracts high-frequency words 803 in other targets having the same analysis category as the provided target for each target, and the extracted high-frequency words 803 are associated with each target. This is the information to be displayed. The providing unit 433 provides the created display data to the provider terminal (not shown) used by the provider at a predetermined timing.

次に動作を説明する。 Next, the operation will be described.

図8は、情報提供システム1の動作を説明するためのシーケンス図である。 FIG. 8 is a sequence diagram for explaining the operation of the information providing system 1.

先ず、収集装置41の収集部413は、所定の収集タイミングになると、伝送部411を介してWebサーバ10とターゲット情報格納装置20との少なくとも1つと接続し、接続したWebサーバ10または、ターゲット情報格納装置20からターゲット情報を収集する(ステップS101)。収集タイミングは、一定の時間間隔ごとでもよいし、分析システム40の管理者から指示があったタイミングでもよい。 First, the collection unit 413 of the collection device 41 connects to at least one of the Web server 10 and the target information storage device 20 via the transmission unit 411 at a predetermined collection timing, and the connected Web server 10 or the target information. Target information is collected from the storage device 20 (step S101). The collection timing may be at regular time intervals or may be the timing instructed by the administrator of the analysis system 40.

収集部413は、収集した各ターゲット情報に対して区分情報とターゲット識別情報とを生成し、ターゲット情報と区分情報とをターゲット識別情報ごと対応付けた収集情報を蓄積部412に蓄積する(ステップS102)。 The collection unit 413 generates classification information and target identification information for each collected target information, and stores the collection information in which the target information and the classification information are associated with each target identification information in the storage unit 412 (step S102). ).

その後、分析装置42の制御部423は、接続部421を介して収集装置41と接続して、収集装置41に蓄積された収集情報を取得し(ステップS103)、その収集情報内の各ターゲット情報から特定語句を抽出する(ステップS104)。制御部423は、収集情報内の各ターゲット識別情報が識別する各ターゲットについて、特定語句ごとに、そのターゲットである対象ターゲットに関するクチコミ情報において特定語句が出現する出現度数を算出する(ステップS105)。制御部423は、各ターゲットについて、特定語句ごとに、その特定語句の出現度数を比較クチコミ情報において特定語句が出現する比較度数に基づいて補正した補正度数を算出する(ステップS106)。 After that, the control unit 423 of the analyzer 42 connects to the collection device 41 via the connection unit 421 to acquire the collection information accumulated in the collection device 41 (step S103), and each target information in the collection information. A specific phrase is extracted from (step S104). The control unit 423 calculates the frequency of appearance of a specific word in the word-of-mouth information about the target target, which is the target, for each specific word for each target identified by each target identification information in the collected information (step S105). For each target, the control unit 423 calculates the correction frequency obtained by correcting the appearance frequency of the specific word for each specific word based on the comparison frequency in which the specific word appears in the comparative word-of-mouth information (step S106).

制御部423は、ターゲット識別情報ごとに、ターゲット情報と特定語句と補正度数とを対応付けた結果情報を生成して、接続部421を介して提供装置43に出力する(ステップS107)。提供装置43の通信部431が結果情報を受信すると、提供部433は、その結果情報を格納部432に格納する(ステップS108)。 The control unit 423 generates result information in which the target information, the specific phrase, and the correction frequency are associated with each target identification information, and outputs the result information to the providing device 43 via the connection unit 421 (step S107). When the communication unit 431 of the providing device 43 receives the result information, the providing unit 433 stores the result information in the storage unit 432 (step S108).

その後、通信部431が利用者端末30から取得要求を受信すると(ステップS109)、提供部433は、格納部432に格納した結果情報に基づいて、取得要求に応じた表示データを生成して利用者端末30に送信する。利用者端末30は、表示データを受信すると、その表示データを表示する(ステップS110)。 After that, when the communication unit 431 receives the acquisition request from the user terminal 30 (step S109), the providing unit 433 generates and uses the display data corresponding to the acquisition request based on the result information stored in the storage unit 432. It is transmitted to the user terminal 30. When the user terminal 30 receives the display data, the user terminal 30 displays the display data (step S110).

以上説明したように本実施形態によれば、蓄積部412は、ターゲットに関するターゲット情報をターゲットごとに蓄積する。制御部423は、各ターゲットについて、そのターゲットである対象ターゲットに関するターゲット情報において特定語句が出現する出現度数を、他のターゲットに関するターゲット情報を含む比較クチコミ情報において特定語句が出現する比較度数に基づいて補正した補正度数を算出する。提供部433は、ターゲット情報、特定語句および補正度数に応じた表示データを生成する。 As described above, according to the present embodiment, the storage unit 412 stores target information regarding the target for each target. For each target, the control unit 423 determines the frequency of appearance of a specific word in the target information about the target target, which is the target, based on the frequency of appearance of the specific word in the comparative word-of-mouth information including the target information of other targets. Calculate the corrected correction frequency. The providing unit 433 generates display data according to the target information, the specific phrase, and the correction frequency.

したがって、ターゲット情報において特定語句が出現する出現度数が、他のターゲットに関するターゲット情報を含む比較クチコミ情報において特定語句が出現する比較度数に基づいて補正され、ターゲット情報、特定語句および補正度数に応じた表示データが生成される。このため、複数のターゲットに対して同じ特定語句が出現する場合でも、ターゲット間の特定語句の出現頻度の違いなどに応じた表示データを生成することが可能になる。したがって、ターゲットの特徴を表す表示データを生成することが可能になるため、ターゲットの特徴を容易に把握することが可能になる。 Therefore, the frequency of occurrence of a specific word in the target information is corrected based on the frequency of appearance of the specific word in the comparative word-of-mouth information including the target information about other targets, and is adjusted according to the target information, the specific word, and the correction frequency. Display data is generated. Therefore, even when the same specific phrase appears for a plurality of targets, it is possible to generate display data according to the difference in the appearance frequency of the specific phrase between the targets. Therefore, since it is possible to generate display data representing the characteristics of the target, it is possible to easily grasp the characteristics of the target.

また、本実施形態では、制御部423は、特定語句の出現度数として、特定語句を含むクチコミ情報の数を算出する。このため、表示データに利用者によるターゲットの評価をターゲットの特徴として反映しやすくすることが可能になり、ターゲットの特徴をより容易に把握することが可能になる。 Further, in the present embodiment, the control unit 423 calculates the number of word-of-mouth information including the specific phrase as the frequency of appearance of the specific phrase. Therefore, it becomes possible to easily reflect the evaluation of the target by the user in the display data as the characteristics of the target, and it becomes possible to more easily grasp the characteristics of the target.

また、本実施形態では、比較クチコミ情報は、対象ターゲットと分析区分が同じターゲットに関するターゲット情報である。このため、比較対象を適切に選択することが可能になるため、出現度数の補正にターゲットの特徴をより適切に反映させることが可能になる。したがって、ターゲットの特徴をより容易に把握することが可能になる。 Further, in the present embodiment, the comparative word-of-mouth information is target information relating to a target having the same analysis category as the target target. Therefore, since it is possible to appropriately select the comparison target, it is possible to more appropriately reflect the characteristics of the target in the correction of the appearance frequency. Therefore, it becomes possible to grasp the characteristics of the target more easily.

また、本実施形態では、制御部423は、比較度数に対する出現度数の突出度合いを示す特徴度を算出し、特徴度に基づいて出現度数を補正する。このため、特定語句の出現度数の突出度合いは特定語句の特徴を表すため、出現度数の補正にターゲットの特徴をより適切に反映させることが可能になる。したがって、ターゲットの特徴をより容易に把握することが可能になる。 Further, in the present embodiment, the control unit 423 calculates the characteristic degree indicating the degree of protrusion of the appearance frequency with respect to the comparative frequency, and corrects the appearance frequency based on the characteristic degree. Therefore, since the degree of protrusion of the appearance frequency of the specific word represents the characteristic of the specific word, it is possible to more appropriately reflect the characteristic of the target in the correction of the appearance frequency. Therefore, it becomes possible to grasp the characteristics of the target more easily.

また、本実施形態では、提供部433は、ターゲット情報と、そのターゲット情報に対応する特定語句のうち補正度数が所定の表示条件を満たす特定語句とを対応付けたデータを表示データとして生成する。このため、特定語句のうち補正度数が高い高頻出語句のようなターゲットの特徴を反映した語句をターゲット情報に対応づけて表示することが可能になるため、ターゲットの特徴をより容易に把握することが可能になる。 Further, in the present embodiment, the providing unit 433 generates data as display data in which the target information and the specific word / phrase corresponding to the target information in which the correction frequency satisfies a predetermined display condition are associated with each other. For this reason, it is possible to display words and phrases that reflect the characteristics of the target, such as high-frequency words and phrases with a high correction frequency, in association with the target information, so that the characteristics of the target can be grasped more easily. Becomes possible.

また、本実施形態では、提供部433は、利用者端末30による表示データに対する操作に応じて、特定語句の補正度数および表示データの少なくとも一方を調整する。このため、他の利用者が興味を持った特定語句などを表示データに反映させることが可能になるため、ターゲットの特徴をより容易に把握することが可能になる。 Further, in the present embodiment, the providing unit 433 adjusts at least one of the correction frequency and the display data of the specific phrase according to the operation on the display data by the user terminal 30. Therefore, it becomes possible to reflect specific words and phrases that other users are interested in in the display data, and it becomes possible to more easily grasp the characteristics of the target.

以上説明した各実施形態において、図示した構成は単なる一例であって、本発明はその構成に限定されるものではない。 In each of the embodiments described above, the illustrated configuration is merely an example, and the present invention is not limited to that configuration.

例えば、ターゲットとして主に宿泊施設を用いて説明したが、ターゲットは宿泊施設に限らない。また、分析システム40は、複数種類のターゲット(例えば、宿泊施設と飲食店など)に関するターゲット情報を分析してもよい。この場合、区分情報に、ターゲットの種類を示す種類情報を加えることで、種類ごとに適切な分析を行うことができる。 For example, although the description mainly uses accommodation facilities as a target, the target is not limited to accommodation facilities. In addition, the analysis system 40 may analyze target information regarding a plurality of types of targets (for example, accommodation facilities and restaurants). In this case, by adding the type information indicating the type of the target to the classification information, an appropriate analysis can be performed for each type.

また、分析システム40の構成は適宜変更可能である。例えば、蓄積部412、記憶部422および格納部432は、同一の記憶装置にて実現されてもよい。収集情報は、分析システム40の管理者などから収集装置41に直接登録されてもよい。 Further, the configuration of the analysis system 40 can be changed as appropriate. For example, the storage unit 412, the storage unit 422, and the storage unit 432 may be realized by the same storage device. The collected information may be directly registered in the collecting device 41 by the administrator of the analysis system 40 or the like.

また、情報提供システム1の各装置の機能は、その機能を実現するためのプログラムを、コンピュータにて読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータに読み込ませ実行させることで、実現されてもよい。 Further, as for the function of each device of the information providing system 1, a program for realizing the function is recorded on a recording medium readable by a computer, and the program recorded on the recording medium is read and executed by the computer. It may be realized by making it.

1 情報提供システム
10 Webサーバ
20 ターゲット情報格納装置
30 利用者端末
40 分析システム
41 収集装置
42 分析装置
43 提供装置
411 伝送部
412 蓄積部
413 収集部
421 接続部
422 記憶部
423 制御部
431 通信部
432 格納部
433 提供部
1 Information provision system 10 Web server 20 Target information storage device 30 User terminal 40 Analysis system 41 Collection device 42 Analysis device 43 Providing device 411 Transmission unit 412 Storage unit 413 Collection unit 421 Connection unit 422 Storage unit 423 Control unit 431 Communication unit 432 Storage unit 433 Provision unit

Claims (9)

ターゲットに関するターゲット情報を前記ターゲットごとに蓄積する蓄積部と、
各ターゲットについて、当該ターゲットである対象ターゲットに関するターゲット情報において特定語句が出現する出現度数を、他のターゲットに関するターゲット情報を含む比較ターゲット情報において前記特定語句が出現する比較度数に基づいて補正した補正度数を算出する制御部と、
前記ターゲット情報、前記特定語句および前記補正度数に応じた表示データを生成する生成部と、を有し、
前記蓄積部は、前記ターゲット情報と前記ターゲットの分析区分を示す区分情報とを前記ターゲットごとに蓄積し、
前記比較ターゲット情報は、前記対象ターゲットと前記分析区分が同じターゲットに関するターゲット情報である、情報分析システム。
A storage unit that stores target information about the target for each target,
For each target, the correction frequency in which the specific word appears in the target information related to the target target is corrected based on the comparison frequency in which the specific word appears in the comparison target information including the target information related to other targets. And the control unit that calculates
Have a, a generation unit for generating display data corresponding to the target information, the specific terms and the correction frequency,
The storage unit stores the target information and the classification information indicating the analysis classification of the target for each target.
The comparison target information is an information analysis system in which the target target and the target information having the same analysis category are the target information .
前記ターゲット情報は、複数の分析対象情報を含み、
前記制御部は、前記特定語句を含む前記分析対象情報の数を前記出現度数として算出する、請求項1に記載の情報分析システム。
The target information includes a plurality of analysis target information.
The information analysis system according to claim 1, wherein the control unit calculates the number of analysis target information including the specific phrase as the frequency of occurrence.
前記分析対象情報は、前記ターゲットに対する評価を示す評価情報である、請求項2に記載の情報分析システム。 The information analysis system according to claim 2, wherein the analysis target information is evaluation information indicating an evaluation of the target. 前記制御部は、前記比較度数に対する前記出現度数の突出度合いを示す特徴度を算出し、前記特徴度に基づいて前記出現度数を補正する、請求項1ないしのいずれか1項に記載の情報分析システム。 The information according to any one of claims 1 to 3 , wherein the control unit calculates a characteristic degree indicating the degree of protrusion of the appearance frequency with respect to the comparative frequency, and corrects the appearance frequency based on the characteristic degree. Analysis system. 前記制御部は、前記特定語句のうち、所定数以上の各ターゲットに関するターゲット情報に共通した共通語句の出現度数を補正する、請求項1ないしのいずれか1項に記載の情報分析システム。 The information analysis system according to any one of claims 1 to 4 , wherein the control unit corrects the frequency of appearance of common words common to target information related to a predetermined number or more of the specific words. 前記生成部は、前記ターゲット情報と、当該ターゲット情報に含まれる前記特定語句のうち前記補正度数が所定の表示条件を満たす語句とを対応付けたデータを前記表示データとして生成する、請求項1ないしのいずれか1項に記載の情報分析システム。 The generation unit generates, as the display data, data in which the target information is associated with a phrase included in the target information and whose correction frequency satisfies a predetermined display condition. The information analysis system according to any one of 5 . 前記生成部は、前記表示データを利用者端末に提供し、当該利用者端末による前記表示データに対する操作に応じて、前記補正度数および前記表示データの少なくとも一方を調整する、請求項に記載の情報分析システム。 The sixth aspect of claim 6 , wherein the generation unit provides the display data to the user terminal and adjusts at least one of the correction frequency and the display data according to the operation of the display data by the user terminal. Information analysis system. ターゲットに関するターゲット情報を前記ターゲットごとに蓄積する蓄積部を有する情報分析システムによる情報分析方法であって、
各ターゲットについて、当該ターゲットである対象ターゲットに関するターゲット情報において特定語句が出現する出現度数を、他のターゲットに関するターゲット情報を含む比較ターゲット情報において前記特定語句が出現する比較度数に基づいて補正した補正度数を算出するステップと、
前記ターゲット情報、前記特定語句および前記補正度数に応じた表示データを生成するステップと、を含み、
前記蓄積部は、前記ターゲット情報と前記ターゲットの分析区分を示す区分情報とを前記ターゲットごとに蓄積し、
前記比較ターゲット情報は、前記対象ターゲットと前記分析区分が同じターゲットに関するターゲット情報である、情報分析方法。
It is an information analysis method by an information analysis system having a storage unit that stores target information about a target for each target.
For each target, the correction frequency in which the specific word appears in the target information related to the target target is corrected based on the comparison frequency in which the specific word appears in the comparison target information including the target information related to other targets. And the steps to calculate
The target information, see contains the steps of: generating a display data corresponding to the specific terms and the correction frequency,
The storage unit stores the target information and the classification information indicating the analysis classification of the target for each target.
The comparison target information is an information analysis method in which the target target and the target information having the same analysis category are the target information .
ターゲットに関するターゲット情報を前記ターゲットごとに蓄積する蓄積部に蓄積された情報を分析するコンピュータに実行させるためのプログラムであって、
各ターゲットについて、当該ターゲットである対象ターゲットに関するターゲット情報において特定語句が出現する出現度数を、他のターゲットに関するターゲット情報を含む比較ターゲット情報において前記特定語句が出現する比較度数に基づいて補正した補正度数を算出する手順と、
前記ターゲット情報、前記特定語句および前記補正度数に応じた表示データを生成する手順と、を含み、
前記蓄積部は、前記ターゲット情報と前記ターゲットの分析区分を示す区分情報とを前記ターゲットごとに蓄積し、
前記比較ターゲット情報は、前記対象ターゲットと前記分析区分が同じターゲットに関するターゲット情報である、プログラム
It is a program for causing a computer to analyze the information stored in the storage unit that stores the target information about the target for each target.
For each target, the correction frequency in which the specific word appears in the target information related to the target target is corrected based on the comparison frequency in which the specific word appears in the comparison target information including the target information related to other targets. And the procedure to calculate
Including the target information, the specific phrase, and a procedure for generating display data according to the correction frequency.
The storage unit stores the target information and the classification information indicating the analysis classification of the target for each target.
The comparison target information is a program in which the target target and the target having the same analysis category are the target information .
JP2018036389A 2018-03-01 2018-03-01 Information analysis system and information analysis method. Active JP6781723B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018036389A JP6781723B2 (en) 2018-03-01 2018-03-01 Information analysis system and information analysis method.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018036389A JP6781723B2 (en) 2018-03-01 2018-03-01 Information analysis system and information analysis method.

Publications (2)

Publication Number Publication Date
JP2019152959A JP2019152959A (en) 2019-09-12
JP6781723B2 true JP6781723B2 (en) 2020-11-04

Family

ID=67946363

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018036389A Active JP6781723B2 (en) 2018-03-01 2018-03-01 Information analysis system and information analysis method.

Country Status (1)

Country Link
JP (1) JP6781723B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7455913B2 (en) * 2021-08-31 2024-03-26 ネイバー コーポレーション Method, system, and computer program for automatically classifying lower-level item categories through review analysis for use in searches

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3476185B2 (en) * 1999-12-27 2003-12-10 インターナショナル・ビジネス・マシーンズ・コーポレーション Information extraction system, information processing device, information collection device, character string extraction method, and storage medium
US10108639B2 (en) * 2014-02-14 2018-10-23 Rakuten, Inc. Display control device, display control device control method, program and information storage medium
JP6407279B2 (en) * 2014-06-30 2018-10-17 楽天株式会社 Information processing apparatus, information processing method, and program for information processing apparatus

Also Published As

Publication number Publication date
JP2019152959A (en) 2019-09-12

Similar Documents

Publication Publication Date Title
US11301884B2 (en) Seed population diffusion method, device, information delivery system and storage medium
JP6858990B2 (en) High-precision search method on website
WO2017121251A1 (en) Information push method and device
US9514202B2 (en) Information processing apparatus, information processing method, program for information processing apparatus and recording medium
CN110020128B (en) Search result ordering method and device
US20150332373A1 (en) Method and system for pushing mobile application
US20130297419A1 (en) Taxonomy based targeted search advertising
CN109325182B (en) Information pushing method and device based on session, computer equipment and storage medium
US11676194B2 (en) Faceted item recommendation system
EP1493118A1 (en) Determination of attributes based on product descriptions
JP6679451B2 (en) Selection device, selection method, and selection program
JP2013506195A (en) Method, apparatus and system for increasing transfer rate of website data
US20150205580A1 (en) Method and System for Sorting Online Videos of a Search
JPWO2012002351A1 (en) Information processing apparatus, information processing method, and information processing program
KR100970335B1 (en) Method for updating interest keyword of user and system for executing the method
CN109241451B (en) Content combination recommendation method and device and readable storage medium
CN112612942B (en) Social big data-based fund recommendation system and method
US20130066800A1 (en) Method of aggregating consumer reviews
JP2012018571A (en) Content recommendation apparatus and method
CN110175264A (en) Construction method, server and the computer readable storage medium of video user portrait
US20150294383A1 (en) Online bidding management system
JP5597613B2 (en) Information processing apparatus, information processing method, information processing program, and recording medium
JP6781723B2 (en) Information analysis system and information analysis method.
CN115129994A (en) Commodity recommendation method and device, electronic equipment and readable storage medium
US20120072281A1 (en) Method and system to monetize domain queries in sponsored search

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190410

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200225

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200407

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200611

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201006

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201016

R150 Certificate of patent or registration of utility model

Ref document number: 6781723

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250