JP6781723B2 - Information analysis system and information analysis method. - Google Patents
Information analysis system and information analysis method. Download PDFInfo
- Publication number
- JP6781723B2 JP6781723B2 JP2018036389A JP2018036389A JP6781723B2 JP 6781723 B2 JP6781723 B2 JP 6781723B2 JP 2018036389 A JP2018036389 A JP 2018036389A JP 2018036389 A JP2018036389 A JP 2018036389A JP 6781723 B2 JP6781723 B2 JP 6781723B2
- Authority
- JP
- Japan
- Prior art keywords
- target
- information
- frequency
- word
- target information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、情報を分析する情報分析システムおよび情報分析方法に関し、特には、クチコミ情報を分析して提供する情報分析システムおよび情報分析方法に関する。 The present invention relates to an information analysis system and an information analysis method for analyzing information, and more particularly to an information analysis system and an information analysis method for analyzing and providing word-of-mouth information.
近年、旅行先、宿泊施設、飲食店、購入商品および利用サービスなどのターゲットを選択する際に、インターネット上の比較サイトなどに記載されたターゲットに関するターゲット情報を閲覧にすることが多くなっている。特に、ターゲット情報として、利用者の視点によるターゲットの評価を示すクチコミ情報が注目されている。 In recent years, when selecting targets such as travel destinations, accommodation facilities, restaurants, purchased products, and services used, it is becoming more common to browse target information related to the targets described on comparison sites on the Internet. In particular, as target information, word-of-mouth information showing the evaluation of the target from the user's point of view is attracting attention.
しかしながら、クチコミ情報のようなインターネット上で発信されている数多いターゲット情報を確認して、適切なターゲットを選択することは容易ではない。 However, it is not easy to check a large number of target information transmitted on the Internet such as word-of-mouth information and select an appropriate target.
これに対して特許文献1には、クチコミ情報などのターゲット情報から出現頻度の高い語句を抽出して、ターゲットを特定するキーワードとして設定する技術が開示されている。この技術では、キーワードを確認することで、ターゲットの特徴を把握することが可能になるため、所望のターゲットを容易に選択することができる。
On the other hand,
しかしながら、特許文献1に記載の技術では、多くの異なるターゲットに対して同じ語句がキーワードとして設定されてしまい、各ターゲットの特徴を把握することが難しくなることがある。例えば、旅行先の宿泊施設を選ぶ場合、旅行先が温泉地であれば、多くの宿泊施設に関するターゲット情報から「温泉」という語句が抽出されてしまい、その結果、多くの宿泊施設に「温泉」というキーワードが設定されてしまう。このような場合、各宿泊施設の特徴を把握することが難しく、適切なターゲットを選択することは容易ではない。
However, in the technique described in
本発明は、上記の問題を鑑みてなされたものであり、ターゲットの特徴を容易に把握することが可能な情報分析装置および情報分析方法を提供することを目的とする。 The present invention has been made in view of the above problems, and an object of the present invention is to provide an information analysis device and an information analysis method capable of easily grasping the characteristics of a target.
本発明による情報分析システムは、ターゲットに関するターゲット情報を前記ターゲットごとに蓄積する蓄積部と、各ターゲットについて、当該ターゲットである対象ターゲットに関するターゲット情報において特定語句が出現する出現度数を、他のターゲットに関するターゲット情報を含む比較ターゲット情報において前記特定語句が出現する比較度数に基づいて補正した補正度数を算出する制御部と、前記ターゲット情報、前記特定語句および前記補正度数に応じた表示データを生成する生成部と、を有する。 The information analysis system according to the present invention relates to a storage unit that stores target information about a target for each target, and for each target, the frequency of occurrence of a specific phrase appearing in the target information about the target target, which is the target, with respect to other targets. A control unit that calculates a correction frequency corrected based on the comparison frequency in which the specific word appears in the comparison target information including the target information, and a generation that generates display data according to the target information, the specific phrase, and the correction frequency. It has a part and.
本発明による情報分析方法は、ターゲットに関するターゲット情報を前記ターゲットごとに蓄積する蓄積部を有する情報分析システムによる情報分析方法であって、各ターゲットについて、当該ターゲットである対象ターゲットに関するターゲット情報において特定語句が出現する出現度数を、他のターゲットに関するターゲット情報を含む比較ターゲット情報において前記特定語句が出現する比較度数に基づいて補正した補正度数を算出するステップと、前記ターゲット情報、前記特定語句および前記補正度数に応じた表示データを生成するステップと、を含む情報分析方法。 The information analysis method according to the present invention is an information analysis method by an information analysis system having a storage unit that stores target information about the target for each target, and for each target, a specific phrase in the target information about the target target that is the target. The step of calculating the correction frequency obtained by correcting the appearance frequency in which the specific word appears based on the comparison frequency in which the specific word appears in the comparison target information including the target information about another target, and the target information, the specific word, and the correction. An information analysis method that includes steps to generate display data according to frequency.
本発明によれば、ターゲットの特徴を容易に把握することが可能になる。 According to the present invention, the characteristics of the target can be easily grasped.
以下、本発明の実施形態について図面を参照して説明する。なお、各図面において同じ機能を有するものには同じ符号を付け、その説明を省略する場合がある。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. In each drawing, those having the same function may be given the same reference numerals and the description thereof may be omitted.
(第1の実施形態)
図1は、本発明の第1の実施形態の情報提供システムを示す図である。図1に示す情報提供システム1は、Webサーバ10と、ターゲット情報格納装置20と、利用者端末30と、分析システム40とを有する。Webサーバ10、ターゲット情報格納装置20、利用者端末30および分析システム40は、ネットワーク100を介して通信可能に接続されている。Webサーバ10および利用者端末30は、図1では、それぞれ3つずつ示されているが、Webサーバ10および利用者端末30の数は、3つに限らず、適宜変更可能である。
(First Embodiment)
FIG. 1 is a diagram showing an information providing system according to the first embodiment of the present invention. The
Webサーバ10は、特定のターゲットに関するターゲット情報を含むWeb情報を提供するサーバである。ターゲットは、企業などの提供者が提供する提供物である。提供物としては、宿泊施設、商店(飲食店やコンビニなど)、塾、物件(賃貸物件や分譲物件)、商品およびサービスなどが挙げられる。Web情報は、ターゲットを提供する提供者にて管理される。
The
ターゲット情報は、例えば、ターゲットに対する評価を示す評価情報を含む。評価情報は、例えば、利用者の視点によるターゲットの評価であるクチコミを示すクチコミ情報である。また、ターゲット情報には、当該ターゲットの名称、説明などが含まれている。ただし、ターゲットの名称、説明などの情報は、ターゲット情報とは別のターゲット説明情報としても良い。なお、Webサーバ10が提供するWeb情報には、利用者が利用者端末30を介して、ターゲットに対する注文処理を行うための注文機能が含まれてもよい。注文処理は、例えば、ターゲットに対する購入注文を行う購入処理や、ターゲットに対する予約注文を行う予約処理などである。注文機能は、例えば、購入フォームや予約フォームなどである。
The target information includes, for example, evaluation information indicating an evaluation of the target. The evaluation information is, for example, word-of-mouth information indicating a word-of-mouth that is an evaluation of a target from the viewpoint of a user. In addition, the target information includes the name, description, and the like of the target. However, information such as the target name and description may be target description information different from the target information. The Web information provided by the
ターゲット情報格納装置20は、そのターゲットに関するターゲット情報をターゲットを識別するターゲット識別情報ごとに示すDB(Database:データベース)を格納する格納装置である。例えば、ターゲット識別情報は、ユニークな管理IDまたはターゲットの名称などである。ターゲット情報格納装置20は、例えば、ターゲットに対応するWebサーバ10が存在しない場合や、ターゲットの提供者とは別に、利用者からターゲット情報を収集する場合などに使用される。ターゲット情報格納装置20が格納するターゲット情報は、クチコミ情報のような特定の情報だけでもよい。なお、ターゲット情報は、アンケートフォームや電子メールなどを用いて利用者から直接投稿されたものでもよいし、アンケート用紙などに記載された情報を管理者がターゲット情報格納装置20に登録したものでもよい。
The target
利用者端末30は、情報提供システム1の利用者にて使用される端末装置である。利用者端末30は、例えば、PC(personal computer)、スマートフォン、スマートTVまたはゲーム機などである。
The
利用者端末30は、ユーザからの指示に従って、ターゲット情報の取得を要求する取得要求を分析システム40に送信する。また、利用者端末30は、分析システム40から、取得要求の応答としてターゲット情報を含む表示データを受信し、その表示データを表示する。なお、取得要求は、キーワードのような取得対象となるターゲットを検索する検索条件や、利用者の属性を示す属性情報などを含む。表示データのより詳細な説明は後述する。
The
分析システム40は、ネットワーク100上のターゲット情報の収集および分析を行い、その分析結果に応じた表示データを利用者端末30に提供する情報分析システムである。
The
図2は、分析システム40の構成を示す図である。図2に示すように分析システム40は、収集装置41と、分析装置42と、提供装置43とを有する。
FIG. 2 is a diagram showing the configuration of the
収集装置41は、ネットワーク100上からターゲット情報を収集して蓄積する。具体的には、収集装置41は、伝送部411と、蓄積部412と、収集部413とを有する。
The
伝送部411は、ネットワーク100上の各装置と接続される。蓄積部412は、種々の情報を蓄積する。
The
収集部413は、Webサーバ10およびターゲット情報格納装置20のうちの少なくとも1つからターゲット情報を収集し、その収集したターゲット情報をターゲットごとに蓄積部412に蓄積する。より具体的には、収集部413は、ターゲット情報と、ターゲットの分析区分を示す区分情報とを、ターゲットを識別する識別情報であるターゲット識別情報ごと対応付けた収集情報を蓄積する。また、収集部413は、Webサーバ10からターゲット説明情報を収集し、ターゲット情報格納装置20からターゲット情報を収集し、ターゲット説明情報をターゲット識別情報に対応付けて収集情報に含めて蓄積部412に蓄積してもよい。
The
本実施形態では、特に断りのない限り、ターゲットは宿泊施設であり、分析区分は宿泊施設が設けられた場所の地理的な区分である場合を例に説明する。地理的な区分は、例えば、市区町村などの行政区分などでもよいし、地表を所定の形状(例えば、メッシュ状)で区切った各領域などでもよい。収集部413は、例えば、ターゲット情報を分析してターゲットである宿泊施設の住所を抽出し、その住所に基づいて区分情報を生成することができる。
In the present embodiment, unless otherwise specified, the target is the accommodation facility, and the analysis category is the geographical division of the place where the accommodation facility is provided. The geographical division may be, for example, an administrative division such as a city, ward, town, or village, or may be an area in which the ground surface is divided by a predetermined shape (for example, a mesh shape). For example, the
分析装置42は、収集装置41が収集したターゲット情報を分析する。具体的には、分析装置42は、接続部421と、記憶部422と、制御部423とを有する。
The
接続部421は、収集装置41と接続する。記憶部422は、種々の情報を記憶する。
The
制御部423は、接続部421を介して収集装置41の蓄積部412から収集情報を取得し、その収集情報を分析する。制御部423は、その分析結果を示す結果情報を提供装置43に送信する。
The
具体的には、先ず、制御部423は、収集情報内の各ターゲット情報から特定語句を抽出する。このとき、制御部423は、ターゲット情報内の全情報から特定語句を抽出してもよいし、ターゲット情報内の特定の分析対象情報から特定語句を抽出してもよい。分析対象情報は、例えば、クチコミ情報である。本実施形態では、制御部423は、ターゲット情報内の複数のクチコミ情報のそれぞれから特定語句を抽出する。
Specifically, first, the
特定語句の抽出処理では、例えば、制御部423は、クチコミ情報内の各語句の品詞を特定し、それらの語句のうち予め定められた品詞(例えば、名詞や形容詞)の語句を特定語句として抽出する。また、制御部423は、記憶部422に予め記憶した対象語句とクチコミ情報内の各語句のマッチング処理を行い、クチコミ情報から対象語句と同じ語句を特定語句として抽出してもよい。
In the extraction process of a specific phrase, for example, the
特定語句を抽出すると、制御部423は、収集情報内の各ターゲット識別情報にて識別される各ターゲットについて、特定語句ごとに、そのターゲットである対象ターゲットに関するクチコミ情報において特定語句が出現する出現度数を算出する。出現度数は、本実施形態では、特定語句を含むクチコミ情報の数である。このため、例えば、同一のクチコミ情報に特定語句が複数回出現しても、出現度数は1となる。なお、出現度数は、特定語句が出現した回数でもよい。
When the specific phrase is extracted, the
また、制御部423は、互いに類似する複数の類似語句の代表となる代表語句を特定語句として抽出してもよい。例えば、複数の類似語句と代表語句との対応関係を示す語句対応情報を記憶部422に予め記憶させておく。特定語句の抽出処理において、クチコミ情報内の類似語句が出現すると、制御部423は、記憶部422に記憶された語句対応情報において、出現した類似語句に対応する代表語句を、特定語句として抽出する。この場合、特定語句の出現度数は、代表語句に対応する各類似語句の出現度数の和となる。なお、類似語句は、例えば、「ラーメン」、「中華ソバ」および「拉麺」などであり、代表語句は、例えば、「ラーメン」である。この例において、対象ターゲットの各クチコミ情報から「ラーメン」2件、「中華ソバ」2件、「拉麺」1件が抽出された場合、代表語句「ラーメン」がその和の5件出現したことになる。また、代表語句は、類似語句のいずれかであってもよいし、類似語句とは別の語句でもよい。
Further, the
また、制御部423は、特定語句の前後の文脈を解析して特定語句の使用状況を特定し、その使用状況を示す状況情報ごとに特定語句の出現度数を算出してもよい。制御部423は、例えば、使用状況を、特定語句が好意的な文脈で使用されている好意的状況と、特定語句が否定的な文脈で使用されている否定的状況のいずれかに特定する。また、制御部423は、使用状況を、好意的状況、否定的状況、および、特定語句が使用された文脈が不明な不明状況のいずれかに特定してもよい。
Further, the
また、制御部423は、出現度数の算出を所定の時間間隔で繰り返し行い、同じ特定語句に対して、最新の出現度数の過去の出現度数に対する割合が所定割合以上増加した場合、その割合に応じて出現頻度を調整(例えば、増加)させてもよい。なお、過去の出現度数は、例えば、前回算出した出現度数である。
Further, the
対象ターゲット情報の特定語句の出現度数が算出されると、他のターゲット情報についても、各々同様に、ターゲット情報の特定語句の出現度数を算出する。各ターゲット情報の特定語句の出現度数を算出すると、制御部423は、各ターゲットについて、特定語句ごとに、その特定語句の出現度数を、他のターゲットに関するクチコミ情報を含む比較クチコミ情報において特定語句が出現する比較度数に基づいて補正した補正度数を算出する。比較クチコミ情報は、対象ターゲット情報の特定語句の出現度数を比較する比較対象となるターゲット情報が有するクチコミ情報の集合であり、比較対象となるターゲット情報の集合を比較ターゲット情報と呼ぶ。比較クチコミ情報は、クチコミ情報全体でもよいし、対象ターゲットと分析区分が同じターゲットのクチコミ情報でもよい。なお、比較クチコミ情報は、対象ターゲットに関するクチコミ情報を含んでも含まなくてもよいが、本実施形態では、対象ターゲットに関するクチコミ情報を含む。
When the appearance frequency of the specific word / phrase of the target target information is calculated, the appearance frequency of the specific word / phrase of the target information is calculated in the same manner for each of the other target information. When the frequency of occurrence of a specific phrase in each target information is calculated, the
補正度数の算出処理では、制御部423は、具体的には、比較度数に対する出現度数の突出度合いを示す特徴度を算出し、その特徴度に基づいて出現度数を補正する。このとき、制御部423は、突出度合いが既定値よりも高い場合、出現度数を特徴度に応じて大きくし、突出度合いが既定値よりも低い場合、出現度数を特徴度に応じて小さくする。また、制御部423は、突出度合いが既定値よりも高い場合、出現度数の補正を行わず、突出度合いが既定値よりも低い場合、出現度数を特徴度に応じて小さくしてもよい。また、制御部423は、特定語句のうち、所定数以上の各ターゲットに関するターゲット情報に共通した共通語句の出現度数だけを補正してもよい。所定数は、予め定められていてもよいし、ターゲットの数に予め定められた比率を掛けた値でもよい。
In the correction frequency calculation process, the
特徴度は、例えば、確率的コンプレキシティを用いて算出される。具体的には、特徴度ΔIは、計算式ΔI=I(D)−(I(E)+I(F))から算出される。ここでI(D)は、比較クチコミ情報に対応する確率的コンプレキシティであり、I(E)は特定語句を含む比較クチコミ情報に対応する確率的コンプレキシティであり、I(F)は特定語句を含まない比較クチコミ情報に対応する確率的コンプレキシティである。 The feature degree is calculated using, for example, stochastic complexity. Specifically, the characteristic degree ΔI is calculated from the calculation formula ΔI = I (D) − (I (E) + I (F)). Here, I (D) is a stochastic complexity corresponding to comparative word-of-mouth information, I (E) is a stochastic complex corresponding to comparative word-of-mouth information including a specific phrase, and I (F) is. It is a stochastic complexity corresponding to comparative word-of-mouth information that does not include a specific phrase.
確率的コンプレキシティは、
特徴度ΔIの計算式において、I(E)+I(F)は、情報量基準と呼ばれ、情報量基準が小さいほど、特定語句がターゲットの特徴的な語句を表す。 In the formula for calculating the characteristic degree ΔI, I (E) + I (F) is called an information criterion, and the smaller the information criterion, the more characteristic the specific phrase represents the target.
以下、特徴度ΔIの具体例について説明する。
(特徴度ΔIの第1の具体例)
比較クチコミ情報の数を10,000件、比較クチコミ情報における語句Aを含むクチコミ情報の数(比較度数)を1,000件とする。
Hereinafter, a specific example of the feature degree ΔI will be described.
(First specific example of characteristic degree ΔI)
The number of comparative word-of-mouth information is 10,000, and the number of word-of-mouth information including the word A in the comparative word-of-mouth information (comparison frequency) is 1,000.
このとき、対象ターゲットであるターゲットXに対するクチコミ情報の数が100件、語句Aを含むターゲットXに対するクチコミ情報の数(対象ターゲットにおける語句Aの出現度数)が30件であったとする。 At this time, it is assumed that the number of word-of-mouth information for the target X, which is the target target, is 100, and the number of word-of-mouth information for the target X including the word A (the frequency of appearance of the word A in the target target) is 30.
この場合、比較クチコミ情報に対応する確率的コンプレキシティI(D)では、m1=100、m=10,000となり、I(D)=約564.85となる。特定語句を含む比較クチコミ情報に対応する確率的コンプレキシティI(E)では、m1=30、m=1,000となり、I(E)=約138.42となる。特定語句を含まない比較クチコミ情報に対応する確率的コンプレキシティI(F)では、m1=100−30=70、m=10,000−1,000=9,000となり、I(F)=約414.46となる。したがって、特徴度ΔI=I(D)−(I(E)+I(F))=約11.97となる。 In this case, in the stochastic complexity I (D) corresponding to the comparative word-of-mouth information, m1 = 100, m = 10,000, and I (D) = about 564.85. In the stochastic complexity I (E) corresponding to the comparative word-of-mouth information including the specific word, m1 = 30, m = 1,000, and I (E) = about 138.42. In the probabilistic complexity I (F) corresponding to the comparative word-of-mouth information that does not include a specific phrase, m1 = 100-30 = 70, m = 10,000-11,000 = 9,000, and I (F) = It becomes about 414.46. Therefore, the characteristic degree ΔI = I (D) − (I (E) + I (F)) = about 11.97.
また、対象ターゲットであるターゲットYに対するクチコミ情報の数が200件、語句Aを含むターゲットYに対するクチコミ情報の数(対象ターゲットにおける語句Aの出現度数)が40件であったとする。 Further, it is assumed that the number of word-of-mouth information for the target Y, which is the target target, is 200, and the number of word-of-mouth information for the target Y including the word A (the frequency of appearance of the word A in the target target) is 40.
この場合、比較クチコミ情報に対応する確率的コンプレキシティI(D)では、m1=200、m=10,000となり、I(D)=約985.22となる。特定語句を含む比較クチコミ情報に対応する確率的コンプレキシティI(E)では、m1=40、m=1,000となり、I(E)=約171.62となる。特定語句を含まない比較クチコミ情報に対応する確率的コンプレキシティI(F)では、m1=200−40=160、m=10,000−1,000=9,000となり、I(F)=約808.12となる。したがって、特徴度ΔI=I(D)−(I(E)+I(F))=約5.48となる。 In this case, in the stochastic complexity I (D) corresponding to the comparative word-of-mouth information, m1 = 200, m = 10,000, and I (D) = about 985.22. In the stochastic complexity I (E) corresponding to the comparative word-of-mouth information including the specific word / phrase, m1 = 40, m = 1,000, and I (E) = about 171.62. In the stochastic complexity I (F) corresponding to the comparative word-of-mouth information that does not include a specific phrase, m1 = 200-40 = 160, m = 10,000-11,000 = 9,000, and I (F) = It becomes about 808.12. Therefore, the characteristic degree ΔI = I (D) − (I (E) + I (F)) = about 5.48.
この例では、ターゲットYにおける語句Aを含むクチコミ情報の数はターゲットXにおける語句Aを含むクチコミ情報の数よりも多いが、ターゲットXにおける語句Aの出現頻度がターゲットYにおける語句Aの出現頻度よりも高く、その結果、ターゲットXの特徴度ΔIがターゲットYの特徴度ΔIよりも高くなっている。 In this example, the number of word-of-mouth information including the word A in the target Y is larger than the number of word-of-mouth information including the word A in the target X, but the frequency of appearance of the word A in the target X is higher than the frequency of appearance of the word A in the target Y. As a result, the characteristic degree ΔI of the target X is higher than the characteristic degree ΔI of the target Y.
(特徴度ΔIの第2の具体例)
比較クチコミ情報の数を10,000件、語句Bを含むクチコミ情報の数(比較度数)を3,000件であるとする。
(Second specific example of characteristic degree ΔI)
It is assumed that the number of comparative word-of-mouth information is 10,000 and the number of word-of-mouth information including word B (comparison frequency) is 3,000.
このとき、対象ターゲットであるターゲットXに対するクチコミ情報の数が100件、語句Bを含むターゲットXに対するクチコミ情報の数(対象ターゲットにおける語句Bの出現度数)が40件であったとする。 At this time, it is assumed that the number of word-of-mouth information for the target X, which is the target target, is 100, and the number of word-of-mouth information for the target X including the word B (the frequency of appearance of the word B in the target target) is 40.
この場合、比較クチコミ情報に対応する確率的コンプレキシティI(D)では、m1=100、m=10,000となり、I(D)=約564.85となる。特定語句を含む比較クチコミ情報に対応する確率的コンプレキシティI(E)では、m1=40、m=3,000となり、I(E)=約216.66となる。特定語句を含まない比較クチコミ情報に対応する確率的コンプレキシティI(F)では、m1=100−40=60、m=10,000−3,000=7,000となり、I(F)=約349.95となる。したがって、特徴度ΔI=I(D)−(I(E)+I(F))=約−1.77となる。 In this case, in the stochastic complexity I (D) corresponding to the comparative word-of-mouth information, m1 = 100, m = 10,000, and I (D) = about 564.85. In the stochastic complexity I (E) corresponding to the comparative word-of-mouth information including the specific word / phrase, m1 = 40, m = 3,000, and I (E) = about 216.66. In the stochastic complexity I (F) corresponding to the comparative word-of-mouth information that does not include a specific phrase, m1 = 100-40 = 60, m = 10,000-3,000 = 7,000, and I (F) = It becomes about 349.95. Therefore, the characteristic degree ΔI = I (D) − (I (E) + I (F)) = about -1.77.
また、対象ターゲットであるターゲットZに対するクチコミ情報の数が100件、語句Bを含むターゲットZに対するクチコミ情報の数(対象ターゲットにおける語句Bの出現度数)が50件であったとする。 Further, it is assumed that the number of word-of-mouth information for the target Z, which is the target target, is 100, and the number of word-of-mouth information for the target Z including the word B (the frequency of appearance of the word B in the target target) is 50.
この場合、比較クチコミ情報に対応する確率的コンプレキシティI(D)では、m1=100、m=10,000となり、I(D)=約564.85となる。特定語句を含む比較クチコミ情報に対応する確率的コンプレキシティI(E)では、m1=50、m=3,000となり、I(E)=約258.53となる。I(F)では、m1=100−50=50、m=10,000−3,000=7,000となり、特定語句を含まない比較クチコミ情報に対応する確率的コンプレキシティI(F)=約301.56となる。したがって、特徴度ΔI=I(D)−(I(E)+I(F))=約4.76となる。 In this case, in the stochastic complexity I (D) corresponding to the comparative word-of-mouth information, m1 = 100, m = 10,000, and I (D) = about 564.85. In the stochastic complexity I (E) corresponding to the comparative word-of-mouth information including the specific word, m1 = 50, m = 3,000, and I (E) = about 258.53. In I (F), m1 = 100-50 = 50, m = 10,000-3,000 = 7,000, and the probabilistic complexity I (F) corresponding to the comparative word-of-mouth information that does not include a specific phrase is It becomes about 301.56. Therefore, the characteristic degree ΔI = I (D) − (I (E) + I (F)) = about 4.76.
この例では、語句Bのようにクチコミ情報に頻繁に出現する語句であっても、特定のターゲット(ターゲットZ)での出現度数が高いと、突出度合いを示す特徴度ΔIが高くなることが示されている。 In this example, it is shown that even if the phrase frequently appears in the word-of-mouth information such as phrase B, the characteristic degree ΔI indicating the degree of protrusion increases when the frequency of appearance at a specific target (target Z) is high. Has been done.
なお、上記の確率的コンプレキシティを用いた特徴度は、特徴度の単なる一例であって、これに限るものではない。特徴度は、例えば、比較クチコミ情報内の特定語句に対するターゲットごとの出現頻度の統計値を比較度数とした際の、比較度数に対する出現度数の割合などでもよい。統計値としては、平均値や中央値などが挙げられる。 It should be noted that the characteristic degree using the above-mentioned stochastic complexity is merely an example of the characteristic degree, and is not limited to this. The characteristic degree may be, for example, the ratio of the appearance frequency to the comparison frequency when the statistical value of the appearance frequency for each target for a specific word in the comparative word-of-mouth information is used as the comparison frequency. Examples of statistical values include mean values and median values.
例えば、第1のターゲット情報の各クチコミ情報から抽出された第1の特定語句の出現度数を65とし、第1〜s(sはターゲット情報の数)のターゲット情報の各々のクチコミ情報から抽出された第1の特定語句の出現度数の平均値(比較度数)が50とし、標準偏差を10とした場合、偏差値が65であり、既定値としての閾値を平均値+標準偏差の60とする。この場合、第1のターゲット情報から抽出された第1の特定語句の出現度数の特徴度を「(偏差値−閾値)*|偏差値−閾値|」で算出すると、特徴度は25となり、補正度数は出現度数+特徴度で90となる。仮に上記の例で、第1の特定語句の出現度数が50であった場合は、偏差値は50となり、特徴度は−100となり、補正度数は−50となる。第1のターゲット情報から抽出された第1の特定語句の出現度数が比較度数よりも大きければ特徴度が高くなり、反対に出現度数が比較度数よりも小さければ特徴度が低くなる。 For example, the frequency of occurrence of the first specific word extracted from each word-of-mouth information of the first target information is 65, and it is extracted from each word-of-mouth information of the target information of the first to s (s is the number of target information). When the average value (comparison frequency) of the appearance frequency of the first specific word is 50 and the standard deviation is 10, the deviation value is 65, and the threshold value as the default value is 60 of the mean value + standard deviation. .. In this case, if the characteristic degree of the appearance frequency of the first specific word extracted from the first target information is calculated by "(deviation value-threshold value) * | deviation value-threshold value |", the characteristic degree becomes 25, which is corrected. The frequency is 90 in terms of appearance frequency + feature frequency. If, in the above example, the frequency of appearance of the first specific word is 50, the deviation value is 50, the characteristic degree is -100, and the correction frequency is -50. If the appearance frequency of the first specific word extracted from the first target information is larger than the comparison frequency, the feature degree is high, and conversely, if the appearance frequency is smaller than the comparison frequency, the feature degree is low.
このように第1のターゲット情報から抽出された第1〜t1(t1は第1のターゲット情報の特定語句の数)の特定語句の出現度数に対する特徴度を各々算出し、更に、第2〜sのターゲット情報についても、各々のクチコミ情報から抽出された特定語句の出現度数に対する特徴度を各々算出する。そして、出現度数を特徴度で補正し補正度数を算出する。 In this way, the characteristics of the first to t1 (t1 is the number of specific words in the first target information) extracted from the first target information with respect to the appearance frequency of the specific words are calculated, and further, the second to s Also for the target information of, the characteristic degree with respect to the appearance frequency of the specific word extracted from each word-of-mouth information is calculated. Then, the appearance frequency is corrected by the feature degree and the correction frequency is calculated.
出現度数を補正した補正度数を算出すると、制御部423は、ターゲット識別情報ごとに、ターゲット情報と特定語句と補正度数とを対応付けた結果情報を生成して提供装置43に出力する。このとき、制御部423は、結果情報を記憶部422に記憶してもよい。
When the correction frequency corrected for the appearance frequency is calculated, the
提供装置43は、利用者端末30からの取得要求に応じた表示データを提供する。具体的には、提供装置43は、通信部431と、格納部432と、提供部433とを有する。
The providing device 43 provides display data in response to an acquisition request from the
通信部431は、ネットワーク100上の各装置と接続される。通信部431は、例えば、利用者端末30からターゲット情報の取得を要求する取得要求を受信し、分析装置42から結果情報を受信する。格納部432は、種々の情報を格納する。
The
提供部433は、通信部431が受信した結果情報に基づいて表示データを生成する生成部である。具体的には、提供部433は、通信部431が受信した結果情報を格納部432に格納する。提供部433は、通信部431が取得要求を受信すると、格納部432に格納した結果情報に基づいて、取得要求に応じた表示データを生成して利用者端末30に送信する。
The providing
具体的には、提供部433は、格納部432から、取得要求内の検索条件に合致するターゲット情報(ターゲット説明情報がターゲット情報とは別の情報として存在する場合は、ターゲット説明情報を検索範囲に含めてもよい)と、そのターゲット情報に対応する特定語句および補正度数を取得し、取得したターゲット情報、特定語句および補正度数に基づいて表示データを生成する。
Specifically, the providing
例えば、提供部433は、ターゲット情報に対応するターゲットの名称と、そのターゲット情報に対応する特定語句のうち補正度数が所定の表示条件を満たす特定語句とを対応付けたデータを表示データとして生成する。所定の表示条件を満たす特定語句は、具体的には、補正度数が高い特定語句である高頻出語句である。高頻出語句は、補正度数が高い方から既定数分の特定語句でもよいし、補正度数が既定度数以上の特定語句でもよい。また、特定の使用状況(例えば、好意的状況)に対応する補正度数が高い特定語句を高頻出語句としてもよい。なお、ターゲット情報と高頻出語句との対応付けは、同じ表示データ内にターゲット情報と高頻出語句との対応付けたものでもよいし、複数の表示データにおいて互いにリンクを介して対応づけられたものでもよい。
For example, the providing
また、提供部433は、利用者端末30による表示データに対する操作に応じて、特定語句の補正度数および表示データの少なくとも一方を調整してもよい。
Further, the providing
また、提供部433は、利用者端末30に送信する利用者向けの表示データとは別に、ターゲットを提供する提供者向けの表示データを生成してもよい。この場合、提供部433は、例えば、所定の生成タイミングで表示データを生成して、提供者が使用する提供者端末(図示せず)に提供する。生成タイミングは、一定の時間間隔ごとでもよいし、分析システム40の管理者や提供者端末などから指示があったタイミングなどでもよい。
Further, the providing
以下、表示データの具体例について説明する。 A specific example of the display data will be described below.
(表示データの第1の具体例)
図3は、表示データが利用者端末30に表示された際の第1の具体例を示す図である。図3の例の場合、提供部433は、先ず、図3(a)に示す表示データ500を生成して利用者端末30に送信する。表示データ500は、提供部433が取得したターゲット情報の一覧を示す一覧情報501を含む。一覧情報501内の各ターゲット情報502a〜502cは、宿泊施設に関する宿情報(ここでは、宿の名称、宿の説明を含む)であり、そのターゲット情報内のクチコミ情報において補正度数が高い高頻出語句503が対応付けられている。
(First specific example of display data)
FIG. 3 is a diagram showing a first specific example when the display data is displayed on the
高頻出語句503のそれぞれには、対応するターゲット情報内のクチコミ情報のうち、その高頻出語句503を含むクチコミ情報へのリンクが張られている。利用者端末30にて高頻出語句503(リンク)が選択された場合、提供部433は、図3(b)に示す表示データ510を生成して利用者端末30に送信する。表示データ510は、選択された高頻出語句のリンク先のクチコミ情報511を含む。図3(b)は、ターゲット情報502cにおける高頻出語句503「ラーメン」が選択され、ターゲット情報502cに対応する宿のクチコミ情報のうち、高頻出語句503「ラーメン」が含まれるクチコミ情報が利用者端末30に送信され、利用者端末30にて表示された例が示されている。
Each of the high-
表示データ510の各クチコミ情報511には、選択された高頻出語句512が含まれる。クチコミ情報511では、選択された高頻出語句512を強調表示する処理が提供部433にて施されている。図の例では、高頻出語句512を太字表示することで強調しているが、強調方法は、この例に限らず、例えば、拡大表示や網掛け表示などの他の方法でもよい。なお、選択された高頻出語句512に加えて、他の高頻出語句が強調されてもよい。その際、選択された高頻出語句512と他の高頻出語句の強調方法を変えることで、選択された高頻出語句512を判別可能にしてもよい。
Each word-of-
(表示データの第2の具体例)
図4は、表示データが利用者端末30に表示された際の第2の具体例を示す図である。図4に示す表示データ500aは、図3(a)に示す表示データ500と比べて、高頻出語句503の表示方法が異なっている。
(Second specific example of display data)
FIG. 4 is a diagram showing a second specific example when the display data is displayed on the
提供部433は、表示データ500aにおけるターゲット情報502bの高頻出語句503に、高頻出語句503の使用状況を示す状況情報504を対応付けしている。図4の例では、表示データ500aが利用者端末30に送信され、利用者端末30により、状況情報504が、高頻出語句503に使用状況に応じた網で示されて、利用者端末30にて表示される。具体的には、高頻出語句503を抽出する際に、制御部423にて、好意的状況と否定的状況とに区別されて出現度数が算出され、補正度数が算出されており、高頻出語句503が示されている枠内における網がかかっている領域の大きさと網がかかっていない領域の大きさの比が好意的状況の補正度数と否定的状況の補正度数の比となるように、表示データ500aは提供部433にて作成されている。また。状況情報504は、例えば、使用状況を濃淡で表してもよい。なお、第2の具体例の場合、制御部423は、特定語句の好意的状況と否定的状況との各出現度数からそれぞれ補正度数を算出し、算出後の好意的状況と否定的状況との各補正度数の割合から補正度数の比を算出してもよいが、特定語句の好意的状況と否定的状況との出現度数の割合を記憶しておき、好意的状況と否定的状況の出現度数の合計した値を基に、補正度数を算出し、当該出現度数の割合を補正度数の比としてもよい。
The providing
(表示データの第3の具体例)
図5は、表示データが利用者端末30に表示された際の第3の具体例を示す図である。図5の例の場合、提供部433は、先ず、図5(a)に示す表示データ600を生成して利用者端末30に送信する。表示データ600は、比較クチコミ情報内の各ターゲット情報に含まれる高頻出語句601が、提供部433により抽出され、抽出された高頻出語句601の一覧を示す語句一覧情報602を含めて作成される。提供部433は、高頻出語句601に、その高頻出語句601を含むクチコミ情報を有するターゲット情報へのリンクを張る。高頻出語句601(リンク)が利用者端末30にて選択された場合、提供部433は、図5(b)に示す表示データ610を生成して利用者端末30に送信する。図5(b)は、高頻出語句601「ラーメン」が選択され、各ターゲット情報に対応する宿のクチコミ情報のうち、語句「ラーメン」が高頻出語句として抽出されたクチコミ情報を有するターゲット情報の一覧が提供部433により作成され、その一覧が利用者端末30に送信されて表示された例が示されている。
(Third specific example of display data)
FIG. 5 is a diagram showing a third specific example when the display data is displayed on the
表示データ610は、選択された高頻出語句601を含むクチコミ情報を有するターゲット情報の一覧を示す一覧情報611を含む。一覧情報611内の各ターゲット情報612は、図3に示したターゲット情報502a〜502cと同様に、高頻出語句613を含み、高頻出語句613には、その高頻出語句613を含むクチコミ情報へのリンクが張られている。
The
(表示データの第4の具体例)
第4の具体例では、提供部433は、表示データとして図5(a)に示す表示データ600を生成する際に、語句一覧情報602に含ませる高頻出語句601を、利用者の属性情報に応じて決定する。属性情報は、利用者端末30からの取得要求に含まれる。属性情報は、例えば、宿泊施設の利用者の年齢、人数、種別(大人または子供など)および性別などを示す。
(Fourth specific example of display data)
In the fourth specific example, when the providing
具体的には、クチコミ情報に対して予めカテゴリ情報を対応付けておき、分析装置42の制御部423が結果情報を生成する際に、抽出した特定語句に、その特定語句を抽出したクチコミ情報のカテゴリ情報を対応付ける。カテゴリ情報は、例えば、ファミリー、カップル、男子旅、女子旅、一人旅または団体旅行などを示す。なお、カテゴリ情報はターゲットの種類に応じて変更される。例えば、ターゲットが物件の場合、カテゴリ情報は、ファミリー、一人暮らし、一戸建てまたはマンションなどとなる。
Specifically, the category information is associated with the word-of-mouth information in advance, and when the
提供部433は、高頻出語句から、利用者の属性情報に合致したカテゴリ情報が対応付けられた語句を選択し、その選択した語句を示す語句一覧情報602を含む表示データ600を生成する。このとき、属性情報とカテゴリ情報との対応関係を示す情報を格納部432に予め格納しておき、提供部433は、属性情報に対応するカテゴリ情報を、属性情報に合致したカテゴリ情報と判断する。例えば、提供部433は、属性情報が「大人二人、子供三人」のように「大人」と「子供」の両方を含んでいる場合、カテゴリ情報として「ファミリー」を選択する。さらに提供部433は、カテゴリ情報「ファミリー」に対応付けられた語句「アイスクリーム」、「ラーメン」などを選択し、その選択された「アイスクリーム」、「ラーメン」などの語句一覧情報602を生成して利用者端末30に送信する。語句一覧情報602内の語句が利用者端末30にて選択された場合の処理は、第3の具体例と同様である。
The providing
(表示データの第5の具体例)
第5の具体例は、提供部433が利用者端末30の操作に応じて特定語句の補正度数および表示データの少なくとも一方を調整する例である。
(Fifth specific example of display data)
A fifth specific example is an example in which the providing
例えば、提供部433は、表示データとして、ターゲットに対する注文処理を行うことが可能なWebサイトである注文サイトへのリンクを含むデータを生成する。このような表示データとしては、例えば、図3(a)に示した表示データ500の各ターゲット情報502a〜502cに、そのターゲット情報に対応するターゲットに対する予約処理を行うことが可能な注文サイトへのリンクを張ったものである。
For example, the providing
提供部433は、利用者端末30による表示データに対する操作を監視して、利用者端末30による表示データの表示履歴を示す履歴情報を取得する。そして利用者端末30の表示データから注文サイトへの移動を検知すると、提供部433は、履歴情報に基づいて、表示データおよび補正度数の少なくとも一方を調整する。
The providing
例えば、提供部433は、履歴情報として、表示データの表示中にどの高頻出語句が選択されたかの選択履歴を取得し、表示データから注文サイトへの移動を検知すると、その利用者端末30の選択履歴にて、直前に選択された高頻出語句をカウントし、一定期間中に、注文サイトへの移動直前に選択された高頻出語句の選択回数の積に応じて、高頻出語句の補正度数を調整したり、表示データに含まれる高頻出語句の強調方法を調整したりする。例えば、各利用者端末30にて注文サイトへの移動する10分前に選択された高頻出語句をカウントし、1週間の間に、選択回数が既定回数以上になった高頻出語句が発生した場合、提供部433は、その高頻出語句の補正度数を高くするか、または、その高頻出語句を他の語句よりも目立つように強調して表示する。また、提供部433は、履歴情報として、高頻出語句を含む表示データの表示時間を取得してもよい。この場合、例えば、各利用者端末30にて高頻出語句の表示された表示時間をカウントし、表示時間の積が既定時間以上になった高頻出語句が発生した場合、提供部433は、その高頻出語句の補正度数を高くするか、または、その高頻出語句を他の語句よりも目立つように強調して表示する。
For example, the providing
(表示データの第6の具体例)
第6の具体例は、第5の具体例と同様に、提供部433が利用者端末30の操作に応じて特定語句の補正度数および表示データの少なくとも一方を調整する例である。具体的には、提供部433は、表示データに含まれる高頻出語句に対する利用者端末30による所定の操作を検出し、その所定の操作に応じて特定語句の補正度数および表示データの少なくとも一方を調整する
(Sixth specific example of display data)
The sixth specific example is an example in which the providing
図6は、表示データの第6の具体例を示す図である。図6(a)に示す注文サイト700のように、ターゲットの注文時に、その注文の参考にした高頻出語句を選択する選択機能701が備わっている場合、提供部433は、注文サイト700において利用者端末30が高頻出語句を選択する操作を所定の操作として検出し、その所定の操作にて選択された高頻出語句に基づいて、表示データおよび補正度数の少なくとも一方を調整する。
FIG. 6 is a diagram showing a sixth specific example of display data. When the
例えば、提供部433は、各利用者端末30の所定の操作において高頻出語句が選択された選択回数を一定期間カウントし、その選択回数に基づいて、高頻出語句の補正度数を調整する。例えば、各利用者端末30にて選択された高頻出語句の選択回数を1カ月間カウントし、選択回数が既定回数以上になった高頻出語句が発生した場合、提供部433は、その高頻出語句の補正度数を高くするか、または、その高頻出語句を他の語句よりも目立つように強調して表示する。また、提供部433は、図6(b)に示す表示データ710ように、表示データ710内の高頻出語句711に対して、その高頻出語句が選択された選択回数712を対応付けてもよい。
For example, the providing
(表示データの第7の具体例)
図7は、提供部433が作成した表示データが表示された際の第7の具体例を示す図である。図7に示す表示データ800は、提供者向けの表示データの一例である。
(7th specific example of display data)
FIG. 7 is a diagram showing a seventh specific example when the display data created by the providing
提供部433は、表示データ800を、特定の提供者が提供するターゲットである提供ターゲットに関する自社情報800aと、提供ターゲットと分析区分が同じ他のターゲットに関する競合他社情報800bとを含めて作成する。自社情報は、提供部433により、提供ターゲットにおいて抽出した高頻出語句801と、その高頻出語句801を含む提供ターゲットに関するクチコミ情報802とを有して作成される情報である。競合他社情報800bは、提供部433により、提供ターゲットと分析区分が同じ他のターゲットにおける高頻出語句803がターゲットごとに抽出され、抽出された高頻出語句803が各々のターゲットごとに対応付けられて表示される情報である。提供部433は作成した表示データを、所定のタイミングで提供者が使用する提供者端末(図示せず)に提供する。
The
次に動作を説明する。 Next, the operation will be described.
図8は、情報提供システム1の動作を説明するためのシーケンス図である。
FIG. 8 is a sequence diagram for explaining the operation of the
先ず、収集装置41の収集部413は、所定の収集タイミングになると、伝送部411を介してWebサーバ10とターゲット情報格納装置20との少なくとも1つと接続し、接続したWebサーバ10または、ターゲット情報格納装置20からターゲット情報を収集する(ステップS101)。収集タイミングは、一定の時間間隔ごとでもよいし、分析システム40の管理者から指示があったタイミングでもよい。
First, the
収集部413は、収集した各ターゲット情報に対して区分情報とターゲット識別情報とを生成し、ターゲット情報と区分情報とをターゲット識別情報ごと対応付けた収集情報を蓄積部412に蓄積する(ステップS102)。
The
その後、分析装置42の制御部423は、接続部421を介して収集装置41と接続して、収集装置41に蓄積された収集情報を取得し(ステップS103)、その収集情報内の各ターゲット情報から特定語句を抽出する(ステップS104)。制御部423は、収集情報内の各ターゲット識別情報が識別する各ターゲットについて、特定語句ごとに、そのターゲットである対象ターゲットに関するクチコミ情報において特定語句が出現する出現度数を算出する(ステップS105)。制御部423は、各ターゲットについて、特定語句ごとに、その特定語句の出現度数を比較クチコミ情報において特定語句が出現する比較度数に基づいて補正した補正度数を算出する(ステップS106)。
After that, the
制御部423は、ターゲット識別情報ごとに、ターゲット情報と特定語句と補正度数とを対応付けた結果情報を生成して、接続部421を介して提供装置43に出力する(ステップS107)。提供装置43の通信部431が結果情報を受信すると、提供部433は、その結果情報を格納部432に格納する(ステップS108)。
The
その後、通信部431が利用者端末30から取得要求を受信すると(ステップS109)、提供部433は、格納部432に格納した結果情報に基づいて、取得要求に応じた表示データを生成して利用者端末30に送信する。利用者端末30は、表示データを受信すると、その表示データを表示する(ステップS110)。
After that, when the
以上説明したように本実施形態によれば、蓄積部412は、ターゲットに関するターゲット情報をターゲットごとに蓄積する。制御部423は、各ターゲットについて、そのターゲットである対象ターゲットに関するターゲット情報において特定語句が出現する出現度数を、他のターゲットに関するターゲット情報を含む比較クチコミ情報において特定語句が出現する比較度数に基づいて補正した補正度数を算出する。提供部433は、ターゲット情報、特定語句および補正度数に応じた表示データを生成する。
As described above, according to the present embodiment, the
したがって、ターゲット情報において特定語句が出現する出現度数が、他のターゲットに関するターゲット情報を含む比較クチコミ情報において特定語句が出現する比較度数に基づいて補正され、ターゲット情報、特定語句および補正度数に応じた表示データが生成される。このため、複数のターゲットに対して同じ特定語句が出現する場合でも、ターゲット間の特定語句の出現頻度の違いなどに応じた表示データを生成することが可能になる。したがって、ターゲットの特徴を表す表示データを生成することが可能になるため、ターゲットの特徴を容易に把握することが可能になる。 Therefore, the frequency of occurrence of a specific word in the target information is corrected based on the frequency of appearance of the specific word in the comparative word-of-mouth information including the target information about other targets, and is adjusted according to the target information, the specific word, and the correction frequency. Display data is generated. Therefore, even when the same specific phrase appears for a plurality of targets, it is possible to generate display data according to the difference in the appearance frequency of the specific phrase between the targets. Therefore, since it is possible to generate display data representing the characteristics of the target, it is possible to easily grasp the characteristics of the target.
また、本実施形態では、制御部423は、特定語句の出現度数として、特定語句を含むクチコミ情報の数を算出する。このため、表示データに利用者によるターゲットの評価をターゲットの特徴として反映しやすくすることが可能になり、ターゲットの特徴をより容易に把握することが可能になる。
Further, in the present embodiment, the
また、本実施形態では、比較クチコミ情報は、対象ターゲットと分析区分が同じターゲットに関するターゲット情報である。このため、比較対象を適切に選択することが可能になるため、出現度数の補正にターゲットの特徴をより適切に反映させることが可能になる。したがって、ターゲットの特徴をより容易に把握することが可能になる。 Further, in the present embodiment, the comparative word-of-mouth information is target information relating to a target having the same analysis category as the target target. Therefore, since it is possible to appropriately select the comparison target, it is possible to more appropriately reflect the characteristics of the target in the correction of the appearance frequency. Therefore, it becomes possible to grasp the characteristics of the target more easily.
また、本実施形態では、制御部423は、比較度数に対する出現度数の突出度合いを示す特徴度を算出し、特徴度に基づいて出現度数を補正する。このため、特定語句の出現度数の突出度合いは特定語句の特徴を表すため、出現度数の補正にターゲットの特徴をより適切に反映させることが可能になる。したがって、ターゲットの特徴をより容易に把握することが可能になる。
Further, in the present embodiment, the
また、本実施形態では、提供部433は、ターゲット情報と、そのターゲット情報に対応する特定語句のうち補正度数が所定の表示条件を満たす特定語句とを対応付けたデータを表示データとして生成する。このため、特定語句のうち補正度数が高い高頻出語句のようなターゲットの特徴を反映した語句をターゲット情報に対応づけて表示することが可能になるため、ターゲットの特徴をより容易に把握することが可能になる。
Further, in the present embodiment, the providing
また、本実施形態では、提供部433は、利用者端末30による表示データに対する操作に応じて、特定語句の補正度数および表示データの少なくとも一方を調整する。このため、他の利用者が興味を持った特定語句などを表示データに反映させることが可能になるため、ターゲットの特徴をより容易に把握することが可能になる。
Further, in the present embodiment, the providing
以上説明した各実施形態において、図示した構成は単なる一例であって、本発明はその構成に限定されるものではない。 In each of the embodiments described above, the illustrated configuration is merely an example, and the present invention is not limited to that configuration.
例えば、ターゲットとして主に宿泊施設を用いて説明したが、ターゲットは宿泊施設に限らない。また、分析システム40は、複数種類のターゲット(例えば、宿泊施設と飲食店など)に関するターゲット情報を分析してもよい。この場合、区分情報に、ターゲットの種類を示す種類情報を加えることで、種類ごとに適切な分析を行うことができる。
For example, although the description mainly uses accommodation facilities as a target, the target is not limited to accommodation facilities. In addition, the
また、分析システム40の構成は適宜変更可能である。例えば、蓄積部412、記憶部422および格納部432は、同一の記憶装置にて実現されてもよい。収集情報は、分析システム40の管理者などから収集装置41に直接登録されてもよい。
Further, the configuration of the
また、情報提供システム1の各装置の機能は、その機能を実現するためのプログラムを、コンピュータにて読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータに読み込ませ実行させることで、実現されてもよい。
Further, as for the function of each device of the
1 情報提供システム
10 Webサーバ
20 ターゲット情報格納装置
30 利用者端末
40 分析システム
41 収集装置
42 分析装置
43 提供装置
411 伝送部
412 蓄積部
413 収集部
421 接続部
422 記憶部
423 制御部
431 通信部
432 格納部
433 提供部
1
Claims (9)
各ターゲットについて、当該ターゲットである対象ターゲットに関するターゲット情報において特定語句が出現する出現度数を、他のターゲットに関するターゲット情報を含む比較ターゲット情報において前記特定語句が出現する比較度数に基づいて補正した補正度数を算出する制御部と、
前記ターゲット情報、前記特定語句および前記補正度数に応じた表示データを生成する生成部と、を有し、
前記蓄積部は、前記ターゲット情報と前記ターゲットの分析区分を示す区分情報とを前記ターゲットごとに蓄積し、
前記比較ターゲット情報は、前記対象ターゲットと前記分析区分が同じターゲットに関するターゲット情報である、情報分析システム。 A storage unit that stores target information about the target for each target,
For each target, the correction frequency in which the specific word appears in the target information related to the target target is corrected based on the comparison frequency in which the specific word appears in the comparison target information including the target information related to other targets. And the control unit that calculates
Have a, a generation unit for generating display data corresponding to the target information, the specific terms and the correction frequency,
The storage unit stores the target information and the classification information indicating the analysis classification of the target for each target.
The comparison target information is an information analysis system in which the target target and the target information having the same analysis category are the target information .
前記制御部は、前記特定語句を含む前記分析対象情報の数を前記出現度数として算出する、請求項1に記載の情報分析システム。 The target information includes a plurality of analysis target information.
The information analysis system according to claim 1, wherein the control unit calculates the number of analysis target information including the specific phrase as the frequency of occurrence.
各ターゲットについて、当該ターゲットである対象ターゲットに関するターゲット情報において特定語句が出現する出現度数を、他のターゲットに関するターゲット情報を含む比較ターゲット情報において前記特定語句が出現する比較度数に基づいて補正した補正度数を算出するステップと、
前記ターゲット情報、前記特定語句および前記補正度数に応じた表示データを生成するステップと、を含み、
前記蓄積部は、前記ターゲット情報と前記ターゲットの分析区分を示す区分情報とを前記ターゲットごとに蓄積し、
前記比較ターゲット情報は、前記対象ターゲットと前記分析区分が同じターゲットに関するターゲット情報である、情報分析方法。 It is an information analysis method by an information analysis system having a storage unit that stores target information about a target for each target.
For each target, the correction frequency in which the specific word appears in the target information related to the target target is corrected based on the comparison frequency in which the specific word appears in the comparison target information including the target information related to other targets. And the steps to calculate
The target information, see contains the steps of: generating a display data corresponding to the specific terms and the correction frequency,
The storage unit stores the target information and the classification information indicating the analysis classification of the target for each target.
The comparison target information is an information analysis method in which the target target and the target information having the same analysis category are the target information .
各ターゲットについて、当該ターゲットである対象ターゲットに関するターゲット情報において特定語句が出現する出現度数を、他のターゲットに関するターゲット情報を含む比較ターゲット情報において前記特定語句が出現する比較度数に基づいて補正した補正度数を算出する手順と、
前記ターゲット情報、前記特定語句および前記補正度数に応じた表示データを生成する手順と、を含み、
前記蓄積部は、前記ターゲット情報と前記ターゲットの分析区分を示す区分情報とを前記ターゲットごとに蓄積し、
前記比較ターゲット情報は、前記対象ターゲットと前記分析区分が同じターゲットに関するターゲット情報である、プログラム。 It is a program for causing a computer to analyze the information stored in the storage unit that stores the target information about the target for each target.
For each target, the correction frequency in which the specific word appears in the target information related to the target target is corrected based on the comparison frequency in which the specific word appears in the comparison target information including the target information related to other targets. And the procedure to calculate
Including the target information, the specific phrase, and a procedure for generating display data according to the correction frequency.
The storage unit stores the target information and the classification information indicating the analysis classification of the target for each target.
The comparison target information is a program in which the target target and the target having the same analysis category are the target information .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018036389A JP6781723B2 (en) | 2018-03-01 | 2018-03-01 | Information analysis system and information analysis method. |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018036389A JP6781723B2 (en) | 2018-03-01 | 2018-03-01 | Information analysis system and information analysis method. |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019152959A JP2019152959A (en) | 2019-09-12 |
JP6781723B2 true JP6781723B2 (en) | 2020-11-04 |
Family
ID=67946363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018036389A Active JP6781723B2 (en) | 2018-03-01 | 2018-03-01 | Information analysis system and information analysis method. |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6781723B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7455913B2 (en) * | 2021-08-31 | 2024-03-26 | ネイバー コーポレーション | Method, system, and computer program for automatically classifying lower-level item categories through review analysis for use in searches |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3476185B2 (en) * | 1999-12-27 | 2003-12-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Information extraction system, information processing device, information collection device, character string extraction method, and storage medium |
US10108639B2 (en) * | 2014-02-14 | 2018-10-23 | Rakuten, Inc. | Display control device, display control device control method, program and information storage medium |
JP6407279B2 (en) * | 2014-06-30 | 2018-10-17 | 楽天株式会社 | Information processing apparatus, information processing method, and program for information processing apparatus |
-
2018
- 2018-03-01 JP JP2018036389A patent/JP6781723B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019152959A (en) | 2019-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11301884B2 (en) | Seed population diffusion method, device, information delivery system and storage medium | |
JP6858990B2 (en) | High-precision search method on website | |
WO2017121251A1 (en) | Information push method and device | |
US9514202B2 (en) | Information processing apparatus, information processing method, program for information processing apparatus and recording medium | |
CN110020128B (en) | Search result ordering method and device | |
US20150332373A1 (en) | Method and system for pushing mobile application | |
US20130297419A1 (en) | Taxonomy based targeted search advertising | |
CN109325182B (en) | Information pushing method and device based on session, computer equipment and storage medium | |
US11676194B2 (en) | Faceted item recommendation system | |
EP1493118A1 (en) | Determination of attributes based on product descriptions | |
JP6679451B2 (en) | Selection device, selection method, and selection program | |
JP2013506195A (en) | Method, apparatus and system for increasing transfer rate of website data | |
US20150205580A1 (en) | Method and System for Sorting Online Videos of a Search | |
JPWO2012002351A1 (en) | Information processing apparatus, information processing method, and information processing program | |
KR100970335B1 (en) | Method for updating interest keyword of user and system for executing the method | |
CN109241451B (en) | Content combination recommendation method and device and readable storage medium | |
CN112612942B (en) | Social big data-based fund recommendation system and method | |
US20130066800A1 (en) | Method of aggregating consumer reviews | |
JP2012018571A (en) | Content recommendation apparatus and method | |
CN110175264A (en) | Construction method, server and the computer readable storage medium of video user portrait | |
US20150294383A1 (en) | Online bidding management system | |
JP5597613B2 (en) | Information processing apparatus, information processing method, information processing program, and recording medium | |
JP6781723B2 (en) | Information analysis system and information analysis method. | |
CN115129994A (en) | Commodity recommendation method and device, electronic equipment and readable storage medium | |
US20120072281A1 (en) | Method and system to monetize domain queries in sponsored search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190410 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200225 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200407 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200611 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201006 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201016 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6781723 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |