JP5008701B2 - Kansei information providing apparatus, method and program thereof - Google Patents

Kansei information providing apparatus, method and program thereof Download PDF

Info

Publication number
JP5008701B2
JP5008701B2 JP2009187643A JP2009187643A JP5008701B2 JP 5008701 B2 JP5008701 B2 JP 5008701B2 JP 2009187643 A JP2009187643 A JP 2009187643A JP 2009187643 A JP2009187643 A JP 2009187643A JP 5008701 B2 JP5008701 B2 JP 5008701B2
Authority
JP
Japan
Prior art keywords
expression
information
sensitivity
polar
occurrence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009187643A
Other languages
Japanese (ja)
Other versions
JP2011039861A (en
Inventor
久子 浅野
いづみ 高橋
のぞみ 小林
義博 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009187643A priority Critical patent/JP5008701B2/en
Publication of JP2011039861A publication Critical patent/JP2011039861A/en
Application granted granted Critical
Publication of JP5008701B2 publication Critical patent/JP5008701B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、イメージを直接表した表現である感性表現に対して感性情報を付与する技術に関する。   The present invention relates to a technique for giving sensitivity information to a sensitivity expression that is an expression that directly represents an image.

ある対象に対するイメージ(印象)を表す情報である感性情報は、SD法(Semantic Differential method)等の主観評価実験を用いて付与するのが一般的である(非特許文献1参照)。しかしながら、主観評価実験はコストが高く、また、あまりに多くの対象を評価するのは困難であるため、大量の対象に対して感性情報を付与することはできなかった。   Sensitivity information, which is information representing an image (impression) for a certain object, is generally given using a subjective evaluation experiment such as the SD method (Semantic Differential method) (see Non-Patent Document 1). However, the subjective evaluation experiment is expensive, and it is difficult to evaluate too many objects, and thus it has not been possible to give sensitivity information to a large number of objects.

池添 他「音楽感性空間を用いた感性語による音楽データベース検索システム」、情報処理学会論文誌、Vol.42、No.12、2001、pp.3201-3212Ikezoe et al. “Music database search system using sensibility words using music sensibility space”, Transactions of Information Processing Society of Japan, Vol.42, No.12, 2001, pp.3201-3212

ここで、あるもののイメージを表すベースとなる基本的な表現は、「まったり」、「シンプル」、「美しい」等の、イメージを直接表した表現である感性表現であると考えることができる。そして、この感性表現に対する感性情報が与えられれば、任意の対象について、その対象と関連する(複数の)感性表現の感性情報を用いて、当該任意の対象に対する感性情報を付与することができると考えられる。   Here, the basic expression that represents the image of a certain object can be considered to be a Kansei expression that is an expression that directly represents the image, such as “married”, “simple”, and “beautiful”. And if the sensitivity information with respect to this emotional expression is given, the sensitivity information for the arbitrary object can be given to the arbitrary object by using the sensitivity information of the emotional expression (s) related to the object. Conceivable.

しかしながら、感性表現についてもその数は数百〜数千にのぼるため、主観評価実験により全ての感性表現に対して感性情報を付与するのは難しかった。   However, since the number of emotional expressions is several hundred to several thousand, it has been difficult to impart sensitivity information to all the emotional expressions by subjective evaluation experiments.

本発明は、上記の点に鑑みなされたもので、テキストから特定の言語表現パタン、即ち感性表現と感性空間上の極表現との特定の共起パタンを抽出することにより、数百〜数千の感性表現に対する感性情報の付与を可能とすることを目的とする。   The present invention has been made in view of the above points, and by extracting a specific language expression pattern from text, that is, a specific co-occurrence pattern of a sensitivity expression and a polar expression in the sensitivity space, hundreds to thousands It is an object to make it possible to add sensibility information to the sensibility expression.

本発明の感性情報付与装置は、感性表現に関する少なくとも1つの軸(感性軸)によって構成される感性空間上で感性表現を位置付け、各感性軸に対する値である感性ベクトルを特徴量とする感性情報を付与するものである。ここで、感性軸は予め定義しておくものとし、感性軸の両極を表す極表現も予め定義しておくものとする。また、極表現は感性表現でもあるものとする。例えば、感性軸として「美しさ」に関する軸を定義した場合、その一方の極表現は感性表現「美しい」、「うつくしい」等であり、他方の極表現は感性表現「醜い」等となる。   The sensibility information providing apparatus of the present invention positions sensibility expression on a sensibility space constituted by at least one axis (sensitivity axis) related to sensibility expression, and sensibility information having a sensibility vector as a feature amount as a value for each sensibility axis. It is given. Here, it is assumed that the sensitivity axis is defined in advance, and polar expressions representing both poles of the sensitivity axis are also defined in advance. The polar expression is also a sensitivity expression. For example, when the axis related to “beauty” is defined as the sensitivity axis, one extreme expression is the sensitivity expression “beautiful”, “beautiful”, and the other extreme expression is the sensitivity expression “ugly”.

より具体的には、本発明の感性情報付与装置は、
入力されたテキストに対してテキスト解析を行い、テキスト解析情報を出力するテキスト解析部と、
前記テキスト解析情報と、感性表現を表す単語列の情報を登録した感性表現辞書と、感性表現と感性空間上の感性軸の極を表す極表現とが特定の関係をもって共起する場合の単語列の正規表現からなる共起パタンを登録した共起パタン抽出ルールとを用いて、極表現と特定の関係をもって共起した感性表現およびその出現数に関する情報である極単位共起感性表現情報を抽出する感性共起パタン抽出部と、
極単位共起感性表現情報を用いて、各感性表現の感性ベクトルからなる感性情報を出力する感性特徴量付与部とを備えたことを特徴とする。
More specifically, the sensitivity information providing device of the present invention is:
A text analysis unit that performs text analysis on the input text and outputs text analysis information;
A word string when the text analysis information, a sensitivity expression dictionary in which information of a word string representing a sensitivity expression is registered, and a sensitivity expression and a polar expression representing the pole of the sensitivity axis in the sensitivity space co-occur with a specific relationship Using the co-occurrence pattern extraction rule that registered the co-occurrence pattern consisting of regular expressions, extract the per-co-occurrence emotional expression information that is information about the emotional expression that co-occurs with a specific relationship with the polar expression and the number of occurrences. A sensibility co-occurrence pattern extraction unit,
And a sensitivity feature amount adding unit that outputs sensitivity information including sensitivity vectors of each sensitivity expression using the polar unit co-occurrence sensitivity expression information.

本発明によれば、テキストから感性表現と感性空間上の極表現との特定の共起パタンを抽出することにより、数百〜数千の感性表現に対する感性ベクトルからなる感性情報を生成して付与することができる。   According to the present invention, by extracting a specific co-occurrence pattern of a Kansei expression and a polar expression in Kansei space from text, Kansei information consisting of Kansei vectors for hundreds to thousands of Kansei expressions is generated and assigned. can do.

本発明の感性情報付与装置の実施の形態の一例を示す構成図The block diagram which shows an example of embodiment of the sensitivity information provision apparatus of this invention 本発明における感性情報付与処理の流れ図Flow chart of Kansei information adding process in the present invention 感性共起パタン抽出部における感性共起パタン抽出処理の流れ図Flow chart of Kansei Co-occurrence Pattern Extraction Process in Kansei Co-occurrence Pattern Extraction Unit 感性特徴量付与部における感性特徴量付与処理の流れ図Flow chart of Kansei feature value adding process in Kansei feature value adding unit テキスト解析および感性共起パタン抽出処理のようすの一例を示す説明図Explanatory drawing which shows an example of the state of text analysis and Kansei co-occurrence pattern extraction processing 感性表現辞書の一例を示す説明図Explanatory drawing which shows an example of a sensitivity expression dictionary 共起パタン抽出ルールの一例を示す説明図Explanatory drawing which shows an example of a co-occurrence pattern extraction rule 極単位共起感性表現情報の一例を示す説明図Explanatory drawing which shows an example of polar unit co-occurrence sensibility expression information 感性情報の一例を示す説明図Explanatory diagram showing an example of sensitivity information

以下、本発明を図示の実施の形態により詳細に説明する。   Hereinafter, the present invention will be described in detail with reference to the illustrated embodiments.

本発明の感性情報付与装置は、コンピュータ装置からなり、キーボード等の入力手段、モニタ等の表示手段(出力手段)、ハードディスクやメモリ等の記億手段および外部ネットワークに接続可能な通信装置等(いずれも図示省略)を備えている。   The sensitivity information providing apparatus of the present invention comprises a computer device, and includes input means such as a keyboard, display means (output means) such as a monitor, storage means such as a hard disk and memory, and a communication device that can be connected to an external network (any Are also not shown).

本発明の感性情報付与装置は、図1に示すように、テキスト解析部1、感性共起パタン抽出部2、感性特徴量付与部3、感性表現辞書(記憶部)4および共起パターン抽出ルール(記憶部)5から構成され、図示しない入力手段から直接入力され又は記憶手段から読み出されて入力され又は通信媒体を介して他の装置等から入力されたテキスト(文書)を入力とし、感性ベクトルからなる感性情報を出力する。   As shown in FIG. 1, the sensitivity information providing apparatus of the present invention includes a text analysis unit 1, a sensitivity co-occurrence pattern extraction unit 2, a sensitivity feature value addition unit 3, a sensitivity expression dictionary (storage unit) 4, and a co-occurrence pattern extraction rule. (Storage unit) 5 is composed of a text (document) input directly from an input means (not shown) or read from a storage means or input from another device or the like via a communication medium. Outputs Kansei information consisting of vectors.

ここでいうテキストとしては、Web等から収集した大規模なテキストの集合(コーパス)を想定しているが、どのようなテキストを用いるかは任意である。テキストの一例を図5(a)に示す。   The text here is assumed to be a large-scale text collection (corpus) collected from the Web or the like, but what kind of text is used is arbitrary. An example of the text is shown in FIG.

テキスト解析部1は、入力されたテキストに対し、少なくとも周知の形態素解析処理(単語情報を生成)を含むテキスト解析処理を行い、少なくとも単語情報(単語の表記、品詞、読み等からなる)を含むテキスト解析情報を出力する(図2のステップS1)。なお、テキスト解析処理として、形態素解析処理に加え、文節情報(文節境界や文節の主辞、主機能語に関する情報)や係り受け情報を付与する周知の係り受け解析処理を行っても良い。   The text analysis unit 1 performs at least a well-known morphological analysis process (generates word information) on the input text, and includes at least word information (consisting of word notation, part of speech, reading, etc.). Text analysis information is output (step S1 in FIG. 2). As text analysis processing, in addition to morphological analysis processing, well-known dependency analysis processing for adding clause information (information about clause boundaries, main phrases of clauses, main function words) and dependency information may be performed.

テキスト解析情報の一例として、図5(a)のテキストに対して形態素解析処理および係り受け解析処理を行ったときの単語情報(単語境界を’/’または’//’で記述。品詞や読み等は省略)および文節情報(文節境界を’//’で記述)からなるテキスト解析情報を図5(b)に示す。   As an example of the text analysis information, word information (word boundary is described by '/' or '//' when the morphological analysis processing and dependency analysis processing are performed on the text of FIG. FIG. 5B shows text analysis information including clause information (sentence boundaries are described by “//”).

感性共起パタン抽出部2は、テキスト解析部1から出力されたテキスト解析情報を入力とし、感性表現辞書4および共起パタン抽出ルール5を用いて、極表現と当該極表現に対して特定の関係をもって共起した感性表現およびその出現数に関する情報とからなる極単位共起感性表現情報を抽出して出力する(図2のステップS2)。   The emotional co-occurrence pattern extraction unit 2 receives the text analysis information output from the text analysis unit 1 as input, and uses the sensitivity expression dictionary 4 and the co-occurrence pattern extraction rule 5 to specify the polar expression and the polar expression. The polar-unit co-occurrence sensitivity expression information composed of the sensitivity expression co-occurring with the relationship and the information regarding the number of appearances is extracted and output (step S2 in FIG. 2).

感性表現辞書4は、感性表現を構成する単語列(少なくとも1つの単語からなる文字列)の単語情報と、その感性表現がどのような種類のものであるかを表すカテゴリ(情報)とを感性表現単位に登録してなるもので、図6にその一例を示す。   The emotional expression dictionary 4 shows the word information of the word string (character string consisting of at least one word) constituting the emotional expression and the category (information) indicating the kind of the emotional expression. An example of this is shown in FIG.

図6において、例えば先頭の感性表現は、表記、品詞、読みが「美し/形容詞語幹/ウツクシ」である1単語で構成され、そのカテゴリは「極表現1A−形容詞」、つまり感性空間上の軸1に対するA極(ここでは両極をA極,B極で表現している)で、かつ活用タイプが形容詞であることを表している。   In FIG. 6, for example, the first emotional expression is composed of one word whose notation, part of speech, and reading are “Beauty / adjective stem / inspired”, and its category is “polar expression 1A-adjective”, that is, on the emotional space. It represents the A pole for axis 1 (here, both poles are represented as A pole and B pole) and the utilization type is an adjective.

共起パタン抽出ルール5は、感性表現と前述した感性空間上での極表現とが特定の関係をもって並列的に出現する(共起する)場合の当該感性表現を構成する単語列の正規表現と当該極表現を構成する単語列の正規表現とからなる共起パタンを、ルールID、並びに当該共起パタンが感性表現および極表現のどのような組み合わせからなるものであるかを表すカテゴリ(情報)とともに登録したものである。   The co-occurrence pattern extraction rule 5 is a regular expression of a word string constituting the emotional expression when the emotional expression and the polar expression on the emotional space described above appear in parallel with a specific relationship (co-occur). A category (information) representing a co-occurrence pattern composed of a regular expression of a word string constituting the polar expression, a rule ID, and a combination of the emotional expression and the polar expression. It was registered with.

図7は共起パタン抽出ルール5の一例を示すもので、ここでは活用タイプが形容名詞である感性表現の直後に極表現が出現する場合のいくつかの共起パタンを単語単位の正規表現として記述しているが、実際にはこれ以外にも様々な共起パタンが登録されている。共起パタンにおいて、<>で1個(の単語)の正規表現、(?:<>)*で0個以上(の単語)の正規表現、(?:<>)?で0または1個(の単語)の正規表現を表し、e:の直後に感性表現辞書照合条件、P:の直後に文節位置条件、h:の直後に表記条件、p:の直後に品詞条件を記述している。また、()で指定されたグループ単位に、結果を出力することにしている。   FIG. 7 shows an example of the co-occurrence pattern extraction rule 5. Here, some co-occurrence patterns when a polar expression appears immediately after a sensitivity expression whose utilization type is an adjective noun are used as regular expressions in units of words. Although described, various other co-occurrence patterns are actually registered. In the co-occurrence pattern, <> is one regular expression, (?: <>) * Is zero or more regular words, (?: <>)? Represents a regular expression of 0 or 1 (word), e. Immediately after the emotional expression dictionary matching condition, P: immediately after the phrase position condition, h: immediately after the notation condition, p: immediately after the part of speech condition Is described. In addition, the result is output in units of groups designated by ().

感性共起パタン抽出部2の処理について、図3を用いて詳細に説明する。   The process of the sensibility co-occurrence pattern extraction unit 2 will be described in detail with reference to FIG.

まず、ステップS21の感性表現抽出処理では、テキスト解析情報と感性表現辞書4とを照合し、感性表現辞書4中の感性表現とマッチした単語列の位置およびそのカテゴリ(情報)を前記テキスト解析情報に追記する。   First, in the emotional expression extraction process in step S21, the text analysis information and the emotional expression dictionary 4 are collated, and the position of the word string that matches the emotional expression in the emotional expression dictionary 4 and its category (information) are described in the text analysis information. Add to

図5(b)のテキスト解析情報に対し、図6の感性表現辞書4を用いた場合の照合結果を追加したテキスト解析情報を図5(c)に示す。下線で表示した部分が、感性表現辞書4とマッチした単語列となる。   FIG. 5C shows text analysis information obtained by adding a collation result when the sensitivity expression dictionary 4 of FIG. 6 is used to the text analysis information of FIG. 5B. The underlined portion is a word string that matches the sentiment expression dictionary 4.

次に、ステップS22の共起パタン抽出処理では、感性表現の位置およびそのカテゴリが追記されたテキスト解析情報と共起パタン抽出ルール5との正規表現照合を行い、共起パタン抽出ルール5中の共起パタンとマッチした極表現および感性表現のペアを共起感性表現情報として出力する。   Next, in the co-occurrence pattern extraction process of step S22, regular expression matching is performed between the text analysis information in which the position of the emotional expression and its category are added and the co-occurrence pattern extraction rule 5, and the co-occurrence pattern extraction rule 5 A pair of polar expression and Kansei expression matched with the co-occurrence pattern is output as co-occurrence Kansei expression information.

ここで、テキスト解析情報中の同一の単語が、共起パタン抽出ルール5内の複数のルールの共起パタンと重複してマッチするケースが考えられるが、優先すべき条件を予め定めておき、重複を解消するようにしても良い。例えば、ここでは重複したルールがある場合、単語数がより多くマッチしたルールを優先することとする。   Here, there may be a case where the same word in the text analysis information overlaps with the co-occurrence patterns of a plurality of rules in the co-occurrence pattern extraction rule 5, but a condition to be prioritized is determined in advance. You may make it eliminate duplication. For example, here, when there are duplicate rules, priority is given to a rule that matches more words.

さらに、共起パタン抽出ルール5によって抽出された共起感性表現情報に対し、抽出中に与えられた情報により制限を行っても良い。例えば、ここでは図7の共起パタン抽出ルールにおいて、カテゴリが非感性表現であるものは共起感性表現情報から除外することとする。   Further, the co-occurrence sensibility expression information extracted by the co-occurrence pattern extraction rule 5 may be limited by information given during extraction. For example, in the co-occurrence pattern extraction rule of FIG. 7, here, a category whose category is non-sensitive expression is excluded from the co-occurrence sensitive expression information.

図5(c)のテキスト解析情報に対し、図7の共起パタン抽出ルール5および省略した他の活用タイプの抽出ルールを用いた場合の共起感性表現情報を図5(d)に示す。   FIG. 5 (d) shows co-occurrence sensibility expression information when the co-occurrence pattern extraction rule 5 of FIG. 7 and other omitted utilization type extraction rules are used for the text analysis information of FIG. 5 (c).

「目の前に〜」の文からは、ルールID=感性−極−形名1のルールにより、「幻想的」(感性表現)と「美し」(極表現)とが抽出される。「その舞台〜」の文は、「自由」という単語が文節の先頭ではないため、どの共起パタンも満たさず、抽出は行われない。「ふわふわして〜」の文からは、図6では記述を省略した「〜した」活用タイプのルールとマッチして、「ふわふわし」(感性表現)と「やわらか」(極表現)とが抽出される。括弧内に記述したのは、抽出した表現の標準形である。この例では、形容詞等の活用のある語は終止形にし、表記ゆらぎ等も統一(うつくしい→美しい)したものを標準形として扱っている。   From the sentence “in front of eyes”, “fantasy” (sensitivity expression) and “beauty” (polar expression) are extracted according to the rule of rule ID = sensitivity-polar-type name 1. The sentence “that stage” does not satisfy any of the co-occurrence patterns because the word “freedom” is not the head of the phrase, and is not extracted. From the sentence "Fuwafuwashite ~", "Fuwafuwashi" (Kansei expression) and "Soft" (Pole expression) are extracted to match the rules for the type of use that was omitted in Fig. 6. Is done. Described in parentheses is the standard form of the extracted expression. In this example, words that use adjectives, etc. are treated as final forms, and notation fluctuations, etc., are unified (beautiful → beautiful) as standard forms.

次に、ステップS23の共起感性表現出力処理では、ステップS22で抽出した各共起感性表現情報を極表現単位に集計する。集計結果は、極表現単位に、共起した感性表現の標準形とその出現数を「共起感性表現標準形:共起頻度(出現数)」の形式で共起頻度順に出力する(なお、標準形ではなく、出現形そのものを用いても良い。)。また、この際、共起頻度のうちの最大値を最大頻度、全ての共起頻度の総計を全頻度として算出し、併せて出力するものとする。これらの情報をまとめて極単位共起感性表現情報と呼び、図8にその一例を示す。   Next, in the co-occurrence sensibility expression output process in step S23, each co-occurrence sensation expression information extracted in step S22 is tabulated in polar expression units. The tabulation results are output in the co-occurrence frequency in the form of “co-occurrence sensitivity expression standard form: co-occurrence frequency (number of occurrences)” in the polar expression unit in the standard form of co-occurrence Kansei expression and the number of occurrences thereof The appearance form itself may be used instead of the standard form.) At this time, the maximum value of the co-occurrence frequencies is calculated as the maximum frequency, and the total of all the co-occurrence frequencies is calculated as the total frequency, and is output together. These pieces of information are collectively called polar unit co-occurrence sensation expression information, and an example is shown in FIG.

感性特徴量付与部3は、極単位共起感性表現情報を用いて、各感性表現の感性ベクトルからなる感性情報を出力する(図2のステップS3)。   The affective feature amount assigning unit 3 uses the polar unit co-occurrence affective expression information to output the affective information including the affective vector of each affective expression (step S3 in FIG. 2).

感性特徴量付与部3の処理について、図4を用いて詳細に説明する。   The process of the sensibility feature amount assigning unit 3 will be described in detail with reference to FIG.

図4は一つの感性軸(例えば、軸1:美しい−醜い)に対する処理のフローを示している。図4の処理を予め定められた感性空間上の全ての感性軸に対して行い、その後、感性表現単位に出力することにより、図9に示すような、各感性表現の感性ベクトルからなる感性情報を出力することとなる。   FIG. 4 shows a processing flow for one sensitivity axis (for example, axis 1: beautiful-ugly). The processing shown in FIG. 4 is performed for all the sensitivity axes in a predetermined sensitivity space, and then output to the sensitivity expression unit, whereby sensitivity information composed of sensitivity vectors of each sensitivity expression as shown in FIG. Will be output.

本例では、各感性軸は「1」から「−1」までの範囲の値を取るよう正規化した値をとるものとする。このうち、極表現Aは正の最大値「1」、極表現Bは負の最大値「−1」をとるものと規定する。   In this example, each sensitivity axis is assumed to have a value normalized so as to take a value in a range from “1” to “−1”. Among these, it is defined that the polar representation A takes a positive maximum value “1” and the polar representation B takes a negative maximum value “−1”.

まず、ステップS31の極表現最大値付与処理では、以後の処理で求める特徴値を正規化するため、極表現を単位として、当該極の極表現がその極の最大値をとるように極表現正規化前最大値を規定する。例えば、極表現単位の最大頻度および全頻度を用いて、
極表現正規化前最大値=ln(a×全頻度+最大頻度)
(但し、aは予め規定した定数)
より、正規化前最大値を算出する例が考えられる。
First, in the polar expression maximum value assigning process in step S31, in order to normalize the feature values obtained in the subsequent processes, the polar expression normalization is performed so that the polar expression of the relevant pole takes the maximum value of the pole in units of the polar expression. Specifies the maximum value before conversion. For example, using the maximum and total frequency of polar representation units,
Maximum value before polar expression normalization = ln (a x total frequency + maximum frequency)
(Where a is a predetermined constant)
Thus, an example of calculating the maximum value before normalization can be considered.

例えば、a=0.05とした場合、図8の極単位共起感性表現情報中の軸1に関する情報を例に取ると、
極表現正規化前最大値(1A)=ln(0.05×25000+10000)=ln(11250)=9.328
極表現正規化前最大値(1B)=ln(0.05×10000+4000)=ln(4500)=8.412
となる。
For example, when a = 0.05, taking information about axis 1 in the polar unit co-occurrence sensation expression information of FIG. 8 as an example,
Maximum value before polar expression normalization (1A) = ln (0.05 × 25000 + 10000) = ln (11250) = 9.328
Maximum value before polar expression normalization (1B) = ln (0.05 × 10000 + 4000) = ln (4500) = 8.412
It becomes.

次に、ステップS32の極特徴量付与処理では、極表現を単位として、当該極表現と特定の関係をもって共起した各感性表現に対して正規化された特徴量(極特徴量)を付与する。例えば、極表現単位の各感性表現の共起頻度および前述した極表現正規化前最大値を用いて、
極特徴量=ln(感性表現の共起頻度)/極表現正規化前最大値
より、極特徴量を算出する例が考えられる。
Next, in the polar feature value adding process of step S32, a normalized feature value (polar feature value) is assigned to each emotional expression co-occurring with a specific relationship with the polar expression in units of the polar expression. . For example, using the co-occurrence frequency of each emotional expression in the polar expression unit and the maximum value before normalizing the polar expression described above,
An example in which the polar feature value is calculated from the polar feature value = ln (co-occurrence frequency of sensitivity expression) / maximum value before polar expression normalization is considered.

図8の極単位共起感性表現情報中の軸1に関する情報を例に取ると、
極特徴量(若い@1A)=ln(10000)/9.33=0.987
極特徴量(弱い@1A)=ln(1000)/9.33=0.741
極特徴量(汚い@1B)=ln(4000)/8.41=0.986
極特徴量(弱い@1B)=ln(2000)/8.41=0.904
等となる。
Taking information about axis 1 in the polar unit co-occurrence sensibility expression information of FIG. 8 as an example,
Extreme feature (young @ 1A) = ln (10000) / 9.33 = 0.987
Extreme feature (weak @ 1A) = ln (1000) / 9.33 = 0.741
Extreme feature (dirty @ 1B) = ln (4000) / 8.41 = 0.986
Extreme feature (weak 1B) = ln (2000) / 8.41 = 0.904
Etc.

次に、ステップS33の軸特徴量付与処理では、感性軸を単位として、その極表現のいずれか一方もしくは両方と特定の関係をもって共起した各感性表現に対して正規化された特徴量(軸特徴量)を付与する。例えば、前述した極特徴量を用いて、一方の極表現とのみ共起した感性表現についてはその極特徴量をそのまま軸特徴量とし、両極表現と共起した感性表現についてはそれらの極特徴量の和を軸特徴量とする。但し、極表現Bの極特徴量については、予め符号を反転させて負の値を付与しておくものとする。   Next, in the axis feature amount giving process in step S33, the feature amount normalized with respect to each sensitivity expression co-occurring with a specific relationship with one or both of the polar expressions, with the sensitivity axis as a unit. (Feature amount). For example, using the polar features described above, the sensitivity feature co-occurring with only one extreme representation is taken as the axial feature value as it is, and the sensitivity feature co-occurring with the bipolar representation is used as the extreme feature value. Is the axis feature. However, for the polar feature amount of the polar expression B, a negative value is given by reversing the sign in advance.

上述した極特徴量を例に採ると、
軸特徴量(若い@1軸)=0.987
軸特徴量(弱い@1軸)=0.741−0.904=−0.163
極特徴量(汚い@1軸)=−0.986
等となる。
Taking the above polar feature as an example,
Axis feature (young @ 1 axis) = 0.987
Axis features (weak @ 1 axis) = 0.741-0.904 = -0.163
Extreme feature (dirty @ 1 axis) = -0.986
Etc.

ここで、ある感性表現が両極表現と共起し、その極特徴量がどちらも予め規定した値以上である場合には、軸特徴量を0とする補正を行っても良い。また、両極表現の極特徴量の和(実際には差分)が、別途規定した値以下である場合には、軸特徴量を0とする補正を行っても良い。   Here, when a certain sensibility expression co-occurs with the bipolar expression, and both of the polar feature quantities are equal to or greater than a predetermined value, correction may be performed so that the axial feature quantity is zero. In addition, when the sum (in fact, difference) of the polar feature amounts of the bipolar representation is equal to or less than a separately specified value, correction may be performed so that the axial feature amount is zero.

1:テキスト解析部、2:感性共起パタン抽出部、3:感性特徴量付与部、4:感性表現辞書(記憶部)、5:共起パターン抽出ルール(記憶部)。   1: text analysis unit, 2: sensibility co-occurrence pattern extraction unit, 3: sensibility feature value adding unit, 4: kansei expression dictionary (storage unit), 5: co-occurrence pattern extraction rule (storage unit).

Claims (9)

感性表現に対して感性情報を付与する感性情報付与装置であって、
入力されたテキストに対してテキスト解析を行い、テキスト解析情報を出力するテキスト解析部と、
前記テキスト解析情報と、感性表現を表す単語列の情報を登録した感性表現辞書と、感性表現と感性空間上の感性軸の極を表す極表現とが特定の関係をもって共起する場合の単語列の正規表現からなる共起パタンを登録した共起パタン抽出ルールとを用いて、極表現と特定の関係をもって共起した感性表現およびその出現数に関する情報である極単位共起感性表現情報を抽出する感性共起パタン抽出部と、
極単位共起感性表現情報を用いて、各感性表現の感性ベクトルからなる感性情報を出力する感性特徴量付与部とを備えた
ことを特徴とする感性情報付与装置。
A sensitivity information giving device for giving sensitivity information to a sensitivity expression,
A text analysis unit that performs text analysis on the input text and outputs text analysis information;
A word string when the text analysis information, a sensitivity expression dictionary in which information of a word string representing a sensitivity expression is registered, and a sensitivity expression and a polar expression representing the pole of the sensitivity axis in the sensitivity space co-occur with a specific relationship Using the co-occurrence pattern extraction rule that registered the co-occurrence pattern consisting of regular expressions, extract the per-co-occurrence emotional expression information that is information about the emotional expression that co-occurs with a specific relationship with the polar expression and the number of occurrences. A sensibility co-occurrence pattern extraction unit,
A sensibility information providing apparatus comprising: a sensibility feature amount adding unit that outputs sensibility information including sensitivity vectors of each sensibility expression using polar unit co-occurrence sensibility expression information.
感性共起パタン抽出部は、
前記テキスト解析情報と感性表現辞書とを照合し、マッチした単語列の情報を前記テキスト解析情報に追記する手段と、
前記追記されたテキスト解析情報と共起パタン抽出ルールとを照合し、マッチした極表現および感性表現のペアを共起感性表現情報として出力する手段と、
前記共起感性表現情報を極表現単位に集計して極単位共起感性表現情報を出力する手段とからなる
ことを特徴とする請求項1に記載の感性情報付与装置。
Kansei co-occurrence pattern extraction unit
Means for collating the text analysis information with the sensibility expression dictionary and adding information on the matched word string to the text analysis information;
Means for collating the added text analysis information and the co-occurrence pattern extraction rule, and outputting a matched polar expression and sensitivity expression pair as co-occurrence sensitivity expression information;
The sensibility information providing apparatus according to claim 1, further comprising means for counting the co-occurrence sensibility expression information into polar expression units and outputting the polar unit co-occurrence sensation expression information.
感性共起パタン抽出部は、
テキスト解析情報中の文節情報に基づき、極表現と特定の関係をもって共起した感性表現のうち文節の先頭でない感性表現を抽出対象外とする
ことを特徴とする請求項1または2に記載の感性情報付与装置。
Kansei co-occurrence pattern extraction unit
The sensitivity according to claim 1 or 2, characterized in that, based on the phrase information in the text analysis information, a sensitivity expression that is not at the beginning of the phrase is excluded from the emotional expression that co-occurs with a specific relationship with the polar expression. Information grant device.
前記感性特徴量付与部は、
極単位共起感性表現情報を用いて、特徴値を正規化するための極表現正規化前最大値を算出する手段と、
極単位共起感性表現情報および極表現正規化前最大値を用いて、極表現と特定の関係をもって共起した各感性表現に対して正規化された極特徴量を算出する手段と、
極特徴量を用いて、極表現のいずれか一方もしくは両方と特定の関係をもって共起した各感性表現に対して正規化された軸特徴量を算出する手段とからなる
ことを特徴とする請求項1乃至3のいずれかに記載の感性情報付与装置。
The sensibility feature value giving unit is:
Means for calculating a maximum value before normalization of the polar expression for normalizing the feature value using the polar unit co-occurrence sensitivity expression information;
Means for calculating polar features normalized for each emotional expression co-occurring with a particular relationship with the polar expression using the polar unit co-occurrence emotional expression information and the maximum value before normalization of the polar expression;
A means for calculating a normalized axial feature value for each emotional expression co-occurring with a specific relationship with one or both of the polar expressions using the polar feature value. The sensitivity information providing apparatus according to any one of 1 to 3.
感性表現に対して感性情報を付与する感性情報付与方法であって、
テキスト解析部が、入力されたテキストに対してテキスト解析を行い、テキスト解析情報を出力するステップと、
感性共起パタン抽出部が、前記テキスト解析情報と、感性表現を表す単語列の情報を登録した感性表現辞書と、感性表現と感性空間上の感性軸の極を表す極表現とが特定の関係をもって共起する場合の単語列の正規表現からなる共起パタンを登録した共起パタン抽出ルールとを用いて、極表現と特定の関係をもって共起した感性表現およびその出現数に関する情報である極単位共起感性表現情報を抽出するステップと、
感性特徴量付与部が、極単位共起感性表現情報を用いて、各感性表現の感性ベクトルからなる感性情報を出力するステップとを含む
ことを特徴とする感性情報付与方法。
A sensitivity information providing method for providing sensitivity information to a sensitivity expression,
A step in which the text analysis unit performs text analysis on the input text and outputs text analysis information;
The emotional co-occurrence pattern extraction unit has a specific relationship between the text analysis information, the emotional expression dictionary in which information on the word string representing the emotional expression is registered, and the polar expression representing the pole of the emotional axis in the emotional space Using the co-occurrence pattern extraction rule that registered the co-occurrence pattern consisting of regular expressions of word strings in the case of co-occurring with Extracting unit co-occurrence sensibility expression information;
And a step of outputting sensitivity information composed of sensitivity vectors of each sensitivity expression using the pole unit co-occurrence sensitivity expression information.
感性共起パタン抽出ステップは、
前記テキスト解析情報と感性表現辞書とを照合し、マッチした単語列の情報を前記テキスト解析情報に追記するステップと、
前記追記されたテキスト解析情報と共起パタン抽出ルールとを照合し、マッチした極表現および感性表現のペアを共起感性表現情報として出力するステップと、
前記共起感性表現情報を極表現単位に集計して極単位共起感性表現情報を出力するステップとからなる
ことを特徴とする請求項5に記載の感性情報付与方法。
Kansei co-occurrence pattern extraction step is
Collating the text analysis information with the sensibility expression dictionary and adding the matched word string information to the text analysis information;
Collating the appended text analysis information with a co-occurrence pattern extraction rule, and outputting a matched polar expression and sensitivity expression pair as co-occurrence sensitivity expression information;
The method according to claim 5, further comprising: summing up the co-occurrence sensitivity expression information in polar expression units and outputting the polar unit co-occurrence sensitivity expression information.
感性共起パタン抽出ステップは、
テキスト解析情報中の文節情報に基づき、極表現と特定の関係をもって共起した感性表現のうち文節の先頭でない感性表現を抽出対象外とする
ことを特徴とする請求項5または6に記載の感性情報付与方法。
Kansei co-occurrence pattern extraction step is
The sensibility according to claim 5 or 6, wherein, based on the phrase information in the text analysis information, the sensibility expression that is co-occurring with the polar expression and having a specific relationship is excluded from the extraction. Information grant method.
前記感性特徴量付与ステップは、
極単位共起感性表現情報を用いて、特徴値を正規化するための極表現正規化前最大値を算出するステップと、
極単位共起感性表現情報および極表現正規化前最大値を用いて、極表現と特定の関係をもって共起した各感性表現に対して正規化された極特徴量を算出するステップと、
極特徴量を用いて、極表現のいずれか一方もしくは両方と特定の関係をもって共起した各感性表現に対して正規化された軸特徴量を算出するステップとからなる
ことを特徴とする請求項5乃至7のいずれかに記載の感性情報付与方法。
The sensibility feature value adding step includes:
Using polar unit co-occurrence sensibility expression information, calculating a maximum value before polar expression normalization for normalizing a feature value;
Using the polar unit co-occurrence sensitivity expression information and the maximum value before polar expression normalization, calculating a normalized polar feature amount for each sensitivity expression co-occurring with a specific relationship with the polar expression;
And calculating a normalized axial feature for each emotional expression co-occurring with a specific relationship with one or both of the polar expressions using the polar feature. The method for giving sensitivity information according to any one of 5 to 7.
コンピュータに、請求項5乃至8のいずれかに記載の感性情報付与方法の各処理ステップを実行させるためのプログラム。   The program for making a computer perform each process step of the sensitivity information provision method in any one of Claims 5 thru | or 8.
JP2009187643A 2009-08-13 2009-08-13 Kansei information providing apparatus, method and program thereof Active JP5008701B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009187643A JP5008701B2 (en) 2009-08-13 2009-08-13 Kansei information providing apparatus, method and program thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009187643A JP5008701B2 (en) 2009-08-13 2009-08-13 Kansei information providing apparatus, method and program thereof

Publications (2)

Publication Number Publication Date
JP2011039861A JP2011039861A (en) 2011-02-24
JP5008701B2 true JP5008701B2 (en) 2012-08-22

Family

ID=43767553

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009187643A Active JP5008701B2 (en) 2009-08-13 2009-08-13 Kansei information providing apparatus, method and program thereof

Country Status (1)

Country Link
JP (1) JP5008701B2 (en)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4879775B2 (en) * 2007-02-22 2012-02-22 日本電信電話株式会社 Dictionary creation method

Also Published As

Publication number Publication date
JP2011039861A (en) 2011-02-24

Similar Documents

Publication Publication Date Title
US10496756B2 (en) Sentence creation system
JP4347226B2 (en) Information extraction program, recording medium thereof, information extraction apparatus, and information extraction rule creation method
CN103324621B (en) A kind of Thai text spelling correcting method and device
Dawdy-Hesterberg et al. Learnability and generalisation of Arabic broken plural nouns
US11531693B2 (en) Information processing apparatus, method and non-transitory computer readable medium
CN106168954A (en) A kind of negative report pattern Method of Fuzzy Matching based on editing distance
Gao et al. SCOPE: the South Carolina psycholinguistic metabase
JP4005343B2 (en) Information retrieval system
Chen et al. XMQAs: Constructing Complex-Modified Question-Answering Dataset for Robust Question Understanding
Patel et al. Influence of Gujarati STEmmeR in supervised learning of web page categorization
JP4499003B2 (en) Information processing method, apparatus, and program
JP4361299B2 (en) Evaluation expression extraction apparatus, program, and storage medium
Shaukat et al. Using TREC for developing semantic information retrieval benchmark for Urdu
JP5008701B2 (en) Kansei information providing apparatus, method and program thereof
JP4567025B2 (en) Text classification device, text classification method, text classification program, and recording medium recording the program
Aslamzai et al. Pashto language stemming algorithm
JP4014130B2 (en) Glossary generation device, glossary generation program, and glossary search device
Elwert Network analysis between distant reading and close reading
JP5528376B2 (en) Document simplifying apparatus and program
JP5441173B2 (en) Related information extraction apparatus, method and program thereof
Hou et al. Syntax-guided Localized Self-attention by Constituency Syntactic Distance
CN117150002B (en) Abstract generation method, system and device based on dynamic knowledge guidance
JP2007241900A (en) Naming system and naming automation method
JP4592556B2 (en) Document search apparatus, document search method, and document search program
Popa et al. Towards syntax-aware token embeddings

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101215

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20110613

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110614

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110615

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110616

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120528

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120529

R150 Certificate of patent or registration of utility model

Ref document number: 5008701

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150608

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350