JP6085574B2 - Work record content analysis apparatus, method and program - Google Patents
Work record content analysis apparatus, method and program Download PDFInfo
- Publication number
- JP6085574B2 JP6085574B2 JP2014026891A JP2014026891A JP6085574B2 JP 6085574 B2 JP6085574 B2 JP 6085574B2 JP 2014026891 A JP2014026891 A JP 2014026891A JP 2014026891 A JP2014026891 A JP 2014026891A JP 6085574 B2 JP6085574 B2 JP 6085574B2
- Authority
- JP
- Japan
- Prior art keywords
- content
- analysis
- analysis unit
- work record
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、作業記録内容解析装置及び方法及びプログラムに係り、特に、システム運用におけるオペレータの作業内容を記した作業記録を分析するための作業記録内容解析装置及び方法及びプログラムに関する。 The present invention relates to a work record content analysis apparatus, method, and program, and more particularly, to a work record content analysis apparatus, method, and program for analyzing a work record that describes the work contents of an operator in system operation.
今日、オペレータ業務の作業証跡、及び、オペレータの知見の蓄積を目的として、システム運用におけるインシデント発生時の状況と対応作業は作業記録として蓄積され、一元的な管理が行われている。作業記録には運用を効率的に行うために必要な情報が多く含まれるが、膨大な量が蓄積され人手で情報抽出は困難であり、また、自由記述であるために機械的な分析も困難な状況にある。 Today, for the purpose of accumulating operator work trails and operator knowledge, the situation and response work at the time of incident occurrence in system operation are accumulated as work records and are managed centrally. The work record contains a lot of information necessary for efficient operation, but it is difficult to extract information manually due to the accumulation of a huge amount, and it is also difficult to analyze mechanically because it is a free description It is in the situation.
こうした中で、作業記録からキーワードとなる単語を抽出し、キーワードから作業記録の内容を解析する方法がある(例えば、非特許文献1参照)。 Under such circumstances, there is a method of extracting a word as a keyword from the work record and analyzing the content of the work record from the keyword (see, for example, Non-Patent Document 1).
また、言語、辞書やコーパスに依存しない形態素解析により動作を分類する技術がある(例えば、非特許文献2参照)。 There is also a technique for classifying actions by morphological analysis independent of language, dictionary, or corpus (see, for example, Non-Patent Document 2).
しかしながら、上記従来の技術は、作業記録の"故障発生モジュール"、"故障を特定した方法"、"故障の解決方法"を獲得するに留まり、原因箇所毎に特定して分類することができず、作業記録の文全ての内容を解析することができないという問題がある。 However, the above-mentioned conventional technology only acquires the “failure occurrence module”, “the method of identifying the failure”, and “the solution of the failure” in the work record, and cannot identify and classify each cause. There is a problem that the contents of all the sentences in the work record cannot be analyzed.
また、形態素解析により動作を分類する方法は、特徴量は自由記述欄から予め人手により原因箇所を示す単語を定義する必要があり、自動的に取得することはできない。 Also, in the method of classifying actions by morphological analysis, it is necessary to define a word indicating the cause part manually in advance from the free description column, and the feature amount cannot be automatically acquired.
本発明は上記の点に鑑みなされたもので、利用者が各文における内容が把握されていない作業記録について、原因箇所に紐付いた特徴量を負荷の係る事前作業なしに獲得し、故障原因に応じた分類を行い、作業記録の内容の全てを解析することが可能な作業記録内容解析装置及び方法及びプログラムを提供することを目的とする。 The present invention has been made in view of the above points, and for a work record in which the content of each sentence is not grasped by the user, the feature amount associated with the cause location is acquired without prior work with a load, and the cause of failure is obtained. An object of the present invention is to provide a work record content analysis apparatus, method, and program capable of classifying according to each other and analyzing the entire contents of the work record.
一態様によれば、利用者の作業記録の内容を分析するための作業記録内容分析装置であって、
前記作業記録が与えられると、解析の対象となる解析単位文を抽出する内容解析単位決定手段と、
予め解析単位文と内容ラベルを対応付けた内容ラベルDBを参照して、前記解析単位文の内容ラベルを取得する内容ラベル決定手段と、
前記解析単位文に含まれる単語と、前記内容ラベル決定手段で取得した前記解析単位文の内容ラベルを組み合わせて、前記解析単位文から内容解析を行うための特徴量を抽出する特徴量抽出手段と、
前記特徴量抽出手段で得られた一つまたは複数の特徴量に基づいて、条件付確率、同時確率を求める、または、作業記録の集合に含まれる頻度の高い特徴量を選択することにより、解析結果を求める内容解析手段と、を有する作業記録内容分析装置が提供される。
According to one aspect, a work record content analyzer for analyzing the contents of a user's work record,
Given the work record, content analysis unit determination means for extracting an analysis unit sentence to be analyzed,
A content label determination unit that acquires a content label of the analysis unit sentence with reference to a content label DB that associates the analysis unit sentence and the content label in advance.
A feature quantity extracting unit that extracts a feature quantity for performing content analysis from the analysis unit sentence by combining a word included in the analysis unit sentence and a content label of the analysis unit sentence acquired by the content label determining unit; ,
Based on one or a plurality of feature quantities obtained by the feature quantity extraction means, a conditional probability and a joint probability are obtained, or analysis is performed by selecting a feature quantity with a high frequency included in a set of work records. A work record content analysis device having content analysis means for obtaining a result is provided.
一態様によれば、利用者が各文における内容が把握されていない作業記録について、原因箇所ごとの分類を行い、内容ラベルや解析単位文を作業記録の解析結果として提供することが可能となる。 According to one aspect, it is possible for a user to classify work records whose contents in each sentence are not grasped for each cause, and to provide content labels and analysis unit sentences as analysis results of the work records. .
以下、図面と共に本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図1は、本発明の一実施の形態における作業記録内容解析装置の構成例を示す。 FIG. 1 shows a configuration example of a work record content analysis apparatus according to an embodiment of the present invention.
同図に示す作業内容解析装置100は、ユーザインタフェース部110、内容解析単位決定部120、内容ラベル決定部130、特徴量抽出部140、内容解析部150を有する。また、図示しないがメモリ等の記憶手段を有するものとする。
The work
ユーザインタフェース部110は、ユーザから解析単位を受け付け、内容解析単位決定部120及び内容ラベル決定部130に入力する機能と、内容解析部150で得られた解析結果を出力する機能を有する。
The
内容解析単位決定部120は、作業記録DB10から読み出した作業記録情報から解析単位や所定の抽出方法に基づいて解析単位文を抽出する。
The content analysis
内容ラベル決定部130は、解析単位文のそれぞれについて、予め定義された内容ラベルのうち、どの内容ラベルに該当するかを解析して、解析単位文と内容ラベルを紐付けて内容ラベルDB20に格納する。また、ユーザインタフェース110を介して、または、内容解析単位決定部120から解析単位文が与えられると、当該解析単位文に対する内容ラベルを内容ラベルDB20から検索する。なお、検索された内容ラベルはユーザインタフェース110を介して利用者に出力することも可能である。
The content
特徴量抽出部140は、解析単位文における特徴量を求める。特徴量としては、解析単位文から得られた単語と内容ラベルから求められる特徴量、解析単語文を構文解析した結果、要約情報の単語集合、システムメッセージの特徴量、システム数値情報等がある。
The feature
内容解析部150は、特徴量抽出部140で得られた特徴量に基づいて、解析単位文の解析を行う。その内容解析結果はユーザインタフェース部110を介して出力する。
The
作業記録DB10は、システム運用中に発生した故障の発生に対するオペレータの対応を記録した作業記録が格納されている。 The work record DB 10 stores a work record that records an operator's response to a failure that occurred during system operation.
内容ラベルDB20は、解析単位文それぞれについて、予め定義した内容ラベルのうち、利用者によってどの内容ラベルに該当するかが解析され、解析単位文に紐付けられた内容ラベルが格納される。内容ラベルの定義例を表1に示す。
The
以下では、作業記録の各文に対して、内容を示す内容ラベルを与えることにより、本発明の課題を解決する。 Below, the subject of this invention is solved by giving the content label which shows the content with respect to each sentence of a work record.
図2は、本発明の一実施の形態における作業記録内容解析装置の処理のフローチャートである。 FIG. 2 is a flowchart of processing of the work record content analysis apparatus according to the embodiment of the present invention.
ステップ101)内容解析単位決定部120は、作業記録DB10から読み出した作業記録情報から以下のような方法により解析単位文を抽出する。解析単位文を抽出する方法としては、以下のような方法がある。
Step 101) The content analysis
(1)作業記録DB10から読み出した作業記録情報に区切りを与えて解析単位文とする。
(1) The work record information read from the
(2)ユーザインタフェース部110を介して、利用者から解析単位を取得し、作業記録DB10から読み出した作業記録情報から当該解析単位に応じて解析単位文を抽出する。
(2) The analysis unit is acquired from the user via the
(3)作業記録DB10から読み出した作業記録情報の改行文字毎に区切って解析単位とする。
(3) A unit of analysis is divided for each line feed character of the work record information read from the
(4)作業記録DB10から読み出した作業記録情報全文を解析単位とする。
(4) The entire work record information read from the
上記のいずれかの方法により取得した解析単位文を内容ラベル決定部130、または、特徴量抽出部140に出力する。
The analysis unit sentence acquired by any one of the above methods is output to the content
ステップ102)内容ラベル決定部130は、ステップ101で取得した解析単位文それぞれについて、内容ラベルDB20に予め定義され、格納されている内容ラベルのうち、どの内容ラベルに該当するかを解析する。
Step 102) The content
ステップ103)特徴量抽出部140は、解析単位文の内容解析を行うための、解析単位文における特徴量を得る。
Step 103) The feature
特徴量を得るには、以下の種々の方法がある。 There are the following various methods for obtaining the feature amount.
(1)形態素解析を利用:
作業記録DB10に利用者が付けた作業記録の日本語のタイトルや作業記録の要約情報がある場合、これを形態素解析し、その単語の集合を特徴量とする。例えば、
"ホストXでパケット異常発生"
というタイトルがあった場合、
"ホストX","で","パケット","異常","発生"
と単語に分割して、これらの単語の集合を特徴量とする。これにより、内容解析部150ではその特徴量が似ているグループによって分類することが可能となる。
(1) Use morphological analysis:
If the
"Packet error occurred on host X"
If there is a title
"Host X", "With", "Packet", "Abnormal", "Occurred"
And a set of these words as a feature amount. As a result, the
(2)テンプレートを利用:
システムメッセージを特徴量として採用する方法として、作業記録DB10から取得したシステムメッセージが異常状態を示している場合(例えば、監視システムが出力した異常アラートメッセージや機器のエラーログ)には当該メッセージをテンプレート化する方法がある。
(2) Use templates:
As a method of adopting a system message as a feature quantity, when a system message acquired from the
例えば、システムメッセージが"ホストXでCPU負荷が90%を超えました"、"2014/01/01 01:10:10Error:system initiation is not defined"である場合、当該メッセージをテンプレート化(状況によって変化する部分を除いたもの)する。例えば、
"****でCPU負荷が**%を超えました","****/**/** **:**:** Error:system initiation is not defined"
のようにして、テンプレートと同じメッセージであるものにIDを付与する。ある作業記録に書かれた異常で、ID100、ID200、ID300の3つのメッセージが出力されたら(100,200,300)というIDの集合を特徴量とする。
For example, if the system message is "CPU load exceeded 90% on host X" or "2014/01/01 01:10:10 Error: system initiation is not defined" Excluding changing parts). For example,
"CPU load exceeds **% at ****", "**** / ** / ** **: **: ** Error: system initiation is not defined"
In this way, ID is assigned to the same message as the template. When three messages of ID100, ID200, and ID300 are output due to an abnormality written in a certain work record, a set of IDs (100, 200, 300) is set as a feature amount.
(3)システム数値情報を利用:
数値情報として、パケット数や応答時間など、作業記録に記載されている数値(ベクトル)を特徴量として用いる。例えば、特徴量("CPU使用率"、"ディスク書き込み速度"、"機器温度")である場合は、(0.5,4000,298)というベクトルが特徴量となる。
(3) Use system numerical information:
As numerical information, numerical values (vectors) described in work records such as the number of packets and response time are used as feature quantities. For example, in the case of a feature amount (“CPU usage rate”, “disk writing speed”, “device temperature”), a vector of (0.5, 4000, 298) is the feature amount.
(4)解析単位文と内容ラベルを用いる:
特徴量Fは、i番目の解析単位文に含まれる情報をXi、また、i番目の解析単位文の内容ラベルをYiとして、
X1,…Xn, Y1,…,Yi-1, Yi+1,…,Yn
を自由に用いて定義することが可能である。
(4) Use parsing unit sentences and content labels:
The feature amount F is defined by supposing that the information included in the i-th analysis unit sentence is X i , and the content label of the i-th analysis unit sentence is Y i .
X 1 ,… X n , Y 1 ,…, Y i−1 , Y i + 1 ,…, Y n
Can be defined freely.
例えば、内容推定を行う解析単位文に単語"緊急"が含まれるかどうかは、
F(X1,…,Xn,Y1,…,Yi-1,Yi+1,…,Y n)=1 if "緊急"∈Xi, otherwise 0
と表現できる。解析単位文に含まれる単語の獲得方法は、形態素解析器MeCab(例えば、非特許文献2等参照)などがある。
For example, whether or not the word “emergency” is included in the analysis unit sentence for content estimation,
F (X 1 ,…, X n , Y 1 ,…, Y i−1 , Y i + 1 ,…, Y n ) = 1 if “urgent” ∈X i , otherwise 0
Can be expressed. As a method for acquiring words included in the analysis unit sentence, there is a morphological analyzer MeCab (see, for example, Non-Patent Document 2).
また、一つ前の解析単位文の内容ラベルが"根拠"であることを特徴量として用いる場合であれば、解析単位文の内容ラベルが決定した時点で内容ラベルDB20に当該解析単位文の内容ラベルYi-1を保持しておき、内容ラベルDB20から内容ラベルを得ることにより、
F(X1,…,Xn,Y1,…Yi-1,Yi+1,…,Yn)=1 if Yi-1="根拠", otherwise 0
と表現できる。
If the content label of the immediately previous analysis unit statement is “Rationale”, the content of the analysis unit statement is stored in the
F (X 1 , ..., X n , Y 1 , ... Y i-1 , Y i + 1 , ..., Y n ) = 1 if Y i-1 = "reason", otherwise 0
Can be expressed.
なお、以下のステップ104に示す特徴量も含め、特徴量は一つでもよいし、複数の特徴量を組み合わせてもよい。
It should be noted that one feature quantity may be included, including a feature quantity shown in
ステップ104) また、特徴量抽出部140において、特徴量を抽出する方法として、解析単位文の構造を解析する方法がある。
Step 104) Further, as a method for extracting the feature quantity in the feature
この場合、内容に関連性のある解析単位文の組(Xp,Xq)を獲得する。例えば、"起・承・転・結"となっている作業記録であれば、[起,承]、[承,転]、[転,結]を関連性のある解析単位文の組として得る。 In this case, a set of analysis unit sentences (Xp, Xq) relevant to the contents is acquired. For example, in the case of a work record with “start / end / change / end”, [start, end], [follow, change], [turn, end] are obtained as a set of related analysis unit sentences. .
また、"目的・根拠1・根拠2・根拠3"となっている作業記録であれば、[目的,根拠1]、[目的,根拠2]、[目的,根拠3]を関連性のある解析単位文の組として得る。 In addition, if the work record is “Purpose / Evidence 1 / Evidence 2 / Evidence 3”, [Purpose / Evidence 1], [Purpose / Evidence 2], and [Purpose / Evidence 3] are related analysis. Get as a set of unit sentences.
上記のような解析単位文の構造解析方法として、構文解析手法のShift-Reduce(例えば、非特許文献3参照)、Eisner法(例えば、非特許文献4)などがある。 As the structure analysis method of the analysis unit sentence as described above, there are a syntax analysis method Shift-Reduce (for example, see Non-Patent Document 3), an Eisner method (for example, Non-Patent Document 4), and the like.
また、特徴量抽出部140は、解析単位文の構造を解析し、特徴量として用いることも可能である。この場合、内容に関連性がある解析単位文の組(Xp,Xq)を獲得する。
The feature
上記の構造を用いて、構造特徴量を定義可能である。例えば、内容解析を行う解析単位文と関連がある解析単位文の特徴量を用いる、等である。この場合、(A,B),(B,C),(C,D)という構造を持つ作業記録である場合、Bの解析単位文の特徴量として、A,Cの特徴量が用いられる。 A structural feature amount can be defined using the above structure. For example, the feature amount of the analysis unit sentence related to the analysis unit sentence for content analysis is used. In this case, in the case of a work record having a structure of (A, B), (B, C), (C, D), the feature quantities of A and C are used as the feature quantities of the analysis unit sentence of B.
ステップ105)内容解析部150は、上記のステップ103,104で得られた特徴量を元に内容解析を実施する。
Step 105) The
内容解析手法は、同時確率をモデル化するHMM(Hidden Markov Mode)(例えば、非特許文献5参照)、条件付確率をモデル化するCRF(Conditional Random Fields)(例えば、非特許文献6参照)などが考えられる。 Content analysis methods include HMM (Hidden Markov Mode) for modeling simultaneous probabilities (for example, see Non-Patent Document 5), CRF (Conditional Random Fields) for modeling conditional probabilities (for example, see Non-Patent Document 6), etc. Can be considered.
内容解析部150は、予め、特徴量と内容ラベルの関係を、当該作業記録内容解析装置100に接続される分析システム40に学習させ、新たな作業記録に対して、各解析単位文の特徴量から、内容ラベルを得る方法がある。この場合、解析単位文の特徴量と内容ラベルの学習方法は、学習データを利用者によって予め与える方法、分析システム40の実行時に利用者によってインタラクティブに与える方法、同一内容ラベルと考えられる別のデータセットを用いる方法が考えられる。同一内容ラベルと考えられる別のデータセットとしては、例えば、作業マニュアルに記述された文を全て"作業"という内容ラベルのデータとして活用する、などが考えられる。
The
また、学習は必ずしも内容ラベルが得られた学習データを用いて行う必要はない。例えば、内容解析単位決定部120で得られた分析を行う作業記録の集合から、重要な解析単位文のみを取り出す場合には、特徴量抽出部140で得られた分析対象の作業記録の集合に登場する頻度の高い特徴量を、重要な解析単位文としてもよい。
Further, learning is not necessarily performed using learning data from which content labels are obtained. For example, when only an important analysis unit sentence is extracted from the set of work records to be analyzed obtained by the content analysis
ステップ106)内容解析部150で得られた内容解析結果を出力する。内容解析結果は、内容ラベルや、重要であると判断された解析単位文、内容ラベルが付与された解析単位文等である。
Step 106) The content analysis result obtained by the
以下に、上記の実施の形態で示した作業記録内容解析装置を適用した場合の例を示す。 Hereinafter, an example in which the work record content analysis apparatus shown in the above embodiment is applied will be described.
[第1の実施例]
図3は、本発明の第1の実施例のシステム構成例である。
[First embodiment]
FIG. 3 is a system configuration example of the first embodiment of the present invention.
同図において、図1と同一構成部分には同一符号を付しその説明を省略する。 In this figure, the same components as those in FIG.
作業記録DB10に蓄積される作業の対象となるシステムは、どのようなものであっても構わない。例えば、企業におけるITシステム、大規模ネットワークなどが挙げられる。
Any system can be used as a target of work stored in the
図3に示すシステムは、利用者30が解析対象として入力した作業記録に対して、解析単位文ごとの内容ラベルを獲得する場合を想定している。
The system shown in FIG. 3 assumes a case where a content label for each analysis unit sentence is acquired for a work record input as an analysis target by the
作業記録に対する内容ラベルの付与システムとして用いる場合、利用者は解析の対象となる作業記録を作業記録内容解析装置100のユーザインタフェース110を介して与える。内容ラベル決定部130は、対象の作業記録における内容ラベルを解析した後、内容ラベルDB20に作業記録の内容ラベルを記録する。その後、利用者30に対して内容ラベルDB20から対象の作業記録の内容ラベルを取り出し、提示する。内容ラベルの解析と、利用者30に対する内容ラベルの提示は、同じ時間に行われる必要はなく、予め解析が行われ、内容ラベルDB20に格納されている場合も考えられる。
When used as a system for assigning a content label to a work record, the user provides a work record to be analyzed via the
これにより、利用者30は、作業記録のうち必要とする内容ラベルを持つ解析単位文のみを取得することが可能となる。
As a result, the
[第2の実施例]
図4は、本発明の第2の実施例のシステム構成例である。
[Second Embodiment]
FIG. 4 is a system configuration example of the second embodiment of the present invention.
同図において、図1と同一構成部分には同一符号を付しその説明を省略する。 In this figure, the same components as those in FIG.
同図に示すシステムでは、複数の作業記録DB101〜10nに対して、同時に内容ラベルを解析する場合を想定している。これは異なる種別の作業記録について、同一の内容ラベルをもつ解析単位文を獲得し、作業記録間の紐付けを行うことを実現する。例えば、ITシステムにおける人手で記述された作業記録と、同ITシステムのコマンドログなどの作業記録に対して、同時に内容解析を行い、それぞれ同じ内容レベルを持つ解析対象の作業記録を獲得し、当該内容ラベルと紐付けて、当該作業記録が格納されている作業記録DB10に格納することができる。
In the system shown in the figure, it is assumed that content labels are simultaneously analyzed for a plurality of
具体的には、利用者30がそれぞれの作業記録DB10について解析を行う作業記録を選択する。作業記録内容解析装置100は、作業記録DB10から解析対象の作業記録を獲得し、内容ラベル決定部130において内容ラベルの解析を行う。この内容ラベルの解析は、複数の作業記録の解析単位文の特徴量を相互に活用しあう場合も、独立に解析する場合も考えられる。
Specifically, the
[第3の実施例]
図5は、本発明の第3の実施例のシステム構成例である。
[Third embodiment]
FIG. 5 is a system configuration example of the third embodiment of the present invention.
図1と同一構成部分には同一符号を付しその説明を省略する。 The same components as those in FIG. 1 are denoted by the same reference numerals and description thereof is omitted.
図5に示すシステムは、作業記録記述中の内容解析を行い、複数の利用者に対して内容解析の結果を提示する場合である。 The system shown in FIG. 5 is a case where the content analysis in the work record description is performed and the result of the content analysis is presented to a plurality of users.
図5に示すように、複数の利用者(A,B)がいる場合、利用者に対して解析単位文書を変更する場合である。例えば、作業記録の内容ラベル推定結果を元に、特定の内容ラベルのみを利用者Aに提示し、残りを利用者Bに対して提示する。この場合、それぞれの利用者A,Bは内容解析を行う作業記録を入力すると同時に、解析単位文の出力を得るための内容ラベルも入力する。作業記録内容解析装置100は、内容ラベル決定部130において、作業記録に該当する内容ラベルのみを獲得し、それぞれの利用者に対して出力を行う内容ラベルを持つ解析単位文のみをユーザインタフェース110から提示する。
As shown in FIG. 5, when there are a plurality of users (A, B), the analysis unit document is changed for the users. For example, based on the content label estimation result of the work record, only a specific content label is presented to the user A, and the rest is presented to the user B. In this case, each user A and B inputs a work record for performing content analysis, and also inputs a content label for obtaining an output of an analysis unit sentence. In the work record
これにより、例えば、ITシステムの運用において、作業記録から遠隔オペレータ(利用者A)と実地作業者(利用者B)が同時に実施する作業を獲得する場合に、遠隔オペレータ(利用者A)には、遠隔オペレータ(利用者A)が行うべき作業の(特定の内容ラベルが付いた)解析単位文を提供し、実地作業者(利用者B)には実地作業者(利用者B)が行うべき作業の(特定の内容ラベルが付いた)解析単位文を提供することが可能となる。 Thus, for example, in the operation of an IT system, when a remote operator (user A) and an actual worker (user B) obtain work simultaneously performed from work records, the remote operator (user A) , Provide analysis unit statements (with specific content labels) of work to be performed by the remote operator (user A), and the actual worker (user B) should be performed by the actual worker (user B) It is possible to provide an analysis unit sentence (with a specific content label) of work.
なお、図1に示す作業記録内容解析装置100の各構成要素の動作をプログラムとして構築し、作業記録内容解析装置として利用されるコンピュータにインストールする、または、ネットワークを介して流通させることが可能である。
The operation of each component of the work record
本発明は、上記の実施の形態及び実施例に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。 The present invention is not limited to the above-described embodiments and examples, and various modifications and applications are possible within the scope of the claims.
10,101〜10n 作業記録DB
20 内容ラベルDB
30 利用者(端末)
40 分析システム
100 作業記録内容解析装置
110 ユーザインタフェース部
120 内容解析単位決定部
130 内容ラベル決定部
140 特徴量抽出部
150 内容解析部
10, 10 1 -10 n work record DB
20 Content label DB
30 users (terminals)
40
Claims (7)
前記作業記録が与えられると、解析単位文を抽出する内容解析単位決定手段と、
予め解析単位文と内容ラベルを対応付けた内容ラベルDBを参照して、前記解析単位文の内容ラベルを取得する内容ラベル決定手段と、
前記解析単位文に含まれる単語と、前記内容ラベル決定手段で取得した前記解析単位文の内容ラベルを組み合わせて、前記解析単位文から内容解析を行うための特徴量を抽出する特徴量抽出手段と、
前記特徴量抽出手段で得られた一つまたは複数の特徴量に基づいて、条件付確率、同時確率を求める、または、作業記録の集合に含まれる頻度の高い特徴量を選択することにより、解析結果を求める内容解析手段と、
を有することを特徴とする作業記録内容分析装置。 A work record content analysis device for analyzing the contents of a user's work record,
Given the work record, content analysis unit determination means for extracting an analysis unit sentence;
A content label determination unit that acquires a content label of the analysis unit sentence with reference to a content label DB that associates the analysis unit sentence and the content label in advance.
A feature quantity extracting unit that extracts a feature quantity for performing content analysis from the analysis unit sentence by combining a word included in the analysis unit sentence and a content label of the analysis unit sentence acquired by the content label determining unit; ,
Based on one or a plurality of feature quantities obtained by the feature quantity extraction means, a conditional probability and a joint probability are obtained, or analysis is performed by selecting a feature quantity with a high frequency included in a set of work records. Content analysis means for obtaining results;
A work record content analyzing apparatus comprising:
前記作業記録に区切りを与える;
前記作業記録の改行文字毎に区切る;
入力された解析単位を用いる;
または、
前記作業記録全文を用いる;
のいずれかにより前記解析単位文を抽出する手段を含む
請求項1記載の作業記録内容分析装置。 The content analysis unit determination means includes
Give a break to the work record;
Separating every newline character in the work record;
Use the entered analysis unit;
Or
Use the full work log;
The work record content analysis apparatus according to claim 1, further comprising means for extracting the analysis unit sentence by any of the above.
前記解析単位文を構文解析し、構文解析の結果に基づいて、内容に関連性のある解析単位文の組を特徴量とする手段を含む
請求項1記載の作業記録内容分析装置。 The feature amount extraction means includes:
The work record content analysis apparatus according to claim 1, further comprising means for parsing the analysis unit sentence and using a set of analysis unit sentences related to the contents as a feature amount based on a result of the syntax analysis.
前記解析単位文から取得した内容ラベルを前記内容ラベルDBに格納する手段を含む
請求項1記載の作業記録内容分析装置。 The content label determining means includes
Working recorded contents analyzer according to claim 1 including means for storing the contents label acquired from the analyzing unit statement on the content label DB.
前記作業記録を格納した作業記録DBから得られた解析対象の作業記録に対して、前記内容ラベルを紐付けて該作業記録DBに格納する手段を含む
請求項1記載の作業記録内容分析装置。 The content label determining means includes
The work record to the working record obtained analyzed from the work record DB storing the work record content analyzer according to claim 1 including means for storing in association with the contents label to the working recording DB.
内容解析単位決定手段、内容ラベル決定手段、特徴量抽出手段、及び内容解析手段を有する装置において、
前記内容解析単位決定手段が、前記作業記録が与えられると、解析単位文を抽出する内容解析単位決定ステップと、
前記内容ラベル決定手段が、予め解析単位文と内容ラベルを対応付けた内容ラベルDBを参照して、前記解析単位文の内容ラベルを取得する内容ラベル決定ステップと、
前記特徴量抽出手段が、前記解析単位文に含まれる単語と、前記内容ラベル決定ステップにおいて取得した前記解析単位文の内容ラベルを組み合わせて、前記解析単位文から内容解析を行うための特徴量を抽出する特徴量抽出ステップと、
前記内容解析手段が、前記特徴量抽出ステップで得られた一つまたは複数の特徴量に基づいて、条件付確率、同時確率を求める、または、作業記録の集合に含まれる頻度の高い特徴量を選択することにより、解析結果を求める内容解析ステップと、
を行うことを特徴とする作業記録内容分析方法。 A work record content analysis method for analyzing the contents of a user's work record,
In an apparatus having content analysis unit determination means, content label determination means, feature amount extraction means, and content analysis means,
The content analysis unit determination means, when the work record is given, a content analysis unit determination step of extracting an analysis unit sentence;
The content label determining means refers to a content label DB in which an analysis unit sentence and a content label are associated with each other in advance, and acquires a content label of the analysis unit sentence.
The feature amount extraction unit combines a word included in the analysis unit sentence with the content label of the analysis unit sentence acquired in the content label determination step, and calculates a feature amount for content analysis from the analysis unit sentence. A feature extraction step to extract;
The content analysis means obtains a conditional probability, a joint probability based on one or a plurality of feature amounts obtained in the feature amount extraction step, or a feature amount that is frequently included in a set of work records. A content analysis step for obtaining an analysis result by selecting,
A method for analyzing the contents of work records, characterized by:
請求項1乃至5のいずれか1項に記載の作業記録内容分析装置の各手段として機能させるための作業記録内容分析プログラム。 Computer
A work record content analysis program for functioning as each means of the work record content analysis apparatus according to any one of claims 1 to 5 .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014026891A JP6085574B2 (en) | 2014-02-14 | 2014-02-14 | Work record content analysis apparatus, method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014026891A JP6085574B2 (en) | 2014-02-14 | 2014-02-14 | Work record content analysis apparatus, method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015153188A JP2015153188A (en) | 2015-08-24 |
JP6085574B2 true JP6085574B2 (en) | 2017-02-22 |
Family
ID=53895345
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014026891A Active JP6085574B2 (en) | 2014-02-14 | 2014-02-14 | Work record content analysis apparatus, method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6085574B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7372055B2 (en) * | 2019-05-30 | 2023-10-31 | Kddi株式会社 | Information processing system and learning method |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3887971B2 (en) * | 1998-09-25 | 2007-02-28 | 富士ゼロックス株式会社 | Information management apparatus, information management method, and computer-readable recording medium recording information management program |
JP2000113064A (en) * | 1998-10-09 | 2000-04-21 | Fuji Xerox Co Ltd | Optimum acting person selection support system |
JP4160548B2 (en) * | 2004-09-29 | 2008-10-01 | 株式会社東芝 | Document summary creation system, method, and program |
JP2008257501A (en) * | 2007-04-05 | 2008-10-23 | Hitachi Ltd | Daily report preparation support system and program |
JP2010176626A (en) * | 2009-02-02 | 2010-08-12 | Fujitsu Ltd | Program and method for document clustering |
JP5364529B2 (en) * | 2009-10-07 | 2013-12-11 | 株式会社Kddi研究所 | Dictionary registration device, document label determination system, and dictionary registration program |
JP5639546B2 (en) * | 2011-08-05 | 2014-12-10 | 株式会社東芝 | Information processing apparatus and information processing method |
-
2014
- 2014-02-14 JP JP2014026891A patent/JP6085574B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015153188A (en) | 2015-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9626622B2 (en) | Training a question/answer system using answer keys based on forum content | |
US8972413B2 (en) | System and method for matching comment data to text data | |
US20170046625A1 (en) | Information processing apparatus and method and non-transitory computer readable medium | |
CN110263009B (en) | Method, device and equipment for generating log classification rule and readable storage medium | |
US10366154B2 (en) | Information processing device, information processing method, and computer program product | |
JP2020027649A (en) | Method, apparatus, device and storage medium for generating entity relationship data | |
WO2019156103A1 (en) | Faq consolidation assistance device, faq consolidation assistance method, and program | |
EP3115907A1 (en) | Common data repository for improving transactional efficiencies of user interactions with a computing device | |
US9772991B2 (en) | Text extraction | |
US20160188569A1 (en) | Generating a Table of Contents for Unformatted Text | |
CN114861677B (en) | Information extraction method and device, electronic equipment and storage medium | |
CN107545505B (en) | Method and system for identifying insurance financing product information | |
Shah et al. | Towards benchmarking feature type inference for automl platforms | |
EP3009942A1 (en) | Social contact message monitoring method and device | |
CN107679159B (en) | Method and device for generating fault diagnosis question response, server and storage medium | |
CN113971205A (en) | Threat report attack behavior extraction method, device, equipment and storage medium | |
WO2019085118A1 (en) | Topic model-based associated word analysis method, and electronic apparatus and storage medium | |
JP6085574B2 (en) | Work record content analysis apparatus, method and program | |
JP6508327B2 (en) | Text visualization system, text visualization method, and program | |
WO2015182559A1 (en) | Information analysis system, information analysis method and information analysis program | |
US10387474B2 (en) | System and method for cross-cloud identification of topics | |
CN111898762B (en) | Deep learning model catalog creation | |
JP6190341B2 (en) | DATA GENERATION DEVICE, DATA GENERATION METHOD, AND PROGRAM | |
CN115774797A (en) | Video content retrieval method, device, equipment and computer readable storage medium | |
WO2018060777A1 (en) | Method and system for optimizing software testing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161028 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161108 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170130 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6085574 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |