JP6064855B2 - 情報処理プログラム及び情報処理装置 - Google Patents

情報処理プログラム及び情報処理装置 Download PDF

Info

Publication number
JP6064855B2
JP6064855B2 JP2013203659A JP2013203659A JP6064855B2 JP 6064855 B2 JP6064855 B2 JP 6064855B2 JP 2013203659 A JP2013203659 A JP 2013203659A JP 2013203659 A JP2013203659 A JP 2013203659A JP 6064855 B2 JP6064855 B2 JP 6064855B2
Authority
JP
Japan
Prior art keywords
information
document information
answer
question
classified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013203659A
Other languages
English (en)
Other versions
JP2015026355A (ja
Inventor
大樹 杉渕
大樹 杉渕
宏 梅基
宏 梅基
基行 鷹合
基行 鷹合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2013203659A priority Critical patent/JP6064855B2/ja
Priority to US14/245,516 priority patent/US9659088B2/en
Priority to AU2014202622A priority patent/AU2014202622B2/en
Publication of JP2015026355A publication Critical patent/JP2015026355A/ja
Application granted granted Critical
Publication of JP6064855B2 publication Critical patent/JP6064855B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/358Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理プログラム及び情報処理装置に関する。
従来の技術として、利用者のフィードバックに基づき内容が類似する文書情報の集合を収集する情報処理装置が提案されている(例えば、特許文献1参照)。
特許文献1に開示された情報処理装置は、内容が類似する文書情報を収集し、当該収集した文書情報の集合を利用者に提示し、集合に間違って含まれている文書の指摘と、集合に含まれていない追加するべき文書情報の指摘とを、利用者からフィードバックとして収集し、当該フィードバックに基づいて文書情報の類似性の算出を最適化する。なお、以下において、内容が類似する文書情報を収集して集合とすることを「分類する」といい、当該集合の内容を「分類」という。
特開2012−118977号公報
本発明の目的は、文書情報の分類が適切か否か利用者に判断させるための情報を作成する情報処理プログラム及び情報処理装置を提供することにある。
本発明の一態様は、上記目的を達成するため、以下の情報処理プログラム及び情報処理装置を提供する。
[1]コンピュータを、
一対一の関係にある第1の文書情報と第2の文書情報の組を複数取得して、取得した複数の組に含まれる複数の前記第2の文書情報のそれぞれの特徴量を前記第2の文書情報のそれぞれから取得する特徴量取得手段と、
前記複数の第2の文書情報のそれぞれを特徴量空間上にプロットした分布図情報を作成する分布図作成手段と、
前記特徴量取得手段が取得した特徴量に基づいて、前記複数の第2の文書情報のそれぞれの間の特徴量空間における距離を求め、求めた前記距離が予め定めた値以上離れている第2の文書情報の集合は、それぞれ異なる属性情報が付与されるものとして、前記複数の第2の文書情報を分類し、分類した分類結果に基づいて当該複数の第2の文書情報に対応する複数の前記第1の文書情報を分類する分類手段
として機能させるための情報処理プログラム。
[2]前記分布図作成手段は、同一の属性情報に付与された前記第2の文書情報ついて作成された複数の分布図情報を結合し、新たな分布図情報を作成する前記[1]に記載の情報処理プログラム。
[3]前記コンピュータを、
前記特徴量取得手段が取得した特徴量に基づいて、前記複数の第2の文書情報のそれぞれの間の特徴量空間における距離を求め、求めた前記距離が予め定めた値以上離れている前記第2の文書情報は、前記属性情報に付与されないものとして、前記複数の第2の文書情報を分類する分類手段としてさらに機能させる前記[1]又は[2]に記載の情報処理プログラム。
[4]前記分類手段は、前記属性情報に付与されないものとされた前記第2の文書情報に他の属性情報を付与する前記[3]に記載の情報処理プログラム。
[5]前記コンピュータを、
前記複数の第2の文書情報の分類を要求した要求元に対し、前記分布図作成手段の作成した前記分布図情報を通知する通知手段としてさらに機能させる前記[1]−[4]のいずれかに記載の情報処理プログラム。
[6]前記複数の第2の文書情報の分類を要求した要求元に対し、前記分布図作成手段の作成した前記分布図情報及び前記分類手段が分類した分類結果を通知する通知手段としてさらに機能させる前記[3]に記載の情報処理プログラム。
[7]一対一の関係にある第1の文書情報と第2の文書情報の組を複数取得して、取得した複数の組に含まれる複数の前記第2の文書情報のそれぞれの特徴量を前記第2の文書情報のそれぞれから取得する特徴量取得手段と、
前記複数の第2の文書情報のそれぞれを特徴量空間上にプロットした分布図情報を作成する分布図作成手段と、
前記特徴量取得手段が取得した特徴量に基づいて、前記複数の第2の文書情報のそれぞれの間の特徴量空間における距離を求め、求めた前記距離が予め定めた値以上離れている第2の文書情報の集合は、それぞれ異なる属性情報が付与されるものとして、前記複数の第2の文書情報を分類し、分類した分類結果に基づいて当該複数の第2の文書情報に対応する複数の前記第1の文書情報を分類する分類手段とを有する情報処理装置。
[8]コンピュータを、
質問と回答の関係にある複数の質問文書情報と複数の回答文書情報を取得して、当該複数の回答文書情報のそれぞれの特徴量を前記回答文書情報のそれぞれから取得する特徴量取得手段と、
前記複数の回答文書情報のそれぞれを特徴量空間上にプロットした分布図情報を作成する分布図作成手段と、
前記特徴量取得手段が取得した特徴量に基づいて、前記複数の回答文書情報のそれぞれの間の特徴量空間における距離を求め、求めた前記距離が予め定めた値以上離れている回答文書情報の集合は、それぞれ異なる属性情報が付与されるものとして、前記複数の回答文書情報を分類し、分類した分類結果に基づいて当該複数の回答文書情報に対応する前記複数の質問文書情報を分類する分類手段として機能させるための情報処理プログラム。
[9]前記コンピュータを、
前記分類された質問文書情報にそれぞれ属性情報を付与する属性情報付与手段としてさらに機能させる前記[8]に記載の情報処理プログラム。
[10]前記コンピュータを、
前記属性情報が付与された質問文書情報について学習を行い、学習結果を生成する学習手段と、
前記学習結果を用いて、属性情報が付与されていない質問文書情報に付与されるべき属性情報を推定する推定手段と、
前記推定された属性情報が付与されている回答文書情報を、前記属性情報が付与されていない質問文書情報に対する回答として提示する提示手段としてさらに機能させる前記[9]に記載の情報処理プログラム。
[11]コンピュータを、
質問と回答の関係にある複数の質問文書情報と複数の回答文書情報及び当該複数の質問文書情報と当該複数の回答文書情報について質問から回答を作成する際の観点を示す判断情報を取得して、前記判断情報に基づいて前記複数の回答文書情報を複数の集合に分類する判断情報分類手段と、
前記判断情報分類手段により一の集合に分類された複数の回答文書情報のそれぞれの特徴量を前記回答文書情報のそれぞれから取得する特徴量取得手段と、
前記複数の集合のそれぞれについて、前記複数の回答文書情報のそれぞれを特徴量空間上にプロットした分布図情報を作成する分布図作成手段と、
前記複数の集合のそれぞれについて、前記特徴量取得手段が取得した特徴量に基づいて、前記複数の回答文書情報のそれぞれの間の特徴量空間における距離を求め、前記複数の集合のそれぞれについて、求めた前記距離が予め定めた値以上離れている回答文書情報の集合は、それぞれ異なる属性情報が付与されるものとして、前記複数の回答文書情報を分類する分類手段と、
前記分類手段により前記複数の回答文書情報が分離よく分類された集合に対応する判断情報が、質問から回答を作成する際に着目すべき観点であるものとして通知する判断情報通知手段として機能させるための情報処理プログラム。
[12]コンピュータを、
質問と回答の関係にある複数の質問文書情報と複数の回答文書情報及び当該複数の質問文書情報と当該複数の回答文書情報について質問から回答を作成する際の観点を示す判断情報を取得して、前記判断情報に基づいて前記複数の回答文書情報を複数の集合に分類する判断情報分類手段と、
前記判断情報分類手段により一の集合に分類された複数の回答文書情報のそれぞれの特徴量を前記回答文書情報のそれぞれから取得する特徴量取得手段と、
前記複数の集合のそれぞれについて、前記複数の回答文書情報のそれぞれを特徴量空間上にプロットした分布図情報を作成する分布図作成手段と、
前記複数の集合のそれぞれについて、前記特徴量取得手段が取得した特徴量に基づいて、前記複数の回答文書情報のそれぞれの間の特徴量空間における距離を求め、前記複数の集合のそれぞれについて、求めた前記距離が予め定めた値以上離れている回答文書情報の集合は、それぞれ異なる属性情報が付与されるものとして、前記複数の回答文書情報を分類し、分類した分類結果に基づいて当該複数の回答文書情報に対応する前記複数の質問文書情報を分類する分類手段と、
それぞれ異なる属性情報が付与されるものとされた回答文書情報の集合に新たな属性情報を付与する属性情報付与手段として機能させるための情報処理プログラム。
[13]質問と回答の関係にある複数の質問文書情報と複数の回答文書情報を取得して、当該複数の回答文書情報のそれぞれの特徴量を前記回答文書情報のそれぞれから取得する特徴量取得手段と、
前記複数の回答文書情報のそれぞれを特徴量空間上にプロットした分布図情報を作成する分布図作成手段と、
前記特徴量取得手段が取得した特徴量に基づいて、前記複数の回答文書情報のそれぞれの間の特徴量空間における距離を求め、求めた前記距離が予め定めた値以上離れている回答文書情報の集合は、それぞれ異なる属性情報が付与されるものとして、前記複数の回答文書情報を分類し、分類した分類結果に基づいて当該複数の回答文書情報に対応する前記複数の質問文書情報を分類する分類手段とを有する情報処理装置。
[14]質問と回答の関係にある複数の質問文書情報と複数の回答文書情報及び当該複数の質問文書情報と当該複数の回答文書情報について質問から回答を作成する際の観点を示す判断情報を取得して、前記判断情報に基づいて前記複数の回答文書情報を複数の集合に分類する判断情報分類手段と、
前記判断情報分類手段により一の集合に分類された複数の回答文書情報のそれぞれの特徴量を前記回答文書情報のそれぞれから取得する特徴量取得手段と、
前記複数の集合のそれぞれについて、前記複数の回答文書情報のそれぞれを特徴量空間上にプロットした分布図情報を作成する分布図作成手段と、
前記複数の集合のそれぞれについて、前記特徴量取得手段が取得した特徴量に基づいて、前記複数の回答文書情報のそれぞれの間の特徴量空間における距離を求め、前記複数の集合のそれぞれについて、求めた前記距離が予め定めた値以上離れている回答文書情報の集合は、それぞれ異なる属性情報が付与されるものとして、前記複数の回答文書情報を分類する分類手段と、
前記分類手段により前記複数の回答文書情報が分離よく分類された集合に対応する判断情報が、質問から回答を作成する際に着目すべき観点であるものとして通知する判断情報通知手段とを有する情報処理装置。
[15]質問と回答の関係にある複数の質問文書情報と複数の回答文書情報及び当該複数の質問文書情報と当該複数の回答文書情報について質問から回答を作成する際の観点を示す判断情報を取得して、前記判断情報に基づいて前記複数の回答文書情報を複数の集合に分類する判断情報分類手段と、
前記判断情報分類手段により一の集合に分類された複数の回答文書情報のそれぞれの特徴量を前記回答文書情報のそれぞれから取得する特徴量取得手段と、
前記複数の集合のそれぞれについて、前記複数の回答文書情報のそれぞれを特徴量空間上にプロットした分布図情報を作成する分布図作成手段と、
前記複数の集合のそれぞれについて、前記特徴量取得手段が取得した特徴量に基づいて、前記複数の回答文書情報のそれぞれの間の特徴量空間における距離を求め、前記複数の集合のそれぞれについて、求めた前記距離が予め定めた値以上離れている回答文書情報の集合は、それぞれ異なる属性情報が付与されるものとして、前記複数の回答文書情報を分類し、分類した分類結果に基づいて当該複数の回答文書情報に対応する前記複数の質問文書情報を分類する分類手段と、
それぞれ異なる属性情報が付与されるものとされた回答文書情報の集合に新たな属性情報を付与する属性情報付与手段とを有する情報処理装置。
請求項1又は7に係る発明によれば、文書情報の分類が適切か否か利用者に判断させるための情報を作成することができる。
請求項2に係る発明によれば、特徴量空間における距離に基づいて文書情報の分類が適切か否か利用者に判断させるための情報を作成することができる。
請求項3に係る発明によれば、文書情報の分類が適切でない場合に、他の属性情報を付与することができる。
請求項4に係る発明によれば、複数の分布図情報を結合して、文書情報の分類が適切か否か利用者に判断させるための情報を作成することができる。
請求項5に係る発明によれば、分布図情報を利用者に提示することができる。
請求項6に係る発明によれば、分布図情報及び分類結果を利用者に提示することができる。
請求項8又は13に係る発明によれば、回答文書情報を分類することで、質問文書情報を分類することができる。
請求項9に係る発明によれば、回答文書情報を分類することで、分類された質問文書情報に属性情報を付与することができる。
請求項10に係る発明によれば、回答文書情報を分類することで属性情報が付与された質問文書情報について学習を行い、当該学習結果に基づいて質問文書情報に対する回答文書情報を提示することができる。
請求項11又は14に係る発明によれば、回答文書情報を分類した際の分離の良さに基づいて、回答文書情報を作成する際に着目すべき観点を示す判断情報を通知することができる。
請求項12又は15に係る発明によれば、判断情報に基づいて属性情報を付与することができる。
図1は、本発明の第1の実施の形態に係る情報処理装置の構成の一例を示すブロック図である。 図2(a)及び(b)は、分布図作成動作の一例を説明するための概略図である。 図3(a)及び(b)は、分類動作の一例を説明するための概略図である。 図4(a)−(c)は、第2の実施の形態に係る情報処理装置の動作例を説明するための概略図である。 図5(a)及び(b)は、第3の実施の形態の情報処理装置の動作の一例を説明するための概略図である。 図6(a)及び(b)は、第3の実施の形態の情報処理装置の動作の他の例を説明するための概略図である。 図7は、本発明の第4の実施の形態に係る情報処理装置の構成の一例を示すブロック図である。 図8(a)−(d)は、質問文書情報及び回答文書情報の構成の一例を示す概略図である。 図9(a)−(d)は、質問文書情報と回答文書情報の特徴を説明するための概略図である。 図10(a)−(e)は、情報処理装置の分類及び学習動作の一例を説明するための概略図である。 図11(a)−(c)は、情報処理装置の推定動作の一例を説明するための概略図である。 図12は、情報処理装置の分類及び学習動作の一例を説明するためのフローチャートである。 図13は、情報処理装置の推定動作の一例を説明するためのフローチャートである。 図14は、本発明の第5の実施の形態に係る情報処理装置の構成の一例を示すブロック図である。 図15(a)−(c)は、質問文書情報及び回答文書情報の構成の一例を示す概略図である。 図16(a)−(c)は、情報処理装置の動作の一例を説明するための概略図である。 図17は、情報処理装置の動作の一例を説明するためのフローチャートである。 図18(a)−(e)は、第6の実施の形態の情報処理装置の動作の一例を説明するための概略図である。
[第1の実施の形態]
(情報処理装置の構成)
図1は、本発明の第1の実施の形態に係る情報処理装置1の構成の一例を示すブロック図である。
この情報処理装置1は、CPU(Central Processing Unit)等から構成され各部を制御するとともに各種のプログラムを実行する制御部10と、HDD(Hard Disk Drive)やフラッシュメモリ等の記録媒体から構成され情報を記憶する記憶装置の一例としての記憶部11と、外部の端末とネットワークを介して通信する通信部12とを備える。
なお、情報処理装置1は、通信部12及びネットワークを介して接続された外部の端末から要求を受け付けて動作し、要求に対する応答を要求元である外部の端末に送信するサーバ装置である。
制御部10は、後述する情報処理プログラム110を実行することで、属性情報受付手段100、特徴量算出手段101、分布図作成手段102、距離算出手段103、分類手段104及び通知手段105等として機能する。
属性情報受付手段100は、外部から受け付けた属性情報付与要求に応じて、文書情報111に対して付与される少なくとも属性名を含む属性情報112を受け付ける。当該属性情報112は、分類の名称を示すものである。ここで、文書情報とは、例えば、電子メール、チャット等の情報通信で送信されるテキスト情報や、音声情報をテキスト化した情報、紙文書等を光学走査して得られた情報等を用いることができる。
特徴量算出手段101は、外部から受け付けた文書情報分類要求に応じて、共通の属性情報112が付与された複数の文書情報111から、一例として、単語出現頻度(TF−IDF)等を用いて文書をベクトル表現し、多次元尺度構成法(MDS)にて特徴量を算出する。なお、他の手法を用いて特徴量を算出してもよい。
分布図作成手段102は、特徴量算出手段101が算出した特徴量に基づいて、同一分類の文書情報111、つまり、共通の属性情報112が付与された複数の文書情報111のそれぞれを特徴量空間上にプロットした分布図情報113を作成する。なお、特徴量空間の次元は、特徴量算出手段101が算出する特徴量の種類の数に依存するものである。
距離算出手段103は、共通の属性情報112が付与された複数の文書情報111のそれぞれの間の特徴量空間における距離を、特徴量算出手段101が算出した特徴量に基づいて算出する。
分類手段104は、距離算出手段103が算出した特徴量空間における距離に基づいて、共通の属性情報112が付与された複数の文書情報111のそれぞれが正しい分類か否か判断し、正しい分類でない場合は異なるものとして分類する。
通知手段105は、分布図作成手段102が作成した分布図情報113及び/又は分類手段104により分類された内容を文書情報分類要求の要求元に対して通知する。
記憶部11は、情報処理プログラム110、文書情報111、属性情報112、分布図情報113及び分布履歴情報114等を格納する。
情報処理プログラム110は、制御部10を上記した各手段100〜106として動作させるプログラムである。
分布履歴情報114は、分布図情報113を一定期間に渡り日時情報とともに記録した情報である。
なお、情報処理装置1は、例えば、サーバ装置又はパーソナルコンピュータであるが、その他に携帯電話機、タブレット端末等を用いることもできる。
また、情報処理装置1は、操作部及び表示部をさらに有する構成とすることで、外部の端末を用いずに単独で動作するように構成してもよい。
(情報処理装置の動作)
次に、本実施の形態の作用を、(1)基本動作、(2)分布図作成動作、(3)分類動作に分けて説明する。
(1)基本動作
まず、情報処理装置1の利用者は、記憶部11の複数の文書情報111を分類するため、複数の文書情報111に対して属性情報を登録するため属性名を入力すべく情報処理装置1にネットワークを介して接続された端末装置(図示せず)の操作部を操作する。
次に、属性情報受付手段100は、属性情報入力欄を端末装置の表示部に表示して属性名の入力を受け付ける。一例として、「税金」という属性名が入力されたとする。
次に、属性情報受付手段100は、属性情報入力欄に入力された属性名である「税金」を複数の文書情報111に付与して属性情報112として記憶部11に保存する。
次に、利用者は、属性情報112が付与された複数の文書情報111の分類が正しいかどうかを確かめるため、つまり、複数の文書情報111のすべてが属性情報112に付与されるものであるかどうかを確かめるため、情報処理装置1に対して文書情報の分類を要求する。
なお、属性情報112の文書情報111に対する付与は、利用者が行うもの以外に、機械で自動で付与されたものであってもよい。
(2)分布図作成動作
図2(a)及び(b)は、分布図作成動作の一例を説明するための概略図である。
図2(a)に示すように、文書情報111a−111aからなる集合111aは、利用者によって属性情報112aとして例えば「税金」が付与されている。本実施形態においては、図2(a)以降に示すように、属性情報を「tag」で表現している。属性情報112aには、種別、カテゴリ、業種等が用意されている。
特徴量算出手段101は、文書情報分類要求に応じて、共通の属性情報112aが付与された複数の文書情報111a−111aからそれぞれ特徴量を算出する。
次に、分布図作成手段102は、図2(b)に示すように、特徴量算出手段101が算出した特徴量に基づいて、共通の属性情報112が付与された複数の文書情報111a−111aのそれぞれを特徴量空間上にプロットした分布図情報113を作成する。
なお、分布図情報113は、説明のために二次元空間上の分布を示しているが、n次元空間上の分布を示すものであってもよい。
また、距離算出手段103は、共通の属性情報112が付与された複数の文書情報111a−111aのそれぞれの間の特徴量空間における距離を、特徴量算出手段101が算出した特徴量に基づいて算出する。図2(b)に示す距離dは、文書情報111aとそれ以外の集合111aに属する文書情報それぞれとの距離の平均である。なお、距離dは、最も近い文書情報との距離でもよいし、最も遠い文書情報との距離でもよく、適宜定義してよい。
(3)分類動作
図3(a)及び(b)は、分類動作の一例を説明するための概略図である。
以下は「(2)分布図作成動作」に続く動作を説明するものであって、「(2)分布図作成動作」において、利用者によって文書情報111aと文書情報111aに対して、同一の属性情報112aである「税金」が付与されていること前提に説明する。分類手段104は、図3(a)に示すように分布図情報113を参照し、特徴量空間における距離dに基づいて、距離が予め定めた閾値d以上のものを共通の属性情報112aにあたる「税金」以外の属性情報が付与されるべき別分類の文書情報であるとして、共通の属性情報112aが付与されるべき集合111aと属性情報112a以外の属性情報が付与されるべき文書情報111aとをそれぞれ異なる分類の集合に属するものと判断する。
分類手段104は、分類の結果d>dである場合、集合111aと文書情報111aとをそれぞれ異なる分類の集合に属するものと判断し、図3(b)に示すように、文書情報aから属性情報112aを削除する。なお、分類手段104は、属性情報112aを削除せずに、以下に説明する通知手段105により属性情報112aが誤って付与されている可能性がある旨を分類結果として利用者に通知してもよい。また、分類手段104は、属性情報112aを削除した文書情報111aに対し、過去の履歴等を利用して、特徴量空間における距離の近い他の文書情報に付与されている属性情報を、属性情報112aの代わりに再付与すべき属性情報であると推測して付与してもよい。ここで、「再付与」とは、予め付与された属性情報と異なる他の属性情報を予め付与された属性情報に代えて付与することをいうものとする。
通知手段105は、分布図作成手段102が作成した分布図情報113a及び/又は分類手段104による分類結果を文書情報分類要求の要求元である利用者に対して通知する。
例えば、分布図情報113aを利用者の利用する端末の表示部に表示するとともに、分類結果として、距離が予め定めた閾値d以上の文書情報111aをハイライト表示して、当該文書情報111aから属性情報112aが削除された旨をメッセージで表示するようにしてもよい。
(第1の実施の形態の効果)
上記した実施の形態によると、属性情報112aが付与された集合111aに含まれる複数の文書情報の特徴量を算出し、特徴量空間における文書情報同士の距離が予め定めた閾値以上の文書情報が存在した場合に、当該文書情報に付与された属性情報112aを削除することとしたため、属性情報112aを削除した文書情報を示すことで、当該文書情報に付与された属性情報112aが適切でない旨を利用者に提示することができる。
また、特徴量空間における文書情報同士の距離が予め定めた閾値以上の文書情報が存在した場合に、当該文書情報の存在を利用者に通知するようにしたため、複数の文書情報に付与された属性情報112aが適切か否か利用者に判断するための情報を提示することができる。
特徴量空間における文書情報同士の距離が予め定めた閾値以上 の文書情報が存在した場合に、当該文書情報の属性情報を再付与することとしたため、属性情報を再付与した文書情報を示すことで、当該文書情報に付与された属性情報112aが適切でない旨を利用者に提示することができる。
これらの効果をまとめると、上記した実施の形態により、複数の文書情報に付与された属性情報112aが適切か否か利用者に判断するための情報を提示することができる。なお、本実施の形態においては、文書情報同士の距離が予め定めた閾値以上の文書情報が存在した場合に、属性情報を削除、利用者に通知又は属性情報を再付与するようにしているが、文書情報同士の距離が他の文書情報同士の距離との関係で相対的に大きい場合に、属性情報を削除、利用者に通知又は属性情報を再付与するようにしてもよい。
なお、判断の条件として予め定めた閾値を含まずに、距離が予め定めた閾値より大きい文書情報が存在した場合に動作を行うようにしても、同様の効果を得られる。また、距離が予め定めた閾値より小さい文書情報について付与された属性情報が適切である旨を通知してもよい。
[第2の実施の形態]
第2の実施の形態は、複数の利用者のそれぞれについて第1の実施の形態で説明した分布図情報を作成した後、作成された複数の分布図情報を結合して分類を行う点で異なる。
図4(a)−(c)は、第2の実施の形態に係る情報処理装置1の動作例を説明するための概略図である。
図4(a)に示すように、複数の利用者A−Cによりそれぞれ文書情報の集合111a−111aに対し、共通の属性情報112aを付与した場合について説明する。なお、付与動作は第1の実施の形態の「(1)基本動作」と同様であるため省略する。
次に、図4(b)に示すように、文書情報の集合111a−111aのそれぞれについて特徴量空間における分布図情報113−113を作成する。なお、分布図情報113−113の作成は、第1の実施の形態の「(2)分布図作成動作」と同様であるため省略する。
分布図情報113−113が作成された時点で、文書情報111aAi−111aCiはそれぞれ集合111aAm−111aCmと予め定めた閾値d以上の距離を有している場合、別分類の文書情報であると分類されるものである。
次に、分布図作成手段102は、分布図情報113−113を結合し、図4(c)に示すように、分布図情報113A+B+Cとする。これにより文書情報111aAi−111aCiは、他の文書情報の集合111aA+B+Cと特徴量空間において予め定めた閾値dより小さい距離に位置することとなる。
(第2の実施の形態の効果)
上記した実施の形態によると、複数の利用者で手分けする等して文書情報に対する属性情報の付与を行った場合に、特徴量空間における文書情報の分布を結合したため、文書情報の数が少ない場合には分類が誤っていると判断されるおそれのあった文書情報について、結合した結果においては分類が誤っていないと判断することができる。なお、結合しても他の文書情報とd以上の距離を有する文書情報は本来通り他の集合であると分類される。
なお、前述した第2の実施の形態では、分布図情報113−113を結合した分布図情報113A+B+Cについて、分類を行うようにした。しかし、これに限らず、分布図情報113−113が作成された時点で、文書情報111aAi−111aCiはそれぞれ集合111aAm−111aCmと予め定めた閾値d以上の距離を有している場合、別分類の文書情報であると分類し、分布図情報113−113を結合した分布図情報113A+B+Cについて、改めて分類をしなおすように実施してもよく、当該実施の形態であっても第2の実施の形態と同様の効果を奏することができる。
[第3の実施の形態]
第3の実施の形態は、第1の実施の形態で説明した分布図情報を作成して経時的に蓄積し、分布図情報の履歴によって分類を行う点で異なる。
図5(a)及び(b)は、第3の実施の形態の情報処理装置1の動作の一例を説明するための概略図である。
図5(a)に示すように、分布図作成手段102が文書情報の集合111bについて特徴量空間における分布図情報113bを作成した場合について説明する。なお、分布図情報113bの作成は、第1の実施の形態の「(2)分布図作成動作」と同様であるため省略する。
分布図情報113bにおいて文書情報111bは、他の文書情報の集合111bと閾値d以上の距離dだけ離れているものとする。通常であれば、分類手段104は、分類の結果d>dである場合、文書情報111bから属性情報を削除するが、本実施の形態においては最初に作成された分布図情報113bについては削除しない。なお、このタイミングで当該文書情報111bについて属性情報の付与が適切でない旨の通知を実行することを妨げるものではない。
次に、文書情報の集合111bと同一の属性情報が付与された文書情報の集合111b’(図5(b)中のハッチングで示された文書情報の集合)について文書情報分類要求を受け付けた場合、分布図作成手段102は、図5(b)に示すように、文書情報の集合111bと111b’とを結合した集合について、特徴量空間における分布図情報113b’を作成する。
分布図情報113b’において文書情報111bは、他の文書情報の集合111bmsと閾値d以上の距離dだけ離れていないため、分類手段104は文書情報111bから属性情報を削除しない。
図6(a)及び(b)は、第3の実施の形態の情報処理装置1の動作の他の例を説明するための概略図である。
図6(a)に示すように、分布図作成手段102が同一の属性情報が付与された文書情報の集合111cについて特徴量空間における分布図情報113cを作成した場合について説明する。なお、分布図情報113cの作成は、第1の実施の形態の「(2)分布図作成動作」と同様であるため省略する。
分布図情報113cにおいて文書情報111cは、他の文書情報の集合111cと閾値d以上の距離dだけ離れているものとする。通常であれば、分類手段104は、分類の結果d>dである場合、文書情報111cから属性情報を削除するが、本実施の形態においては最初に作成された分布図情報113cについては削除しない。なお、このタイミングで当該文書情報111cについて属性情報の付与が適切でない旨の通知を実行することを妨げるものではない。
次に、文書情報の集合111cと同一の属性情報が付与された文書情報の集合111c’ (図6(b)中のハッチングで示された文書情報の集合)について文書情報分類要求を受け付けた場合、分布図作成手段102は、図6(b)に示すように、文書情報の集合111cと111c’とを結合した集合について、特徴量空間における分布図情報113c’を作成する。
分布図情報113c’において文書情報111cは、他の文書情報の集合111cS1と閾値d以上の距離dだけ離れているものの、新たにできた集合111cS2と閾値d以上は離れていない。さらに集合111cS1と集合111cS2とが閾値d以上離れている。そのため、分類手段104は文書情報111cが含まれる文書情報の集合111cS2に対し111cS1に対応付けられた属性情報とは異なる新たな属性情報が対応付けられるべきであると判断する。
通知手段105は、分類手段104が文書情報111cが含まれる文書情報の集合111cS2に対し111cS1に対応付けられた属性情報とは異なる属性情報が対応付けられると判断した場合、文書情報の集合111cS2に対し新たな属性情報を付与するよう提案すべく、文書情報分類要求の要求元である利用者に対して通知してもよい。
なお、分類手段104は、図5及び図6で説明したように文書情報分類要求を通算で2回受け付けるまでは属性情報の削除又は不削除の判断をせず、通算で2回受け付けた場合に属性情報の削除又は不削除を判断したが、n回受け付けた場合に判断してもよいし、回数ではなく、ある期間を経過した場合に判断してもよい。ある期間を経過した場合としては、例えば、1年を経過した場合や季節毎等が挙げられる。また、予め定めたイベントが発生した場合を条件としてもよい。予め定めたイベントとしては、例えば、一定以上の数の文書情報の集合が蓄積された場合等が挙げられる。また、利用者の指示があった場合に属性情報の削除又は不削除の判断を行うようにしてもよい。
また、分類手段104が判断することなく、通知手段105が経時的な分布図情報の変化をアニメーション等を用いて利用者に提示し、利用者に属性情報の付与の適否の判断をさせるものでもよい。
(第3の実施の形態の効果)
上記した実施の形態によると、経時的に作成された複数の特徴量空間における文書情報の分布を結合したため、分類が誤っている文書情報について、結合した結果において新たな分類を提案することができる。
[第4の実施の形態]
第4の実施の形態は、文書情報が質問文書情報と、当該質問文書情報に対する回答である回答文書情報との組み合わせに代わった点で第1の実施の形態と異なり、回答文書情報について第1の実施の形態で説明した分布図情報を作成し、分類した後、当該分類結果を用いて質問文書情報を分類して、当該質問文書情報の分類結果によって学習を行うものである。また、当該学習結果を用いて質問文書情報に対応する回答文書情報を推定するものである。
(情報処理装置の構成)
図7は、本発明の第4の実施の形態に係る情報処理装置2の構成の一例を示すブロック図である。
この情報処理装置2は、CPU等から構成され各部を制御するとともに各種のプログラムを実行する制御部20と、HDDやフラッシュメモリ等の記録媒体から構成され情報を記憶する記憶装置の一例としての記憶部21と、外部の端末とネットワークを介して通信する通信部22とを備える。
なお、情報処理装置2は、通信部22及びネットワークを介して接続された外部の端末から要求を受け付けて動作し、要求に対する応答を要求元である外部の端末に送信するサーバ装置である。
制御部20は、後述する情報処理プログラム210を実行することで、特徴量算出手段200、分布図作成手段201、距離算出手段202、分類手段203、通知手段204、属性情報付与手段205、学習手段206、質問受付手段207、属性推定手段208及び回答提示手段209等として機能する。
特徴量算出手段200は、質問文書情報211の分類要求に応じて、対応する複数の回答文書情報212を、一例として、単語出現頻度(TF−IDF)等を用いてベクトル表現し、多次元尺度構成法(MDS)にて特徴量を算出する。なお、他の手法を用いて特徴量を算出してもよい。
ここで、質問文書情報211とは、質問形式のテキスト情報であって、質問をする利用者(以下、「質問者」という。)によって作成されたものであり、例えば、電子メール、チャット等の情報通信で送信されるテキスト情報や、音声情報をテキスト化した情報、紙文書等を光学走査して得られた情報等を用いることができる。また、回答文書情報212は、回答をする利用者(以下、「回答者」という。)によって作成されたものであって、質問文書情報211及び回答文書情報212は、質問に対する回答の関係にあり、それぞれ一対一に対応している情報の集合とする。つまり、質問文書情報211と回答文書情報212は、回答文書情報212を作成した回答者が関連付けるものである。
分布図作成手段201は、特徴量算出手段200が算出した特徴量に基づいて、複数の回答文書情報212のそれぞれを特徴量空間上にプロットした分布図情報214を作成する。なお、特徴量空間の次元は、特徴量算出手段200が算出する特徴量の種類の数に依存するものである。
距離算出手段202は、複数の回答文書情報212のそれぞれの間の特徴量空間における距離を、特徴量算出手段200が算出した特徴量に基づいて算出する。
分類手段203は、距離算出手段202が算出した特徴量空間における距離が予め定めた距離だけ離れている場合に、回答文書情報212どうしが異なる属性情報213を付与されるものとして分類する。
通知手段204は、分類手段203によって分類された複数の回答文書情報212及び/又は当該複数の回答文書情報212に対応する質問文書情報211を分類要求の要求元に対して通知する。
属性情報付与手段205は、外部から受け付けた属性情報付与要求に応じて、同一分類の回答文書情報212及び/又は質問文書情報211に対して付与される少なくとも属性名を含む属性情報213を受け付ける。当該属性情報213は、分類の名称を示すものである。
学習手段206は、属性情報213が付与された質問文書情報211を用いて学習を行い、学習情報215を生成する。なお、ここで学習とは、例えば、サポートベクトルマシン(SVM)等を用いた機械学習により行われる。
質問受付手段207は、通信部22を介して外部から質問文書情報211を受け付ける。
属性推定手段208は、質問受付手段207が外部から受け付けた質問文書情報211に付与される属性情報を、学習情報215を用いて推定する。
回答提示手段209は、属性推定手段208によって推定された属性情報に対応する回答文書情報212を、質問文書情報211の送信元に提示する。
記憶部21は、情報処理プログラム210、質問文書情報211、回答文書情報212、属性情報213、分布図情報214及び学習情報215等を格納する。
情報処理プログラム210は、制御部20を上記した各手段200〜209として動作させるプログラムである。
なお、情報処理装置2は、例えば、サーバ装置又はパーソナルコンピュータであるが、その他に携帯電話機、タブレット端末等を用いることもできる。
また、情報処理装置2は、操作部及び表示部をさらに有する構成とすることで、外部の端末を用いずに単独で動作するように構成してもよい。
(質問文書情報及び回答文書情報の構成)
図8(a)−(d)は、質問文書情報211及び回答文書情報212の構成の一例を示す概略図である。
図8(a)に示す質問文書情報211aは、質問文書情報211の一例であり、例えば、質問すべき分野の情報を的確に理解している専門家等によるものではなく、質問すべき分野の情報を完全には理解していない一般の利用者(質問者)による質問であって、質問の前提となる情報や質問に派生する情報等である(質問の本質的内容とは無関係な)背景内容2110と、質問の本質的な内容である質問内容2111とを有する。なお、背景内容2110は、必ず含まれるものではないが、一般の利用者からの質問であることを前提とすると含まれることが多い内容である。また、質問内容2111は、質問の本質的な内容であるが、利用者によっては的確な内容を示していない場合が多い内容である。
上記のような前提において、第1の実施の形態と同様の動作によって、質問文書情報211aについて特徴量算出手段200によって特徴量を算出し、分布図作成手段201によって図8(c)に示す分布図情報214aを作成すると、背景内容2110に含まれる単語や、的確な内容でない質問内容2111の単語が、質問文書情報211aから抽出される特徴量に影響し、各質問文書情報211aの分類結果は必ずしも理想的なものとはならない。
一方、図8(b)に示す回答文書情報212aは、回答すべき分野の情報を的確に理解している専門家等(回答者)により作成されるものであって、質問の本質的な内容に対する回答の内容である回答内容2120を有する。
上記のような前提において、第1の実施の形態と同様の動作によって、回答文書情報212aについて特徴量算出手段200によって特徴量を算出し、分布図作成手段201によって図8(d)に示す分布図情報214aを作成すると、的確な単語が回答内容2120に含まれるため、分布図情報214aと比較して、各回答文書情報212aの分類結果は理想的なものとなることが多い。
第4の実施の形態は、上記した質問文書情報211と回答文書情報212の特徴を利用したものであり、質問文書情報211の分類を、対応する回答文書情報212を用いて行うものである。
以下において、質問文書情報211と回答文書情報212の他の特徴についてさらに説明する。
図9(a)−(d)は、質問文書情報211と回答文書情報212の特徴を説明するための概略図である。
図9(a)に示す分布図情報214bに示すように、質問文書情報211b、211b、211bと質問文書情報211b、211bとが異なるものとして分類される場合であっても、図9(c)に示す分布図情報214bに示すように、回答文書情報212b、212b、212bと回答文書情報212b、212bとが同一のものとして分類される場合があり、これはつまり、異なる質問であっても、似た内容の回答で対応可能な場合を示す。
一方、図9(b)に示す分布図情報214cに示すように、質問文書情報211c、211c、211c、211c、211c、211cが同一のものとして分類される場合であっても、図9(d)に示す分布図情報214cに示すように、回答文書情報212c、212c、212cと回答文書情報212c、212b、212bとが異なるものとして分類される場合があり、これはつまり、似たような質問であっても、異なる内容の回答で対応可能な場合を示す。
上記した図9(a)及び図9(c)の例並びに図9(b)及び図9(d)の例のいずれにおいても、回答文書情報212の分類に基づいて質問文書情報211を分類することで、適切な回答文書情報212を提示することができる。
(情報処理装置の動作)
次に、本実施の形態の作用を、(1)分類及び学習動作、(2)推定動作に分けて説明する。
(1)分類及び学習動作
図10(a)−(e)は、情報処理装置2の分類及び学習動作の一例を説明するための概略図である。図12は、情報処理装置2の分類及び学習動作の一例を説明するためのフローチャートである。
まず、情報処理装置2の管理をする利用者(以下、「管理者」という。)は、図10(a)に示す質問文書情報211d、211d、211d…を分類して、質問文書情報211d、211d、211d…に対して属性情報を登録するため、まず、対応する回答文書情報212d、212d、212d…を分類すべく情報処理装置2にネットワークを介して接続された端末装置(図示せず)の操作部を操作する。なお、管理者は、回答者であってもよい。
情報処理装置2は、管理者の操作内容に応じて、互いに関連付けられた質問文書情報211d、211d、211d…及び回答文書情報212d、212d、212d…のセットを記憶部21から取得する(S1)。
次に、特徴量算出手段200は、回答文書情報212d、212d、212d…の特徴量を算出する(S2)。
次に、分布図作成手段201は、図10(b)に示すように、特徴量算出手段200が算出した特徴量に基づいて、回答文書情報212d、212d、212d…のそれぞれを特徴量空間上にプロットした分布図情報214dを作成する(S3)。
次に、距離算出手段202は、複数の回答文書情報212のそれぞれの間の特徴量空間における距離dを、特徴量算出手段200が算出した特徴量に基づいて算出する(S4)。
分類手段203は、距離算出手段202が算出した特徴量空間における距離が予め定めた距離だけ離れている場合に、図10(c)に示すように、回答文書情報212d−212dと回答文書情報212d−212dにそれぞれ異なる属性情報213を付与するものとして分類する(S5)。
通知手段204は、分類手段203によって分類された回答文書情報212d−212dと回答文書情報212d−212dを分類要求の要求元である端末装置に対して通知する(S6)。
情報処理装置2の利用者は、端末装置に通知された内容を確認し、回答文書情報212d−212dと回答文書情報212d−212dに属性情報213dと属性情報213dをそれぞれ付与するべく操作する。
属性情報付与手段205は、端末装置から属性情報付与要求を受け付け(S7)、当該属性情報付与要求に応じて、図10(c)に示すように、回答文書情報212d−212dに属性情報213dを付与し、回答文書情報212d−212dに属性情報213dを付与する(S7)。
また、属性情報付与手段205は、図10(d)に示すように、回答文書情報212d−212dと回答文書情報212d−212dに対応した質問文書情報211d−211dと質問文書情報211d−211dに対しても、同様に属性情報213dと属性情報213dを付与する(S8)。
次に、学習手段206は、図10(d)に示す属性情報213dと属性情報213dが付与された質問文書情報211d−211dと質問文書情報211d−211dを用いて学習を行い、学習情報215を生成する(S9)。
次に、管理者の操作に基づき、図10(e)に示すように、属性情報213d及び属性情報213dのそれぞれについて、回答文書情報212d−212dを一般化した回答文書情報212d及び回答文書情報212d−212dを一般化した回答文書情報212dを作成して、関連付ける。なお、回答文書情報212d及び回答文書情報212dは、回答文書情報212d−212d及び回答文書情報212d−212dから共通する単語を抽出して自動で生成するものであってもよい。
(2)推定動作
図11(a)−(c)は、情報処理装置2の推定動作の一例を説明するための概略図である。図13は、情報処理装置2の推定動作の一例を説明するためのフローチャートである。
まず、情報処理装置2に対して質問者は、質問をするために、図11(a)に示す質問文書情報211dを作成して、情報処理装置2にネットワークを介して接続された他の端末装置(図示せず)から情報処理装置2に送信する。
情報処理装置2の質問受付手段207は、質問者から質問文書情報211dを受け付ける(S20)。なお、質問文書情報211dは、回答文書情報212が関連付けられていないものである。
次に、属性推定手段208は、学習情報215を用いて質問文書情報211dに付与されるべき属性情報を推定し、図11(b)に示すように、属性情報213dを付与する(S21)。
次に、回答提示手段209は、図11(c)に示すように、属性情報213dに関連付けられた回答文書情報212dを、質問文書情報211dに対する回答として、質問者の利用する端末装置に表示することで提示する(S22)。なお、回答文書情報212dは、質問者の利用する端末装置に直接表示せずに、回答者の利用する端末装置に一端表示してから、回答者によって確認や修正を行って質問者に提示するものであってもよい。
(第4の実施の形態の効果)
上記した実施の形態によると、質問の本質的な内容に対する回答の内容である回答内容2120を有する回答文書情報212を用いて、対応する質問文書情報211を分類したため、質問文書情報211が必ずしも質問の本質的な内容を有しない場合であっても質問文書情報211を直接分類する場合に比べて、質問文書情報211の背景内容2110に含まれる単語や、的確な内容でない質問内容2111の単語が抽出される特徴量に影響されることのない分類結果を得られる。
また、回答文書情報212により分類された質問文書情報211に属性情報213を付与して、当該質問文書情報211と属性情報213のセットについて学習手段206によって学習して学習情報215を生成し、当該学習情報215を用いた属性推定により提示すべき回答文書情報212を特定するため、回答文書情報212の分類に沿った回答を提示することができる。
[第5の実施の形態]
第5の実施の形態は、第4の実施の形態の質問文書情報に対する回答として、回答者が回答文書情報を作成する際の観点としての判断情報を追加したものである。また、当該判断情報を用いて回答文書情報を分類するものであり、当該分類に応じて属性情報を付与するものである。
(情報処理装置の構成)
図14は、本発明の第5の実施の形態に係る情報処理装置3の構成の一例を示すブロック図である。
この情報処理装置3は、CPU等から構成され各部を制御するとともに各種のプログラムを実行する制御部30と、HDDやフラッシュメモリ等の記録媒体から構成され情報を記憶する記憶装置の一例としての記憶部31と、外部の端末とネットワークを介して通信する通信部32とを備える。
なお、情報処理装置3は、通信部32及びネットワークを介して接続された外部の端末から要求を受け付けて動作し、要求に対する応答を要求元である外部の端末に送信するサーバ装置である。
制御部30は、後述する情報処理プログラム310を実行することで、判断情報付与手段300、判断情報分類手段301、特徴量算出手段302、分布図作成手段303、距離算出手段304、分類手段305、判断情報通知手段306及び属性情報付与手段307等として機能する。
判断情報付与手段300は、質問文書情報311に対する回答文書情報312を作成する際の観点を判断情報314として質問文書情報311及び回答文書情報312に関連付けて付与する。
判断情報分類手段301は、質問文書情報311と回答文書情報312の組み合わせが複数ある場合に、質問文書情報311と回答文書情報312に付与された判断情報314に基づいて質問文書情報311と回答文書情報312の組み合わせを複数の集合に分類する。
特徴量算出手段302は、集合に含まれる複数の回答文書情報312を、一例として、単語出現頻度(TF−IDF)等を用いてベクトル表現し、多次元尺度構成法(MDS)にて特徴量を算出する。なお、他の手法を用いて特徴量を算出してもよい。
分布図作成手段303は、特徴量算出手段302が算出した特徴量に基づいて、集合に含まれる複数の回答文書情報312のそれぞれを特徴量空間上にプロットした分布図情報315を作成する。なお、特徴量空間の次元は、特徴量算出手段302が算出する特徴量の種類の数に依存するものである。
距離算出手段304は、集合に含まれる複数の回答文書情報312のそれぞれの間の特徴量空間における距離を、特徴量算出手段302が算出した特徴量に基づいて算出する。
分類手段305は、距離算出手段304が算出した特徴量空間における距離に基づいて、集合に含まれる複数の回答文書情報312を分類する。
判断情報通知手段306は、分類手段305によって特徴量空間において複数の回答文書情報312が分離よく分類された集合の判断情報を、推薦する判断情報として回答文書情報312の作成者、つまり回答者に対して通知する。
属性情報付与手段307は、外部から受け付けた属性情報付与要求に応じて、同一分類の回答文書情報312又は質問文書情報311に対して付与される少なくとも属性名を含む属性情報313を受け付ける。当該属性情報313は、分類の名称を示すものである。
記憶部31は、情報処理プログラム310、質問文書情報311、回答文書情報312、属性情報313、判断情報314及び分布図情報315等を格納する。
情報処理プログラム310は、制御部30を上記した各手段300〜307として動作させるプログラムである。
なお、情報処理装置3は、例えば、サーバ装置又はパーソナルコンピュータであるが、その他に携帯電話機、タブレット端末等を用いることもできる。
また、情報処理装置3は、操作部及び表示部をさらに有する構成とすることで、外部の端末を用いずに単独で動作するように構成してもよい。
(質問文書情報及び回答文書情報の構成)
図15(a)−(c)は、質問文書情報311及び回答文書情報312の構成の一例を示す概略図である。
図15(a)に示す質問文書情報311eは、質問文書情報311の一例であり、例えば、質問すべき分野の情報を的確に理解している専門家等によるものではなく、質問すべき分野の情報を完全には理解していない一般の利用者(質問者)による質問であって、質問の前提となる情報や質問に派生する情報等である(質問の本質的内容とは無関係な)背景内容3110と、質問の本質的な内容である質問内容3111とを有する。なお、背景内容3110は、必ず含まれるものではないが、一般の利用者からの質問であることを前提とすると含まれることが多い内容である。また、質問内容3111は、質問の本質的な内容であるが、利用者によっては的確な内容を示していない場合が多い内容である。
一方、図15(b)及び(c)に示す回答文書情報312e及び312eは、回答すべき内容を的確に理解している専門家等(回答者5A及び5B)により作成されるものであって、質問の本質的な内容に対する回答の内容である回答内容3121及び3122を有する。
しかし、回答者5A及び5Bは、回答すべき内容を的確に理解している専門家等であっても、質問内容3111が的確な内容を示していない場合には、それぞれ異なる観点で回答文書情報312e及び312eを作成してしまう場合がある。つまり、回答文書情報312eは回答者5Aが「地域」の観点で作成したものであり、回答文書情報312eは回答者5Bが「業界」の観点で作成したものである。
上記のような前提において、回答文書情報312を作成する際の回答者の観点、つまり判断情報314が異なることは好ましいことではなく、同一の観点で回答文書情報312が作成することが質問者にとっては望ましい。従って、以下において回答者間で共通の観点により回答文書情報312を作成できるように複数の判断情報314がある場合には最適な判断情報314を回答者に提示するための動作について説明する。
(情報処理装置の動作)
次に、本実施の形態の作用を説明する。
図16(a)−(c)は、情報処理装置3の動作の一例を説明するための概略図である。図17は、情報処理装置3の動作の一例を説明するためのフローチャートである。
まず、回答者は、図16(a)に示すように、質問文書情報311f、311f、311f…に対する、回答文書情報312f、312f、312f…を作成するとともに、当該回答文書情報312f、312f、312f…を作成した際の観点として判断情報314fや314fを関連付けるべく情報処理装置3にネットワークを介して接続された端末装置(図示せず)の操作部を操作する。なお、質問文書情報311f、311f、311f…と、回答文書情報312f、312f、312f…とは、同一の属性情報313fが付与されているものとする。
情報処理装置3の判断情報付与手段300は、回答者の操作内容に応じて、質問文書情報311f−311f及び回答文書情報312f−312fに対して判断情報314fを付与し、質問文書情報311f11−311f16及び回答文書情報312f11−312f16に対して判断情報314fを付与する。
上記した質問文書情報311、回答文書情報312及び判断情報314のセットがある場合に、判断情報分類手段301は、上記セットを取得し(S30)、判断情報314で質問文書情報311及び回答文書情報312のセットを複数の集合に分類する(S31)。つまり、上記した例であれば、質問文書情報311f−311f及び回答文書情報312f−312fの集合(判断情報314f)と、質問文書情報311f11−311f16及び回答文書情報312f11−312f16の集合(判断情報314f)とに分類する。
次に、特徴量算出手段302は、回答文書情報312f−312f及び回答文書情報312f11−312f16の特徴量を算出する(S32)。
次に、分布図作成手段303は、図16(b)及び(c)に示すように、特徴量算出手段302が算出した特徴量に基づいて、回答文書情報312f−312f及び回答文書情報312f11−312f16のそれぞれを判断情報314f及び314f毎に特徴量空間上にプロットした分布図情報315f及び315fを作成する(S33)。
次に、距離算出手段304は、回答文書情報312f−312f及び回答文書情報312f11−312f16のそれぞれの間の特徴量空間における距離df1及びdf2を、特徴量算出手段302が算出した特徴量に基づいて算出する(S34)。
次に、分類手段305は、距離算出手段304が算出した特徴量空間における距離が予め定めた距離だけ離れている場合に、図16(b)及び(c)に示すように、回答文書情報312f−312f及び回答文書情報312f11−312f16を分類する(S35)。
次に、判断情報通知手段306は、分布図情報315f及び315fを比較して評価し、分類の分離の良い分布図情報315fの判断情報314fを、回答文書情報を作成する際に着目すべき観点として回答者の使用する他の端末装置に通知する(S36)。なお、通知のタイミングは、属性情報313fが付与されると推定される回答文書情報312を回答者が受信したタイミングであってもよいし、回答者が要求した任意のタイミングであってもよい。
(第5の実施の形態の効果)
上記した実施の形態によると、質問文書情報311及び回答文書情報312と関連付けられた判断情報314を用いて、質問文書情報311及び回答文書情報312の集合を分類し、分類毎に分布図情報315を作成して回答文書情報312の分類の分離の良さを基準に判断情報314を評価して、分類の分離の良い分布図情報315の判断情報314を、回答文書情報を作成する際に着目すべき観点として回答者の使用する他の端末装置に通知したため、複数の回答者間で同一の観点を共有して回答文書情報312を作成することができる。
[第6の実施の形態]
第6の実施の形態は、第5の実施の形態と同様の構成において、判断情報314の概念を細分化し、当該判断情報314の細分化を利用して回答文書情報312の概念を細分化するものである。
(情報処理装置の動作)
次に、本実施の形態の作用を説明する。
図18(a)−(e)は、第6の実施の形態の情報処理装置3の動作の一例を説明するための概略図である。
まず、回答者は、図18(a)に示すように、質問文書情報311g、311g、311g…311gに対する、回答文書情報312g、312g、312g…312gを作成するとともに、当該回答文書情報312g、312g、312g…312gを作成した際の観点として判断情報314g(「業種」)を関連付けるべく情報処理装置3にネットワークを介して接続された端末装置(図示せず)の操作部を操作する。なお、質問文書情報311g、311g、311g…311gと回答文書情報312g、312g、312g…312gとは、同一の属性情報313gが付与されているものとする。
情報処理装置3の判断情報付与手段300は、回答者の操作内容に応じて、質問文書情報311g−311g及び回答文書情報312g−312gに対して判断情報314gを付与する。
次に、回答者は、図18(b)に示すように、質問文書情報311g−311g及び回答文書情報312g−312gを作成した際の観点として、判断情報314g(「業種」)をさらに細分化した判断情報314g11(「業種A」)と判断情報314g12(「業種B」)を関連付けるべく情報処理装置3にネットワークを介して接続された端末装置の操作部を操作する。例えば、回答者は、回答文書情報312gを作成した際の観点として判断情報314g11(「業種A」)を関連付け、回答文書情報312g、312g、312g−312gを作成した際の観点として判断情報314g12(「業種B」)を関連付けた場合について説明する。
情報処理装置3の判断情報付与手段300は、回答者の操作内容に応じて、質問文書情報311g及び回答文書情報312gに対して判断情報314g11を付与し、質問文書情報311g、311g、311g−311g及び回答文書情報312g、312g、312g−312gに対して判断情報314g12を付与する。
上記した質問文書情報311、回答文書情報312及び判断情報314のセットがある場合に、第5の実施の形態と同様に、判断情報分類手段301は、上記セットを取得し、判断情報314で質問文書情報311及び回答文書情報312のセットを分類する。つまり、上記した例であれば、質問文書情報311g及び回答文書情報312gの集合(判断情報314g11)と、質問文書情報311g、311g、311g−311g及び回答文書情報312g、312g、312g−312gの集合(判断情報314g12)とに分類する。
次に、特徴量算出手段302は、回答文書情報312g及び回答文書情報312g、312g、312g−312gの特徴量を算出する(S32)。
次に、分布図作成手段303は、図18(c)に示すように、特徴量算出手段302が算出した特徴量に基づいて、回答文書情報312g及び回答文書情報312g、312g、312g−312gのそれぞれを判断情報314g11及び314g12毎に特徴量空間上にプロットした分布図情報315g11及び315g12を作成する(S33)。
次に、距離算出手段304は、回答文書情報312g、312g、312g−312gのそれぞれの間の特徴量空間における距離d12を、特徴量算出手段302が算出した特徴量に基づいて算出する(S34)。なお、回答文書情報312gについては単一であるために距離を算出していない。
次に、分類手段305は、距離算出手段304が算出した特徴量空間における距離d12が予め定めた距離だけ離れている場合に、図18(d)に示すように、回答文書情報312g、312g、312g−312gを回答文書情報312g、312gと回答文書情報312g−312gとに分類する。
次に、判断情報通知手段306は、上記した分類結果とともに、分類毎に属性情報313gをさらに細分化した属性情報を付与するよう回答者に通知する。
回答者は、図18(d)に示すように、質問文書情報311g及び回答文書情報312gに対して属性情報313g11を付与し、質問文書情報311g、311g及び回答文書情報312g、312gに対して属性情報313g12を付与し、質問文書情報311g−311g及び回答文書情報312g−312gに対して属性情報313g12’を付与する。
上記した細分化された属性情報313g11、属性情報313g12及び属性情報313g12’と、属性情報313gとの関係は図18(e)に示すようになり、情報処理装置3は当該木構造を属性情報313の付随情報として記憶する。なお、細分化された判断情報314g11及び判断情報314g12と、判断情報314gとの関係も同様に木構造であり、回答文書情報を作成する際に当該構造を回答者に提示して、回答者に適切な判断情報を選択させるようにしてもよい。
また、当該細分化された属性情報313g11が付与された質問文書情報311gと、属性情報313g12が付与された質問文書情報311g、311gと、属性情報313g12’が付与された質問文書情報311g−311gとについて、第4の実施の形態に示したように、学習手段206によって学習して学習情報215を生成してもよい。
(第6の実施の形態の効果)
上記した実施の形態によると、判断情報314を細分化して、質問文書情報311及び回答文書情報312の集合を分類し、分類毎に分布図情報315を作成してさらに分類したため、質問文書情報311及び回答文書情報312に細分化した属性情報313を付与することができる。また、細分化された判断情報314の構造を回答者に提示したため、回答者は当該構造に沿って適切な判断情報314を選択することができる。
なお、第2の実施の形態のように複数の利用者によって文書情報を分類していく場合に、本実施の形態を適用し、判断情報314及び属性情報313を複数の回答者によって細分化して回答文書情報を分類していく場合(図4(a)の利用者A−Cを回答者A−Cとし、文書情報111a−111aを回答文書情報111a−111aとする)、各回答者によって細分化された判断情報314及び属性情報313が付与されたとしても(図4(b)参照)、複数の回答者の回答文書情報を結合した場合に文書情報が分類されない場合(図4(c)参照)は、各回答者によって細分化された判断情報314及び属性情報313は採用せずに、細分化されていない判断情報314及び属性情報313を用いることとしてもよい。
[他の実施の形態]
なお、本発明は、上記実施の形態に限定されず、本発明の趣旨を逸脱しない範囲で種々な変形が可能である。
上記実施の形態では制御部10内の各手段100−105の機能をプログラムで実現したが、各手段の全て又は一部をASIC等のハードウエアによって実現してもよい。また、上記実施の形態で用いたプログラムをCD−ROM等の記録媒体に記憶して提供することもできる。また、上記実施の形態で説明した上記ステップの入れ替え、削除、追加等は本発明の要旨を変更しない範囲内で可能である。
1 情報処理装置
2 情報処理装置
3 情報処理装置
5A 回答者
5B 回答者
10 制御部
11 記憶部
12 通信部
20 制御部
21 記憶部
22 通信部
30 制御部
31 記憶部
32 通信部
100 属性情報受付手段
101 特徴量算出手段
102 分布図作成手段
103 距離算出手段
104 分類手段
105 通知手段
110 情報処理プログラム
111 文書情報
112 属性情報
113 分布図情報
114 分布履歴情報
200 特徴量算出手段
201 分布図作成手段
202 距離算出手段
203 分類手段
204 通知手段
205 属性情報付与手段
206 学習手段
207 質問受付手段
208 属性推定手段
209 回答提示手段
210 情報処理プログラム
211 質問文書情報
212 回答文書情報
213 属性情報
214 分布図情報
215 学習情報
300 判断情報付与手段
301 判断情報分類手段
302 特徴量算出手段
303 分布図作成手段
304 距離算出手段
305 分類手段
306 判断情報通知手段
307 属性情報付与手段
310 情報処理プログラム
311 質問文書情報
312 回答文書情報
313 属性情報
314 判断情報
315 分布図情報
2110 背景内容
2111 質問内容
2120 回答内容
3110 背景内容
3111 質問内容
3121 回答内容

Claims (15)

  1. コンピュータを、
    一対一の関係にある第1の文書情報と第2の文書情報の組を複数取得して、取得した複数の組に含まれる複数の前記第2の文書情報のそれぞれの特徴量を前記第2の文書情報のそれぞれから取得する特徴量取得手段と、
    前記複数の第2の文書情報のそれぞれを特徴量空間上にプロットした分布図情報を作成する分布図作成手段と、
    前記特徴量取得手段が取得した特徴量に基づいて、前記複数の第2の文書情報のそれぞれの間の特徴量空間における距離を求め、求めた前記距離が予め定めた値以上離れている第2の文書情報の集合は、それぞれ異なる属性情報が付与されるものとして、前記複数の第2の文書情報を分類し、分類した分類結果に基づいて当該複数の第2の文書情報に対応する複数の前記第1の文書情報を分類する分類手段
    として機能させるための情報処理プログラム。
  2. 前記分布図作成手段は、同一の属性情報に付与された前記第2の文書情報について作成された複数の分布図情報を結合し、新たな分布図情報を作成する請求項1に記載の情報処理プログラム。
  3. 前記コンピュータを、
    前記特徴量取得手段が取得した特徴量に基づいて、前記複数の第2の文書情報のそれぞれの間の特徴量空間における距離を求め、求めた前記距離が予め定めた値以上離れている前記第2の文書情報は、前記属性情報に付与されないものとして、前記複数の第2の文書情報を分類する分類手段としてさらに機能させる請求項1又は2に記載の情報処理プログラム。
  4. 前記分類手段は、前記属性情報に付与されないものとされた前記第2の文書情報に他の属性情報を付与する請求項3に記載の情報処理プログラム。
  5. 前記コンピュータを、
    前記複数の第2の文書情報の分類を要求した要求元に対し、前記分布図作成手段の作成した前記分布図情報を通知する通知手段としてさらに機能させる請求項1−4のいずれか1項に記載の情報処理プログラム。
  6. 前記複数の第2の文書情報の分類を要求した要求元に対し、前記分布図作成手段の作成した前記分布図情報及び前記分類手段が分類した分類結果を通知する通知手段としてさらに機能させる請求項3に記載の情報処理プログラム。
  7. 一対一の関係にある第1の文書情報と第2の文書情報の組を複数取得して、取得した複数の組に含まれる複数の前記第2の文書情報のそれぞれの特徴量を前記第2の文書情報のそれぞれから取得する特徴量取得手段と、
    前記複数の第2の文書情報のそれぞれを特徴量空間上にプロットした分布図情報を作成する分布図作成手段と、
    前記特徴量取得手段が取得した特徴量に基づいて、前記複数の第2の文書情報のそれぞれの間の特徴量空間における距離を求め、求めた前記距離が予め定めた値以上離れている第2の文書情報の集合は、それぞれ異なる属性情報が付与されるものとして、前記複数の第2の文書情報を分類し、分類した分類結果に基づいて当該複数の第2の文書情報に対応する複数の前記第1の文書情報を分類する分類手段とを有する情報処理装置。
  8. コンピュータを、
    質問と回答の関係にある複数の質問文書情報と複数の回答文書情報を取得して、当該複数の回答文書情報のそれぞれの特徴量を前記回答文書情報のそれぞれから取得する特徴量取得手段と、
    前記複数の回答文書情報のそれぞれを特徴量空間上にプロットした分布図情報を作成する分布図作成手段と、
    前記特徴量取得手段が取得した特徴量に基づいて、前記複数の回答文書情報のそれぞれの間の特徴量空間における距離を求め、求めた前記距離が予め定めた値以上離れている回答文書情報の集合は、それぞれ異なる属性情報が付与されるものとして、前記複数の回答文書情報を分類し、分類した分類結果に基づいて当該複数の回答文書情報に対応する前記複数の質問文書情報を分類する分類手段として機能させるための情報処理プログラム。
  9. 前記コンピュータを、
    前記分類された質問文書情報にそれぞれ属性情報を付与する属性情報付与手段としてさらに機能させる請求項8に記載の情報処理プログラム。
  10. 前記コンピュータを、
    前記属性情報が付与された質問文書情報について学習を行い、学習結果を生成する学習手段と、
    前記学習結果を用いて、属性情報が付与されていない質問文書情報に付与されるべき属性情報を推定する推定手段と、
    前記推定された属性情報が付与されている回答文書情報を、前記属性情報が付与されていない質問文書情報に対する回答として提示する提示手段としてさらに機能させる請求項9に記載の情報処理プログラム。
  11. コンピュータを、
    質問と回答の関係にある複数の質問文書情報と複数の回答文書情報及び当該複数の質問文書情報と当該複数の回答文書情報について質問から回答を作成する際の観点を示す判断情報を取得して、前記判断情報に基づいて前記複数の回答文書情報を複数の集合に分類する判断情報分類手段と、
    前記判断情報分類手段により一の集合に分類された複数の回答文書情報のそれぞれの特徴量を前記回答文書情報のそれぞれから取得する特徴量取得手段と、
    前記複数の集合のそれぞれについて、前記複数の回答文書情報のそれぞれを特徴量空間上にプロットした分布図情報を作成する分布図作成手段と、
    前記複数の集合のそれぞれについて、前記特徴量取得手段が取得した特徴量に基づいて、前記複数の回答文書情報のそれぞれの間の特徴量空間における距離を求め、前記複数の集合のそれぞれについて、求めた前記距離が予め定めた値以上離れている回答文書情報の集合は、それぞれ異なる属性情報が付与されるものとして、前記複数の回答文書情報を分類する分類手段と、
    前記分類手段により前記複数の回答文書情報が分離よく分類された集合に対応する判断情報が、質問から回答を作成する際に着目すべき観点であるものとして通知する判断情報通知手段として機能させるための情報処理プログラム。
  12. コンピュータを、
    質問と回答の関係にある複数の質問文書情報と複数の回答文書情報及び当該複数の質問文書情報と当該複数の回答文書情報について質問から回答を作成する際の観点を示す判断情報を取得して、前記判断情報に基づいて前記複数の回答文書情報を複数の集合に分類する判断情報分類手段と、
    前記判断情報分類手段により一の集合に分類された複数の回答文書情報のそれぞれの特徴量を前記回答文書情報のそれぞれから取得する特徴量取得手段と、
    前記複数の集合のそれぞれについて、前記複数の回答文書情報のそれぞれを特徴量空間上にプロットした分布図情報を作成する分布図作成手段と、
    前記複数の集合のそれぞれについて、前記特徴量取得手段が取得した特徴量に基づいて、前記複数の回答文書情報のそれぞれの間の特徴量空間における距離を求め、前記複数の集合のそれぞれについて、求めた前記距離が予め定めた値以上離れている回答文書情報の集合は、それぞれ異なる属性情報が付与されるものとして、前記複数の回答文書情報を分類し、分類した分類結果に基づいて当該複数の回答文書情報に対応する前記複数の質問文書情報を分類する分類手段と、
    それぞれ異なる属性情報が付与されるものとされた回答文書情報の集合に新たな属性情報を付与する属性情報付与手段として機能させるための情報処理プログラム。
  13. 質問と回答の関係にある複数の質問文書情報と複数の回答文書情報を取得して、当該複数の回答文書情報のそれぞれの特徴量を前記回答文書情報のそれぞれから取得する特徴量取得手段と、
    前記複数の回答文書情報のそれぞれを特徴量空間上にプロットした分布図情報を作成する分布図作成手段と、
    前記特徴量取得手段が取得した特徴量に基づいて、前記複数の回答文書情報のそれぞれの間の特徴量空間における距離を求め、求めた前記距離が予め定めた値以上離れている回答文書情報の集合は、それぞれ異なる属性情報が付与されるものとして、前記複数の回答文書情報を分類し、分類した分類結果に基づいて当該複数の回答文書情報に対応する前記複数の質問文書情報を分類する分類手段とを有する情報処理装置。
  14. 質問と回答の関係にある複数の質問文書情報と複数の回答文書情報及び当該複数の質問文書情報と当該複数の回答文書情報について質問から回答を作成する際の観点を示す判断情報を取得して、前記判断情報に基づいて前記複数の回答文書情報を複数の集合に分類する判断情報分類手段と、
    前記判断情報分類手段により一の集合に分類された複数の回答文書情報のそれぞれの特徴量を前記回答文書情報のそれぞれから取得する特徴量取得手段と、
    前記複数の集合のそれぞれについて、前記複数の回答文書情報のそれぞれを特徴量空間上にプロットした分布図情報を作成する分布図作成手段と、
    前記複数の集合のそれぞれについて、前記特徴量取得手段が取得した特徴量に基づいて、前記複数の回答文書情報のそれぞれの間の特徴量空間における距離を求め、前記複数の集合のそれぞれについて、求めた前記距離が予め定めた値以上離れている回答文書情報の集合は、それぞれ異なる属性情報が付与されるものとして、前記複数の回答文書情報を分類する分類手段と、
    前記分類手段により前記複数の回答文書情報が分離よく分類された集合に対応する判断情報が、質問から回答を作成する際に着目すべき観点であるものとして通知する判断情報通知手段とを有する情報処理装置。
  15. 質問と回答の関係にある複数の質問文書情報と複数の回答文書情報及び当該複数の質問文書情報と当該複数の回答文書情報について質問から回答を作成する際の観点を示す判断情報を取得して、前記判断情報に基づいて前記複数の回答文書情報を複数の集合に分類する判断情報分類手段と、
    前記判断情報分類手段により一の集合に分類された複数の回答文書情報のそれぞれの特徴量を前記回答文書情報のそれぞれから取得する特徴量取得手段と、
    前記複数の集合のそれぞれについて、前記複数の回答文書情報のそれぞれを特徴量空間上にプロットした分布図情報を作成する分布図作成手段と、
    前記複数の集合のそれぞれについて、前記特徴量取得手段が取得した特徴量に基づいて、前記複数の回答文書情報のそれぞれの間の特徴量空間における距離を求め、前記複数の集合のそれぞれについて、求めた前記距離が予め定めた値以上離れている回答文書情報の集合は、それぞれ異なる属性情報が付与されるものとして、前記複数の回答文書情報を分類し、分類した分類結果に基づいて当該複数の回答文書情報に対応する前記複数の質問文書情報を分類する分類手段と、
    それぞれ異なる属性情報が付与されるものとされた回答文書情報の集合に新たな属性情報を付与する属性情報付与手段とを有する情報処理装置。
JP2013203659A 2013-06-17 2013-09-30 情報処理プログラム及び情報処理装置 Active JP6064855B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013203659A JP6064855B2 (ja) 2013-06-17 2013-09-30 情報処理プログラム及び情報処理装置
US14/245,516 US9659088B2 (en) 2013-06-17 2014-04-04 Information processing apparatus and non-transitory computer readable medium
AU2014202622A AU2014202622B2 (en) 2013-06-17 2014-05-14 Information processing apparatus and program

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013126383 2013-06-17
JP2013126383 2013-06-17
JP2013203659A JP6064855B2 (ja) 2013-06-17 2013-09-30 情報処理プログラム及び情報処理装置

Publications (2)

Publication Number Publication Date
JP2015026355A JP2015026355A (ja) 2015-02-05
JP6064855B2 true JP6064855B2 (ja) 2017-01-25

Family

ID=52020380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013203659A Active JP6064855B2 (ja) 2013-06-17 2013-09-30 情報処理プログラム及び情報処理装置

Country Status (3)

Country Link
US (1) US9659088B2 (ja)
JP (1) JP6064855B2 (ja)
AU (1) AU2014202622B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105281925B (zh) * 2014-06-30 2019-05-14 腾讯科技(深圳)有限公司 网络业务用户群组划分的方法和装置
CN106227808B (zh) * 2016-07-22 2019-04-05 厦门容能科技有限公司 一种去除邮件干扰信息的方法以及垃圾邮件判定方法
CN106339418A (zh) * 2016-08-15 2017-01-18 乐视控股(北京)有限公司 一种分类纠错方法及装置
US11030409B2 (en) * 2016-08-19 2021-06-08 Accenture Global Solutions Limited Identifying attributes associated with an entity using natural language processing
US11947898B2 (en) * 2021-03-31 2024-04-02 Storyroom Inc. System and method of content brief generation using machine learning

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05342272A (ja) * 1992-06-05 1993-12-24 Fujitsu Ltd テキスト自動分類方式
JP4955843B2 (ja) * 1998-08-31 2012-06-20 三菱電機株式会社 情報検索システム、情報検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3812799B2 (ja) * 2000-03-06 2006-08-23 Kddi株式会社 文書集合特徴化方法および該方法を用いた文書集合検索方法およびそれらの装置
JP2001312503A (ja) * 2000-04-28 2001-11-09 Ricoh Co Ltd 文書群分類装置、文書群分類方法及び文書群分類プログラムを記録した記録媒体
JP3625054B2 (ja) * 2000-11-29 2005-03-02 松下電器産業株式会社 技術文書検索装置
US20030046297A1 (en) * 2001-08-30 2003-03-06 Kana Software, Inc. System and method for a partially self-training learning system
JP2005208977A (ja) * 2004-01-23 2005-08-04 Fuji Xerox Co Ltd 文書ファイリング装置および文書ファイリング方法
US20060069678A1 (en) * 2004-09-30 2006-03-30 Wu Chou Method and apparatus for text classification using minimum classification error to train generalized linear classifier
US8090743B2 (en) 2006-04-13 2012-01-03 Lg Electronics Inc. Document management system and method
US8275803B2 (en) 2008-05-14 2012-09-25 International Business Machines Corporation System and method for providing answers to questions
JP5374078B2 (ja) * 2008-06-16 2013-12-25 オリンパス株式会社 画像処理装置、画像処理方法および画像処理プログラム
US8645369B2 (en) 2008-07-31 2014-02-04 Yahoo! Inc. Classifying documents using implicit feedback and query patterns
JP5173721B2 (ja) * 2008-10-01 2013-04-03 キヤノン株式会社 文書処理システム及びその制御方法、プログラム、記憶媒体
US20120084112A1 (en) * 2010-09-24 2012-04-05 International Business Machines Corporation Providing community for customer questions
US20120136812A1 (en) 2010-11-29 2012-05-31 Palo Alto Research Center Incorporated Method and system for machine-learning based optimization and customization of document similarities calculation

Also Published As

Publication number Publication date
AU2014202622B2 (en) 2016-09-29
US9659088B2 (en) 2017-05-23
US20140372875A1 (en) 2014-12-18
AU2014202622A1 (en) 2015-01-22
JP2015026355A (ja) 2015-02-05

Similar Documents

Publication Publication Date Title
Foody Harshness in image classification accuracy assessment
JP6064855B2 (ja) 情報処理プログラム及び情報処理装置
JP2017224184A (ja) 機械学習装置
JP2014130408A (ja) グラフ作成プログラム、情報処理装置、およびグラフ作成方法
KR101773574B1 (ko) 데이터 테이블의 차트 시각화 방법
CA2752740A1 (en) Characterizing user information
JP5683622B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
CN108710654B (zh) 一种舆情数据可视化方法及设备
JP6520361B2 (ja) コンテンツ活用支援方法、コンテンツ活用支援プログラム、及びコンテンツ活用支援装置
US20070092857A1 (en) Method and apparatus for supporting training, and computer product
US20150379112A1 (en) Creating an on-line job function ontology
JP5786630B2 (ja) 情報処理装置及び情報処理プログラム
CN109344347A (zh) 显示控制方法、装置、电子设备及计算机可读存储介质
CN103020095B (zh) 信息处理设备和信息处理方法
JP5787924B2 (ja) クラスタ形成装置、クラスタ形成方法及びクラスタ形成プログラム
JP2012118705A (ja) 表示装置及び表示方法
JP5803912B2 (ja) 情報提供装置、システム、方法、及びプログラム
WO2015167497A1 (en) Visualizing topics with bubbles including pixels
JP2016051383A (ja) 帳票データ管理プログラム、帳票データ管理方法、及び情報処理装置
JP2012150680A (ja) 人間関係マップ作成支援装置,人間関係マップ作成支援方法および人間関係マップ作成支援プログラム
JP5316554B2 (ja) 情報処理装置及びプログラム
JP6348916B2 (ja) データ処理方法、データ処理装置及びデータ処理プログラム
JP2007328532A (ja) 事業評価装置、事業評価方法、事業評価プログラム
KR102365429B1 (ko) 불성실응답자를 판별하는 인공지능을 이용한 온라인 모바일 설문조사 플랫폼
US20170091307A1 (en) Computer readable recording medium, evaluation method, and evaluation apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150819

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160608

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160621

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160815

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160830

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161027

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161205

R150 Certificate of patent or registration of utility model

Ref document number: 6064855

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350