JP2010282416A - 区分データレコメンド方法、プログラム、及び装置 - Google Patents

区分データレコメンド方法、プログラム、及び装置 Download PDF

Info

Publication number
JP2010282416A
JP2010282416A JP2009135132A JP2009135132A JP2010282416A JP 2010282416 A JP2010282416 A JP 2010282416A JP 2009135132 A JP2009135132 A JP 2009135132A JP 2009135132 A JP2009135132 A JP 2009135132A JP 2010282416 A JP2010282416 A JP 2010282416A
Authority
JP
Japan
Prior art keywords
classification
data
classification code
file
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009135132A
Other languages
English (en)
Other versions
JP5332918B2 (ja
Inventor
Akifumi Nakahama
章文 中浜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2009135132A priority Critical patent/JP5332918B2/ja
Publication of JP2010282416A publication Critical patent/JP2010282416A/ja
Application granted granted Critical
Publication of JP5332918B2 publication Critical patent/JP5332918B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】新規テキスト情報に設定される区分データを自動的にチェック可能とし、付け間違いや未入力時に入力者へ候補情報を提供する。
【解決手段】分類コード表作成部101は、テキスト情報の母集団テキストファイル109と、正しいと判断された区分データが付与されたテキスト情報の標本テキストファイル110とから、区分データと分類コードとの対応関係を示す分類コード表ファイル104及び、分類コードの母集団テキストファイル109内での出現状況を収集した分類コード統計情報表ファイル105を作成する。区分データレコメンド部102は、新規テキスト情報から分類コードを抽出し、分類コード表ファイル104からその分類コードに対応する区分データを抽出し、その区分データ毎に分類コード統計情報表ファイル105から統計情報を抽出し、その統計情報に基づいて、新規テキスト情報に対応する区分データの候補を選択し提示する。
【選択図】図1

Description

テキスト情報を1つ以上の区分値によってそのテキスト情報の区分を示す区分データと共に蓄積する技術に関する。
近年、コールセンターの集積情報に注目し、分析を進める企業が増加傾向にある。背景には、顧客応対システムやテキストマイニングソフト等の導入が進み、コールセンターのITインフラが整備されたことが挙げられる。
しかしながら、集積情報は、様々な理由により、誤入力が発生しやすい。例えば、通話しながらのデータ入力や通話後、複数案件をまとめて入力する場合が多いため、入力者が誤入力に気がつかない場合が多い。
更に、コールセンターやお客様相談室の応対要員は、パートタイムや派遣社員で構成される場合が多く、定期的な人員入替により、入力水準を一定に保つのが難しい。
誤入力の例としては、以下が挙げられる。
(A)テキスト情報(直接入力する情報)の誤字脱字
(B)区分データ(プルダウンメニューから選択する情報)の付け間違い
(C)区分データの未設定
なお、上記(A)〜(C)として示される事例は、図18に示されるような顧客応対システム1801での入力を想定している。顧客応対システムとは、応対開始時間や顧客情報、質問内容や応対内容を入力者が都度画面入力して、履歴管理を行うシステムで、応対履歴データベース1802を有するシステムである。
このような顧客応対システムの入力画面は、業種・業務により違いはあるものの、大きく4種類の情報から画面構成される場合が多い。

(1)基本情報
案件番号、受付日時、受付者等の受付に関する情報を入力する部分
(2)顧客情報
顧客ID、顧客名等の顧客に関する情報を入力する部分
(3)問合せ情報
質問内容や質問の区分に関する情報を入力する部分
(4)回答情報
回答内容や回答の区分に関する情報を入力する部分

上記(1)〜(4)には、直接タイプ入力される項目と、プルダウンメニュー、チェックボックス等から選択される項目がある。また、画面起動時に初期値がセットされる場合や、特定の入力値からデータベースが検索されて、他の項目値が自動セットされる場合もある。
誤入力は、上記(3)の質問と(4)の回答の区分の入力で発生しやすい。実際のところ、(A)の誤字脱字は、入力文字の一部で発生する場合が多い。発生しても意味が通じない場合は少ないため、誤字脱字を都度確認して修正する必要性は低い。
一方、(B)(C)の区分データは本来、テキスト内容を目検で確認するのが非常に手間となるため、入力者が付加した区分データを集計することで、すばやく傾向をつかむ目的がある。それ故に、区分データには精度が求められる。
区分データの精度が低いと、集計結果の妥当性が無くなる。そのため、入力データを目検でチェックして、区分データの修正を行っている企業もある。しかしながら、多くの企業では、人員不足や集積情報が膨大なことから、入力段階のまま集積せざる得ないケースが多い。また、(B)(C)の区分データは、入力者が入力方法を知らない場合や誤理解している場合に、誤入力が続くため、(A)の問題より深刻である。
特開2001−060199号公報 特開2002−183194号公報 特開2002−189754号公報
しかし、上述したような区分データの誤入力をチェックしたり、区分データの入力を支援するような有効な従来技術はなかった。
そこで、本発明の1つの側面では、顧客応対システム等における新規テキスト情報の入力画面に設定される区分データを自動的にチェック可能とし、付け間違いの可能性がある場合や未入力時に入力者へ候補情報(レコメンド)を提供することを目的とする。
態様の一例では、テキスト情報を1つ以上の区分値によって該テキスト情報の区分を示す区分データと共に蓄積する方法として実現され、以下の構成を有する。
まず、lそれぞれ入力者によって区分データが付与されたテキスト情報の母集団テキストファイルと、正しいと判断された区分データが付与されたテキスト情報の標本テキストファイルとが、所定のテキスト単位の任意の組合せで構成される分類コードをキーとして比較されることにより、区分データと分類コードとの対応関係を示す分類コード表ファイルが作成される。
次に、分類コード表ファイルから抽出される区分データ毎に、分類コード表ファイル内でその区分データに対応付けられる分類コードの母集団テキストファイル内での出現状況を統計情報として収集した分類コード統計情報表ファイルが作成される。
次に、新規に入力された新規テキスト情報から分類コードが抽出され、その抽出された分類コード毎に分類コード表ファイルが検索されることにより、その分類コードに対応する区分データが抽出される。
そして、その抽出された区分データ毎に分類コード統計情報表ファイルから統計情報が抽出され、その抽出された統計情報に基づいて、新規テキスト情報に対応する区分データの候補が抽出された区分データから選択され提示される。
新規テキスト情報の入力に対して、それにもっとも適した区分データの候補(レコメンド)を的確に提示することが可能となる。
区分データのレコメンド機能を有する顧客応対システムの実施形態の構成図である。 分類コード表作成部101が実行する分類コード表作成処理を示す動作フローチャートである。 区分データレコメンド部102が実行する区分データレコメンド表示制御処理の制御動作を示す動作フローチャートである。 分類コード自動再作成部103が実行する分類コード自動再作成処理の制御動作を示す動作フローチャートである。 母集団テキストファイル109のデータ構成例を示す図である。 標本テキストファイル110のデータ構成例を示す図である。 区分データと分類階層・分類コードとの対応関係を示す図である。 分類コード表ファイル104のデータ構成例を示す図である。 分類コード統計情報表ファイル105のデータ構成例を示す図である。 応対情報の入力例と、それに対応する形態素、形態素パターン、及び形態素行列の例を示す図である 形態素行列を構成する形態素行列ファイルのデータ構成例を示す図である。 検索結果ファイル107のデータ構成例を示す図である。 レコメンドファイル108のデータ構成例を示す図である。 レコメンドメッセージの表示処理の説明図である。 区分データのお薦め表示の表示例を示す図である。 分類コード自動再作成処理における分類コード統計情報表ファイル105のデータ構成例を示す図である。 顧客応対システムの実施形態を実現できるコンピュータのハードウェア構成の一例を示す図である。 顧客応対システムの説明図である。
以下、実施形態について詳細に説明する。
図1は、区分データのレコメンド機能を有する顧客応対システムの実施形態の構成図である。
本実施形態による顧客応対システム100は、分類コード表作成部101、区分データレコメンド部102、及び分類コード自動再作成部103を備える。分類コード表作成部101は、入力者からの作成依頼に基づいて、分類コード表ファイル104及び分類コード統計情報表ファイル105を作成する。区分データレコメンド部102は、入力者による顧客応対における応対履歴データベース106への画面入力時に、分類コード表ファイル104を検索して、検索結果ファイル107、及びレコメンドファイル108を生成する。そして、区分データレコメンド部102は、これらのファイルの内容に基づいて、l区分データのレコメンド即ち候補の提示を行う。
分類コード自動再作成部103は、分類コード表ファイル104の自動再作成を実行する。
以上の構成を有する顧客応対システム100の実施形態の動作について、以下に詳細に説明する。
図2は、図1の分類コード表作成部101が実行する分類コード表作成処理を示す動作フローチャートである。
まず、入力者は、情報源Aの母集団テキストファイル109と情報源Bの標本テキストファイル110を指定する。図5は、母集団テキストファイル109のデータ構成例を示す図、図6は、標本テキストファイル110のデータ構成例を示す図である。
母集団テキストファイル109は、図5のように、1つのレコード(データ組)が、過去一定期間の顧客対応にて入力されるテキスト情報と、そのテキスト情報に対して入力者が設定した区分1から区分N(例えばN=3)までの各区分値の組からなる区分データで構成されている。この区分データは、入力者の判断で設定されたものであるため、テキスト情報に対して必ずしも適切な区分が設定されているとは限らない。母集団テキストファイル109のデータ量は、過去の一定期間(例えば1ヶ月)の顧客対応にて得られる全データ数であるため、大量(例えば1万件)である。この場合、後述する各ファイルとの同期を取るために、区分データを構成する区分1から区分Nまでの各区分値を結合した値が、区分データIDとして使用される。
これに対して、標本テキストファイル110は、図6のように、1つのレコード(データ組)が、テキスト情報と、そのテキスト情報に対して最適に設定された区分データとで構成されている。標本テキストファイル110のテキスト情報とそれに対応する区分データは、人手によって最適な対応関係となるように修正されている。標本テキストファイル110のデータ量は、1組の区分データに対して例えば50レコード程度である。母集団テキストファイル109の場合と同様に、区分データを構成する区分1から区分Nまでの各区分値を結合した値が、区分データIDとして使用される。
母集団テキストファイル109及び標本テキストファイル110は、それぞれCSVファイルのようなテキストファイルであってもよいし、データベースシステム上のレコードファイルであってもよい。
図1の分類コード表作成部101は、上述の情報源Aである母集団テキストファイル109と情報源Bである標本テキストファイル110から、以下のようにして分類コード表ファイル104を作成する。
まず、分類コード表作成部101は、母集団テキストファイル109と標本テキストファイル110から、分類コードを抽出する(図2のステップS201)。
本実施形態では、上述の分類コードを作成するために、本出願の出願人による特願2008−258776号の特許出願に記載の技術を用いる。この技術による処理の概要は以下の通りである。
ステップ1
区分データが適切に設定された標本テキストファイル110を構成する各レコードのテキスト情報(図6参照)に対して形態素解析が実行され、各レコードに共通に含まれる2つの形態素からなる組(2形態素組)の集合が抽出される。
ステップ2
母集団テキストファイル109を構成する各レコードのテキスト情報(図5参照)に対しても形態素解析が実行され、各テキストファイル109を構成する形態素群が抽出される。
抽出の繰返し回数を示す分類階層が、1にセットされる。
母集団テキストファイル109全体が、初期状態の処理対象の母集団テキストの集合として選択される。
ステップ3
ステップ1で抽出された2形態素組の各々毎に、標本テキストファイル110内の各レコードでの同時出現数(標本内出現数)と、処理対象の母集団テキストの集合内の同時出現数(母集団内出現数)が算出される。そして、「出現率=標本内出現数÷母集団内出現数」が算出される。
この出現率が上位所定順位以内となる2形態素組群が、現在の分類階層(最初は1)における分類コード群として選択される。
ステップ4
ステップ3で選択された各分類コード(=2形態素組)と、現在の分類階層とかなるデータ組に、各分類コードが含まれる標本テキストファイル110に対して設定されている区分データが対応付けられる。
ステップ5
分類階層が+1され、ステップ3で選択された各分類コード(=2形態素組)群のみが含まれる母集団テキストファイル109内のテキスト情報の集合が新たな処理対象の母集団テキストの集合とされ、ステップ3、4、及びこのステップ5の処理が繰り返し実行される。
このステップ5において、母集団テキストの集合に含まれるテキスト情報の数の変化が所定の閾値以下になったら、分類コードの抽出処理を終了する。
図7は、上述のステップ1からステップ5の繰返し処理によって生成される区分データと分類階層・分類コードとの対応関係を示す図である。分類コードは、テキストファイルに対して或る区分データが設定されるときに、そのテキストファイルに対する形態素解析の結果そのテキストファイルに含まれるべき適切な2つの形態素からなる組(2形態素組)の候補である。1種類の区分データに対して、複数の分類コードが対応付けられる場合がある。また、1種類の区分データに対して、分類階層が異なる同じ分類コードが複数回対応付けられる場合もある。
上述のステップ5として示されるように、分類コードの抽出において、分類階層が進むにつれて母集団テキストファイルが絞り込まれてゆく。このため、新たに入力されたテキストファイルを形態素解析して得られる形態素に、複数の分類階層にわたって選択されている分類コードを構成する2つの形態素が含まれる場合には、次のような推測が可能である。即ち、新たに入力されたテキストファイルは、上記分類コードに対応付けられている区分データが設定されている標本テキストファイル110に、より類似したテキスト内容を有すると推測できる。このため、その新たに入力されたテキストファイルには、上記区分データを設定することが推奨される。これが、本実施形態における区分データレコメンド機能の基本的な考え方である。
次に、図1の分類コード表作成部101は、図2のステップS201にて抽出した上述の分類コードに基づいて、分類コード表ファイル104を作成する(図2のステップS202)。図8は、図7の対応関係に基づいて生成される分類コード表ファイル104のデータ構成例を示す図である。図7の対応関係のフォーマットに、各データ組(レコード)毎に「分類最下層」データが付加されている。このデータは、それに対応する分類コードが、どの分類階層まで抽出されたかを示す情報である。例えば図8に示される1レコード目の分類コード「納品書−印刷」は、分類階層1のデータであるが、この分類コードは分類階層3においても選択されていることを示している。この情報は、図1の区分データレコメンド部102が、後述する分類コード表検索処理を実行するときに使用される。
分類コード表ファイル104は、CSVファイルのようなテキストファイルであってもよいし、データベースシステム上のレコードファイルであってもよい。図8の1行が1組のデータ組即ち1レコードを表す。区分データを構成する区分1から区分Nまでの各区分値を結合した値が、区分データIDとして使用される。
次に、分類コード表作成部101は、図2のステップS201での分類コードの抽出処理の内容に基づいて、分類コード統計情報表ファイル105を作成する(図2のステップS203)。
図9は、分類コード統計情報表ファイル105のデータ構成例を示す図である。このファイルは、区分データ項目(区分1から区分Nまでの各区分値の組)と、R1〜R4、及びR6〜R8の各分類コード統計情報項目と、分類精度項目、及び作成日項目とから構成される。区分データ項目の区分1から区分Nまでの各区分値を結合した値が区分データIDとして使用される。
図2の動作フローチャートでの処理結果に基づいて、分類コード表ファイル104の区分データ項目に登録されている各区分データのうち、同じ区分データを有するレコード群の情報が、分類コード統計情報表ファイル105の1つのレコードにまとめられる。そして、分類コード統計情報表ファイル105の各処理対象レコードの項目は、以下のようにして生成される。
R1項目には、分類コード表ファイル104のもととなった母集団テキストファイル109のレコード件数が登録される。
R2項目には、標本テキストファイル110のレコード件数が登録される。
R3項目には、区分データに対応付けられる1組以上の分類コードを使って母集団テキストファイル109が検索されたときに抽出されるレコード件数が登録される。より具体的には、分類コード表作成部101は、分類コード統計情報表ファイル105上の処理対象レコードの区分データで図8の分類コード表ファイル104の区分データ項目を検索する。そして、分類コード表作成部101は、検索により抽出された各レコードの分類コード項目(図8参照)に格納されている分類コードを抽出する。次に、分類コード表作成部101は、抽出した分類コード毎に、母集団テキストファイル109のテキスト情報項目(図5参照)を検索し、その分類コードを構成する2つの形態素を共に含むレコードの件数を抽出する。そして、分類コード表作成部101は、検索したレコード件数を、抽出した分類コード全体で加算し、その結果をR3項目に登録する。
R4項目には、R3項目の決定において母集団テキストファイル109から検索されたレコードのうち、分類コード統計情報表ファイル105上の処理対象レコードの区分データと同じ区分データが設定されているレコードの件数が登録される。
分類精度項目には、R4の項目値をR3の項目値で割って得られる値が登録される。
作成日は、母集団テキストファイル109内で最新に登録されたテキスト情報(図5)を含むレコードの日付である。
R6〜R8は、図1の分類コード自動再作成部103が使用し、初期値は何れも0である。これらの詳細については後述する。
以上のようにして、図1の分類コード表作成部101が分類コード表ファイル104と分類コード統計情報表ファイル105を作成すると、図1の区分データレコメンド部102が動作可能となる。
図3は、区分データレコメンド部102が実行する区分データレコメンド表示制御処理の制御動作を示す動作フローチャートである。
まず、入力者(図1参照)が、顧客応対システム100の画面入力部を用いて、顧客に対する応対内容を入力する(図3のステップS301)。図10(a)は、入力例を示す図である。質問内容のテキストと共に区分データ(大分類、中分類等、更に細かい分類も可能)が入力される。
これを受けて、図1の区分データレコメンド部102は、まずステップS301での入力内容に対して1つの検索IDを発行する(図3のステップS302)。検索IDとしては例えば「A00000000000000」のようなものである。
以上の入力内容は、検索ID及び作成日と共に、図1の応対履歴データベース106に順次蓄積され、応対履歴の解析処理等に活用されるほか、後述する分類コード自動再作成処理において参照される。
次に、区分データレコメンド部102は、ステップS301での入力内容から、質問内容のテキストデータを抽出し、そのデータに対して形態素解析処理を実行する(図3のステップS303)。この結果、例えば図10(a)の入力例における質問内容の部分のテキストデータに対して、図10(b)に例示されるような形態素が抽出される。
次に、区分データレコメンド部102は、ステップS303で抽出した形態素から、図10(c)として例示されるように、2形態素から構成される形態素パターンを選択し、それに基づいて形態素行列ファイルを作成する(図3のステップS304)。図10(d)は、形態素行列を概念的に示した図であり、縦列と横行にそれぞれ出現しうる形態素が配置され、各列と各行の交点が、各列の形態素と各行の形態素からなる形態素パターンを表している。同一の形態素同士の組と順序が逆の形態素の組に対応する×の部分は除かれて、○の部分の形態素パターンのみが形態素行列の要素を構成するデータとして抽出される。図11は、形態素行列を構成する形態素行列ファイルのデータ構成例を示す図である。ステップS302にて発行された検索ID毎、即ちステップS301での入力内容毎に、形態素行列の要素を構成する形態素パターンが登録される。
次に、区分データレコメンド部102は、ステップS305からS310までのループ処理によって、以下の一連の処理を繰り返し実行する。
まず、区分データレコメンド部102は、ステップS304にて得られた形態素行列ファイルから、形態素行列の要素である形態素パターンを順番に選択する(図3のステップS306)。
次に、区分データレコメンド部102は、分類コード表ファイル104(図8参照)において、ステップS306で選択した形態素パターンを分類コード項目の値として有するレコードを抽出する。続いて、区分データレコメンド部102は、抽出されたレコードの分類階層項目と分類最下層項目の内容を判定する。この判定に基づき、区分データレコメンド部102は、第1階層から分類最下層項目で示される階層までの全ての階層のレコードが抽出されている区分データ(=区分ID)を検索する(以上、図3のステップS307)。
次に、区分データレコメンド部102は、ステップS307での検索がヒットしたか否かを判定する(図3のステップS308)。そして、区分データレコメンド部102は、ヒットした場合に、そのヒットした区分データを、ステップS302にて発行されている検索IDに対応させて、検索結果ファイル107に登録する(図3のステップS309)。図12は、検索結果ファイル107のデータ構成例を示す図である。検索結果ファイル107の各レコードにおいて、検索ID項目にはステップS302で発行された検索IDが格納され、区分データ項目にはステップS307での検索でヒットした区分データが格納される。
以上のステップS306からS309までの一連の処理が、顧客応対の入力内容から得られた形態素行列の要素を構成する形態素パターン毎に繰り返し実行される。
形態素行列中の全ての形態素パターンに対するステップS305からS310までの繰返し処理が終了すると、区分データレコメンド部102は、ステップS309にて検索結果ファイル107に新たに登録された各処理対象レコード毎に、次の処理を実行する。即ち、区分データレコメンド部102は、分類コード統計情報表ファイル105から、その区分データ項目の内容が上記処理対象レコードの区分データ(図12参照)と同じレコードを検索する。次に、区分データレコメンド部102は、検索されたレコードの分類精度項目に格納されている分類精度値を抽出する。そして、区分データレコメンド部102は、その抽出した分類精度値と上記処理対象レコードの内容を結合する。その後、区分データレコメンド部102は、上位所定順位(例えば第3位)までの分類精度値とそれに結合されている処理対象レコードの内容を、レコメンドファイル108に登録する(以上、図3のステップS311)。図13は、レコメンドファイル108のデータ構成例を示す図である。レコメンドファイル108の各レコードは、上記処理対象レコードの検索ID及び区分データ(図12参照)が格納される検索ID項目及び区分データ項目と、分類精度値が格納される分類精度項目とから構成される。
次に、区分データレコメンド部102は、ステップS301にて入力中の応対内容の区分データ(図10(a)参照)と、レコメンドファイル108との比較処理を実行する(図3のステップS312)。具体的には、区分データレコメンド部102は、レコメンドファイル108(図13参照)において、検索ID項目の値がステップS302にて発行されている検索IDと同じレコードを、分類精度項目に登録されている分類精度が高い順位で抽出する。そして、区分データレコメンド部102は、応対内容中の区分データが、レコメンドファイル108から抽出されたレコードのうち、何番目の順位のレコード中の区分データ(図13参照)と一致するかを比較判定する。
ステップS312での比較判定の結果に基づいて、区分データレコメンド部102は、入力中の応対内容に対応させて、区分データのお薦めを示すメッセージを表示する(図3のステップS313)。図14は、ステップS312での比較判定と、その比較結果を受けて実行されるレコメンドメッセージを表示するための制御処理との関係を示す図である。今、応対内容中の区分データがレコメンドファイル108から抽出された第1番目の順位のレコード、即ち分類精度が最上位のレコードの区分データと一致したと判定された場合には、レコメンドメッセージは表示されない。これは、入力者による区分データの指定が最適であることを意味する。また、応対内容中の区分データがレコメンドファイル108から抽出された第1番目以外の順位のレコード、即ち分類精度が第2位以下のレコードの区分データと一致したと判定されたなら、一致検出順位より高順位のレコードの区分データが、お薦め表示される。これは、入力者による区分データの指定よりも最適な区分データが存在することを意味する。更に、応対内容中の区分データがレコメンドファイル108から抽出されたどのレコードの区分データとも一致しないと判定されたなら、抽出された全ての順位のレコードの区分データが、お薦め表示される。これは、入力者による区分データの指定は適切でないことを意味するため、この場合には、全ての順位の区分データ候補がお薦め表示される。図15は、上述の処理によって入力者に表示される区分データのお薦め表示の表示例を示す図である。
図15に例示される表示において、入力者は、何れかの区分データのお薦めの右横の「選択」リンクをクリックすることにより、そのお薦めの区分データを採用することができる。区分データレコメンド部102は、入力者によりお薦めの区分データの選択操作を受付け(図3のステップS314)、その選択された区分データを応対入力画面中の区分データの入力フォーム領域に自動設定する(図3のステップS315)。
その後、区分データレコメンド部102の処理が終了する。
以上説明した実施形態では、新たな応対内容の入力に対して、それにもっとも適した区分データの候補(レコメンド)を的確に提示することが可能となる。
図4は、分類コード自動再作成部103が実行する分類コード自動再作成処理の制御動作を示す動作フローチャートである。
この処理は、分類コード統計情報表ファイル105を利用し、区分データの一致度を自動的に解析し、一致度が低い区分データの分類コードを自動的に再作成する処理である。この処理を自動化することにより、人手による区分データのチェック作業が不要となり、分類コードを自動学習することができ、高い精度でのレコメンド処理が可能となる。
この処理ではまず、一定期間毎に、以下のチェック処理が実行される。
まず、分類コード自動再作成部103は、図9に示されるデータ構成例を有する分類コード統計情報表ファイル105の各区分データのレコードにおいて、R6、R7、R8の各項目値を初期化、即ち値0を設定する(図4のステップS401)。
次に、分類コード自動再作成部103は、分類コード統計情報表ファイル105の各区分データのレコードにおいて、R6項目に、以下の計算結果をセットする(図4のステップS402)。なお、R4項目値及びR1項目値は、R6項目と同一のレコード中の値である。

R6項目値=R4項目値/R1項目値

このようにして計算されるR6項目値は、R1項目値で示されるレコード件数を有する母集団テキストファイル109の中に、R4項目値で示されるレコード件数を有する区分データが一致するレコードが存在する割合、即ち期待値を示している。
次に、分類コード自動再作成部103は、分類コード統計情報表ファイル105から、各レコードの区分データ及び作成日の組合せを取り出す(図9参照)(図4のステップS403)。
次に、分類コード自動再作成部103は、ステップS403で取り出した区分データ及び作成日の組合せ毎に、以下の一連の処理を繰り返し実行する(図4のステップS404からS408までのループ処理)。
即ちまず、分類コード自動再作成部103は、区分データ及び作成日の組合せの1組を選択する(図4のステップS405)。
次に、分類コード自動再作成部103は、応対履歴データベース106から、ステップS405で選択した組の作成日以降の作成日が記憶されている応対履歴のレコード件数を検索する。そして、分類コード自動再作成部103は、そのレコード件数を、分類コード統計情報表ファイル105において、ステップS405で選択した組に対応するレコードのR7項目にセットする(以上、図4のステップS406)。
次に、分類コード自動再作成部103は、応対履歴データベース106から、ステップS405で選択した組の作成日以降の作成日が記憶され、かつその組の区分データと同じ区分データが記憶されている応対履歴のレコード件数を検索する。そして、分類コード自動再作成部103は、そのレコード件数を、分類コード統計情報表ファイル105において、ステップS405で選択した組に対応するレコードのR8項目にセットする(以上、図4のステップS407)。
以上のステップS405からS407の一連の処理が、分類コード統計情報表ファイル105上の全てのレコードに対して実行される(図4のステップS404からS408までのループ処理)。
その後、分類コード自動再作成部103は、分類コード統計情報表ファイル105から、以下の条件に一致する区分データを抽出する(図4のステップS409)。

R8項目値/R7項目値(実際に存在する割合)<R6項目値(期待する割合)×α

ここで、αは閾値のシステムパラメーターであり、管理者が自由に設定できる値とする。
図16は、分類コード自動再作成処理における分類コード統計情報表ファイル105のデータ構成例を示す図であり、図9のデータ構成例に対応している。この例に示されるレコードでは、元々R1=10,000件の母集団テキストファイル109に対してそのレコードの区分データを有するレコード件数R4が180件であった。従って、R6=R4/R1=180/10,000=0.018となる。そして、そのレコードの最新の作成日以降に応対履歴データベース106に登録されたレコード件数R7は、20,000件になっている。この20,000件のうち、そのレコードの区分データと一致する区分データを有するレコード件数R8は100件であった。従って、ステップS409では、実際に存在する割合(R8/R7=0.01)が、期待する割合(R6=0.018)×αよりも小さいレコードの区分データが抽出される。
最後に、分類コード自動再作成部103は、ステップS409で上述の条件に一致する区分データが抽出された場合には、以下の処理を実行する。即ち、分類コード自動再作成部103は、R7に対応する応対履歴データベース106上のレコード群を母集団テキストファイル109、R8に対応する応対履歴データベース106上のレコード群を標本テキストファイル110とする。そして、分類コード自動再作成部103は、図2の動作フローチャートで説明したのと同じ分類コード作成処理を実行することにより、分類コード表ファイル104及び分類コード統計情報表ファイル105を自動的に再作成する。
図17は、以上に説明した顧客応対システムの実施形態を実現できるコンピュータのハードウェア構成の一例を示す図である。
図17に示されるコンピュータは、CPU1701、メモリ1702、入力装置1703、出力装置1704、外部記憶装置1705、可搬記録媒体1709が挿入される可搬記録媒体駆動装置1706、及びネットワーク接続装置1707を有し、これらがバス1708によって相互に接続された構成を有する。同図に示される構成は上記システムを実現できるコンピュータの一例であり、そのようなコンピュータはこの構成に限定されるものではない。
CPU1701は、当該コンピュータ全体の制御を行う。メモリ1702は、プログラムの実行、データ更新等の際に、外部記憶装置1705(或いは可搬記録媒体1709)に記憶されているプログラム又はデータを一時的に格納するRAM等のメモリである。CUP1701は、プログラムをメモリ1702に読み出して実行することにより、全体の制御を行う。
入力装置1703は、例えば、キーボード、マウス等及びそれらのインタフェース制御装置とからなる。入力装置1703は、ユーザによるキーボードやマウス等による入力操作を検出し、その検出結果をCPU1701に通知する。
出力装置1704は、表示装置、印刷装置等及びそれらのインタフェース制御装置とからなる。出力装置1704は、CPU1701の制御によって送られてくるデータを表示装置や印刷装置に出力する。
外部記憶装置1705は、例えばハードディスク記憶装置である。主に各種データやプログラムの保存に用いられる。
可搬記録媒体駆動装置1706は、光ディスクやSDRAM、コンパクトフラッシュ等の可搬記録媒体1709を収容するもので、外部記憶装置1705の補助の役割を有する。
ネットワーク接続装置1707は、例えばLAN(ローカルエリアネットワーク)又はWAN(ワイドエリアネットワーク)の通信回線を接続するための装置である。
実施形態によるシステムは、図1に示される各ブロックの機能、又は図2〜図4に示される動作フローチャートの処理に対応する機能を搭載したプログラムをCPU1701が実行することで実現される。そのプログラムは、例えば外部記憶装置1705や可搬記録媒体1709に記録して配布してもよく、或いはネットワーク接続装置1707によりネットワークから取得できるようにしてもよい。また、各処理において用いられるデータは、例えば外部記憶装置1705からメモリ1702に読み出されて処理される。
以上説明した実施形態では、顧客応対システムにおける顧客応対情報の入力時の区分データの付与時にレコメンド表示する実施形態について説明したが、上述の技術は、何らかの文章情報の入力時に区分データを付与するシステムに広く適用することが可能である。
コールセンターやお客様相談室等で使用される顧客応対システムにおける区分データの入力に利用することができる。
100、1801 顧客応対システム
101 分類コード表作成部
102 区分データレコメンド部
103 分類コード自動再作成部
104 分類コード表ファイル
105 分類コード統計情報表ファイル
106、1802 応対履歴データベース
107 検索結果ファイル
108 レコメンドファイル
109 母集団テキストファイル(情報源A)
110 標本テキストファイル(情報源B)
1701 CPU
1702 メモリ
1703 入力装置
1704 出力装置
1705 外部記憶装置
1706 可搬記録媒体駆動装置
1707 ネットワーク接続装置
1708 バス
1709 可搬記録媒体

Claims (7)

  1. テキスト情報を1つ以上の区分値によって該テキスト情報の区分を示す区分データと共に蓄積する方法において、
    それぞれ入力者によって前記区分データが付与されたテキスト情報の母集団テキストファイルと、正しいと判断された前記区分データが付与されたテキスト情報の標本テキストファイルとを、所定のテキスト単位の任意の組合せで構成される分類コードをキーとして比較することにより、前記区分データと前記分類コードとの対応関係を示す分類コード表ファイルを作成し、
    前記分類コード表ファイルから抽出される前記区分データ毎に、前記分類コード表ファイル内で該区分データに対応付けられる前記分類コードの前記母集団テキストファイル内での出現状況を統計情報として収集した分類コード統計情報表ファイルを作成し
    新規に入力された新規テキスト情報から前記分類コードを抽出し、該抽出された分類コード毎に前記分類コード表ファイルを検索することにより、該分類コードに対応する区分データを抽出し、
    該抽出された区分データ毎に前記分類コード統計情報表ファイルから前記統計情報を抽出し、
    該抽出された統計情報に基づいて、前記新規テキスト情報に対応する区分データの候補を前記抽出された区分データから選択し提示する、
    ことを特徴とする区分データレコメンド方法。
  2. 前記新規テキスト情報を履歴データベースとして蓄積し、
    前記分類コード表ファイルから抽出される前記区分データ毎に、前記履歴データベース内での該区分データの出現状況を算出し、
    該出現状況を該区分データに対応して前記分類コード統計情報表ファイルから抽出される前記統計情報と比較し、
    該比較結果に基づいて、前記履歴データベースから前記母集団テキストファイル及び前記標本テキストファイルを決定して前記分類コード表ファイル及び前記分類コード統計情報表ファイルを再作成する、
    ことを特徴とする請求項1に記載の区分データレコメンド方法。
  3. 前記テキスト単位は形態素である、
    ことを特徴とする請求項1又は2の何れかに記載の区分データレコメンド方法。
  4. テキスト情報を1つ以上の区分値によって該テキスト情報の区分を示す区分データと共に蓄積するコンピュータに、
    それぞれ入力者によって前記区分データが付与されたテキスト情報の母集団テキストファイルと、正しいと判断された前記区分データが付与されたテキスト情報の標本テキストファイルとを、所定のテキスト単位の任意の組合せで構成される分類コードをキーとして比較することにより、前記区分データと前記分類コードとの対応関係を示す分類コード表ファイルを作成し、
    前記分類コード表ファイルから抽出される前記区分データ毎に、前記分類コード表ファイル内で該区分データに対応付けられる前記分類コードの前記母集団テキストファイル内での出現状況を統計情報として収集した分類コード統計情報表ファイルを作成し
    新規に入力された新規テキスト情報から前記分類コードを抽出し、該抽出された分類コード毎に前記分類コード表ファイルを検索することにより、該分類コードに対応する区分データを抽出し、
    該抽出された区分データ毎に前記分類コード統計情報表ファイルから前記統計情報を抽出し、
    該抽出された統計情報に基づいて、前記新規テキスト情報に対応する区分データの候補を前記抽出された区分データから選択し提示する、
    処理を実行させるためのプログラム。
  5. 前記新規テキスト情報を履歴データベースとして蓄積し、
    前記分類コード表ファイルから抽出される前記区分データ毎に、前記履歴データベース内での該区分データの出現状況を算出し、
    該出現状況を該区分データに対応して前記分類コード統計情報表ファイルから抽出される前記統計情報と比較し、
    該比較結果に基づいて、前記履歴データベースから前記母集団テキストファイル及び前記標本テキストファイルを決定して前記分類コード表ファイル及び前記分類コード統計情報表ファイルを再作成する、
    処理を更に実行することを特徴とする請求項1に記載のプログラム。
  6. テキスト情報を1つ以上の区分値によって該テキスト情報の区分を示す区分データと共に蓄積する装置において、
    それぞれ入力者によって前記区分データが付与されたテキスト情報の母集団テキストファイルと、正しいと判断された前記区分データが付与されたテキスト情報の標本テキストファイルとを、所定のテキスト単位の任意の組合せで構成される分類コードをキーとして比較することにより、前記区分データと前記分類コードとの対応関係を示す分類コード表ファイルを作成し、前記分類コード表ファイルから抽出される前記区分データ毎に、前記分類コード表ファイル内で該区分データに対応付けられる前記分類コードの前記母集団テキストファイル内での出現状況を統計情報として収集した分類コード統計情報表ファイルを作成する分類コード表作成部と、
    新規に入力された新規テキスト情報から前記分類コードを抽出し、該抽出された分類コード毎に前記分類コード表ファイルを検索することにより、該分類コードに対応する区分データを抽出し、該抽出された区分データ毎に前記分類コード統計情報表ファイルから前記統計情報を抽出し、該抽出された統計情報に基づいて、前記新規テキスト情報に対応する区分データの候補を前記抽出された区分データから選択し提示する区分データレコメンド部と、
    を含むことを特徴とする区分データレコメンド装置。
  7. 前記新規テキスト情報を履歴データベースとして蓄積し、前記分類コード表ファイルから抽出される前記区分データ毎に、前記履歴データベース内での該区分データの出現状況を算出し、該出現状況を該区分データに対応して前記分類コード統計情報表ファイルから抽出される前記統計情報と比較し、該比較結果に基づいて、前記履歴データベースから前記母集団テキストファイル及び前記標本テキストファイルを決定して前記分類コード表ファイル及び前記分類コード統計情報表ファイルを再作成する分類コード自動再作成部を更に含む、
    ことを特徴とする請求項1に記載の区分データレコメンド装置。
JP2009135132A 2009-06-04 2009-06-04 区分データレコメンド方法、プログラム、及び装置 Expired - Fee Related JP5332918B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009135132A JP5332918B2 (ja) 2009-06-04 2009-06-04 区分データレコメンド方法、プログラム、及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009135132A JP5332918B2 (ja) 2009-06-04 2009-06-04 区分データレコメンド方法、プログラム、及び装置

Publications (2)

Publication Number Publication Date
JP2010282416A true JP2010282416A (ja) 2010-12-16
JP5332918B2 JP5332918B2 (ja) 2013-11-06

Family

ID=43539088

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009135132A Expired - Fee Related JP5332918B2 (ja) 2009-06-04 2009-06-04 区分データレコメンド方法、プログラム、及び装置

Country Status (1)

Country Link
JP (1) JP5332918B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10540121B2 (en) 2018-02-05 2020-01-21 Konica Minolta, Inc. Non-transitory computer-readable recording medium storing input assistance program and input assisting method
CN113485683A (zh) * 2021-06-28 2021-10-08 延锋伟世通电子科技(上海)有限公司 Rtc代码量统计方法、***、介质及终端

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002007433A (ja) * 2000-04-17 2002-01-11 Fujitsu Ltd 情報分類装置、情報分類方法および情報分類プログラムを記録したコンピュータ読み取り可能な記録媒体、並びに情報分類プログラム
JP2002202984A (ja) * 2000-11-02 2002-07-19 Fujitsu Ltd ルールベースモデルに基づくテキスト情報自動分類装置
JP2003248687A (ja) * 2002-02-22 2003-09-05 Nippon Yunishisu Kk 情報処理装置およびその方法
JP2004234051A (ja) * 2003-01-28 2004-08-19 Fuji Xerox Co Ltd 文章分類装置およびその方法
JP2005190284A (ja) * 2003-12-26 2005-07-14 Nec Corp 情報分類装置および情報分類方法
JP2007172249A (ja) * 2005-12-21 2007-07-05 Fujitsu Ltd 文書分類プログラム、文書分類装置、および文書分類方法
JP2008243126A (ja) * 2007-03-29 2008-10-09 Chuden Cti Co Ltd 入力情報分析装置
JP2008276344A (ja) * 2007-04-26 2008-11-13 Just Syst Corp 多重トピック分類装置、多重トピック分類方法、および多重トピック分類プログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002007433A (ja) * 2000-04-17 2002-01-11 Fujitsu Ltd 情報分類装置、情報分類方法および情報分類プログラムを記録したコンピュータ読み取り可能な記録媒体、並びに情報分類プログラム
JP2002202984A (ja) * 2000-11-02 2002-07-19 Fujitsu Ltd ルールベースモデルに基づくテキスト情報自動分類装置
JP2003248687A (ja) * 2002-02-22 2003-09-05 Nippon Yunishisu Kk 情報処理装置およびその方法
JP2004234051A (ja) * 2003-01-28 2004-08-19 Fuji Xerox Co Ltd 文章分類装置およびその方法
JP2005190284A (ja) * 2003-12-26 2005-07-14 Nec Corp 情報分類装置および情報分類方法
JP2007172249A (ja) * 2005-12-21 2007-07-05 Fujitsu Ltd 文書分類プログラム、文書分類装置、および文書分類方法
JP2008243126A (ja) * 2007-03-29 2008-10-09 Chuden Cti Co Ltd 入力情報分析装置
JP2008276344A (ja) * 2007-04-26 2008-11-13 Just Syst Corp 多重トピック分類装置、多重トピック分類方法、および多重トピック分類プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10540121B2 (en) 2018-02-05 2020-01-21 Konica Minolta, Inc. Non-transitory computer-readable recording medium storing input assistance program and input assisting method
CN113485683A (zh) * 2021-06-28 2021-10-08 延锋伟世通电子科技(上海)有限公司 Rtc代码量统计方法、***、介质及终端

Also Published As

Publication number Publication date
JP5332918B2 (ja) 2013-11-06

Similar Documents

Publication Publication Date Title
JP6233411B2 (ja) 障害分析装置、障害分析方法、および、コンピュータ・プログラム
KR101125911B1 (ko) 업무 프로세스 분석을 위한 정보 처리 방법 및 장치
CN107704467B (zh) 搜索质量评估方法及装置
JP6912714B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
CN102637178A (zh) 一种音乐推荐方法、装置及***
CN102597966B (zh) 运行管理装置以及运行管理方法
CN106943747B (zh) 虚拟角色名称推荐方法、装置、电子设备和存储介质
US7685468B2 (en) Method and system for test case generation
US10248517B2 (en) Computer-implemented method, information processing device, and recording medium
CN110321383A (zh) 大数据平台数据同步方法、装置、计算机设备及存储介质
CN104424539A (zh) 维护信息管理***及方法、以及维护信息显示方法
JP5588811B2 (ja) データ分析支援システム及び方法
US8909768B1 (en) Monitoring of metrics to identify abnormalities in a large scale distributed computing environment
JP2018195127A (ja) インシデント管理装置、インシデント管理方法およびコンピュータプログラム
JP6832903B2 (ja) 情報検索システムおよび方法
JP5332918B2 (ja) 区分データレコメンド方法、プログラム、及び装置
CN111078988B (zh) 一种电力服务信息热点检索方法、装置和电子设备
JP2017097462A (ja) 検索プログラム、検索装置および検索方法
CN111597806A (zh) 一种基于统计模型识别短信文本模版的方法、设备及介质
CN114860819A (zh) 商业智能***的构建方法、装置、设备和存储介质
CN110941608B (zh) 一种埋点分析和漏斗分析报表生成方法、装置及设备
CN106776704A (zh) 统计信息收集方法和装置
JP2011123652A (ja) データ解析システム、及びその方法
JP2020166443A (ja) データ加工方法レコメンドシステム、データ加工方法レコメンド方法、及びデータ加工方法レコメンドプログラム
CN114153830B (zh) 数据验证方法及其装置、计算机存储介质、电子设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130408

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130416

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130617

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130715

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees