JP7043243B2 - 分類装置、分類方法、およびプログラム - Google Patents
分類装置、分類方法、およびプログラム Download PDFInfo
- Publication number
- JP7043243B2 JP7043243B2 JP2017241660A JP2017241660A JP7043243B2 JP 7043243 B2 JP7043243 B2 JP 7043243B2 JP 2017241660 A JP2017241660 A JP 2017241660A JP 2017241660 A JP2017241660 A JP 2017241660A JP 7043243 B2 JP7043243 B2 JP 7043243B2
- Authority
- JP
- Japan
- Prior art keywords
- category
- existing
- categories
- new content
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 33
- 238000012545 processing Methods 0.000 claims description 77
- 230000006870 function Effects 0.000 claims description 49
- 230000002787 reinforcement Effects 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 17
- 239000013598 vector Substances 0.000 description 86
- 238000013528 artificial neural network Methods 0.000 description 18
- 239000011159 matrix material Substances 0.000 description 12
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 6
- 230000000717 retained effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241000008357 Okapia johnstoni Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
分類装置は、一以上のプロセッサによって実現される。分類装置は、新規コンテンツを取得した場合、強化学習によってパラメータが決定された価値関数に基づいて、新規コンテンツの分類先とするカテゴリを既存の複数のカテゴリの中から選択するのか、新たなカテゴリを生成してそのカテゴリに分類するのかを決定する。これによって、分類装置は、効果的にコンテンツを選り分けることができる。
図1は、実施形態の分類装置100を含むコンテンツ分類システム1の一例を示す図である。実施形態におけるコンテンツ分類システム1は、例えば、一以上の情報提供装置10(10-1~10-n;nは任意の自然数)と、分類装置100とを備える。これらの装置は、例えば、ネットワークNWを介して互いに接続される。
以下、フローチャートに即して学習処理部114によるカテゴリ分類の処理の流れを説明する。図4は、学習処理部114による一連の処理の流れを示すフローチャートである。本フローチャートの処理は、例えば、取得部112により新規コンテンツCTが取得された場合に実行される。以下のフローチャートの説明では、一例として、コンテンツCTが「記事」であるものとし、更に、その記事のカテゴリが「トピック」であるものとして説明する。
以下、学習処理部114による価値関数の強化学習について説明する。例えば、学習処理部114は、Q学習の手法を利用して、上述した価値関数Vのパラメータを学習する。以下に説明する価値関数Vは、例えば、入力層と、一以上の中間層(隠れ層)と、出力層とをもつニューラルネットワークによって実現されるものとする。価値関数情報FXには、例えば、ニューラルネットワークを構成するニューロン(ユニット)の結合情報や結合係数(後述するニューラルネットワークのモデルパラメータ)などの各種情報が含まれる。例えば、入力層のユニット数は6つ以上とし、出力層のユニット数を1つとし、中間層は3層以上とし、各中間層のユニット数を128とし、中間層の各層間において全てのユニット同士を互いに結合させるものとする。また、各中間層のユニットの活性化関数は、正規化線形関数(ReLU関数)であってもよいし、シグモイド関数や、ステップ関数、その他の関数などであってもよい。
素性2:全記事のベクトルの重み付き平均値。
素性3:既存トピックとの類似度のうち、値の大きい上位所定数の類似度。
素性4:トピックが生成されてから経過した時間。
素性5:既存トピックに新着記事が最後に分類されてから経過した時間。
素性6:既存トピックに含まれる記事数。
上述した実施形態の分類装置100は、例えば、図9に示すようなハードウェア構成により実現される。図9は、実施形態の分類装置100のハードウェア構成の一例を示す図である。
Claims (17)
- 新規コンテンツを取得する取得部と、
前記取得部により前記新規コンテンツが取得された場合、強化学習によって、前記新規コンテンツの分類先とするカテゴリを、既存の複数のカテゴリの中から選択するのか、新たなカテゴリを生成して前記生成したカテゴリに分類するのかを決定する学習処理部と、
を備え、
前記学習処理部は、
既存の複数のカテゴリの其々の特徴量と前記新規コンテンツの特徴量との類似度のうち、最も大きい類似度が閾値以上であるか否かを判定し、
前記類似度が閾値以上であると判定した場合、前記既存の複数のカテゴリの中から、前記新規コンテンツとの特徴量間の類似度が最も大きい既存のカテゴリを、前記新規コンテンツの分類先のカテゴリとして選択し、
前記選択した既存のカテゴリに前記新規コンテンツを分類する場合、カテゴリの状態を評価する価値関数に基づいて、前記新規コンテンツの分類先の既存のカテゴリを消去せずに残しておいた場合の価値が最大となるように、前記既存のカテゴリの特徴量を更新する、
分類装置。 - 新規コンテンツを取得する取得部と、
前記取得部により前記新規コンテンツが取得された場合、強化学習によって、前記新規コンテンツの分類先とするカテゴリを、既存の複数のカテゴリの中から選択するのか、新たなカテゴリを生成して前記生成したカテゴリに分類するのかを決定する学習処理部と、
を備え、
前記学習処理部は、
前記既存の複数のカテゴリの其々の特徴量と前記新規コンテンツの特徴量との類似度のうち、最も大きい類似度が閾値以上であるか否かを判定し、
前記類似度が閾値未満であると判定した場合、前記既存の複数のカテゴリの中から一つのカテゴリを除いて複数のカテゴリを組み合わせ、
カテゴリの状態を評価する価値関数に基づいて、前記組み合わせた複数のカテゴリの其々を消去せずに残しておいた場合の価値の総和を導出し、
前記複数のカテゴリの組み合わせごとに導出した価値の総和のうち、最も価値の総和が大きいカテゴリの組み合わせ時に除いた一つのカテゴリを、消去するカテゴリに決定し、
新たなカテゴリを生成して前記新規コンテンツを前記生成したカテゴリに分類すると共に前記既存の複数のカテゴリの中から前記消去すると決定した一つのカテゴリを消去する、
分類装置。 - 前記学習処理部は、更に、
組み合わせの対象とする複数のカテゴリの中に、前記新規コンテンツを一つのカテゴリとして含め、
前記既存の複数のカテゴリと、一つのカテゴリとした前記新規コンテンツとの集合の中から一つのカテゴリを除いて複数のカテゴリを組み合わせ、
最も価値の総和が大きいカテゴリの組み合わせ時に除いた一つのカテゴリが前記新規コンテンツである場合、前記新規コンテンツを消去することを決定する、
請求項2に記載の分類装置。 - 前記学習処理部は、前記新規コンテンツの分類結果に基づいて、前記価値関数のパラメータを前記強化学習により学習する、
請求項1から3のうちいずれか1項に記載の分類装置。 - 前記学習処理部は、ある第1時刻において既存のカテゴリに前記新規コンテンツが分類されたときに与えられる報酬と、前記第1時刻よりも前の第2時刻から、前記第1時刻に至るまでの過程において、既存のカテゴリに前記新規コンテンツが分類されていた場合に前記価値関数により求められる第1価値との和を導出し、
前記報酬および前記第1価値の和と、前記第2時刻において既存のカテゴリに前記新規コンテンツが分類されていた場合に前記価値関数により求められる第2価値との差分に基づいて、前記価値関数のパラメータを学習する、
請求項4に記載の分類装置。 - 前記学習処理部は、前記差分を二乗した値が最小となるように、前記価値関数のパラメータを学習する、
請求項5に記載の分類装置。 - 前記第1時刻および前記第2時刻は、前記取得部により前記新規コンテンツが取得された時刻であり、
前記学習処理部は、前記第2時刻から前記第1時刻までの時間差分に基づいて前記第1価値を減少させる、
請求項5または6に記載の分類装置。 - 前記価値関数は、前記新規コンテンツの分類先として選択したカテゴリに含まれる既存の一以上のコンテンツの特徴量と、前記新規コンテンツの特徴量との重み付き平均が少なくとも入力されたときに、カテゴリの価値を導出する、
請求項4から7のうちいずれか1項に記載の分類装置。 - 前記価値関数は、既存の一以上のコンテンツの特徴量と前記新規コンテンツの特徴量との重み付き平均が少なくとも入力されたときに、カテゴリの価値を導出する、
請求項4から8のうちいずれか1項に記載の分類装置。 - 前記価値関数は、既存の複数のカテゴリの其々と前記新規コンテンツとの類似度が少なくとも入力されたときに、カテゴリの価値を導出する、
請求項4から9のうちいずれか1項に記載の分類装置。 - 前記価値関数は、既存の複数のカテゴリの其々が生成されてから経過した時間が少なくとも入力されたときに、カテゴリの価値を導出する、
請求項4から10のうちいずれか1項に記載の分類装置。 - 前記価値関数は、既存の複数のカテゴリの其々にコンテンツが分類されてから経過した時間が少なくとも入力されたときに、カテゴリの価値を導出する、
請求項4から11のうちいずれか1項に記載の分類装置。 - 前記価値関数は、既存の複数のカテゴリの其々に含まれるコンテンツの数が少なくとも入力されたときに、カテゴリの価値を導出する、
請求項4から12のうちいずれか1項に記載の分類装置。 - コンピュータが、
新規コンテンツを取得し、
前記新規コンテンツを取得した場合、強化学習によって、前記新規コンテンツの分類先とするカテゴリを既存の複数のカテゴリの中から選択するのか、新たなカテゴリを生成して前記生成したカテゴリに分類するのかを決定し、
前記決定する処理において、前記コンピュータが、
既存の複数のカテゴリの其々の特徴量と前記新規コンテンツの特徴量との類似度のうち、最も大きい類似度が閾値以上であるか否かを判定し、
前記類似度が閾値以上であると判定した場合、前記既存の複数のカテゴリの中から、前記新規コンテンツとの特徴量間の類似度が最も大きい既存のカテゴリを、前記新規コンテンツの分類先のカテゴリとして選択し、
前記選択した既存のカテゴリに前記新規コンテンツを分類する場合、カテゴリの状態を評価する価値関数に基づいて、前記新規コンテンツの分類先の既存のカテゴリを消去せずに残しておいた場合の価値が最大となるように、前記既存のカテゴリの特徴量を更新する、
分類方法。 - コンピュータに、
新規コンテンツを取得させ、
前記新規コンテンツが取得された場合、強化学習によって、前記新規コンテンツの分類先とするカテゴリを既存の複数のカテゴリの中から選択するのか、新たなカテゴリを生成して前記生成したカテゴリに分類するのかを決定させ、
前記決定させる処理において、前記コンピュータに、
既存の複数のカテゴリの其々の特徴量と前記新規コンテンツの特徴量との類似度のうち、最も大きい類似度が閾値以上であるか否かを判定させ、
前記類似度が閾値以上であると判定した場合、前記既存の複数のカテゴリの中から、前記新規コンテンツとの特徴量間の類似度が最も大きい既存のカテゴリを、前記新規コンテンツの分類先のカテゴリとして選択させ、
前記選択した既存のカテゴリに前記新規コンテンツを分類する場合、カテゴリの状態を評価する価値関数に基づいて、前記新規コンテンツの分類先の既存のカテゴリを消去せずに残しておいた場合の価値が最大となるように、前記既存のカテゴリの特徴量を更新させる、
プログラム。 - コンピュータが、
新規コンテンツを取得し、
前記新規コンテンツを取得した場合、強化学習によって、前記新規コンテンツの分類先とするカテゴリを既存の複数のカテゴリの中から選択するのか、新たなカテゴリを生成して前記生成したカテゴリに分類するのかを決定し、
前記決定する処理において、前記コンピュータが、
前記既存の複数のカテゴリの其々の特徴量と前記新規コンテンツの特徴量との類似度のうち、最も大きい類似度が閾値以上であるか否かを判定し、
前記類似度が閾値未満であると判定した場合、前記既存の複数のカテゴリの中から一つのカテゴリを除いて複数のカテゴリを組み合わせ、
カテゴリの状態を評価する価値関数に基づいて、前記組み合わせた複数のカテゴリの其々を消去せずに残しておいた場合の価値の総和を導出し、
前記複数のカテゴリの組み合わせごとに導出した価値の総和のうち、最も価値の総和が大きいカテゴリの組み合わせ時に除いた一つのカテゴリを、消去するカテゴリに決定し、
新たなカテゴリを生成して前記新規コンテンツを前記生成したカテゴリに分類すると共に前記既存の複数のカテゴリの中から前記消去すると決定した一つのカテゴリを消去する、
分類方法。 - コンピュータに、
新規コンテンツを取得させ、
前記新規コンテンツが取得された場合、強化学習によって、前記新規コンテンツの分類先とするカテゴリを既存の複数のカテゴリの中から選択するのか、新たなカテゴリを生成して前記生成したカテゴリに分類するのかを決定させ、
前記決定させる処理において、前記コンピュータに、
前記既存の複数のカテゴリの其々の特徴量と前記新規コンテンツの特徴量との類似度のうち、最も大きい類似度が閾値以上であるか否かを判定させ、
前記類似度が閾値未満であると判定した場合、前記既存の複数のカテゴリの中から一つのカテゴリを除いて複数のカテゴリを組み合わせさせ、
カテゴリの状態を評価する価値関数に基づいて、前記組み合わせた複数のカテゴリの其々を消去せずに残しておいた場合の価値の総和を導出させ、
前記複数のカテゴリの組み合わせごとに導出した価値の総和のうち、最も価値の総和が大きいカテゴリの組み合わせ時に除いた一つのカテゴリを、消去するカテゴリに決定させ、
新たなカテゴリを生成して前記新規コンテンツを前記生成したカテゴリに分類すると共に前記既存の複数のカテゴリの中から前記消去すると決定した一つのカテゴリを消去させる、
プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017241660A JP7043243B2 (ja) | 2017-12-18 | 2017-12-18 | 分類装置、分類方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017241660A JP7043243B2 (ja) | 2017-12-18 | 2017-12-18 | 分類装置、分類方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019109662A JP2019109662A (ja) | 2019-07-04 |
JP7043243B2 true JP7043243B2 (ja) | 2022-03-29 |
Family
ID=67179800
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017241660A Active JP7043243B2 (ja) | 2017-12-18 | 2017-12-18 | 分類装置、分類方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7043243B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111506727B (zh) * | 2020-04-16 | 2023-10-03 | 腾讯科技(深圳)有限公司 | 文本内容类别获取方法、装置、计算机设备和存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002117046A (ja) | 2000-10-05 | 2002-04-19 | Just Syst Corp | 文書分類装置、文書分類方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP6224857B1 (ja) | 2017-03-10 | 2017-11-01 | ヤフー株式会社 | 分類装置、分類方法および分類プログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8391618B1 (en) * | 2008-09-19 | 2013-03-05 | Adobe Systems Incorporated | Semantic image classification and search |
-
2017
- 2017-12-18 JP JP2017241660A patent/JP7043243B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002117046A (ja) | 2000-10-05 | 2002-04-19 | Just Syst Corp | 文書分類装置、文書分類方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP6224857B1 (ja) | 2017-03-10 | 2017-11-01 | ヤフー株式会社 | 分類装置、分類方法および分類プログラム |
Non-Patent Citations (1)
Title |
---|
角谷 和俊,マルチチャンネル型ニュース配信システムのための時系列クラスタリング,情報処理学会論文誌 ,日本,社団法人情報処理学会,2002年06月15日,第43巻 No.SIG5(TOD14),87-97ページ |
Also Published As
Publication number | Publication date |
---|---|
JP2019109662A (ja) | 2019-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11645571B2 (en) | Scheduling in a dataset management system | |
Balaanand et al. | An enhanced graph-based semi-supervised learning algorithm to detect fake users on Twitter | |
US20220335501A1 (en) | Item recommendations using convolutions on weighted graphs | |
US9785888B2 (en) | Information processing apparatus, information processing method, and program for prediction model generated based on evaluation information | |
CN107016026B (zh) | 一种用户标签确定、信息推送方法和设备 | |
JP7160980B2 (ja) | 情報提供装置、情報提供方法、およびプログラム | |
CN104090919B (zh) | 推荐广告的方法及广告推荐服务器 | |
CN105701498B (zh) | 一种用户分类方法及服务器 | |
CN109165975B (zh) | 标签推荐方法、装置、计算机设备及存储介质 | |
US20090125382A1 (en) | Quantifying a Data Source's Reputation | |
CN112148973B (zh) | 一种信息推送的数据处理方法及装置 | |
CN108280670A (zh) | 种子人群扩散方法、装置以及信息投放*** | |
JP6097126B2 (ja) | レコメンド情報生成装置及びレコメンド情報生成方法 | |
US12020267B2 (en) | Method, apparatus, storage medium, and device for generating user profile | |
CN111429161B (zh) | 特征提取方法、特征提取装置、存储介质及电子设备 | |
CN107247728B (zh) | 文本处理方法、装置及计算机存储介质 | |
Vinagre et al. | Collaborative filtering with recency-based negative feedback | |
CN111625726A (zh) | 一种用户画像的处理方法和装置 | |
CN113656699B (zh) | 用户特征向量确定方法、相关设备及介质 | |
Hamadani et al. | Comparison of artificial intelligence algorithms and their ranking for the prediction of genetic merit in sheep | |
JP7043243B2 (ja) | 分類装置、分類方法、およびプログラム | |
JP6960838B2 (ja) | 情報提供装置、情報提供方法、およびプログラム | |
KR20200122652A (ko) | 영양 성분 프로파일링 기반 사료추천 시스템 | |
Eastman et al. | A weighted normalized likelihood procedure for empirical land change modeling | |
CN112948678A (zh) | 文章召回方法及***、文章推荐方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20180117 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200306 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210402 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210824 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211020 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220316 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7043243 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |