JP7067884B2 - 分類装置、分類方法及び分類プログラム - Google Patents
分類装置、分類方法及び分類プログラム Download PDFInfo
- Publication number
- JP7067884B2 JP7067884B2 JP2017177328A JP2017177328A JP7067884B2 JP 7067884 B2 JP7067884 B2 JP 7067884B2 JP 2017177328 A JP2017177328 A JP 2017177328A JP 2017177328 A JP2017177328 A JP 2017177328A JP 7067884 B2 JP7067884 B2 JP 7067884B2
- Authority
- JP
- Japan
- Prior art keywords
- query
- classification
- queries
- classification device
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 61
- 239000000284 extract Substances 0.000 claims description 28
- 238000004364 calculation method Methods 0.000 claims description 23
- 238000000605 extraction Methods 0.000 claims description 20
- 239000013598 vector Substances 0.000 claims description 15
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 238000003860 storage Methods 0.000 description 57
- 238000012545 processing Methods 0.000 description 24
- 230000008569 process Effects 0.000 description 22
- 238000004458 analytical method Methods 0.000 description 21
- 230000000877 morphologic effect Effects 0.000 description 20
- 230000002776 aggregation Effects 0.000 description 16
- 238000004220 aggregation Methods 0.000 description 16
- 230000006399 behavior Effects 0.000 description 15
- 238000004891 communication Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 7
- 230000010365 information processing Effects 0.000 description 7
- 230000009471 action Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 230000035606 childbirth Effects 0.000 description 3
- 230000035935 pregnancy Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 235000014510 cooky Nutrition 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 235000019640 taste Nutrition 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
まず、図1を用いて、実施形態に係る分類処理の一例について説明する。図1は、実施形態に係る分類処理の一例を示す図である。図1では、実施形態に係る分類処理の一例として、実施形態に係る分類装置100がユーザU01から送信されるキーワードリストL01に含まれる複数のキーワードを分類する処理を例に挙げて説明する。
次に、図2を用いて、実施形態に係る分類システム1の構成について説明する。図2は、実施形態に係る分類システム1の構成例を示す図である。図2に示すように、分類システム1は、ユーザ端末10と、分類装置100とを含む。ユーザ端末10、及び分類装置100は、通信ネットワークであるネットワークN(例えば、インターネット)を介して有線または無線により通信可能に接続される。なお、図2に示す分類システム1に含まれる各装置の数は図示したものに限られない。例えば、分類システム1には、複数台のユーザ端末10等が含まれてもよい。
次に、図3を用いて、実施形態に係る分類装置100の構成について説明する。図3は、実施形態に係る分類装置100の構成例を示す図である。図3に示すように、分類装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、分類装置100は、分類装置100を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を出力するための出力部(例えば、液晶ディスプレイ等)を有してもよい。
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。通信部110は、通信ネットワークと有線又は無線で接続され、通信ネットワークを介して、ユーザ端末10との間で情報の送受信を行う。
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、関連度情報記憶部121と、特徴情報記憶部122と、分類情報記憶部123とを有する。以下、各記憶部について順に説明する。
関連度情報記憶部121は、クエリ同士の関連度に関する情報を記憶する。関連度情報記憶部121は、図1で示したデータベースDB01に対応する。ここで、図4に、実施形態に係る関連度情報記憶部121の一例を示す。図4は、実施形態に係る関連度情報記憶部121の一例を示す図である。図4に示すように、関連度情報記憶部121は、「集計期間」、「検索ユーザ全体数」、「第1クエリ」、「第2クエリ」、「関連度」といった項目を有する。
特徴情報記憶部122は、クエリの特徴情報を記憶する。特徴情報記憶部122は、図1で示したデータベースDB02に対応する。ここで、図5に、実施形態に係る特徴情報記憶部122の一例を示す。図5は、実施形態に係る特徴情報記憶部122の一例を示す図である。図5に示すように、特徴情報記憶部122は、「第1クエリ」、「抽出された第2クエリ情報」、「形態素解析情報」、「特徴情報」といった項目を有する。
分類情報記憶部123は、分類処理の結果を記憶する。分類情報記憶部123は、図1で示したデータベースDB03に対応する。ここで、図6に、実施形態に係る分類情報記憶部123の一例を示す。図6は、実施形態に係る分類情報記憶部123の一例を示す図である。図6に示すように、分類情報記憶部123は、「キーワードリストID」、「クラスID」、「キーワード」といった項目を有する。
制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、分類装置100内部の記憶装置に記憶されている各種プログラム(分類プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
取得部131は、各種情報を取得する。例えば、取得部131は、ユーザから送信されるクエリを取得する。具体的には、取得部131は、ユーザから任意に入力されるキーワードであって、検索サイト等における検索処理に用いるためのキーワードをクエリとして取得する。なお、クエリは、複数のキーワードを含んでいてもよい。
算出部132は、取得部131によって取得されたクエリ同士の関連度を算出する。算出部132は、任意のクエリのうち、互いに異なる二つのクエリのいずれかを入力したユーザの数と、当該二つのクエリを両方とも入力したユーザの数と、に少なくとも基づいて、任意のクエリ同士の関連度を算出する。なお、算出部132は、クエリに複数のキーワードが含まれている場合には、キーワードごとに、キーワードを入力したユーザの数を計数してもよい。
抽出部133は、任意のクエリ同士の関連度に基づいて、第1クエリと関連する複数の第2クエリを抽出する。例えば、抽出部133は、算出部132によって算出された関連度に基づいて、第1クエリと関連する複数の第2クエリを抽出する。
生成部134は、抽出部133によって抽出された複数の第2クエリに基づいて、第1クエリを特徴付ける特徴情報を生成する。
受付部135は、各種要求を受け付ける。例えば、受付部135は、所定のユーザから任意のキーワードを受け付ける。具体的には、受付部135は、キーワードの分類を所望するユーザから、任意のキーワードを受け付けるとともに、当該キーワードの分類の要求(リクエスト)を受け付ける。受付部135は、受け付けたキーワードを分類部136に送る。例えば、受付部135によって一のキーワードが受け付けられた場合、分類部136は、当該一のキーワードが既存のクラスのいずれかに分類されるかを判定する。
分類部136は、生成部134によって生成された特徴情報に基づいて、第1クエリに対応するキーワードを分類する。
次に、図7及び図8を用いて、実施形態に係る分類装置100による処理の手順について説明する。まず、図7を用いて、実施形態に係る特徴情報の生成処理の手順について説明する。図7は、実施形態に係る分類装置100による処理手順を示すフローチャート(1)である。
上述した実施形態に係る分類システム1は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、上記の分類システム1に含まれる各装置の他の実施形態について説明する。
上記実施形態では、分類装置100が、ユーザからキーワードリストを受け付ける例を示した。ここで、分類装置100は、ユーザから受け付けた一のキーワードに基づいて、キーワードリストを生成し、生成したキーワードリストに含まれるキーワードを分類する処理を行ってもよい。
上記実施形態では、分類装置100が、第1クエリと第2クエリの両方を入力したユーザの数に基づいてクエリ同士の関連度を算出する例を示した。ここで、上述のように、クエリは、一のキーワードのみならず、複数のキーワードや文章によって構成される場合がある。このため、分類装置100は、ユーザから送信されたクエリを形態素解析し、形態素解析の結果に含まれるキーワードを第1クエリや第2クエリとして取り扱うようにしてもよい。この場合、分類装置100は、既知の記述を用いて、クエリに含まれる名詞や固有名詞を抽出し、抽出したキーワードのみを処理に用いてもよい。
分類装置100は、第1クエリと第2クエリとの両方を検索したユーザと判定する期間について、必ずしも集計期間と同じ期間において検索行動がなされたことを条件とすることを要しない。すなわち、分類装置100は、第1クエリと第2クエリとの両方を検索したユーザと判定する期間と、クエリを検索したユーザの数等を集計する期間とをそれぞれ設定してもよい。例えば、分類装置100は、同一ユーザから24時間以内に第1クエリと第2クエリとが送信された場合に、当該ユーザを第1クエリと第2クエリとの両方を検索したユーザと扱ってもよい。また、分類装置100は、同一ユーザにおける同一セッション(例えば、所定の検索サイトへアクセスし、アクセスが途切れるまでの一連の行動)において第1クエリと第2クエリとが送信された場合に、当該ユーザを第1クエリと第2クエリとの両方を検索したユーザと扱ってもよい。このように、分類装置100は、ユーザの検索行動を柔軟に取扱い、種々の情報処理を行ってもよい。
上記実施形態では、検索サイトが分類装置100によって提供される例を示した。しかし、検索サイトは、所定の外部サーバ(例えば、検索サービスを提供するウェブサーバ)によって提供されてもよい。この場合、分類装置100は、外部サーバを介して、ユーザが検索サイトに対して送信したクエリやユーザ情報等を取得するようにしてもよい。
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、上述してきた実施形態に係る分類装置100やユーザ端末10は、例えば図10に示すような構成のコンピュータ1000によって実現される。以下、分類装置100を例として説明する。図10は、分類装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM(Read Only Memory)1300、HDD(Hard Disk Drive)1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
上述してきたように、実施形態に係る分類装置100は、抽出部133と、生成部134と、分類部136とを有する。抽出部133は、任意のクエリ同士の関連度に基づいて、第1クエリと関連する複数の第2クエリを抽出する。生成部134は、抽出部133によって抽出された複数の第2クエリに基づいて、第1クエリを特徴付ける特徴情報を生成する。分類部136は、生成部134によって生成された特徴情報に基づいて、第1クエリに対応するキーワードを分類する。
10 ユーザ端末
100 分類装置
110 通信部
120 記憶部
121 関連度情報記憶部
122 特徴情報記憶部
123 分類情報記憶部
130 制御部
131 取得部
132 算出部
133 抽出部
134 生成部
135 受付部
136 分類部
Claims (9)
- 任意のクエリ同士の関連度に基づいて、第1クエリと関連する複数の第2クエリを抽出する抽出部と、
前記抽出部によって抽出された複数の第2クエリに基づいて、前記第1クエリを特徴付ける特徴情報を生成する生成部と、
前記生成部によって生成された特徴情報に基づいて、前記第1クエリに対応するキーワードを分類する分類部と、
を備え、
前記生成部は、
前記複数の第2クエリの各々を構成する要素と、当該要素の出現回数とに基づいて、当該複数の第2クエリと関連する前記第1クエリの特徴情報を生成する、
ことを特徴とする分類装置。 - 前記生成部は、
前記第1クエリの特徴情報として、前記複数の第2クエリの各々を構成する要素を次元とし、当該要素の出現回数を各々の次元の次元数とするベクトルを生成し、
前記分類部は、
前記生成部によって生成されたベクトルの類似度に基づいて、前記キーワードを分類する、
ことを特徴とする請求項1に記載の分類装置。 - 任意のクエリのうち、互いに異なる二つのクエリのいずれかを入力したユーザの数と、当該二つのクエリを両方とも入力したユーザの数と、に少なくとも基づいて、任意のクエリ同士の関連度を算出する算出部、
をさらに備え、
前記抽出部は、
前記算出部によって算出された関連度に基づいて、第1クエリと関連する複数の第2クエリを抽出する、
ことを特徴とする請求項1又は2に記載の分類装置。 - 前記算出部は、
所定期間のうちに前記互いに異なる二つのクエリを両方とも入力したユーザの数に基づいて、前記関連度を算出する、
ことを特徴とする請求項3に記載の分類装置。 - 所定のユーザから任意のキーワードを受け付ける受付部、
をさらに備え、
前記分類部は、
前記受付部によって受け付けられたキーワードに対応する特徴情報に基づいて、当該キーワードを分類する、
ことを特徴とする請求項1~4のいずれか一つに記載の分類装置。 - 前記受付部は、
任意の複数のキーワードを含むキーワードリストを受け付け、
前記分類部は、
前記受付部によって受け付けられたキーワードリストに含まれる各々のキーワードの特徴情報に基づいて、当該キーワードリストに含まれる各々のキーワードを分類する、
ことを特徴とする請求項5に記載の分類装置。 - 前記受付部は、
前記所定のユーザから任意のキーワードの入力を受け付けた場合に、当該任意のキーワードとの関連度が所定の閾値を超える複数のキーワードを抽出し、当該任意のキーワードと抽出した複数のキーワードとを含むキーワードリストを生成し、
前記分類部は、
前記受付部によって生成されたキーワードリストに含まれる各々のキーワードを分類する、
ことを特徴とする請求項5に記載の分類装置。 - コンピュータが実行する分類方法であって、
任意のクエリ同士の関連度に基づいて、第1クエリと関連する複数の第2クエリを抽出する抽出工程と、
前記抽出工程によって抽出された複数の第2クエリに基づいて、前記第1クエリを特徴付ける特徴情報を生成する生成工程と、
前記生成工程によって生成された特徴情報に基づいて、前記第1クエリに対応するキーワードを分類する分類工程と、
を含み、
前記生成工程は、
前記複数の第2クエリの各々を構成する要素と、当該要素の出現回数とに基づいて、当該複数の第2クエリと関連する前記第1クエリの特徴情報を生成する、
ことを特徴とする分類方法。 - 任意のクエリ同士の関連度に基づいて、第1クエリと関連する複数の第2クエリを抽出する抽出手順と、
前記抽出手順によって抽出された複数の第2クエリに基づいて、前記第1クエリを特徴付ける特徴情報を生成する生成手順と、
前記生成手順によって生成された特徴情報に基づいて、前記第1クエリに対応するキーワードを分類する分類手順と、
をコンピュータに実行させ、
前記生成手順は、
前記複数の第2クエリの各々を構成する要素と、当該要素の出現回数とに基づいて、当該複数の第2クエリと関連する前記第1クエリの特徴情報を生成する、
ことを特徴とする分類プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017177328A JP7067884B2 (ja) | 2017-09-15 | 2017-09-15 | 分類装置、分類方法及び分類プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017177328A JP7067884B2 (ja) | 2017-09-15 | 2017-09-15 | 分類装置、分類方法及び分類プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019053519A JP2019053519A (ja) | 2019-04-04 |
JP7067884B2 true JP7067884B2 (ja) | 2022-05-16 |
Family
ID=66014891
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017177328A Active JP7067884B2 (ja) | 2017-09-15 | 2017-09-15 | 分類装置、分類方法及び分類プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7067884B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7127080B2 (ja) * | 2020-03-19 | 2022-08-29 | ヤフー株式会社 | 判定装置、判定方法及び判定プログラム |
JP6948425B2 (ja) | 2020-03-19 | 2021-10-13 | ヤフー株式会社 | 判定装置、判定方法及び判定プログラム |
JP7079867B1 (ja) | 2021-03-19 | 2022-06-02 | ヤフー株式会社 | 生成装置、生成方法及び生成プログラム |
CN115402057B (zh) * | 2022-10-31 | 2023-03-24 | 长城汽车股份有限公司 | 一种空调调节方法、服务器、终端及*** |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110208730A1 (en) | 2010-02-23 | 2011-08-25 | Microsoft Corporation | Context-aware searching |
US20160188619A1 (en) | 2014-12-30 | 2016-06-30 | Yahoo! Inc. | Method and system for enhanced query term suggestion |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9727614B1 (en) * | 2014-03-17 | 2017-08-08 | Amazon Technologies, Inc. | Identifying query fingerprints |
-
2017
- 2017-09-15 JP JP2017177328A patent/JP7067884B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110208730A1 (en) | 2010-02-23 | 2011-08-25 | Microsoft Corporation | Context-aware searching |
US20160188619A1 (en) | 2014-12-30 | 2016-06-30 | Yahoo! Inc. | Method and system for enhanced query term suggestion |
Also Published As
Publication number | Publication date |
---|---|
JP2019053519A (ja) | 2019-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7067884B2 (ja) | 分類装置、分類方法及び分類プログラム | |
CN107862022B (zh) | 文化资源推荐*** | |
WO2020029412A1 (zh) | 标签推荐方法、装置、计算机设备及计算机可读存储介质 | |
JP2013517563A (ja) | ユーザ通信の解析システムおよび方法 | |
JP2013504118A (ja) | クエリのセマンティックパターンに基づく情報検索 | |
JP6664599B2 (ja) | 曖昧性評価装置、曖昧性評価方法、及び曖昧性評価プログラム | |
US20130179418A1 (en) | Search ranking features | |
US20220358552A1 (en) | Methods and systems for hair-service based digital image searching and ranking | |
KR101811211B1 (ko) | 빅데이터 기반의 사용성 테스트 방법 및 장치 | |
JP6568284B1 (ja) | 提供装置、提供方法及び提供プログラム | |
WO2023206960A1 (zh) | 基于内容与协同过滤的产品推荐方法、装置及计算机设备 | |
JP2021149681A (ja) | 判定装置、判定方法及び判定プログラム | |
JP7088644B2 (ja) | 提供装置、提供方法及び提供プログラム | |
JP6985181B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US20160055238A1 (en) | Document analysis apparatus and document analysis program | |
JP4128033B2 (ja) | プロファイルデータ検索装置及びプログラム | |
JP7088656B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP2017004260A (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP7249222B2 (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
JP7297855B2 (ja) | キーワード抽出装置、キーワード抽出方法、およびプログラム | |
JP7044821B2 (ja) | 情報処理システム、および情報処理方法 | |
JP2012113348A (ja) | 分類装置、コンテンツ検索システム、コンテンツ分類方法、コンテンツ検索方法及びプログラム | |
JP6948425B2 (ja) | 判定装置、判定方法及び判定プログラム | |
Das | Business intelligence through opinion mining | |
Al-Khiza'ay et al. | PeRView: A framework for personalized review selection using micro-reviews |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200309 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210216 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20211012 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211228 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20211228 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20220117 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20220118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220329 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220428 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7067884 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |