JP2013522719A - 製品のカテゴリ分類 - Google Patents
製品のカテゴリ分類 Download PDFInfo
- Publication number
- JP2013522719A JP2013522719A JP2012557037A JP2012557037A JP2013522719A JP 2013522719 A JP2013522719 A JP 2013522719A JP 2012557037 A JP2012557037 A JP 2012557037A JP 2012557037 A JP2012557037 A JP 2012557037A JP 2013522719 A JP2013522719 A JP 2013522719A
- Authority
- JP
- Japan
- Prior art keywords
- product
- products
- category
- word sequence
- product category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【選択図】図1
Description
本出願は、あらゆる目的のために、参照によって本明細書に組み込まれる、2010年3月9日に出願された発明の名称を「METHOD AND DEVICE FOR CATEGORIZING DATA(製品をカテゴリ分類するための方法及び装置)」とする中国特許出願第201010122141.2号に基づく優先権を主張する。該出願は、
TD1=(フレーズ11、スコア11)、(フレーズ12、スコア12)、(フレーズ13、スコア13)
TD2=(フレーズ21、スコア21)、(フレーズ22、スコア22)、(フレーズ23、スコア23)
ここで、「フレーズXX」は、フレーズを表しており、「スコアYY」は、対応するスコアを表している。
Claims (21)
- 製品をカテゴリ分類するための方法であって、
取得されたデータから複数の製品のタイトルを抽出することと、
前記タイトルをフレーズに分割することと、
前記フレーズについての各スコアを決定することと、
前記フレーズについての前記決定された各スコアに少なくとも部分的に基づいて選択された前記フレーズの少なくとも1つを使用して、前記複数の製品のうちの第1の製品に対応する第1のワードシーケンスを構成することと、
前記第1のワードシーケンスを前記複数の製品のうちの第2の製品に対応する第2のワードシーケンスと比較することと、
前記比較に少なくとも部分的に基づいて、前記複数の製品のうちの前記第1の製品と前記第2の製品とを統合して1つの製品カテゴリに入れることと、
を備える方法。 - 請求項1に記載の方法であって、更に、
第1の製品カテゴリと第2の製品カテゴリとの間における類似度を決定することと、
前記決定された類似度が合体閾値に少なくとも見合う場合に、前記第1の製品カテゴリを前記第2の製品カテゴリと合体させることと、
を備える方法。 - 請求項1に記載の方法であって、
前記フレーズについての各スコアを決定することは、フレーズの過去発生頻度に少なくとも部分的に基づく、方法。 - 請求項1に記載の方法であって、更に、
前記取得されたデータから前記複数の製品についての属性情報を抽出し、前記属性情報をフレーズに分割することを備える方法。 - 請求項1に記載の方法であって、
前記第1のワードシーケンスを前記複数の製品のうちの第2の製品についての第2のワードシーケンスと比較することは、前記第1のワードシーケンスが前記第2のワードシーケンスに類似しているか否かを決定することを含む、方法。 - 請求項5に記載の方法であって、
前記第1のワードシーケンスが前記第2のワードシーケンスに類似しているか否かを決定することは、一致率に少なくとも部分的に基づく、方法。 - 請求項1に記載の方法であって、
前記複数の製品のうちの前記第1の製品と前記第2の製品とを統合して1つの製品カテゴリに入れることは、前記複数の製品のうちの前記第1の製品及び前記第2の製品に関連付けられたデータを統合することを含む、方法。 - 請求項1に記載の方法であって、
前記複数の製品のうちの前記第1の製品と前記第2の製品とを統合して1つの製品カテゴリに入れることは、前記複数の製品のうちの前記第1の製品及び前記第2の製品の両方を1つのカテゴリ識別子とともに記憶させることを含む、方法。 - 請求項2に記載の方法であって、
類似度を決定することは、前記第1の製品カテゴリに対応する決定されたスコア及び前記第2の製品カテゴリに対応する決定されたスコアに基づいて値を計算することを含む、方法。 - 請求項2に記載の方法であって、
前記第1の製品カテゴリを前記第2の製品カテゴリと合体させることは、前記第1の製品カテゴリ及び前記第2の製品カテゴリを同じカテゴリ識別子とともに記憶させることを含む、方法。 - 製品をカテゴリ分類するためのシステムであって、
1つ又は2つ以上のプロセッサと、
前記1つ又は2つ以上のプロセッサに接続され、前記1つ又は2つ以上のプロセッサに命令を提供するように構成されているメモリと、
を備え、
前記1つ又は2つ以上のプロセッサは、
取得されたデータから複数の製品のタイトルを抽出し、
前記タイトルをフレーズに分割し、
前記フレーズについての各スコアを決定し、
前記フレーズについての前記決定された各スコアに少なくとも部分的に基づいて選択された前記フレーズの少なくとも1つを使用して、前記複数の製品のうちの第1の製品に対応する第1のワードシーケンスを構成し、
前記第1のワードシーケンスを前記複数の製品のうちの第2の製品に対応する第2のワードシーケンスと比較し、
前記比較に少なくとも部分的に基づいて、前記複数の製品のうちの前記第1の製品と前記第2の製品とを統合して1つの製品カテゴリに入れるように、
構成されている、システム。 - 請求項11に記載のシステムであって、
前記1つ又は2つ以上のプロセッサは、更に、
第1の製品カテゴリと第2の製品カテゴリとの間における類似度を決定し、
前記決定された類似度が合体閾値を越えるか否かに基づいて、前記第1の製品カテゴリを前記第2の製品カテゴリと合体させるように、
構成されている、システム。 - 請求項11に記載のシステムであって、
前記1つ又は2つ以上のプロセッサは、フレーズの過去発生頻度に少なくとも部分的に基づいて、前記フレーズについての各スコアを決定するように構成されている、システム。 - 請求項11に記載のシステムであって、
前記1つ又は2つ以上のプロセッサは、更に、取得されたデータから前記複数の製品についての属性情報を抽出し、前記属性情報をフレーズに分割するように構成されている、システム。 - 請求項11に記載のシステムであって、
前記1つ又は2つ以上のプロセッサは、前記第1のワードシーケンスが前記第2のワードシーケンスに類似しているか否かを決定することを含み、前記第1のワードシーケンスを前記複数の製品のうちの第2の製品についての第2のワードシーケンスと比較する、ように構成されている、システム。 - 請求項15に記載のシステムであって、
前記1つ又は2つ以上のプロセッサは、一致率に少なくとも部分的に基づいて、前記第1のワードシーケンスが前記第2のワードシーケンスに類似しているか否かを決定するように構成されている、システム。 - 請求項11に記載のシステムであって、
前記1つ又は2つ以上のプロセッサは、前記複数の製品のうちの前記第1の製品及び前記第2の製品に関連付けられたデータを統合することを含み、前記複数の製品のうちの前記第1の製品と前記第2の製品とを統合して1つの製品カテゴリに入れるように構成されている、システム。 - 請求項11に記載のシステムであって、
前記1つ又は2つ以上のプロセッサは、前記複数の製品のうちの前記第1の製品及び前記第2の製品の両方を同じカテゴリ識別子とともに記憶させることを含み、前記複数の製品のうちの前記第1の製品と前記第2の製品とを統合して1つの製品カテゴリに入れるように構成されている、システム。 - 請求項11に記載のシステムであって、
前記1つ又は2つ以上のプロセッサは、前記第1の製品カテゴリに対応する決定されたスコア及び前記第2の製品カテゴリに対応する決定されたスコアに基づいて値を計算することを含み、類似度を決定するように構成されている、システム。 - 請求項12に記載のシステムであって、
前記1つ又は2つ以上のプロセッサは、前記第1の製品カテゴリ及び前記第2の製品カテゴリを1つのカテゴリ識別子とともに記憶させることを含み、前記第1の製品カテゴリを前記第2の製品カテゴリと合体させるように構成されている、システム。 - 製品をカテゴリ分類するためのコンピュータプログラム製品であって、コンピュータによって読み取り可能なストレージ媒体に実装され、
取得されたデータから複数の製品のタイトルを抽出するためのコンピュータ命令と、
前記タイトルをフレーズに分割するためのコンピュータ命令と、
前記フレーズについての各スコアを決定するためのコンピュータ命令と、
前記フレーズについての前記決定された各スコアに少なくとも部分的に基づいて選択された前記フレーズの少なくとも1つを使用して、前記複数の製品のうちの第1の製品に対応する第1のワードシーケンスを構成するためのコンピュータ命令と、
前記第1のワードシーケンスを前記複数の製品のうちの第2の製品に対応する第2のワードシーケンスと比較するためのコンピュータ命令と、
前記比較に少なくとも部分的に基づいて、前記複数の製品のうちの前記第1の製品と前記第2の製品とを統合して1つの製品カテゴリに入れるためのコンピュータ命令と、
を備えるコンピュータプログラム製品。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010122141.2 | 2010-03-09 | ||
CN2010101221412A CN102193936B (zh) | 2010-03-09 | 2010-03-09 | 一种数据分类的方法及装置 |
US201113932659A | 2011-03-01 | 2011-03-01 | |
US12/932,659 | 2011-03-01 | ||
PCT/US2011/000388 WO2011112236A1 (en) | 2010-03-09 | 2011-03-02 | Categorizing products |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013522719A true JP2013522719A (ja) | 2013-06-13 |
JP2013522719A5 JP2013522719A5 (ja) | 2014-02-06 |
Family
ID=48712976
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012557037A Pending JP2013522719A (ja) | 2010-03-09 | 2011-03-02 | 製品のカテゴリ分類 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2013522719A (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005522784A (ja) * | 2002-04-10 | 2005-07-28 | シーネット・ネットワークス・インコーポレイテッド | オンライン購入システム用コンテンツ集約方法及び装置 |
-
2011
- 2011-03-02 JP JP2012557037A patent/JP2013522719A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005522784A (ja) * | 2002-04-10 | 2005-07-28 | シーネット・ネットワークス・インコーポレイテッド | オンライン購入システム用コンテンツ集約方法及び装置 |
Non-Patent Citations (2)
Title |
---|
前澤 敏之: ""商品カテゴリ"および"取扱店舗"の統計情報を用いた商品タイトルに含まれるフレーズの重要度判定", 言語処理学会第14回年次大会論文集, JPN6014016855, 17 March 2008 (2008-03-17), pages 1081 - 1084, ISSN: 0002797699 * |
関根 聡: "ショッピングサイトにおける商品の同一性、類似性の推定手法", 言語処理学会第16回年次大会論文集, JPN6014016856, 8 March 2010 (2010-03-08), pages 254 - 257, ISSN: 0002797700 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11507975B2 (en) | Information processing method and apparatus | |
US10423648B2 (en) | Method, system, and computer readable medium for interest tag recommendation | |
US20110225161A1 (en) | Categorizing products | |
JP5575902B2 (ja) | クエリのセマンティックパターンに基づく情報検索 | |
WO2017097231A1 (zh) | 话题处理方法及装置 | |
JP5721818B2 (ja) | 検索におけるモデル情報群の使用 | |
CN107862022B (zh) | 文化资源推荐*** | |
KR102468930B1 (ko) | 관심대상 문서 필터링 시스템 및 그 방법 | |
US20130046771A1 (en) | Systems and methods for facilitating the gathering of open source intelligence | |
CN108073568A (zh) | 关键词提取方法和装置 | |
CN104537341B (zh) | 人脸图片信息获取方法和装置 | |
JP2016532173A (ja) | 意味情報、キーワード拡張及びそれに関するキーワード検索の方法及びシステム | |
WO2013163062A1 (en) | Recommending keywords | |
CN107180093A (zh) | 信息搜索方法及装置和时效性查询词识别方法及装置 | |
US20150302036A1 (en) | Method, system and computer program for information retrieval using content algebra | |
KR102108683B1 (ko) | 비관심사 컨텐츠를 포함하는 추천 컨텐츠를 제공하는 방법 | |
CN106815265B (zh) | 裁判文书的搜索方法及装置 | |
CN106844482B (zh) | 一种基于搜索引擎的检索信息匹配方法及装置 | |
US20120239657A1 (en) | Category classification processing device and method | |
JP7067884B2 (ja) | 分類装置、分類方法及び分類プログラム | |
TW201426357A (zh) | 搜索資料排序的方法和裝置,資料搜索的方法和裝置 | |
Wei et al. | Online education recommendation model based on user behavior data analysis | |
CN109344232A (zh) | 一种舆情信息检索方法及终端设备 | |
CN116431895A (zh) | 安全生产知识个性化推荐方法及*** | |
CN106294784B (zh) | 资源搜索方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131211 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131211 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140417 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140422 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140711 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150120 |