JP5928091B2 - タググループ分類方法、装置及びデータマッシュアップ方法、装置 - Google Patents
タググループ分類方法、装置及びデータマッシュアップ方法、装置 Download PDFInfo
- Publication number
- JP5928091B2 JP5928091B2 JP2012079208A JP2012079208A JP5928091B2 JP 5928091 B2 JP5928091 B2 JP 5928091B2 JP 2012079208 A JP2012079208 A JP 2012079208A JP 2012079208 A JP2012079208 A JP 2012079208A JP 5928091 B2 JP5928091 B2 JP 5928091B2
- Authority
- JP
- Japan
- Prior art keywords
- tag
- group
- class
- feature vector
- tag group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
S2:pubdate(公開時間)、publishdate(発表時間)
S3:URL(統一資源位置指定子)、link(リンク)
S4:summary(要約)、description(概述)
S5:event(イベント)、title(タイトル)、what(何)
S6:starttime(スタートタイム)、when(何時)
S7:where(何処)、location(場所)
・・・
Sn:who(誰)、attendees(参加者)
ただし、nは、1以上の整数である。
T2:title(タイトル)、publishdate(発表時間)、creator(創作者)、description(概述)、URL(統一資源位置指定子)
T3:title(タイトル)、link(リンク)、writer(筆者)、description(概述)
T4:title(タイトル)、link(リンク)、writer(筆者)、description(概述)
T5:event(イベント)、starttime(スタートタイム)、endtime(エンドタイム)、location(場所)、attendees(参加者)
T6:title(タイトル)、starttime(スタートタイム)、duration(期間)、where(何処)、attendees(参加者)
・・・
Tp:what(何)、where(何処)、who(誰)、when(何時)
ただし、pは、1以上の整数である。
類似度(A,B)=(Σfak×fbk)/sqrt[(Σfak×fak) ×(Σfbk×fbk)] 式(1)
ただし、1≦k≦n、nは1以上の整数である。
ただし、1≦j≦m,mは1以上の整数である。
Claims (8)
- コンピュータが、少なくとも一つのタグと、前記少なくとも一つのタグにより定義された相応するデータとを含むタググループに対して分類を行う方法であって、
前記コンピュータが、
同義のタグが属する同義タグセット群と、1つのデータリストのデータを定義するタグが属するタググループ群とから、あるグループに属するタグが、いずれの同義タグにいくつ現れるかを示す要素群を生成し、
前記要素群から、各タググループに対応する特徴ベクトルを生成し、
前記タググループを、各タググループの特徴ベクトルの類似度に応じてクラスに分類し、
ここで、生成された前記特徴ベクトルのうち、各要素が前記同義タグセット群における異なる同義タグセットにそれぞれ対応し、各要素の値は対応するタググループのうちの、該要素に対応する同義タグセットに属するタグの数である、ことを特徴とする分類を行う方法。 - 前記コンピュータが、
各クラスについて、クラスに分類されたタググループの特徴ベクトルの要素の値の和となるコア特徴ベクトルを算出し、
分類されるべきタググループの特徴ベクトルと、分類先となる各クラスのコア特徴ベクトルとの類似度を求め、何れのコア特徴ベクトルとも類似しないと判断すると、新たなクラスを作成して該分類されるべきタググループを該作成した新たなクラスに分類する、
ことを特徴とする請求項1に記載の分類を行う方法。 - 少なくとも一つのタグと、前記少なくとも一つのタグにより定義された相応するデータとを含むタググループに対して分類を行う装置であって、
同義のタグが属する同義タグセット群と、1つのデータリストのデータを定義するタグが属するタググループ群とから、あるグループに属するタグが、いずれの同義タグにいくつ現れるかを示す要素群を生成する第一のユニットと、
前記要素群から、各タググループに対応する特徴ベクトルを生成する第二のユニットと、
前記タググループを、各タググループの特徴ベクトルの類似度に応じてクラスに分類する第三のユニットと、
を含み、
ここで、生成された前記特徴ベクトルのうち、各要素が前記同義タグセット群における異なる同義タグセットにそれぞれ対応し、各要素の値は対応するタググループのうちの、該要素に対応する同義タグセットに属するタグの数である、ことを特徴とする分類を行う装置。 - 各クラスについて、クラスに分類されたタググループの特徴ベクトルの要素の値の和となるコア特徴ベクトルを算出する第四のユニットと、
分類されるべきタググループの特徴ベクトルと、分類先となる各クラスのコア特徴ベクトルとの類似度を求め、何れのコア特徴ベクトルとも類似しないと判断すると、新たなクラスを作成して該分類されるべきタググループを該作成した新たなクラスに分類する第五のユニットと、
を含む、ことを特徴とする請求項3に記載の分類を行う装置。 - コンピュータが、タググループに基づいてデータをマッシュアップする方法であって、
前記コンピュータが、
請求項1又は2に記載の分類を行う方法で、タググループを少なくとも一つのクラスに分類し、
同一のクラスにおける各タググループの各タグのそれぞれを、その所属する同義タグセットにおいて指定されたタグで置換する、
ことを特徴とするデータをマッシュアップする方法。 - タググループに基づいてデータをマッシュアップする装置であって、
請求項3又は4に記載の分類を行う装置で、タググループを少なくとも一つのクラスに分類する分類ユニットと、
同一のクラスにおける各タググループの各タグのそれぞれを、その所属する同義タグセットにおいて指定されたタグで置換する置換ユニットと、
を含む、ことを特徴とするデータをマッシュアップする装置。 - コンピュータに、請求項1又は2に記載の分類を行う方法を実行させるためのプログラム。
- 請求項7に記載のプログラムを記憶しているコンピュータ読み出し可能な記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110101514.2A CN102750289B (zh) | 2011-04-19 | 2011-04-19 | 基于标签组对数据进行混合的方法和设备 |
CN201110101514.2 | 2011-04-19 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012226740A JP2012226740A (ja) | 2012-11-15 |
JP5928091B2 true JP5928091B2 (ja) | 2016-06-01 |
Family
ID=47030481
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012079208A Expired - Fee Related JP5928091B2 (ja) | 2011-04-19 | 2012-03-30 | タググループ分類方法、装置及びデータマッシュアップ方法、装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5928091B2 (ja) |
CN (1) | CN102750289B (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016033335A1 (en) * | 2014-08-27 | 2016-03-03 | Sgk | Media generation system and methods of performing the same |
CN106202090B (zh) * | 2015-05-04 | 2020-02-07 | 阿里巴巴集团控股有限公司 | 一种信息处理、搜索方法及装置、服务器 |
JP6366852B2 (ja) * | 2016-02-29 | 2018-08-01 | 三菱電機株式会社 | 機器分類装置 |
CN107229615A (zh) * | 2017-07-01 | 2017-10-03 | 王亚迪 | 一种网络个体或群体价值观自动辨别方法 |
US11663184B2 (en) | 2017-07-07 | 2023-05-30 | Nec Corporation | Information processing method of grouping data, information processing system for grouping data, and non-transitory computer readable storage medium |
CN110309294B (zh) * | 2018-03-01 | 2022-03-15 | 阿里巴巴(中国)有限公司 | 内容集合的标签确定方法及装置 |
CN111143346B (zh) * | 2018-11-02 | 2023-08-25 | 北京字节跳动网络技术有限公司 | 标签组的差异性确定方法、装置、电子设备及可读介质 |
CN110245265B (zh) * | 2019-06-24 | 2021-11-02 | 北京奇艺世纪科技有限公司 | 一种对象分类方法、装置、存储介质及计算机设备 |
CN112434722B (zh) * | 2020-10-23 | 2024-03-19 | 浙江智慧视频安防创新中心有限公司 | 基于类别相似度的标签平滑计算的方法、装置、电子设备及介质 |
CN113010737B (zh) * | 2021-03-25 | 2024-04-30 | 腾讯科技(深圳)有限公司 | 一种视频标签的分类方法、装置及存储介质 |
CN114529772B (zh) * | 2022-04-19 | 2022-07-15 | 广东唯仁医疗科技有限公司 | Oct三维图像分类方法、***、计算机装置及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100816934B1 (ko) * | 2006-04-13 | 2008-03-26 | 엘지전자 주식회사 | 문서검색 결과를 이용한 군집화 시스템 및 그 방법 |
JP2008084192A (ja) * | 2006-09-28 | 2008-04-10 | Toshiba Corp | 構造化文書検索装置、構造化文書検索方法および構造化文書検索プログラム |
CN100535904C (zh) * | 2007-08-11 | 2009-09-02 | 腾讯科技(深圳)有限公司 | 检索在线广告资源的方法和装置 |
JP4745419B2 (ja) * | 2009-05-15 | 2011-08-10 | 株式会社東芝 | 文書分類装置およびプログラム |
CN101984437B (zh) * | 2010-11-23 | 2012-08-08 | 亿览在线网络技术(北京)有限公司 | 音乐资源个性化推荐方法及*** |
-
2011
- 2011-04-19 CN CN201110101514.2A patent/CN102750289B/zh not_active Expired - Fee Related
-
2012
- 2012-03-30 JP JP2012079208A patent/JP5928091B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN102750289B (zh) | 2015-08-05 |
JP2012226740A (ja) | 2012-11-15 |
CN102750289A (zh) | 2012-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5928091B2 (ja) | タググループ分類方法、装置及びデータマッシュアップ方法、装置 | |
Crainic et al. | Scenario grouping in a progressive hedging-based meta-heuristic for stochastic network design | |
CN110192210A (zh) | 构建和处理用于动态结构化机器学习模型的计算图 | |
US8307366B2 (en) | Post-processing phase in a distributed processing system using assignment information | |
WO2018025706A1 (ja) | テーブル意味推定システム、方法およびプログラム | |
US11605002B2 (en) | Program, information processing method, and information processing apparatus | |
US9141596B2 (en) | System and method for processing markup language templates from partial input data | |
CN110515944B (zh) | 基于分布式数据库的数据存储方法、存储介质和电子设备 | |
US10162879B2 (en) | Label filters for large scale multi-label classification | |
US20200379807A1 (en) | Method, device, and computer program product for managing jobs in processing system | |
CN109582967B (zh) | 舆情摘要提取方法、装置、设备及计算机可读存储介质 | |
WO2023093375A1 (zh) | 一种计算资源获取方法、装置、电子设备和存储介质 | |
JP2015162109A (ja) | タスク割り当てサーバ、タスク割り当て方法およびプログラム | |
WO2018025707A1 (ja) | テーブル意味推定システム、方法およびプログラム | |
US20230032208A1 (en) | Augmenting data sets for machine learning models | |
CN113516185A (zh) | 模型训练的方法、装置、电子设备及存储介质 | |
CN106383738B (zh) | 任务处理方法和分布式计算框架 | |
US20200050657A1 (en) | Ontology creation assistance device | |
CN114091686B (zh) | 数据处理方法、装置、电子设备和存储介质 | |
Hosseinian et al. | Algorithms for the generalized independent set problem based on a quadratic optimization approach | |
CN111178925B (zh) | 用户画像的属性预测方法、装置、服务器和计算机可读介质 | |
CN111859917A (zh) | 主题模型构建方法、设备及计算机可读存储介质 | |
JP7375096B2 (ja) | 分散表現生成システム、分散表現生成方法及び分散表現生成プログラム | |
Kliegr et al. | EasyMiner-Short History of Research and Current Development. | |
JP5942998B2 (ja) | 線形制約条件生成装置及び方法、半正定値最適化問題求解装置、計量学習装置、並びにコンピュータ・プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150106 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150824 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150901 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151030 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160329 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160411 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5928091 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |