CN101119326B - 一种即时通信会话记录的管理方法及装置 - Google Patents

一种即时通信会话记录的管理方法及装置 Download PDF

Info

Publication number
CN101119326B
CN101119326B CN2006101095396A CN200610109539A CN101119326B CN 101119326 B CN101119326 B CN 101119326B CN 2006101095396 A CN2006101095396 A CN 2006101095396A CN 200610109539 A CN200610109539 A CN 200610109539A CN 101119326 B CN101119326 B CN 101119326B
Authority
CN
China
Prior art keywords
conversation recording
session
conversation
session theme
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2006101095396A
Other languages
English (en)
Other versions
CN101119326A (zh
Inventor
石燕伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN2006101095396A priority Critical patent/CN101119326B/zh
Publication of CN101119326A publication Critical patent/CN101119326A/zh
Application granted granted Critical
Publication of CN101119326B publication Critical patent/CN101119326B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种即时通信会话记录的管理方法,用于解决现有技术中即时通信用户在会话记录中查询信息时,不仅操作繁琐,而且查询效率低的问题。该方法包括:获取用户的会话记录并对其进行分类得到样本集合;分别对各样本集合进行相关性分析生成相应的分类组合,该分类组合包含所述样本集合中会话记录对应的特征向量;根据各分类组合中词语出现的频率确定分类组合对应的会话主题,并使该会话主题关联到分类组合对应的会话记录;以及根据用户查询时输入的关键词查找与该关键词匹配的会话主题,并将查找到的与会话主题关联的会话记录呈现给用户。本发明同时公开了一种即时通信会话记录的管理装置。

Description

一种即时通信会话记录的管理方法及装置
技术领域
本发明涉及通信及计算机技术领域,尤其涉及一种即时通讯会话记录的管理方法及装置。
背景技术
随着即时通讯(IM)技术的不断发展和普及,越来越多的用户不仅采用IM软件在网络中与其他用户进行交流,还可以将IM软件作为用户向其他用户咨询工作或学习中遇到问题的工具,同时,用户间的会话记录伴随着用户间的交流在IM***中保存下来,为用户以后查找自己关注的信息提供了资料。
例如:当用户A向用户B对一个问题进行了咨询,用户B返回了问题的答案,当用户C就同一个问题咨询用户A或用户B时,用户A需要查看与用户B的会话记录中的相关信息,或者用户B需要查看与用户A的会话记录中的相关信息时,用户A或用户B都需要在会话记录中人工查找相关记录,当会话记录较多或用户A与用户C咨询问题的时间间隔较长时,采用现有技术的方法,不仅增加了人工查找的工作量,而且查找效率较低。
如果用户A就同一问题对多个用户进行了咨询,当用户A希望从与多个用户的会话记录中查询信息时,采用现有技术的方法,如用户使用的即时通信***提供会话记录查看功能的即时通信***时,用户A只能人工对多个用户的会话记录逐一查看,找到自己关心的信息。即使用户A使用其它一些提供了用户会话记录的数据导入/导出功能的即时通信***,用户A也需要将多个用户的会话记录数据先进行导出,然后在导出数据中进行查询,用户A还可根据自己关心的信息的关键词在导出数据中进行查询,但采用关键词的方式也只能定位到包含该关键词的语段,该语段不一定与用户关心的信息相关,也不能实现用户在会话记录中有效查找信息。
发明内容
本发明提供一种即时通讯会话记录的管理方法及装置,用以解决现有技术中存在的即时通讯用户在会话记录中查询信息时,不仅操作繁琐,而且查询效率低的问题。
本发明提供以下技术方案:
一种即时通信会话记录的管理方法,包括如下步骤:
获取用户的会话记录并对其进行分类得到样本集合;
生成所述样本集合中每条会话记录对应的特征向量,分析各特征向量与其他特征向量的相关性,根据所述相关性对特征向量进行分类生成分类组合;
根据各分类组合中词语出现的频率确定分类组合对应的会话主题,并使该会话主题关联到分类组合对应的会话记录;以及
根据用户查询时输入的关键词查找与该关键词匹配的会话主题,并将查找到的与会话主题关联的会话记录呈现给用户。
其中,生成会话主题后进一步分析会话主题之间的相关性,并将相关性大于预定阈值的会话主题合并为同一个会话主题,使合并后的会话主题与被合并的所有会话主题所对应的会话记录关联。
按不同的会话用户对会话记录进行分类生成样本集合。
较佳的,根据所述样本集合中会话记录的间隔时间,进一步将一个样本集合划分为多个不同的样本集合。
生成样本集合中每条会话记录对应的特征向量,分析各特征向量与其他特征向量的相关性,具体包括:
对每条会话记录进行分词处理,删除该会话记录中无实际意义的词语得到集合S,合并S中的同义词,并进行向量化,则生成与该会话记录对应的特征向量
Figure DEST_PATH_GA20179767200610109539601D00011
(W1,W2,W3......Wn),其中Wi为第i个元素的权重,各元素为S中的词语;
计算与各会话记录对应的特征向量
Figure DEST_PATH_GA20179767200610109539601D00021
中各词的权重,根据组成所述特征向量的各词在其特征向量中的权重计算各特征向量的相关性。
根据分类组合中出现频率大于预定阈值的词语确定该分类组合的会话主题。
一种即时通信会话记录的管理装置,包括:
用于存储用户会话记录的单元;
用于对所述会话记录进行分类生成样本集合的单元;
用于生成所述样本集合中每条会话记录对应的特征向量,分析各特征向量与其他特征向量的相关性,根据所述相关性对特征向量进行分类生成分类组合的单元;
用于确定所述分类组合对应的会话主题,并使该会话主题关联到分类组合对应的会话记录的单元;以及
用于根据用户查询时输入的关键词查找与该关键词匹配的会话主题,并将查找到的与会话主题关联的会话记录呈现给用户的单元。
较佳的,所述装置还包括:
用于分析会话主题之间的相关性,并将相关性大于预定阈值的会话主题合并为同一个会话主题,以及将合并后的会话主题与被合并的所有会话主题所对应的会话记录关联的单元。
本发明有益效果如下:
本发明对用户会话记录进行分类生成样本集合后,分别对各样本集合进行相关性分析生成相应的分类组合并确定出分类组合对应的会话主题,以及将会话主题关联到分类组合对应的会话记录。采用本发明后,当用户需要从会话记录中查询信息时,用户只需输入关键词,***将自动查找与该关键词匹配的会话主题,并将查找到的会话主题所关联的会话记录呈现给用户,不仅避免了用户手工查询信息时的繁琐操作,而且提高了查询效率。
附图说明
图1为本发明实施例中用户会话记录的管理装置结构示意图;
图2为本发明实施例中用户会话记录管理方法的示意图;
图3为本发明实施例中对用户会话记录进行分类的处理流程图;
图4为本发明实施例中对样本集合进行相关性分析的处理流程图。
具体实施方式
为了解决现有技术中,即时通讯用户在会话记录中查询信息时,不仅操作繁琐,而且查询效率低的问题,本实施例中对用户会话记录进行分类生成样本集合,分别对各样本集合进行相关性分析生成相应的分类组合并确定出分类组合对应的会话主题,并将会话主题关联到分类组合对应的会话记录,以及根据用户输入的关键词查找与该关键词匹配的会话主题,并将查找到的会话主题所关联的会话记录呈现给用户。
参阅图1所示为本实施例中用户会话记录的管理装置结构示意图,包括:存储单元101、分类单元102、分析单元103、会话主题单元104、合并单元105和查询单元106。
存储单元101用于保存用户的会话记录和会话主题。分类单元102用于获取会话记录并对会话记录进行分类得到样本集合。分析单元103用于对样本集合进行相关性分析,生成样本集合的分类组合。会话主题单元104用于确定样本集合分类组合的会话主题,并使该会话主题关联到分类组合对应的会话记录。合并单元105用于分析会话主题之间的相关性,并将相关性大于预定阈值的会话主题合并为同一个会话主题,以及将合并后的会话主题关联到被合并的所有会话主题对应的会话记录。查询单元106用于接收用户在会话记录中查询信息时输入的关键词和查找与该关键词匹配的会话主题,并将查找到的会话主题所关联的会话记录呈现给用户。
参阅图2所示为本实施例中用户会话记录管理方法的示意图,包括:
步骤201、获取用户的会话记录并对该会话记录进行分类得到样本集合。
步骤202、对生成的样本集合进行相关性分析生成相应的分类组合。
步骤203、根据各分类组合中词语出现的频率确定分类组合对应的会话主题,并使该会话主题关联到分类组合对应的会话记录。
步骤204、分析会话主题之间的相关性,并将相关性大于预定阈值的会话主题合并为同一个会话主题,使合并后的会话主题关联到被合并的所有会话主题对应的会话记录。
步骤205、当用户在会话记录中查询信息时,根据用户查询时输入的关键词查找与该关键词匹配的会话主题,并将查找到的会话主题所关联的会话记录呈现给用户。
在步骤201中,对会话记录进行分类的处理流程参阅图3所示,处理过程如下:
步骤301、判断会话记录是否已经过分类处理,如果已经过分类处理,则不对其进行处理;否则,执行步骤302。
步骤302、对没有经过分类处理的会话记录根据不同的用户对会话记录进行分类,如:判断会话记录TRi和会话记录TRj是否属于同一用户间的会话记录,如果会话记录TRi和会话记录TRj分属于不同用户间的会话,将会话记录TRi和会话记录TRj划分为不同的样本集合TS;如果会话记录TRi和会话记录TRj属于同一用户间的会话记录,则将会话记录TRi和会话记录TRj划分到相同的样本集合中。
步骤303、将同一样本集合根据该样本集合中的会话记录的间隔时间进行划分,进一步划分为不同的样本集合,会话记录的间隔时间根据实际应用,可设为一星期等。
经过步骤303处理生成的样本集合TS为进行相关性分析的样本集合。
参阅图4所示,对一个样本集合采用KNN(K Nearest Neighbor,K最近邻居)算法进行相关性分析的处理过程如下:
步骤401、对样本集合TS中的每条会话记录TR生成对应的特征向量。首先对每条会话记录TR进行分词处理,去除其中的助词,叹词等无实际意义的词,得到集合S;合并S中的同义词,例如将{“电脑”,“计算机”}合并为{“计算机”,“计算机”}。将经过同义词合并后的对应于每条会话记录的集合S进行向量化,生成特征向量
Figure G061A9539620060810D000061
(W1,W2,W3......Wn),其中Wi为第i个元素的权重,各元素为S中的词语。
步骤402、计算与各会话记录TR对应的特征向量
Figure G061A9539620060810D000062
中各元素的权值W。采用如下公式进行权值计算:
W ( t , d → ) = tf ( t , d → ) × log ( N / n t + 0.01 ) Σ t ∈ d → [ tf ( t , d → ) × log ( N / n t + 0.01 ) ] 2
其中,
Figure G061A9539620060810D000064
为词t在特征向量
Figure G061A9539620060810D000065
中的权重,而为词t在特征向量中的词频,N为每个样本集合TS中会话记录TR的总数,nt为每个样本集合TS中出现词t的会话记录TR数,分母为归一化因子。
步骤403、计算与各会话记录对应的特征向量之间的相关系数,根据计算所得相关系数确定与各特征向量最相似的K个特征向量。
具体实施时,采用如下公式 Sim ( d i , d j ) = Σ k = 1 M W ik × W jk ( Σ k = 1 M W ik 2 ) ( Σ k = 1 M W jk 2 ) 计算出各会话记录对应的特征向量间的相关系数,其中,Sim(di,dj)为特征向量di与特征向量dj的相关系数,Wik和Wjk分别为特征向量di和特征向量dj的第k个元素的权值。
通过计算,获得各特征向量间的相关系数,根据该相关系数,将与每一个特征向量最相关的K个特征向量分别组合为一个集合,K的取值可根据实际应用进行确定。
步骤404、将各会话记录对应的特征向量划分到分类C中的不同类中生成分类组合。
分类C为样本集合TS中各会话记录对应的特征向量组成的集合。
方法一:当分类C为空时,则采用如下方式生成分类C中的一个向量集合c,然后将c添加到分类C中:
对应于会话记录的特征向量
Figure G061A9539620060810D000071
和特征向量
Figure G061A9539620060810D000072
分别属于对方最相似的K个邻居组成的集合,则
Figure G061A9539620060810D000073
Figure G061A9539620060810D000074
属于同一类c,生成类c并将该类与特征向量
Figure G061A9539620060810D000075
和特征向量对应的会话记录关联,然后将类c添加到分类C,每个类c中的特征向量组成一个分类组合。
方法二:当分类C不为空时,则计算对应于各会话记录的特征向量
Figure G061A9539620060810D000077
属于某个类c(c∈C)的权重,采用如下的公式:
p ( x → , C j ) = Σ d → i ∈ KNN Sim ( x → , d → i ) y ( d → i , C j )
其中,
Figure G061A9539620060810D000079
为对应于一条会话记录的特征向量,
Figure G061A9539620060810D0000710
为与
Figure G061A9539620060810D0000711
最相似的K个邻居组成的集合中的特征向量,
Figure G061A9539620060810D0000712
Figure G061A9539620060810D0000713
与其最相关的特征向量
Figure G061A9539620060810D0000714
的相关系数,该相关系数可根据步骤403计算结果获得,
Figure G061A9539620060810D0000715
为类别属性函数,如果特征向量
Figure G061A9539620060810D0000716
属于类Cj
Figure G061A9539620060810D0000717
的函数值为1,否则为0。根据计算得到比较特征向量
Figure G061A9539620060810D0000719
在各类Cj中的权值,将特征向量
Figure G061A9539620060810D0000720
分到权值较大的类Cj中,并将该类Cj与特征向量
Figure G061A9539620060810D0000721
对应的会话记录关联。
采用方法二时,如果特征向量
Figure G061A9539620060810D0000722
和现存每个类c的相关度都很小,则可采用方法一的方式生成一个新的类c′,并将类c′加入到分类C中,并将类c′与特性向量
Figure G061A9539620060810D0000723
对应的会话记录关联。
对各特征向量进行处理后,将特征向量都划分到一个类中,由各类分别组成分类组合。
将生成的各分类组合中出现频率最高的N个词语或者频率大于a的词语,确定为该分类组合的会话主题,N值和a值根据实际应用进行确定。
对每个样本集合TS进行上述处理后生成分类组合及该分类组合对应的会话主题,将生成的会话主题进行相关性分析时,将会话主题作为KNN算法的一个样本集合,计算该集合中每一个会话主题中各词在该会话主题中的权重,根据权重,利用步骤403中的公式,计算出各会话主题的相关系数,将相关系数大于设定阈值的会话主题进行合并。
呈现会话记录给用户时,根据不同的会话用户将会话记录进行排列,也可以根据会话主题中会话记录的权重顺序排列。
以上实施例中采用了KNN算法对样本集合进行相关性分析,但本发明不仅限于采用KNN算法对样本集合进行分析。对会话记录进行相关性分析的方法还可以应用向量机算法、神经网络算法以及贝叶斯算法等基于向量空间的训练算法和分类方法。例如采用贝叶斯算法时,计算各会话记录对应特征向量中每个词出现在某个会话中的概率,然后根据贝叶斯公式计算出特征向量属于某个会话的概率,将其加入到概率最大的会话中。
采用本发明,当用户在会话记录中查询用户关心的信息时,用户只需要输入关键词,***将自动查询与关键词匹配的会话主题,并将与该会话主题关联的会话记录呈现给用户,不仅避免了用户手工查询信息时的繁琐操作,而且提高了查询效率。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若对本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (8)

1.一种即时通信会话记录的管理方法,其特征在于,包括如下步骤:
获取用户的会话记录并对其进行分类得到样本集合;
生成所述样本集合中每条会话记录对应的特征向量,分析各特征向量与其他特征向量的相关性,根据所述相关性对特征向量进行分类生成分类组合;
根据各分类组合中词语出现的频率确定分类组合对应的会话主题,并使该会话主题关联到分类组合对应的会话记录;以及
根据用户查询时输入的关键词查找与该关键词匹配的会话主题,并将查找到的与会话主题关联的会话记录呈现给用户。
2.如权利要求1所述的方法,其特征在于,生成会话主题后进一步分析会话主题之间的相关性,并将相关性大于预定阈值的会话主题合并为同一个会话主题,使合并后的会话主题与被合并的所有会话主题所对应的会话记录关联。
3.如权利要求1或2所述的方法,其特征在于,按不同的会话用户对会话记录进行分类生成样本集合。
4.如权利要求3所述的方法,其特征在于,根据所述样本集合中会话记录的间隔时间,进一步将一个样本集合划分为多个不同的样本集合。
5.如权利要求1所述的方法,其特征在于,所述生成样本集合中每条会话记录对应的特征向量,分析各特征向量与其他特征向量的相关性,具体包括:
对每条会话记录进行分词处理,删除该会话记录中无实际意义的词语得到集合S,合并S中的同义词,并进行向量化,则生成与该会话记录对应的特征向量
Figure FA20179767200610109539601C00011
(W1,W2,W3......Wn),其中Wi为第i个元素的权重,各元素为S中的词语;
计算与各会话记录对应的特征向量
Figure FA20179767200610109539601C00012
中各词的权重,根据组成所述特征向量的各词在其特征向量中的权重计算各特征向量的相关性。
6.如权利要求1所述的方法,其特征在于,根据分类组合中出现频率大于预定阈值的词语确定该分类组合的会话主题。
7.一种即时通信会话记录的管理装置,其特征在于,包括:
用于存储用户会话记录的单元;
用于对所述会话记录进行分类生成样本集合的单元;
用于生成所述样本集合中每条会话记录对应的特征向量,分析各特征向量与其他特征向量的相关性,根据所述相关性对特征向量进行分类生成分类组合的单元;
用于确定所述分类组合对应的会话主题,并使该会话主题关联到分类组合对应的会话记录的单元;以及
用于根据用户查询时输入的关键词查找与该关键词匹配的会话主题,并将查找到的与会话主题关联的会话记录呈现给用户的单元。
8.如权利要求7所述的装置,其特征在于,还包括:
用于分析会话主题之间的相关性,并将相关性大于预定阈值的会话主题合并为同一个会话主题,以及将合并后的会话主题与被合并的所有会话主题所对应的会话记录关联的单元。
CN2006101095396A 2006-08-04 2006-08-04 一种即时通信会话记录的管理方法及装置 Active CN101119326B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2006101095396A CN101119326B (zh) 2006-08-04 2006-08-04 一种即时通信会话记录的管理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2006101095396A CN101119326B (zh) 2006-08-04 2006-08-04 一种即时通信会话记录的管理方法及装置

Publications (2)

Publication Number Publication Date
CN101119326A CN101119326A (zh) 2008-02-06
CN101119326B true CN101119326B (zh) 2010-07-28

Family

ID=39055265

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006101095396A Active CN101119326B (zh) 2006-08-04 2006-08-04 一种即时通信会话记录的管理方法及装置

Country Status (1)

Country Link
CN (1) CN101119326B (zh)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2377059B1 (en) * 2008-12-12 2020-01-08 Koninklijke Philips N.V. An assertion-based record linkage in distributed and autonomous healthcare environments
CN101483620B (zh) * 2009-02-17 2012-09-26 腾讯科技(深圳)有限公司 一种即时通讯工具中的会话保留方法和***
CN101997964A (zh) * 2009-08-13 2011-03-30 中国电信股份有限公司 一种移动通信终端及其联系记录的处理方法
CN103078781A (zh) * 2011-10-25 2013-05-01 国际商业机器公司 用于即时消息***的方法和即时消息***
CN102646134A (zh) * 2012-03-29 2012-08-22 百度在线网络技术(北京)有限公司 一种用于确定消息记录中的消息会话的方法和设备
CN103425648B (zh) * 2012-05-15 2016-04-13 腾讯科技(深圳)有限公司 关系圈的处理方法和***
CN103279465B (zh) * 2012-12-18 2018-05-25 北京奇虎科技有限公司 通信历史数据的控制方法及装置
CN103279466B (zh) * 2012-12-18 2018-01-26 北京奇虎科技有限公司 控制通信历史数据的方法及装置
CN105024906B (zh) * 2014-04-21 2018-10-02 腾讯科技(深圳)有限公司 社交网络中的群消息存储、查询方法和***
CN105450497A (zh) * 2014-07-31 2016-03-30 国际商业机器公司 生成聚类模型以及基于该聚类模型进行聚类的方法和装置
CN104361003A (zh) * 2014-10-10 2015-02-18 金硕澳门离岸商业服务有限公司 一种聊天记录分类显示方法及装置
CN104462518B (zh) * 2014-12-22 2018-10-19 百度在线网络技术(北京)有限公司 用于对im信息进行标注的方法和设备
CN105049336A (zh) * 2015-08-12 2015-11-11 深圳前海珩昌科技有限公司 即时通信消息的处理方法、服务器、客户端及***
CN105141502A (zh) * 2015-08-12 2015-12-09 深圳前海珩昌科技有限公司 一种即时通信过程的管理方法及装置
CN106487640A (zh) * 2015-08-25 2017-03-08 平安科技(深圳)有限公司 多通讯模块控制方法及服务器
CN106888236B (zh) * 2015-12-15 2021-08-31 腾讯科技(深圳)有限公司 会话管理方法及会话管理装置
CN105589625B (zh) * 2015-12-21 2020-06-02 惠州Tcl移动通信有限公司 一种社交媒体消息的处理方法及其装置、通信终端
CN105959205A (zh) * 2016-04-29 2016-09-21 杨夫春 聊天记录保存方法
CN106599147A (zh) * 2016-12-06 2017-04-26 庄爱芹 一种浏览器浏览记录的管理方法及装置
CN106777013B (zh) * 2016-12-07 2020-09-11 科大讯飞股份有限公司 对话管理方法和装置
CN108737240A (zh) * 2017-04-18 2018-11-02 阿里巴巴集团控股有限公司 聊天群自动创建的方法、装置以及群创建的方法
US11582179B2 (en) 2017-11-15 2023-02-14 Huawei Technologies Co., Ltd. Information search method, terminal, network device, and system
CN111698143B (zh) * 2019-03-14 2022-12-16 阿里巴巴集团控股有限公司 信息处理方法、信息显示方法及装置
CN110138645B (zh) 2019-03-29 2021-06-18 腾讯科技(深圳)有限公司 会话消息的显示方法、装置、设备及存储介质
CN110781930A (zh) * 2019-10-14 2020-02-11 西安交通大学 一种基于网络安全设备日志数据的用户画像分组及行为分析方法和***
CN112769673A (zh) * 2019-11-05 2021-05-07 钉钉控股(开曼)有限公司 沟通记录的生成、推荐和展示方法及装置
CN111327518B (zh) * 2020-01-21 2022-10-11 上海掌门科技有限公司 一种拼接消息的方法与设备
CN111708866B (zh) * 2020-08-24 2020-12-11 北京世纪好未来教育科技有限公司 会话切分方法、装置、电子设备和存储介质
CN111798870A (zh) * 2020-09-08 2020-10-20 共道网络科技有限公司 会话环节确定方法、装置及设备、存储介质
CN113113017B (zh) * 2021-04-08 2024-04-09 百度在线网络技术(北京)有限公司 音频的处理方法和装置
CN113595886A (zh) * 2021-07-29 2021-11-02 北京达佳互联信息技术有限公司 即时通讯消息的处理方法、装置、电子设备及存储介质
CN114691830B (zh) * 2022-03-31 2022-12-20 江苏冬云云计算股份有限公司 一种基于大数据的网络安全分析方法及***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1584883A (zh) * 2004-05-27 2005-02-23 威盛电子股份有限公司 关联性文件连结管理***、方法及记录媒体
CN1609859A (zh) * 2004-11-26 2005-04-27 孙斌 搜索结果聚类的方法
CN1741012A (zh) * 2004-08-23 2006-03-01 富士施乐株式会社 文本检索装置及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1584883A (zh) * 2004-05-27 2005-02-23 威盛电子股份有限公司 关联性文件连结管理***、方法及记录媒体
CN1741012A (zh) * 2004-08-23 2006-03-01 富士施乐株式会社 文本检索装置及方法
CN1609859A (zh) * 2004-11-26 2005-04-27 孙斌 搜索结果聚类的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JP特开2005-173847A 2005.06.30
同上.

Also Published As

Publication number Publication date
CN101119326A (zh) 2008-02-06

Similar Documents

Publication Publication Date Title
CN101119326B (zh) 一种即时通信会话记录的管理方法及装置
CN104199965B (zh) 一种语义信息检索方法
CN105808590B (zh) 搜索引擎实现方法、搜索方法以及装置
US8543380B2 (en) Determining a document specificity
Weng et al. Using text classification and multiple concepts to answer e-mails
CA2720842A1 (en) System and method for value significance evaluation of ontological subjects of network and the applications thereof
EP2045734A2 (en) Automatically generating a hierarchy of terms
CN108549647B (zh) 基于SinglePass算法实现无标注语料主动预测移动客服领域中突发事件的方法
US20030212663A1 (en) Neural network feedback for enhancing text search
CN103309869B (zh) 数据对象的展示关键词推荐方法及***
US20060085405A1 (en) Method for analyzing and classifying electronic document
US20110191335A1 (en) Method and system for conducting legal research using clustering analytics
CN116455861B (zh) 一种基于大数据的计算机网络安全监测***及方法
CN112257419A (zh) 一种基于词频和语义计算专利文献相似度的智能检索方法、装置、电子设备及其存储介质
EP2045732A2 (en) Determining the depths of words and documents
CN104573130A (zh) 基于群体计算的实体解析方法及装置
CN109918674B (zh) 一种基于案件要素相似性建模的案件串并方法
CN113407785B (zh) 一种基于分布式储存***的数据处理方法和***
CN105787662A (zh) 基于属性的移动应用软件性能预测方法
CN112149422A (zh) 一种基于自然语言的企业新闻动态监测方法
CN111783456A (zh) 一种利用语义分析技术的舆情分析方法
Sadesh et al. Automatic Clustering of User Behaviour Profiles for Web Recommendation System.
CN111008285B (zh) 一种基于论文关键属性网络的作者消歧方法
JP2005092442A (ja) 多次元空間モデル表現装置および多次元空間モデル表現方法
Yang et al. A hot topic detection approach on Chinese microblogging

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant