CN101079025B - 一种文档相关度计算***和方法 - Google Patents

一种文档相关度计算***和方法 Download PDF

Info

Publication number
CN101079025B
CN101079025B CN2006100360943A CN200610036094A CN101079025B CN 101079025 B CN101079025 B CN 101079025B CN 2006100360943 A CN2006100360943 A CN 2006100360943A CN 200610036094 A CN200610036094 A CN 200610036094A CN 101079025 B CN101079025 B CN 101079025B
Authority
CN
China
Prior art keywords
justice
vocabulary
module
document
semantic vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2006100360943A
Other languages
English (en)
Other versions
CN101079025A (zh
Inventor
丁江伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Shiji Guangsu Information Technology Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN2006100360943A priority Critical patent/CN101079025B/zh
Publication of CN101079025A publication Critical patent/CN101079025A/zh
Application granted granted Critical
Publication of CN101079025B publication Critical patent/CN101079025B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明涉及文档相关度计算***及方法。该***包括文档预处理模块和分词模块,文档预处理模块的输入为至少一篇待分析文档,分词模块的输出为对应至少一篇文档的第一词汇表;还包括:分词后处理模块,用于根据第一词汇表中词汇的词性,剔除其中的停用词、虚词,得到第二词汇表;义元处理模块,对第二词汇表中的词汇进行义元标注,形成第三词汇表,确定第三词汇表中多义词所对应的多个义元的权重或为多义词确定唯一义元以得到第一义元表,对第一义元表中的所有义元计算权重,得到按权重排序的主题语义向量;文档相关度计算模块,与义元处理模块相连,用于对至少两个主题语义向量进行相关度计算。本发明的有益效果是提升了文档相关度计算的精度。

Description

一种文档相关度计算***和方法
技术领域
本发明涉及网络通信技术,更具体地说,涉及一种文档相关度计算***和方法。
背景技术
文档相关度是一个0到1之间的小数,表征了两篇文档之间语义上的相关程度。例如,两篇相同文档的相关度为1,而一篇涉及编程技术的文档与一篇涉及政治社会的文档的相关度远小于1、接近于0。计算文档相关度可以应用在很多方面,比如文档的分类聚类、检索相关文章信息等。
目前文档相关度的计算都是基于主题词汇提取技术的:首先通过计算提取出待比较文档的主题词汇,再通过计算主题词汇之间的相关度而得出待比较文档的相关度。
现有的主题提取方法主要有两种。一种是是基于标题的主题提取技术。其方法是:采用文档解析器,解析文档,找出文档的标题,然后将文档中标题的值作为文档的主题思想。但是这种计算方法显然过于简单,无法应用在计算文档相关度中。
另外一种是基于词频的主题提取技术。随着统计自然语言处理技术的发展,按照高词频关键词来标示文档主题的方法得到了广泛的应用,特别是在网页主题的提取中比较常用。具体做法是先将网页源文件去tag标记,然后将文章内容进行分词统计词频,最后按词频对关键词排序,给出前N个高词频作为文章主题。但是由于表义语言发展得很充分,一义多词、一词多义是普遍现象,再加上修辞法的运用使得词汇稀疏现象客观存在,特别是对于网页类的短文章,该算法整体效果不是很理想,从而导致文档相关度的计算不理想。
发明内容
本发明的目的在于针对现有技术的缺陷,提供一种文档相关度计算***和方法,其基于义元集语义分析技术,同时可消除多义词和词汇稀疏现象对相关度的消极影响。
本发明的技术方案是:一种文档相关度计算***,包括顺序相连的文档预处理模块和分词模块,所述文档预处理模块的输入为至少一篇待分析文档,所述分词模块的输出为对应所述至少一篇文档的第一词汇表;所述分词模块还具有对切分后的词汇进行词性标注的功能;还包括:在所述分词模块与义元处理模块之间还串联的分词后处理模块,所述分词后处理模块用于根据第一词汇表中词汇的词性,剔除其中的停用词、虚词,得到第二词汇表;义元处理模块,用于对所述第二词汇表中的词汇进行义元标注,形成第三词汇表,确定所述第三词汇表中多义词所对应的多个义元的权重或为多义词确定唯一义元以得到第一义元表,对所述第一义元表中的所有义元计算权重,得到按权重排序的主题语义向量;文档相关度计算模块,其与所述义元处理模块相连,用于对至少两个主题语义向量进行相关度计算。
其中,所述文档预处理模块用于将输入的、不同格式的文档转换为标准格式,并提取文档正文;分词模块用于对所述文档预处理模块的输出进行分词,得到所述第一词汇表。所述义元处理模块包括:义元标注模块,其用于使用义元词典对所述第二词汇表中的词汇进行义元标注,形成第三词汇表;词义消歧模块,其用于确定所述第三词汇表中多义词所对应的多个义元的权重,或为多义词确定唯一义元,得到第一义元表;主题语义向量计算模块,其用于对所述第一义元表中的所有义元计算权重,得到按权重排序的主题语义向量。
作为本发明的一个改进,还包括主题语义向量库,其输入端与所述义元处理模块相连,输出端与所述文档相关度计算模块相连,用于存储所述义元处理模块输出的主题语义向量。所述文档相关度计算模块用于对至少两个主题语义向量进行相关度计算;所述主题语义向量从所述义元处理模块获得,或从所述主题语义向量库中获得,或分别从所述义元处理模块和主题语义向量库中获得。
本发明还提供了一种文档相关度计算方法,包括以下步骤:(a),由文档预处理模块将输入的、不同格式的文档转换为标准格式,并提取文档正文内容;(b),由分词模块对所述文档预处理模块的输出进行分词并对切分后的词汇进行词性标注,得到第一词汇表;由分词后处理模块对所述第一词汇表的词汇进行剔除其中的停用词、虚词处理得到第二词汇表;(c),由义元处理模块对所述第二词汇表中的词汇进行义元标注,形成第三词汇表,并对所述第三词汇表中的词汇进行处理,确定其中多义词所对应的多个义元的权重或为多义词确定唯一义元以得到第一义元表,对所述第一义元表中的所有义元计算权重,得到按权重排序的主题语义向量;(d),由文档相关度计算模块对待分析的至少两篇文档的主题语义向量进行计算,得到所述至少两篇文档的相关度。
其中,步骤(d)中,所述至少两篇文档的主题语义向量从所述义元处理模块获得,或从与所述文档相关度计算模块连接的主题语义向量库中获得,或分别从所述义元处理模块和主题语义向量库中获得。
进一步的,步骤(a)进一步包括:所述文档预处理模块获取对应文档类别信息和标题信息。
步骤(c)中,获得主题语义向量的方法是:(c1),由义元标注模块使用义元词典对所述第二词汇表中的词汇进行义元标注,形成第三词汇表;(c2),由词义消歧模块对所述第三词汇表中标注过义元的词汇进行处理,确定其中多义词所对应的多个义元的权重,或为多义词确定唯一义元,得到第一义元表;(c3),由主题语义向量计算模块对所述第一义元表中的所有义元计算权重,得到按权重排序的主题语义向量。
本发明的有益效果在于:①采用基于义元集的语义分析技术,避免了词汇稀疏的难题,使得涉及短文章的文档间相关度的分析效果良好,提升了文档相关度计算的精度。②应用词义消歧技术,消除了多义词对计算相关度的消极影响,提高了相关度计算精度。③充分考虑了文档的预分类、标题信息和显示属性,能够准确地提取出文档的主题,从而提升文档相关度计算精度。
附图说明
图1是本发明一种文档相关度计算***的结构图。
图2是本发明一种文档相关度计算方法的流程图。
具体实施方式
下面根据附图和较佳实施例对本发明作进一步阐述。
如图1所示,本发明一种文档相关度计算***包括顺次相连的文档预处理模块1、分词模块2、分词后处理模块3、义元处理模块和文档相关度计算模块8。义元处理模块包括顺次相连的义元标注模块4、词义消歧模块5和主题语义向量计算模块6。根据需要,还可以包括主题语义向量库7,其输入端与主题语义向量计算模块6相连,其输出端与文档相关度计算模块8相连。
其中,文档预处理模块1用于将输入的、不同格式的文档转换为标准格式,并提取文档正文。其中,不同格式的文档可以包括网页、word文档、文本文档、pdf等文档。标准格式可以是文本文档。在具体实现中,如果可以从转换后的标准格式中提取文档标题和分类信息,则文档预处理模块还可以具有提取转换后标准文档标题和分类信息的能力,以提高提取文档主题的准确度,从而提升文档相关度计算精度。如***处理的所有文档都是网页格式的,则标准格式定义为网页格式,文档预处理模块就需要具备提取网页标题和分类信息的能力。它与分词模块2相连。
分词模块2用于对所述文档预处理模块1的输出进行分词。本实施例中,分词模块2负责按照词典将转换后网页的正文和标题、类别切分成词汇。如将“我是一个学生”进行分词,分为“我”、“是”、“一个”、“学生”四个词。现有的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。本实施例中采用基于字符串匹配的分词方法。该方法又叫做机械分词方法,它是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行匹配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。
本发明中,分词模块2还具有对切分后的词汇进行词性标注的功能,以方便分词后处理模块3按照词性将词汇中的停用词和虚词等去掉。
分词后处理模块3的功能包括但不限于对分词模块2的输出去停用词、去虚词等功能,剔除对主题无关的信息。
义元标注模块4用于使用义元词典对分词后的词汇到义元标注。它与分词后处理模块3、词义消歧模块5、以及义元词典相连。
由于义元词典对多义词给出了多个义元,这时就需要词义消歧模块5根据上、下文信息确定该多义词对应的每个义元的可能权重。当然也可以采用较简单的方法:根据上下文确定一个特定的义元作为该多义词的语义。本实施例采用第二种方法。可以采用贝叶斯算法、决策树、计算信息熵等方法进行计算。
本发明在文档主题的提取过程中并不是用词汇作为计算单元的,而是使用义元词典将词汇转换成义元表示,是一种基于义元集的语义分析技术。所谓义元(semantic primitives)就是组义语言中最基本的元素。它可以解释成:一组意思的符号,此外,所有的其它词汇都能用它们来定义。自然语言处理所面临的一个重大难题是词汇稀疏,所以将关键词转换成义元词表示能很大程度上避免词汇稀疏现象,义元集是一个小规模词汇或者义元序号集合,表征了自然界的所有概念,一个义元集元素唯一的、不重复的表示一个概念。
主题语义向量计算模块6用于利用统计语言学原理对词义消歧模块5输出的所有义元进行计算,计算的结果是对不同的义元赋予了不同的权重,得到按权重排序的主题语义向量。如果文档预处理模块1得到了文档的标题和分类信息,则主题语义向量计算模块6在计算的过程中对于文档的分类信息、标题信息和正文信息分别给予不同的统计权值。
本实施例中,采用Tf-Idf算法对所有义元计算权重。当然也可以采用交叉熵等算法对义元计算权重。Tf-Idf算法采用倒排索引技术,其主要应用在全文检索。该算法可以保证为中等频率的义元赋以高的权重,并排除噪声词汇。
主题语义向量库7用于存储主题语义向量计算模块6输出的主题语义向量。
文档相关度计算模块8用于对待分析的至少两篇文档的主题语义向量进行计算,得到所述至少两篇文档的相关度。上述主题语义向量可以都从义元处理模块获得,即前述各模块分别同时处理至少两篇文档。上述主题语义向量也可以都从所述主题语义向量库7中获得,其根据设定,从主题语义向量库7中寻找到与待分析文档对应的主题语义向量,然后进行计算。上述主题语义向量也可以一篇从义元处理模块中获得,而另一篇从主题语义向量库7中获得。例如管理模块发现待分析的两篇文档中的一篇已经经过分析,且其主题语义向量存储在主题语义向量库7中,则本次只分析一篇文档,另一篇文档的主题语义向量直接从主题语义向量库7中获得。
可以通过计算两个主题语义向量之间的夹角余弦来得到相关文档的相关度。
如图2所示,本发明一种文档相关度计算方法包括步骤:
S1,文档预处理模块1将输入的、不同格式的文档转换为标准格式文档,提取其正文内容,如果可以再获得其标题和类别信息。
S2,分词模块2对文档的正文内容(可能还包括类别和标题)进行分词,并对上述切分后的词汇进行词性标注,形成第一词汇表。
S3,分词后处理模块3将第一词汇表中的停用词、虚词等剔除,形成第二词汇表。
S4,义元标注模块4按照词典和义元词典的对应关系将第二词汇表中的词汇用义元进行标注,形成第三词汇表。
S5,词义消歧模块5对第三词汇表中的多义词进行处理,根据上下文信息为多义词确定对应的唯一义元,得到第一义元表。
S6,主题语义向量计算模块6按照量空间模型的Tf-Idf(特征项赋权因子)等算法给第一义元表中的所有义元计算权重,得到按权重排序的主题语义向量。
S7,文档相关度计算模块8对与待分析文档相对应的主题语义向量进行计算,得到待分析文档之间的相关度,并将其归一化到0-1之间的数值。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (8)

1.一种文档相关度计算***,包括顺序相连的文档预处理模块和分词模块,所述文档预处理模块的输入为至少一篇待分析文档,所述分词模块的输出为对应所述至少一篇文档的第一词汇表;所述分词模块还具有对切分后的词汇进行词性标注的功能;其特征在于,还包括:
在所述分词模块与义元处理模块之间还串联的分词后处理模块,所述分词后处理模块用于根据第一词汇表中词汇的词性,剔除其中的停用词、虚词,得到第二词汇表;
义元处理模块,用于对所述第二词汇表中的词汇进行义元标注,形成第三词汇表,确定所述第三词汇表中多义词所对应的多个义元的权重或为多义词确定唯一义元以得到第一义元表,对所述第一义元表中的所有义元计算权重,得到按权重排序的主题语义向量;
文档相关度计算模块,其与所述义元处理模块相连,用于对至少两个主题语义向量进行相关度计算。
2.根据权利要求1所述的一种文档相关度计算***,其特征在于:还包括主题语义向量库,其输入端与所述义元处理模块相连,输出端与所述文档相关度计算模块相连,用于存储所述义元处理模块输出的主题语义向量;
所述文档相关度计算模块用于对至少两个主题语义向量进行相关度计算;所述主题语义向量从所述义元处理模块获得,或从所述主题语义向量库中获得,或分别从所述义元处理模块和主题语义向量库中获得。
3.根据权利要求1所述的一种文档相关度计算***,其特征在于:
所述文档预处理模块用于将输入的、不同格式的文档转换为标准格式,并提取文档正文;
分词模块用于对所述文档预处理模块的输出进行分词,得到所述第一词汇表。
4.根据权利要求3所述的一种文档相关度计算***,其特征在于,所述义元处理模块包括:
义元标注模块,其用于使用义元词典对所述第二词汇表中的词汇进行义元标注,形成第三词汇表;
词义消歧模块,其用于确定所述第三词汇表中多义词所对应的多个义元的权重,或为多义词确定唯一义元,得到第一义元表;
主题语义向量计算模块,其用于对所述第一义元表中的所有义元计算权重,得到按权重排序的主题语义向量。
5.一种文档相关度计算方法,其特征在于,包括以下步骤:
(a),由文档预处理模块将输入的、不同格式的文档转换为标准格式,并提取文档正文内容;
(b),由分词模块对所述文档预处理模块的输出进行分词并对切分后的词汇进行词性标注,得到第一词汇表;由分词后处理模块对所述第一词汇表的词汇进行剔除其中的停用词、虚词处理得到第二词汇表;
(c),由义元处理模块对所述第二词汇表中的词汇进行义元标注,形成第三词汇表,并对所述第三词汇表中的词汇进行处理,确定其中多义词所对应的多个义元的权重或为多义词确定唯一义元以得到第一义元表,对所述第一义元表中的所有义元计算权重,得到按权重排序的主题语义向量;
(d),由文档相关度计算模块对待分析的至少两篇文档的主题语义向量进行计算,得到所述至少两篇文档的相关度。
6.根据权利要求5所述的一种文档相关度计算方法,其特征在于:步骤(d)中,所述至少两篇文档的主题语义向量从所述义元处理模块获得,或从与所述文档相关度计算模块连接的主题语义向量库中获得,或分别从所述义元处理模块和主题语义向量库中获得。
7.根据权利要求5所述的一种文档相关度计算方法,其特征在于,步骤(a)进一步包括:所述文档预处理模块获取对应文档类别信息和标题信息。
8.根据权利要求5所述的一种文档相关度计算方法,其特征在于,步骤(c)中,获得主题语义向量的方法是:
(c1),由义元标注模块使用义元词典对所述第二词汇表中的词汇进行义元标注,形成第三词汇表;
(c2),由词义消歧模块对所述第三词汇表中标注过义元的词汇进行处理,确定其中多义词所对应的多个义元的权重,或为多义词确定唯一义元,得到第一义元表;
(c3),由主题语义向量计算模块对所述第一义元表中的所有义元计算权重,得到按权重排序的主题语义向量。
CN2006100360943A 2006-06-19 2006-06-19 一种文档相关度计算***和方法 Active CN101079025B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2006100360943A CN101079025B (zh) 2006-06-19 2006-06-19 一种文档相关度计算***和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2006100360943A CN101079025B (zh) 2006-06-19 2006-06-19 一种文档相关度计算***和方法

Publications (2)

Publication Number Publication Date
CN101079025A CN101079025A (zh) 2007-11-28
CN101079025B true CN101079025B (zh) 2010-06-16

Family

ID=38906505

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006100360943A Active CN101079025B (zh) 2006-06-19 2006-06-19 一种文档相关度计算***和方法

Country Status (1)

Country Link
CN (1) CN101079025B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100114887A1 (en) * 2008-10-17 2010-05-06 Google Inc. Textual Disambiguation Using Social Connections
CN102073552B (zh) * 2009-11-19 2013-01-16 北大方正集团有限公司 一种数字资源包结构校验方法及***
CN101833582A (zh) * 2010-05-04 2010-09-15 吴毓杰 基于模板的词汇实体关联性挖掘方法与***
CN102609422A (zh) * 2011-01-25 2012-07-25 阿里巴巴集团控股有限公司 类目错放识别方法和装置
CN102867048B (zh) * 2012-09-08 2015-02-18 苏州大学 一种基于语义压缩的文档存储方法
CN103106192B (zh) * 2013-02-02 2016-02-03 深圳先进技术研究院 文学作品作者识别方法及装置
CN103092828B (zh) * 2013-02-06 2015-08-12 杭州电子科技大学 基于语义分析和语义关系网络的文本相似度度量方法
CN103246640B (zh) * 2013-04-23 2016-08-03 北京酷云互动科技有限公司 一种检测重复文本的方法及装置
CN103678287B (zh) * 2013-11-30 2016-12-07 语联网(武汉)信息技术有限公司 一种关键词翻译统一的方法
CN105528349B (zh) 2014-09-29 2019-02-01 华为技术有限公司 知识库中问句解析的方法及设备
CN105760363B (zh) * 2016-02-17 2019-12-13 腾讯科技(深圳)有限公司 文本文件的词义消歧方法及装置
CN105930435B (zh) * 2016-04-19 2019-02-12 北京深度时代科技有限公司 一种基于画像模型的对象识别方法
CN106372122B (zh) * 2016-08-23 2018-04-10 温州大学瓯江学院 一种基于维基语义匹配的文档分类方法及***
CN107832306A (zh) * 2017-11-28 2018-03-23 武汉大学 一种基于Doc2vec的相似实体挖掘方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5873056A (en) * 1993-10-12 1999-02-16 The Syracuse University Natural language processing system for semantic vector representation which accounts for lexical ambiguity
WO2001042984A1 (en) * 1999-12-08 2001-06-14 Roitblat Herbert L Process and system for retrieval of documents using context-relevant semantic profiles
CN1403957A (zh) * 2001-09-06 2003-03-19 联想(北京)有限公司 通过主题词矫正基于向量空间模型文本相似度计算的方法
CN1741012A (zh) * 2004-08-23 2006-03-01 富士施乐株式会社 文本检索装置及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5873056A (en) * 1993-10-12 1999-02-16 The Syracuse University Natural language processing system for semantic vector representation which accounts for lexical ambiguity
WO2001042984A1 (en) * 1999-12-08 2001-06-14 Roitblat Herbert L Process and system for retrieval of documents using context-relevant semantic profiles
CN1403957A (zh) * 2001-09-06 2003-03-19 联想(北京)有限公司 通过主题词矫正基于向量空间模型文本相似度计算的方法
CN1741012A (zh) * 2004-08-23 2006-03-01 富士施乐株式会社 文本检索装置及方法

Also Published As

Publication number Publication date
CN101079025A (zh) 2007-11-28

Similar Documents

Publication Publication Date Title
CN101079025B (zh) 一种文档相关度计算***和方法
CN101079024B (zh) 一种专业词表动态生成***和方法
US8131539B2 (en) Search-based word segmentation method and device for language without word boundary tag
CN109145260B (zh) 一种文本信息自动提取方法
CN109684642B (zh) 一种结合页面解析规则和nlp文本向量化的摘要提取方法
CN109829159A (zh) 一种古汉语文本的一体化自动词法分析方法及***
WO2017080090A1 (zh) 一种网页正文提取比对方法
CN101079031A (zh) 一种网页主题提取***和方法
CN103049435A (zh) 文本细粒度情感分析方法及装置
CN107168956B (zh) 一种基于管道的中文篇章结构分析方法及***
CN102622338A (zh) 一种短文本间语义距离的计算机辅助计算方法
CN113221559B (zh) 利用语义特征的科技创新领域中文关键短语抽取方法及***
CN102063424A (zh) 一种中文分词方法
CN112417854A (zh) 中文文档抽取式摘要方法
CN113312922B (zh) 一种改进的篇章级三元组信息抽取方法
CN111858933A (zh) 基于字符的层次化文本情感分析方法及***
CN111897917A (zh) 基于多模态自然语言特征的轨道交通行业术语提取方法
CN114495143A (zh) 一种文本对象识别方法、装置、电子设备及存储介质
CN114491062B (zh) 一种融合知识图谱和主题模型的短文本分类方法
CN114064901B (zh) 一种基于知识图谱词义消歧的书评文本分类方法
CN115618883A (zh) 一种业务语义识别方法及装置
Shanmugalingam et al. Language identification at word level in Sinhala-English code-mixed social media text
CN105574066A (zh) 网页正文提取比对方法及其***
CN114239579A (zh) 基于正则表达式和crf模型的电力可研文档提取方法及装置
CN111859887A (zh) 一种基于深度学习的科技新闻自动写作***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: SHENZHEN SHIJI LIGHT SPEED INFORMATION TECHNOLOGY

Free format text: FORMER OWNER: TENGXUN SCI-TECH (SHENZHEN) CO., LTD.

Effective date: 20131021

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20131021

Address after: 518057 Tencent Building, 16, Nanshan District hi tech park, Guangdong, Shenzhen

Patentee after: Shenzhen Shiji Guangsu Information Technology Co., Ltd.

Address before: 518057 Guangdong city of Shenzhen province high tech Park high-tech South Road Fiyta high-tech building 5-10

Patentee before: Tencent Technology (Shenzhen) Co., Ltd.