CN105630975A - 一种信息处理方法和电子设备 - Google Patents

一种信息处理方法和电子设备 Download PDF

Info

Publication number
CN105630975A
CN105630975A CN201510992322.3A CN201510992322A CN105630975A CN 105630975 A CN105630975 A CN 105630975A CN 201510992322 A CN201510992322 A CN 201510992322A CN 105630975 A CN105630975 A CN 105630975A
Authority
CN
China
Prior art keywords
software
descriptor
keyword
search
title
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510992322.3A
Other languages
English (en)
Other versions
CN105630975B (zh
Inventor
葛付江
赵凯
卢小东
卓雷
史晓斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201510992322.3A priority Critical patent/CN105630975B/zh
Publication of CN105630975A publication Critical patent/CN105630975A/zh
Application granted granted Critical
Publication of CN105630975B publication Critical patent/CN105630975B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种信息处理方法中,基于软件的名称,在搜索引擎中搜索得到关于该软件的描述信息集合,并依据预设的提取规则,继续对所述描述信息集合中的各个描述信息提取关键词;基于所述关键词,为所述软件进行分类,得到所述软件的所属类别。采用该方法,由于是基于软件名称搜索得到多个描述信息进行关键词提取,该描述信息中包含的信息与该软件名称相关且并未限制于该软件名称,则分类依据的内容不仅为该软件名称,而是多于该软件名称的信息,因此,基于该提取的关键词实现对软件进行的分类,准确度更高。

Description

一种信息处理方法和电子设备
技术领域
本发明涉及电子设备领域,更具体的说,是涉及一种信息处理方法和电子设备。
背景技术
随着电子技术的发展,各种软件被广泛开发,并应用于各个领域。
软件分类一般根据预先定义的类别把软件分为行业(建筑、政府、金融、教育、医疗、法律、房地产、物流、中介等),邮件、文档、操作***工具、电脑安全、下载、学习、聊天、视频、游戏、图片、音乐、理财等。
现有技术中,一般仅是基于软件名称对其进行分类,但由于软件名称较短,且很多软件是借用常用词汇或其它拟物形象命名的(比如Chrome是一个浏览器),导致分类的准确率低。
发明内容
有鉴于此,本发明提供了一种信息处理方法,解决了现有技术中,仅基于软件名称对其进行分类导致的准确率低的问题。
为实现上述目的,本发明提供如下技术方案:
一种信息处理方法,包括:
基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合;
依据预设的提取规则,对所述描述信息集合提取关键词;
基于所述关键词,对所述软件进行分类,得到所述软件的所属类别。
上述的方法,优选的,在所述基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合之后,所述依据预设的提取规则,对所述描述信息集合提取关键词之前,还包括:
依据预设的排序规则,对所述描述信息集合中的至少两个描述信息进行排序。
上述的方法,优选的,所述搜索引擎为至少两个,则所述基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合;依据预设的排序规则,对所述描述信息集合中的至少两个描述信息进行排序,包括:
基于待分类的软件名称,分别在至少两个搜索引擎中搜索,得到与搜索引擎对应的搜索结果,每个搜索引擎对应的搜索结果中包含有至少一个关于所述软件的描述信息;
汇集各个搜索引擎的搜索结果,得到关于所述软件的描述信息集合,所述描述信息集合中包含有至少两个描述信息;
分析所述描述信息与所述软件名称的相似度值;
依据所述描述信息的相似度值以及预设的排序方式,对所述描述信息集合中的至少两个描述信息进行排序。
上述的方法,优选的,基于所述关键词,为所述软件进行分类,得到所述软件的所属类别,包括:
基于所述关键词,分析得到与所述关键词对应的分类类别;
建立所述类别与所述描述信息之间的关联关系,实现为所述软件进行分类,得到所述软件的所属类别。
上述的方法,优选的,所述建立所述类别与所述描述信息之间的关联关系,包括:
基于所述至少两个描述信息排序的先后顺序,为所述描述信息对应的关键词赋予权重值;
基于所述描述信息对应的关键词权重值,分析得到所述类别与所述描述信息之间的关联关系值;
依据所述关联关系值,分别建立所述至少两个描述信息对应的软件与所述类别的关联关系。
上述的方法,优选的,在所述基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合之后,所述依据预设的提取规则,对所述描述信息集合提取关键词之前,还包括:
对所述描述信息集合中的至少两个描述信息进行过滤,得到满足预设的过滤条件的描述信息。
上述的方法,优选的,所述对所述描述信息集合中的至少两个描述信息进行过滤,包括:
获取所述描述信息中包含的初始关键词;
判断所述初始关键词是否大于预设第一阈值,得到第一判断结果;
基于所述第一判断结果表征所述初始关键词个数大于第一阈值,判定所述描述信息满足预设的过滤条件。
上述的方法,优选的,所述对所述描述信息集合中的至少两个描述信息进行过滤,包括:
获取所述描述信息中包含的初始关键词;
基于关键词与分类类别对应关系以及所述初始关键词,分析得到所述描述信息对应的分类个数;
判断所述分类个数是否小于预设第二阈值,得到第二判断结果;
基于所述第二判断结果表征所述分类个数小于预设第二阈值,判定所述描述信息满足预设的过滤条件。
一种电子设备,包括:
内存;
处理器,用于基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合;依据预设的提取规则,对所述描述信息集合提取关键词;并且,基于所述关键词,为所述软件进行分类,得到所述软件的所属类别。
上述的电子设备,优选的,所述处理器在所述基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合之后还用于:
依据预设的排序规则,对所述描述信息集合中的至少两个描述信息进行排序。
上述的电子设备,优选的,所述搜索引擎为至少两个时,
所述处理器基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合;依据预设的排序规则,对所述描述信息集合中的至少两个描述信息进行排序,具体包括:
基于待分类的软件名称,分别在至少两个搜索引擎中搜索,得到与搜索引擎对应的搜索结果,每个搜索引擎对应的搜索结果中包含有至少一个关于所述软件的描述信息;
汇集各个搜索引擎的搜索结果,得到关于所述软件的描述信息集合,所述描述信息集合中包含有至少两个描述信息;
分析所述描述信息与所述软件名称的相似度值;
依据所述描述信息的相似度值以及预设的排序方式,对所述描述信息集合中的至少两个描述信息进行排序。
一种电子设备,包括:
获取模块,用于基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合;
提取模块,用于依据预设的提取规则,对所述描述信息集合提取关键词;
分类模块,用于基于所述关键词,为所述软件进行分类,得到所述软件的所属类别。
经由上述的技术方案可知,与现有技术相比,本发明提供了一种信息处理方法,基于软件的名称,在搜索引擎中搜索得到关于该软件的描述信息集合,并依据预设的提取规则,继续对所述描述信息集合中的各个描述信息提取关键词;基于所述关键词,为所述软件进行分类,得到所述软件的所属类别。采用该方法,由于是基于软件名称搜索得到多个描述信息进行关键词提取,该描述信息中包含的信息与该软件名称相关且并未限制于该软件名称,则分类依据的内容不仅为该软件名称,而是多于该软件名称的信息,因此,基于该提取的关键词实现对软件进行的分类,准确度更高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明提供的一种信息处理方法实施例1的流程图;
图2为本发明提供的一种信息处理方法实施例2的流程图;
图3为本发明提供的一种信息处理方法实施例3的流程图;
图4为本发明提供的一种信息处理方法实施例4的流程图;
图5为本发明提供的一种信息处理方法实施例5的流程图;
图6为本发明提供的一种信息处理方法实施例6的流程图;
图7为本发明提供的一种信息处理方法实施例7的流程图;
图8为本发明提供的一种信息处理方法实施例8的流程图;
图9为本发明提供的一种电子设备实施例1的结构示意图;
图10为本发明提供的一种电子设备实施例2的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅附图1,为本发明提供的一种信息处理方法实施例1的流程图,该方法应用于一电子设备中,其中,该电子设备具体可以为台式机、笔记本、平板电脑、手机、智能电视、智能手表、穿戴式设备等形式的电子设备。
其中,该方法包括以下步骤:
步骤S101:基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合;
其中,该待分类的软件名称已知,在搜索引擎中对该软件的名称进行搜索,得到关于该软件的大量描述信息,该大量的描述信息组成了关于该软件的描述信息集合。
其中,该搜索引擎可以为一个或者多个。
具体实施中,为提高分类的精度,可采用多个搜索引擎进行搜索,为减少分类过程中搜索的数据量,可采用一个搜索引擎进行搜索。
步骤S102:依据预设的提取规则,对所述描述信息集合提取关键词;
其中,该电子设备中还预设有提取规则,基于该提取规则,能够对该描述信息集合中的各个描述信息的关键词进行提取。
需要说明的是,该描述信息包括信息名称和信息摘要,则该关键词可以为从描述信息的信息名称和/或信息摘要中提取得到的关键词。
步骤S103:基于所述关键词,对所述软件进行分类,得到所述软件的所属类别。
需要说明的是,依据现有的分类规则,不同的关键词对应不同的分类。
则,基于该关键字,能够对该软件进行分类,由于该软件可以具有多个关键字,则对该软件进行分类时,能够确定该软件所属类别可以为多个。
例如,某一软件所属的类别可以为游戏、军事等两个甚至多个类别。
综上,本实施例提供的一种信息处理方法中,基于软件的名称,在搜索引擎中搜索得到关于该软件的描述信息集合,并依据预设的提取规则,继续对所述描述信息集合中的各个描述信息提取关键词;基于所述关键词,为所述软件进行分类,得到所述软件的所属类别。采用该方法,由于是基于软件名称搜索得到多个描述信息进行关键词提取,该描述信息中包含的信息与该软件名称相关且并未限制于该软件名称,则分类依据的内容不仅为该软件名称,而是多于该软件名称的信息,因此,基于该提取的关键词实现对软件进行的分类,准确度更高。
请参阅附图2,为本发明提供的一种信息处理方法实施例2的流程图,该方法包括以下步骤:
步骤S201:基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合;
其中,步骤S201与实施例1中的步骤S101一致,本实施例中不做赘述。
步骤S202:依据预设的排序规则,对所述描述信息集合中的至少两个描述信息进行排序;
其中,该电子设备中预设有排序规则,基于该排序规则可实现对该描述信息集合中的各个描述信息进行排序。
需要说明的是,本申请中采用的为该描述信息与软件名称的相似度进行排序,后续实施例中会对该基于相似度进行排序的具体过程进行解释,本实施例中不做详述。
步骤S203:依据预设的提取规则,对所述描述信息集合提取关键词;
步骤S204:基于所述关键词,对所述软件进行分类,得到所述软件的所属类别。
其中,步骤S203-204与实施例1中的步骤S102-103一致,本实施例中不做赘述。
综上,本实施例提供的一种信息处理方法中,还包括:依据预设的排序规则,对所述描述信息集合中的至少两个描述信息进行排序。采用该方法,基于对描述信息集合中的多个描述信息进行排序的结果,对描述信息集合提取关键词。
其中,该搜索引擎可以为多个。
请参阅附图3,为本发明提供的一种信息处理方法实施例3的流程图,该方法包括以下步骤:
步骤S301:基于待分类的软件名称,分别在至少两个搜索引擎中搜索,得到与搜索引擎对应的搜索结果;
步骤S302:汇集各个搜索引擎的搜索结果,得到关于所述软件的描述信息集合;
其中,每个搜索引擎对应的搜索结果中包含有至少一个关于所述软件的描述信息。
需要说明的是,不同搜索引擎对应的搜索方式(搜索采用的算法)不同,则其搜索得到的描述信息也不完全相同。
具体的,可分别在不同的搜索引擎中,对该软件的名称进行搜索,并得到各个搜索引擎搜索得到的搜索结果,每个搜索引擎的搜索结构包含有至少一个描述信息,该描述信息与该软件相关。
其中,将各个搜索引擎搜索得到的搜索结果进行汇集,得到关于该软件的全部的描述信息集合,该描述信息集合中包含有至少两个描述信息。
步骤S303:分析所述描述信息与所述软件名称的相似度值;
其中,该描述信息包括信息名称和信息摘要。
具体的,基于该描述信息中的信息名称和信息摘要,分析与该软件名称的相似度。
具体实施中,可以分别采用欧氏距离算法计算得到该描述信息中的信息名称、信息摘要计算与该软件名称的相似度值。
具体的,对于两个n维向量X=(x1,x2,...,xi,...,xn)和Y=(y1,y2,...,yi,...,yn),其中,xi和yi都是实数域的值,即xi∈R,yi∈R,R是实数域。
则X和Y的欧式距离d的计算公式如下:
d ( X , Y ) = Σ i = 1 n ( x i - y i ) 2
d(X,Y)越大表示向量X和Y的距离越远,相似度越低。
作为一个具体示例,应用欧式距离计算两个文档D1和D2的方法如下:
设D1和D2中出现的所有不同词汇集合为W=(w1,w2,...,wi,...,wn),其中,wi为某一个词汇,则D1和D2可以分布其中出现的词汇的特征表示为F1和F2
F1=(f(w1,D1),f(w2,D1),...,f(wi,D1),...,f(wn,D1))
F2=(f(w1,D2),f(w2,D2),...,f(wi,D2),...,f(wn,D2))
其中,f(wi,Dj)表示词汇wi在文档Dj中的特征值,f(wi,Dj)常用的两种计算方法为:
1、词频:f(wi,Dj)为wi在文档Dj中的出现频率,记为f(wi,Dj)=tf(wi,Dj);
2、TF-IDF(TermFrequency-InverseDocumentFrequency):
f(wi,Dj)=tf(wi,Dj)×idf(wi);
其中,其中,D表示所有文档的集合,|D|表示所有文档集合中的文档数量,j:wi∈Dj表示在所有文档集合D中出现词汇wi的文档的个数。
其中,f(wi,Dj)取以上任意一种即可,则D1和D2的欧式距离为:
d ( D 1 , D 2 ) = Σ i = 1 n ( f ( w i , D 1 ) - f ( w i , D 2 ) ) 2
需要说明的是,由于描述信息集合中包含有多个描述信息,需要依次对该多个描述信息与该软件名称的相似度值进行计算。
步骤S304:依据所述描述信息的相似度值以及预设的排序方式,对所述描述信息集合中的至少两个描述信息进行排序;
其中,基于上述步骤计算得到的描述信息与该软件名称的相似度值,对该描述信息集合中的各个描述信息进行排序。
具体的,可以按照预设的排序方式,将该描述信息集合中的描述信息进行排序。
例如,可以采用相似度值从大到小的排序方式对该描述信息进行排序,则在后续步骤中,可基于该从前向后的顺序提取关键词;或者可以采用相似度值从小到大的排序方式对该描述信息进行排序,则在后续步骤中,可基于该从后向前的顺序提取关键词。
步骤S305:依据预设的提取规则,对所述描述信息集合提取关键词;
步骤S306:基于所述关键词,对所述软件进行分类,得到所述软件的所属类别。
其中,步骤S305-306与实施例2中的步骤S203-204一致,本实施例中不做赘述。
综上,本实施例提供的一种信息处理方法中,包括:基于待分类的软件名称,分别在至少两个搜索引擎中搜索,得到与搜索引擎对应的搜索结果,每个搜索引擎对应的搜索结果中包含有至少一个关于所述软件的描述信息;汇集各个搜索引擎的搜索结果,得到关于所述软件的描述信息集合,所述描述信息集合中包含有至少两个描述信息;分析所述描述信息与所述软件名称的相似度值;依据所述描述信息的相似度值以及预设的排序方式,对所述描述信息集合中的至少两个描述信息进行排序。采用该方法,基于各个搜索引擎搜索得到的多个描述信息组成的描述信息集合,分析得到各个描述信息与软件名称的相似度值,并基于相似度值进行排序,以为后续提取关键词做准备。
请参阅附图4,为本发明提供的一种信息处理方法实施例4的流程图,该方法包括以下步骤:
步骤S401:基于待分类的软件名称,分别在至少两个搜索引擎中搜索,得到与搜索引擎对应的搜索结果;
步骤S402:汇集各个搜索引擎的搜索结果,得到关于所述软件的描述信息集合,所述描述信息集合中包含有至少两个描述信息;
步骤S403:分析所述描述信息与所述软件名称的相似度值;
步骤S404:依据所述描述信息的相似度值以及预设的排序方式,对所述描述信息集合中的至少两个描述信息进行排序;
步骤S405:依据预设的提取规则,对所述描述信息集合提取关键词;
其中,步骤S401-406与实施例3中的步骤S301-306一致,本实施例中不做赘述。
步骤S406:基于所述关键词,分析得到与所述关键词对应的分类类别;
首先,需要说明的是,预设有关键词与分类类别之间的对应关系。
则,依据该对应关系,可分析查找到与该关键词对应的分类类别。
例如,关键词“游戏”对应的分类类别为游戏;关键词“战争”对应的分类类别为军事。
步骤S407:建立所述类别与所述描述信息之间的关联关系,实现为所述软件进行分类,得到所述软件的所属类别。
其中,由于该关键词是基于描述信息提取得到,则该基于该关键词确定的分类类别也与该描述信息具有关联关系。
具体的,建立该类别与描述信息之间的关联关系,使得该描述信息对应相应的类别,且该描述信息是与该软件相关,即建立软件与该类别之间的对应关系,则实现了为软件分类,该描述信息对应的类别就是该软件所属的类别。
综上,本实施例提供的一种信息处理方法中,该基于所述关键词,为所述软件进行分类,得到所述软件的所属类别,包括:基于所述关键词,分析得到与所述关键词对应的分类类别;建立所述类别与所述描述信息之间的关联关系,实现为所述软件进行分类,得到所述软件的所属类别。采用该方法,基于关键词确定描述信息对应的类别,进而实现了确定软件相应的类别,完成对该软件进行分类的过程。
请参阅附图5,为本发明提供的一种信息处理方法实施例5的流程图,该方法包括以下步骤:
步骤S501:基于待分类的软件名称,分别在至少两个搜索引擎中搜索,得到与搜索引擎对应的搜索结果;
步骤S502:汇集各个搜索引擎的搜索结果,得到关于所述软件的描述信息集合,所述描述信息集合中包含有至少两个描述信息;
步骤S503:分析所述描述信息与所述软件名称的相似度值;
步骤S504:依据所述描述信息的相似度值以及预设的排序方式,对所述描述信息集合中的至少两个描述信息进行排序;
步骤S505:依据预设的提取规则,对所述描述信息集合提取关键词;
步骤S506:基于所述关键词,分析得到与所述关键词对应的分类类别;
其中,步骤S501-506与实施例4中的步骤S401-406一致,本实施例中不做赘述。
步骤S507:基于所述至少两个描述信息排序的先后顺序,为所述描述信息对应的关键词赋予权重值;
其中,基于各个描述信息排序的先后顺序,为从该描述信息中获取的关键词赋予权重值。
其中,由于该描述信息的排序是基于该描述信息与软件名称的相似度值进行的,则相似度值越大的描述信息,其对应的关键词与软件名称的关联关系越大。
具体的,当该排序为依据相似度值从大到小进行排序时,则排序越靠前的描述信息中获取的关键词赋予越大的权重值;当该排序为依据相似度值从小到大进行排序时,排序越靠后的描述信息中获取的关键词赋予越大的权重值。
例如,描述信息依据相似度值从大到小依次为描述信息1、描述信息2和描述信息3;从该描述信息1中获取的关键词包括a、b、c,从描述信息2中获取的关键词包括a、c、e,从描述信息3中获取的关键词包括a、s、d。则可为描述信息1对应关键词赋值0.5,为描述信息2对应关键词赋值0.3,为描述信息1对应关键词赋值0.2。
步骤S508:基于所述描述信息对应的关键词权重值,分析得到所述类别与所述描述信息之间的关联关系值;
其中,基于每个描述信息对应的关键词的权重值,计算该描述信息与该关键词对应的类别之间的关联关系值。
需要说明的是,该关键词是由该描述信息中提取得到,则该类别与该描述信息之间的关联关系值与该描述信息的关键词的权重值成比例或者相同。
其中,该关联关系值表征了该描述信息与该类别之间的关联程度。
具体的,当该关联关系值较大时,表征了该描述信息与该类别之间的关联程度较高;当该关联关系值较小时,表征了该描述信息与该类别之间的关联程度较低。
步骤S509:依据所述关联关系值,分别建立所述至少两个描述信息对应的软件与所述类别的关联关系;
首先,该关联关系值表征了描述信息与类别之间的关联程度,而该描述信息与该软件之间相关,则基于该表征描述信息与类别之间的关联程度的关联关系值,可计算得到该软件与该类别之间的关联关系。
例如,描述信息依据相似度值从大到小依次为描述信息1、描述信息2和描述信息3;从该描述信息1中获取的关键词包括a、b、c,从描述信息2中获取的关键词包括a、c、e,从描述信息3中获取的关键词包括a、s、d。则可为描述信息1对应关键词赋值0.5,为描述信息2对应关键词赋值0.3,为描述信息1对应关键词赋值0.2。而关键词a对应的类别为A,关键词b对应的类别为B。
对于该类别A,该软件与该类别之间关联关系可以表示为:0.5+0.3+0.2=1;
对于该类别B,该软件与该类别之间关联关系可以表示为:0.5+0+0=0.5。
依次可计算得到其他类别与该软件之间的关联关系。
步骤S510:基于所述关联关系实现为所述软件进行分类,得到所述软件的所属类别。
其中,该至少两个描述信息与该类别具有关联关系,则可确定该软件与该类别之间也具有关联关系,即该软件属于该类别。
具体的,某一类别可以对应多个描述信息,则可基于该描述信息与类别的关联关系,确定该软件属于该类别。
需要说明的是,由于描述信息与类别之间具有关联关系值,则可以基于该关联关系值,分析得到各个与该软件相关的描述信息与某一类别之间的关联程度,该关联程度表征了该软件与该类别之间的关联程度。
进而,该软件基于其与类别之间的关联程度,可以确定与软件有关联的类别,并可基于该关联程度,为该软件所属的类别进行排序。
例如,该软件与类别A之间关联关系为1,该软件与类别B之间关联关系为0.5,则可依据该关联关系的数值进行排序。
综上,本实施例提供的一种信息处理方法中,该建立所述类别与所述描述信息之间的关联关系,包括:基于所述至少两个描述信息排序的先后顺序,为所述描述信息对应的关键词赋予权重值;基于所述描述信息对应的关键词权重值,分析得到所述类别与所述描述信息之间的关联关系值;依据所述关联关系值,分别建立所述至少两个描述信息对应的软件与所述类别的关联关系。采用该方法,将描述信息与类别之间的关联关系量化,计算得到描述信息与类别之间的关联关系值,进而基于该关联关系值确定相应的类别与软件之间的关系,实现为软件进行分类的过程。
请参阅附图6,为本发明提供的一种信息处理方法实施例6的流程图,该方法包括以下步骤:
步骤S601:基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合;
其中,步骤S601与实施例1中的步骤S101一致,本实施例中不做赘述。
步骤S602:对所述描述信息集合中的至少两个描述信息进行过滤,得到满足预设的过滤条件的描述信息;
其中,当搜索引擎对该软件的名称进行搜索时,能够得到海量的描述信息,为了减少分类过程中的数据处理量,需要对该海量的描述信息进行过滤。
需要说明的是,该过滤的具体过程在后续实施例中会做详细说明,本实施例中不做详述。
步骤S603:依据预设的提取规则,对所述描述信息集合提取关键词;
需要说明的是,步骤S603中的描述信息指的是该满足预设的过滤条件的描述信息。
步骤S604:基于所述关键词,对所述软件进行分类,得到所述软件的所属类别。
其中,步骤S603-604与实施例1中的步骤S102-103一致,本实施例中不做赘述。
综上,本实施例提供的一种信息处理方法中,还包括:对所述描述信息集合中的至少两个描述信息进行过滤,得到满足预设的过滤条件的描述信息。采用该方法,对搜索得到的海量的描述信息进行过滤,以减少分类过程中的数据处理量,降低电子设备的数据处理负担。
请参阅附图7,为本发明提供的一种信息处理方法实施例7的流程图,该方法包括以下步骤:
步骤S701:基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合;
其中,步骤S701与实施例6中的步骤S601一致,本实施例中不做赘述。
步骤S702:获取所述描述信息中包含的初始关键词;
其中,该描述信息中可以包括文档名称和文档摘要。
一般的,该初始关键词是该描述信息生成时,由编辑人员设置。即,直接对该描述信息进行读取,就可确定其中包含的初始关键词。
具体的,该描述信息中包含的初始关键词是从该文档名称和文档摘要获取得到,而不仅仅是从文档名称中获取。
步骤S703:判断所述初始关键词是否大于预设第一阈值,得到第一判断结果;
其中,该初始关键词表征了该描述信息中包含的信息量,初始关键词越多表征该描述信息中包含的信息量越多,否则越少。
为保证后续处理过程中依据的描述信息中具有足够的信息量,需要确定其包含有大于第一预设阈值的初始关键词,因此,基于所述第一判断结果表征所述初始关键词个数大于第一阈值,判定所述描述信息满足预设的过滤条件。
具体的,该第一预设阈值可以为软件名称中关键词个数的三分之一。
例如,该软件名称中有6个关键词a、b、c、d、e和f,描述信息4中包含的初始关键词有a、b、c,描述信息5中包含有初始关键词a、b、d,描述信息6中包含有初始关键词e,则可知该描述信息6中的初始关键词个数小于软件名称关键词的1/3,则该描述信息6不满足预设的过滤条件。
步骤S704:基于所述描述信息满足预设的过滤条件,依据预设的提取规则,对所述描述信息集合提取关键词;
步骤S705:基于所述关键词,对所述软件进行分类,得到所述软件的所属类别。
其中,步骤S704-705与实施例6中的步骤S603-604一致,本实施例中不做赘述。
综上,本实施例提供的一种信息处理方法中,该对所述描述信息集合中的至少两个描述信息进行过滤,包括:获取所述描述信息中包含的初始关键词;判断所述初始关键词是否大于预设第一阈值,得到第一判断结果;基于所述第一判断结果表征所述初始关键词个数大于第一阈值,判定所述描述信息满足预设的过滤条件。采用该方法,基于描述信息中包含的初始关键词大于预设第一阈值,判定该描述信息满足预设的过滤条件,以保证后续处理过程中依据的描述信息中具有足够的信息量。
请参阅附图8,为本发明提供的一种信息处理方法实施例8的流程图,该方法包括以下步骤:
步骤S801:基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合;
其中,步骤S801与实施例6中的步骤S601一致,本实施例中不做赘述。
步骤S802:获取所述描述信息中包含的初始关键词;
其中,该描述信息中可以包括文档名称和文档摘要。
一般的,该初始关键词是该描述信息生成时,由编辑人员设置。即,直接对该描述信息进行读取,就可确定其中包含的初始关键词。
具体的,该描述信息中包含的初始关键词是从该文档名称和文档摘要获取得到,而不仅仅是从文档名称中获取。
步骤S803:基于关键词与分类类别对应关系以及所述初始关键词,分析得到所述描述信息对应的分类个数;
其中,由于关键词与分类类别之间具有对应关系,则基于该初始关键词,确定该初始关键词对应的分类类别。
其中,由于一个描述信息中包含有多个初始关键词,则可确定该描述信息对应的多个分类类别。
步骤S804:判断所述分类个数是否小于预设第二阈值,得到第二判断结果;
需要说明的是,一般来讲,一个描述信息对应的类别为几个,如果对应的类别太多,则可初始关键词设置方式有问题,该描述信息中还有干扰因素,为减少后续处理难度,可忽略该描述信息。
具体的,基于所述第二判断结果表征所述分类个数小于预设第二阈值,判定所述描述信息满足预设的过滤条件。
具体的,该第二预设阈值一般取6,即不大于5个类别则认为分类正常,否则分类太多。
步骤S805:基于所述描述信息满足预设的过滤条件,依据预设的提取规则,对所述描述信息集合提取关键词;
步骤S806:基于所述关键词,对所述软件进行分类,得到所述软件的所属类别。
其中,步骤S805-806与实施例6中的步骤S603-604一致,本实施例中不做赘述。
综上,本实施例提供的一种信息处理方法中,该对所述描述信息集合中的至少两个描述信息进行过滤,包括:获取所述描述信息中包含的初始关键词;基于关键词与分类类别对应关系以及所述初始关键词,分析得到所述描述信息对应的分类个数;判断所述分类个数是否小于预设第二阈值,得到第二判断结果;基于所述第二判断结果表征所述分类个数小于预设第二阈值,判定所述描述信息满足预设的过滤条件。采用该方法,基于描述信息中包含的初始关键词对应分类小于预设第二阈值,判定该描述信息满足预设的过滤条件,以保证后续处理过程中依据的描述信息中不受干扰因素影响,减少信息处理难度。
上述本发明提供的实施例中详细描述了一种信息处理方法,对于本发明的方法可采用多种形式的装置实现,因此本发明还提供了一种应用该信息处理方法的电子设备,下面给出具体的实施例进行详细说明。
请参阅附图9,为本发明提供的一种电子设备实施例1的结构示意图,该电子设备具体可以为台式机、笔记本、平板电脑、手机、智能电视、智能手表、穿戴式设备等形式的电子设备。
其中,该电子设备可以包括以下部分:内存901和处理器902;
其中,处理器902,用于基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合;依据预设的提取规则,对所述描述信息集合提取关键词;并且,基于所述关键词,为所述软件进行分类,得到所述软件的所属类别。
其中,内存901用于存储各种内容,如预设提取规则、分类得到结果等。
优选的,处理器在所述基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合之后还用于:
依据预设的排序规则,对所述描述信息集合中的至少两个描述信息进行排序。
优选的,所述搜索引擎为至少两个时,
所述处理器基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合;依据预设的排序规则,对所述描述信息集合中的至少两个描述信息进行排序,具体包括:
基于待分类的软件名称,分别在至少两个搜索引擎中搜索,得到与搜索引擎对应的搜索结果,每个搜索引擎对应的搜索结果中包含有至少一个关于所述软件的描述信息;
汇集各个搜索引擎的搜索结果,得到关于所述软件的描述信息集合,所述描述信息集合中包含有至少两个描述信息;
分析所述描述信息与所述软件名称的相似度值;
依据所述描述信息的相似度值以及预设的排序方式,对所述描述信息集合中的至少两个描述信息进行排序。
优选的,处理器基于所述关键词,为所述软件进行分类,得到所述软件的所属类别,包括:
基于所述关键词,分析得到与所述关键词对应的分类类别;
建立所述类别与所述描述信息之间的关联关系,实现为所述软件进行分类,得到所述软件的所属类别。
优选的,处理器建立所述类别与所述描述信息之间的关联关系,包括:
基于所述至少两个描述信息排序的先后顺序,为所述描述信息对应的关键词赋予权重值;
基于所述描述信息对应的关键词权重值,分析得到所述类别与所述描述信息之间的关联关系值;
依据所述关联关系值,分别建立所述至少两个描述信息对应的软件与所述类别的关联关系。
优选的,处理器在所述基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合之后,所述依据预设的提取规则,对所述描述信息集合提取关键词之前,还用于:
对所述描述信息集合中的至少两个描述信息进行过滤,得到满足预设的过滤条件的描述信息。
优选的,处理器对所述描述信息集合中的至少两个描述信息进行过滤,包括:
获取所述描述信息中包含的初始关键词;
判断所述初始关键词是否大于预设第一阈值,得到第一判断结果;
基于所述第一判断结果表征所述初始关键词个数大于第一阈值,判定所述描述信息满足预设的过滤条件。
优选的,处理器对所述描述信息集合中的至少两个描述信息进行过滤,包括:
获取所述描述信息中包含的初始关键词;
基于关键词与分类类别对应关系以及所述初始关键词,分析得到所述描述信息对应的分类个数;
判断所述分类个数是否小于预设第二阈值,得到第二判断结果;
基于所述第二判断结果表征所述分类个数小于预设第二阈值,判定所述描述信息满足预设的过滤条件。
综上,本实施例提供的一种电子设备中,基于软件的名称,在搜索引擎中搜索得到关于该软件的描述信息集合,并依据预设的提取规则,继续对所述描述信息集合中的各个描述信息提取关键词;基于所述关键词,为所述软件进行分类,得到所述软件的所属类别。采用该电子设备,由于是基于软件名称搜索得到多个描述信息进行关键词提取,该描述信息中包含的信息与该软件名称相关且并未限制于该软件名称,则分类依据的内容不仅为该软件名称,而是多于该软件名称的信息,因此,基于该提取的关键词实现对软件进行的分类,准确度更高。
请参阅附图10,为本发明提供的一种电子设备实施例2的结构示意图,该电子设备具体可以为台式机、笔记本、平板电脑、手机、智能电视、智能手表、穿戴式设备等形式的电子设备。
其中,该电子设备可以包括以下部分:获取模块1001、提取模块1002和分类模块1003;
其中,获取模块1001,用于基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合;
其中,提取模块1002,用于依据预设的提取规则,对所述描述信息集合提取关键词;
其中,分类模块1003,用于基于所述关键词,为所述软件进行分类,得到所述软件的所属类别。
优选的,还包括:排序模块,用于依据预设的排序规则,对所述描述信息集合中的至少两个描述信息进行排序。
优选的,所述搜索引擎为至少两个,则所述获取模块基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合;所述排序模块依据预设的排序规则,对所述描述信息集合中的至少两个描述信息进行排序,具体包括:
基于待分类的软件名称,分别在至少两个搜索引擎中搜索,得到与搜索引擎对应的搜索结果,每个搜索引擎对应的搜索结果中包含有至少一个关于所述软件的描述信息;
汇集各个搜索引擎的搜索结果,得到关于所述软件的描述信息集合,所述描述信息集合中包含有至少两个描述信息;
分析所述描述信息与所述软件名称的相似度值;
依据所述描述信息的相似度值以及预设的排序方式,对所述描述信息集合中的至少两个描述信息进行排序。
优选的,所述基于所述关键词,为所述软件进行分类,得到所述软件的所属类别,包括:
基于所述关键词,分析得到与所述关键词对应的分类类别;
建立所述类别与所述描述信息之间的关联关系,实现为所述软件进行分类,得到所述软件的所属类别。
优选的,所述建立所述类别与所述描述信息之间的关联关系,包括:
基于所述至少两个描述信息排序的先后顺序,为所述描述信息对应的关键词赋予权重值;
基于所述描述信息对应的关键词权重值,分析得到所述类别与所述描述信息之间的关联关系值;
依据所述关联关系值,分别建立所述至少两个描述信息对应的软件与所述类别的关联关系。
优选的,还包括:
过滤模块,用于对所述描述信息集合中的至少两个描述信息进行过滤,得到满足预设的过滤条件的描述信息。
优选的,所述过滤模块,具体用于:
获取所述描述信息中包含的初始关键词;
判断所述初始关键词是否大于预设第一阈值,得到第一判断结果;
基于所述第一判断结果表征所述初始关键词个数大于第一阈值,判定所述描述信息满足预设的过滤条件。
优选的,所述过滤模块,具体用于:
获取所述描述信息中包含的初始关键词;
基于关键词与分类类别对应关系以及所述初始关键词,分析得到所述描述信息对应的分类个数;
判断所述分类个数是否小于预设第二阈值,得到第二判断结果;
基于所述第二判断结果表征所述分类个数小于预设第二阈值,判定所述描述信息满足预设的过滤条件。
综上,本实施例提供的一种电子设备中,基于软件的名称,在搜索引擎中搜索得到关于该软件的描述信息集合,并依据预设的提取规则,继续对所述描述信息集合中的各个描述信息提取关键词;基于所述关键词,为所述软件进行分类,得到所述软件的所属类别。采用该电子设备,由于是基于软件名称搜索得到多个描述信息进行关键词提取,该描述信息中包含的信息与该软件名称相关且并未限制于该软件名称,则分类依据的内容不仅为该软件名称,而是多于该软件名称的信息,因此,基于该提取的关键词实现对软件进行的分类,准确度更高。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例提供的装置而言,由于其与实施例提供的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所提供的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所提供的原理和新颖特点相一致的最宽的范围。

Claims (12)

1.一种信息处理方法,其特征在于,包括:
基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合;
依据预设的提取规则,对所述描述信息集合提取关键词;
基于所述关键词,对所述软件进行分类,得到所述软件的所属类别。
2.根据权利要求1所述的方法,其特征在于,在所述基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合之后,所述依据预设的提取规则,对所述描述信息集合提取关键词之前,还包括:
依据预设的排序规则,对所述描述信息集合中的至少两个描述信息进行排序。
3.根据权利要求2所述的方法,其特征在于,所述搜索引擎为至少两个,则所述基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合;依据预设的排序规则,对所述描述信息集合中的至少两个描述信息进行排序,包括:
基于待分类的软件名称,分别在至少两个搜索引擎中搜索,得到与搜索引擎对应的搜索结果,每个搜索引擎对应的搜索结果中包含有至少一个关于所述软件的描述信息;
汇集各个搜索引擎的搜索结果,得到关于所述软件的描述信息集合,所述描述信息集合中包含有至少两个描述信息;
分析所述描述信息与所述软件名称的相似度值;
依据所述描述信息的相似度值以及预设的排序方式,对所述描述信息集合中的至少两个描述信息进行排序。
4.根据权利要求3所述的方法,其特征在于,基于所述关键词,为所述软件进行分类,得到所述软件的所属类别,包括:
基于所述关键词,分析得到与所述关键词对应的分类类别;
建立所述类别与所述描述信息之间的关联关系,实现为所述软件进行分类,得到所述软件的所属类别。
5.根据权利要求4所述的方法,其特征在于,所述建立所述类别与所述描述信息之间的关联关系,包括:
基于所述至少两个描述信息排序的先后顺序,为所述描述信息对应的关键词赋予权重值;
基于所述描述信息对应的关键词权重值,分析得到所述类别与所述描述信息之间的关联关系值;
依据所述关联关系值,分别建立所述至少两个描述信息对应的软件与所述类别的关联关系。
6.根据权利要求1所述的方法,其特征在于,在所述基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合之后,所述依据预设的提取规则,对所述描述信息集合提取关键词之前,还包括:
对所述描述信息集合中的至少两个描述信息进行过滤,得到满足预设的过滤条件的描述信息。
7.根据权利要求6所述的方法,其特征在于,所述对所述描述信息集合中的至少两个描述信息进行过滤,包括:
获取所述描述信息中包含的初始关键词;
判断所述初始关键词是否大于预设第一阈值,得到第一判断结果;
基于所述第一判断结果表征所述初始关键词个数大于第一阈值,判定所述描述信息满足预设的过滤条件。
8.根据权利要求6所述的方法,其特征在于,所述对所述描述信息集合中的至少两个描述信息进行过滤,包括:
获取所述描述信息中包含的初始关键词;
基于关键词与分类类别对应关系以及所述初始关键词,分析得到所述描述信息对应的分类个数;
判断所述分类个数是否小于预设第二阈值,得到第二判断结果;
基于所述第二判断结果表征所述分类个数小于预设第二阈值,判定所述描述信息满足预设的过滤条件。
9.一种电子设备,其特征在于,包括:
内存;
处理器,用于基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合;依据预设的提取规则,对所述描述信息集合提取关键词;并且,基于所述关键词,为所述软件进行分类,得到所述软件的所属类别。
10.根据权利要求9所述的电子设备,其特征在于,所述处理器在所述基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合之后还用于:
依据预设的排序规则,对所述描述信息集合中的至少两个描述信息进行排序。
11.根据权利要求10所述的电子设备,其特征在于,所述搜索引擎为至少两个时,
所述处理器基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合;依据预设的排序规则,对所述描述信息集合中的至少两个描述信息进行排序,具体包括:
基于待分类的软件名称,分别在至少两个搜索引擎中搜索,得到与搜索引擎对应的搜索结果,每个搜索引擎对应的搜索结果中包含有至少一个关于所述软件的描述信息;
汇集各个搜索引擎的搜索结果,得到关于所述软件的描述信息集合,所述描述信息集合中包含有至少两个描述信息;
分析所述描述信息与所述软件名称的相似度值;
依据所述描述信息的相似度值以及预设的排序方式,对所述描述信息集合中的至少两个描述信息进行排序。
12.一种电子设备,其特征在于,包括:
获取模块,用于基于软件的名称,在搜索引擎中搜索得到关于所述软件的描述信息集合;
提取模块,用于依据预设的提取规则,对所述描述信息集合提取关键词;
分类模块,用于基于所述关键词,为所述软件进行分类,得到所述软件的所属类别。
CN201510992322.3A 2015-12-24 2015-12-24 一种信息处理方法和电子设备 Active CN105630975B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510992322.3A CN105630975B (zh) 2015-12-24 2015-12-24 一种信息处理方法和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510992322.3A CN105630975B (zh) 2015-12-24 2015-12-24 一种信息处理方法和电子设备

Publications (2)

Publication Number Publication Date
CN105630975A true CN105630975A (zh) 2016-06-01
CN105630975B CN105630975B (zh) 2020-10-27

Family

ID=56045908

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510992322.3A Active CN105630975B (zh) 2015-12-24 2015-12-24 一种信息处理方法和电子设备

Country Status (1)

Country Link
CN (1) CN105630975B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107861753A (zh) * 2017-06-26 2018-03-30 平安普惠企业管理有限公司 App生成索引、检索方法和***及可读存储介质
CN108090090A (zh) * 2016-11-23 2018-05-29 北京国双科技有限公司 栏目分类方法和装置
CN108255522A (zh) * 2016-12-27 2018-07-06 北京金山云网络技术有限公司 一种应用程序分类方法及装置
CN109753427A (zh) * 2018-12-04 2019-05-14 国网山东省电力公司无棣县供电公司 一种发供电测试单元辨析***
CN110941714A (zh) * 2018-09-21 2020-03-31 武汉安天信息技术有限责任公司 分类规则库构建方法、应用分类方法及装置
CN112579476A (zh) * 2021-02-23 2021-03-30 北京北大软件工程股份有限公司 一种漏洞和软件对齐的方法、装置以及存储介质
WO2021212879A1 (zh) * 2020-04-22 2021-10-28 深圳传音控股股份有限公司 快捷搜索方法、终端及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1324044A (zh) * 2000-05-11 2001-11-28 贵州东方世纪科技有限责任公司 国际互联网上提供搜索服务的方法及所用的服务器
CN101340463A (zh) * 2008-08-22 2009-01-07 深圳市迅雷网络技术有限公司 一种确定网络资源类型的方法和装置
CN102081601A (zh) * 2009-11-27 2011-06-01 北京金山软件有限公司 一种领域词识别方法和装置
CN102135992A (zh) * 2011-03-15 2011-07-27 宇龙计算机通信科技(深圳)有限公司 终端应用程序的归类方法和终端
CN103577252A (zh) * 2012-07-26 2014-02-12 腾讯科技(深圳)有限公司 一种软件分类的方法及装置
CN103984685A (zh) * 2013-02-07 2014-08-13 百度国际科技(深圳)有限公司 一种用于对待分类词条进行分类的方法、装置与设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1324044A (zh) * 2000-05-11 2001-11-28 贵州东方世纪科技有限责任公司 国际互联网上提供搜索服务的方法及所用的服务器
CN101340463A (zh) * 2008-08-22 2009-01-07 深圳市迅雷网络技术有限公司 一种确定网络资源类型的方法和装置
CN102081601A (zh) * 2009-11-27 2011-06-01 北京金山软件有限公司 一种领域词识别方法和装置
CN102135992A (zh) * 2011-03-15 2011-07-27 宇龙计算机通信科技(深圳)有限公司 终端应用程序的归类方法和终端
CN103577252A (zh) * 2012-07-26 2014-02-12 腾讯科技(深圳)有限公司 一种软件分类的方法及装置
CN103984685A (zh) * 2013-02-07 2014-08-13 百度国际科技(深圳)有限公司 一种用于对待分类词条进行分类的方法、装置与设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108090090A (zh) * 2016-11-23 2018-05-29 北京国双科技有限公司 栏目分类方法和装置
CN108255522A (zh) * 2016-12-27 2018-07-06 北京金山云网络技术有限公司 一种应用程序分类方法及装置
CN107861753A (zh) * 2017-06-26 2018-03-30 平安普惠企业管理有限公司 App生成索引、检索方法和***及可读存储介质
CN110941714A (zh) * 2018-09-21 2020-03-31 武汉安天信息技术有限责任公司 分类规则库构建方法、应用分类方法及装置
CN109753427A (zh) * 2018-12-04 2019-05-14 国网山东省电力公司无棣县供电公司 一种发供电测试单元辨析***
WO2021212879A1 (zh) * 2020-04-22 2021-10-28 深圳传音控股股份有限公司 快捷搜索方法、终端及存储介质
CN112579476A (zh) * 2021-02-23 2021-03-30 北京北大软件工程股份有限公司 一种漏洞和软件对齐的方法、装置以及存储介质

Also Published As

Publication number Publication date
CN105630975B (zh) 2020-10-27

Similar Documents

Publication Publication Date Title
CN105630975A (zh) 一种信息处理方法和电子设备
CN109815314B (zh) 一种意图识别方法、识别设备及计算机可读存储介质
CN106649818B (zh) 应用搜索意图的识别方法、装置、应用搜索方法和服务器
CN108509482B (zh) 问题分类方法、装置、计算机设备和存储介质
US11176124B2 (en) Managing a search
CN111291210B (zh) 图像素材库生成方法、图像素材推荐方法及相关装置
US20160140187A1 (en) System and method for answering natural language question
CN110472027B (zh) 意图识别方法、设备及计算机可读存储介质
CN108563773B (zh) 基于知识图谱的法律条文精准搜索排序方法
CN106599054B (zh) 一种题目分类及推送的方法及***
CN106651696B (zh) 一种近似题推送方法及***
CN102737039B (zh) 索引建立方法、搜索方法和搜索结果排序方法及对应装置
Aytar et al. Utilizing semantic word similarity measures for video retrieval
CN105005564A (zh) 一种基于问答平台的数据处理方法和装置
CN108334610A (zh) 一种新闻文本分类方法、装置及服务器
CN106156372B (zh) 一种互联网网站的分类方法及装置
CN105893533A (zh) 一种文本匹配方法及装置
CN111797239A (zh) 应用程序的分类方法、装置及终端设备
CN108446295B (zh) 信息检索方法、装置、计算机设备和存储介质
CN108038099B (zh) 基于词聚类的低频关键词识别方法
CN102890700A (zh) 一种基于体育比赛视频的相似视频片段检索方法
CN105824862A (zh) 一种基于电子设备的图片分类方法及电子设备
CN103092966A (zh) 一种挖掘词汇的方法及装置
CN110750995A (zh) 一种基于自定义图谱的文件管理方法
CN110633407A (zh) 信息检索方法、装置、设备及计算机可读介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant