CN109558508B - 数据挖掘方法、装置、计算机设备及存储介质 - Google Patents

数据挖掘方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN109558508B
CN109558508B CN201811227320.5A CN201811227320A CN109558508B CN 109558508 B CN109558508 B CN 109558508B CN 201811227320 A CN201811227320 A CN 201811227320A CN 109558508 B CN109558508 B CN 109558508B
Authority
CN
China
Prior art keywords
user
data
mining
pictures
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811227320.5A
Other languages
English (en)
Other versions
CN109558508A (zh
Inventor
齐慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201811227320.5A priority Critical patent/CN109558508B/zh
Publication of CN109558508A publication Critical patent/CN109558508A/zh
Application granted granted Critical
Publication of CN109558508B publication Critical patent/CN109558508B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了数据挖掘方法、装置、计算机设备及存储介质,其中方法包括:将数据集中的数据分类保存,并将分类结果通过数据页展示给用户;当接收到用户针对所展示的任一分类的数据挖掘请求时,按照用户选定的挖掘方式进行数据挖掘,并根据挖掘结果向该分类中补充数据。应用本发明所述方案,能够提升挖掘效率等。

Description

数据挖掘方法、装置、计算机设备及存储介质
【技术领域】
本发明涉及计算机应用技术,特别涉及数据挖掘方法、装置、计算机设备及存储介质。
【背景技术】
目前,用户可基于收集到的大量数据来进行相关模型的训练,所述数据可为图片等。
当需要进行数据集更新时,如需要增加图片时,通常采用以下处理方式:人工进行图片搜索,并从搜索到的图片中选出符合要求的图片,补充到数据集中。
上述方式中,由于需要依赖于人的手工操作,因此效率低下,而且会耗费大量的人力成本等。
【发明内容】
有鉴于此,本发明提供了数据挖掘方法、装置、计算机设备及存储介质。
具体技术方案如下:
一种数据挖掘方法,包括:
将数据集中的数据分类保存,并将分类结果通过数据页展示给用户;
当接收到用户针对所展示的任一分类的数据挖掘请求时,按照用户选定的挖掘方式进行数据挖掘,并根据挖掘结果向所述分类中补充数据。
根据本发明一优选实施例,该方法进一步包括:当接收到用户的上传数据集请求时,获取用户上传的数据,将上传的数据补充到已有的分类中,和/或,补充到新建的分类中。
根据本发明一优选实施例,该方法进一步包括:当接收用户针对任一分类的数据上传请求时,获取用户上传的数据,将上传的数据补充到所述分类中。
根据本发明一优选实施例,该方法进一步包括以下之一或全部:
当接收到用户针对任一分类的预览请求时,将所述分类中的数据展示给用户;
获取并保存用户对所展示的数据所作的编辑。
根据本发明一优选实施例,所述数据为图片,所述按照用户选定的挖掘方式进行数据挖掘包括以下之一或全部:
按照用户选定的文本标签进行数据挖掘;
按照用户选定的图片进行数据挖掘。
根据本发明一优选实施例,所述按照用户选定的文本标签进行数据挖掘包括:
为用户展示所述分类下的文本标签列表,按照用户从所述文本标签列表中选定的文本标签进行图片搜索,将搜索到的图片作为挖掘结果。
根据本发明一优选实施例,该方法进一步包括以下之一或全部:
在为用户展示所述分类下的文本标签列表之后,若接收到用户的编辑请求,则获取并保存用户针对所述文本标签列表进行的编辑操作;
在为用户展示所述分类下的文本标签列表之后,若接收到用户的添加请求,则获取并保存用户针对所述文本标签列表进行的添加操作。
根据本发明一优选实施例,所述获取并保存用户针对所述文本标签列表进行的添加操作包括以下之一或全部:
获取用户输入的文本标签,将用户输入的文本标签添加到所述文本标签列表中;
确定用户从所述分类中的图片中选定的图片,通过对选定的图片进行图片猜词,得到选定的图片对应的文本标签,获取用户从得到的文本标签中选定的文本标签,将选定的文本标签添加到所述文本标签列表中。
根据本发明一优选实施例,所述按照用户选定的图片进行数据挖掘包括:
确定用户从所述分类中的图片中选定的图片;
按照选定的图片进行图片搜索,将搜索到的图片作为挖掘结果。
根据本发明一优选实施例,所述根据挖掘结果向所述分类中补充数据包括:
将用户从所述挖掘结果中选定的数据补充到所述分类中。
一种数据挖掘装置,包括:第一处理单元以及第二处理单元;
所述第一处理单元,用于将数据集中的数据分类保存,并将分类结果通过数据页展示给用户;
所述第二处理单元,用于当接收到用户针对所展示的任一分类的数据挖掘请求时,按照用户选定的挖掘方式进行数据挖掘,并根据挖掘结果向所述分类中补充数据。
根据本发明一优选实施例,所述第二处理单元进一步用于,当接收到用户的上传数据集请求时,获取用户上传的数据,将上传的数据补充到已有的分类中,和/或,补充到新建的分类中。
根据本发明一优选实施例,所述第二处理单元进一步用于,当接收用户针对任一分类的数据上传请求时,获取用户上传的数据,将上传的数据补充到所述分类中。
根据本发明一优选实施例,所述第二处理单元进一步用于执行以下操作之一或全部:
当接收到用户针对任一分类的预览请求时,将所述分类中的数据展示给用户;
获取并保存用户对所展示的数据所作的编辑。
根据本发明一优选实施例,所述数据为图片,所述第二处理单元按照用户选定的挖掘方式进行数据挖掘包括以下之一或全部:
按照用户选定的文本标签进行数据挖掘;
按照用户选定的图片进行数据挖掘。
根据本发明一优选实施例,所述第二处理单元为用户展示所述分类下的文本标签列表,按照用户从所述文本标签列表中选定的文本标签进行图片搜索,将搜索到的图片作为挖掘结果。
根据本发明一优选实施例,所述第二处理单元进一步用于执行以下操作之一或全部:
在为用户展示所述分类下的文本标签列表之后,若接收到用户的编辑请求,则获取并保存用户针对所述文本标签列表进行的编辑操作;
在为用户展示所述分类下的文本标签列表之后,若接收到用户的添加请求,则获取并保存用户针对所述文本标签列表进行的添加操作。
根据本发明一优选实施例,所述第二处理单元获取并保存用户针对所述文本标签列表进行的添加操作包括以下之一或全部:
获取用户输入的文本标签,将用户输入的文本标签添加到所述文本标签列表中;
确定用户从所述分类中的图片中选定的图片,通过对选定的图片进行图片猜词,得到选定的图片对应的文本标签,获取用户从得到的文本标签中选定的文本标签,将选定的文本标签添加到所述文本标签列表中。
根据本发明一优选实施例,所述第二处理单元确定用户从所述分类中的图片中选定的图片,按照选定的图片进行图片搜索,将搜索到的图片作为挖掘结果。
根据本发明一优选实施例,所述第二处理单元将用户从所述挖掘结果中选定的数据补充到所述分类中。
一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如以上所述的方法。
一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如以上所述的方法。
基于上述介绍可以看出,采用本发明所述方案,可将数据集中的数据分类保存,并可将分类结果通过数据页展示给用户,当接收到用户针对所展示的任一分类的数据挖掘请求时,可按照用户选定的挖掘方式自动地进行数据挖掘,进而可根据挖掘结果向该分类中补充数据,相比于人工手工操作的挖掘方式,本发明所述方案中可显著的节省人力成本,并提升了挖掘效率,而且可将挖掘到的数据自动地补充到相应的分类下,从而更加方便对数据进行管理和维护等。
【附图说明】
图1为本发明所述数据挖掘方法实施例的流程图。
图2为本发明所述数据页的第一示意图。
图3为本发明所述数据页的第二示意图。
图4为本发明所述上传数据集页面的示意图。
图5为本发明所述数据上传页面的示意图。
图6为本发明所述数据挖掘页面的示意图。
图7为本发明所述文本标签添加页面的示意图。
图8为本发明所述在结果框中显示挖掘结果的示意图。
图9为本发明所述数据挖掘装置实施例的组成结构示意图。
图10示出了适于用来实现本发明实施方式的示例性计算机***/服务器12的框图。
【具体实施方式】
为了使本发明的技术方案更加清楚、明白,以下参照附图并举实施例,对本发明所述方案进行进一步说明。
显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本文中出现的术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1为本发明所述数据挖掘方法实施例的流程图。如图1所示,包括以下具体实现方式。
在101中,将数据集中的数据分类保存,并将分类结果通过数据页展示给用户。
在102中,当接收到用户针对所展示的任一分类的数据挖掘请求时,按照用户选定的挖掘方式进行数据挖掘,并根据挖掘结果向该分类中补充数据。
本实施例中,可将当前版本的数据集中的数据分类保存,并可细化分类。比如,对于“鸟”类,可细化为“喜鹊”、“杜鹃”等类别。
所述数据可为任意形式的数据,优选地,所述数据为图片。以下即以图片为例,对本实施例所述方案进行说明。
可将分类结果通过数据页展示给用户。数据页中除了包含分类结果之外,还可进一步包含其它信息。如图2所示,图2为本发明所述数据页的第一示意图,其中可展示有分类结果,如不同分类以及不同分类下的图片数量,并可进一步展示有“数据上传”、“数据挖掘”、“预览”、“上传数据集”、“保存数据”等按钮,数据完成保存后可直接发起训练。
如图2所示,用户还可查看历史版本的数据页,从而呈现出图3所示的另一数据页,图3为本发明所述数据页的第二示意图,如图3所示,通过该数据页,可以查看之前使用过的各数据集版本,数据集在版本迭代的过程中可能会有数量的变化、种类的变化、图片质量的变化等,可针对历史版本的数据集重新发起训练等。
对于图2所示的当前版本的数据页,当接收到用户的上传数据集请求时,可获取用户上传的数据,并可根据上传的数据的命名方式等,将上传的数据补充到已有的分类中,和/或,补充到新建的分类中。
如当确定用户点击图2所示的“上传数据集”按钮时,可为用户呈现出图4所示页面,图4为本发明所述上传数据集页面的示意图,用户可采用链接或压缩包等形式上传图片,并需要按照预定的格式如命名方式等上传图片,这样,对于上传的图片,可根据其命名方式等,确定出所属的分类,并补充到相应的分类中,如果没有相应的分类,可新建相应的分类,并补充到新建的分类中等。
对于图2所示的当前版本的数据页,当接收用户针对任一分类的数据上传请求时,可获取用户上传的数据,并将上传的数据补充到该分类中。
如当确定用户点击图2所示的“数据上传”按钮时,可为用户呈现出图5所示的页面,图5为本发明所述数据上传页面的示意图,用户可按照要求上传如本地的图片,从而将上传的图片补充到“燕子“分类中。
对于图2所示的当前版本的数据页,当接收到用户针对任一分类的预览请求时,可将该分类中的数据展示给用户。
针对任一分类,如当确定用户点击图2所示的该分类后的“预览”按钮时,可将该分类下的图片展示给用户,供用户进行预览。
进一步地,还可获取并保存用户对所展示的数据所作的编辑,比如,用户可以选中所展示的部分图片,并执行删除操作等。
对于图2所示的当前版本的数据页,当接收到用户针对所展示的任一分类的数据挖掘请求时,可按照用户选定的挖掘方式进行数据挖掘,并可根据挖掘结果向该分类中补充数据。
如当确定用户点击图2所示的“数据挖掘”按钮时,可为用户呈现出图6所示页面,图6为本发明所述数据挖掘页面的示意图,可按照用户选定的挖掘方式进行数据挖掘,如按照用户选定的文本标签(即图中所示的关键词)进行数据挖掘,和/或,按照用户选定的图片进行数据挖掘,即可采用以文搜图(即图中所示的关键词搜图)的方式,也可以采用以图搜图的方式,以下分别对这两种方式进行说明。
1)以文搜图
如图6所示,当接收到用户针对所展示的“燕子”分类的数据挖掘请求时,可为用户展示该分类下的文本标签列表,其中包括“燕子****”等文本标签,用户可直接选定其中的某一个或多个文本标签,进而可根据用户选定的文本标签进行图片搜索,将搜索到的图片作为挖掘结果。
另外,用户还可对所展示的文本标签列表进行编辑和/或添加操作,如分别点击图6所示的“编辑”和“添加”按钮。相应地,在为用户展示该分类下的文本标签列表之后,若接收到用户的编辑请求,可获取并保存用户针对文本标签列表进行的编辑操作,和/或,在为用户展示该分类下的文本标签列表之后,若接收到用户的添加请求,可获取并保存用户针对文本标签列表进行的添加操作。
其中,对文本标签列表进行的编辑操作可以包括删除文本标签、修改文本标签内容等。
对文本标签列表进行的添加操作可以包括:获取用户输入的文本标签,将用户输入的文本标签添加到文本标签列表中,和/或,确定用户从该分类中的图片中选定的图片,通过对选定的图片进行图片猜词,得到选定的图片对应的文本标签,获取用户从得到的文本标签中选定的文本标签,将选定的文本标签添加到文本标签列表中。
当确定用户点击“添加”按钮之后,可为用户呈现出图7所示页面,图7为本发明所述文本标签添加页面的示意图,如图7所示,可直接获取用户在输入框中输入的文本标签,将用户输入的文本标签添加到文本标签列表中,和/或,当确定用户点击“图片猜词”按钮之后,将“燕子”分类下的图片展示给用户,并确定出用户选定的图片,可以是一张,也可以是多张,进而可利用现有的图片猜词技术,分别生成用户选定的每张图片对应的文本标签,进而可获取用户从生成的文本标签中选定的文本标签,将选定的文本标签添加到文本标签列表中。
用户可从文本标签列表中选定一个或多个文本标签,进而可根据选定的文本标签进行图片搜索,如可从网络上进行搜索,将搜索到的图片作为挖掘结果,并显示在结果框中,如图8所示,图8为本发明所述在结果框中显示挖掘结果的示意图。用户可通过观察判断等,从挖掘结果中选定符合要求的图片,作为正样本添加到“燕子”分类中,对于不符合要求的图片,可添加到负样本中。比如,挖掘结果中共包括12张图片,其中10张为燕子图片,另外2张为企鹅图片,那么可将10张燕子图片作为正样本,将2张企鹅图片作为负样本。
2)以图搜图
该方式中,可以按照用户选定的图片按照以图搜图的方式进行数据挖掘。
当确定用户点击图6所示“添加图片”按钮之后,可将“燕子”分类下的图片展示给用户,并获取用户从所展示的图片中选定的图片,进而可按照选定的图片进行图片搜索,如可从网络上进行搜索,将搜索到的图片作为挖掘结果,并显示在结果框中,用户可通过观察判断等,从挖掘结果中选定符合要求的图片,作为正样本添加到“燕子”分类中,对于不符合要求的图片,可添加到负样本中。
需要说明的是,对于前述的方法实施例,为了简单描述,将其表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
总之,采用本发明方法实施例所述方案,可按照用户选定的挖掘方式自动地进行数据挖掘,并可根据挖掘结果向相应分类中补充数据,相比于人工手工操作的挖掘方式,本发明方法实施例所述方案可显著的节省人力成本,并提升了挖掘效率,而且可将挖掘到的数据自动地补充到相应的分类下,从而更加方便对数据进行管理和维护等,另外,本发明方法实施例中所述的数据挖掘过程灵活可控,可以采用以文搜图的方式,也可以采用以图搜图的方式,并可同时扩展数据的标签和内容等。
以上是关于方法实施例的介绍,以下通过装置实施例,对本发明所述方案进行进一步说明。
图9为本发明所述数据挖掘装置实施例的组成结构示意图。如图9所示,包括:第一处理单元901以及第二处理单元902。
第一处理单元901,用于将数据集中的数据分类保存,并将分类结果通过数据页展示给用户。
第二处理单元902,用于当接收到用户针对所展示的任一分类的数据挖掘请求时,按照用户选定的挖掘方式进行数据挖掘,并根据挖掘结果向该分类中补充数据。
本实施例中,可将当前版本的数据集中的数据分类保存,并可细化分类。比如,对于“鸟”类,可细化为“喜鹊”、“杜鹃”等类别。
第一处理单元901可将分类结果通过数据页展示给用户。数据页中除了包含分类结果之外,还可进一步包含其它信息,如图2所示。
用户还可查看历史版本的数据页,如图3所示,通过该数据页,可以查看之前使用过的各数据集版本,数据集在版本迭代的过程中可能会有数量的变化、种类的变化、图片质量的变化等,可针对历史版本的数据集重新发起训练等。
第二处理单元902可在接收到用户的上传数据集请求时,获取用户上传的数据,将上传的数据补充到已有的分类中,和/或,补充到新建的分类中。
第二处理单元902还可在接收用户针对任一分类的数据上传请求时,获取用户上传的数据,将上传的数据补充到该分类中。
另外,第二处理单元902还可进一步执行以下操作之一或全部:当接收到用户针对任一分类的预览请求时,将该分类中的数据展示给用户;获取并保存用户对所展示的数据的所作的编辑。
优选地,所述数据为图片,第二处理单元902按照用户选定的挖掘方式进行数据挖掘可包括以下之一或全部:按照用户选定的文本标签进行数据挖掘;按照用户选定的图片进行数据挖掘。
其中,在按照用户选定的文本标签进行数据挖掘时,第二处理单元902可为用户展示该分类下的文本标签列表,并按照用户从文本标签列表中选定的文本标签进行图片搜索,将搜索到的图片作为挖掘结果。
第二处理单元902还可进一步执行以下操作之一或全部:在为用户展示该分类下的文本标签列表之后,若接收到用户的编辑请求,则获取并保存用户针对文本标签列表进行的编辑操作;在为用户展示该分类下的文本标签列表之后,若接收到用户的添加请求,则获取并保存用户针对文本标签列表进行的添加操作。
第二处理单元902获取并保存用户针对文本标签列表进行的添加操作可包括以下之一或全部:获取用户输入的文本标签,将用户输入的文本标签添加到文本标签列表中;确定用户从该分类中的图片中选定的图片,通过对选定的图片进行图片猜词,得到选定的图片对应的文本标签,获取用户从得到的文本标签中选定的文本标签,将选定的文本标签添加到文本标签列表中。
在按照用户选定的图片进行数据挖掘时,第二处理单元902可首先确定用户从该分类中的图片中选定的图片,进而可按照选定的图片进行图片搜索,将搜索到的图片作为挖掘结果。
后续,第二处理单元902可将用户从挖掘结果中选定的数据即图片补充到相应分类中。
图9所示装置实施例的具体工作流程请参照前述方法实施例中的相关说明,不再赘述。
总之,采用本发明装置实施例所述方案,可按照用户选定的挖掘方式自动地进行数据挖掘,并可根据挖掘结果向相应分类中补充数据,相比于人工手工操作的挖掘方式,本发明装置实施例所述方案可显著的节省人力成本,并提升了挖掘效率,而且可将挖掘到的数据自动地补充到相应的分类下,从而更加方便对数据进行管理和维护等,另外,本发明装置实施例中所述的数据挖掘过程灵活可控,可以采用以文搜图的方式,也可以采用以图搜图的方式,并可同时扩展数据的标签和内容等。
图10示出了适于用来实现本发明实施方式的示例性计算机***/服务器12的框图。图10显示的计算机***/服务器12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图10所示,计算机***/服务器12以通用计算设备的形式表现。计算机***/服务器12的组件可以包括但不限于:一个或者多个处理器(处理单元)16,存储器28,连接不同***组件(包括存储器28和处理器16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及***组件互连(PCI)总线。
计算机***/服务器12典型地包括多种计算机***可读介质。这些介质可以是任何能够被计算机***/服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机***/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***34可以用于读写不可移动的、非易失性磁介质(图10未显示,通常称为“硬盘驱动器”)。尽管图10中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机***/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机***/服务器12交互的设备通信,和/或与使得该计算机***/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机***/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图10所示,网络适配器20通过总线18与计算机***/服务器12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机***/服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
处理器16通过运行存储在存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现图1所示实施例中的方法。
本发明同时公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时将实现如图1所示实施例中的方法。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法等,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (20)

1.一种数据挖掘方法,其特征在于,包括:
将数据集中的数据分类保存,并将分类结果通过数据页展示给用户;
当接收到用户针对所展示的任一分类的数据挖掘请求时,按照用户选定的挖掘方式进行数据挖掘,并根据挖掘结果向所述分类中补充数据;
所述数据为图片,所述按照用户选定的挖掘方式进行数据挖掘包括:为用户展示所述分类下的文本标签列表,按照用户从所述文本标签列表中选定的文本标签进行图片搜索,将搜索到的图片作为挖掘结果;
该方法进一步包括:若接收到用户的添加请求,则获取并保存用户针对所述文本标签列表进行的添加操作,包括:确定用户从所述分类中的图片中选定的图片,通过对选定的图片进行图片猜词,得到选定的图片对应的文本标签,获取用户从得到的文本标签中选定的文本标签,将选定的文本标签添加到所述文本标签列表中。
2.根据权利要求1所述的方法,其特征在于,
该方法进一步包括:当接收到用户的上传数据集请求时,获取用户上传的数据,将上传的数据补充到已有的分类中,和/或,补充到新建的分类中。
3.根据权利要求1所述的方法,其特征在于,
该方法进一步包括:当接收用户针对任一分类的数据上传请求时,获取用户上传的数据,将上传的数据补充到所述分类中。
4.根据权利要求1所述的方法,其特征在于,
该方法进一步包括以下之一或全部:
当接收到用户针对任一分类的预览请求时,将所述分类中的数据展示给用户;
获取并保存用户对所展示的数据所作的编辑。
5.根据权利要求1所述的方法,其特征在于,
所述按照用户选定的挖掘方式进行数据挖掘进一步包括:
按照用户选定的图片进行数据挖掘。
6.根据权利要求1所述的方法,其特征在于,
该方法进一步包括:
在为用户展示所述分类下的文本标签列表之后,若接收到用户的编辑请求,则获取并保存用户针对所述文本标签列表进行的编辑操作。
7.根据权利要求1所述的方法,其特征在于,
所述获取并保存用户针对所述文本标签列表进行的添加操作进一步包括:
获取用户输入的文本标签,将用户输入的文本标签添加到所述文本标签列表中。
8.根据权利要求5所述的方法,其特征在于,
所述按照用户选定的图片进行数据挖掘包括:
确定用户从所述分类中的图片中选定的图片;
按照选定的图片进行图片搜索,将搜索到的图片作为挖掘结果。
9.根据权利要求1所述的方法,其特征在于,
所述根据挖掘结果向所述分类中补充数据包括:
将用户从所述挖掘结果中选定的数据补充到所述分类中。
10.一种数据挖掘装置,其特征在于,包括:第一处理单元以及第二处理单元;
所述第一处理单元,用于将数据集中的数据分类保存,并将分类结果通过数据页展示给用户;
所述第二处理单元,用于当接收到用户针对所展示的任一分类的数据挖掘请求时,按照用户选定的挖掘方式进行数据挖掘,并根据挖掘结果向所述分类中补充数据;
所述数据为图片,所述第二处理单元为用户展示所述分类下的文本标签列表,按照用户从所述文本标签列表中选定的文本标签进行图片搜索,将搜索到的图片作为挖掘结果;若接收到用户的添加请求,则获取并保存用户针对所述文本标签列表进行的添加操作,包括:确定用户从所述分类中的图片中选定的图片,通过对选定的图片进行图片猜词,得到选定的图片对应的文本标签,获取用户从得到的文本标签中选定的文本标签,将选定的文本标签添加到所述文本标签列表中。
11.根据权利要求10所述的装置,其特征在于,
所述第二处理单元进一步用于,当接收到用户的上传数据集请求时,获取用户上传的数据,将上传的数据补充到已有的分类中,和/或,补充到新建的分类中。
12.根据权利要求10所述的装置,其特征在于,
所述第二处理单元进一步用于,当接收用户针对任一分类的数据上传请求时,获取用户上传的数据,将上传的数据补充到所述分类中。
13.根据权利要求10所述的装置,其特征在于,
所述第二处理单元进一步用于执行以下操作之一或全部:
当接收到用户针对任一分类的预览请求时,将所述分类中的数据展示给用户;
获取并保存用户对所展示的数据所作的编辑。
14.根据权利要求10所述的装置,其特征在于,
所述第二处理单元进一步用于,按照用户选定的图片进行数据挖掘。
15.根据权利要求10所述的装置,其特征在于,
所述第二处理单元进一步用于,在为用户展示所述分类下的文本标签列表之后,若接收到用户的编辑请求,则获取并保存用户针对所述文本标签列表进行的编辑操作。
16.根据权利要求10所述的装置,其特征在于,
所述第二处理单元获取并保存用户针对所述文本标签列表进行的添加操作进一步包括:获取用户输入的文本标签,将用户输入的文本标签添加到所述文本标签列表中。
17.根据权利要求14所述的装置,其特征在于,
所述第二处理单元确定用户从所述分类中的图片中选定的图片,按照选定的图片进行图片搜索,将搜索到的图片作为挖掘结果。
18.根据权利要求10所述的装置,其特征在于,
所述第二处理单元将用户从所述挖掘结果中选定的数据补充到所述分类中。
19.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~9中任一项所述的方法。
20.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~9中任一项所述的方法。
CN201811227320.5A 2018-10-22 2018-10-22 数据挖掘方法、装置、计算机设备及存储介质 Active CN109558508B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811227320.5A CN109558508B (zh) 2018-10-22 2018-10-22 数据挖掘方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811227320.5A CN109558508B (zh) 2018-10-22 2018-10-22 数据挖掘方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN109558508A CN109558508A (zh) 2019-04-02
CN109558508B true CN109558508B (zh) 2020-06-26

Family

ID=65865199

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811227320.5A Active CN109558508B (zh) 2018-10-22 2018-10-22 数据挖掘方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN109558508B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111209277B (zh) * 2020-01-06 2023-11-24 北京思维造物信息科技股份有限公司 一种数据处理方法、装置、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107958272A (zh) * 2017-12-12 2018-04-24 北京旷视科技有限公司 图片数据集更新方法、装置、***及计算机存储介质
CN108563683A (zh) * 2018-03-08 2018-09-21 北京达佳互联信息技术有限公司 标签添加方法、装置及终端

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101110997B (zh) * 2007-08-03 2010-08-18 中兴通讯股份有限公司 一种铃音上传的方法及***
US8903167B2 (en) * 2011-05-12 2014-12-02 Microsoft Corporation Synthesizing training samples for object recognition
CN106296208B (zh) * 2015-06-05 2021-09-14 创新先进技术有限公司 一种商品分类方法及装置
CN106131116A (zh) * 2016-06-16 2016-11-16 惠州Tcl移动通信有限公司 一种多媒体资料的分享与存储管理方法及***
CN106779911A (zh) * 2016-11-23 2017-05-31 顾承伟 一种提供智能厨房服务的方法及其***
CN107041018A (zh) * 2017-04-14 2017-08-11 四川长虹电器股份有限公司 移动终端对广告机终端进行节目发布管理的方法
CN107846461A (zh) * 2017-10-31 2018-03-27 广州市新誉工程咨询有限公司 基于bim模型的文件上传方法及管理方法及文件命名方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107958272A (zh) * 2017-12-12 2018-04-24 北京旷视科技有限公司 图片数据集更新方法、装置、***及计算机存储介质
CN108563683A (zh) * 2018-03-08 2018-09-21 北京达佳互联信息技术有限公司 标签添加方法、装置及终端

Also Published As

Publication number Publication date
CN109558508A (zh) 2019-04-02

Similar Documents

Publication Publication Date Title
CN107832662B (zh) 一种获取图片标注数据的方法和***
CN108416003B (zh) 一种图片分类方法和装置、终端、存储介质
CN107291828B (zh) 基于人工智能的口语查询解析方法、装置及存储介质
CN109087135B (zh) 用户意图的挖掘方法及装置、计算机设备及可读介质
CN107908641B (zh) 一种获取图片标注数据的方法和***
CN107909088B (zh) 获取训练样本的方法、装置、设备和计算机存储介质
EP3916584A1 (en) Information processing method and apparatus, electronic device and storage medium
CN107133263B (zh) Poi推荐方法、装置、设备及计算机可读存储介质
CN108897869B (zh) 语料标注方法、装置、设备和存储介质
US20160371244A1 (en) Collaboratively reconstituting tables
CN110609879B (zh) 兴趣点判重方法、装置、计算机设备及存储介质
CN104520848A (zh) 按照出席者搜索事件
CN110162757B (zh) 一种表格结构提取方法及***
CN106899755B (zh) 信息分享方法、信息分享装置及终端
CN107729347B (zh) 同义标签的获取方法、装置、设备及计算机可读存储介质
CN109558508B (zh) 数据挖掘方法、装置、计算机设备及存储介质
CN112528608B (zh) 页面编辑方法、装置、电子设备和存储介质
EP3564833B1 (en) Method and device for identifying main picture in web page
CN110263140B (zh) 一种主题词的挖掘方法、装置、电子设备及存储介质
CN110362688B (zh) 试题标注方法、装置、设备及计算机可读存储介质
CN112231444A (zh) 结合rpa和ai的语料数据的处理方法、装置和电子设备
CN114385891B (zh) 数据搜索方法、装置、电子设备及存储介质
KR20160012901A (ko) 이미지를 검색하는 방법 및 그 전자 장치
CN113886637A (zh) 一种视频粗排序的方法、装置、电子设备及存储介质
CN110378378B (zh) 事件检索方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant