CN110543576B - 互联网移动终端中多媒体文件进行自动分类的方法及*** - Google Patents

互联网移动终端中多媒体文件进行自动分类的方法及*** Download PDF

Info

Publication number
CN110543576B
CN110543576B CN201910820347.3A CN201910820347A CN110543576B CN 110543576 B CN110543576 B CN 110543576B CN 201910820347 A CN201910820347 A CN 201910820347A CN 110543576 B CN110543576 B CN 110543576B
Authority
CN
China
Prior art keywords
multimedia file
virtual folder
content description
unclassified
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910820347.3A
Other languages
English (en)
Other versions
CN110543576A (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Dingniu Prism Network Technology Co ltd
Original Assignee
Shandong Dingniu Prism Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Dingniu Prism Network Technology Co ltd filed Critical Shandong Dingniu Prism Network Technology Co ltd
Priority to CN201910820347.3A priority Critical patent/CN110543576B/zh
Publication of CN110543576A publication Critical patent/CN110543576A/zh
Application granted granted Critical
Publication of CN110543576B publication Critical patent/CN110543576B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/188Virtual file systems
    • G06F16/192Implementing virtual folder structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/41Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/45Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Library & Information Science (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种对互联网移动终端中的多媒体文件进行自动分类的方法及***,其中方法包括:获取多媒体文件的多个内容描述项,将多个内容描述项中每个内容描述项进行关键词划分以确定每个内容描述项所涉及的多个主题词;在移动终端的存储器中创建新的存储区域;在接收到对多媒体文件进行自动分类的指示之后,移动终端将所获取的每个新的多媒体文件存储在文件缓存区中并记录每个新的多媒体文件被存储在文件缓存区中的缓存开始时间,为每个新的多媒体文件生成摘要信息;将已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件以进行分类处理。

Description

互联网移动终端中多媒体文件进行自动分类的方法及***
技术领域
本发明涉及移动互联网领域,并且更具体地,涉及一种对移动互联网内的移动终端中的多媒体文件进行自动分类的方法及***。
背景技术
目前,随着移动互联网的迅猛发展,越来越多的移动终端基于移动互联网进行信息交互。由于各种应用的功能越来越完善和丰富,移动终端内所存储的各种类型的多媒体文件,例如,视频、音频等,越来越多。然而,目前,在现有技术中,没有基于互联网移动互联网内的移动终端中的多媒体文件的特性进行适当分类的技术。
发明内容
根据本发明的一个方面,提供一种对互联网移动终端中的多媒体文件进行自动分类的方法,所述方法包括:
当接收到对移动互联网内移动终端中的多媒体文件进行自动分类的指示时,获取多媒体文件的多个内容描述项,为每个内容描述项分配一个虚拟文件夹,并为每个虚拟文件夹设置文件夹标识符,将多个内容描述项中每个内容描述项进行关键词划分以确定每个内容描述项所涉及的多个主题词,在多个主题词中确定一个主要主题词或多个次要主题词;
在移动终端的存储器中创建新的存储区域,新的存储区域包括:文件缓存区、分类识别存储区以及无类别存储区,其中文件缓存区用于存储在接收到对多媒体文件进行自动分类的指示之后,移动终端所获取的新的多媒体文件,分类识别存储区内为每个虚拟文件夹创建一个相应的存储单元,每个存储单元用于存储与所归属的虚拟文件夹相关联的关联信息,以及无类别存储区用于存储不属于任何虚拟文件夹的多媒体文件;
在接收到对多媒体文件进行自动分类的指示之后,移动终端将所获取的每个新的多媒体文件存储在文件缓存区中并记录每个新的多媒体文件被存储在文件缓存区中的缓存开始时间,为每个新的多媒体文件生成摘要信息;
将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件以进行分类处理。
将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件以进行分类处理包括:
将原始的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的关联度,确定原始的多媒体文件与每个内容描述项的关联度中最大的关联度是否大于第一关联度阈值:
如果是,则将与原始的多媒体文件的关联度最大的内容描述项作为原始的多媒体文件的归属内容描述项,确定与原始的多媒体文件的归属内容描述项相关联的虚拟文件夹,利用虚拟文件夹的文件夹标识符和原始的多媒体文件的标识符构建关联二元组,关联二元组的格式为<原始的多媒体文件的标识符、虚拟文件夹的文件夹标识符>,根据虚拟文件夹的文件夹标识符将多个关联二元组中每个关联二元组保存到相应的虚拟文件夹的存储单元中,以由关联二元组来构成与相应的虚拟文件夹相关联的关联信息;
如果否,则将原始的多媒体文件从原始的存储区域移动到无类别存储区以作为未分类的多媒体文件并记录每个未分类的多媒体文件被存储在无类别存储区中的分类开始时间。
当对所有原始的多媒体文件的分类处理完成后,将分类识别存储区的每个存储单元的关联信息中的关联二元组内的虚拟文件夹的文件夹标识符作为每个存储单元内的每个原始的多媒体文件的分类描述信息,以利用分类描述信息来指示每个原始的多媒体文件所归属的虚拟文件夹而不改变每个原始的多媒体文件的存储位置并且因此确定每个虚拟文件夹各自所包括的多个多媒体文件。
当基于缓存开始时间确定文件缓存区中存储的新的多媒体文件在文件缓存区中的存储时间到达第一时间阈值时,将新的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定新的多媒体文件与每个内容描述项的关联度,基于新的多媒体文件与每个内容描述项的关联度确定新的多媒体文件与多个内容描述项的平均关联度,当新的多媒体文件与多个内容描述项的平均关联度大于或等于第二关联度阈值时,将与新的多媒体文件的关联度最大的内容描述项作为新的多媒体文件的归属内容描述项,确定与新的多媒体文件的归属内容描述项相关联的虚拟文件夹,将与新的多媒体文件的归属内容描述项相关联的虚拟文件夹的标识符作为新的多媒体文件的分类描述信息,以利用分类描述信息来指示新的多媒体文件所归属的虚拟文件夹并且将新的多媒体文件移动到原始的存储区域中;
当新的多媒体文件与多个内容描述项的平均关联度小于关联度阈值时,将新的多媒体文件移动到无类别存储区以作为未分类的多媒体文件并记录每个未分类的多媒体文件被存储在无类别存储区中的分类开始时间,根据无类别存储区中每个未分类的多媒体文件的摘要信息为每个未分类的多媒体文件推荐至少一个虚拟文件夹,将所推荐的每个虚拟文件夹的标识符作为无类别存储区中未分类的多媒体文件的推荐信息,以指示为每个未分类的多媒体文件所推荐的至少一个虚拟文件夹并且因此确定虚拟文件夹所包括的被推荐的至少一个未分类的多媒体文件。
当特定虚拟文件夹中多个多媒体文件中的目标多媒体文件在移动终端内被浏览或使用时,将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示,并获取针对于特定虚拟文件夹所包括的被推荐的至少一个未分类的多媒体文件中每个的关联指示信息;
当基于分类开始时间确定无类别存储区中的未分类的多媒体文件在无类别存储区中的存储时间到达第二时间阈值时,对与未分类的多媒体文件相关联的所有关联指示信息进行统计,并根据统计结果确定未分类的多媒体文件所归属的虚拟文件夹,并将所归属的虚拟文件夹的标识符作为未分类的多媒体文件的分类描述信息,以利用分类描述信息来指示未分类的多媒体文件所归属的虚拟文件夹。
根据本发明的另一个方面,提供一种对互联网移动终端中的多媒体文件进行自动分类的***,所述***包括:
分配装置,当接收到对移动互联网内移动终端中的多媒体文件进行自动分类的指示时,获取多媒体文件的多个内容描述项,为每个内容描述项分配一个虚拟文件夹,并为每个虚拟文件夹设置文件夹标识符,将多个内容描述项中每个内容描述项进行关键词划分以确定每个内容描述项所涉及的多个主题词,在多个主题词中确定一个主要主题词或多个次要主题词;
创建装置,在移动终端的存储器中创建新的存储区域,新的存储区域包括:文件缓存区、分类识别存储区以及无类别存储区,其中文件缓存区用于存储在接收到对多媒体文件进行自动分类的指示之后,移动终端所获取的新的多媒体文件,分类识别存储区内为每个虚拟文件夹创建一个相应的存储单元,每个存储单元用于存储与所归属的虚拟文件夹相关联的关联信息,以及无类别存储区用于存储不属于任何虚拟文件夹的多媒体文件;
生成装置,在接收到对多媒体文件进行自动分类的指示之后,将所获取的每个新的多媒体文件存储在文件缓存区中并记录每个新的多媒体文件被存储在文件缓存区中的缓存开始时间,为每个新的多媒体文件生成摘要信息;
分类装置,将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件以进行分类处理。
所述分类装置将原始的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的关联度,确定原始的多媒体文件与每个内容描述项的关联度中最大的关联度是否大于第一关联度阈值:
如果是,则将与原始的多媒体文件的关联度最大的内容描述项作为原始的多媒体文件的归属内容描述项,确定与原始的多媒体文件的归属内容描述项相关联的虚拟文件夹,利用虚拟文件夹的文件夹标识符和原始的多媒体文件的标识符构建关联二元组,关联二元组的格式为<原始的多媒体文件的标识符、虚拟文件夹的文件夹标识符>,根据虚拟文件夹的文件夹标识符将多个关联二元组中每个关联二元组保存到相应的虚拟文件夹的存储单元中,以由关联二元组来构成与相应的虚拟文件夹相关联的关联信息;
如果否,则将原始的多媒体文件从原始的存储区域移动到无类别存储区以作为未分类的多媒体文件并记录每个未分类的多媒体文件被存储在无类别存储区中的分类开始时间。
当对所有原始的多媒体文件的分类处理完成后,将分类识别存储区的每个存储单元的关联信息中的关联二元组内的虚拟文件夹的文件夹标识符作为每个存储单元内的每个原始的多媒体文件的分类描述信息,以利用分类描述信息来指示每个原始的多媒体文件所归属的虚拟文件夹而不改变每个原始的多媒体文件的存储位置并且因此确定每个虚拟文件夹各自所包括的多个多媒体文件。
还包括处理装置,当基于缓存开始时间确定文件缓存区中存储的新的多媒体文件在文件缓存区中的存储时间到达第一时间阈值时,将新的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定新的多媒体文件与每个内容描述项的关联度,基于新的多媒体文件与每个内容描述项的关联度确定新的多媒体文件与多个内容描述项的平均关联度,当新的多媒体文件与多个内容描述项的平均关联度大于或等于第二关联度阈值时,将与新的多媒体文件的关联度最大的内容描述项作为新的多媒体文件的归属内容描述项,确定与新的多媒体文件的归属内容描述项相关联的虚拟文件夹,将与新的多媒体文件的归属内容描述项相关联的虚拟文件夹的标识符作为新的多媒体文件的分类描述信息,以利用分类描述信息来指示新的多媒体文件所归属的虚拟文件夹并且将新的多媒体文件移动到原始的存储区域中;
当新的多媒体文件与多个内容描述项的平均关联度小于关联度阈值时,将新的多媒体文件移动到无类别存储区以作为未分类的多媒体文件并记录每个未分类的多媒体文件被存储在无类别存储区中的分类开始时间,根据无类别存储区中每个未分类的多媒体文件的摘要信息为每个未分类的多媒体文件推荐至少一个虚拟文件夹,将所推荐的每个虚拟文件夹的标识符作为无类别存储区中未分类的多媒体文件的推荐信息,以指示为每个未分类的多媒体文件所推荐的至少一个虚拟文件夹并且因此确定虚拟文件夹所包括的被推荐的至少一个未分类的多媒体文件;
当基于分类开始时间确定无类别存储区中的未分类的多媒体文件在无类别存储区中的存储时间到达第二时间阈值时,对与未分类的多媒体文件相关联的所有关联指示信息进行统计,并根据统计结果确定未分类的多媒体文件所归属的虚拟文件夹,并将所归属的虚拟文件夹的标识符作为未分类的多媒体文件的分类描述信息,以利用分类描述信息来指示未分类的多媒体文件所归属的虚拟文件夹。
还包括展示装置,当特定虚拟文件夹中多个多媒体文件中的目标多媒体文件在移动终端内被浏览或使用时,将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示,并获取针对于特定虚拟文件夹所包括的被推荐的至少一个未分类的多媒体文件中每个的关联指示信息。
附图说明
图1为本发明的对互联网移动终端中的多媒体文件进行自动分类的方法的流程图;
图2为本发明的对互联网移动终端中的多媒体文件进行自动分类的***的结构示意图。
具体实施方式
图1为本发明的对互联网移动终端中的多媒体文件进行自动分类的方法100的流程图。如图1所示,方法100从步骤101处开始。在步骤101,当接收到对移动互联网内移动终端中的多媒体文件进行自动分类的指示时,获取多媒体文件的多个内容描述项,为每个内容描述项分配一个虚拟文件夹,并为每个虚拟文件夹设置文件夹标识符,将多个内容描述项中每个内容描述项进行关键词划分以确定每个内容描述项所涉及的多个主题词,在多个主题词中确定一个主要主题词或多个次要主题词;
多媒体文件包括视频文件、音频文件和图像文件;其中多媒体文件的多个内容描述项是由移动终端的用户所生成的,或多媒体文件的多个内容描述项是由移动终端的操作***所生成的。每个内容描述项是由与时间、地点、内容和主题相关联的信息所构成的描述信息。所述移动终端的存储器中存储多个多媒体文件。虚拟文件夹是不需要真实地创建的文件夹;虚拟文件夹利用关联关系来为每个内容描述项提供服务;文件夹标识符能够唯一地标识虚拟文件夹。虚拟文件夹与虚拟文件夹内的多个多媒体文件存在关联关系,但是虚拟文件夹内的多个多媒体文件中的每个多媒体文件仍存储在初始位置处,而不会因为与虚拟文件夹存在关联关系而被复制或移动到虚拟文件夹内。
将多个内容描述项中每个内容描述项进行关键词划分以确定每个内容描述项所涉及的多个主题词包括:将多个内容描述项中每个内容描述项进行关键词划分,将与时间相关联的信息和与地点相关联的信息均作为主题词,将与内容相关联的信息中的所有名词作为主题词和与主题相关联的信息中的所有名词作为主题词,从而确定每个内容描述项所涉及的多个主题词。
在多个主题词中确定一个主要主题词或多个次要主题词包括:根据移动终端的用户预先设置的选择规则从在多个主题词中确定一个主要主题词或多个次要主题词;或根据移动终端的操作***的选择规则从在多个主题词中确定一个主要主题词或多个次要主题词。所述主要主题词是与时间相关联的信息或与地点相关联的信息。所述主要主题词是与内容相关联的信息中的所有名词中的一个;或者是与主题相关联的信息中的所有名词中的一个。次要主题词是多个主题词中除了一个主要主题词之外的所有其它主题词。
在步骤102,在移动终端的存储器中创建新的存储区域,新的存储区域包括:文件缓存区、分类识别存储区以及无类别存储区,其中文件缓存区用于存储在接收到对多媒体文件进行自动分类的指示之后,移动终端所获取的新的多媒体文件,分类识别存储区内为每个虚拟文件夹创建一个相应的存储单元,每个存储单元用于存储与所归属的虚拟文件夹相关联的关联信息,以及无类别存储区用于存储不属于任何虚拟文件夹的多媒体文件;
所述移动终端的存储器中包括原始的存储区域和新的存储区域,所述原始的存储区域用于存储在接收到对移动互联网内移动终端中的多媒体文件进行自动分类的指示之前已经被存储在存储器中的多媒体文件。分类识别存储区包括多个存储单元,每个存储单元均对应一个虚拟文件夹,存储单元的数量与虚拟文件夹的数量相同。
在步骤103,在接收到对多媒体文件进行自动分类的指示之后,移动终端将所获取的每个新的多媒体文件存储在文件缓存区中并记录每个新的多媒体文件被存储在文件缓存区中的缓存开始时间,为每个新的多媒体文件生成摘要信息。
为每个新的多媒体文件生成摘要信息包括:根据每个新的多媒体文件的介绍信息来生成摘要信息,或对每个新的多媒体文件的介绍信息进行概括来生成摘要信息;或对每个新的多媒体文件的文件内容进行概括来生成摘要信息;或对每个新的多媒体文件的文件内容进行信息提取来生成摘要信息。
在步骤104,将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件以进行分类处理:
将原始的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的关联度,确定原始的多媒体文件与每个内容描述项的关联度中最大的关联度是否大于第一关联度阈值。
将原始的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的关联度包括:将原始的多媒体文件的摘要信息与每个内容描述项的主要主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的主要主题词的关联度KAi
将原始的多媒体文件的摘要信息与每个内容描述项的每个次要主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的每个次要主题词的关联度,基于原始的多媒体文件与每个内容描述项的每个次要主题词的关联度确定原始的多媒体文件与每个内容描述项的所有次要主题词的平均关联度PAi
原始的多媒体文件与每个内容描述项的关联度Ai=α×KAi+β×PAi
N≥i≥1,其中i和N均为自然数,N为内容描述项的数量,Ai为原始的多媒体文件与第i个内容描述项的关联度;KAi为原始的多媒体文件与第i个内容描述项的主要主题词的关联度;PAi为原始的多媒体文件与第i个内容描述项的所有次要主题词的平均关联度;
其中1>α>0;1>β>0,并且α+β=1;
例如,α=0.75,β=0.25,α=0.5,β=0.5,α=0.25,β=0.75。
其中将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件以进行分类处理为:将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件并针对每个原始的多媒体文件进行分类处理。第一关联度阈值为50%、60%、70%、80%或90%;
如果是,则将与原始的多媒体文件的关联度最大的内容描述项作为原始的多媒体文件的归属内容描述项,确定与原始的多媒体文件的归属内容描述项相关联的虚拟文件夹,利用虚拟文件夹的文件夹标识符和原始的多媒体文件的标识符构建关联二元组,关联二元组的格式为<原始的多媒体文件的标识符、虚拟文件夹的文件夹标识符>,根据虚拟文件夹的文件夹标识符将多个关联二元组中每个关联二元组保存到相应的虚拟文件夹的存储单元中,以由关联二元组来构成与相应的虚拟文件夹相关联的关联信息;
如果否,则将原始的多媒体文件从原始的存储区域移动到无类别存储区以作为未分类的多媒体文件并记录每个未分类的多媒体文件被存储在无类别存储区中的分类开始时间。
与相应的虚拟文件夹相关联的关联信息包括多个关联二元组,并且每个关联二元组中的虚拟文件夹的文件夹标识符均是相应的虚拟文件夹的文件夹标识符。与相应的虚拟文件夹相关联的关联信息用于记录或指示与相应的虚拟文件夹相关联的多个原始的多媒体文件,或与相应的虚拟文件夹相关联的关联信息用于记录或指示相应的虚拟文件夹所包括的多个原始的多媒体文件。
当对所有原始的多媒体文件的分类处理完成后,将分类识别存储区的每个存储单元的关联信息中的关联二元组内的虚拟文件夹的文件夹标识符作为每个存储单元内的每个原始的多媒体文件的分类描述信息,以利用分类描述信息来指示每个原始的多媒体文件所归属的虚拟文件夹而不改变每个原始的多媒体文件的存储位置并且因此确定每个虚拟文件夹各自所包括的多个多媒体文件;
在步骤105,当基于缓存开始时间确定文件缓存区中存储的新的多媒体文件在文件缓存区中的存储时间到达第一时间阈值时,将新的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定新的多媒体文件与每个内容描述项的关联度,基于新的多媒体文件与每个内容描述项的关联度确定新的多媒体文件与多个内容描述项的平均关联度,当新的多媒体文件与多个内容描述项的平均关联度大于或等于第二关联度阈值时,将与新的多媒体文件的关联度最大的内容描述项作为新的多媒体文件的归属内容描述项,确定与新的多媒体文件的归属内容描述项相关联的虚拟文件夹,将与新的多媒体文件的归属内容描述项相关联的虚拟文件夹的标识符作为新的多媒体文件的分类描述信息,以利用分类描述信息来指示新的多媒体文件所归属的虚拟文件夹并且将新的多媒体文件移动到原始的存储区域中;
在分类处理完成后,为与虚拟文件夹相关联的原始的多媒体文件添加分类描述信息,所述分类描述信息是原始的多媒体文件所归属的虚拟文件夹的文件夹标识符。基于当前时间和缓存开始时间确定文件缓存区中存储的新的多媒体文件在文件缓存区中的存储时间;将当前时间和缓存开始时间之间的时间间隔确定为文件缓存区中存储的新的多媒体文件在文件缓存区中的存储时间。第一时间阈值为:5个小时、10个小时、20个小时、30个小时、50个小时、100个小时、300个小时或720个小时。
将新的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定新的多媒体文件与每个内容描述项的关联度包括:将新的多媒体文件的摘要信息与每个内容描述项的多个主题词中的每个主题词进行关联度计算以确定新的多媒体文件与每个内容描述项的每个主题词的关联度,基于新的多媒体文件与每个内容描述项的每个主题词的关联度确定新的多媒体文件与每个内容描述项的所有主题词的平均关联度,将新的多媒体文件与每个内容描述项的所有主题词的平均关联度确定为新的多媒体文件与每个内容描述项的关联度。第二关联度阈值为40%、50%、60%、70%或80%。
在步骤106,当新的多媒体文件与多个内容描述项的平均关联度小于关联度阈值时,将新的多媒体文件移动到无类别存储区以作为未分类的多媒体文件并记录每个未分类的多媒体文件被存储在无类别存储区中的分类开始时间,根据无类别存储区中每个未分类的多媒体文件的摘要信息为每个未分类的多媒体文件推荐至少一个虚拟文件夹,将所推荐的每个虚拟文件夹的标识符作为无类别存储区中未分类的多媒体文件的推荐信息,以指示为每个未分类的多媒体文件所推荐的至少一个虚拟文件夹并且因此确定虚拟文件夹所包括的被推荐的至少一个未分类的多媒体文件;
根据无类别存储区中每个未分类的多媒体文件的摘要信息为每个未分类的多媒体文件推荐至少一个虚拟文件夹包括:将未分类的多媒体文件的摘要信息与每个内容描述项的多个主题词中的每个主题词进行关联度计算以确定未分类的多媒体文件与每个内容描述项的每个主题词的关联度,基于未分类的多媒体文件与每个内容描述项的每个主题词的关联度确定未分类的多媒体文件与每个内容描述项的所有主题词的平均关联度,将与未分类的多媒体文件的平均关联度大于第三关联度阈值的至少一个内容描述项确定为未分类的多媒体文件的至少一个推荐内容描述项。将与至少一个推荐内容描述项中每个推荐内容描述项相关联的虚拟文件夹确定为未分类的多媒体文件的推荐的虚拟文件夹,从而为每个未分类的多媒体文件推荐至少一个虚拟文件夹;或者,将根据无类别存储区中每个未分类的多媒体文件的摘要信息为每个未分类的多媒体文件推荐至少一个虚拟文件夹替换为:从多个虚拟文件夹中为每个未分类的多媒体文件随机推荐至少一个虚拟文件夹。第三关联度阈值为40%、50%、60%、70%或80%。
在步骤107,当特定虚拟文件夹中多个多媒体文件中的目标多媒体文件在移动终端内被浏览或使用时,将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示,并获取针对于特定虚拟文件夹所包括的被推荐的至少一个未分类的多媒体文件中每个的关联指示信息。
将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示为:在预览区域在将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行预览式的关联展示。
将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示为:在预览区域在将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行缩略式的关联展示。
将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示为:在预览区域在将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行小图标式的关联展示。由移动终端的用户生成针对于被推荐的至少一个未分类的多媒体文件的关联指示信息。所述关联指示信息的格式为<虚拟文件夹的文件夹标识符,相关性>;其中相关性包括:文件相关或文件不相关。
在步骤108,当基于分类开始时间确定无类别存储区中的未分类的多媒体文件在无类别存储区中的存储时间到达第二时间阈值时,对与未分类的多媒体文件相关联的所有关联指示信息进行统计,并根据统计结果确定未分类的多媒体文件所归属的虚拟文件夹,并将所归属的虚拟文件夹的标识符作为未分类的多媒体文件的分类描述信息,以利用分类描述信息来指示未分类的多媒体文件所归属的虚拟文件夹。
基于当前时间和分类开始时间确定无类别存储区中的未分类的多媒体文件在无类别存储区中的存储时间;将当前时间和分类开始时间之间的时间间隔确定为无类别存储区中的未分类的多媒体文件在无类别存储区中的存储时间。第二时间阈值为:5个小时、10个小时、20个小时、30个小时、50个小时、100个小时、300个小时或720个小时。
对与未分类的多媒体文件相关联的所有关联指示信息进行统计包括:按照虚拟文件夹的文件夹标识符对与未分类的多媒体文件相关联的所有关联指示信息进行统计,以获取未分类的多媒体文件与多个虚拟文件夹中每个虚拟文件夹相关的关联指示信息的总数量和内容为文件相关的关联指示信息的相关数量。
根据统计结果确定未分类的多媒体文件所归属的虚拟文件夹包括:将多个虚拟文件夹中相关数量与总数量的比值最大的虚拟文件夹确定为未分类的多媒体文件所归属的虚拟文件夹。
图2为本发明的对互联网移动终端中的多媒体文件进行自动分类的***200的结构示意图。***200包括:分配装置201、创建装置202、生成装置203、分类装置204、处理装置205以及展示装置206。分配装置201,当接收到对移动互联网内移动终端中的多媒体文件进行自动分类的指示时,获取多媒体文件的多个内容描述项,为每个内容描述项分配一个虚拟文件夹,并为每个虚拟文件夹设置文件夹标识符,将多个内容描述项中每个内容描述项进行关键词划分以确定每个内容描述项所涉及的多个主题词,在多个主题词中确定一个主要主题词或多个次要主题词。
多媒体文件包括视频文件、音频文件和图像文件;其中多媒体文件的多个内容描述项是由移动终端的用户所生成的,或多媒体文件的多个内容描述项是由移动终端的操作***所生成的。每个内容描述项是由与时间、地点、内容和主题相关联的信息所构成的描述信息。所述移动终端的存储器中存储多个多媒体文件。虚拟文件夹是不需要真实地创建的文件夹;虚拟文件夹利用关联关系来为每个内容描述项提供服务;文件夹标识符能够唯一地标识虚拟文件夹。虚拟文件夹与虚拟文件夹内的多个多媒体文件存在关联关系,但是虚拟文件夹内的多个多媒体文件中的每个多媒体文件仍存储在初始位置处,而不会因为与虚拟文件夹存在关联关系而被复制或移动到虚拟文件夹内。
将多个内容描述项中每个内容描述项进行关键词划分以确定每个内容描述项所涉及的多个主题词包括:将多个内容描述项中每个内容描述项进行关键词划分,将与时间相关联的信息和与地点相关联的信息均作为主题词,将与内容相关联的信息中的所有名词作为主题词和与主题相关联的信息中的所有名词作为主题词,从而确定每个内容描述项所涉及的多个主题词。
在多个主题词中确定一个主要主题词或多个次要主题词包括:根据移动终端的用户预先设置的选择规则从在多个主题词中确定一个主要主题词或多个次要主题词;或根据移动终端的操作***的选择规则从在多个主题词中确定一个主要主题词或多个次要主题词。所述主要主题词是与时间相关联的信息或与地点相关联的信息。所述主要主题词是与内容相关联的信息中的所有名词中的一个;或者是与主题相关联的信息中的所有名词中的一个。次要主题词是多个主题词中除了一个主要主题词之外的所有其它主题词。
创建装置202,在移动终端的存储器中创建新的存储区域,新的存储区域包括:文件缓存区、分类识别存储区以及无类别存储区,其中文件缓存区用于存储在接收到对多媒体文件进行自动分类的指示之后,移动终端所获取的新的多媒体文件,分类识别存储区内为每个虚拟文件夹创建一个相应的存储单元,每个存储单元用于存储与所归属的虚拟文件夹相关联的关联信息,以及无类别存储区用于存储不属于任何虚拟文件夹的多媒体文件。
所述移动终端的存储器中包括原始的存储区域和新的存储区域,所述原始的存储区域用于存储在接收到对移动互联网内移动终端中的多媒体文件进行自动分类的指示之前已经被存储在存储器中的多媒体文件。分类识别存储区包括多个存储单元,每个存储单元均对应一个虚拟文件夹,存储单元的数量与虚拟文件夹的数量相同。
生成装置203,在接收到对多媒体文件进行自动分类的指示之后,移动终端将所获取的每个新的多媒体文件存储在文件缓存区中并记录每个新的多媒体文件被存储在文件缓存区中的缓存开始时间,为每个新的多媒体文件生成摘要信息。
为每个新的多媒体文件生成摘要信息包括:根据每个新的多媒体文件的介绍信息来生成摘要信息,或对每个新的多媒体文件的介绍信息进行概括来生成摘要信息;或对每个新的多媒体文件的文件内容进行概括来生成摘要信息;或对每个新的多媒体文件的文件内容进行信息提取来生成摘要信息。
分类装置204,将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件以进行分类处理:
将原始的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的关联度,确定原始的多媒体文件与每个内容描述项的关联度中最大的关联度是否大于第一关联度阈值。
将原始的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的关联度包括:将原始的多媒体文件的摘要信息与每个内容描述项的主要主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的主要主题词的关联度KAi
将原始的多媒体文件的摘要信息与每个内容描述项的每个次要主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的每个次要主题词的关联度,基于原始的多媒体文件与每个内容描述项的每个次要主题词的关联度确定原始的多媒体文件与每个内容描述项的所有次要主题词的平均关联度PAi
原始的多媒体文件与每个内容描述项的关联度Ai=α×KAi+β×PAi
N≥i≥1,其中i和N均为自然数,N为内容描述项的数量,Ai为原始的多媒体文件与第i个内容描述项的关联度;KAi为原始的多媒体文件与第i个内容描述项的主要主题词的关联度;PAi为原始的多媒体文件与第i个内容描述项的所有次要主题词的平均关联度;
其中1>α>0;1>β>0,并且α+β=1;
例如,α=0.75,β=0.25,α=0.5,β=0.5,α=0.25,β=0.75。
其中将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件以进行分类处理为:将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件并针对每个原始的多媒体文件进行分类处理。第一关联度阈值为50%、60%、70%、80%或90%;
如果是,则将与原始的多媒体文件的关联度最大的内容描述项作为原始的多媒体文件的归属内容描述项,确定与原始的多媒体文件的归属内容描述项相关联的虚拟文件夹,利用虚拟文件夹的文件夹标识符和原始的多媒体文件的标识符构建关联二元组,关联二元组的格式为<原始的多媒体文件的标识符、虚拟文件夹的文件夹标识符>,根据虚拟文件夹的文件夹标识符将多个关联二元组中每个关联二元组保存到相应的虚拟文件夹的存储单元中,以由关联二元组来构成与相应的虚拟文件夹相关联的关联信息;
如果否,则将原始的多媒体文件从原始的存储区域移动到无类别存储区以作为未分类的多媒体文件并记录每个未分类的多媒体文件被存储在无类别存储区中的分类开始时间。
与相应的虚拟文件夹相关联的关联信息包括多个关联二元组,并且每个关联二元组中的虚拟文件夹的文件夹标识符均是相应的虚拟文件夹的文件夹标识符。与相应的虚拟文件夹相关联的关联信息用于记录或指示与相应的虚拟文件夹相关联的多个原始的多媒体文件,或与相应的虚拟文件夹相关联的关联信息用于记录或指示相应的虚拟文件夹所包括的多个原始的多媒体文件。
当对所有原始的多媒体文件的分类处理完成后,将分类识别存储区的每个存储单元的关联信息中的关联二元组内的虚拟文件夹的文件夹标识符作为每个存储单元内的每个原始的多媒体文件的分类描述信息,以利用分类描述信息来指示每个原始的多媒体文件所归属的虚拟文件夹而不改变每个原始的多媒体文件的存储位置并且因此确定每个虚拟文件夹各自所包括的多个多媒体文件;
处理装置205,当基于缓存开始时间确定文件缓存区中存储的新的多媒体文件在文件缓存区中的存储时间到达第一时间阈值时,将新的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定新的多媒体文件与每个内容描述项的关联度,基于新的多媒体文件与每个内容描述项的关联度确定新的多媒体文件与多个内容描述项的平均关联度,当新的多媒体文件与多个内容描述项的平均关联度大于或等于第二关联度阈值时,将与新的多媒体文件的关联度最大的内容描述项作为新的多媒体文件的归属内容描述项,确定与新的多媒体文件的归属内容描述项相关联的虚拟文件夹,将与新的多媒体文件的归属内容描述项相关联的虚拟文件夹的标识符作为新的多媒体文件的分类描述信息,以利用分类描述信息来指示新的多媒体文件所归属的虚拟文件夹并且将新的多媒体文件移动到原始的存储区域中;
在分类处理完成后,为与虚拟文件夹相关联的原始的多媒体文件添加分类描述信息,所述分类描述信息是原始的多媒体文件所归属的虚拟文件夹的文件夹标识符。基于当前时间和缓存开始时间确定文件缓存区中存储的新的多媒体文件在文件缓存区中的存储时间;将当前时间和缓存开始时间之间的时间间隔确定为文件缓存区中存储的新的多媒体文件在文件缓存区中的存储时间。第一时间阈值为:5个小时、10个小时、20个小时、30个小时、50个小时、100个小时、300个小时或720个小时。
将新的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定新的多媒体文件与每个内容描述项的关联度包括:将新的多媒体文件的摘要信息与每个内容描述项的多个主题词中的每个主题词进行关联度计算以确定新的多媒体文件与每个内容描述项的每个主题词的关联度,基于新的多媒体文件与每个内容描述项的每个主题词的关联度确定新的多媒体文件与每个内容描述项的所有主题词的平均关联度,将新的多媒体文件与每个内容描述项的所有主题词的平均关联度确定为新的多媒体文件与每个内容描述项的关联度。第二关联度阈值为40%、50%、60%、70%或80%。
当新的多媒体文件与多个内容描述项的平均关联度小于关联度阈值时,将新的多媒体文件移动到无类别存储区以作为未分类的多媒体文件并记录每个未分类的多媒体文件被存储在无类别存储区中的分类开始时间,根据无类别存储区中每个未分类的多媒体文件的摘要信息为每个未分类的多媒体文件推荐至少一个虚拟文件夹,将所推荐的每个虚拟文件夹的标识符作为无类别存储区中未分类的多媒体文件的推荐信息,以指示为每个未分类的多媒体文件所推荐的至少一个虚拟文件夹并且因此确定虚拟文件夹所包括的被推荐的至少一个未分类的多媒体文件;
根据无类别存储区中每个未分类的多媒体文件的摘要信息为每个未分类的多媒体文件推荐至少一个虚拟文件夹包括:将未分类的多媒体文件的摘要信息与每个内容描述项的多个主题词中的每个主题词进行关联度计算以确定未分类的多媒体文件与每个内容描述项的每个主题词的关联度,基于未分类的多媒体文件与每个内容描述项的每个主题词的关联度确定未分类的多媒体文件与每个内容描述项的所有主题词的平均关联度,将与未分类的多媒体文件的平均关联度大于第三关联度阈值的至少一个内容描述项确定为未分类的多媒体文件的至少一个推荐内容描述项。将与至少一个推荐内容描述项中每个推荐内容描述项相关联的虚拟文件夹确定为未分类的多媒体文件的推荐的虚拟文件夹,从而为每个未分类的多媒体文件推荐至少一个虚拟文件夹;或者,将根据无类别存储区中每个未分类的多媒体文件的摘要信息为每个未分类的多媒体文件推荐至少一个虚拟文件夹替换为:从多个虚拟文件夹中为每个未分类的多媒体文件随机推荐至少一个虚拟文件夹。第三关联度阈值为40%、50%、60%、70%或80%。
当基于分类开始时间确定无类别存储区中的未分类的多媒体文件在无类别存储区中的存储时间到达第二时间阈值时,对与未分类的多媒体文件相关联的所有关联指示信息进行统计,并根据统计结果确定未分类的多媒体文件所归属的虚拟文件夹,并将所归属的虚拟文件夹的标识符作为未分类的多媒体文件的分类描述信息,以利用分类描述信息来指示未分类的多媒体文件所归属的虚拟文件夹。
基于当前时间和分类开始时间确定无类别存储区中的未分类的多媒体文件在无类别存储区中的存储时间;将当前时间和分类开始时间之间的时间间隔确定为无类别存储区中的未分类的多媒体文件在无类别存储区中的存储时间。第二时间阈值为:5个小时、10个小时、20个小时、30个小时、50个小时、100个小时、300个小时或720个小时。
对与未分类的多媒体文件相关联的所有关联指示信息进行统计包括:按照虚拟文件夹的文件夹标识符对与未分类的多媒体文件相关联的所有关联指示信息进行统计,以获取未分类的多媒体文件与多个虚拟文件夹中每个虚拟文件夹相关的关联指示信息的总数量和内容为文件相关的关联指示信息的相关数量。
根据统计结果确定未分类的多媒体文件所归属的虚拟文件夹包括:将多个虚拟文件夹中相关数量与总数量的比值最大的虚拟文件夹确定为未分类的多媒体文件所归属的虚拟文件夹。
展示装置206,当特定虚拟文件夹中多个多媒体文件中的目标多媒体文件在移动终端内被浏览或使用时,将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示,并获取针对于特定虚拟文件夹所包括的被推荐的至少一个未分类的多媒体文件中每个的关联指示信息。
将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示为:在预览区域在将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行预览式的关联展示。
将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示为:在预览区域在将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行缩略式的关联展示。
将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示为:在预览区域在将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行小图标式的关联展示。由移动终端的用户生成针对于被推荐的至少一个未分类的多媒体文件的关联指示信息。所述关联指示信息的格式为<虚拟文件夹的文件夹标识符,相关性>;其中相关性包括:文件相关或文件不相关。

Claims (10)

1.一种对互联网移动终端中的多媒体文件进行自动分类的方法,所述方法包括:
当接收到对移动互联网内移动终端中的多媒体文件进行自动分类的指示时,获取多媒体文件的多个内容描述项,为每个内容描述项分配一个虚拟文件夹,并为每个虚拟文件夹设置文件夹标识符,将多个内容描述项中每个内容描述项进行关键词划分以确定每个内容描述项所涉及的多个主题词,在多个主题词中确定一个主要主题词或多个次要主题词;
在移动终端的存储器中创建新的存储区域,新的存储区域包括:文件缓存区、分类识别存储区以及无类别存储区,其中文件缓存区用于存储在接收到对多媒体文件进行自动分类的指示之后,移动终端所获取的新的多媒体文件,分类识别存储区内为每个虚拟文件夹创建一个相应的存储单元,每个存储单元用于存储与所归属的虚拟文件夹相关联的关联信息,以及无类别存储区用于存储不属于任何虚拟文件夹的多媒体文件;
在接收到对多媒体文件进行自动分类的指示之后,移动终端将所获取的每个新的多媒体文件存储在文件缓存区中并记录每个新的多媒体文件被存储在文件缓存区中的缓存开始时间,为每个新的多媒体文件生成摘要信息;
将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件以进行分类处理。
2.根据权利要求1所述的方法,将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件以进行分类处理包括:
将原始的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的关联度,确定原始的多媒体文件与每个内容描述项的关联度中最大的关联度是否大于第一关联度阈值:
如果是,则将与原始的多媒体文件的关联度最大的内容描述项作为原始的多媒体文件的归属内容描述项,确定与原始的多媒体文件的归属内容描述项相关联的虚拟文件夹,利用虚拟文件夹的文件夹标识符和原始的多媒体文件的标识符构建关联二元组,关联二元组的格式为<原始的多媒体文件的标识符、虚拟文件夹的文件夹标识符>,根据虚拟文件夹的文件夹标识符将多个关联二元组中每个关联二元组保存到相应的虚拟文件夹的存储单元中,以由关联二元组来构成与相应的虚拟文件夹相关联的关联信息;
如果否,则将原始的多媒体文件从原始的存储区域移动到无类别存储区以作为未分类的多媒体文件并记录每个未分类的多媒体文件被存储在无类别存储区中的分类开始时间。
3.根据权利要求1所述的方法,当对所有原始的多媒体文件的分类处理完成后,将分类识别存储区的每个存储单元的关联信息中的关联二元组内的虚拟文件夹的文件夹标识符作为每个存储单元内的每个原始的多媒体文件的分类描述信息,以利用分类描述信息来指示每个原始的多媒体文件所归属的虚拟文件夹而不改变每个原始的多媒体文件的存储位置并且因此确定每个虚拟文件夹各自所包括的多个多媒体文件。
4.根据权利要求1所述的方法,当基于缓存开始时间确定文件缓存区中存储的新的多媒体文件在文件缓存区中的存储时间到达第一时间阈值时,将新的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定新的多媒体文件与每个内容描述项的关联度,基于新的多媒体文件与每个内容描述项的关联度确定新的多媒体文件与多个内容描述项的平均关联度,当新的多媒体文件与多个内容描述项的平均关联度大于或等于第二关联度阈值时,将与新的多媒体文件的关联度最大的内容描述项作为新的多媒体文件的归属内容描述项,确定与新的多媒体文件的归属内容描述项相关联的虚拟文件夹,将与新的多媒体文件的归属内容描述项相关联的虚拟文件夹的标识符作为新的多媒体文件的分类描述信息,以利用分类描述信息来指示新的多媒体文件所归属的虚拟文件夹并且将新的多媒体文件移动到原始的存储区域中;
当新的多媒体文件与多个内容描述项的平均关联度小于关联度阈值时,将新的多媒体文件移动到无类别存储区以作为未分类的多媒体文件并记录每个未分类的多媒体文件被存储在无类别存储区中的分类开始时间,根据无类别存储区中每个未分类的多媒体文件的摘要信息为每个未分类的多媒体文件推荐至少一个虚拟文件夹,将所推荐的每个虚拟文件夹的标识符作为无类别存储区中未分类的多媒体文件的推荐信息,以指示为每个未分类的多媒体文件所推荐的至少一个虚拟文件夹并且因此确定虚拟文件夹所包括的被推荐的至少一个未分类的多媒体文件。
5.根据权利要求1所述的方法,当特定虚拟文件夹中多个多媒体文件中的目标多媒体文件在移动终端内被浏览或使用时,将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示,并获取针对于特定虚拟文件夹所包括的被推荐的至少一个未分类的多媒体文件中每个的关联指示信息;
当基于分类开始时间确定无类别存储区中的未分类的多媒体文件在无类别存储区中的存储时间到达第二时间阈值时,对与未分类的多媒体文件相关联的所有关联指示信息进行统计,并根据统计结果确定未分类的多媒体文件所归属的虚拟文件夹,并将所归属的虚拟文件夹的标识符作为未分类的多媒体文件的分类描述信息,以利用分类描述信息来指示未分类的多媒体文件所归属的虚拟文件夹。
6.一种对互联网移动终端中的多媒体文件进行自动分类的***,所述***包括:
分配装置,当接收到对移动互联网内移动终端中的多媒体文件进行自动分类的指示时,获取多媒体文件的多个内容描述项,为每个内容描述项分配一个虚拟文件夹,并为每个虚拟文件夹设置文件夹标识符,将多个内容描述项中每个内容描述项进行关键词划分以确定每个内容描述项所涉及的多个主题词,在多个主题词中确定一个主要主题词或多个次要主题词;
创建装置,在移动终端的存储器中创建新的存储区域,新的存储区域包括:文件缓存区、分类识别存储区以及无类别存储区,其中文件缓存区用于存储在接收到对多媒体文件进行自动分类的指示之后,移动终端所获取的新的多媒体文件,分类识别存储区内为每个虚拟文件夹创建一个相应的存储单元,每个存储单元用于存储与所归属的虚拟文件夹相关联的关联信息,以及无类别存储区用于存储不属于任何虚拟文件夹的多媒体文件;
生成装置,在接收到对多媒体文件进行自动分类的指示之后,将所获取的每个新的多媒体文件存储在文件缓存区中并记录每个新的多媒体文件被存储在文件缓存区中的缓存开始时间,为每个新的多媒体文件生成摘要信息;
分类装置,将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件以进行分类处理。
7.根据权利要求6所述的方法,所述分类装置将原始的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的关联度,确定原始的多媒体文件与每个内容描述项的关联度中最大的关联度是否大于第一关联度阈值:
如果是,则将与原始的多媒体文件的关联度最大的内容描述项作为原始的多媒体文件的归属内容描述项,确定与原始的多媒体文件的归属内容描述项相关联的虚拟文件夹,利用虚拟文件夹的文件夹标识符和原始的多媒体文件的标识符构建关联二元组,关联二元组的格式为<原始的多媒体文件的标识符、虚拟文件夹的文件夹标识符>,根据虚拟文件夹的文件夹标识符将多个关联二元组中每个关联二元组保存到相应的虚拟文件夹的存储单元中,以由关联二元组来构成与相应的虚拟文件夹相关联的关联信息;
如果否,则将原始的多媒体文件从原始的存储区域移动到无类别存储区以作为未分类的多媒体文件并记录每个未分类的多媒体文件被存储在无类别存储区中的分类开始时间。
8.根据权利要求6所述的方法,当对所有原始的多媒体文件的分类处理完成后,将分类识别存储区的每个存储单元的关联信息中的关联二元组内的虚拟文件夹的文件夹标识符作为每个存储单元内的每个原始的多媒体文件的分类描述信息,以利用分类描述信息来指示每个原始的多媒体文件所归属的虚拟文件夹而不改变每个原始的多媒体文件的存储位置并且因此确定每个虚拟文件夹各自所包括的多个多媒体文件。
9.根据权利要求6所述的方法,还包括处理装置,当基于缓存开始时间确定文件缓存区中存储的新的多媒体文件在文件缓存区中的存储时间到达第一时间阈值时,将新的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定新的多媒体文件与每个内容描述项的关联度,基于新的多媒体文件与每个内容描述项的关联度确定新的多媒体文件与多个内容描述项的平均关联度,当新的多媒体文件与多个内容描述项的平均关联度大于或等于第二关联度阈值时,将与新的多媒体文件的关联度最大的内容描述项作为新的多媒体文件的归属内容描述项,确定与新的多媒体文件的归属内容描述项相关联的虚拟文件夹,将与新的多媒体文件的归属内容描述项相关联的虚拟文件夹的标识符作为新的多媒体文件的分类描述信息,以利用分类描述信息来指示新的多媒体文件所归属的虚拟文件夹并且将新的多媒体文件移动到原始的存储区域中;
当新的多媒体文件与多个内容描述项的平均关联度小于关联度阈值时,将新的多媒体文件移动到无类别存储区以作为未分类的多媒体文件并记录每个未分类的多媒体文件被存储在无类别存储区中的分类开始时间,根据无类别存储区中每个未分类的多媒体文件的摘要信息为每个未分类的多媒体文件推荐至少一个虚拟文件夹,将所推荐的每个虚拟文件夹的标识符作为无类别存储区中未分类的多媒体文件的推荐信息,以指示为每个未分类的多媒体文件所推荐的至少一个虚拟文件夹并且因此确定虚拟文件夹所包括的被推荐的至少一个未分类的多媒体文件;
当基于分类开始时间确定无类别存储区中的未分类的多媒体文件在无类别存储区中的存储时间到达第二时间阈值时,对与未分类的多媒体文件相关联的所有关联指示信息进行统计,并根据统计结果确定未分类的多媒体文件所归属的虚拟文件夹,并将所归属的虚拟文件夹的标识符作为未分类的多媒体文件的分类描述信息,以利用分类描述信息来指示未分类的多媒体文件所归属的虚拟文件夹。
10.根据权利要求6所述的方法,还包括展示装置,当特定虚拟文件夹中多个多媒体文件中的目标多媒体文件在移动终端内被浏览或使用时,将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示,并获取针对于特定虚拟文件夹所包括的被推荐的至少一个未分类的多媒体文件中每个的关联指示信息。
CN201910820347.3A 2019-09-01 2019-09-01 互联网移动终端中多媒体文件进行自动分类的方法及*** Active CN110543576B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910820347.3A CN110543576B (zh) 2019-09-01 2019-09-01 互联网移动终端中多媒体文件进行自动分类的方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910820347.3A CN110543576B (zh) 2019-09-01 2019-09-01 互联网移动终端中多媒体文件进行自动分类的方法及***

Publications (2)

Publication Number Publication Date
CN110543576A CN110543576A (zh) 2019-12-06
CN110543576B true CN110543576B (zh) 2022-12-06

Family

ID=68712400

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910820347.3A Active CN110543576B (zh) 2019-09-01 2019-09-01 互联网移动终端中多媒体文件进行自动分类的方法及***

Country Status (1)

Country Link
CN (1) CN110543576B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111159653A (zh) * 2019-12-23 2020-05-15 泰康保险集团股份有限公司 一种多媒体任务处理的***及方法
CN111159434A (zh) * 2019-12-29 2020-05-15 赵娜 一种在互联网存储集群中存储多媒体文件的方法及***
CN111078646B (zh) * 2019-12-30 2023-12-05 山东蝶飞信息技术有限公司 基于互联网设备的运行数据对软件进行分组的方法及***
CN112165634B (zh) * 2020-09-29 2022-09-16 北京百度网讯科技有限公司 建立音频分类模型的方法、自动转换视频的方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930444A (zh) * 2012-09-25 2013-02-13 中兴通讯股份有限公司 一种移动终端及其应用分类管理方法和***
CN107122429A (zh) * 2017-04-13 2017-09-01 北京安云世纪科技有限公司 一种文件管理的方法和装置及移动终端
CN107784089A (zh) * 2017-09-30 2018-03-09 维沃移动通信有限公司 一种多媒体数据的存储方法、处理方法及移动终端
CN109491982A (zh) * 2018-10-22 2019-03-19 王梅 移动互联网的移动终端内创建虚拟存储单元的方法及***

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100763180B1 (ko) * 2005-06-09 2007-10-04 삼성전자주식회사 메타 데이터를 이용한 브라우징 방법 및 장치
JP2012064297A (ja) * 2010-08-19 2012-03-29 Panasonic Corp コンテンツファイル分類装置およびコンテンツファイル分類方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930444A (zh) * 2012-09-25 2013-02-13 中兴通讯股份有限公司 一种移动终端及其应用分类管理方法和***
CN107122429A (zh) * 2017-04-13 2017-09-01 北京安云世纪科技有限公司 一种文件管理的方法和装置及移动终端
CN107784089A (zh) * 2017-09-30 2018-03-09 维沃移动通信有限公司 一种多媒体数据的存储方法、处理方法及移动终端
CN109491982A (zh) * 2018-10-22 2019-03-19 王梅 移动互联网的移动终端内创建虚拟存储单元的方法及***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
多媒体网络教学资源的内容特征提取与搜索研究;孟祥增;《电化教育研究》;20071201(第12期);全文 *
旅游景区知识管理***的设计;贾志洋等;《云南民族大学学报(自然科学版)》;20130310(第02期);全文 *

Also Published As

Publication number Publication date
CN110543576A (zh) 2019-12-06

Similar Documents

Publication Publication Date Title
CN110543576B (zh) 互联网移动终端中多媒体文件进行自动分类的方法及***
US6314421B1 (en) Method and apparatus for indexing documents for message filtering
US9098585B2 (en) Clustering multimedia search
US5550965A (en) Method and system for operating a data processor to index primary data in real time with iconic table of contents
TWI475412B (zh) 數位內容次序調整方法和數位內容匯流器
CN108351897B (zh) 用于创建和更新媒体内容项组的方法、***和介质
CN109408639B (zh) 一种弹幕分类方法、装置、设备和存储介质
US20060206495A1 (en) Method and apparatus for grouping content items
CN109429103B (zh) 推荐信息的方法、装置及计算机可读存储介质、终端设备
CN112364202A (zh) 视频推荐方法、装置及电子设备
CN110515895B (zh) 大数据存储***中对数据文件进行关联存储的方法及***
CN104854588A (zh) 用于搜索标记的主要为非文本的项目的***和方法
US11036743B2 (en) Methods, systems, and media for presenting content organized by category
CN110569447B (zh) 一种网络资源的推荐方法、装置及存储介质
CN106294709B (zh) 云存储文件的展示方法及装置
CN105659232B (zh) 用于呈现媒体项目的着陆页
CN114020980A (zh) 生成、创建内容清单的方法、电子设备及存储介质
CN111159435B (zh) 多媒体资源处理方法、***、终端及计算机可读存储介质
WO2022081665A1 (en) Methods, systems, and media for identifying relevant content
CN107404657B (zh) 一种广告推荐方法和装置
CN110929002B (zh) 相似文章去重的方法、装置、终端及计算机可读存储介质
KR102023687B1 (ko) 서버의 이미지 공유 방법, 그리고 이를 구현한 시스템 및 어플리케이션
US20200159769A1 (en) Methods, systems, and media for combining classifier scores of a hierarchical set of entities
CN116185256A (zh) 互动方法、介质、装置和计算设备
CN116226414A (zh) 一种话题标签推荐方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20221109

Address after: 250101 Room 917, 9th Floor, Qilu Software Building, South Head, Xinyu Road, High tech Zone, Jinan, Shandong

Applicant after: Shandong Dingniu Prism Network Technology Co.,Ltd.

Address before: 100191 905, Building 10, Luozhuang Xili, Zhichun Road, Haidian District, Beijing

Applicant before: Gao Shuhui

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant