CN111930687A - 文件处理方法、装置、终端及存储介质 - Google Patents

文件处理方法、装置、终端及存储介质 Download PDF

Info

Publication number
CN111930687A
CN111930687A CN202010798927.XA CN202010798927A CN111930687A CN 111930687 A CN111930687 A CN 111930687A CN 202010798927 A CN202010798927 A CN 202010798927A CN 111930687 A CN111930687 A CN 111930687A
Authority
CN
China
Prior art keywords
file
hash information
hash
information
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010798927.XA
Other languages
English (en)
Inventor
李磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oppo Chongqing Intelligent Technology Co Ltd
Original Assignee
Oppo Chongqing Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oppo Chongqing Intelligent Technology Co Ltd filed Critical Oppo Chongqing Intelligent Technology Co Ltd
Priority to CN202010798927.XA priority Critical patent/CN111930687A/zh
Publication of CN111930687A publication Critical patent/CN111930687A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/137Hash-based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Storage Device Security (AREA)

Abstract

本申请公开了一种文件处理方法,该方法包括:响应于文件的外发请求,获取外发请求对应的哈希信息;根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件;执行所述识别出的文件的外发动作。本申请还公开了一种提供了文件处理装置、终端和计算机可读存储介质。本申请的文件识别外发不会重叠和重复,降低了文件识别的出错率,提高了文件识别的准确性,保证了外发的文件的可靠性。

Description

文件处理方法、装置、终端及存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种文件处理方法、装置、终端及存储介质。
背景技术
目前非结构化文件内容识别的方法主要依赖关键字匹配,通过关键字来做出文件的识别操作。当新增一类文件后,需要频繁的对新文件进行关键字的提取或者筛选具有代表性的样本,需要往复的进行此操作,进而导致关键字重复、识别精度下降。在识别文本做出外发动作时,因关键字重复终端无法做到准确识别到需要的文本,导致文本识别失败,识别错误率提高,影响了外发。
发明内容
本申请实施例通过提供一种文件处理方法、装置终端及存储介质,旨在解决现有在识别文本做出外发动作时,因关键字重复终端无法做到准确识别到需要的文本,导致文本识别失败,识别错误率提高,影响了外发的技术问题。
为实现上述目的,本申请一方面提供了一种文件处理方法,所述文件处理方法包括:
响应于文件的外发请求,获取外发请求对应的哈希信息;
根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件;
执行所述识别出的文件的外发动作。
为实现上述目的,本申请另一方面还提出一种文件处理装置,所述装置包括:
获取模块、识别模块和发送模块,
所述控制模块,用于响应于文件的外发请求,获取外发请求对应的哈希信息;
所述识别模块,用于根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件;
所述发送模块,用于执行所述识别出的文件的外发动作。
为实现上述目的,本申请另一方面还提出一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
响应于文件的外发请求,获取外发请求对应的哈希信息;
根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件;
执行所述识别出的文件的外发动作。
为实现上述目的,本申请另一方面还提出一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以下步骤:
响应于文件的外发请求,获取外发请求对应的哈希信息;
根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件;
执行所述识别出的文件的外发动作。
本申请通过设置文件的哈希信息,通过文件的哈希信息来匹配文件的识别操作,从存储的文件中识别需要外发的文件,哈希信息是不可逆的信息,也不会重叠和重复,降低了文件识别的出错率,提高了文件识别的准确性,保证了外发的文件的可靠性。
附图说明
图1为实现本申请各个实施例的终端的硬件结构示意图;
图2为本申请文件处理方法一实施例的操作流程示意图;
图3为本申请一实施例中根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件的操作流程示意图;
图4为本申请另一实施例中根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件的操作流程示意图;
图5为本申请文件处理方法另一实施例的操作流程示意图;
图6为本申请一实施例中隐私标识信息修改的操作流程示意图;
图7为本申请文件处理方法又一实施例的操作流程示意图;
图8为本申请文件处理方法又一实施例的操作流程示意图;
图9为本申请文件处理方法又一实施例的操作流程示意图;
图10为本申请文件处理方法又一实施例的操作流程示意图;
图11为本申请一实施例中处理文件的操作流程示意图;
图12为本申请一实施例中文件处理装置的架构示意图;
图13为图12中识别模块的一细化架构示意图;
图14为本申请又一实施例中文件处理装置的架构示意图;
图15为本申请又一实施例中文件处理装置的架构示意图;
图16为本申请又一实施例中文件处理装置的架构示意图。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请的实施方案是:响应于文件的外发请求,获取外发请求对应的哈希信息;根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件;执行所述识别出的文件的外发动作。
本申请所述的终端可以各种形式来实施。例如,终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant,PDA)、便捷式媒体播放器(Portable Media Player,PMP)、导航装置、可穿戴设备、智能手环、计步器等移动终端。
参照图1,图1是本申请实施例方法涉及的硬件运行环境的设备结构示意图
如图1所示,该移动终端可以包括:处理器1001,例如CPU,存储器1003,通信总线1004,用户输入单元1002,显示单元1005。其中,通信总线1004用于实现处理器1001和存储器1003之间的连接通信。存储器1003可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1003可选的还可以是独立于前述处理器1001的存储装置。
可选地,移动终端还包括至少一种传感器,比如光传感器、运动传感器以及其他传感器。加速计传感器作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
可选地,显示单元1005用于显示由用户输入的消息或提供给用户的消息。显示单元1005可包括显示面板,可以采用液晶显示器(Liquid Crystal Display,LCD、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板。
可选地,用户输入单元1002可用于接收输入的数字或字符消息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元1002可包括触控面板以及其他输入设备。触控面板,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并根据预先设定的程式驱动相应的连接装置。除了触控面板,用户输入单元1002还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种,具体此处不做限定。
可选地,处理器1001是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器1003内的软件程序和/或模块,以及调用存储在存储器1003内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器1001可包括一个或多个处理单元;可选的,处理器1001可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1001中。
可选地,存储器1003可用于存储软件程序以及各种数据。存储器1003可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1003可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
本领域技术人员可以理解,图1中示出的移动终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
在图1所示的移动终端中,处理器1001用于执行存储器1003中文件处理应用程序,实现以下步骤:
响应于文件的外发请求,获取外发请求对应的哈希信息;
根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件;
执行所述识别出的文件的外发动作。
参考图2,图2为本申请文件处理方法的操作流程示意图;所述文件处理方法包括:
步骤S10,响应于文件的外发请求,获取外发请求对应的哈希信息;
文件的范畴很广泛,电脑上运行的如杀毒、游戏等软件或程序都可以叫文件。文件是一个具有符号的一组相关联元素的有序序列。文件可以包含范围非常广泛的内容。***和用户都可以将具有一定独立功能的程序模块、一组数据或一组文字命名为一个文件。
所述文件在终端中应用程序文件,用户记录的文件,用户日常的通话数据、用户日常的***文件数据等,不局限于上述举例的数据。
一般,存储于终端的数据会涉及到需要做外发处理,用户基于终端触发外发请求,响应于终端上接收到的文件的外发请求,需要获取终端中存储的文件,与外发请求作出匹配,通过用户在终端提供的输入界面或者输入接口输入文件的哈希信息或者通过代表的文字信息,得到文件的哈希信息,终端获取到需要外发的文件的哈希信息,通过哈希信息在终端存储的文件中做出文件检索。找到目标文件,找到外发的目标文件。
每个文件的哈希信息从文件***下载,在需要对文件加载哈希信息时,将文件上传至文件***,由文件***匹配哈希信息,通过文件的时间、大小、类型、文件名等信息构建哈希信息,文件***生成每个文件的哈希信息,再将哈希信息下发至终端,与终端同步存储了文件以及文件的哈希信息,同时存储的还有文件的下载时间、大小、文件名等信息。
在一实施例中,所述哈希信息也可以是在终端本地实现,本地加载文件***,通过本地的文件***实现哈希信息的生成,通过哈希函数来生成哈希信息,方式与在文件***一样的操作过程。
步骤S20,根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件;
在获取到需要外发的文件的哈希信息后,需要根据哈希信息从终端存储的文件中识别出需要外发的目标文件,而目标文件是与哈希信息匹配的文件,即,将哈希信息与存储的文件的哈希信息做匹配动作,哈希信息相似度高的就是需要外发的目标文件,设置相似度阈值,例如,90%或者95%,在哈希信息的相似度达到相似度阈值之上时,判定相似度在相似度阈值的文件是目标文件,是识别出的外发的文件。
所述根据哈希信息识别存储的文件,还可以是:获取哈希信息的标识,通过哈希信息的标识做出识别,在标识与存储的文件的标识相同时,将相同的文件作为外发的目标文件。
步骤S30,执行所述识别出的文件的外发动作。
在成功从存储的文件中识别出外发的文件时,执行所述识别出的文件的外发动作。
本实施例通过设置文件的哈希信息,通过文件的哈希信息来匹配文件的识别操作,从存储的文件中识别需要外发的文件,哈希信息是不可逆的信息,也不会重叠和重复,降低了文件识别的出错率,提高了文件识别的准确性,保证了外发的文件的可靠性。
在本申请的一实施例中,参考图3,所述根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件的步骤包括:
步骤S21,提取所述哈希信息的文件全文哈希信息,根据所述全文哈希信息识别存储的文件,识别出的文件为与所述全文哈希信息匹配的文件。
所述哈希信息是整个文件的哈希信息,例如,一个完整的应用程序的文件,或者一条完整的通话记录;对整个文件形成文件的哈希信息,一个文件只有一个哈希信息。在得到文件的哈希信息后,提取所述哈希信息中的文件全文哈希信息,通过全文的哈希信息做出文件的识别,从存储的文件中提取与文件全文哈希信息匹配的文件,将全文哈希信息匹配的文件作为识别出的目标文件,作为需要外发的文件。
本实施例通过全文哈希信息的方式,对一个完整文件形成哈希信息,通过全文的哈希信息,对比较大的文件作出快速的识别,提高识别的效率。
在一实施例中,参考图4,所述根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件的步骤包括:
步骤S22,提取所述哈希信息的文件文件分段哈希信息,根据所述分段哈希信息识别存储的文件,识别出的文件为与所述分段哈希信息匹配的文件,所述分段哈希为文件分为多个子文件后各个子文件的哈希信息。
本实施例与上述实施例的差异在于,上述实施例采用的是全文哈希的方式。本实施例采用的是一个文件拆分为多个子文件,通过子文件的分段哈希信息来做出文件的匹配,即,一个完整的文件除了全文哈希信息外,还有分段哈希信息。
不同文件根据文件的大小和/或文件的关联性将一个完整的文件划分成多个子文件,将关联的文件和/或按照预设的文件划分大小,例如,100kb或者200kb等,将一个完整的文件划分成多个子文件,为每个子文件设置哈希信息。在做文件识别时,通过子文件的分段哈希识别出需要外发的文件,可以实行单个子文件的外发或者通过多个分段哈希信息均匹配,将多个子文件识别出来,外发完整的一个文件。
而本申请也提出分段哈希信息生成过程:在从文件***下载了哈希信息后,接收对文件的编辑操作;响应于所述文件的编辑操作,生成文件的分段哈希信息,在生成分段哈希信息之前,所述文件被分割成多个子文件,所述分段哈希信息对应每个子文件设置。在用户对下载的哈希做二次修改时,提供二次修改接口,对用户验证,通过用户验证得到修改的接口,二次修改后,分段文件,得到分段哈希信息。
文件分成子文件也可以考虑带宽的影响,带宽会影响发送文件的大小,所以可以结合带宽允许单词发送文件的大小来做出子文件的划分,带宽允许发送的文件越大,划分的子文件数量越少;而在一实施例中,为了提高文件的划分和外发,计算当前使用的带宽,获取当前带宽的使用场景,根据带宽的使用场景来对文件作出子文件数量的划分依据,通过带宽的使用场景来匹配子文件数量,提高了文件划分的准确性。
本实施例通过将整个文件形成分段哈希信息,可以通过分段的哈希信息做出文件的拆解,识别单个文件,而无需对整个文件外发,提高了文件识别的便捷性,降低识别难度,提高识别准度,提高外发的可靠性。
在一实施例中,参考图5,所述根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件的步骤,还包括:
步骤S23,获取外发请求对应的隐私标识信息,从识别出的文件中确定与所述隐私标识信息对应的文件,不同的所述隐私标识指示文件不同级别的隐私程度。
在从存储的文件中识别需要外发的文件时,即,获取外发请求对应的文件时,还需要对文件的标识做出识别,而该标识是隐私标识,代表文件的隐私程度,例如,绝密、机密、秘密、内部公开等,或者是不属于机密文件,是对外公开的,不具备敏感性的文件,而对于机密或者绝密、私密或者内部公开的文件都是敏感性的文件,需要一定的管控,设置标识,而绝密的隐私程度最高,例如,可以设置隐私标识的值为5,而对外公开的隐私程度最低,可以设置为0。在做文件识别时,可以做隐私标识的识别,在隐私标识符合后,再做哈希信息的匹配,哈希匹配隐私标识匹配后,将满足隐私标识、哈希信息匹配的文件识别出来作为目标文件外发。
在与文件***交互获取哈希信息时,也可以响应于文件的操作指令,将所述操作指令对应的文件上传至文件***,所述文件***执行上传的文件的哈希设置以及隐私标识信息设置;接收所述文件***下发的文件的哈希信息和隐私标识信息。通过文件***实现哈希信息和隐私标识信息的同步获取。
本实施例通过隐私标识和哈希信息的共同结合来识别文件,可以精准的识别外发的敏感文件,无需重复的进行关键词的提取,降低了文件识别的难度,提高了识别的效率和准确性。
在一实施例中,参考图6,在本地存储了文件的哈希信息和隐私标识信息后,还包括:
步骤S40,接收所述文件的隐私标识信息的修改指令;
步骤S50,响应于所述修改指令,执行所述文件的隐私标识信息的修改操作,所述修改操作包括提高或者降低所述文件的隐私程度。
接收修改指令,对隐私标识信息做出修改,即,在隐私文件(敏感文件)的敏感性降低或不再敏感时,只需要将对应的文件标签标志为非敏感即可如数字0。隐私标识信息不是固定不动,可以随着文件的变化而做出改变,主动提出隐私标识信息的修改,将敏感性降低的文件的隐私标识做出修改,而不再受敏感标识限制,提高文件的灵活性。
本实施例通过对文件的隐私标识做出修改,通过隐私标识信息的匹配,提前将非隐私的文件匹配出来,避免误报的情况。
在一实施例中,参考图7,提出一种哈希信息和隐私信息的设置方法,包括:
步骤S01,响应于文件的操作指令,将所述操作指令对应的文件上传至文件***,所述文件***执行上传的文件的哈希设置以及隐私标识信息设置;
步骤S02,接收所述文件***下发的文件的哈希信息和隐私标识信息。
每个文件的哈希信息从文件***下载,在需要对文件加载哈希信息时,将文件上传至文件***,由文件***匹配哈希信息,通过文件的时间、大小、类型、文件名等信息构建哈希信息,文件***生成每个文件的哈希信息,再将哈希信息下发至终端,与终端同步存储了文件以及文件的哈希信息,同时存储的还有文件的下载时间、大小、文件名等信息。
可选地,对于文件的哈希信息生成的过程可以是:响应于文件的操作指令,将所述操作指令对应的文件上传至文件***,所述文件***执行上传的文件的哈希设置以及隐私标识信息设置;接收所述文件***下发的文件的哈希信息和隐私标识信息。
在一实施例中,所述哈希信息也可以是在终端本地实现,本地加载文件***,通过本地的文件***实现哈希信息的生成,通过哈希函数来生成哈希信息,方式与在文件***一样的操作过程。
在从存储的文件中识别需要外发的文件时,即,获取外发请求对应的文件时,还需要对文件的标识做出识别,而该标识是隐私标识,代表文件的隐私程度,例如,绝密、机密、秘密、内部公开等,或者是不属于机密文件,是对外公开的,不具备敏感性的文件,而对于机密或者绝密、私密或者内部公开的文件都是敏感性的文件,需要一定的管控,设置标识,而绝密的隐私程度最高,例如,可以设置隐私标识的值为5,而对外公开的隐私程度最低,可以设置为0。在做文件识别时,可以做隐私标识的识别,在隐私标识符合后,再做哈希信息的匹配,哈希匹配隐私标识匹配后,将满足隐私标识、哈希信息匹配的文件识别出来作为目标文件外发。
本实施例通过隐私标识和哈希信息的共同结合来识别文件,可以精准的识别外发的敏感文件,无需重复的进行关键词的提取,降低了文件识别的难度,提高了识别的效率和准确性。
在一实施例中,参考图8,所述接收所述文件***下发的文件的哈希信息和隐私标识信息的步骤之后,还包括:
步骤S03,接收对文件的编辑操作;
步骤S04,响应于所述文件的编辑操作,生成文件的分段哈希信息,在生成分段哈希信息之前,所述文件被分割成多个子文件,所述分段哈希信息对应每个子文件设置。
本实施例采用的是一个文件拆分为多个子文件,通过子文件的分段哈希信息来做出文件的匹配,即,一个完整的文件除了全文哈希信息外,还有分段哈希信息。
不同文件根据文件的大小和/或文件的关联性将一个完整的文件划分成多个子文件,将关联的文件和/或按照预设的文件划分大小,例如,100kb或者200kb等,将一个完整的文件划分成多个子文件,为每个子文件设置哈希信息。在做文件识别时,通过子文件的分段哈希识别出需要外发的文件,可以实行单个子文件的外发或者通过多个分段哈希信息均匹配,将多个子文件识别出来,外发完整的一个文件。
接收对文件的编辑操作;响应于所述文件的编辑操作,生成文件的分段哈希信息,在生成分段哈希信息之前,所述文件被分割成多个子文件,所述分段哈希信息对应每个子文件设置。在用户对下载的哈希做二次修改时,提供二次修改接口,对用户验证,通过用户验证得到修改的接口,二次修改后,分段文件,得到分段哈希信息。
文件分成子文件也可以考虑带宽的影响,带宽会影响发送文件的大小,所以可以结合带宽允许单词发送文件的大小来做出子文件的划分,带宽允许发送的文件越大,划分的子文件数量越少;而在一实施例中,为了提高文件的划分和外发,计算当前使用的带宽,获取当前带宽的使用场景,根据带宽的使用场景来对文件作出子文件数量的划分依据,通过带宽的使用场景来匹配子文件数量,提高了文件划分的准确性。
本实施例通过将整个文件形成分段哈希信息,可以通过分段的哈希信息做出文件的拆解,识别单个文件,而无需对整个文件外发,提高了文件识别的便捷性,降低识别难度,提高识别准度,提高外发的可靠性。
在一实施例中,参考图9,所述接收所述文件***下发的文件的哈希信息和隐私标识信息的步骤之后,还包括:
步骤S05,接收所述文件的隐私标识信息的修改指令;
步骤S06,响应于所述修改指令,执行所述文件的隐私标识信息的修改操作,所述修改操作包括提高或者降低所述文件的隐私程度。
接收修改指令,对隐私标识信息做出修改,即,在隐私文件(敏感文件)的敏感性降低或不再敏感时,只需要将对应的文件标签标志为非敏感即可如数字0。隐私标识信息不是固定不动,可以随着文件的变化而做出改变,主动提出隐私标识信息的修改,将敏感性降低的文件的隐私标识做出修改,而不再受敏感标识限制,提高文件的灵活性。
本实施例通过对文件的隐私标识做出修改,通过隐私标识信息的匹配,提前将非隐私的文件匹配出来,避免误报的情况。
在一实施例中,参考图10,所述方法还包括:
步骤S101,响应于文件的操作指令,将所述操作指令对应的文件上传至文件***,所述文件***执行上传的文件的哈希设置以及隐私标识信息设置;
步骤S102,接收所述文件***下发的文件的哈希信息和隐私标识信息;
步骤S103,响应于文件的外发请求,获取外发请求对应的哈希信息;
步骤S104,根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件;
步骤S105,执行所述识别出的文件的外发动作。
通过组合的方式,提供的实施例,通过结合文件哈希、隐私标识信息的设置,文件外发来描述本申请实施例的过程。
所述根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件的步骤包括:提取所述哈希信息的文件全文哈希信息,根据所述全文哈希信息识别存储的文件,识别出的文件为与所述全文哈希信息匹配的文件。
所述根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件的步骤包括:提取所述哈希信息的文件文件分段哈希信息,根据所述分段哈希信息识别存储的文件,识别出的文件为与所述分段哈希信息匹配的文件,所述分段哈希为文件分为多个子文件后各个子文件的哈希信息。
为了更好的说明本申请的实施例,参考图11,图11包括图11A、图11B、图11C和图11D,在图11A中,文件处理过程包括:
步骤A:文件上传到集中的文件***时,自动计算文件的全文哈希和分段哈希信息,如图11B所示,文件上传到敏感文件平台,自动生成文件的全文哈希和分段哈希并保存在敏感文件哈希库中,将哈希和分段哈希信息记录在日志中,同时后台日志自动保存该文件的文件名、大小、创建时间等属性,最终汇总形成敏感文件哈希库Hash-Database。
步骤B:用户使用终端PC从文件***下载文件时,如图11C所示,从敏感文件平台下载文件时,除文件下载的文件内容外,将自动从敏感文件哈希库中下载对应文件的哈希信息至本地留存,本地终端除记录下载的文件名、时间、大小外,还将自动从Hash-Database同步对应文件的哈希信息和文件敏感性标签,并在终端日志库中保存。
步骤C:当终端发生文件外发行为时,通过哈希和文件敏感性标签对比,可以精准的识别出敏感文件,参考图11D,从终端外发文件时,通过终端敏感文件哈希信息与敏感文件哈希库的匹配,来识别外发文件的敏感性;
步骤C存在以下细节:
步骤C1:从文件***下载的文件,用户没有经过二次编辑,文件哈希信息保持不变,与敏感文件***中的保持一致;
步骤C2:从文件***下载的文件,用户经过了二次编辑,通过分段哈希匹配相似度,来识别文件的敏感性
本实施例中存在这样的技术细节:如果文件***中的敏感性降低或不再敏感时,保存在敏感文件哈希库中Hash-Database的文件敏感性标签置为0,则步骤C中可以先通过比对文件敏感性标签判断文件已不再敏感,降低误报。
本申请还提出一种文件处理装置,参考图12,所述装置包括:获取模块10、识别模块20和发送模块30,
所述控制模块10,用于响应于文件的外发请求,获取外发请求对应的哈希信息;
所述识别模块20,用于根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件;
所述发送模块30,用于执行所述识别出的文件的外发动作。
进一步地,参考图13,所述识别模块20包括提取单元21和识别单元22,
所述提取单元21,用于提取所述哈希信息的文件全文哈希信息;
所述识别单元22,用于根据所述全文哈希信息识别存储的文件,识别出的文件为与所述全文哈希信息匹配的文件。
进一步地,所述提取单元21,还用于提取所述哈希信息的文件文件分段哈希信息;
所述识别单元22,还用于根据所述分段哈希信息识别存储的文件,识别出的文件为与所述分段哈希信息匹配的文件,所述分段哈希为文件分为多个子文件后各个子文件的哈希信息。
进一步地,所述获取模块10,还用于获取外发请求对应的隐私标识信息;
所述识别单元22,还用于从识别出的文件中确定与所述隐私标识信息对应的文件,不同的所述隐私标识指示文件不同级别的隐私程度。
进一步地,参考图14,所述装置还包括接收模块40,所述发送模块30,还用于响应于文件的操作指令,将所述操作指令对应的文件上传至文件***,所述文件***执行上传的文件的哈希设置以及隐私标识信息设置;
所述接收模块40,用于接收所述文件***下发的文件的哈希信息和隐私标识信息。
进一步地,参考图15,所述装置还包括:生成模块50,
所述接收模块40,还用于接收对文件的编辑操作;
所述生成模块50,用于响应于所述文件的编辑操作,生成文件的分段哈希信息,在生成分段哈希信息之前,所述文件被分割成多个子文件,所述分段哈希信息对应每个子文件设置。
进一步地,参考图16,所述装置还包括修改模块60,
所述接收模块40,还用于接收所述文件的隐私标识信息的修改指令;
所述修改模块60,用于响应于所述修改指令,执行所述文件的隐私标识信息的修改操作,所述修改操作包括提高或者降低所述文件的隐私程度。
本申请还提出一种终端,所述终端包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
响应于文件的外发请求,获取外发请求对应的哈希信息;
根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件;
执行所述识别出的文件的外发动作。
所述终端设置有处理器以及与所述处理连接的通信单元和数据业务单元所述通信单元接收文件外发请求,根据外发请求数据业务单元执行哈希匹配和识别文件的操作,通过通信单元外发终端的文件。
本申请的终端通过设置文件的哈希信息,通过文件的哈希信息来匹配文件的识别操作,从存储的文件中识别需要外发的文件,哈希信息是不可逆的信息,也不会重叠和重复,降低了文件识别的出错率,提高了文件识别的准确性,保证了外发的文件的可靠性。
本申请还提出一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以下步骤:
响应于文件的外发请求,获取外发请求对应的哈希信息;
根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件;
执行所述识别出的文件的外发动作。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本申请可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本申请的可选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括可选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (16)

1.一种文件处理方法,其特征在于,所述文件处理方法包括:
响应于文件的外发请求,获取外发请求对应的哈希信息;
根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件;
执行所述识别出的文件的外发动作。
2.根据权利要求1所述的文件处理方法,其特征在于,所述根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件的步骤包括:
提取所述哈希信息的文件全文哈希信息,根据所述全文哈希信息识别存储的文件,识别出的文件为与所述全文哈希信息匹配的文件。
3.根据权利要求1所述的文件处理方法,其特征在于,所述根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件的步骤包括:
提取所述哈希信息的文件文件分段哈希信息,根据所述分段哈希信息识别存储的文件,识别出的文件为与所述分段哈希信息匹配的文件,所述分段哈希为文件分为多个子文件后各个子文件的哈希信息。
4.根据权利要求1所述的文件处理方法,其特征在于,所述根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件的步骤,还包括:
获取外发请求对应的隐私标识信息,从识别出的文件中确定与所述隐私标识信息对应的文件,不同的所述隐私标识指示文件不同级别的隐私程度。
5.根据权利要求1所述的文件处理方法,其特征在于,所述方法,还包括:
响应于文件的操作指令,将所述操作指令对应的文件上传至文件***,所述文件***执行上传的文件的哈希设置以及隐私标识信息设置;
接收所述文件***下发的文件的哈希信息和隐私标识信息。
6.根据权利要求5所述的文件处理方法,其特征在于,所述接收所述文件***下发的文件的哈希信息和隐私标识信息的步骤之后,还包括:
接收对文件的编辑操作;
响应于所述文件的编辑操作,生成文件的分段哈希信息,在生成分段哈希信息之前,所述文件被分割成多个子文件,所述分段哈希信息对应每个子文件设置。
7.根据权利要求5所述的文件处理方法,其特征在于,所述接收所述文件***下发的文件的哈希信息和隐私标识信息的步骤之后,还包括:
接收所述文件的隐私标识信息的修改指令;
响应于所述修改指令,执行所述文件的隐私标识信息的修改操作,所述修改操作包括提高或者降低所述文件的隐私程度。
8.一种文件处理方法,其特征在于,所述文件处理方法,包括:
响应于文件的操作指令,将所述操作指令对应的文件上传至文件***,所述文件***执行上传的文件的哈希设置以及隐私标识信息设置;
接收所述文件***下发的文件的哈希信息和隐私标识信息。
9.根据权利要求8所述的文件处理方法,其特征在于,所述接收所述文件***下发的文件的哈希信息和隐私标识信息的步骤之后,还包括:
接收对文件的编辑操作;
响应于所述文件的编辑操作,生成文件的分段哈希信息,在生成分段哈希信息之前,所述文件被分割成多个子文件,所述分段哈希信息对应每个子文件设置。
10.根据权利要求8所述的文件处理方法,其特征在于,所述接收所述文件***下发的文件的哈希信息和隐私标识信息的步骤之后,还包括:
接收所述文件的隐私标识信息的修改指令;
响应于所述修改指令,执行所述文件的隐私标识信息的修改操作,所述修改操作包括提高或者降低所述文件的隐私程度。
11.一种文件处理方法,其特征在于,所述文件处理方法,包括:
响应于文件的操作指令,将所述操作指令对应的文件上传至文件***,所述文件***执行上传的文件的哈希设置以及隐私标识信息设置;
接收所述文件***下发的文件的哈希信息和隐私标识信息;
响应于文件的外发请求,获取外发请求对应的哈希信息;
根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件;
执行所述识别出的文件的外发动作。
12.如权利要求11的文件处理方法,其特征在于,所述根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件的步骤包括:
提取所述哈希信息的文件全文哈希信息,根据所述全文哈希信息识别存储的文件,识别出的文件为与所述全文哈希信息匹配的文件。
13.根据权利要求11所述的文件处理方法,其特征在于,所述根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件的步骤包括:
提取所述哈希信息的文件文件分段哈希信息,根据所述分段哈希信息识别存储的文件,识别出的文件为与所述分段哈希信息匹配的文件,所述分段哈希为文件分为多个子文件后各个子文件的哈希信息。
14.一种文件处理装置,其特征在于,所述装置包括:获取模块、识别模块和发送模块,
所述控制模块,用于响应于文件的外发请求,获取外发请求对应的哈希信息;
所述识别模块,用于根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件;
所述发送模块,用于执行所述识别出的文件的外发动作。
15.一种终端,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
响应于文件的外发请求,获取外发请求对应的哈希信息;
根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件;
执行所述识别出的文件的外发动作。
16.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现以下步骤:
响应于文件的外发请求,获取外发请求对应的哈希信息;
根据所述哈希信息识别存储的文件,识别出的文件为与所述哈希信息匹配的文件;
执行所述识别出的文件的外发动作。
CN202010798927.XA 2020-08-10 2020-08-10 文件处理方法、装置、终端及存储介质 Withdrawn CN111930687A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010798927.XA CN111930687A (zh) 2020-08-10 2020-08-10 文件处理方法、装置、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010798927.XA CN111930687A (zh) 2020-08-10 2020-08-10 文件处理方法、装置、终端及存储介质

Publications (1)

Publication Number Publication Date
CN111930687A true CN111930687A (zh) 2020-11-13

Family

ID=73307345

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010798927.XA Withdrawn CN111930687A (zh) 2020-08-10 2020-08-10 文件处理方法、装置、终端及存储介质

Country Status (1)

Country Link
CN (1) CN111930687A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150227535A1 (en) * 2014-02-11 2015-08-13 Red Hat, Inc. Caseless file lookup in a distributed file system
CN108108127A (zh) * 2017-12-15 2018-06-01 中链科技有限公司 一种文件读取方法及***
CN108965486A (zh) * 2018-10-08 2018-12-07 深圳市创维软件有限公司 一种文件下载方法、***、服务器及存储介质
CN110083606A (zh) * 2019-04-25 2019-08-02 深圳市豪斯莱科技有限公司 跨链存储方法、终端及存储介质
CN111211966A (zh) * 2019-12-30 2020-05-29 航天信息股份有限公司 一种用于存储聊天工具中传输文件的方法及***
CN111353177A (zh) * 2020-05-25 2020-06-30 杭州趣链科技有限公司 一种基于区块链的隐私大文件存储***
CN111460394A (zh) * 2020-03-30 2020-07-28 陈兴芜 一种版权文件的验证方法、装置及计算机可读存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150227535A1 (en) * 2014-02-11 2015-08-13 Red Hat, Inc. Caseless file lookup in a distributed file system
CN108108127A (zh) * 2017-12-15 2018-06-01 中链科技有限公司 一种文件读取方法及***
CN108965486A (zh) * 2018-10-08 2018-12-07 深圳市创维软件有限公司 一种文件下载方法、***、服务器及存储介质
CN110083606A (zh) * 2019-04-25 2019-08-02 深圳市豪斯莱科技有限公司 跨链存储方法、终端及存储介质
CN111211966A (zh) * 2019-12-30 2020-05-29 航天信息股份有限公司 一种用于存储聊天工具中传输文件的方法及***
CN111460394A (zh) * 2020-03-30 2020-07-28 陈兴芜 一种版权文件的验证方法、装置及计算机可读存储介质
CN111353177A (zh) * 2020-05-25 2020-06-30 杭州趣链科技有限公司 一种基于区块链的隐私大文件存储***

Similar Documents

Publication Publication Date Title
US10162865B2 (en) Generating image tags
US11321105B2 (en) Interactive informational interface
US11182593B2 (en) Image processing method, computer device, and computer readable storage medium
US11250075B1 (en) Searching social media content
AU2016265408A1 (en) System and method for extracting and sharing application-related user data
KR20160124087A (ko) 사용자 디바이스의 활성 페르소나 결정
EP3493130A1 (en) Image processing method, image processing device, computer device, and computer readable storage medium
CN110622153A (zh) 用于查询分割的方法和***
CN107885483B (zh) 音频信息的校验方法、装置、存储介质及电子设备
EP2758912B1 (en) Methods and apparatus for progressive pattern matching in a mobile environment
CN113190646B (zh) 一种用户名样本的标注方法、装置、电子设备及存储介质
CN111680686B (zh) 招牌信息识别方法、装置、终端及存储介质
CN113190695B (zh) 多媒体数据搜索方法及装置、计算机设备和介质
CN116956080A (zh) 一种数据处理方法、装置以及存储介质
KR102586286B1 (ko) 상황적 디지털 미디어 처리 시스템 및 방법
CN112995757B (zh) 视频剪裁方法及装置
CN113609479A (zh) 一种文件检测的方法、装置、电子设备及可读存储介质
CN113641936A (zh) 用于页面跳转的方法、装置、电子设备及存储介质
CN116758362A (zh) 图像处理方法、装置、计算机设备及存储介质
CN111930687A (zh) 文件处理方法、装置、终端及存储介质
CN114722234B (zh) 基于人工智能的音乐推荐方法、装置、存储介质
WO2022161025A1 (zh) 声纹识别方法、装置、电子设备和可读存储介质
CN112632222B (zh) 一种终端设备和确定数据所属领域的方法
EP3912019B1 (en) Multiple source media management
CN113987496A (zh) 恶意攻击检测的方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20201113