CN114024955B - 基于rpa及ai的文件处理方法、装置、设备及介质 - Google Patents

基于rpa及ai的文件处理方法、装置、设备及介质 Download PDF

Info

Publication number
CN114024955B
CN114024955B CN202111283652.7A CN202111283652A CN114024955B CN 114024955 B CN114024955 B CN 114024955B CN 202111283652 A CN202111283652 A CN 202111283652A CN 114024955 B CN114024955 B CN 114024955B
Authority
CN
China
Prior art keywords
file
uploaded
uploading
target website
files
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111283652.7A
Other languages
English (en)
Other versions
CN114024955A (zh
Inventor
贾俊
汪冠春
胡一川
褚瑞
李玮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Laiye Network Technology Co Ltd
Laiye Technology Beijing Co Ltd
Original Assignee
Beijing Laiye Network Technology Co Ltd
Laiye Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Laiye Network Technology Co Ltd, Laiye Technology Beijing Co Ltd filed Critical Beijing Laiye Network Technology Co Ltd
Priority to CN202111283652.7A priority Critical patent/CN114024955B/zh
Publication of CN114024955A publication Critical patent/CN114024955A/zh
Application granted granted Critical
Publication of CN114024955B publication Critical patent/CN114024955B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例公开一种基于RPA及AI的文件处理方法、装置、设备及介质,该方法包括:S1、读取配置文件表,所述配置文件表中包括待上传文件的文件信息和上传路径信息;S2、如果确定目标网站未存储所述待上传文件,则获取所述待上传文件,并将各个待上传文件按照对应的上传路径信息依次上传到所述目标网站中;S3、对于任意一个上传成功的文件,在所述目标网站的网页操作界面填写该文件对应的文件信息。通过采用上述技术方案,解决了人工上传文件效率低下的问题。

Description

基于RPA及AI的文件处理方法、装置、设备及介质
技术领域
本发明实施例涉及流程自动化技术领域,具体而言,涉及一种基于RPA及AI的文件处理方法、装置、设备及介质。
背景技术
RPA(Robotic Process Automation,机器人流程自动化),是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
AI(Artificial Intelligence,人工智能)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用***的一门新的技术科学。
RPA具有独特的优势:低代码、非侵入。低代码是说,RPA不需要很高的IT水平就能操作,不懂编程的业务人员也能开发流程;非侵入是说,RPA可以模拟人的操作,不用软件***开放接口。但是传统的RPA具有一定的局限性:只能基于固定的规则,并且应用场景受限。随着AI技术的不断发展,RPA与AI深度融合克服了传统RPA的局限,RPA+AI=Hand work+Head work,正在极大的改变劳动力的价值。
目前,企业文件资料的上传通常是由人工来执行。特别是对于一些学习资料,培训师将学习资料课件做好后,需要登录学习网站把相应资料上传。一般情况下,需要上传的学习资料是多个文件,这完全是一个重复性的机械劳动。如果网络出现异常,则很容易导致学习资料,特别是大数据量的视频文件的上传失败。如果出现上传失败的情况,则需要人工重新来执行上传操作,效率低下。
发明内容
本发明实施例提供一种基于RPA及AI的文件处理方法、装置、设备及介质,用以克服人工上传文件效率低下的问题。
第一方面,本发明实施提供了一种基于RPA及AI的文件处理方法,包括:
S1、读取配置文件表,所述配置文件表中包括待上传文件的文件信息和上传路径信息;
S2、如果确定目标网站未存储所述待上传文件,则获取所述待上传文件,并将各个待上传文件按照对应的上传路径信息依次上传到所述目标网站中;
S3、对于任意一个上传成功的文件,在所述目标网站的网页操作界面填写该文件对应的文件信息。
可选的,所述S1包括:
S11、如果所述配置文件表为便携式文档PDF格式或是图片格式,则调用光学字符识别OCR组件对所述配置文件表进行识别,得到所述配置文件表中每个单元格的内容及各单元格在表格中的位置信息;
S12、从各单元格的内容中确定待上传文件的文件信息和上传路径信息;
相应的,所述S2具体包括:
如果确定目标网站未存储所述待上传文件,则获取所述待上传文件,并根据各待上传文件在表格中位置的先后顺序,将各个待上传文件按照对应的上传路径信息依次上传到所述目标网站中。
可选的,所述S2具体包括:
S21、获取目标网站的登录账号和登录密码,并将所述登录账号及其登录密码输入所述目标网站的登录对话框中,以登录所述目标网站;
S22、如果确定所述目标网站未存储所述待上传文件,则获取所述待上传文件,并将所述待上传文件上传到所述目标网站的设定文件夹中;
S23、按照所述上传路径信息,将所述设定文件夹中的文件移动到对应的目标文件夹中进行存储。
可选的,所述方法还包括:
S24、对于所述设定文件夹中的任意一个文件,如果所述目标网站的文件目录中不存在与该文件的文件类型对应的目标文件夹,则根据所述文件类型在所述目标网站创建对应的目标文件夹,并将该目标文件夹添加到所述文件目录中。
可选的,所述方法还包括:
S4、在登录所述目标网站的过程中,如果检测到存在验证码,则对所述验证码进行光学字符OCR识别,并将识别结果输入所述登录对话框的验证码填写处。
可选的,所述方法还包括:
S5、在文件上传过程中,如果检测到文件上传失败的提示信息,或者在设定时间内未检测到文件上传成功的提示信息,则退出所述目标网站,并执行所述目标网站的重新登录,以及文件的上传操作。
可选的,所述待上传文件为学习资料;相应的,所述方法还包括:
根据用户的浏览记录,确定关注所述学习资料所属类型的目标用户;
将所述学习资料上传成功的提示信息发送给所述目标用户。
第二方面,本发明实施例还提供了一种基于RPA及AI的文件处理装置,包括:
配置文件读取模块,被配置为:读取配置文件表,所述配置文件表中包括待上传文件的文件信息和上传路径信息;
文件上传模块,被配置为:如果确定目标网站未存储所述待上传文件,则获取所述待上传文件,并将各个待上传文件按照对应的上传路径信息依次上传到所述目标网站中;
文件信息填写模块,被配置为:对于任意一个上传成功的文件,在所述目标网站的网页操作界面填写该文件对应的文件信息。
可选的,所述配置文件读取模块,包括:
识别单元,被配置为:如果所述配置文件表为便携式文档PDF格式或是图片格式,则调用光学字符识别OCR组件对所述配置文件表进行识别,得到所述配置文件表中每个单元格的内容及各单元格在表格中的位置信息;
上传信息确定单元,被配置为:从各单元格的内容中确定待上传文件的文件信息和上传路径信息;
相应的,所述文件上传模块,具体被配置为:
获取所述待上传文件,并根据各待上传文件在表格中位置的先后顺序,将各个待上传文件按照对应的上传路径信息依次上传到目标网站中。
可选的,所述文件上传模块,包括:
网站登录单元,被配置为:获取目标网站的登录账号和登录密码,并将所述登录账号及其登录密码输入所述目标网站的登录对话框中,以登录所述目标网站;
文件上传单元,被配置为:如果确定所述目标网站未存储所述待上传文件,则获取所述待上传文件,并将所述待上传文件上传到所述目标网站的设定文件夹中;
文件移动单元,被配置为按照所述上传路径信息,将所述设定文件夹中的文件移动到对应的目标文件夹中进行存储。
可选的,所述装置还包括:
目标文件夹创建单元,被配置为:对于所述设定文件夹中的任意一个文件,如果所述目标网站的文件目录中不存在与该文件的文件类型对应的目标文件夹,则根据所述文件类型在所述目标网站创建对应的目标文件夹,并将该目标文件夹添加到所述文件目录中。
可选的,所述装置还包括:
验证码识别模块,被配置为:在登录所述目标网站的过程中,如果检测到存在验证码,则对所述验证码进行光学字符OCR识别,并将识别结果输入所述登录对话框的验证码填写处。
可选的,所述装置还包括:
重新上传模块,被配置为:在文件上传过程中,如果检测到文件上传失败的提示信息,或者在设定时间内未检测到文件上传成功的提示信息,则退出所述目标网站,并执行所述目标网站的重新登录,以及文件的上传操作。
可选的,所述待上传文件为学习资料;相应的,所述装置还包括:
目标用户确定模块,被配置为:根据用户的浏览记录,确定关注所述学习资料所属类型的目标用户;
消息发送模块,被配置为:将所述学习资料上传成功的提示信息发送给所述目标用户。
第三方面,本发明实施例还提供了一种计算设备,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明任意实施例所提供的基于RPA及AI的文件处理方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所提供的基于RPA及AI的文件处理方法。
本发明实施例提供的技术方案,RPA机器人可从配置文件表中读取待上传文件的文件信息和上传路径信息,并将各个待上传文件按照对应的上传路径信息依次上传到目标网站。通过采用RPA机器人代替人工来执行文件上传操作的方式,节省了大量的人力资源和时间资源。在文件上传成功之后,RPA机器人可在目标网站的网页操作界面填写该文件对应的文件说明,以使用户在未打开文件的情况下,能够清楚、直观地了解的文件的基本信息,为用户提供了便利。
本发明实施例的创新点包括:
1、RPA机器人代替人工从配置文件表中读取待上传文件的文件信息和上传路径信息,并将各个待上传文件按照对应的上传路径信息依次上传到目标网站,节省了大量的人力资源和时间资源,是本发明实施例的创新点之一。
2、如果配置文件表是PDF格式或者是图片格式,PRA机器人可调用OCR组件对其进行识别,得到配置文件表中各单元格的内容和行列信息。相对于人工从配置文件表中查询待上传文件信息的方式,本实施例采用RPA及AI相结合的方式,节省了大量的人力资源,并可提高文件上传的效率,是本发明实施例的创新点之一。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a为本发明实施例一提供的一种基于RPA及AI的文件处理方法的流程图;
图1b为本发明实施例一提供的RPA机器人在目标网站填写文件说明的效果截图;
图2a为本发明实施例二提供的一种基于RPA及AI的文件处理方法的流程图;
图2b为本发明实施例二提供的一种在流程自动化平台搭建的RPA机器人的流程效果截图;
图3为本发明实施例三提供的一种基于RPA及AI的文件处理装置的结构框图;
图4为本发明实施例四提供的一种计算设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例及附图中的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例的描述中,“配置文件表”中包含有待上传文件的文件信息和上传路径信息。其中,文件信息包括文件名称、文件编号、文件标签和文件简介等。RPA机器人在执行文件上传操作时,是按照配置文件表进行上传的。
本发明实施例的描述中,“目标网站”是配置于服务器端可供用户访问的网站。其中,“服务器”是指具有文件上传需求的业务***后端。
本发明实施例的描述中,“客户端”是具有文件上传需求的业务***前端,“客户端”可以为业务***对应的应用软件,也可以为浏览器,以便RPA机器人通过浏览器访问业务***的网站。
本发明实施例的描述中,“上传路径信息”为待上传文件在上传到目标网站后,在目标网站中的存储地址。RPA机器人可按照该上传路径信息将文件上传到目标网站的目标文件夹中。
在本发明实施例的描述中,术语“对话机器人”,广义上来讲,是指能够与人类通过语音或文字进行对话交互的计算机程序。
在本发明实施例的描述中,术语“知识语料库”是某一业务领域内若干个知识点形成的结构化集合。
为了更加清楚、明白地解释本发明各实施例的内容,下面先对本发明实施例的基本工作原理进行简单介绍。
机器人流程自动化(Robotic Process Automation)简称RPA,是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
AI(Artificial Intelligence)是人工智能的英文缩写,它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用***的一门新的技术科学。本发明实施例所用到的AI技术包括OCR(Optical Character Recognition,光学字符识别)技术和NLP(Natural Language Processing,自然语言处理)技术。本实施例中,采用OCR技术可对PDF格式或图片格式的配置文件表进行识别,或者可对网页中验证码所在的图片进行识别。采用NLP技术中的语义识别算法可对待上传文件的文件类型进行确定。
目前,文件资料的上传操作,例如培训资料的上传操作完全是由人工来完成的。人工在登录学习网站把相应资料上传后,还需填写资料说明。如果遇到网络异常和***异常情况,上传操作和填写资料操作还得从头来做,费时费力。为了解决上述问题,本发明实施例提供的方案,通过RPA机器人来代替人工操作,RPA机器人按照配置文件表中待上传文件的上传路径信息,将各个待上传文件上传到目标网站中。并在各文件上传成功之后,在目标网站的网页操作界面填写该文件的文件说明。在上传过程中如果出现网络故障,RPA机器人则将重新执行文件的上传操作。本发明实施例这样设置提高了文件上传的效率,节省了大量的人力资源和时间资源。
本发明实施例公开了一种基于RPA及AI的文件处理方法、装置、设备及介质。以下分别进行详细说明。
实施例一
图1a为本发明实施例一提供的一种基于RPA及AI的文件处理方法的流程图,该方法可应用于将各种文件资料上传到目标网站的应用场景下,典型的是可应用于将学***台的场景下。其中,用户可通过私有账号上传、浏览和下载该目标网站中存储的文件。该目标网站也可以为共享网站,用于存放共享文件。不同用户可通过相同的账号登录该共享网站,浏览和下载该网站的内容。本实施例提供的基于RPA及AI的文件处理方法可通过基于RPA及AI的文件处理装置来执行,该装置可通过软件和/或硬件的方式来实现,本实施例的技术方案是通过RPA机器人来执行的,该RPA机器人可搭载在UiBot Creator平台,该UiBot Creator平台是一款专业强大的机器人生产工具,为机器人提供良好载体。如图1a所示,该方法包括:
S110、读取配置文件表。
其中,配置文件表可作为待上传文件的资料说明,其中包含有待上传文件的文件信息和上传路径信息。其中,文件信息包括文件名称、文件编号、文件标签和文件简介等。该配置文件可由相关人员编写并存放于本地指定文件夹中。RPA机器人可从该指定文件夹中读取到该配置文件表的内容。
示例性的,配置文件表一般为Excel(一种电子表格软件)文档。RPA机器人可根据该文档的表格格式,例如,左右格式,或者上下格式,直接读取到该文档的文档内容。具体的,下表1为一种学习文件的配置文件表。如下表1所示,该表格为上下格式的表格文件,即第一行为表头,即文件的属性信息,从第二行开始为具体的文件内容,即属性值。RPA机器人可根据该表格文件的格式,读取出待上传文件的文件信息和上传路径信息。其中,上传路径信息为待上传文件上传到目标网站的存储地址。
示例性的,如果配置文件表为PDF(Portable Document Format,便携式文档格式)格式或是图片格式的文件,则RPA机器人可通过调用OCR组件,对该配置文件表进行识别,得到该配置文件表中每个单元格的内容及各单元格在表格中的位置信息,即行列索引,并可从每个单元格的内容提取出待上传文件的文件信息和上传路径信息。
表1学习资料配置文件表
S120、如果确定目标网站未存储待上传文件,则获取待上传文件,并将各个待上传文件按照对应的上传路径信息依次上传到目标网站中。
本实施例中,RPA机器人可通过目标网站的登录账号和登录密码登录该网站,并可判断出该网站是否存储有配置文件表中的待上传文件。
示例性的,如果判断出目标网站已存储有该待上传文件,则不对该待上传文件执行上传操作,并可对配置文件表中的该文件进行标记,以提醒文件管理人员该文件已存储于目标网站中。
示例性的,如果判断出目标网站未存储该待上传文件,则从本地的设定文件夹中获取该待上传文件。其中,待上传文件在本地的存储地址可设置于配置文件表中,RPA机器人可按照该表中的本地存储地址获取到该待上传文件。或者,在创建RPA机器人对应的流程块时,也可创建用于打开本地设定文件夹的流程块,以使RPA机器人在执行到该流程块的内容时,通过打开本地设定文件夹来获取到该待上传文件。
在获取到该待上传文件后,可按照各上传文件对应的文件路径信息,将其依次上传到目标网站。其中,待上传文件的上传顺序可按照该文件在配置文件表中所在位置的先后顺序来执行。具体的,RPA机器人从配置文件表中每读取到一个未存储的待上传文件,则执行一次对该文件的获取和上传操作。
本实施例中,在每个待上传文件上传成功之后,网站页面会弹出文件上传成功的消息提示框。当然,如果文件上传失败,网站页面也会弹出文件上传失败的消息提示框。RPA机器人可通过识别该提示框中的提示信息确定文件是否上传成功。具体的,RPA机器人可通过NLP技术中的语义识别或关键字匹配方法,对消息框中的提示消息进行设别,以确定文件是否上传成功。
S130、对于任意一个上传成功的文件,在目标网站的网页操作界面填写该文件对应的文件信息。
本实施例中,对于任意一个上传成功的文件,在该文件上传成功之后,RPA机器人需在目标网站的网页操作界面填写对该文件的文件说明,以使用户在无需打开具体文件的情况下,能够通过文件说明了解到文件的基本信息。
具体的,图1b为本发明实施例一提供的RPA机器人在目标网站填写文件说明的效果截图。如图1b所示,需要填写的文件信息包括文件标题、课程编号、课程目录、标准学时、文件标签和文件简介等。RPA机器人可从配置文件表中读取到各文件的文件信息,并填入目标网站。
本实施例提供的技术方案,RPA机器人可从配置文件表中读取待上传文件的文件信息和上传路径信息,并将各个待上传文件按照对应的上传路径信息依次上传到目标网站。通过采用RPA机器人代替人工来执行文件上传操作的方式,节省了大量的人力资源和时间资源。在文件上传成功之后,RPA机器人可在目标网站的网页操作界面填写该文件对应的文件说明,以使用户在未打开文件的情况下,能够清楚、直观地了解的文件的基本信息,为用户提供了便利。
实施例二
图2a为本发明实施例二提供的一种基于RPA及AI的文件处理方法的流程图,本实施例在上述实施例的基础上,对目标网站的登录过程,以及文件上传的具体过程,以及文件上传之后,用户访问目标网站点击该文件的过程进行了细化,如图2a所示,本实施例提供的方法包括:
S210、读取配置文件表,得到待上传文件的文件信息和上传路径信息。
S220、获取目标网站的登录账号和登录密码,并将登录账号及其登录密码输入目标网站的登录对话框中,以登录目标网站。
本实施例中,在登录目标网站的过程中,如果检测到存在验证码,则可采用OCR技术对验证码所在图片进行识别,并将识别结果输入登录对话框的验证码填写处。
S230、如果确定目标网站未存储待上传文件,则获取待上传文件,并将待上传文件上传到目标网站的设定文件夹中。
本实施例中,设定文件夹可作为待上传文件存储的中转站,用于暂存各个待上传文件,以便后续可根据各文件的文件类型对其进行分类存储。
S240、对于设定文件夹中的任意一个文件,如果目标网站的文件目录中不存在该文件的文件类型对应的目标文件夹,则根据文件类型在目标网站创建对应的目标文件夹,并将该目标文件夹添加到文件目录中。
示例性的,配置文件表的文件信息中通常包含有待上传文件的文件类型。RPA机器人可从配置文件表中读取到待上传文件的文件类型。
本实施例中,待上传文件的文件路径信息是该文件在目标网站的存储地址,该地址能够反映出目标网站各文件夹之间的层级关系,该层级关系中的最后一级表示的是具体的文件名及文件格式,例如“组织架构/公司架构/公司介绍/公司简介.doc”,“教学视频/基础课视频/语文视频/作文强化视频.avi”,或者如上表1中所示的“云课堂视频上传\视频路径\多流程协作.wmv”等。
示例性的,RPA机器人可通过解析文件路径信息,得到待上传文件的文件类型,通常为该文件所在文件夹的文件名,例如,“作文强化视频”这一待上传文件对应的类型为“语文视频”,“公司简介”这一待上传文件对应的类型为“公司介绍”。
特别的,如果RPA机器人无法从文件路径信息中解析得到文件类型,则可通过NLP技术对文件的文件名进行语义识别,得到该文件的文件类型。
本实施例中,在确定出待上传文件的文件类型后,如果检测出目标网站的文件目录中不存在该文件类型对应的目标文件夹,则可根据该文件类型在目标网站创建对应的目标文件夹,以用于实现对该文件的分类存储。具体的,该目标文件夹可以该文件的文件类型来命名。在创建了目标文件夹之后,可通过刷新目标网站的网页界面,将该目标文件夹添加到文件目录中。
S250、按照上传路径信息,将设定文件夹中的文件移动到对应的目标文件夹中进行存储。
S260、在文件上传过程中,如果检测到文件上传失败的提示信息,或者在设定时间内未检测到文件上传成功的提示信息,则退出目标网站,并执行目标网站的重新登录,以及文件的上传操作。
本领域技术人员可以理解的是,在文件上传过程中,可能会出现网络异常或目标网站***异常的情况。上述情况的出现将会导致文件无法正常上传到目标网站。在上述的情况下,网页界面通常会出现文件上传失败的提示信息,或者在设定时间,例如2分钟内,无法显示文件上传成功的提示信息。如果RPA机器人识别出存在文件上传失败的提示信息时,或者在设定时间内,无法得到文件上传成功的提示信息,则确定文件上传失败。
示例性的,在上述情况下,RPA机器人可通过不断刷新网页的方式等待网络恢复正常,并可在网络恢复正常后,重新执行文件的上传操作。
示例性的,RPA机器人也可退出该目标网站,并可重新执行目标网站的登录以及文件的上传操作。
本实施例这样设置,在网络异常或目标网站***异常的情况下,通过RPA机器人替代人工重复执行文件的上传操作,节省了人力资源和大量的时间,
下面,以待上传文件是学***台搭建的RPA机器人的流程效果截图。如图2b所示,RPA机器人在每次执行完视频信息的上传操作之后,都会判断上传过程是否存在异常,即检测是否接收到上传失败的提示信息或者在设定时间内判断是否未接收到上传成功的提示信息。如果未出现异常,则确定视频信息上传成功。
进一步的,目标网站的数据库中存储有不同学员对各个学习资料类型的关注情况。RPA机器人可根据用户对目标网站各文件夹的浏览记录,例如,点击率,确定关注学习资料所属类型的目标用户,并可将学习资料上传成功的提示信息发送给目标用户,从而可提醒目标用户观看所关注的视频信息。本实施例这样设置替代了人工登录目标网站查询是否有其所关注的文件的上传情况,为用户的操作提供了极大的便利,提升了用户体验。
本实施例中,目标网站还可以为共享存储空间,例如企业办公软件的共享空间,或者企业申请使用的云空间等。相应的,待上传文件可以为供企业员工查看或下载的文件资料,例如,技术文件资料、产品资料或学习资料等。
在上述应用场景下,RPA机器人在将待上传文件上传到目标网站后,可获取目标网站中所有文件的文件名及其链接,并可将所有文件的文件名及其链接添加到对话机器人的知识语料库中。其中,对话机器人是指能够与人类通过语音或文字进行对话交互的计算机程序,可搭载在常用的办公软件中。这样设置,解决了人工手动更新对话机器人知识语料库费时费力的问题,这也是本发明实施例的创新点之一。
在利用RPA机器人完成对对话机器人知识语料库的更新之后,用户在通过对话机器人查询文件的过程中,对话机器人可自动将最新文件对应的链接发送给用户,避免了手动登录目标网站查找文件的操作,节省了操作时间,提高了工作效率。
示例性的,对于用户输入的关于待查询文件的提问语句,如果对话机器人的知识语料库中不存在该提问语句对应答案的链接,则可将该查询语句的目录信息返回给用户,用户可根据实际需求点击目录信息中的相关选项。对话机器人可根据用户的点击操作返回给用户对应文件夹的文件名及其链接,以供用户进行访问。这样设置的好处在于,在对话机器人无法给出用户提问语句答案的情况下,为用户提供更多的选择,提升用户体验。
本实施例提供的技术方案,在文件上传过程中,如果RPA机器人确定出目标网站的文件目录中不存在与待上传文件的文件类型对应的目标文件夹,则根据该文件的类型在目标网站创建对应的目标文件夹。这样设置,便于将待上传文件进行分类存储。此外,RPA机器人在将待上传文件上传到目标网站后,可获取目标网站中所有文件的文件名及其链接,并可将所有文件的文件名及其链接添加到对话机器人的知识语料库中,解决了人工手动更新对话机器人知识语料库费时费力的问题。
实施例三
图3为本发明实施例三提供的一种基于RPA及AI的文件处理装置的结构框图,如图3所示,该装置包括:配置文件读取模块310、文件上传模块320和文件信息填写模块330;其中,
配置文件读取模块310,被配置为:读取配置文件表,所述配置文件表中包括待上传文件的文件信息和上传路径信息;
文件上传模块320,被配置为:如果确定目标网站未存储所述待上传文件,则获取所述待上传文件,并将各个待上传文件按照对应的上传路径信息依次上传到所述目标网站中;
文件信息填写模块330,被配置为:对于任意一个上传成功的文件,在所述目标网站的网页操作界面填写该文件对应的文件信息。
可选的,所述配置文件读取模块,包括:
识别单元,被配置为:如果所述配置文件表为便携式文档PDF格式或是图片格式,则调用光学字符识别OCR组件对所述配置文件表进行识别,得到所述配置文件表中每个单元格的内容及各单元格在表格中的位置信息;
上传信息确定单元,被配置为:从各单元格的内容中确定待上传文件的文件信息和上传路径信息;
相应的,所述文件上传模块,具体被配置为:
如果确定目标网站未存储所述待上传文件,则获取所述待上传文件,并根据各待上传文件在表格中位置的先后顺序,将各个待上传文件按照对应的上传路径信息依次上传到所述目标网站中。
可选的,所述文件上传模块,包括:
网站登录单元,被配置为:获取目标网站的登录账号和登录密码,并将所述登录账号及其登录密码输入所述目标网站的登录对话框中,以登录所述目标网站;
文件上传单元,被配置为:如果确定所述目标网站未存储所述待上传文件,则获取所述待上传文件,并将所述待上传文件上传到所述目标网站的设定文件夹中;
文件移动单元,被配置为按照所述上传路径信息,将所述设定文件夹中的文件移动到对应的目标文件夹中进行存储。
可选的,所述装置还包括:
目标文件夹创建单元,被配置为:对于所述设定文件夹中的任意一个文件,如果所述目标网站的文件目录中不存在与该文件的文件类型对应的目标文件夹,则根据所述文件类型在所述目标网站创建对应的目标文件夹,并将该目标文件夹添加到所述文件目录中。
可选的,所述装置还包括:
验证码识别模块,被配置为:在登录所述目标网站的过程中,如果检测到存在验证码,则对所述验证码进行光学字符OCR识别,并将识别结果输入所述登录对话框的验证码填写处。
可选的,所述装置还包括:
重新上传模块,被配置为:在文件上传过程中,如果检测到文件上传失败的提示信息,或者在设定时间内未检测到文件上传成功的提示信息,则退出所述目标网站,并执行所述目标网站的重新登录,以及文件的上传操作。
可选的,所述待上传文件为学习资料;相应的,所述装置还包括:
目标用户确定模块,被配置为:根据用户的浏览记录,确定关注所述学习资料所属类型的目标用户;
消息发送模块,被配置为:将所述学习资料上传成功的提示信息发送给所述目标用户。
本发明实施例所提供的基于RPA及AI的文件处理装置可执行本发明任意实施例所提供的基于RPA及AI的文件处理方法,具备执行方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于RPA及AI的文件处理方法。
实施例四
请参阅图4,图4为本发明实施例四提供的一种计算设备的结构示意图。如图4所示,该计算设备可以包括:
存储有可执行程序代码的存储器701;
与存储器701耦合的处理器702;
其中,处理器702调用存储器701中存储的可执行程序代码,执行本发明任意实施例所提供的基于RPA及AI的文件处理方法。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行本发明任意实施例所提供的基于RPA及AI的文件处理方法。
在本发明的各种实施例中,应理解,上述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在本发明所提供的实施例中,应理解,“与A相应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。
另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例上述方法的部分或全部步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域普通技术人员可以理解:实施例中的装置中的模块可以按照实施例描述分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。

Claims (13)

1.一种基于RPA及AI的文件处理方法,其特征在于,包括:
S1、读取配置文件表,所述配置文件表中包括待上传文件的文件信息和上传路径信息;
S2、如果确定目标网站未存储所述待上传文件,则获取所述待上传文件,并将各个待上传文件按照对应的上传路径信息依次上传到所述目标网站中,并且,在将待上传文件上传到所述目标网站后,获取所述目标网站中所有文件的文件名及其链接,并将所有文件的文件名及其链接添加到对话机器人的知识语料库中,以供对话机器人将最新文件对应的链接发送给用户;用户在通过对话机器人查询文件的过程中,对于用户输入的关于待查询文件的提问语句,如果对话机器人的知识语料库中不存在该提问语句对应答案的链接,则将查询语句的目录信息返回给用户,并且,对话机器人根据用户对目标信息的点击操作返回给用户对应文件夹的文件名及其链接,以供用户进行访问;
S3、对于任意一个上传成功的文件,在所述目标网站的网页操作界面填写该文件对应的文件信息。
2.根据权利要求1所述的方法,其特征在于,所述S1包括:
S11、如果所述配置文件表为便携式文档PDF格式或是图片格式,则调用光学字符识别OCR组件对所述配置文件表进行识别,得到所述配置文件表中每个单元格的内容及各单元格在表格中的位置信息;
S12、从各单元格的内容中确定待上传文件的文件信息和上传路径信息;
相应的,所述S2具体包括:
如果确定目标网站未存储所述待上传文件,则获取所述待上传文件,并根据各待上传文件在表格中位置的先后顺序,将各个待上传文件按照对应的上传路径信息依次上传到所述目标网站中。
3.根据权利要求1所述的方法,其特征在于,所述S2具体包括:
S21、获取目标网站的登录账号和登录密码,并将所述登录账号及其登录密码输入所述目标网站的登录对话框中,以登录所述目标网站;
S22、如果确定所述目标网站未存储所述待上传文件,则获取所述待上传文件,并将所述待上传文件上传到所述目标网站的设定文件夹中;
S23、按照所述上传路径信息,将所述设定文件夹中的文件移动到对应的目标文件夹中进行存储。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
S24、对于所述设定文件夹中的任意一个文件,如果所述目标网站的文件目录中不存在与该文件的文件类型对应的目标文件夹,则根据所述文件类型在所述目标网站创建对应的目标文件夹,并将该目标文件夹添加到所述文件目录中。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
S4、在登录所述目标网站的过程中,如果检测到存在验证码,则对所述验证码进行光学字符OCR识别,并将识别结果输入所述登录对话框的验证码填写处。
6.根据权利要求3所述的方法,其特征在于,所述方法还包括:
S5、在文件上传过程中,如果检测到文件上传失败的提示信息,或者在设定时间内未检测到文件上传成功的提示信息,则退出所述目标网站,并执行所述目标网站的重新登录,以及文件的上传操作。
7.根据权利要求1所述的方法,其特征在于,所述待上传文件为学习资料;相应的,所述方法还包括:
根据用户的浏览记录,确定关注所述学习资料所属类型的目标用户;
将所述学习资料上传成功的提示信息发送给所述目标用户。
8.一种基于RPA及AI的文件处理装置,其特征在于,包括:
配置文件读取模块,被配置为:读取配置文件表,所述配置文件表中包括待上传文件的文件信息和上传路径信息;
文件上传模块,被配置为:如果确定目标网站未存储所述待上传文件,则获取所述待上传文件,并将各个待上传文件按照对应的上传路径信息依次上传到所述目标网站中,并且,在将待上传文件上传到所述目标网站后,获取所述目标网站中所有文件的文件名及其链接,并将所有文件的文件名及其链接添加到对话机器人的知识语料库中,以供对话机器人将最新文件对应的链接发送给用户;用户在通过对话机器人查询文件的过程中,对于用户输入的关于待查询文件的提问语句,如果对话机器人的知识语料库中不存在该提问语句对应答案的链接,则将查询语句的目录信息返回给用户,并且,对话机器人根据用户对目标信息的点击操作返回给用户对应文件夹的文件名及其链接,以供用户进行访问;
文件信息填写模块,被配置为:对于任意一个上传成功的文件,在所述目标网站的网页操作界面填写该文件对应的文件信息。
9.根据权利要求8所述的装置,其特征在于,所述配置文件读取模块,包括:
识别单元,被配置为:如果所述配置文件表为便携式文档PDF格式或是图片格式,则调用光学字符识别OCR组件对所述配置文件表进行识别,得到所述配置文件表中每个单元格的内容及各单元格在表格中的位置信息;
上传信息确定单元,被配置为:从各单元格的内容中确定待上传文件的文件信息和上传路径信息;
相应的,所述文件上传模块,具体被配置为:
如果确定目标网站未存储所述待上传文件,则获取所述待上传文件,并根据各待上传文件在表格中位置的先后顺序,将各个待上传文件按照对应的上传路径信息依次上传到所述目标网站中。
10.根据权利要求8所述的装置,其特征在于,所述文件上传模块,包括:
网站登录单元,被配置为:获取目标网站的登录账号和登录密码,并将所述登录账号及其登录密码输入所述目标网站的登录对话框中,以登录所述目标网站;
文件上传单元,被配置为:如果确定所述目标网站未存储所述待上传文件,则获取所述待上传文件,并将所述待上传文件上传到所述目标网站的设定文件夹中;
文件移动单元,被配置为按照所述上传路径信息,将所述设定文件夹中的文件移动到对应的目标文件夹中进行存储。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:
目标文件夹创建单元,被配置为:对于所述设定文件夹中的任意一个文件,如果所述目标网站的文件目录中不存在与该文件的文件类型对应的目标文件夹,则根据所述文件类型在所述目标网站创建对应的目标文件夹,并将该目标文件夹添加到所述文件目录中。
12.一种计算设备,其特征在于,所述计算设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的基于RPA及AI的文件处理方法。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的基于RPA及AI的文件处理方法。
CN202111283652.7A 2021-11-01 2021-11-01 基于rpa及ai的文件处理方法、装置、设备及介质 Active CN114024955B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111283652.7A CN114024955B (zh) 2021-11-01 2021-11-01 基于rpa及ai的文件处理方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111283652.7A CN114024955B (zh) 2021-11-01 2021-11-01 基于rpa及ai的文件处理方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN114024955A CN114024955A (zh) 2022-02-08
CN114024955B true CN114024955B (zh) 2024-03-12

Family

ID=80059236

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111283652.7A Active CN114024955B (zh) 2021-11-01 2021-11-01 基于rpa及ai的文件处理方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN114024955B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117573243B (zh) * 2024-01-17 2024-05-10 杭州实在智能科技有限公司 用于信创体系的rpa文件操作和管理方法及***

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110460668A (zh) * 2019-08-15 2019-11-15 深圳市盟天科技有限公司 一种文件上传方法、装置、计算机设备和存储介质
CN110958292A (zh) * 2019-09-17 2020-04-03 平安银行股份有限公司 文件上传方法、电子装置、计算机设备及存储介质
CN111242577A (zh) * 2020-01-13 2020-06-05 中国建设银行股份有限公司 Rpa流程自动化机器人部署方法、装置及电子设备
CN111752900A (zh) * 2020-06-30 2020-10-09 北京来也网络科技有限公司 基于rpa及ai的文件存储方法、装置、设备和介质
WO2021003932A1 (zh) * 2019-07-05 2021-01-14 平安国际智慧城市科技股份有限公司 文件管理方法、装置、计算机设备和存储介质
CN112347042A (zh) * 2020-11-05 2021-02-09 中国平安人寿保险股份有限公司 文件上传方法、装置、电子设备及存储介质
CN112668988A (zh) * 2019-10-15 2021-04-16 尤帕斯公司 使用人工智能(ai)的媒体到工作流生成

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102685223A (zh) * 2012-04-28 2012-09-19 广州市动景计算机科技有限公司 基于云端存储的文件处理方法及***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021003932A1 (zh) * 2019-07-05 2021-01-14 平安国际智慧城市科技股份有限公司 文件管理方法、装置、计算机设备和存储介质
CN110460668A (zh) * 2019-08-15 2019-11-15 深圳市盟天科技有限公司 一种文件上传方法、装置、计算机设备和存储介质
CN110958292A (zh) * 2019-09-17 2020-04-03 平安银行股份有限公司 文件上传方法、电子装置、计算机设备及存储介质
CN112668988A (zh) * 2019-10-15 2021-04-16 尤帕斯公司 使用人工智能(ai)的媒体到工作流生成
CN111242577A (zh) * 2020-01-13 2020-06-05 中国建设银行股份有限公司 Rpa流程自动化机器人部署方法、装置及电子设备
CN111752900A (zh) * 2020-06-30 2020-10-09 北京来也网络科技有限公司 基于rpa及ai的文件存储方法、装置、设备和介质
CN112347042A (zh) * 2020-11-05 2021-02-09 中国平安人寿保险股份有限公司 文件上传方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN114024955A (zh) 2022-02-08

Similar Documents

Publication Publication Date Title
US20130103391A1 (en) Natural language processing for software commands
CA3001800A1 (en) Automated generation of narrative responses to data queries
US11663255B2 (en) Automatic collaboration between distinct responsive devices
CN102880683B (zh) 一种可行性研究报告的自动网络生成***及其生成方法
US11557219B2 (en) Generating and rating user assessments
CN114024955B (zh) 基于rpa及ai的文件处理方法、装置、设备及介质
US11262978B1 (en) Voice-adapted reformulation of web-based answers
CN112418875A (zh) 跨平台税务智能客服语料迁移方法及装置
US11526567B2 (en) Contextualizing searches in a collaborative session
US20220406210A1 (en) Automatic generation of lectures derived from generic, educational or scientific contents, fitting specified parameters
US20230177631A1 (en) Automatically enhancing content items through identifying relationships
US20230101339A1 (en) Automatic response prediction
WO2023100050A1 (en) Conversational agent counterfactual simulation
US11113081B2 (en) Generating a video for an interactive session on a user interface
Svetsky et al. Universal IT Support Design for Engineering Education
CN111984781A (zh) 偏见最小化的自动概括
Sankar et al. The Applied AI and Natural Language Processing Workshop: Explore practical ways to transform your simple projects into powerful intelligent applications
CA2672630A1 (en) Providing user assistance for a software application
Hashim et al. Content management system (CMS) for public health professional in health, Malaysia: A conceptual framework
Warholm Promoting Data Journalism with Purpose-Made Systems: A case study of the benefits of purpose-made data journalism systems among Norwegian Data Journalists
US20240193213A1 (en) Machine-learning based document recommendation for online real-time communication system
US11314785B2 (en) Automatic visualization and inquiry generation
US20230083444A1 (en) Adjusting digital presentation material using machine learning models
Tham A conversational question and answer chatbot for university
Cooney et al. Lab 1–Product Description

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant