CN110007842A - 网页内容选取方法及装置 - Google Patents

网页内容选取方法及装置 Download PDF

Info

Publication number
CN110007842A
CN110007842A CN201910312561.8A CN201910312561A CN110007842A CN 110007842 A CN110007842 A CN 110007842A CN 201910312561 A CN201910312561 A CN 201910312561A CN 110007842 A CN110007842 A CN 110007842A
Authority
CN
China
Prior art keywords
webpage
page
terminal
location information
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910312561.8A
Other languages
English (en)
Inventor
汪伟利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Guanqun Information Technology Ltd By Share Ltd
Original Assignee
Beijing Guanqun Information Technology Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Guanqun Information Technology Ltd By Share Ltd filed Critical Beijing Guanqun Information Technology Ltd By Share Ltd
Priority to CN201910312561.8A priority Critical patent/CN110007842A/zh
Publication of CN110007842A publication Critical patent/CN110007842A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种网页内容选取方法及装置,涉及互联网技术领域。该网页内容选取方法包括:接收终端网页页面的点击指令,点击指令包括对终端网页页面点击位置的位置信息,确定位置信息对应的网页页面元素,获取网页页面元素对应的网络信息,网络信息包括下述一项或多项:网页页面元素的基本类型标识、位置信息和内容的类型枚举。该方法在用户需要选取特定的网页页面元素时,只需要用户在可浏览网页的终端上对其想要选取的特定网页页面元素直接进行点击即可,操作简单,提高了通用性。

Description

网页内容选取方法及装置
技术领域
本发明涉及互联网技术领域,具体而言,涉及一种网页内容选取方法及装置。
背景技术
在互联网应用技术中,有时需要对网页上特定位置的内容进行不定时的多次提取,例如:标题、图片、时间、视频或评论等,从而进一步对获取到的内容进行保存或分析等,尤其在互联网爬虫技术中的应用尤为广泛。
然而,在现有技术中,对于网页内容的提取方式,一般是通过编程语言的方式来提取,操作方式复杂。
发明内容
本发明的目的在于,针对上述现有技术中的不足,提供一种网页内容选取方法及装置,以解决操作复杂的问题。
为实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种网页内容选取方法,所述方法包括:接收终端网页页面的点击指令,所述点击指令包括对所述终端网页页面点击位置的位置信息,确定所述位置信息对应的网页页面元素,获取所述网页页面元素对应的网络信息,所述网络信息包括下述一项或多项:网页页面元素的基本类型标识、位置信息和内容的类型枚举。
一种实现方式中,所述接收终端网页页面的点击指令之前,还包括:接收用户输入的登录信息,所述登录信息包括:用户标识,向服务器发送登录请求,所述登录请求包括所述登录信息,接收所述服务器发送的登录成功响应。
一种实现方式中,所述确定所述位置信息对应的网页页面元素之后,还包括:向所述服务器发送历史数据查询请求,所述历史数据查询请求包括:所述用户标识、以及所述网页页面元素对应的网页标识,接收所述服务器根据所述网页标识发送的历史数据,所述历史数据包括:历史选取的所述网页标识对应的历史网页页面元素,查询所述网页标识对应的历史网页页面元素中是否包含所述位置信息对应的网页页面元素。
一种实现方式中,所述获取所述网页页面元素对应的网络信息,包括:若所述网页标识对应的历史网页页面元素中不包含所述位置信息对应的网页页面元素,则获取所述网页页面元素对应的网络信息。
一种实现方式中,所述确定所述位置信息对应的网页页面元素之后,还包括:生成所述网页页面元素对应的选中标识;在所述终端网页页面上显示所述选中标识,其中,所述选中标识在所述终端网页页面上用于框选所述位置信息对应的网页页面元素。
第二方面,本发明实施例还提供了一种网页内容选取装置,所述装置包括:接收模块、确定模块和获取模块,所述接收模块,用于接收终端网页页面的点击指令,所述点击指令包括对所述终端网页页面点击位置的位置信息,所述确定模块,用于确定所述位置信息对应的网页页面元素所述获取模块用户,所述获取模块,用于获取所述网页页面元素对应的网络信息,所述网络信息包括下述一项或多项:网页页面元素的基本类型标识、位置信息和内容的类型枚举。
一种实现方式中,所述装置还包括登录模块,用于接收用户输入的登录信息,所述登录信息包括:用户标识,向服务器发送登录请求,所述登录请求包括所述登录信息,接收所述服务器发送的登录成功响应。
一种实现方式中,所述确定模块还用于向所述服务器发送历史数据查询请求,所述历史数据查询请求包括:所述用户标识、以及所述网页页面元素对应的网页标识,接收所述服务器根据所述网页标识发送的历史数据,所述历史数据包括:历史选取的所述网页标识对应的历史网页页面元素,查询所述网页标识对应的历史网页页面元素中是否包含所述位置信息对应的网页页面元素。
一种实现方式中,所述获取模块具体用于若所述网页标识对应的历史网页页面元素中不包含所述位置信息对应的网页页面元素,则获取所述网页页面元素对应的网络信息。
一种实现方式中,所述装置还包括显示模块,用于生成所述网页页面元素对应的选中标识,在所述终端网页页面上显示所述选中标识,其中,所述选中标识在所述终端网页页面上用于框选所述位置信息对应的网页页面元素。
本发明的有益效果是:该网页内容选取方法通过接收终端网页页面的点击指令,其中,点击指令包括对终端网页页面点击位置的位置信息,确定位置信息对应的网页页面元素,获取网页页面元素对应的网络信息,网络信息包括下述一项或多项:网页页面元素的基本类型标识、位置信息和内容的类型枚举,该方法在用户需要选取特定的网页页面元素时,只需要用户在可浏览网页的终端上对其想要选取的特定网页页面元素直接进行点击即可,操作简单,提高了通用性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请第一实施例提供的一种网络内容选取方法的应用场景示意图;
图2为本申请第二实施例提供的一种网页内容选取方法的流程示意图;
图3为本申请第二实施例提供的一种网页内容选取方法的用户登录流程示意图;
图4为本申请第二实施例提供的另一种网页内容选取方法的流程示意图;
图5为本申请第二实施例提供的又一种网页内容选取方法的流程示意图;
图6为本申请第二实施例提供的一种选取网页内容前显示示意图;
图7为本申请第二实施例提供的一种选取网页内容后显示示意图;
图8为本申请第三实施例提供的一种网页内容选取装置的示意图;
图9为本申请第四实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“网页内容选取”,给出以下实施方式。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕请求批处理进行描述,但是应该理解,这仅是一个示例性实施例。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
第一实施例
图1为本申请第一实施例提供的一种网络内容选取方法的应用场景示意图,如图1所示,在该应用场景中,可以包括任意的智能手机1、计算机2或平板电脑3等终端设备,只要可以浏览网页的终端即可,将该终端通过网络4与服务器5建立通信连接,以进行数据通信或交互等。
其中,在终端中将选取网页页面内容的指令信息可以用可视化的计算机应用程序(Application,简称APP)形式的界面、插件形式的界面或网址链接等方式将终端上所执行的命令可视化,通过网络4将执行后的数据信息发送到服务器5,该网络4可以是无线网络或有线网络等通信方式,该服务器5中可以包括处理终端发送的数据的处理器和存储当前处理的数据的存储器,通过服务器5对接收到的终端发送的数据进行处理和计算等操作,再将这种处理过的数据发送到终端设备供使用终端的用户查看。
第二实施例
图2为本申请第二实施例提供的一种网页内容选取方法的流程示意图,如图2所示,该方法包括:
S101、接收终端网页页面的点击指令,点击指令包括对终端网页页面点击位置的位置信息。
具体的,当用户在终端上进入网页页面之后,如果要选取网页页面上的一些网页页面元素,例如:选取网页页面元素对应的网站类型、新闻类型、文章标题、时间、来源、源标题和参与人数中的任意元素,将其终端设置为选取网页内容的模式,此时,用户点击终端网页上的要选取元素的位置,就可以进行网页内容的选取操作,当用户选取网页内容的操作结束之后,又可以重新设置为仅浏览网页的模式,此时,点击网页上的位置只能是浏览网页。其中,可以在登录相关的网页页面选择APP之后进入选取网页内容的模式。
因此,当设置为选取网页内容的模式时,终端设备检测到用户的点击指令是对网页上内容的选取操作,此时,用户通过点击要选取的网页上网页页面元素对应的位置,终端即时根据用户点击终端网页页面的触碰位置信息,来接收用户点击终端网页页面的点击指令。
可选地,若终端是计算机,接收的点击指令可以是通过鼠标移动计算机上光标的位置,进行点击要选取的网页页面上网页页面元素对应的位置,若终端是智能手机和平板电脑中任意一种,接收的点击指令可以是通过手指或触屏笔等直接点击要选取的网页页面上网页页面元素对应的位置。
S102、确定位置信息对应的网页页面元素。
具体的,用户在终端网页上想要选取的网页页面元素对应的坐标范围内点击。此时,点击指令会触发网页页面上响应的事件,在事件响应中,终端可以获取当前点击指令触发事件的位置对应的网页页面元素坐标范围,通过点击指令和相应的网页页面元素的坐标范围可以确定点击选取的网页页面元素。
S103、获取网页页面元素对应的网络信息,网络信息包括下述一项或多项:网页页面元素的基本类型标识、位置信息和内容的类型枚举。
需要说明的是,一般网页制作的结构都是基于文档对象模型构建的,即,把网页中的所有网页页面元素构建为树形结构,除了根节点之外的每个节点都有唯一的父节点,同时,除了叶子节点之外的每个节点可能拥有至少一个子节点,而且,同属一个父节点的所有子节点可以称为兄弟节点,树形结构中的每个节点可能包含多种属性信息,用于描述本节点。例如:一个节点中的属性可以包括本节点的唯一标识数字、姓名和显示样式等属性的任意一种,进一步通过所有节点之间的层级关系和属性信息,来确定唯一的节点,也就得到了该节点对应的网页页面元素的路径信息。
示例的:通过首先判断一个节点是否包含唯一的标识数字或名称等属性信息,再确定该节点在同级节点中的索引号,来唯一确定该节点的位置信息,从而得到该节点对应的网页页面元素的路径信息。
再将该路径信息,根据树形结构中节点之间属性信息,通过递归的方式,将选取的网页页面元素对应的节点的父节点的位置信息,经过整合处理,即可得到所选取的网页页面元素对应的位置描述信息。
然后根据该网页页面元素对应的位置描述信息,获取到对应的网络信息。其中,网络信息可以是至少包括网页页面元素的基本类型标识、位置信息和内容的类型枚举,其中基本类型标识可以是树形结构中对应的节点类型标识,位置信息可以是确定网页文档中某部分的位置语言,常用类描述网页中具体网页页面元素的位置信息,内容的类型枚举可以是指定当前选取的网页页面元素的内容,如标题、时间、作者或正文等。
可选地,当需要对当前已选取的网页页面元素需要删除时,同样可通过直接点击该网页页面元素坐标范围内的任意位置,根据点击指令的位置信息确认该元素是已经选取过时,则将其要删除的网页页面元素的网络信息进行删除。
获取上述网络信息之后,将网络信息进行存储,存储时可以使用网页页面元素的标识作为存储索引,与存储的内容一一对应。网页页面元素的标识可以是网页页面元素的名称、编号、域名、链接等,在此不作限制。
在本实施例中,该网页内容选取方法通过接收终端网页页面的点击指令,其中,点击指令包括对终端网页页面点击位置的位置信息,确定位置信息对应的网页页面元素,获取网页页面元素对应的网络信息,网络信息包括下述一项或多项:网页页面元素的基本类型标识、位置信息和内容的类型枚举,该方法在用户需要选取特定的网页页面元素时,只需要用户在可浏览网页的终端上对其想要选取的特定网页页面元素直接进行点击即可,操作简单,提高了通用性。
图3为本申请第二实施例提供的一种网页内容选取方法的用户登录流程示意图,为了实现上述获取的网络信息可以在多个终端同步,可以通过登录用户账号的方式,只要用户使用同一个账号,就可以实现共享,不论在哪个终端登录都可以通过服务器获取历史获取的网络信息。
如图3所示,一种实现方式中,接收终端网页页面的点击指令之前,还包括:
S201、接收用户输入的登录信息,登录信息包括:用户标识。
具体的,为保护用户选取的网页内容对应的数据,可以使用用户登录信息验证的方式,来提高用户使用时的信息安全性,同时,当用户使用登录信息登录后,通过该登录信息中的历史数据,还可以同步之前的数据,来提高用户选取网页内容的便利性,因此,用户首先是根据终端可视化的提示输入对应的登录信息。
可选地,用户输入的登录信息可以包括用户标识,即,用户账号和登录密码等。
进一步地,登录信息还可以包括验证码,验证码的方式可以是随机生成的数字验证和发送短信密码验证等方式。
S202、向服务器发送登录请求,登录请求包括登录信息。
具体的,当终端接收到用户输入的登录信息后,进一步根据用户的登录指令向服务器发送登录请求,服务器根据数据库中保存的登录信息验证当前终端发送的请求。
S203、接收服务器发送的登录成功响应。
具体的,当服务器验证用户的登录信息在数据库中保存的登录信息符合时,将登录成功的信息发送给终端,此时,终端将接收到登录成功的响应。
另外,若服务器将接收到的终端发送的登录信息在保存的数据库中没有验证通过时,则发送给终端登录失败的响应,终端接收到该登录失败的响应时,可以根据一项或多项不符合的信息将对应的失败响应发送给终端,终端接收之后根据对应的失败响应提示用户进行重新输入对应不符合的登录信息,以下一其中几种情况为例进行说明,示例的:
第一、若服务器发送到终端的失败响应是用户账号输入错误,则终端显示“该账号输入错误”,用户重新输入用户账号,重新登录。
第二、若服务器发送到终端的失败响应是登录密码输入有误,则终端显示“该密码输入错误”,用户重新输入登录密码,重新登录。
第三、若服务器发送到终端的失败响应是验证码输入有误,则终端显示“该验证码输入错误”,用户重新输入验证码,重新登录。
第四、若用户忘记自己的登录密码,可以通过点击忘记密码获取验证码来完成新密码的输入。
需要说明的是,具体的提示方式不仅仅限于上述所描述的方式,还可以是其他方式,在此不再一一赘述。
图4为本申请第二实施例提供的另一种网页内容选取方法的流程示意图,如图4所示,一种实现方式中,确定位置信息对应的网页页面元素之后,还包括:
S301、向服务器发送历史数据查询请求,历史数据查询请求包括:用户标识、以及网页页面元素对应的网页标识。
具体的,终端向服务器发送历史数据查询请求,可以是当用户通过鼠标移动网页上光标的位置,所点击选取好该网页上网页页面元素的网络信息之后,终端向服务器发送与当前登录信息在服务器数据库中对应的登录信息所匹配的历史数据,来进行更新服务器中保存的历史数据,简单来说,就是通过终端向服务器发送历史数据查询请求,来找到用户的登录信息在数据库中对应的该登录信息,并查询该登录信息中历史选取的网页页面元素对应的网页标识。
需要说明的是,在本申请实施例中所说的“请求”,可以是用户对终端可视化界面上对应的提交指令的点击,也可是默认为用户点击当前选取的网页页面元素后,终端自发的对服务器发送的一种请求。
S302、接收服务器根据网页标识发送的历史数据,历史数据包括:历史选取的网页标识对应的历史网页页面元素。
具体的,服务器根据接收到的终端发送的登录信息对应的历史数据查询请求,将服务器数据库中保存的与该登录信息对应的历史数据发送给终端,终端接收到之后,用户即可查看对应的历史数据,例如:用户在之前选取的网页标识对应的网页页面元素。
S303、查询网页标识对应的历史网页页面元素中是否包含位置信息对应的网页页面元素。
具体的,终端在接收到历史数据之后,用户在点击到当前选取的网页页面元素对应的位置信息之后,通过与历史选取的网页页面元素的位置信息进行匹配,查看是否已在历史数据中被选取。
进一步地,根据用户在终端设置的情况来确定是进行自动删除或是重复选取,例如:若当前点击的网页页面元素对应的位置信息与历史数据中有重复时,根据用户设置的情况,若是不进行重复选取,则不再对当前选取的网页页面元素对应的网络信息进行保存,若是需要重复选取,则继续对当前选取的网页页面元素对应的网络信息进行保存。
在本实施例中,通过查询历史数据,既可以实现数据同步的目的,避免用户重新进行选取操作,减少了用户的操作次数,为用户的使用带来了一定的便利。
下述将以一种实现方式为例进行说明设置为自动删除时的情况为例进行说明,示例的:
一种实现方式中,获取网页页面元素对应的网络信息,包括:若网页标识对应的历史网页页面元素中不包含位置信息对应的网页页面元素,则获取网页页面元素对应的网络信息。
具体的,若历史数据中的网页标识对应的网页页面元素没有用户当前点击的网页页面的位置信息得到的网页页面元素,则获取当前用户点击的网页页面位置信息对应的网页页面元素的网络信息,并进行保存。
进一步地,若网页标识对应的历史网页页面元素中包含位置信息对应的网页页面元素,则根据用户设置的自动删除模式,当用户再次点击网页上该网页页面元素对应的位置时,则直接删除。
可选地,当用户想要对已经选取的网页页面元素的网络信息进行删除时,可直接在终端界面上设置一种删除指令的操作,当点击该网页页面元素的对应的删除指令时,即可实现对已经选取的网页页面元素进行删除。
在本实施例中,通过将选取的网页页面元素进行删除或添加等操作,并与历史数据进行匹配,得到新的选取的网页页面元素的网络信息,进而将网页页面元素对应的网络信息发送到服务器,实现服务器中数据库的更新。
图5为本申请第二实施例提供的又一种网页内容选取方法的流程示意图,如图5所示,一种实现方式中,确定位置信息对应的网页页面元素之后,还包括:
S401、生成网页页面元素对应的选中标识。
具体的,当确定用户点击的网页页面的位置信息对应的网页页面元素之后,终端将根据用户设置的选中标识样式生成对应的选中标识。
可选地,选中标识可以有以下几种情况,示例的:
第一、在终端网页上光标经过某个网页页面元素时对应的该网页页面元素的坐标范围的选中标识。
第二、在终端网页上光标点击某个网页页面元素之后对应的该网页页面元素的坐标范围的选中标识。
第三、通过将已选中的网页页面元素对应的网络信息进行界面显示,在终端网页上通过点击或光标移动到网络信息显示界面上已选取的某个网络信息对应的网页页面元素在终端网页上对应位置的坐标范围的选中标识。
需要说明的是,在本申请中所说的选中标识可以通过在终端上设置为不同的显示标识样式,来显示不同的情况,例如:选中标识可以是标识样式和颜色等,而且所选中的情况不仅限于上述三种情况,根据用户的喜好设置其他选中标识的情况。
S402、在终端网页页面上显示选中标识,其中,选中标识在终端网页页面上用于框选位置信息对应的网页页面元素。
具体的,终端根据用户在终端网页上的不同操作类型在终端上显示对应操作类型的网页页面元素的选中标识。
可选地,选中标识可以是根据网页上该网页页面元素的位置坐标范围对应的边框,边框的显示样式可以根据用户自己的喜好设置为自己喜欢的样式,例如:选择线条的显示样式、颜色、粗细和形状等。
图6为本申请第二实施例提供的一种选取网页内容前显示示意图,图7为本申请第二实施例提供的一种选取网页内容后显示示意图,如图6和图7所示,下述将以一种示例情况为例进行说明当用户点击终端网页上要选取的网页页面元素时的可视化效果,示例的:
当用户未对网页上的内容进行选取之前的显示界面如图6所示,当用户拖动鼠标使终端上的光标(图中未示出)在网页上移动拟选择目标时,可参照如图7中“A新闻”所示,在页面上将会标记出光标当前位置所属的坐标范围,光标经过哪一位置,则标记当前位置所属的网页页面元素的坐标范围,用户可根据标记的坐标范围所属的网页页面元素确认是否需要选取当前标记的坐标范围内所属的网页页面元素,若不是,则重新拖动鼠标,没有选定网页页面元素对应的坐标范围的标记框也将不再标记出,直到根据光标位置所标记的坐标范围内的网页页面元素是想要选取的即可,例如:当用户想要选取“A网站”时,拖动鼠标查看光标当前位置所属的坐标范围内的网页页面元素是“A网站”时,用户点击之后则标记出用户所选取的“A网站”的标记,同样,使用同样的方式,选中“音乐”时,标记出用户所选取的“音乐”的标记,让用户对自己所选取的网页页面元素一目了然。
需要说明的是,标记样式可以是如图7中所示的线条,也可以是填充颜色,所用线条的样式和填充的颜色也可以根据用户的喜好自己设置,只要能够方便用户查看即可,在此不再赘述。
根据本实施例所提供的方法,下述将以在计算机上使用插件形式的可视化界面(下述均以界面来表示插件形式的可视化界面)来描述实现网页内容选取的步骤,示例的:
第一、用户在打开界面之后,若用户没有自己的登录信息,则先根据界面的提示注册自己的登录信息,再输入用户的登录信息进行登录,若用户已有自己的登录信息,则直接根据界面的提示将已有的登录信息输入进行登录即可。
另外,若是第一次登录,则在界面上所显示的内容都是默认的初始设置,下述将以用户的登录信息不是第一次登录时使用的步骤为例进行说明。
第二、用户登录成功之后,可以通过界面查看之前的历史设置和历史选取的数据,通过重设或继续使用历史设置来选择自己使用界面的模式,通过历史选取的数据可查看历史选取的网页页面元素,例如:
用户在打开界面时,若仅是想浏览网页来选择自己要选取哪些网页上的网页页面元素时,则可设置为仅浏览网页的模式,当用户确认某个网页有用户想选取的网页页面元素时,再设置为仅选取网页内容的模式。
进一步地,为方便用户直观的查看自己选取的网页页面元素,再设置为选中标识标记模式,并选择标记的样式,当用户进行不同的操作,则显示出不同的选中标识,例如:点击该元素对应的位置之后,将该元素对应的位置坐标范围用设置好的选中标识显示出来,这样用户每点击确定选取一个网页页面元素,则相应的标记一个网页页面元素。
进一步地,当用户因为误点击已选取或者要删除已选取的网页页面元素时,可通过再次点击该网页页面元素对应的位置信息将其删除。
另外,为方便用户查看所选取的网页页面元素的网络信息和设置信息,可将其网络信息和/或设置信息设置为显示或隐藏模式,用户想要查看哪个信息则将其设置为显示模式,即可显示用户想要查看的信息,可以是其中一个或两个都显示的情况,也可以是其中一个或两个都隐藏的情况,例如:当设置显示的是网络信息时,可通过该网络信息显示的界面查看当前已选取的网页页面元素对应的网络信息,进一步点击网络信息即可查看网络信息中的各种详细信息。
进一步地,当用户想要在网络信息界面上查看某个网络信息是在网页上的哪个位置时,可将光标移动到与该网络信息对应的查看的位置,此时,以不同的标记样式将其标记出来。
进一步地,当用户想要删除网路信息界面上当前查看的某个网络信息对应的网页页面元素时,可以在网络信息界面上该网页页面元素对应的网络信息上点击删除,或者,也可以根据上述所说的直接在该网页页面元素对应的位置坐标范围内点击进行删除。
通过上述操作,可以实现将重新选取的内容发送到服务器,在服务器接收到新的数据之后,进一步将历史数据库中的数据进行更新。
根据本实施例所提供的网页内容选取方法,用户通过在终端网页上选取页面上某一内容,由终端根据在网页的点击位置,然后用页面语言来描述该点击位置对应的网页页面元素的网络信息,并能可视化的直接在当前网页上显示出所选取的该位置的网页页面元素,这样通过将获取到的信息发送到服务器,通过服务器保存的具体的信息,就可以实时定位到与该网页上所选取的网页页面元素位置信息对应的最新的内容,并且通过用户登录,无论何时何地,再次打开该网页或更换终端时,能够直接在该网页上看到所有之前选取的页面元素所在位置的可视化标定信息,以及对应的网络信息,即使选取位置的显示内容已经变化,也可以很方便的直接查看所有的选择内容,并便于对选择进行修改和调整,进一步对服务器的数据库中的信息进行更新。
第三实施例
图8为本申请第三实施例提供的一种网页内容选取装置的示意图,如图8所示,该装置具体包括:接收模块20、确定模块30和获取模块40。
接收模块20,用于接收终端网页页面的点击指令,点击指令包括对终端网页页面点击位置的位置信息,确定模块30,用于确定位置信息对应的网页页面元素获取模块用户,获取模块40,用于获取网页页面元素对应的网络信息,网络信息包括下述一项或多项:网页页面元素的基本类型标识、位置信息和内容的类型枚举。
一种实现方式中,装置还包括登录模块10,用于接收用户输入的登录信息,登录信息包括:用户标识,向服务器发送登录请求,登录请求包括登录信息,接收服务器发送的登录成功响应。
一种实现方式中,确定模块30还用于向服务器发送历史数据查询请求,历史数据查询请求包括:用户标识、以及网页页面元素对应的网页标识,接收服务器根据网页标识发送的历史数据,历史数据包括:历史选取的网页标识对应的历史网页页面元素,查询网页标识对应的历史网页页面元素中是否包含位置信息对应的网页页面元素。
一种实现方式中,获取模块40具体用于若网页标识对应的历史网页页面元素中不包含位置信息对应的网页页面元素,则获取网页页面元素对应的网络信息。
一种实现方式中,装置还包括显示模块50,用于生成网页页面元素对应的选中标识,在终端网页页面上显示选中标识,其中,选中标识在终端网页页面上用于框选位置信息对应的网页页面元素。
上述装置用于执行前述实施例提供的方法,其实现原理和技术效果类似,在此不再赘述。
以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上***(system-on-a-chip,简称SOC)的形式实现。
第四实施例
图9为本发明第四实施例提供的一种电子设备的结构示意图,如图9所示,该设备可以集成于终端设备或者终端设备的芯片,该终端设备可以是具备网页选选取功能的计算设备。
该设备包括:存储器60和处理器70。
存储器60用于存储程序,处理器70调用存储器60存储的程序,以执行上述方法实施例。具体实现方式和技术效果类似,这里不再赘述。
可选地,本发明还提供一种程序产品,例如计算机可读存储介质,包括程序,该程序在被处理器执行时用于执行上述方法实施例。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (10)

1.一种网页内容选取方法,其特征在于,所述方法包括:
接收终端网页页面的点击指令,所述点击指令包括对所述终端网页页面点击位置的位置信息;
确定所述位置信息对应的网页页面元素;
获取所述网页页面元素对应的网络信息,所述网络信息包括下述一项或多项:网页页面元素的基本类型标识、位置信息和内容的类型枚举。
2.如权利要求1所述的方法,其特征在于,所述接收终端网页页面的点击指令之前,还包括:
接收用户输入的登录信息,所述登录信息包括:用户标识;
向服务器发送登录请求,所述登录请求包括所述登录信息;
接收所述服务器发送的登录成功响应。
3.如权利要求2所述的方法,其特征在于,所述确定所述位置信息对应的网页页面元素之后,还包括:
向所述服务器发送历史数据查询请求,所述历史数据查询请求包括:所述用户标识、以及所述网页页面元素对应的网页标识;
接收所述服务器根据所述网页标识发送的历史数据,所述历史数据包括:历史选取的所述网页标识对应的历史网页页面元素;
查询所述网页标识对应的历史网页页面元素中是否包含所述位置信息对应的网页页面元素。
4.如权利要求3所述的方法,其特征在于,所述获取所述网页页面元素对应的网络信息,包括:
若所述网页标识对应的历史网页页面元素中不包含所述位置信息对应的网页页面元素,则获取所述网页页面元素对应的网络信息。
5.如权利要求4所述的方法,其特征在于,所述确定所述位置信息对应的网页页面元素之后,还包括:
生成所述网页页面元素对应的选中标识;
在所述终端网页页面上显示所述选中标识,其中,所述选中标识在所述终端网页页面上用于框选所述位置信息对应的网页页面元素。
6.一种网页内容选取装置,其特征在于,所述装置包括:接收模块、确定模块和获取模块;
所述接收模块,用于接收终端网页页面的点击指令,所述点击指令包括对所述终端网页页面点击位置的位置信息;
所述确定模块,用于确定所述位置信息对应的网页页面元素;
所述获取模块,用于获取所述网页页面元素对应的网络信息,所述网络信息包括下述一项或多项:网页页面元素的基本类型标识、位置信息和内容的类型枚举。
7.如权利要求6所述的装置,其特征在于,所述装置还包括登录模块,用于接收用户输入的登录信息,所述登录信息包括:用户标识;
向服务器发送登录请求,所述登录请求包括所述登录信息;
接收所述服务器发送的登录成功响应。
8.如权利要求7所述的装置,其特征在于,所述确定模块还用于向所述服务器发送历史数据查询请求,所述历史数据查询请求包括:所述用户标识、以及所述网页页面元素对应的网页标识;
接收所述服务器根据所述网页标识发送的历史数据,所述历史数据包括:历史选取的所述网页标识对应的历史网页页面元素;
查询所述网页标识对应的历史网页页面元素中是否包含所述位置信息对应的网页页面元素。
9.如权利要求8所述的装置,其特征在于,所述获取模块具体用于若所述网页标识对应的历史网页页面元素中不包含所述位置信息对应的网页页面元素,则获取所述网页页面元素对应的网络信息。
10.如权利要求9所述的装置,其特征在于,所述装置还包括显示模块,用于生成所述网页页面元素对应的选中标识;
在所述终端网页页面上显示所述选中标识,其中,所述选中标识在所述终端网页页面上用于框选所述位置信息对应的网页页面元素。
CN201910312561.8A 2019-04-18 2019-04-18 网页内容选取方法及装置 Pending CN110007842A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910312561.8A CN110007842A (zh) 2019-04-18 2019-04-18 网页内容选取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910312561.8A CN110007842A (zh) 2019-04-18 2019-04-18 网页内容选取方法及装置

Publications (1)

Publication Number Publication Date
CN110007842A true CN110007842A (zh) 2019-07-12

Family

ID=67172761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910312561.8A Pending CN110007842A (zh) 2019-04-18 2019-04-18 网页内容选取方法及装置

Country Status (1)

Country Link
CN (1) CN110007842A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111797410A (zh) * 2020-05-18 2020-10-20 冠群信息技术(南京)有限公司 一种多服务器授权控制方法和装置
CN113239274A (zh) * 2021-05-19 2021-08-10 郑州信息科技职业学院 一种行为大数据自动化采集***
CN115357160A (zh) * 2022-07-13 2022-11-18 北京庖丁科技有限公司 文档内容点选方法、装置、电子设备、介质和程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279475A (zh) * 2013-04-11 2013-09-04 广东电网公司信息中心 一种web应用***内容变更的检测方法及***
CN108132948A (zh) * 2016-11-30 2018-06-08 北京国双科技有限公司 处理爬取网页的方法和装置
US20180239693A1 (en) * 2017-02-21 2018-08-23 International Business Machines Corporation Testing web applications using clusters
CN109542553A (zh) * 2018-10-26 2019-03-29 北京慧流科技有限公司 用户界面ui元素的信息抓取方法及装置、及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279475A (zh) * 2013-04-11 2013-09-04 广东电网公司信息中心 一种web应用***内容变更的检测方法及***
CN108132948A (zh) * 2016-11-30 2018-06-08 北京国双科技有限公司 处理爬取网页的方法和装置
US20180239693A1 (en) * 2017-02-21 2018-08-23 International Business Machines Corporation Testing web applications using clusters
CN109542553A (zh) * 2018-10-26 2019-03-29 北京慧流科技有限公司 用户界面ui元素的信息抓取方法及装置、及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111797410A (zh) * 2020-05-18 2020-10-20 冠群信息技术(南京)有限公司 一种多服务器授权控制方法和装置
CN113239274A (zh) * 2021-05-19 2021-08-10 郑州信息科技职业学院 一种行为大数据自动化采集***
CN115357160A (zh) * 2022-07-13 2022-11-18 北京庖丁科技有限公司 文档内容点选方法、装置、电子设备、介质和程序产品
CN115357160B (zh) * 2022-07-13 2023-10-27 北京庖丁科技有限公司 文档内容点选方法、装置、电子设备、介质和程序产品

Similar Documents

Publication Publication Date Title
US11163851B2 (en) Method, apparatus, computer device and storage medium of page displaying
US10547571B2 (en) Message service providing method for message service linked to search service and message server and user terminal to perform the method
US8176120B2 (en) Web-page authoring tool for automatic enrollment in advertising program
US8510268B1 (en) Editable geographic data for maps, and applications thereof
KR102340228B1 (ko) 검색 서비스와 연결된 메시지 서비스를 위한 메시지 서비스 제공 방법 및 상기 메시지 서비스 제공 방법을 수행하는 메시지 서버 및 사용자 단말
US20200073903A1 (en) Method and device of tagging links included in a screenshot of webpage
KR20150043344A (ko) 다른 형태의 정보 공유를 통한 코브라우징의 통합
CN110708235B (zh) 消息生成方法、装置、存储介质和计算机设备
CN110007842A (zh) 网页内容选取方法及装置
CN104685502A (zh) 用于将在线内容关联到第二索引的内容的***和方法
WO2016091002A1 (zh) 在网页上提供认证信息的方法及装置
CN105447015A (zh) 基于移动终端的职位信息推送方法、装置及***
US20170134364A1 (en) Note update method and device
US9536445B2 (en) System and method for visually tracking a learned process
US9449111B2 (en) System and method for generating and accessing trails
CN114726947B (zh) 消息展示方法、装置、用户终端及可读存储介质
CN104268273B (zh) 推送信息的处理方法、装置及浏览器、浏览器插件
US20140122404A1 (en) System and method for displaying a trail
CN107735785A (zh) 自动信息检索
KR101710824B1 (ko) 제삼자 서비스 플랫폼 로그인을 위한 방법 및 시스템
US9292883B2 (en) System and method for managing a trail
CN112416474A (zh) 客户端的功能调用方法和装置、存储介质及电子设备
TWI519997B (zh) 伺服器、使用者裝置及終端裝置
JP2008250889A (ja) コミュニティ管理システム
CN105988992A (zh) 图标推送方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190712

RJ01 Rejection of invention patent application after publication