CN115001819A - 实名登录方法、装置及存储介质 - Google Patents
实名登录方法、装置及存储介质 Download PDFInfo
- Publication number
- CN115001819A CN115001819A CN202210621436.7A CN202210621436A CN115001819A CN 115001819 A CN115001819 A CN 115001819A CN 202210621436 A CN202210621436 A CN 202210621436A CN 115001819 A CN115001819 A CN 115001819A
- Authority
- CN
- China
- Prior art keywords
- real
- login
- name
- information
- name login
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000009471 action Effects 0.000 claims abstract description 19
- 238000012795 verification Methods 0.000 claims description 43
- 238000012545 processing Methods 0.000 claims description 9
- 238000010200 validation analysis Methods 0.000 claims description 4
- 238000004088 simulation Methods 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 235000014510 cooky Nutrition 0.000 description 15
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000013480 data collection Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 229910052711 selenium Inorganic materials 0.000 description 1
- 239000011669 selenium Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/08—Network architectures or network communication protocols for network security for authentication of entities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/08—Network architectures or network communication protocols for network security for authentication of entities
- H04L63/083—Network architectures or network communication protocols for network security for authentication of entities using passwords
- H04L63/0838—Network architectures or network communication protocols for network security for authentication of entities using passwords using one-time-passwords
Landscapes
- Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本公开实施例中提供实名登录方法、装置及存储介质,方法包括:访问网站服务器的登录页面,在网站服务器的登录页面定位得到实名登录元素;基于所定位的实名登录元素模拟至少一个账户的实名登录信息的输入及登录动作;获取登录完成状态下产生的已有实名登录信息;利用所述至少一个账号的已有实名登录信息在所述网站服务器直接登入。本公开实施例实现在网站服务器的实名登录,以利于提升数据采集的效率。
Description
技术领域
本公开涉及网络技术领域,尤其涉及实名登录方法、装置及存储介质。
背景技术
由于近些年网络信息安全事件的发生,人们对网络信息的安全意识逐渐提高,互联网产品对用户的行也做了更详细的定义,很多网站对用户查询、搜索、浏览等行为不进行实名制,如果用户发布评论、发表弹幕、甚至对浏览信息进行打分,这类行为都进行了实名制的用户登录设置。
网站所提供的网页中包含了很多有分析价值的数据,可以通过数据采集程序获取。然而,用户需要在实名登录的网站手工输入登录信息,造成数据采集效率的降低。因此,如何合理高效地获取到需要实名登录的网站的网页元素数据,成为数据采集流程的重要一个环节。
发明消息
鉴于以上相关技术的缺点,本公开的目的在于提供实名登录方法、装置及存储介质,以解决相关技术中的问题。
本公开第一方面提供一种实名登录方法,包括:访问网站服务器的登录页面,在网站服务器的登录页面定位得到实名登录元素;基于所定位的实名登录元素模拟至少一个账户的实名登录信息的输入及登录动作;获取登录完成状态下产生的已有实名登录信息;利用所述至少一个账号的已有实名登录信息在所述网站服务器直接登入。
在第一方面的实施例中,所述实名登录元素包括:实名身份信息输入框元素;获取验证码元素;验证码输入框元素。
在第一方面的实施例中,所述实名身份信息包括以下至少一种:手机号;身份证号。
在第一方面的实施例中,所述实名登录元素还包括:预设操作动作验证元素。
在第一方面的实施例中,所述基于所定位的实名登录元素模拟至少一个账户的实名登录信息的输入及登录动作,包括:模拟在实名身份信息输入框输入实名身份信息,并触动发送实名身份信息的按钮以获取验证码,以及在验证码输入框输入验证码,触发登录按钮以提交。
在第一方面的实施例中,所述已有实名登录信息包括小型文本文件。
在第一方面的实施例中,所述利用所述至少一个账号的已有实名登录信息在所述网站直接登入,包括:发送携带所述已有实名登录信息的请求至所述网站服务器,以直接登入所述网站服务器。
在第一方面的实施例中,所述的实名登录方法还包括:在登录状态下,发送携带资源定位信息的请求以定位网页中相关的网页元素;从网页元素中解析指定信息并存储。
本公开第二方面提供一种实名登录装置,包括:资源定位模块,用于访问网站服务器的登录页面,在网站服务器的登录页面定位得到实名登录元素;登录模拟模块,用于基于所定位的实名登录元素模拟至少一个账户的实名登录信息的输入及登录动作;已有实名登记信息获取模块,用于获取登录完成状态下产生的已有实名登录信息;登录模块,用于利用所述至少一个账号的已有实名登录信息在所述网站服务器直接登入。
本公开第三方面提供一种计算机装置,包括:存储单元及处理单元;所述存储单元存储有程序指令;所述处理单元用于运行所述程序指令以执行如第一方面中任一项所述的实名登录方法。
本公开第四方面提供一种计算机可读存储介质,存储有程序指令,所述程序指令被运行以执行如第一方面中任一项所述的实名登录方法。
如上所述,本公开实施例中提供实名登录方法、装置及存储介质,方法包括:访问网站服务器的登录页面,在网站服务器的登录页面定位得到实名登录元素;基于所定位的实名登录元素模拟至少一个账户的实名登录信息的输入及登录动作;获取登录完成状态下产生的已有实名登录信息;利用所述至少一个账号的已有实名登录信息在所述网站服务器直接登入。本公开实施例实现在网站服务器的实名登录,以利于提升数据采集的效率。
附图说明
图1展示本公开一实施例中实名登录方法的流程示意图。
图2展示本公开一实施例中实名登录方法的原理示意图。
图3展示本公开一实施例中实名登录装置的模块示意图。
图4展示本公开一实施例中计算机装置的结构示意图。
具体实施方式
以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本公开所揭露的消息轻易地了解本公开的其他优点与功效。本公开还可以通过另外不同的具体实施方式加以实施或应用***,本公开中的各项细节也可以根据不同观点与应用***,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
下面以附图为参考,针对本公开的实施例进行详细说明,以便本公开所属技术领域的技术人员能够容易地实施。本公开可以以多种不同形态体现,并不限定于此处说明的实施例。
在本公开的表示中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的表示意指结合该实施例或示例表示的具体特征、结构、材料或者特点包括于本公开的至少一个实施例或示例中。而且,表示的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本公开中表示的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于表示目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本公开的表示中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
为了明确说明本公开,省略与说明无关的器件,对于通篇说明书中相同或类似的构成要素,赋予了相同的参照符号。
在通篇说明书中,当说某器件与另一器件“连接”时,这不仅包括“直接连接”的情形,也包括在其中间把其它元件置于其间而“间接连接”的情形。另外,当说某种器件“包括”某种构成要素时,只要没有特别相反的记载,则并非将其它构成要素排除在外,而是意味着可以还包括其它构成要素。
虽然在一些实例中术语第一、第二等在本文中用来表示各种元件,但是这些元件不应当被这些术语限制。这些术语仅用来将一个元件与另一个元件进行区分。例如,第一接口及第二接口等表示。再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、步骤、操执行、元件、模块、项目、种类、和/或组,但不排除一个或多个其他特征、步骤、操执行、元件、模块、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能、步骤或操执行的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
此处使用的专业术语只用于言及特定实施例,并非意在限定本公开。此处使用的单数形态,只要语句未明确表示出与之相反的意义,那么还包括复数形态。在说明书中使用的“包括”的意义是把特定特性、区域、整数、步骤、执行业、要素及/或成份具体化,并非排除其它特性、区域、整数、步骤、执行业、要素及/或成份的存在或附加。
表示“下”、“上”等相对空间的术语可以为了更容易地说明在附图中图示的一器件相对于另一器件的关系而使用。这种术语是指,不仅是在附图中所指的意义,还包括使用中的装置的其它意义或执行业。例如,如果翻转附图中的装置,曾说明为在其它器件“下”的某器件则说明为在其它器件“上”。因此,所谓“下”的示例性术语,全部包括上与下方。装置可以旋转90°或其它角度,代表相对空间的术语也据此来解释。
虽然未不同地定义,但包括此处使用的技术术语及科学术语,所有术语均具有与本公开所属技术领域的技术人员一般理解的意义相同的意义。普通使用的字典中定义的术语追加解释为具有与相关技术文献和当前提示的消息相符的意义,只要未进行定义,不得过度解释为理想的或非常公式性的意义。
目前,基于网络安全需求,很多网站都要求先实名登录之后才能进行浏览。但是如此一来,正常的网站数据采集行为的效率会受到较大影响。具体的,如果需要人工输入实名登录信息来完成登录,则效率会大大下降。
鉴于此,本公开实施例中提供自动化的实名登录方法,以解决目前相关技术中的问题,提升数据采集效率。
如图1所示,展示本公开实施例中实名登录方法的流程示意图。
所述自动化实名登录方法可以实现于一计算机装置,所述计算机装置与网站服务器通信,计算机装置可以运行有数据采集程序,所述数据采集程序可以通过浏览器访问并自动化地实名登录网站服务器。
在图1中,所述实名登录方法包括:
步骤S101:访问网站服务器的登录页面,在网站服务器的登录页面定位得到实名登录元素。
在一些实施例中,数据采集程序可以调用浏览器的方法来访问登录页面。比如Python的browser.get(URL),URL即统一定位资源符,包含域名例如“https://www.***.com”等。
在一些场景中,实名登录的方式通常呈现为用户在网页的手机号输入框输入手机号,在拉动滑块到匹配位置后,被允许点击“获取验证码”按钮,之后用户将手机收到的验证码输入到验证码输入框中,点击登录按钮来完成实名登录。网页中会包含这些网页元素。具体的,可以通过通过登录网站的登录页面,对网页元素进行分析定位,从而找到可供输入并提交实名登录信息的元素。比如,所述实名登录元素可以包括:实名身份信息输入框元素;获取验证码元素;验证码输入框元素。其中,所述实名身份信息可以包括以下至少一种:手机号;身份证号。所述实名身份信息输入框元素对应例如手机号输入框,所述获取验证码元素对应“获取验证码”按钮,验证码输入框元素对应验证码输入框。
在一些实施例中,所述实名登录元素还可以包括如预设操作动作验证元素。示例性地,所述预设操作动作包括例如滑动匹配等,相应的,所述预设操作动作验证元素比如为拉动滑块验证元素。具体的,提供一滑块滑动到形状匹配的空缺位置以完成验证。
通过一个实例来说明以上过程。
打开Chrome内核的浏览器,根据网站提示流程(比如“登录”按钮)找到对应的登录页面;通过浏览器抓包分析,找到对应的登录页面接口:https://passport.xxxx.com/user/member/fastOrder#ctm_ref=ssc_hp_myctrip_phoneor ders_a。根据该登录页面的网页源代码,通过网页元素定位,找到相关功能的网页元素,比如手机号输入框元素为txt_phone,拉动滑块验证元素为cpt-drop-btn并可以设置制定滑动的页面距离,验证码输入框元素为txt_phone,获取验证码元素为btn_getCode,验证码输入元素valCode,点击查询按钮元素btn_search等等。
在一些实施例中,所述网页元素定位的方式可以通过例如selenium的方法法来实现。例如,通过find_element_by_id、find_element_by_css_selector等方法定位到手机号输入框、拉动滑块、发送以获取验证码、验证码输入的按钮等。
步骤S102:基于所定位的实名登录元素模拟至少一个账户的实名登录信息的输入及登录动作。
在定位到上述实名登录元素之后,通过在这些元素进行操作,如输入框的信息输入、按钮的点击等等,来模拟出之前所述的登录操作。例如,模拟在实名身份信息输入框输入实名身份信息,并触动发送实名身份信息的按钮以获取验证码(可以在拉动滑块验证通过后被允许),以及在验证码输入框输入验证码,触发登录按钮以提交。
步骤S103:获取登录完成状态下产生的已有实名登录信息。
在一些实施例中,所似乎历史实名信息可以包括小型文本文件(Cookies)。Cookie是某些网站为了辨别用户身份,进行Session跟踪而储存在用户本地终端上的数据(通常经过加密),由用户客户端计算机暂时或永久保存的信息。在一些实施例中,可以通过get_cookies的方法来获取到所述已有实名登录信息。
步骤S104:利用所述至少一个账号的已有实名登录信息在所述网站服务器直接登入。
在一些实施例中,发送携带所述已有实名登录信息的请求至所述网站服务器,以直接登入所述网站服务器。示例性地,所述请求可以通过requests库的requests.get(URL)方法产生,向网站服务器请求对应URL的网页元素。
可以将Cookie***访问请求的Headers请求头,代码例如以下所示:
Headers={
"Cookie":xxx
}
在另一个示例中,可以将所述Cookies直接作为requests.get方法的参数,以登录到信息交流服务器。示例性的代码如下所示:
Cookie={"Cookie":xxx}
requests.get(URL,cookie=Cookie)
更具体的,代码可以表示为:
Imprort requests
Headers={‘Cookie’:’复制相关页面元素接口的Cookie’信息}
html=requests.get(url=’xxxx’,headers=headers).text
在登录状态下,可以实施数据采集动作。具体的,还是可以通过基于Python的requests.get形成并发送携带资源定位信息(URL)的请求,发送到网站服务器,以定位网页中相关的网页元素(比如需要评论数据进行语义分析等)。并且,进而网页元素中解析指定信息并存储,通过例如xpath和jsonpath从网页元素中抓取文本数据等。
需要说明的是,网页元素定位的方法有多种,比如通过元素的id属性来定位元素,通过元素的name属性来定位元素,通过元素的class name属性来定位元素,通过超链接文本(link_text)定位元素,通过匹配超链接文本(partial_link_text)定位元素,通过tag_name定位元素,通过xpath定位元素,通过css定位元素,因此上述示例中的网页元素定位方法可以根据需求从中进行选择。
在一些实施例中,所述账号可以是多个,每个账号都预先实名注册了实名登录信息,即例如手机号或身份证号。进而,可以通过登录多个账号或者一个账号进行数据采集作业。
为直观说明上述实名登录方法的流程,可以参考图2,给出一个具体示例以说明原理。
调用浏览器以根据URL访问网站服务器的登录网页,并对登录网页中的实名登录元素进行定位,例如通过selenium工具的find_element_by_id、find_element_by_css_selector等方法。图2中登录页面200展示了登录网页的网页元素,如手机号输入框“请输入手机号”、“获取验证码”按钮、验证码输入框“请输入短信验证码”、滑动验证条“向右拖动滑块进行验证”及“登录”按钮。进一步的,可以通过程序来模拟人工操作这些网页元素,如填写信息后的登录界面201所示,在手机号输入框输入手机号,并拖动滑块至匹配位置(可以设置滑动的长度以保证滑动到匹配位置),点击“获取验证码”,并将获取的短信验证码填入至验证码输入框,再点击“登录”按钮以实现登录,进而登录页面200转换至显示已登录的页面202。在再一些实施例中,实名登录元素可能还可以包括同意服务条款、隐私政策同意的打钩等。
通过在已登录状态下,通过get_cookies方法得到已有实名登录信息Cookie。之后可以退出登录状态,恢复到登录页面200。
在获取到了登录信息Cookie之后,数据采集程序可以直接利用Cookie来实现登录形成登录页面202,进而可以对网页中的所需网页元素进行获取,并解析得到所需的数据。
如图3所示,展示本公开实施例中实名登录装置的模块示意图。所述实名登录装置300的具体实现可以参考之前流程实施例中的实名登录方法,此处不再对技术细节作重复赘述。
所述实名登录装置300包括:
资源定位模块301,用于访问网站服务器的登录页面,在网站服务器的登录页面定位得到实名登录元素;
登录模拟模块302,用于基于所定位的实名登录元素模拟至少一个账户的实名登录信息的输入及登录动作;
已有实名登记信息获取模块303,用于获取登录完成状态下产生的已有实名登录信息;
登录模块304,用于利用所述至少一个账号的已有实名登录信息在所述网站服务器直接登入。
在一些实施例中,所述实名登录元素包括:实名身份信息输入框元素;获取验证码元素;验证码输入框元素。
在一些实施例中,所述实名身份信息包括以下至少一种:手机号;身份证号。
在一些实施例中,所述实名登录元素还包括:预设操作动作验证元素,例如滑条验证元素。
在一些实施例中,所述基于所定位的实名登录元素模拟至少一个账户的实名登录信息的输入及登录动作,包括:模拟在实名身份信息输入框输入实名身份信息,并触动发送实名身份信息的按钮以获取验证码,以及在验证码输入框输入验证码,触发登录按钮以提交。
在一些实施例中,所述已有实名登录信息包括小型文本文件。
在一些实施例中,所述利用所述至少一个账号的已有实名登录信息在所述网站直接登入,包括:发送携带所述已有实名登录信息的请求至所述网站服务器,以直接登入所述网站服务器。
在一些实施例中,所述的实名登录装置300还包括:元素定位请求模块,用于在登录状态下,发送携带资源定位信息的请求以定位网页中相关的网页元素;从网页元素中解析指定信息并存储。
需特别说明的是,在图3实施例中的各个功能模块,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以程序指令产品的形式实现。程序指令产品包括一个或多个程序指令。在计算机上加载和执行程序指令指令时,全部或部分地产生按照本公开的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。程序指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输。
并且,图3实施例所揭露的装置,可通过其它的模块划分方式实现。以上所表示的装置实施例仅仅是示意性的,例如所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或模块可以结合或者可以动态到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接于可以是通过一些接口,装置或模块的间接耦合或通信连接于,可以是电性或其它的形式。
另外,图3实施例中的各功能模块及子模块可以动态在一个处理部件中,也可以是各个模块单独物理存在,也可以两个或两个以上模块动态在一个部件中。上述动态的部件既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。上述动态的部件如果以软件功能模块的形式实现并执行为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。该存储介质可以是只读存储单元,磁盘或光盘等。
需特别说明的是,本公开上述实施例的流程图表示的流程或方法表示可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分。并且本公开的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能。
例如,图1实施例中的各个步骤的顺序可能可以在具体场景中加以变化,并非以上述表示为限。
如图4所示,展示本公开一实施例中计算机装置的结构示意图。
在一些实施例中,所述计算机装置用于装载实现前述方法实施例(例如图1)的程序指令。
如图4所示,计算机装置400以通用计算设备的形式表现。计算机装置400的组件可以包括但不限于:上述至少一个处理单元410、上述至少一个存储单元420、连接不同***组件(包括存储单元420和处理单元410)的总线430。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元410执行,使得计算机装置用于实现本公开上述实施例(如图1)中所描述方法步骤。
在一些实施例中,存储单元420可以包括易失性存储单元,例如随机存取存储单元(RAM)4201和/或高速缓存存储单元4202,还可以进一步包括只读存储单元(ROM)4203。
在一些实施例中,存储单元420还可以包括具有一组(至少一个)程序模块4205的程序/实用工具4204,这样的程序模块4205包括但不限于:操执行***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
在一些实施例中,总线430可以包括数据总线、地址总线和控制总线。
在一些实施例中,计算机装置400也可以与一个或多个外部设备500(例如键盘、指向设备、蓝牙设备等)通信,这种通信可以通过输入/输出(I/O)接口450进行。可选的,计算机装置400还包括显示单元440,其连接到输入/输出(I/O)接口450,用于进行显示。并且,计算机装置400还可以通过网络适配器460与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器460通过总线430与计算机装置400的其它模块通信。应当明白,尽管图中未示出,可以结合计算机装置400使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
本公开的实施例中还可以提供计算机刻度存储介质,其可以包含程序代码,并可以在设备上运行,例如个人电脑上运行,以实现本公开上述方法实施例(如图1等)中的各个步骤及子步骤的执行。在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
所述程序代码可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储单元(RAM)、只读存储单元(ROM)、可擦式可编程只读存储单元(EPROM或闪存)、光纤、便携式紧凑盘只读存储单元(CD-ROM)、光存储单元件、磁存储单元件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言-诸如Java、C++等,还包括常规的过程式程序设计语言-诸如"C"语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上所述,本公开实施例中提供实名登录方法、装置及存储介质,方法包括:访问网站服务器的登录页面,在网站服务器的登录页面定位得到实名登录元素;基于所定位的实名登录元素模拟至少一个账户的实名登录信息的输入及登录动作;获取登录完成状态下产生的已有实名登录信息;利用所述至少一个账号的已有实名登录信息在所述网站服务器直接登入。本公开实施例实现在网站服务器的实名登录,以利于提升数据采集的效率。
上述实施例仅例示性说明本公开的原理及其功效,而非用于限制本公开。任何熟悉此技术的人士皆可在不违背本公开的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本公开所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本公开的权利要求所涵盖。
Claims (11)
1.一种实名登录方法,其特征在于,包括:
访问网站服务器的登录页面,在网站服务器的登录页面定位得到实名登录元素;
基于所定位的实名登录元素模拟至少一个账户的实名登录信息的输入及登录动作;
获取登录完成状态下产生的已有实名登录信息;
利用所述至少一个账号的已有实名登录信息在所述网站服务器直接登入。
2.根据权利要求1所述的实名登录方法,其特征在于,所述实名登录元素包括:实名身份信息输入框元素;获取验证码元素;验证码输入框元素。
3.根据权利要求2所述的实名登录方法,其特征在于,所述实名身份信息包括以下至少一种:手机号;身份证号。
4.根据权利要求1所述的实名登录方法,其特征在于,所述实名登录元素还包括:预设操作动作验证元素。
5.根据权利要求2所述的实名登录方法,其特征在于,所述基于所定位的实名登录元素模拟至少一个账户的实名登录信息的输入及登录动作,包括:
模拟在实名身份信息输入框输入实名身份信息,并触动发送实名身份信息的按钮以获取验证码,以及在验证码输入框输入验证码,触发登录按钮以提交。
6.根据权利要求1所述的实名登录方法,其特征在于,所述已有实名登录信息包括小型文本文件。
7.根据权利要求1所述的实名登录方法,其特征在于,所述利用所述至少一个账号的已有实名登录信息在所述网站直接登入,包括:
发送携带所述已有实名登录信息的请求至所述网站服务器,以直接登入所述网站服务器。
8.根据权利要求1所述的实名登录方法,其特征在于,还包括:
在登录状态下,发送携带资源定位信息的请求以定位网页中相关的网页元素;
从网页元素中解析指定信息并存储。
9.一种实名登录装置,其特征在于,包括:
资源定位模块,用于访问网站服务器的登录页面,在网站服务器的登录页面定位得到实名登录元素;
登录模拟模块,用于基于所定位的实名登录元素模拟至少一个账户的实名登录信息的输入及登录动作;
已有实名登记信息获取模块,用于获取登录完成状态下产生的已有实名登录信息;
登录模块,用于利用所述至少一个账号的已有实名登录信息在所述网站服务器直接登入。
10.一种计算机装置,其特征在于,包括:存储单元及处理单元;所述存储单元存储有程序指令;所述处理单元用于运行所述程序指令以执行如权利要求1至8中任一项所述的实名登录方法。
11.一种计算机可读存储介质,其特征在于,存储有程序指令,所述程序指令被运行以执行如权利要求1至8中任一项所述的实名登录方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210621436.7A CN115001819A (zh) | 2022-06-02 | 2022-06-02 | 实名登录方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210621436.7A CN115001819A (zh) | 2022-06-02 | 2022-06-02 | 实名登录方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115001819A true CN115001819A (zh) | 2022-09-02 |
Family
ID=83031659
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210621436.7A Pending CN115001819A (zh) | 2022-06-02 | 2022-06-02 | 实名登录方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115001819A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102495855A (zh) * | 2011-11-21 | 2012-06-13 | 奇智软件(北京)有限公司 | 自动登录方法及装置 |
CN103618649A (zh) * | 2013-12-03 | 2014-03-05 | 北京人民在线网络有限公司 | 网站数据采集方法及装置 |
CN106934686A (zh) * | 2017-02-16 | 2017-07-07 | 上海咿呀信息科技有限公司 | 一种自助下单的方法及*** |
CN107733847A (zh) * | 2017-07-25 | 2018-02-23 | 上海壹账通金融科技有限公司 | 平台登录网站方法、装置、计算机设备以及可读存储介质 |
CN108173875A (zh) * | 2018-01-30 | 2018-06-15 | 美通云动(北京)科技有限公司 | 页面登录方法及装置、电子设备、存储介质 |
US10069812B1 (en) * | 2014-03-14 | 2018-09-04 | Intuit Inc. | Technique for facilitating auto login to a website |
CN111191097A (zh) * | 2019-12-20 | 2020-05-22 | 天阳宏业科技股份有限公司 | 一种网络爬虫自动化获取网页信息方法、装置及*** |
CN113254748A (zh) * | 2021-06-09 | 2021-08-13 | 浪潮卓数大数据产业发展有限公司 | 一种自动化获取登录后cookie的方法 |
-
2022
- 2022-06-02 CN CN202210621436.7A patent/CN115001819A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102495855A (zh) * | 2011-11-21 | 2012-06-13 | 奇智软件(北京)有限公司 | 自动登录方法及装置 |
US20140344907A1 (en) * | 2011-11-21 | 2014-11-20 | Beijing Qihoo Technology Company Limited | Auto login method and device |
CN103618649A (zh) * | 2013-12-03 | 2014-03-05 | 北京人民在线网络有限公司 | 网站数据采集方法及装置 |
US10069812B1 (en) * | 2014-03-14 | 2018-09-04 | Intuit Inc. | Technique for facilitating auto login to a website |
CN106934686A (zh) * | 2017-02-16 | 2017-07-07 | 上海咿呀信息科技有限公司 | 一种自助下单的方法及*** |
CN107733847A (zh) * | 2017-07-25 | 2018-02-23 | 上海壹账通金融科技有限公司 | 平台登录网站方法、装置、计算机设备以及可读存储介质 |
CN108173875A (zh) * | 2018-01-30 | 2018-06-15 | 美通云动(北京)科技有限公司 | 页面登录方法及装置、电子设备、存储介质 |
CN111191097A (zh) * | 2019-12-20 | 2020-05-22 | 天阳宏业科技股份有限公司 | 一种网络爬虫自动化获取网页信息方法、装置及*** |
CN113254748A (zh) * | 2021-06-09 | 2021-08-13 | 浪潮卓数大数据产业发展有限公司 | 一种自动化获取登录后cookie的方法 |
Non-Patent Citations (3)
Title |
---|
孟兵 等: "零基础学Python爬虫、数据分析与可视化从入门到精通", pages: 241 - 245 * |
曾健荣;张仰森;郑佳;黄改娟;陈若愚;: "面向多数据源的网络爬虫实现技术及应用", 计算机科学, no. 05, pages 311 - 316 * |
毕志杰;李静;: "基于Python的新浪微博爬虫程序设计与研究", 信息与电脑(理论版), no. 04, pages 154 - 156 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9697191B2 (en) | Flexible analytics-driven webpage design and optimization | |
CA2684822C (en) | Data transformation based on a technical design document | |
US8935798B1 (en) | Automatically enabling private browsing of a web page, and applications thereof | |
CA2992605C (en) | A system and method for use in regression testing of electronic document hyperlinks | |
US10417317B2 (en) | Web page profiler | |
CN110808868B (zh) | 测试数据获取方法、装置、计算机设备及存储介质 | |
US20160012074A1 (en) | System and method for providing contextual analytics data | |
CN113704590B (zh) | 网页数据获取方法、装置、电子设备及存储介质 | |
CN104317570B (zh) | 动态解析Web应用的装置和方法 | |
CN110795651A (zh) | 用于保存前端数据的方法、装置及电子设备 | |
US11550990B2 (en) | Machine first approach for identifying accessibility, non-compliances, remediation techniques and fixing at run-time | |
CN111797297B (zh) | 页面数据处理方法、装置、计算机设备及存储介质 | |
US10614145B2 (en) | Presenting content on a webpage in a desired format | |
CN111581098B (zh) | 接口数据转移存储的方法、装置、服务器及存储介质 | |
US20100125797A1 (en) | Client integration of information from a supplemental server into a portal | |
CN111597059A (zh) | 接口调用请求处理方法、装置及电子设备 | |
CN115001819A (zh) | 实名登录方法、装置及存储介质 | |
CN114896543A (zh) | 舆情分析方法、装置及存储介质 | |
US20210335466A1 (en) | System for Reviewing Patient Data from Remote Patient Monitoring Devices | |
CN110968768B (zh) | 信息生成方法和装置 | |
CN114297469A (zh) | 检索方法、装置、***、电子设备及存储介质 | |
Kovaliuk et al. | Optimization of web-application performance | |
US20080114631A1 (en) | Service evaluation system, service evaluation method, recording medium storing service evaluation program | |
IE20190191A1 (en) | Digital user consent preferences and control | |
Masri et al. | Real-Time Data and UI Integrations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20220902 |
|
WD01 | Invention patent application deemed withdrawn after publication |