CN112685072A - 通信地址知识库的生成方法、装置、设备及存储介质 - Google Patents

通信地址知识库的生成方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112685072A
CN112685072A CN202011629917.XA CN202011629917A CN112685072A CN 112685072 A CN112685072 A CN 112685072A CN 202011629917 A CN202011629917 A CN 202011629917A CN 112685072 A CN112685072 A CN 112685072A
Authority
CN
China
Prior art keywords
communication address
application program
stored
target application
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011629917.XA
Other languages
English (en)
Other versions
CN112685072B (zh
Inventor
张健
李超
石磊
孟宝权
王杰
杨满智
蔡琳
梁彧
田野
傅强
金红
陈晓光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eversec Beijing Technology Co Ltd
Original Assignee
Eversec Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eversec Beijing Technology Co Ltd filed Critical Eversec Beijing Technology Co Ltd
Priority to CN202011629917.XA priority Critical patent/CN112685072B/zh
Publication of CN112685072A publication Critical patent/CN112685072A/zh
Application granted granted Critical
Publication of CN112685072B publication Critical patent/CN112685072B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Stored Programmes (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种通信地址知识库的生成方法、装置、设备及存储介质。其中,方法包括:通过应用程序解析工具对目标应用程序进行解析,获取基础信息和对应的全部通信地址;根据基础信息、通信地址知识库中存储的与目标应用程序对应的主通信地址和补充通信地址,确定各通信地址是否是与通信地址知识库中存储的与目标应用程序对应的主通信地址不重叠的待存储主通信地址;将各通信地址中的待存储主通信地址存储于通信地址知识库中。本发明实施例可以生成较为完整的包含为应用程序提供主要支撑服务的通信地址的知识库,为后续确定为违规应用程序提供主要支撑服务的通信地址提供依据,从而实现快速与精准地确定提供主要支撑服务的通信地址。

Description

通信地址知识库的生成方法、装置、设备及存储介质
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种通信地址知识库的生成方法、装置、设备及存储介质。
背景技术
随着我国互联网的飞速发展,应用程序(App)数量迅猛增长,服务内容不断丰富。应用程序数量日益上升的同时,应用程序违规行为日益严重。当应用程序发生违规时,需要对违规应用程序的所有者进行定位操作,即确定为违规应用程序提供主要支撑服务的通信地址。
相关技术中,在应用程序发生违规时,通常由技术人员对为应用程序提供功能服务的全部通信地址进行分析,从应用程序提供功能服务的全部通信地址中确定为应用程序提供主要支撑服务的通信地址。为应用程序提供功能服务的全部通信地址包括为应用程序提供主要支撑服务的通信地址以及为应用程序提供补充功能的通信地址。随着应用程序的服务内容不断丰富,为应用程序提供补充功能的通信地址的数量不断增加,导致为应用程序提供功能服务的通信地址数量较多,需要投入较多人力进行分析,难以快速与精准地确定为违规应用程序提供主要支撑服务的通信地址。
发明内容
本发明实施例提供一种通信地址知识库的生成方法、装置、设备及存储介质,可以生成包含为应用程序提供主要支撑服务的通信地址的知识库,为后续确定为违规应用程序提供主要支撑服务的通信地址提供依据,从而实现快速与精准地确定为违规应用程序提供主要支撑服务的通信地址。
第一方面,本发明实施例提供了一种通信地址知识库的生成方法,包括:
通过应用程序解析工具对目标应用程序进行解析,获取所述目标应用程序的基础信息和与所述目标应用程序对应的全部通信地址;其中,所述基础信息包括应用程序名称、应用程序包名以及信息摘要;
根据所述基础信息、通信地址知识库中存储的与所述目标应用程序对应的主通信地址和补充通信地址,确定各所述通信地址是否是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址;其中,所述主通信地址是为应用程序提供主要支撑服务的通信地址,所述补充通信地址是为应用程序提供补充功能的通信地址;
将各所述通信地址中的待存储主通信地址存储于所述通信地址知识库中。
第二方面,本发明实施例还提供了一种通信地址知识库的生成装置,包括:
应用程序解析模块,用于通过应用程序解析工具对目标应用程序进行解析,获取所述目标应用程序的基础信息和与所述目标应用程序对应的全部通信地址;其中,所述基础信息包括应用程序名称、应用程序包名以及信息摘要;
主通信地址确定模块,用于根据所述基础信息、通信地址知识库中存储的与所述目标应用程序对应的主通信地址和补充通信地址,确定各所述通信地址是否是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址;其中,所述主通信地址是为应用程序提供主要支撑服务的通信地址,所述补充通信地址是为应用程序提供补充功能的通信地址;
主通信地址存储模块,用于将各所述通信地址中的待存储主通信地址存储于所述通信地址知识库中。
第三方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本发明实施例所述的通信地址知识库的生成方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如本发明实施例所述的通信地址知识库的生成方法。
本发明实施例的技术方案,通过应用程序解析工具对目标应用程序进行解析,获取目标应用程序的基本信息和与目标应用程序对应的全部通信地址,然后根据基本信息、通信地址知识库中存储的与目标应用程序对应的主通信地址和补充通信地址,确定各通信地址是否是与通信地址知识库中存储的与目标应用程序对应的主通信地址不重叠的待存储主通信地址,并将各通信地址中的待存储主通信地址存储于所述通信地址知识库中,可以根据应用程序的基础信息、通信地址知识库中存储的已知的与应用程序对应的主通信地址和补充通信地址,综合判定与应用程序对应的各通信地址是否是与通信地址知识库中存储的已知的与应用程序对应的主通信地址不重叠的待存储主通信地址,可以对应用程序所对应的通信地址进行更加精准与快速的分析,分析出各通信地址中的待存储主通信地址,将各通信地址中的待存储主通信地址存储于通信地址知识库中,生成了较为完整的包含为应用程序提供主要支撑服务的通信地址的知识库,对于分析并掌握应用程序与提供主要支撑服务的通信地址的关系情况起到了很好的技术支撑作用,为后续确定为违规应用程序提供主要支撑服务的通信地址提供依据,从而实现快速与精准地确定为违规应用程序提供主要支撑服务的通信地址。
附图说明
图1A为本发明实施例一提供的一种通信地址知识库的生成方法的流程图。
图1B为本发明实施例一提供的一种获取目标应用程序的基础信息和与目标应用程序对应的全部通信地址的方法的流程图。
图1C为本发明实施例一提供的一种获取与目标通信地址对应的顶级域名的方法的流程图。
图1D为本发明实施例一提供的一种目标通信地址的检测过程的示意图。
图2为本发明实施例二提供的一种通信地址知识库的生成方法的流程图。
图3为本发明实施例三提供的一种通信地址知识库的生成装置的结构示意图。
图4为本发明实施例四提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1A为本发明实施例一提供的一种通信地址知识库的生成方法的流程图。本发明实施例可适用于生成包含为应用程序提供主要支撑服务的通信地址的知识库的情况,该方法可以由本发明实施例提供的通信地址知识库的生成装置来执行,该装置可采用软件和/或硬件的方式实现,并一般可集成在计算机设备中。例如,服务器中。如图1A所示,本发明实施例的方法具体包括:
步骤101、通过应用程序解析工具对目标应用程序进行解析,获取所述目标应用程序的基础信息和与所述目标应用程序对应的全部通信地址。
其中,所述基础信息包括应用程序名称、应用程序包名以及信息摘要。应用程序名称是应用程序的名称。应用程序包名(Package Name)是目标应用程序的唯一标识。信息摘要是与目标应用程序对应的信息摘要算法(Message-Digest Algorithm 5,MD5)信息。与目标应用程序对应的MD5信息可以用于验证目标应用程序是否已被修改,是否安全。
应用程序(Application,App)为完成某项或多项特定工作的计算机程序,它运行在用户模式,可以和用户进行交互,具有可视的用户界面。本发明实施例中,目标应用程序可以为任意一个或者多个应用程序,本发明实施例中对此不加以限制。应用程序解析工具可以是用于对应用程序进行解析的软件。例如,应用程序解析软件ExEinfo PE。
与所述目标应用程序对应的通信地址是为目标应用程序提供功能服务的通信地址。可选的,通信地址为统一资源定位***(Uniform Resource Locator,URL)格式的通信地址。
目标应用程序可以通过为目标应用程序提供某一个功能服务的通信地址,与用于提供该功能服务的后台服务器建立通信连接,实现该功能。与所述目标应用程序对应的通信地址可以包括主通信地址和补充通信地址。
与目标应用程序对应的主通信地址是为目标应用程序提供主要支撑服务的通信地址。目标应用程序可以通过主通信地址,与用于提供主要支撑服务的后台服务器建立通信连接,以使该后台服务器为目标应用程序提供各种业务支撑,实现目标应用程序的主要功能。
与目标应用程序对应的补充通信地址是为目标应用程序提供补充功能的通信地址。目标应用程序可以有多个用于为目标应用程序提供补充功能的软件开发工具包(Software Development Kit,SDK)。各软件开发工具包为目标应用程序提供不同的补充功能。各软件开发工具包有对应的补充通信地址。目标应用程序的软件开发工具包可以通过与软件开发工具包对应的补充通信地址,与用于提供某一项补充功能的后台服务器建立通信连接,实现该项补充功能。
可选的,通过应用程序解析工具对目标应用程序进行解析,获取所述目标应用程序的基础信息和与所述目标应用程序对应的全部通信地址,包括:通过应用程序解析工具对目标应用程序进行静态解析和动态解析,得到所述目标应用程序的静态解析结果和动态解析结果;在所述静态解析结果中,获取所述目标应用程序的基础信息;在所述动态解析结果中,获取与所述目标应用程序对应的全部通信地址。
可选的,静态解析是通过反编译目标应用程序的安装包文件,解析其中的权限、组件、敏感函数等信息,得到目标应用程序的静态解析结果。目标应用程序的静态解析结果是在目标应用程序的静态解析过程中解析得到的信息。目标应用程序的静态解析结果中包含目标应用程序的应用程序名称、应用程序包名以及信息摘要。
可选的,动态解析是通过在模拟器运行目标应用程序,然后再对目标应用程序进行一些操作以触发尽可能多的行为,接着输出日志,再通过脚本解析日志中的信息,得到目标应用程序的动态解析结果。目标应用程序的动态解析结果中包含与目标应用程序对应的全部通信地址。
在一个具体实例中,图1B为本发明实施例一提供的一种获取目标应用程序的基础信息和与目标应用程序对应的全部通信地址的方法的流程图。如图1B所示,方法具体包括:
步骤1011、通过应用程序解析工具对目标应用程序进行静态解析和动态解析,得到所述目标应用程序的静态解析结果和动态解析结果。
步骤1012、在所述静态解析结果中,获取所述目标应用程序的基础信息。
可选的,提取静态解析结果中的目标应用程序的基础信息。
步骤1013、在所述动态解析结果中,获取与所述目标应用程序对应的全部通信地址。
可选的,提取动态解析结果中的与目标应用程序对应的全部通信地址。
由此,通过应用程序解析工具对目标应用程序进行静态解析和动态解析,通过静态解析获取目标应用程序的基础信息,通过动态解析获取目标应用程序的网络活动信息,即获取与目标应用程序对应的全部通信地址。
步骤102、根据所述基础信息、通信地址知识库中存储的与所述目标应用程序对应的主通信地址和补充通信地址,确定各所述通信地址是否是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址。
其中,所述主通信地址是为应用程序提供主要支撑服务的通信地址,所述补充通信地址是为应用程序提供补充功能的通信地址。
通信地址知识库中可以包括与多个应用程序对应的主通信地址。
可选的,根据所述基础信息、通信地址知识库中存储的与所述目标应用程序对应的主通信地址和补充通信地址,确定各所述通信地址是否是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址,包括:针对与所述目标应用程序对应的每一个通信地址执行下述操作:获取与目标通信地址对应的顶级域名;在检测到所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址和补充通信地址没有包含所述目标通信地址时,使用编辑距离算法计算所述顶级域名和所述应用程序包名的反序结果之间的相似度;在检测到所述相似度大于预设相似度阈值时,确定所述目标通信地址是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址。
可选的,根据所述基础信息、通信地址知识库中存储的与所述目标应用程序对应的主通信地址和补充通信地址,确定各所述通信地址是否是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址,还包括:在检测到所述相似度小于等于预设相似度阈值时,根据所述基础信息获取所述目标应用程序的开发者名称;根据所述顶级域名进行备案查询和域名查询,获取与所述目标通信地址对应的主体名称、网站名称以及所有者名称;使用余弦相似度算法,分别计算所述开发者名称与所述主体名称之间的相似度、所述开发者名称与所述网站名称之间的相似度以及所述开发者名称与所述所有者名称之间的相似度;计算所述目标通信地址在与所述目标应用程序对应的全部通信地址的顶级域名中的占比;根据所述占比、所述开发者名称与所述主体名称之间的相似度、所述开发者名称与所述网站名称之间的相似度以及所述开发者名称与所述所有者名称之间的相似度进行加权计算,得到加权计算结果;在检测到所述加权计算结果大于预设结果阈值时,确定所述目标通信地址是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址;在检测到所述加权计算结果小于等于预设结果阈值时,确定所述目标通信地址不是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址。
可选的,根据所述基础信息、通信地址知识库中存储的与所述目标应用程序对应的主通信地址和补充通信地址,确定各所述通信地址是否是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址,还包括:在检测到所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址或补充通信地址包含所述目标通信地址时,确定所述目标通信地址不是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址。
可选的,获取与目标通信地址对应的顶级域名,包括:提取所述目标通信地址中的域名;提取所述域名中的顶级域名。
其中,目标通信地址为与目标应用程序对应的全部通信地址中的任意一个通信地址。通信地址为URL格式的通信地址,包含域名。域名,又称网域,是由一串用点分隔的名字组成的互联网上某一台计算机或计算机组的名称,用于在数据传输时对计算机的定位标识(有时也指地理位置)。在实际应用中,域名采用分级结构,最高级为根域名,其次为顶级域名,再次为一级域名、二级域名、三级域名等。例如“.”为根域名,“.com”、“.cn”为顶级域名,“abc.com”为一级域名,“www.abc.com”为二级域名。
在一个具体实例中,图1C为本发明实施例一提供的一种获取与目标通信地址对应的顶级域名的方法的流程图。如图1C所示,方法具体包括:
步骤1021、提取目标通信地址中的域名。
步骤1022、提取域名中的顶级域名。
由此,通过首先对URL格式的目标通信地址进行域名提取,然后对域名进行提取顶级域名操作,获取与目标通信地址对应的顶级域名。
可选的,在获取与目标通信地址对应的顶级域名之后,检测所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址和补充通信地址是否包含所述目标通信地址。
通信地址知识库中存储的与所述目标应用程序对应的主通信地址是已知的与目标应用程序对应的主通信地址。可选的,预先建立各已知的主通信地址与目标应用程序的应用程序名称之间的对应关系,然后根据对应关系将各已知的与目标应用程序对应的主通信地址存储于通信地址知识库中。后续可以根据目标应用程序的应用程序名称,获取通信地址知识库中存储的与所述目标应用程序对应的主通信地址。
通信地址知识库中存储的与所述目标应用程序对应的补充通信地址是已知与目标应用程序对应的补充通信地址。可选的,预先建立各已知的补充通信地址与目标应用程序的应用程序名称之间的对应关系,然后根据对应关系将各已知的与目标应用程序对应的补充通信地址存储于通信地址知识库中。后续可以根据目标应用程序的应用程序名称,获取通信地址知识库中存储的与所述目标应用程序对应的补充通信地址。
在一个具体实例中,图1D为本发明实施例一提供的一种目标通信地址的检测过程的示意图。如图1D所示,具体包括:
步骤1201、获取与目标通信地址对应的顶级域名。
步骤1202、判断通信地址知识库中存储的与目标应用程序对应的主通信地址是否包含目标通信地址:若否,则执行步骤1203;若是,则执行步骤1213。
可选的,通信地址知识库中存储的与目标应用程序对应的主通信地址包含目标通信地址,表明目标通信地址是与通信地址知识库中存储的与目标应用程序对应的主通信地址重叠的主通信地址,从而可以确定目标通信地址不是与通信地址知识库中存储的与目标应用程序对应的主通信地址不重叠的待存储主通信地址。
步骤1203、判断通信地址知识库中存储的与目标应用程序对应的补充通信地址是否包含目标通信地址:若否,则执行步骤1204;若是,则执行步骤1213。
可选的,通信地址知识库中存储的与目标应用程序对应的补充通信地址包含目标通信地址,表明目标应用程序是与通信地址知识库中存储的与目标应用程序对应的补充通信地址重叠的补充通信地址,从而可以确定目标通信地址不是与通信地址知识库中存储的与目标应用程序对应的主通信地址不重叠的待存储主通信地址。
步骤1204、使用编辑距离算法计算顶级域名和应用程序包名的反序结果之间的相似度。
其中,在检测到通信地址知识库中存储的与目标应用程序对应的主通信地址和补充通信地址没有包含目标通信地址时,需要对目标通信地址进行进一步分析。
可选的,应用程序包名的反序结果是对应用程序包名进行名称反序操作后得到的结果。示例性的,应用程序包名“com.abc”的反序结果为“abc.com”。
步骤1205、判断相似度是否大于预设相似度阈值:若是,则执行步骤1212;若否,则执行步骤1206。
可选的,预设相似度阈值可以根据业务需求进行设置。
可选的,如果顶级域名和应用程序包名的反序结果之间的相似度大于预设相似度阈值,即目标通信地址的顶级域名和应用程序包名的反序结果之间的相似度较高,代表目标通信地址是与目标应用程序对应的主通信地址的可能性较高,而且根据之前的判断过程已知通信地址知识库中存储的与目标应用程序对应的主通信地址没有包含目标通信地址,从而可以确定目标应用程序是与通信地址知识库中存储的与目标应用程序对应的主通信地址不重叠的待存储主通信地址。
可选的,如果顶级域名和应用程序包名的反序结果之间的相似度小于等于预设相似度阈值,即目标通信地址的顶级域名和应用程序包名的反序结果之间的相似度较低,代表目标通信地址是与目标应用程序对应的主通信地址的可能性较低,从而可以确定目标通信地址不是与通信地址知识库中存储的与目标应用程序对应的主通信地址不重叠的待存储主通信地址。
步骤1206、根据基础信息获取目标应用程序的开发者名称。
可选的,应用程序的开发者名称是应用程序的开发者的名称。预先建立各应用程序的基础信息和应用程序的开发者名称的对应关系,并根据对应关系将各应用程序的基础信息和开发者名称存储至数据库中。由此,可以根据目标应用程序的基础信息,在数据库中获取目标应用程序的开发者名称。
步骤1207、根据顶级域名进行备案查询和域名查询,获取与目标通信地址对应的主体名称、网站名称以及所有者名称。
可选的,备案查询是在域名备案***中查询域名的备案信息。域名查询是在域名注册服务商提供的域名信息平台上查询域名的相关信息,例如,查询域名当前的所有者名称、所有者的联系方式、以及域名的当前状态等。域名注册服务商提供的域名信息平台可以为WHOIS域名信息平台。
可选的,根据顶级域名进行备案查询和域名查询,获取与目标通信地址对应的主体名称、网站名称以及所有者名称,包括:根据顶级域名在域名备案***和域名信息平台上查询目标通信地址的顶级域名的主体名称、网站名称以及所有者名称;将目标通信地址的顶级域名的主体名称、网站名称以及所有者名称确定为与目标通信地址对应的主体名称、网站名称以及所有者名称。
步骤1208、使用余弦相似度算法,分别计算开发者名称与主体名称之间的相似度、开发者名称与网站名称之间的相似度以及开发者名称与所有者名称之间的相似度。
步骤1209、计算目标通信地址在与目标应用程序对应的全部通信地址的顶级域名中的占比。
其中,目标通信地址在与目标应用程序对应的全部通信地址的顶级域名中的占比,即目标通信地址在全部通信地址的顶级域名中的出现次数与全部通信地址的总数量的比值。示例性的,目标通信地址在与目标应用程序对应的全部通信地址的顶级域名中的出现次数为60,与目标应用程序对应的全部通信地址的总数量为100,目标通信地址在与目标应用程序对应的全部通信地址的顶级域名中的占比即为0.6。
步骤1210、根据占比、开发者名称与主体名称之间的相似度、开发者名称与网站名称之间的相似度以及开发者名称与所有者名称之间的相似度进行加权计算,得到加权计算结果。
可选的,根据占比、开发者名称与主体名称之间的相似度、开发者名称与网站名称之间的相似度以及开发者名称与所有者名称之间的相似度进行加权计算,得到加权计算结果,包括:分别计算占比和开发者名称与主体名称之间的相似度的乘积、占比和开发者名称与网站名称之间的相似度的乘积、以及占比和开发者名称与所有者名称之间的相似度的乘积,然后对上述乘积求和,得到加权计算结果。示例性的,目标通信地址在与目标应用程序对应的全部通信地址的顶级域名中的占比为0.6,开发者名称与主体名称之间的相似度为0.6,开发者名称与网站名称之间的相似度为0.4,开发者名称与所有者名称之间的相似度为0.6。占比和开发者名称与主体名称之间的相似度的乘积为0.36,占比和开发者名称与网站名称之间的相似度的乘积为0.24,占比和开发者名称与所有者名称之间的相似度的乘积为0.36,然后对上述乘积求和,得到加权计算结果0.96。
步骤1211、判断加权计算结果是否大于预设结果阈值:若是,则执行步骤1212;若否,则执行步骤1213。
可选的,预设结果阈值可以根据业务需求进行设置。
可选的,如果加权计算结果大于预设结果阈值,即开发者名称与主体名称、网站名称以及所有者名称之间的相似度较高,代表目标通信地址是与目标应用程序对应的主通信地址的可能性较高,而且根据之前的判断过程已知通信地址知识库中存储的与目标应用程序对应的主通信地址没有包含目标通信地址,从而可以确定目标应用程序是与通信地址知识库中存储的与目标应用程序对应的主通信地址不重叠的待存储主通信地址。
可选的,如果加权计算结果大于预设结果阈值,即开发者名称与主体名称、网站名称以及所有者名称之间的相似度较低,代表目标通信地址是与目标应用程序对应的主通信地址的可能性较低,从而可以确定目标通信地址不是与通信地址知识库中存储的与目标应用程序对应的主通信地址不重叠的待存储主通信地址。
步骤1212、确定目标通信地址是与通信地址知识库中存储的与目标应用程序对应的主通信地址不重叠的待存储主通信地址。
步骤1213、确定目标通信地址不是与通信地址知识库中存储的与目标应用程序对应的主通信地址不重叠的待存储主通信地址。
由此,可以通过上述检测过程,综合判定出各通信地址是否是与通信地址知识库中存储的与目标应用程序对应的主通信地址不重叠的待存储主通信地址。
步骤103、将各所述通信地址中的待存储主通信地址存储于所述通信地址知识库中。
可选的,通信地址知识库是包含多个应用程序所对应的主通信地址的知识库,即包含为多个应用程序提供主要支撑服务的通信地址的知识库。待存储主通信地址即为还未存储至通信地址知识库中的与应用程序对应的主通信地址。
可选的,将各所述通信地址中的待存储主通信地址存储于所述通信地址知识库中,包括:建立各所述通信地址中的待存储主通信地址与所述应用程序名称的对应关系;根据所述对应关系将所述待存储主通信地址存储于所述通信地址知识库中。后续可以根据目标应用程序的应用程序名称,获取通信地址知识库中存储的与所述目标应用程序对应的主通信地址。
相关技术中,随着应用程序的服务内容不断丰富,为应用程序提供补充功能的通信地址的数量不断增加,导致为应用程序提供功能服务的通信地址数量较多,需要投入较多人力进行分析,难以快速与精准地确定为违规应用程序提供主要支撑服务的通信地址。
本发明实施例基于应用程序解析工具,解析应用程序的基础信息(应用程序名称、应用程序包名以及信息摘要等相关信息),解析应用程序的网络活动信息(与应用程序对应的全部通信地址),然后对通信地址进行分析,分析出各所述通信地址中的待存储主通信地址,将各所述通信地址中的待存储主通信地址存储于所述通信地址知识库中,生成了较为完整的包含为应用程序提供主要支撑服务的通信地址的知识库,对于分析并掌握应用程序与提供主要支撑服务的通信地址的关系情况起到了很好的技术支撑作用。在应用程序发生违规时,可以在包含为应用程序提供主要支撑服务的通信地址的知识库中,快速与精准地获取为违规应用程序提供主要支撑服务的通信地址,从而实现快速与精准地确定为违规应用程序提供主要支撑服务的通信地址。
本发明实施例根据应用程序的基础信息、通信地址知识库中存储的已知的与应用程序对应的主通信地址和补充通信地址,综合判定与应用程序对应的各通信地址是否是与通信地址知识库中存储的已知的与应用程序对应的主通信地址不重叠的待存储主通信地址,可以对应用程序所对应的通信地址进行更加精准与快速的分析,并提取应用程序所对应的主通信地址信息,便于更深入的了解应用程序相应活动特性,从而能更全面与高效的对于相关行业管理以及行业发展提供支持。
本发明实施例提供了一种通信地址知识库的生成方法,通过应用程序解析工具对目标应用程序进行解析,获取目标应用程序的基本信息和与目标应用程序对应的全部通信地址,然后根据基本信息、通信地址知识库中存储的与目标应用程序对应的主通信地址和补充通信地址,确定各通信地址是否是与通信地址知识库中存储的与目标应用程序对应的主通信地址不重叠的待存储主通信地址,并将各通信地址中的待存储主通信地址存储于所述通信地址知识库中,可以根据应用程序的基础信息、通信地址知识库中存储的已知的与应用程序对应的主通信地址和补充通信地址,综合判定与应用程序对应的各通信地址是否是与通信地址知识库中存储的已知的与应用程序对应的主通信地址不重叠的待存储主通信地址,可以对应用程序所对应的通信地址进行更加精准与快速的分析,分析出各通信地址中的待存储主通信地址,将各通信地址中的待存储主通信地址存储于通信地址知识库中,生成了较为完整的包含为应用程序提供主要支撑服务的通信地址的知识库,对于分析并掌握应用程序与提供主要支撑服务的通信地址的关系情况起到了很好的技术支撑作用,为后续确定为违规应用程序提供主要支撑服务的通信地址提供依据,从而实现快速与精准地确定为违规应用程序提供主要支撑服务的通信地址。
实施例二
图2为本发明实施例二提供的一种通信地址知识库的生成方法的流程图。本发明实施例可以与上述一个或者多个实施例中各个可选方案结合。如图2所示,本发明实施例的方法具体包括:
步骤201、通过应用程序解析工具对目标应用程序进行静态解析和动态解析,得到所述目标应用程序的静态解析结果和动态解析结果。
可选的,静态解析是通过反编译目标应用程序的安装包文件,解析其中的权限、组件、敏感函数等信息,得到目标应用程序的静态解析结果。目标应用程序的静态解析结果是在目标应用程序的静态解析过程中解析得到的信息。目标应用程序的静态解析结果中包含目标应用程序的应用程序名称、应用程序包名以及信息摘要。
可选的,动态解析是通过在模拟器运行目标应用程序,然后再对目标应用程序进行一些操作以触发尽可能多的行为,接着输出日志,再通过脚本解析日志中的信息,得到目标应用程序的动态解析结果。目标应用程序的动态解析结果中包含与目标应用程序对应的全部通信地址。
步骤202、在所述静态解析结果中,获取所述目标应用程序的基础信息。
可选的,提取静态解析结果中的目标应用程序的基础信息。
步骤203、在所述动态解析结果中,获取与所述目标应用程序对应的全部通信地址。
可选的,提取动态解析结果中的与目标应用程序对应的全部通信地址。
步骤204、根据所述基础信息、通信地址知识库中存储的与所述目标应用程序对应的主通信地址和补充通信地址,确定各所述通信地址是否是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址。
其中,所述主通信地址是为应用程序提供主要支撑服务的通信地址,所述补充通信地址是为应用程序提供补充功能的通信地址。
步骤205、建立各所述通信地址中的待存储主通信地址与所述应用程序名称之间的对应关系。
步骤206、根据所述对应关系将所述待存储主通信地址存储于所述通信地址知识库中。
本发明实施例提供了一种通信地址知识库的生成方法,通过应用程序解析工具对目标应用程序进行静态解析和动态解析,通过静态解析获取目标应用程序的基础信息,通过动态解析获取目标应用程序的网络活动信息,即获取与目标应用程序对应的全部通信地址,可以根据应用程序的基础信息、通信地址知识库中存储的已知的与应用程序对应的主通信地址和补充通信地址,综合判定与应用程序对应的各通信地址是否是与通信地址知识库中存储的已知的与应用程序对应的主通信地址不重叠的待存储主通信地址,可以对应用程序所对应的通信地址进行更加精准与快速的分析,并提取应用程序所对应的主通信地址信息。
实施例三
图3为本发明实施例三提供的一种通信地址知识库的生成装置的结构示意图。如图3所示,所述装置包括:应用程序解析模块301、主通信地址确定模块302以及主通信地址存储模块303。
其中,应用程序解析模块301,用于通过应用程序解析工具对目标应用程序进行解析,获取所述目标应用程序的基础信息和与所述目标应用程序对应的全部通信地址;其中,所述基础信息包括应用程序名称、应用程序包名以及信息摘要;主通信地址确定模块302,用于根据所述基础信息、通信地址知识库中存储的与所述目标应用程序对应的主通信地址和补充通信地址,确定各所述通信地址是否是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址;其中,所述主通信地址是为应用程序提供主要支撑服务的通信地址,所述补充通信地址是为应用程序提供补充功能的通信地址;主通信地址存储模块303,用于将各所述通信地址中的待存储主通信地址存储于所述通信地址知识库中。
本发明实施例提供了一种通信地址知识库的生成装置,通过应用程序解析工具对目标应用程序进行解析,获取目标应用程序的基本信息和与目标应用程序对应的全部通信地址,然后根据基本信息、通信地址知识库中存储的与目标应用程序对应的主通信地址和补充通信地址,确定各通信地址是否是与通信地址知识库中存储的与目标应用程序对应的主通信地址不重叠的待存储主通信地址,并将各通信地址中的待存储主通信地址存储于所述通信地址知识库中,可以根据应用程序的基础信息、通信地址知识库中存储的已知的与应用程序对应的主通信地址和补充通信地址,综合判定与应用程序对应的各通信地址是否是与通信地址知识库中存储的已知的与应用程序对应的主通信地址不重叠的待存储主通信地址,可以对应用程序所对应的通信地址进行更加精准与快速的分析,分析出各通信地址中的待存储主通信地址,将各通信地址中的待存储主通信地址存储于通信地址知识库中,生成了较为完整的包含为应用程序提供主要支撑服务的通信地址的知识库,对于分析并掌握应用程序与提供主要支撑服务的通信地址的关系情况起到了很好的技术支撑作用,为后续确定为违规应用程序提供主要支撑服务的通信地址提供依据,从而实现快速与精准地确定为违规应用程序提供主要支撑服务的通信地址。
在本发明实施例的一个可选实施方式中,可选的,应用程序解析模块301可以包括:应用程序解析单元,用于通过应用程序解析工具对目标应用程序进行静态解析和动态解析,得到所述目标应用程序的静态解析结果和动态解析结果;基础信息获取单元,用于在所述静态解析结果中,获取所述目标应用程序的基础信息;通信地址获取单元,用于在所述动态解析结果中,获取与所述目标应用程序对应的全部通信地址。
在本发明实施例的一个可选实施方式中,可选的,主通信地址确定模块302具体用于:针对与所述目标应用程序对应的每一个通信地址执行下述操作:获取与目标通信地址对应的顶级域名;在检测到所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址和补充通信地址没有包含所述目标通信地址时,使用编辑距离算法计算所述顶级域名和所述应用程序包名的反序结果之间的相似度;在检测到所述相似度大于预设相似度阈值时,确定所述目标通信地址是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址。
在本发明实施例的一个可选实施方式中,可选的,主通信地址确定模块302还具体用于:在检测到所述相似度小于等于预设相似度阈值时,根据所述基础信息获取所述目标应用程序的开发者名称;根据所述顶级域名进行备案查询和域名查询,获取与所述目标通信地址对应的主体名称、网站名称以及所有者名称;使用余弦相似度算法,分别计算所述开发者名称与所述主体名称之间的相似度、所述开发者名称与所述网站名称之间的相似度以及所述开发者名称与所述所有者名称之间的相似度;计算所述目标通信地址在与所述目标应用程序对应的全部通信地址的顶级域名中的占比;根据所述占比、所述开发者名称与所述主体名称之间的相似度、所述开发者名称与所述网站名称之间的相似度以及所述开发者名称与所述所有者名称之间的相似度进行加权计算,得到加权计算结果;在检测到所述加权计算结果大于预设结果阈值时,确定所述目标通信地址是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址;在检测到所述加权计算结果小于等于预设结果阈值时,确定所述目标通信地址不是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址。
在本发明实施例的一个可选实施方式中,可选的,主通信地址确定模块302在获取与目标通信地址对应的顶级域名时,具体用于:提取所述目标通信地址中的域名;提取所述域名中的顶级域名。
在本发明实施例的一个可选实施方式中,可选的,主通信地址确定模块302还具体用于:在检测到所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址或补充通信地址包含所述目标通信地址时,确定所述目标通信地址不是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址。
在本发明实施例的一个可选实施方式中,可选的,主通信地址存储模块303可以包括:关系建立单元,用于建立各所述通信地址中的待存储主通信地址与所述应用程序名称之间的对应关系;地址存储单元,用于根据所述对应关系将所述待存储主通信地址存储于所述通信地址知识库中。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
上述通信地址知识库的生成装置可执行本发明任意实施例所提供的通信地址知识库的生成方法,具备执行通信地址知识库的生成方法相应的功能模块和有益效果。
实施例四
图4为本发明实施例四提供的一种计算机设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性计算机设备12的框图。图4显示的计算机设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器16,存储器28,连接不同***组件(包括存储器28和处理器16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及***组件互连(PCI)总线。
计算机设备12典型地包括多种计算机***可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图4中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
处理器16通过运行存储在存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的通信地址知识库的生成方法。该方法具体可以包括:通过应用程序解析工具对目标应用程序进行解析,获取所述目标应用程序的基础信息和与所述目标应用程序对应的全部通信地址;其中,所述基础信息包括应用程序名称、应用程序包名以及信息摘要;根据所述基础信息、通信地址知识库中存储的与所述目标应用程序对应的主通信地址和补充通信地址,确定各所述通信地址是否是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址;其中,所述主通信地址是为应用程序提供主要支撑服务的通信地址,所述补充通信地址是为应用程序提供补充功能的通信地址;将各所述通信地址中的待存储主通信地址存储于所述通信地址知识库中。
实施例五
本发明实施例五提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,例如实现本发明实施例所提供的通信地址知识库的生成方法。该方法具体可以包括:通过应用程序解析工具对目标应用程序进行解析,获取所述目标应用程序的基础信息和与所述目标应用程序对应的全部通信地址;其中,所述基础信息包括应用程序名称、应用程序包名以及信息摘要;根据所述基础信息、通信地址知识库中存储的与所述目标应用程序对应的主通信地址和补充通信地址,确定各所述通信地址是否是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址;其中,所述主通信地址是为应用程序提供主要支撑服务的通信地址,所述补充通信地址是为应用程序提供补充功能的通信地址;将各所述通信地址中的待存储主通信地址存储于所述通信地址知识库中。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或计算机设备上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种通信地址知识库的生成方法,其特征在于,包括:
通过应用程序解析工具对目标应用程序进行解析,获取所述目标应用程序的基础信息和与所述目标应用程序对应的全部通信地址;其中,所述基础信息包括应用程序名称、应用程序包名以及信息摘要;
根据所述基础信息、通信地址知识库中存储的与所述目标应用程序对应的主通信地址和补充通信地址,确定各所述通信地址是否是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址;其中,所述主通信地址是为应用程序提供主要支撑服务的通信地址,所述补充通信地址是为应用程序提供补充功能的通信地址;
将各所述通信地址中的待存储主通信地址存储于所述通信地址知识库中。
2.根据权利要求1所述的方法,其特征在于,通过应用程序解析工具对目标应用程序进行解析,获取所述目标应用程序的基础信息和与所述目标应用程序对应的全部通信地址,包括:
通过应用程序解析工具对目标应用程序进行静态解析和动态解析,得到所述目标应用程序的静态解析结果和动态解析结果;
在所述静态解析结果中,获取所述目标应用程序的基础信息;
在所述动态解析结果中,获取与所述目标应用程序对应的全部通信地址。
3.根据权利要求1所述的方法,其特征在于,根据所述基础信息、通信地址知识库中存储的与所述目标应用程序对应的主通信地址和补充通信地址,确定各所述通信地址是否是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址,包括:
针对与所述目标应用程序对应的每一个通信地址执行下述操作:
获取与目标通信地址对应的顶级域名;
在检测到所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址和补充通信地址没有包含所述目标通信地址时,使用编辑距离算法计算所述顶级域名和所述应用程序包名的反序结果之间的相似度;
在检测到所述相似度大于预设相似度阈值时,确定所述目标通信地址是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址。
4.根据权利要求3所述的方法,其特征在于,根据所述基础信息、通信地址知识库中存储的与所述目标应用程序对应的主通信地址和补充通信地址,确定各所述通信地址是否是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址,还包括:
在检测到所述相似度小于等于预设相似度阈值时,根据所述基础信息获取所述目标应用程序的开发者名称;
根据所述顶级域名进行备案查询和域名查询,获取与所述目标通信地址对应的主体名称、网站名称以及所有者名称;
使用余弦相似度算法,分别计算所述开发者名称与所述主体名称之间的相似度、所述开发者名称与所述网站名称之间的相似度以及所述开发者名称与所述所有者名称之间的相似度;
计算所述目标通信地址在与所述目标应用程序对应的全部通信地址的顶级域名中的占比;
根据所述占比、所述开发者名称与所述主体名称之间的相似度、所述开发者名称与所述网站名称之间的相似度以及所述开发者名称与所述所有者名称之间的相似度进行加权计算,得到加权计算结果;
在检测到所述加权计算结果大于预设结果阈值时,确定所述目标通信地址是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址;
在检测到所述加权计算结果小于等于预设结果阈值时,确定所述目标通信地址不是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址。
5.根据权利要求3所述的方法,其特征在于,获取与目标通信地址对应的顶级域名,包括:
提取所述目标通信地址中的域名;
提取所述域名中的顶级域名。
6.根据权利要求3所述的方法,其特征在于,根据所述基础信息、通信地址知识库中存储的与所述目标应用程序对应的主通信地址和补充通信地址,确定各所述通信地址是否是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址,还包括:
在检测到所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址或补充通信地址包含所述目标通信地址时,确定所述目标通信地址不是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址。
7.根据权利要求1所述的方法,其特征在于,将各所述通信地址中的待存储主通信地址存储于所述通信地址知识库中,包括:
建立各所述通信地址中的待存储主通信地址与所述应用程序名称之间的对应关系;
根据所述对应关系将所述待存储主通信地址存储于所述通信地址知识库中。
8.一种通信地址知识库的生成装置,其特征在于,包括:
应用程序解析模块,用于通过应用程序解析工具对目标应用程序进行解析,获取所述目标应用程序的基础信息和与所述目标应用程序对应的全部通信地址;其中,所述基础信息包括应用程序名称、应用程序包名以及信息摘要;
主通信地址确定模块,用于根据所述基础信息、通信地址知识库中存储的与所述目标应用程序对应的主通信地址和补充通信地址,确定各所述通信地址是否是与所述通信地址知识库中存储的与所述目标应用程序对应的主通信地址不重叠的待存储主通信地址;其中,所述主通信地址是为应用程序提供主要支撑服务的通信地址,所述补充通信地址是为应用程序提供补充功能的通信地址;
主通信地址存储模块,用于将各所述通信地址中的待存储主通信地址存储于所述通信地址知识库中。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7中任一所述的通信地址知识库的生成方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一所述的通信地址知识库的生成方法。
CN202011629917.XA 2020-12-31 2020-12-31 通信地址知识库的生成方法、装置、设备及存储介质 Active CN112685072B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011629917.XA CN112685072B (zh) 2020-12-31 2020-12-31 通信地址知识库的生成方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011629917.XA CN112685072B (zh) 2020-12-31 2020-12-31 通信地址知识库的生成方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112685072A true CN112685072A (zh) 2021-04-20
CN112685072B CN112685072B (zh) 2023-08-01

Family

ID=75455869

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011629917.XA Active CN112685072B (zh) 2020-12-31 2020-12-31 通信地址知识库的生成方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112685072B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113890866A (zh) * 2021-09-26 2022-01-04 恒安嘉新(北京)科技股份公司 一种违规应用软件识别方法、装置、介质及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030182401A1 (en) * 2002-03-25 2003-09-25 Alps System Integration Co., Ltd. URL information sharing system using proxy cache of proxy log
CN106067879A (zh) * 2016-06-07 2016-11-02 腾讯科技(深圳)有限公司 信息的检测方法及装置
CN107018210A (zh) * 2017-04-12 2017-08-04 北京微影时代科技有限公司 一种ip地址库创建方法及装置
CN108076006A (zh) * 2016-11-09 2018-05-25 华为技术有限公司 一种查找被攻击主机的方法及日志管理服务器
CN111478984A (zh) * 2020-03-17 2020-07-31 平安科技(深圳)有限公司 服务器ip地址获取方法、装置及计算机可读存储介质
CN111782231A (zh) * 2020-07-14 2020-10-16 厦门市美亚柏科信息股份有限公司 服务部署方法和装置
CN112015910A (zh) * 2020-08-20 2020-12-01 恒安嘉新(北京)科技股份公司 域名知识库的生成方法、装置、计算机设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030182401A1 (en) * 2002-03-25 2003-09-25 Alps System Integration Co., Ltd. URL information sharing system using proxy cache of proxy log
CN106067879A (zh) * 2016-06-07 2016-11-02 腾讯科技(深圳)有限公司 信息的检测方法及装置
CN108076006A (zh) * 2016-11-09 2018-05-25 华为技术有限公司 一种查找被攻击主机的方法及日志管理服务器
CN107018210A (zh) * 2017-04-12 2017-08-04 北京微影时代科技有限公司 一种ip地址库创建方法及装置
CN111478984A (zh) * 2020-03-17 2020-07-31 平安科技(深圳)有限公司 服务器ip地址获取方法、装置及计算机可读存储介质
CN111782231A (zh) * 2020-07-14 2020-10-16 厦门市美亚柏科信息股份有限公司 服务部署方法和装置
CN112015910A (zh) * 2020-08-20 2020-12-01 恒安嘉新(北京)科技股份公司 域名知识库的生成方法、装置、计算机设备及存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ANGEL_CG: "一个完整的URL 解析过程", pages 1 - 3, Retrieved from the Internet <URL:https://blog.csdn.net/angle_chen123/article/details/85335244> *
CAYMANT: "计算两个URL的相似度 编辑距离和docsim", pages 1 - 2, Retrieved from the Internet <URL:https://blog.csdn.net/cayman_2015/article/details/84950524> *
XIAOBIN FU等: "Mining navigation history for recommendation", PROCEEDINGS OF THE 5TH INTERNATIONAL CONFERENCE ON INTELLIGENT USER INTERFACES, pages 106 *
张志海: "移动互联网绿色上网管理***的设计与实现", 中国优秀硕士学位论文全文数据库信息科技辑, no. 3, pages 139 - 182 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113890866A (zh) * 2021-09-26 2022-01-04 恒安嘉新(北京)科技股份公司 一种违规应用软件识别方法、装置、介质及电子设备
CN113890866B (zh) * 2021-09-26 2024-03-12 恒安嘉新(北京)科技股份公司 一种违规应用软件识别方法、装置、介质及电子设备

Also Published As

Publication number Publication date
CN112685072B (zh) 2023-08-01

Similar Documents

Publication Publication Date Title
CN108667855B (zh) 网络流量异常监测方法、装置、电子设备及存储介质
CN110990020A (zh) 一种软件编译方法、装置及电子设备和存储介质
CN110321154B (zh) 一种微服务的接口信息展示方法、装置及电子设备
CN109637000B (zh) ***检验方法及装置、存储介质、电子终端
CN112035354B (zh) 风险代码的定位方法、装置、设备及存储介质
US20200327043A1 (en) System and a method for automated script generation for application testing
CN111241111B (zh) 数据查询方法及装置、数据对比方法及装置、介质及设备
CN112685029A (zh) 一种可视化模板的生成方法、装置、设备及存储介质
CN113032834A (zh) 一种数据库表格处理方法、装置、设备及存储介质
CN110597704B (zh) 应用程序的压力测试方法、装置、服务器和介质
CN109388568B (zh) 代码测试方法和装置
CN112685072B (zh) 通信地址知识库的生成方法、装置、设备及存储介质
US10489728B1 (en) Generating and publishing a problem ticket
CN110858143B (zh) 一种安装包生成方法、装置、设备及存储介质
CN115022201B (zh) 一种数据处理功能测试方法、装置、设备及存储介质
CN111309311B (zh) 一种漏洞检测工具生成方法、装置、设备及可读存储介质
CN110674491B (zh) 用于安卓应用的实时取证的方法、装置和电子设备
CN114090650A (zh) 一种样本数据识别方法、装置、电子设备及存储介质
CN113656301A (zh) 一种接口测试方法、装置、设备及存储介质
EP2782005A1 (en) Verifying state reachability in a statechart model having computer program code embedded therein
CN113760696A (zh) 一种程序问题定位方法、装置、电子设备和存储介质
CN113746953B (zh) 域名服务器dns处理方法、装置、设备及存储介质
CN117033318B (zh) 一种待测数据的生成方法、装置、存储介质及电子设备
CN111061502B (zh) 一种安装包获取方法、装置、设备和存储介质
CN115495750A (zh) 组件检测方法、装置、电子设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant