CN113947339A - 生成资产线索数据的方法和装置 - Google Patents
生成资产线索数据的方法和装置 Download PDFInfo
- Publication number
- CN113947339A CN113947339A CN202111575548.5A CN202111575548A CN113947339A CN 113947339 A CN113947339 A CN 113947339A CN 202111575548 A CN202111575548 A CN 202111575548A CN 113947339 A CN113947339 A CN 113947339A
- Authority
- CN
- China
- Prior art keywords
- asset
- data
- field
- type
- inventory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Game Theory and Decision Science (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开提供了一种生成资产线索数据的方法和装置,涉及大数据处理技术领域。其中该方法包括:获取多种类型的存量资产数据;提取每种类型的存量资产数据中与资产相关的关联字段以及关联字段的字段内容,并且获取关联字段的字段内容所涉及的对象;针对每种类型的存量资产数据,基于提取的关联字段以及对应的字段内容和字段内容所涉及的对象,生成与每种类型的存量资产数据相对应的资产线索主体;以及基于每个对象构建多个资产线索主体之间的索引关系,以通过所述索引关系和对应的关联字段的字段内容生成资产线索数据。
Description
技术领域
本公开涉及大数据处理技术领域,具体涉及一种生成资产线索数据的方法及装置、电子设备、计算机可读存储介质和计算机程序产品。
背景技术
由于与企业或企业人员有关的数据涉及的维度较多并且涉及范围广,因此在这些数据的基础上需要进行一些关联分析,才能体现出数据的价值。现有技术中,缺少对于企业或企业人员的资产线索的挖掘分析,无法帮助用户在多元化的数据中快速找到相关企业或企业人员的资产流向。因此,无法根据资产流向进行风险预警,从而正确把握企业的相关资产信息的变化。由此可知,如何对企业或企业人员的资产线索数据进行挖掘分析,是目前亟需解决的技术问题。
发明内容
根据本公开实施例的一个方面,提供了一种生成资产线索数据的方法,包括:
获取多种类型的存量资产数据;
提取每种类型的存量资产数据中与资产相关的关联字段以及所述关联字段的字段内容,并且获取所述关联字段的字段内容所涉及的对象;
针对每种类型的存量资产数据,基于提取的关联字段以及对应的字段内容和字段内容所涉及的对象,生成与每种类型的存量资产数据相对应的资产线索主体;以及
基于每个对象构建多个资产线索主体之间的索引关系,以通过所述索引关系和对应的关联字段的字段内容生成资产线索数据。
可选地,所述存量资产数据为在当前的统计时间区段之前的多个统计时间区段内收集的资产数据。
可选地,根据与资产相关联的字段配置文件,提取每种类型的存量资产数据中与资产相关的关联字段以及所述关联字段的字段内容,并且获取所述关联字段的字段内容所涉及的对象,
其中,所述字段配置文件用于记录每种类型的资产数据中的多个与资产相关的关联字段。
可选地,还包括:根据每种类型的存量资产数据的时间戳,将每种类型的存量资产数据分别划分到至少一个数据分区内。
可选地,获取所述关联字段的字段内容所涉及的对象,包括:
获取每种类型的存量资产数据在每个数据分区内的与关联字段相关的字段内容;
获取所述每个数据分区内的与关联字段相关的字段内容所涉及的一个或者多个对象,其中,每个对象具有与所述关联字段的字段内容相对应的对象标识。
可选地,还包括:获取与所述对象标识相关的关联对象,其中,所述关联对象包括关联人员和/或关联公司;
建立所述对象标识与所述关联对象之间的索引关系。
可选地,所述针对每种类型的存量资产数据,基于提取的关联字段以及对应的字段内容和字段内容所涉及的对象,生成与每种类型的存量资产数据相对应的资产线索主体,包括:
按照所述关联字段的字段内容所涉及的对象,根据每种类型的存量资产数据中所述关联字段的字段内容生成与每种类型的存量资产数据相关的多条资产记录;
基于与每种类型的存量资产数据相关的多条资产记录,生成与所述每种类型的存量资产数据相对应的资产线索主体。
可选地,基于每个对象构建多个资产线索主体之间的索引关系,以通过所述索引关系和对应的关联字段的字段内容生成资产线索数据,包括:
以每个对象为索引,在多个资产线索主体中归属于同一对象的所述关联字段的字段内容之间构建索引关系;以及
通过所述索引关系,基于所归属的同一对象的所述关联字段的字段内容构成每个对象的资产线索数据。
可选地,每个对象的资产线索数据包括:
与每个对象相关联的多种类型的资产数据。
可选地,还包括:获取多种类型的增量资产数据;
提取每种类型的增量资产数据中与资产相关的关联字段,并且获取所述关联字段的字段内容所涉及的对象;
根据所述关联字段的字段内容所涉及的对象,将所述字段内容添加到相对应的资产线索数据中。
基于本公开实施例的另一方面,提供了一种生成资产线索数据的装置,包括:
存量数据获取模块,用于获取多种类型的存量资产数据;
字段和对象获取模块,用于提取每种类型的存量资产数据中与资产相关的关联字段以及所述关联字段的字段内容,并且获取所述关联字段的字段内容所涉及的对象;
资产线索主体生成模块,用于针对每种类型的存量资产数据,基于提取的关联字段以及对应的字段内容和字段内容所涉及的对象,生成与每种类型的存量资产数据相对应的资产线索主体;
资产线索数据生成模块,用于基于每个对象构建多个资产线索主体之间的索引关系,以通过所述索引关系和对应的关联字段的字段内容生成资产线索数据。
基于本公开实施例的又一方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述任一实施例所述的方法。
基于本公开实施例的再一方面,提供了一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述任一实施例所述的方法。
基于本公开实施例的再一方面,提供了一种计算机程序产品,包括计算机可读代码,其特征在于,当所述计算机可读代码在设备上运行时,所述设备中的处理器执行用于实现上述任一实施例所述的方法。
基于本公开上述实施例提供的生成资产线索数据的方法及装置、电子设备、计算机可读存储介质和计算机程序产品,能够通过目标企业及其关联企业和关联人员的存量资产数据,挖掘与各类资产有关的字段,形成目标企业及其关联企业和关联人员的各类资产线索,然后建立目标企业与这些资产线索之间的索引关系,以便用户查询、追踪和进行安全预警。基于这些改进,本公开可以帮助用户在多元化的数据中快速找到相关企业或企业人员的资产流向,从而可以根据资产流向进行风险预警,以便正确把握企业的相关资产信息的变化。
附图说明
图1是本公开一示例性实施例提供的生成资产线索数据的方法的流程示意图;
图2是本公开一示例性实施例提供的生成资产线索数据的装置的示意图;
图3是本公开一示例性实施例提供的生成资产线索数据的逻辑示意图;以及
图4是本公开一示例性实施例提供的电子设备的示意图。
具体实施方式
下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。
应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
另外,本公开中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本公开实施例可以应用于终端设备、计算机***、服务器等电子设备,其可与众多其它通用或专用计算***环境或配置一起操作。适于与终端设备、计算机***、服务器等电子设备一起使用的众所周知的终端设备、计算***、环境和/或配置的例子包括但不限于:个人计算机***、服务器计算机***、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的***、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机***、大型计算机***和包括上述任何***的分布式云计算技术环境,等等。
终端设备、计算机***、服务器等电子设备可以在由计算机***执行的计算机***可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机***/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算***存储介质上。
本公开实施例提供了一种生成资产线索数据的方法,通过目标企业及其关联企业和关联人员的存量资产数据,挖掘与各类资产有关的字段,形成目标企业及其关联企业和关联人员的各类资产线索,然后建立目标企业与这些资产线索之间的索引关系,以便用户查询、追踪和进行安全预警。因而本公开的生成资产线索数据的方法可以帮助用户在多元化的数据中快速找到相关企业或企业人员的资产流向,从而可以根据资产流向进行风险预警,以便正确把握企业的相关资产信息的变化。
图1是本公开一示例性实施例提供的生成资产线索数据的方法的流程示意图。本实施例可应用在电子设备上,如图1所示,包括以下步骤:
步骤S101,获取多种类型的存量资产数据。
在一个实施例中,存量资产数据为在当前的统计时间区段之前的多个统计时间区段内收集的资产数据。存量资产数据是指已经收集或已经存在的资产数据,也可以认为是历史资产数据。存量资产数据包括多个类型,例如,资本资产、股权类资产、不动产、非诉资产、涉诉资产、对外债权、对外投资、无形资产、商业往来资产、担保类资产等。
应当了解的是,在本公开为了对生成资产线索数据时,已经获取的数据和最新获取的数据进行区分,将已经获取的资产数据标识为存量资产数据,并且将最新获取的资产数据标识为增量资产数据。由此可知,存量资产数据和增量资产数据均为包括资产数据的数据,并且存量资产数据和增量资产数据有相同的作用、属性和内容等。
增量资产数据是在进行数据更新时确定的新增加的数据。例如,在当前的统计时间区段期满后,那么当前的统计时间区段中的数据为增量资产数据。其中统计时间区段可以使一个自然日。通常,存量资产数据和增量资产数据均包括多个字段,其中部分字段与资产数据相关,部分字段与资产数据无关。在本公开中,将与资产数据相关的字段确定为关联字段。
在一个实施例中,存量资产数据包含各种类型的与资产相关的数据和附加数据。可选地,使用DataX数据同步工具,将数据库中的数据整合到DataWorks平台。DataX是目前广泛使用的离线数据同步工具/平台,能够实现包括 MySQL、SQL Server、Oracle、Hive 、HBase等各种异构数据源之间高效的数据同步功能。DataWorks平台相当于一个数据仓库,并且底层数据可以按天进行调度。例如,本公开中,可以在每天凌晨获取前一天的所有类型的资产数据,来完成数据聚合操作。如上所述,所有类型的资产数据包括:资本资产、股权类资产、不动产、非诉资产、涉诉资产、对外债权、对外投资、无形资产、商业往来资产、担保类资产和其他类型的资产数据。
在一个实施例中,在对存量资产数据进行聚合之后,首先对经过聚合的处理数据进行预处理。预处理的主要工作是数据清洗,例如,将重复的、不完整的脏数据进行处理和过滤。然后,可以对存量资产数据进行关联分析。可选地,本公开使用spark sql从DataWorks平台获取存量资产数据以进行关联分析。从DataWorks平台获取的各种类型的存量资产数据存在于不同的表中。
步骤S102,提取每种类型的存量资产数据中与资产相关的关联字段以及关联字段的字段内容,并且获取关联字段的字段内容所涉及的对象。
在一个实施例中,根据与资产相关联的字段配置文件,提取每种类型的存量资产数据中与资产相关的关联字段以及关联字段的字段内容,并且获取关联字段的字段内容所涉及的对象。由于字段配置文件可以指示每种类型的存量资产数据中与资产相关的关联字段和与资产不相关的非关联字段,因此通过本公开实施例,可以准确地从资产数据中提取相应的信息,包括与资产相关的关联字段、关联字段的字段内容、以及各字段内容涉及的对象等。
在一个实施例中,字段配置文件用于记录每种类型的资产数据中的多个与资产相关的关联字段。关联字段包括至少一个字段。每个字段均具有字段内容,例如,字段内容所涉及的对象包括对象标识。例如,存量数据的类型为专利数据,其中专利数据的多个字段包括:申请人、发明人、申请号、专利名称、专利类型、法律状态、公开(公告)号、公开(公告)日以及分类号等。
在专利数据的多个字段中,根据与资产相关联的字段配置文件确定,与资产相关的关联字段包括:申请人、申请号、专利名称、专利类型、法律状态、公开(公告)号、申请日等。在确定了关联字段后,获取类型为专利数据的资产关联字段的字段内容。字段内容例如是表中的多条记录。
在一个实施例中,本公开根据每种类型的存量资产数据的时间戳(时间戳表征存量资产数据产生的时间),将每种类型的存量资产数据分别划分到至少一个数据分区内。
由于从DataWorks平台获取的各种类型的存量资产数据存在于不同的表中,因此每个表的数据量是不同的,并且有的数据量大,而有的数据量小,由此可能产生数据倾斜。为了避免数据倾斜的产生,本公开根据每种类型的存量资产数据中数据内容的时间戳,将每种类型的存量资产数据分别划分到至少一个分区中。划分分区的目的是为了将数据打散,使得每个分区中的数据分布均匀。本公开还可以根据数据主键的Hash值对处理数据进行分区。例如,在某一个范围内的Hash值会进入同一分区,其效果与根据时间戳进行分区的效果相同。
在一个实施例中,获取关联字段的字段内容所涉及的对象,包括:获取每种类型的存量资产数据在每个数据分区内的与关联字段相关的字段内容;获取每个数据分区内的与关联字段相关的字段内容所涉及的一个或者多个对象,其中,每个对象具有与关联字段的字段内容相对应的对象标识。具体地,对象可以具有与字段内容对应的对象标识。例如,对象是字段内容中每条记录中的对象标识。举例来说,如上面所述的专利数据中申请号可以作为对象标识。即,对象标识可以用来识别不同的字段内容。例如,字段内容包括两件专利申请,那么两件专利申请的申请号用来对两件专利进行区分和识别。
在一个实施例中,本方法还包括:获取与对象标识相关的关联对象,其中关联对象包括关联人员和/或关联公司;建立对象标识与关联对象之间的索引关系。举例来说,每件专利申请可能具有一个或多个申请人。申请人可以为公司或个人。然后,获取与对象标识关联的公司或人员。例如,专利申请具有相关的关联人员(例如,申请人为自然人)以及相关的关联公司(例如,申请人为公司)。
本公开基于对象标识,建立对象标识与相关的关联人员和/或相关的关联公司之间的索引关系。例如,通过申请号建立自然人申请人或公司申请人之间的索引关系。在另一个实例中,与对象标识相关的关联人员,包括企业的法定代表人、股东、高管、监事等。与对象标识相关的关联公司,包括对外有投资关系的公司、子公司或者母公司等。在进一步的实例中,针对资产数据为专利申请的情况,根据申请人中的公司A,获取公司A中的主要人员以及公司A对外投资的公司B,然后,建立公司A与主要人员和公司B之间的索引关系。索引关系用于通过对象标识中的人员姓名和公司名称查找相关资产线索数据。本公开实施例可以在每处理完一条数据,或者在处理完数据分区内的所有数据之后建立索引关系,甚至可以在处理完所有存量资产数据之后再建立索引关系。通过本公开实施例,在关联对象之间建立相应的索引关系,可以实现资产线索数据之间的关联检索或关联推荐。
针对多个数据分区内的数据,本公开通过获取每种类型的存量资产数据在每个数据分区内的关联字段的字段内容,确定关联字段的字段内容所涉及的对象,从而实现对多个数据分区内的数据进行并发或同时处理。
步骤S103,针对每种类型的存量资产数据,基于提取的关联字段以及对应的字段内容和字段内容所涉及的对象,生成与每种类型的存量资产数据相对应的资产线索主体。
在一个实施例中,本公开按照关联字段的字段内容所涉及的对象,根据每种类型的存量资产数据中关联字段的字段内容生成与每种类型的存量资产数据相关的多条资产记录;基于与每种类型的存量资产数据相关的多条资产记录,生成与每种类型的存量资产数据相对应的资产线索主体。资产线索主体例如是存储有存量资产数据的数据表。每个资产线索主体可以与每种类型的存量资产数据相对应。资产线索主体中包括多条资产记录,并且在资产线索主体中利用对象标识对每条资产记录进行区分。在每种类型的资产数据中,将资产数据的关联字段的字段内容和对象标识之间建立索引关系。通过本公开实施例,针对每种类型的资产数据,可以单独生成对应的资产线索主体,而每个资产线索中又可以包含多条资产记录。
在一个具体实例中,从将每种类型的存量资产数据分别划分到至少一个数据分区内,到在存量资产数据的关联字段的字段内容和对象标识之间建立索引关系的过程如下:通过字段配置文件抽取数据分区内每条数据与资产相关的字段内容,然后再获取字段内容对应的公司,形成一条json记录。这条json记录为与资产数据相关的资产记录。将json记录先缓存在内存中,然后对每个数据分区内的所有数据进行处理。当所有数据分区内的数据都处理完成后,再把数据按数据类型汇总并存储。随后,建立每条数据对应的公司与关联的企业人员和关联的公司之间的索引关系。例如,在专利申请的资产数据类型中,需要获取专利名称、申请日、申请号、专利类型、法律状态、公开(公告)号、公开(公告)日以及申请人等信息,以组合成对应的json记录。一条json记录格式如下:
[{"type":"1","key":"专利名称","value":"带数据地图展示图形用户界面的显示屏幕面板"},{"type":"1","key":"申请日","value":"2018-08-09"},{"type":"1","key":"申请号","value":"201810210785"},{"type":"1","key":"专利类型","value":"外观设计"},{"type":"1","key":"法律状态","value":"授权"},{"type":"1","key":"公开(公告)号","value":"CN306662761S"},{"type":"1","key":"公开(公告)日","value":"2021-07-06"},"type":"1","key":"申请人","value":"北京某某科技有限公司"}],。
在另一个实例中,以商标数据为例,获取一条原始的表数据,数据为{"id":226807320,"reg_no":57139988,"int_cls":42,"tm_name":"AAA","app_date":"2021-06-23","applicant_cn":"北京XXXXXX科技有限公司","status":4,"status_new":5,"deleted":0}。提取商标名称、商标状态以及国际分类在数据表中生成asset_data json字段。由于商标信息为无形资产,因此设置线索解读为新增一条商标信息,公司无形资产可能增加。
再根据原始数据表的主键id去关联原始索引表中的公司主体gid为2318455639,根据dim_id(维度ID)、asset_id(原始数据表id)、inner_id(公司主体ID)、found_time(线索发生的时间,即时间戳)组合的MD5值,生成主键48_ba2e18896db313a7ea5fc682b11c659c,线索表数据为
{
"primaryKeys": {
"id": {
"value": "48_ba2e18896db313a7ea5fc682b11c659c"
},
"inner_id": {
"value": "2318455639"
}
},
"columns": {
"asset_data": {"value": "[{\"key\":\"商标名称\",\"type\":\"1\",\"value\":\"AAA\"},{\"key\":\"商标状态\",\"type\":\"1\",\"value\":\"商标申请中\"},{\"key\":\"国际分类\",\"type\":\"1\",\"value\":\"42类-网站服务\"},{\"key\":\"申请日期\",\"type\":\"1\",\"value\":\"2021-06-23\"}]"
},
"asset_id": {
"value": "226807320"
},
"asset_read": {
"value": "新增一条商标信息,公司无形资产可能增加"
},
"asset_type": {
"value": "无形资产"
},
"business_id": {
"value": "-"
},
"deleted": {
"value": "0"
},
"detail_type": {
"value": "商标信息"
},
"dim_id": {
"value": "48"
},
"flowing_type": {
"value": "资金流向未知"
},
"found_date": {
"value": "20210623"
},
"found_time": {
"value": "1624377600000"
},
"gid": {
"value": "2318455639"
},
"hid": {
"value": "0"
},
"inner_name": {
"value": "北京XXXXX科技有限公司"
},
"money_status": {
"value": "新增商标"
},
"otherData": {
"value": "{\"regNo\":\"57139988\",\"tmClass\":\"42\"}"
},
"sourceID": {
"value": "0"
}
}
},
生成数据之后,根据数据表生成索引表,数据表和索引表通过主键关联:
{
"primaryKeys": [
{
"value": "2318455639"
},
{
"value": "48_ba2e18896db313a7ea5fc682b11c659c"
}
],
"columns": {
"found_time":
{
"value": "1624377600000"
}
],
"deleted":
{
"value": "0"
},
"create_time":
{
"value": "1624377600000"
},
"asset_type":
{
"value": "8"
},
"dim_id":
{
"value": "48"
},
"flowing_type":
{
"value": "3"
},
"found_date":
{
"value": "20210623"
}
}
在数据处理的具体实例中,本公开实施例提供的各种类型的资产数据处理如下:
1)资本资产
a.债券信息
针对每行债券信息记录,获取对应的债券简称、发行规模、发行日期数据、企业名称,并包装成json格式的数据,作为资产线索主体。当企业新增一条数据,表示发行新的债券,现金资产疑似流入,线索解读为发行债券,近期可能会有新的资金注入,相应企业债务也会有所增加。再获取发行日期的时间,从而生成时间戳以供排序时使用。
b.融资信息
针对每行融资信息记录,获取对应的融资轮次、融资金额、投资方、企业名称,并包装成json格式的数据,作为资产线索主体。当企业新增一条数据,表示新增一笔融资,现金资产疑似流入,线索解读为新增一笔融资信息,近期可能会有新的资金注入。再获取融资的时间,从而生成时间戳以供排序时使用。
c.变更记录-注册资本
针对每行“变更记录-注册资本”记录,获取对应的变更项目、变更前、变更后、变更日期、企业名称,包装成json格式数据,作为资产线索主体。当企业新增一条数据,区分是认缴资本还是实缴资本变化,判断变更前和变更后资本的大小,如果是认缴资本增加或减少,目前不能判断出资产流向,如果是实缴资本增加,现金资产疑似流入,线索解读为实缴资本增加。股东可能向企业缴纳新的现金资产或有新的股东加入,如果是实缴资本减少,现金资产疑似流出,线索解读为实缴资本减少,股东可能从企业撤回一笔现金资产或有股东退出。再获取变更日期的时间,从而生成时间戳以供排序时使用。
2)股权类资产
a.司法协助
针对每行司法协助信息记录,获取土地面积、土地用途、行政区、公示期、企业名称,并包装成json格式的数据,作为资产线索主体。当新增一条数据,表示企业公示了新的地块信息,现金资产疑似流出,线索解读为有新的土地信息被公示,近期可能进行了土地收购活动。再获取公示开始的时间,从而生成时间戳以供排序时使用。
3)不动产
a.地块公示
针对每行地块公示记录,获取土地面积、土地用途、行政区、公示期、企业名称,并包装成json格式的数据,作为资产线索主体。当新增一条数据,表示公司公示了新的地块信息,现金资产疑似流出,线索解读为有新的土地信息被公示,近期可能进行了土地收购活动。再获取公示开始的时间,从而生成时间戳以供排序时使用。
b.购地信息
针对每行购地信息记录,获取成交价格、供地方式、行政区、合同签订日期、企业名称,并包装成json格式的数据,作为资产线索主体。当新增一条数据,表示公司购买了土地,现金资产疑似流出,线索解读为有新的购地信息被公示,近期可能进行了土地收购活动。再获取公示开始的时间,从而生成时间戳以供排序时使用。
c.土地转让
针对每行土地转让记录,获取转让价格、原土地使用权人、现土地使用权人、成交日期、企业名称,并包装成json格式的数据,作为资产线索主体。当新增一条数据,表示公司进行土地转让,现金资产疑似流入,线索解读为有新的土地转让信息被公示,近期可能进行了土地转让活动。再获取公示开始的时间,从而生成时间戳以供排序时使用。
4)非诉资产
a.资产交易
针对每行资产交易记录,获取标题、交易价格、项目类型、标的方、装让/处置方、企业名称、起始日期,并包装成json格式数据,作为资产线索主体。当新增项目类型为“资产拍卖”的数据,表示公司或公司人员有非诉资产被拍卖,现金资产疑似流入,线索解读为有非现金资产可能被处置,对外应收账款可能增加。当新增项目类型为“产权交易”的且“标的方”为当前公司,表示公司有资产对外交易,现金资产疑似流入,线索解读为有非现金资产可能被处置,对外应收账款可能增加。当新增项目类型为“产权交易”的且“转让方”为当前公司,表示购入新的资产,现金资产疑似流出,线索解读为近期可能进行了交易活动,非现金资产可能增加的同时,对外应付账款也可能相应增加。获取起始日期生成时间戳供排序时使用。
5)涉诉资产
a.询价评估
针对每行询价评估记录,获取每行记录获取标的物名称、资产类型、摇号日期、企业名称,并包装成json格式的数据,作为资产线索主体。当公司或人员选定评估机构新增数据,表示有资产选定询价评估机构,现金资产流向未知,线索解读为有资产可能将要被法院处置,债权人需要及时向法院申请参与分配。获取摇号日期生成时间戳以供排序时使用。
b.司法拍卖
针对每行司法拍卖记录,获取拍卖公告、起拍价、评估价、拍卖时间、企业名称,并包装成json格式的数据,作为资产线索主体。当公司或人员新增有资产将被司法拍卖数据,现金资产流向未知,线索解读为有资产可能正在被法院处置,债权人需要及时向法院申请参与分配。当公司或人员新增拍中涉诉资产数据,现金资产疑似流出,线索解读为拍得被法院处置的他人资产,近期可能发生交易活动。获取拍卖日期,从而生成时间戳以供排序时使用。
6)对外债权
a.法律诉讼
针对每行法律诉讼记录,获取案件名称、案号、案由、审理法院、裁判日期、企业名称,并包装成json格式数据,作为资产线索主体。当新增起诉他人的产权纠纷案件,现金流向未知,线索解读为有新的产权纠纷案件进入诉讼程序,现有非现金资产可能增加。当新增被他人起诉的产权纠纷案件,现金流向未知,线索解读为有新的产权纠纷案件进入诉讼程序,现有非现金资产可能减少,新增起诉他人的债务纠纷案件,现金资产疑似流入,线索解读为有新的债务纠纷案件进入诉讼程序,对外应收账款可能增加。当新增被他人起诉的债务纠纷案件,现金资产疑似流出,线索解读为有新的债务纠纷案件进入诉讼程序,对外应收账款可能减少。获取裁判日期,从而生成时间戳以供排序时使用。
7)对外投资
a.对外投资
针对每行对外投资记录,判断数据,如果涉及公司或人员新增对外投资,获取被投资企业名称、投资数额、投资比例、企业名称,并包装成json格式的数据,现金资产疑似流出,线索解读为新增一条对外投资信息,公司对外持有股权增加,相应近期可能会有资金流出。判断数据,如果是公司或人员撤出对外投资,获取被投资企业名称、退出前投资数额、退出前投资比例、企业名称,并包装成json格式的数据,现金资产疑似流入,线索解读为新增一条撤出对外投资信息,公司对外持有股权可能减少,相应近期现金流可能增加。如果是公司或人员增加现有对外投资数据,获取被投资企业名称、增持后投资数额、增持后投资比例、企业名称,包装成json格式数据,现金资产疑似流出,线索解读为新增一条增持信息,公司对外持有股权数额可能增加,相应近期可能会有资金流出。判断数据,如果是公司或人员减少现有对外投资数据,获取被投资企业名称、减持后投资数额、减持后投资比例、企业名称,包装成json格式数据,现金资产疑似流入,线索解读为新增一条减持信息,公司对外持有股权数额可能减少,相应近期现金流可能增加。再获取更新日期,从而生成时间戳以供排序时使用。
8)无形资产
a.商标信息
针对每行商标信息记录,获取商标名称、商标状态、国际分类、申请日期、所有人,企业名称,包装成json格式数据,作为资产线索主体。当新增一条数据,表示公司新增商标,现金资产流向未知,线索解读为新增一条商标信息,公司无形资产可能增加。再获取申请日期,从而生成时间戳以供排序时使用。
b.专利信息
针对每行商标信息记录,获取专利名称、专利类型、法律状态、公开(公告)号、公开(公告)日、专利权人,包装成json格式数据,作为资产线索主体。当新增一条数据,表示公司新增专利,现金资产流向未知,线索解读为新增一条专利信息,公司无形资产可能增加。获取公开日,从而生成时间戳以供排序时使用。
c.资质证书
针对每行资质证书记录,获取证书名称、证书编号、发证日期、截止日期、公司名称,包装成json格式数据,作为资产线索主体。当新增一条数据,表示公司新增资质证书,现金资产流向未知,线索解读为获取新的资质证书,公司无形资产可能增加。再获取company_id,去索引表匹配该行记录的主体公司。再获取发证日期,从而生成时间戳以供排序时使用。
d.著作权
针对每行著作权记录,判断数据,如果是软件著作权,则获取软件全称、登记号、登记批准日期、著作权人,包装成json格式数据,作为资产线索主体,如果是作品著作权,则获取作品名称、登记号、作品类别、登记日期,包装成json格式数据,作为资产线索主体。当新增一条数据,表示公司新增著作权,现金资产流向未知,线索解读为新增一条著作权信息,公司无形资产可能增加。获取登记日期,从而生成时间戳以供排序时使用。
d.网站备案
针对每行网站备案记录,获取网站名称、网站首页、域名、网站备案/许可证号、审核日期、公司名称,包装成json格式数据,作为资产线索主体。当新增一条数据,表示公司新增网站备案,现金资产流向未知,线索解读为新增一条网站备案信息,公司无形资产可能增加。再获取审核日期,从而生成时间戳以供排序时使用。
d.产品信息
针对每行产品信息记录,获取产品简称、产品分类、简介、公司名称,包装成json格式数据,作为资产线索主体。当新增一条数据,表示公司新增产品信息,现金资产流向未知,线索解读为新增一条产品信息,行业竞争力提高,公司无形资产可能增加。获取发布日期,从而生成时间戳以供排序时使用。
d.微信
针对每行微信记录,获取微信公众号、微信号、简介、帐号主体,包装成json格式数据,作为资产线索主体。当新增一条数据,表示公司新增微信公众号,现金资产流向未知,线索解读为新增一条微信公众号信息,公司宣传力度、用户粘性可能增加,公司无形资产可能增加。获取线索产生的日期,从而生成时间戳以供排序时使用。
d.微博
针对每行微博记录,获取微博名称、行业类别、简介、帐号主体,包装成json格式数据,作为资产线索主体。当新增一条数据,表示公司新增微博号,现金资产流向未知,线索解读为新增一条微博账户信息,公司宣传力度、用户粘性可能增加,公司无形资产可能增加。再获取线索产生的日期,从而生成时间戳以供排序时使用。
i.行政许可
针对每行行政许可记录进行区分,如果是经过认证的来源数据,则获取许可文件名称、许可文件编号、许可机关、许可内容、有效期自、有效期至、公司名称,包装成json格式数据,作为资产线索主体,如果是其他来源数据,则获取决定文书号、许可机关、许可内容、许可决定日期、许可截止日期,包装成json格式数据,作为资产线索主体。当新增一条数据,表示公司新增行政许可,现金资产流向未知,线索解读为新增一条行政许可信息,公司近期可能会扩展经营范围,公司无形资产可能增加。再获取有效期,从而生成时间戳以供排序时使用。
j.电信许可
针对每行电信许可记录,获取许可证号、业务及其覆盖范围、是否有效、公司名称,包装成json格式数据,作为资产线索主体。当新增一条数据,表示公司新增电信许可,现金资产流向未知,线索解读为新增一条电信许可信息,公司近期可能会扩展经营范围,公司无形资产可能增加。获取发布日期,从而生成时间戳以供排序时使用。
9)商业往来资产
a.招投标
针对每行招投标记录,获取标题、采购人、发布日期、投标人,包装成json格式数据,作为资产线索主体。当新增中标数据,表示公司新增中标信息,现金资产疑似流入,线索解读为新增一条中标信息,近期可能签署供货/服务合同,对外应收账款可能增加,当新增招标数据,表示公司对外发布招标信息,现金资产疑似流出,线索解读为新增一条招标信息,近期可能签署供货/服务合同,对外应付账款可能增加。再获取发布日期,从而生成时间戳以供排序时使用。
b.客户
针对每行客户记录,获取客户名称、销售金额、销售占比、报告期、公司名称,包装成json格式数据,作为资产线索主体。当新增数据,表示公司新增客户,现金资产疑似流入,线索解读为新增一条客户信息,企业近期业务可能增多,带来更多现金收入。获取审核日期,从而生成时间戳以供排序时使用。
c.供应商
针对每行供应商记录,获取供应商名称、采购金额、采购占比、报告期、公司名称,包装成json格式数据,作为资产线索主体。当新增数据,表示公司新增供应商,现金资产疑似流出,线索解读为新增一条供应商信息,企业采购需求增加,导致更多应付账款。再获取审核日期,从而生成时间戳以供排序时使用。
10)担保类资产
a.股权质押
针对每行股权质押记录,获取质押人参股企业、质押股份数量、质押股份市值、状态、公告日期、公司名称,包装成json格式数据,作为资产线索主体。当新增公司质押数据,表示公司质押了在外持有的股权,现金资产疑似流入,线索解读为质押了在外持有的股权,近期可能有融资资金进入,或为第三方提供担保,获取一定的利益。但同时存在担保风险,当新增公司质押,且数据状态变更为“已解除质押”,表示公司有质押的在外持有的股权解除了质押,现金资产疑似流出,线索解读为解除了在外持有的股权的质押,近期可能清偿了一笔债务,有现金资产流出,当新增“股东质押明细”的数据,表示股东质押了当前公司的股权,现金资产流向未知,当新增“股东质押明细”的数据并且状态变为“已解除质押”的数据,表示有股东质押当前企业的股权解除了质押,现金资产流向未。获取审核日期,从而生成时间戳以供排序时使用。
b.股权出质
针对每行股权出质记录,获取出质人、出质股权标的企业、质权人、出质股权数额、状态、股权出质设立登记日期,包装成json格式数据,作为资产线索主体。新增“出质人”为当前公司,状态为“有效”的数据,表示公司出质了股权,现金资产疑似流入,线索解读为新增一项股权出质,近期可能有融资资金进入,或为第三方提供担保,获取一定的利益。但同时存在担保风险。新增“出质人”为当前公司,状态为“无效”的数据,表示有股权出质变更为无效,现金资产流向未知,线索解读为担保解除。新增“质权人”为当前公司,状态为“有效”的数据,表示有向该企业出质的股权,现金资产疑似流出,线索解读为获得一项新的股权质权,可能对外进行了借款或投资。新增“质权人”为当前公司,状态为“无效”的数据,表示有向该企业出质的股权变更为无效,现金资产疑似流入,表示丧失一项股权质权,近期可能有债务被清偿,有现金资产流入。再获取股权出质设立登记日期,从而生成时间戳以供排序时使用。
c.动产抵压
针对每行动产抵压记录,获取抵押人、抵押权人、被担保债权数额、被担保债权类型、登记编号、登记日期,包装成json格式数据,作为资产线索主体。当公司新增抵押数据,并且当前公司为抵押人,表示对外抵押了动产,现金资产疑似流入,线索解读为新增一项动产抵押,近期可能有融资资金进入,或为第三方提供担保,获取一定的利益。但同时存在担保风险;当公司新增抵押数据,并且当前公司为抵押权人,表示有企业或人员向该企业抵押了动产,现金资产疑似流出,线索解读为获得了一项动产抵押,可能对外进行了借款或投资,有现金资产流出;当新增抵押失效数据,并且当前公司为抵押人,表示有动产抵押已注销,现金资产流向未知,线索解读为解除了担保风险。当新增抵押失效数据,并且当前公司为抵押权人,表示有向该企业抵押的动产已注销,现金流向未知,线索解读为丧失一项动产抵押权;再获取股权出质设立登记日期,从而生成时间戳以供排序时使用。
d.知识产权出质
针对每行知识产权出质记录,获取知识产权出质、知识产权登记证号、种类、出质人名称、质权人名称、状态,包装成json格式数据,作为资产线索主体。当新增出质人名称为当前公司的数据,表示对外出质了知识产权,现金资产疑似流入,线索解读为质押了一项知识产权,近期可能有融资资金进入,或为第三方提供担保,获取一定的利益,但同时存在担保风险。当新增质权人名称为当前公司的数据,表示有企业或人员向该企业出质了知识产权,现金资产疑似流出,线索解读为获得了一项新的知识产权质权,可能对外进行了借款或投资,有现金资产流出。再获取出质日期,从而生成时间戳以供排序时使用。
e.土地抵押
针对每行土地抵押记录,获取土地抵押人名称、土地抵押权人、土地使用权证号、土地评估金额、土地抵押金额、土地抵押登记起始时间、土地抵押结束时间,包装成json格式数据,作为资产线索主体。当新增土地抵押人名称为当前公司,且土地抵押结束日期大于当前时间的数据,表示对外抵押了土地,现金资产疑似流入,线索解读为新增一项土地抵押,近期可能有融资资金进入,或为第三方提供担保,获取一定的利益,但同时存在担保风险。当新增土地抵押人名称为当前公司,且土地抵押结束日期小于等于当前时间的数据,表示有抵押的土地到了抵押结束日期,现金流向未知,线索解读为担保风险解除。当新增土地抵押权人为当前公司,且土地抵押结束日期大于当前时间的数据,表示有企业或人员向该企业抵押了土地,现金资产疑似流出,线索解读为获得了一项新的土地抵押,可能对外进行了借款或投资,有现金资产流出,线索解读为获得了一项新的土地抵押,可能对外进行了借款或投资,有现金资产流出。当新增土地抵押权人为当前公司,且土地抵押结束日期小于或等于当前时间的数据,表示有向该企业抵押的土地到了抵押结束日期,现金流向未知,线索解读为丧失了一项土地抵押权。获取土地抵押登记起始时间,从而生成时间戳以供排序时使用。
11)其他类型
a.失信被执行人
针对每行失信被执行人记录,获取执行依据文书号、失信行为、履行情况、发布日期、失信人,包装成json格式数据,作为资产线索主体。当新增一条失信被执行人、现金资产疑似流出,线索解读为缺乏偿债能力,债权人应及时关注其资产状况。当新增一条失信被执行人,现金资产疑似流出,线索解读为履行债务能力有所恢复,近期可能有资产被执行。获取发布日期,从而生成时间戳以供排序时使用。
b.限制消费令
针对每行限制消费令记录,获取案号、申请人日期、发布日期、限制人关联的公司名称,包装成json格式数据,作为资产线索主体。当新增一条限制高消费令,现金资产疑似流出,线索解读为近期有资产被执行,当移除一条限制消费令,现金资产疑似流出,线索解读为可能有新的资金注入,或有新的资产线索被申请人/人民法院查知,履债能力恢复,近期可能会有资产被执行。获取发布日期,从而生成时间戳以供排序时使用。
c.被执行人
针对每行被执行人记录,获取案号、执行标的、立案日期、被执行人,包装成json格式数据,作为资产线索主体。当有案件恢复执行,现金资产疑似流出,线索解读为履行债务能力有所恢复,近期可能会有资产被执行。当新增一条被执行人,现金资产疑似流出,线索解读为履申请人向法院申请执行相关生效文书,近期可能有资产被执行。当移除一条被执行人,现金资产疑似流出,线索解读为可能有新的资金注入,或有新的资产线索被申请人/人民法院查知,履债能力恢复,近期可能会有资产被执行。获取发布日期,从而生成时间戳以供排序时使用。
d.涉金融黑名单
针对每行记录,获取案号、涉案类型、公司名称,包装成json格式数据,作为资产线索主体。当有人员或公司被列入涉金融黑名单,现金资产流向未知。获取发布日期,从而生成时间戳以供排序时使用。
e.环保处罚
针对每行环保处罚记录,获取决定文书号、处罚结果、处罚单位、被处罚企业名称、处罚日期,包装成json格式数据,作为资产线索主体。当新增一条环保处罚,现金资产疑似流出,线索解读为环保处罚可能导致罚款或责令停产、停业、关闭等,可能直接或间接导致有现金流出。获取处罚日期,从而生成时间戳以供排序时使用。
f.欠税公告
针对每行欠税公告记录,获取当前新发生的欠税余额、欠税余额、欠税税种、发布日期、欠税公司名称,包装成json格式数据,作为资产线索主体。当新增一条欠税公告,现金资产疑似流出,线索解读为有待缴税款,近期可能会有资金流出。获取发布日期,从而生成时间戳以供排序时使用。
每种类型的存量资产数据生成对应的资产线索主体后,根据每条数据对应的公司名称,建立公司名称对象与关联的企业人员和/或关联的公司之间的索引关系,例如,专利信息中对应的专利权人。当专利权人为公司时,获取公司名称,建立公司名称对象与关联的公司之间的索引关系。
步骤S104,基于每个对象构建多个资产线索主体之间的索引关系,以通过索引关系和关联字段的字段内容生成资产线索数据。
在一个实施例中,本公开以每个对象为索引,在多个资产线索主体中归属于同一对象的关联字段的字段内容之间构建索引关系。通过索引关系,基于所归属的同一对象的关联字段的字段内容构成每个对象的资产线索数据。例如,在多个资产线索主体中,搜索同一对象的关联字段的字段内容,将归属于同一对象的关联字段的字段内容构成这个对象的资产线索数据。因为按照对象来构成的每个对象的所有相关的资产数据,因此能够获得每个对象的资产线索数据。即,以每个对象为索引,将多个资产线索主体中相同对象的字段内容之间构建索引关系。通过索引关系将归属于同一对象的字段内容构成每个对象的资产线索数据。通过本公开实施例,可以以对象为索引,将多个资产线索主体中归属于同一对象的资产记录进行关联,以建立对应的索引关系,从而方便用户查询归属于同一对象的资产线索数据。
在一个实施例中,每个对象的资产线索数据包括:与每个对象相关联的多种类型的资产数据。例如,构建A公司的多个资产线索主体之间的索引关系:以A公司的名称作为检索条件,在融资信息、不动产、专利信息、商标信息等不同类型资产数据的索引关系中检索与A公司相关的资产数据。具体地,在资产线索主体生成之后,将数据表中的对象标识id作为索引,并基于同主键id、线索时间以及类型id等,生成资产线索数据并且将以数据表的形式存储资产线索数据。
在一个实施例中,由于所收集的数据会随时间不断增加,对资产存量数据处理完成后,还需要处理不断增长的资产增量数据。为此,本公开实施例获取多种类型的增量资产数据。提取每种类型的增量资产数据中与资产相关的关联字段,并且获取关联字段的字段内容所涉及的对象。根据关联字段的字段内容所涉及的对象,将字段内容添加到相对应的资产线索数据中。
增量资产数据的处理方式与存量资产数据的处理方式是相同的,但是可能会存在数据获取方式等的不同。例如,资产可以通过对增量日志进行解析,来获取资产增量数据。然后,根据增量数据的数据量确定是否将每种类型的增量数据分别划分到至少一个数据分区内资产。对资产增量数据进行与存量数据相似的处理,以生成资产与每种类型的增量数据对应的新增的资产线索数据。然后,资产根据数据类型,将新增的资产线索数据添加到相对应的已有的资产线索数据中。通过本公开实施例,在产生增量资产数据后,还可以实时更新资产线索数据,因而可以帮助用户在多元化的数据中及时找到相关企业或企业人员的资产流向,从而可以根据资产流向及时进行风险预警,以便及时、正确把握企业的相关资产信息的变化。
资产线索数据的用途主要是提供数据查询。例如,通过企业名称或人员姓名查询资产线索数据,以获取企业或人员的资产数据,从而准确地确定企业或人员的相关资产信息。
本公开实施例还提供了一种生成资产线索数据的装置,通过目标企业及其关联企业和关联人员的存量资产数据,挖掘与各类资产有关的字段,形成目标企业及其关联企业和关联人员的各类资产线索,然后建立目标企业与这些资产线索之间的索引关系,以便用户查询、追踪和进行安全预警。因而,本公开的生成资产线索数据的装置可以帮助用户在多元化的数据中快速找到相关企业或企业人员的资产流向,从而可以根据资产流向进行风险预警,以便正确把握企业的相关资产信息的变化。
图2是本公开一示例性实施例提供的生成资产线索数据的装置的结构示意图。如图2所示,装置包括:
存量数据获取模块210,用于获取多种类型的存量资产数据。其中存量资产数据为在当前的统计时间区段之前的多个统计时间区段内收集的资产数据。
字段和对象获取模块220,用于提取每种类型的存量资产数据中与资产相关的关联字段以及关联字段内的字段内容,并且获取关联字段的字段内容所涉及的对象。具体地,字段和对象获取模块220根据与资产相关联的字段配置文件,提取每种类型的存量资产数据中与资产相关的关联字段以及关联字段的字段内容,并且获取关联字段的字段内容所涉及的对象。其中,字段配置文件用于记录每种类型的资产数据中的多个与资产相关的关联字段。
资产线索主体生成模块230,用于针对每种类型的存量资产数据,基于提取的关联字段以及对应的字段内容和字段内容所涉及的对象,生成与每种类型的存量资产数据相对应的资产线索主体。
资产线索数据生成模块240,用于基于每个对象构建多个资产线索主体之间的索引关系,以通过索引关系和对应的关联字段的字段内容生成资产线索数据。
在一个实施例中,装置还包括:数据划分模块250,用于根据每种类型的存量资产数据的时间戳,将每种类型的存量资产数据分别划分到至少一个数据分区内。
在一个实施例中,字段和对象获取模块220,包括:
第一获取子模块,获取每种类型的存量资产数据在每个数据分区内的与关联字段相关的字段内容;
第二获取子模块,获取每个数据分区内的与关联字段相关的字段内容所涉及的一个或者多个对象,其中,每个对象具有与关联字段的字段内容相对应的对象标识。
在一个实施例中,装置还包括:索引建立模块260,用于获取与对象标识相关的关联对象,其中,关联对象包括关联人员和/或关联公司;建立对象标识与关联对象之间的索引关系。
在一个实施例中,资产线索主体生成模块230包括:
第一生成子模块,按照关联字段的字段内容所涉及的对象,根据每种类型的存量资产数据中关联字段的字段内容生成与每种类型的存量资产数据相关的多条资产记录;
第二生成子模块,基于与每种类型的存量资产数据相关的多条资产记录,生成与每种类型的存量资产数据相对应的资产线索主体。
在一个实施例中,资产线索数据生成模块240包括:
构建子模块,以每个对象为索引,在多个资产线索主体中归属于同一对象的关联字段的字段内容之间构建索引关系;以及
构成子模块,通过索引关系,基于所归属的同一对象的关联字段的字段内容构成每个对象的资产线索数据。其中每个对象的资产线索数据包括:与每个对象相关联的多种类型的资产数据。
在一个实施例中,装置还包括:增量数据处理模块270,用于获取多种类型的增量资产数据;提取每种类型的增量资产数据中与资产相关的关联字段,并且获取关联字段的字段内容所涉及的对象;根据关联字段的字段内容所涉及的对象,将字段内容添加到相对应的资产线索数据中。
图3是本公开一示例性实施例提供的生成资产线索数据的逻辑示意图。在一个实施例中,获取多种类型的存量资产数据301-1、301-2、……、301-n。其中存量资产数据301-1、301-2、……、301-n中的每个均可以是特定类型的数据。举例来说,存量资产数据301-1、301-2、……、301-n中的每个均具有多个字段,例如,字段A、字段B、字段C、字段D、字段E等。其中n为任何合理的自然数。
提取每种类型的存量资产数据301-1、301-2、……、301-n中与资产数据相关的关联字段,并且获取关联字段的字段内容所涉及的对象。例如,从存量资产数据301-1提取与资产数据相关的关联字段为字段A、字段B、字段C。从存量资产数据301-2提取与资产数据相关的关联字段为字段A、字段C、字段E。从存量资产数据301-n提取与资产数据相关的关联字段为字段A、字段C、字段D以及字段E。
随后,通过每种类型的存量资产数据中与资产相关的关联字段的字段内容和字段内容所涉及的对象,生成与每种类型的存量资产数据相对应的资产线索主体。例如,资产线索主体302-1、302-2、……、302-n。如图3所示,每个存量资产数据与相应的资产线索主体相对应,例如存量资产数据301-1与资产线索主体302-1相对应、存量资产数据301-2与资产线索主体302-2相对应,以及存量资产数据301-n与资产线索主体302-n相对应。
随后,基于每个对象构建多个资产线索主体之间的索引关系,通过索引关系和关联字段的字段内容生成资产线索数据。如图3所示,通过基于每个对象构建资产线索主体302-1、302-2、……、302-n的索引关系,通过索引关系和关联字段的字段内容生成资产线索数据ID-1、ID-2、ID-3、……、ID-m。其中m为任何合理的自然数。
通过查询平台可以提供针对任意对象的资产线索主体的查询。例如,查询平台收到针对于ID-2的查询请求,那么通过查询可以将ID-2的资产线索主体中的资产数据返回给请求者。示例性的,在用户查询时,可以根据各资产线索的时间戳,以时间倒序的方式在时间轴上依次展示用户查询的目标企业以及该目标企业的所有关联企业和关联人员涉及的资产线索。
图4是本公开一示例性实施例提供的电子设备的结构。该电子设备可以是第一设备和第二设备中的任一个或两者、或与它们独立的单机设备,该单机设备可以与第一设备和第二设备进行通信,以从它们接收所采集到的输入信号。图4示出了根据本公开实施例的电子设备的框图。如图4所示,电子设备包括一个或多个处理器410和存储器420。
处理器410可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备中的其他组件以执行期望的功能。
存储器420可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器410可以运行所述程序指令,以实现上文所述的本公开的各个实施例的软件程序的生成资产线索数据的方法以及/或者其他期望的功能。在一个示例中,电子设备还可以包括:输入装置430和输出装置440,这些组件通过总线***和/或其他形式的连接机构(未示出)互连。
此外,该输入装置430还可以包括例如键盘、鼠标等等。
该输出装置440可以向外部输出各种信息。该输出设备440可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图4中仅示出了该电子设备中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的生成资产线索数据的方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的生成资产线索数据的方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于***实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开中涉及的器件、装置、设备、***的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、***。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (13)
1.一种生成资产线索数据的方法,包括:
获取多种类型的存量资产数据;
提取每种类型的存量资产数据中与资产相关的关联字段以及所述关联字段的字段内容,并且获取所述关联字段的字段内容所涉及的对象;
针对每种类型的存量资产数据,基于提取的关联字段以及对应的字段内容和字段内容所涉及的对象,生成与每种类型的存量资产数据相对应的资产线索主体;以及
基于每个对象构建多个资产线索主体之间的索引关系,以通过所述索引关系和对应的关联字段的字段内容生成资产线索数据。
2.根据权利要求1所述的方法,其特征在于,所述存量资产数据为在当前的统计时间区段之前的多个统计时间区段内收集的资产数据。
3.根据权利要求1所述的方法,其特征在于,
根据与资产相关联的字段配置文件,提取每种类型的存量资产数据中与资产相关的关联字段以及所述关联字段的字段内容,并且获取所述关联字段的字段内容所涉及的对象,
其中,所述字段配置文件用于记录每种类型的资产数据中的多个与资产相关的关联字段。
4.根据权利要求1所述的方法,还包括:
根据每种类型的存量资产数据的时间戳,将每种类型的存量资产数据分别划分到至少一个数据分区内。
5.根据权利要求4所述的方法,其特征在于,获取所述关联字段的字段内容所涉及的对象,包括:
获取每种类型的存量资产数据在每个数据分区内的与关联字段相关的字段内容;
获取所述每个数据分区内的与关联字段相关的字段内容所涉及的一个或者多个对象,其中,每个对象具有与所述关联字段的字段内容相对应的对象标识。
6.根据权利要求5所述的方法,还包括:
获取与所述对象标识相关的关联对象,其中,所述关联对象包括关联人员和/或关联公司;
建立所述对象标识与所述关联对象之间的索引关系。
7.根据权利要求5所述的方法,其特征在于,所述针对每种类型的存量资产数据,基于提取的关联字段以及对应的字段内容和字段内容所涉及的对象,生成与每种类型的存量资产数据相对应的资产线索主体,包括:
按照所述关联字段的字段内容所涉及的对象,根据每种类型的存量资产数据中所述关联字段的字段内容生成与每种类型的存量资产数据相关的多条资产记录;
基于与每种类型的存量资产数据相关的多条资产记录,生成与所述每种类型的存量资产数据相对应的资产线索主体。
8.根据权利要求1或7所述的方法,其特征在于,基于每个对象构建多个资产线索主体之间的索引关系,以通过所述索引关系和对应的关联字段的字段内容生成资产线索数据,包括:
以每个对象为索引,在多个资产线索主体中归属于同一对象的所述关联字段的字段内容之间构建索引关系;以及
通过所述索引关系,基于所归属的同一对象的所述关联字段的字段内容构成每个对象的资产线索数据。
9.根据权利要求1所述的方法,其特征在于,每个对象的资产线索数据包括:
与每个对象相关联的多种类型的资产数据。
10.根据权利要求8所述的方法,还包括:
获取多种类型的增量资产数据;
提取每种类型的增量资产数据中与资产相关的关联字段,并且获取所述关联字段的字段内容所涉及的对象;
根据所述关联字段的字段内容所涉及的对象,将所述字段内容添加到相对应的资产线索数据中。
11.一种生成资产线索数据的装置,包括:
存量数据获取模块,用于获取多种类型的存量资产数据;
字段和对象获取模块,用于提取每种类型的存量资产数据中与资产相关的关联字段以及所述关联字段的字段内容,并且获取所述关联字段的字段内容所涉及的对象;
资产线索主体生成模块,用于针对每种类型的存量资产数据,基于提取的关联字段以及对应的字段内容和字段内容所涉及的对象,生成与每种类型的存量资产数据相对应的资产线索主体;
资产线索数据生成模块,用于基于每个对象构建多个资产线索主体之间的索引关系,以通过所述索引关系和对应的关联字段的字段内容生成资产线索数据。
12.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行权利要求1-10中任一项所述的方法。
13.一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现权利要求1-10中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111575548.5A CN113947339A (zh) | 2021-12-22 | 2021-12-22 | 生成资产线索数据的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111575548.5A CN113947339A (zh) | 2021-12-22 | 2021-12-22 | 生成资产线索数据的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113947339A true CN113947339A (zh) | 2022-01-18 |
Family
ID=79339191
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111575548.5A Pending CN113947339A (zh) | 2021-12-22 | 2021-12-22 | 生成资产线索数据的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113947339A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104376406A (zh) * | 2014-11-05 | 2015-02-25 | 上海计算机软件技术开发中心 | 一种基于大数据的企业创新资源管理与分析***和方法 |
CN109947759A (zh) * | 2017-07-17 | 2019-06-28 | ***通信集团吉林有限公司 | 一种数据索引建立方法、索引检索方法及装置 |
CN111258988A (zh) * | 2020-02-05 | 2020-06-09 | 中国工商银行股份有限公司 | 资产管理方法、装置、电子设备以及介质 |
CN112000773A (zh) * | 2020-08-25 | 2020-11-27 | 城云科技(中国)有限公司 | 基于搜索引擎技术的数据关联关系挖掘方法及应用 |
-
2021
- 2021-12-22 CN CN202111575548.5A patent/CN113947339A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104376406A (zh) * | 2014-11-05 | 2015-02-25 | 上海计算机软件技术开发中心 | 一种基于大数据的企业创新资源管理与分析***和方法 |
CN109947759A (zh) * | 2017-07-17 | 2019-06-28 | ***通信集团吉林有限公司 | 一种数据索引建立方法、索引检索方法及装置 |
CN111258988A (zh) * | 2020-02-05 | 2020-06-09 | 中国工商银行股份有限公司 | 资产管理方法、装置、电子设备以及介质 |
CN112000773A (zh) * | 2020-08-25 | 2020-11-27 | 城云科技(中国)有限公司 | 基于搜索引擎技术的数据关联关系挖掘方法及应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Spilnyk et al. | Accounting and financial reporting system in the digital economy | |
CN108376317B (zh) | 一种知识产权政策风险防范***、基于该***的知识产权交易***和方法 | |
CN105243117B (zh) | 一种数据处理***和方法 | |
CN110751361B (zh) | 一种银行需求条目级管理方法及*** | |
CN111930754A (zh) | 一种区块链仓单的生成和更新方法、装置及设备 | |
US20160203564A1 (en) | System and method for consolidating expense records | |
CN109214892A (zh) | 一种电子商务平台管理*** | |
CN102956003A (zh) | 电子商务*** | |
CN112598513A (zh) | 识别股东风险交易行为的方法及装置 | |
Kshetri | Blockchains and international business | |
US20180025225A1 (en) | System and method for generating consolidated data for electronic documents | |
Gröblacher | Cryptocurrencies (Bitcoins) in financial reporting-New challenge for accountants | |
CN116842106A (zh) | 资源线索的生成方法和装置 | |
CN113947339A (zh) | 生成资产线索数据的方法和装置 | |
US10235719B2 (en) | Centralized GAAP approach for multidimensional accounting to reduce data volume and data reconciliation processing costs | |
JP2016053931A (ja) | 監査対象特定支援プログラム、監査対象特定支援方法および監査支援装置 | |
Bulycheva et al. | Innovative approach to accounting policy development in accordance with international financial reporting standards | |
Bala | Tokenization of Assets | |
KR101699472B1 (ko) | 데이터 거래소 시스템 및 그 방법 | |
Ilyin et al. | The technologies of commodity-money circulation on the basis of personal and corporative e-banks | |
TW202032474A (zh) | 在區塊鏈技術中結合大數據訊息之供應鏈金融服務方法、系統、電腦程式產品及電腦可讀取記錄媒體 | |
CN110223163A (zh) | 中介管理***及反欺诈数据分析方法 | |
CN110738498A (zh) | 客户风险识别方法及装置 | |
EP3494531A1 (en) | System and method for generating consolidated data for electronic documents | |
Xiong et al. | Financial Risk Control and Audit of Supply Chain under the Information Technology Environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220118 |