CN111383004A - 数字货币的实***置提取方法、信息的提取方法及其装置 - Google Patents

数字货币的实***置提取方法、信息的提取方法及其装置 Download PDF

Info

Publication number
CN111383004A
CN111383004A CN201811641544.0A CN201811641544A CN111383004A CN 111383004 A CN111383004 A CN 111383004A CN 201811641544 A CN201811641544 A CN 201811641544A CN 111383004 A CN111383004 A CN 111383004A
Authority
CN
China
Prior art keywords
address
transaction
information
digital currency
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811641544.0A
Other languages
English (en)
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhifan Technology Co ltd
Original Assignee
Beijing Zhifan Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhifan Technology Co ltd filed Critical Beijing Zhifan Technology Co ltd
Priority to CN201811641544.0A priority Critical patent/CN111383004A/zh
Publication of CN111383004A publication Critical patent/CN111383004A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/04Payment circuits
    • G06Q20/06Private payment circuits, e.g. involving electronic currency used among participants of a common payment scheme
    • G06Q20/065Private payment circuits, e.g. involving electronic currency used among participants of a common payment scheme using e-cash
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/382Payment protocols; Details thereof insuring higher security of transaction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/50Address allocation
    • H04L61/5007Internet protocol [IP] addresses
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2101/00Indexing scheme associated with group H04L61/00
    • H04L2101/60Types of network addresses
    • H04L2101/69Types of network addresses using geographic information, e.g. room number
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2209/00Additional information or applications relating to cryptographic mechanisms or cryptographic arrangements for secret or secure communication H04L9/00
    • H04L2209/56Financial cryptography, e.g. electronic payment or e-cash
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/50Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols using hash chains, e.g. blockchains or hash trees

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明涉及大数据信息处理领域,涉及一种数字货币的实***置提取方法以及数字货币信息的提取方法,包括:在网络中设置探测节点,通过探测节点获取从多个数字货币节点收到的交易记录,所述交易记录包括交易标识、网络地址、交易时间,所述网络地址为交易输入的网络地址;每个交易标识对应一个数字货币地址,对于每个交易标识获取其对应的交易记录中交易时间最早的网络地址作为目标网络地址。对于一个数字货币地址,对应多个目标网络地址,获取概率最高的目标网络地址对应的实***置作为该交易地址的实***置。通过上述方法,可以将每个数字货币地址合理的标记上实***置,并获取数字货币的相关信息,为金融监管部门提供参考,便于查询货币地址的相关信息,从而为政府监管数字货币提供更快捷的手段,可靠性较高,具有很高的价值。

Description

数字货币的实***置提取方法、信息的提取方法及其装置
技术领域
本发明涉及互联网大数据处理领域,尤其是区块链领域,具体涉及一种数字货币的实***置提取方法、信息的提取方法及其装置。
背景技术
区块链是一种按照时间顺序将数据区块以顺序相连的方式进行组合的一种链式数据结构,并以密码学方式保证的不可篡改和不可伪造的分布式账本。比特币是一种以区块链作为底层技术的数字加密货币。比特币具备去中心化和匿名性的特点,去中心化指在分布式***中实现基于去中心化信用的点对点交易,匿名性指买卖双方在进行交易时无法知晓对方身份。
但是比特币的每一笔交易的详细信息都会被保存在区块链中,这些信息包括交易哈希、交易发生的时间、输入地址、输出地址、每个输入地址的支付金额、每个输出地址的接收金额,交易费、区块哈希等。所有人都可以查询这些交易信息,并可追踪数字货币的流向。这些数字货币对应的地址实际对应的是用户实体,数字货币地址中记录的数字货币与该用户实体所拥有的数字货币相对应。由于数字货币的交易地址、交易金额等信息动态更新,数据量非常巨大的,金融监管机构很难获得有效的信息。
发明内容
有鉴于此,本发明实施例提供了一种数字货币的实***置提取方法、信息的提取方法及其装置,以解决现有技术中数字货币交易中数据量巨大,金融机构难以获得有效信息的问题。
根据第一方面,本发明实施例还提供一种数字货币的实***置提取方法,包括:在网络中设置探测节点,通过探测节点获取从多个数字货币节点收到的交易记录,所述交易记录包括交易标识、网络地址、交易时间,所述网络地址为交易输入的网络地址;每个交易标识对应一个或多个交易输入数字货币地址,对于每个交易标识获取其对应的交易记录中交易时间最早的网络地址作为目标网络地址;对于一个数字货币地址,获取其对应的多个目标网络地址;在多个目标网络地址中,获取概率最高的目标网络地址;获取所述目标网络地址对应的实***置,作为该数字货币地址关联的实***置。
该方案中,为数字货币地址关联实体的地理位置信息即实***置,由于在全局网中,交易信息是全局广播的,因此针对监测节点探测到的交易信息,时间最早的信息对应的IP地址是该数字货币地址对应的,对于一个数字货币地址,其对应多个IP地址时,将出现频率最高的IP地址作为实***置是准确性最高的。因此通过上述方法,可以将每个数字货币地址合理的标记上实体地址,为金融监管部门提供参考,可靠性较高,从而为政府监管数字货币提供更快捷的手段,具有很高的价值。
结合第一方面,可选地,所述监测多个数字货币节点,获取从多个所述数字货币节点收到的交易信息记,包括:在网络上放置探测服务软件;通过探测服务软件连接多个数字货币节点;从所述数字货币节点接收广播的交易信息记录。通过设置探测服务软件的方式,可以实时探测数字货币节点收到的交易广播,当部署的节点数量足够多时,可以实时得到交易信息,从而确保时间最早的交易记录对应的IP地址所对应的实***置以较高概率为交易发起的数字货币地址对应的实***置,提高实***置信息获取的准确性。
可选地,数字货币的实***置提取方法中,对于一个数字货币地址,获取其对应的多个目标网络地址时,将该数字货币地址所在地址簇中的所有数字货币地址与该目标网络地址关联起来。
根据第二方面,本实施例还提供一种数字货币的信息提取方法,包括:获取多笔数字货币的交易信息,所述交易信息至少包括交易地址及其对应的交易金额;通过上述第一发明所述的方法获取所述数字货币地址对应的实***置;根据交易地址生成地址簇;根据所述交易信息构建地址簇交易图;根据所述数字货币地址对应的实名信息为所述地址簇标记实名信息;根据所述交易金额为所述地址簇标记余额;建立所述数字货币地址与地址簇余额的对应关系。
该方案中的数字货币的信息提取方法,将数字货币地址对应的实***置、地址簇信息、交易金额信息等有效的关联起来,通过解析区块获取交易信息,根据交易信息生成数字货币地址信息,然后为数字货币地址关联交易金额的信息、实***置信息、实名信息等,从而生成数字货币地址的用户画像,以方便监管机构进行查询并了解数字货币地址所对应实体的行为特征。
结合第二方面,可选地,所述数字货币地址信息还包括:地址余额、总输入金额、总输出金额、地址财富排行、输入交易数、输出交易数、总交易数、最近一次交易金额、最近一次交易时间、最近一次交易对应的IP地址、地理位置信息、实体用户信息、交易实体用户信息中的一种或几种。所述根据所述交易金额为所述地址簇标记余额的步骤,包括:获取地址簇中每个交易地址对应的初始金额;获取每个交易地址对应的输入金额、输出金额;根据所述初始金额、输入金额、输出金额确定每个地址的当前余额;根据每个地址的当前余额确定地址簇的余额。
结合第二方面及其可选的实施方式,可选地,根据所述交易信息构建地址簇交易图,包括:获取交易的输入地址和输出地址,其中输入地址所在的地址簇为第一地址簇,输出地址所在的地址簇为第二地址簇;建立一条从第一地址簇到第二地址簇的有向边;遍历所有交易的输入地址和输出地址,绘制地址簇交易图。该方案通过有效地分析数字货币如比特币交易的关联信息,可以构建所有交易信息的地址簇交易图,表示出交易过程中的双方信息以及交易情况,结合实名信息,从而为政府提供交易者的真实身份,具有很高的社会价值,为个人和企业提供更加简便的交易流查询服务,具有很好的经济效益,为监管机构或相关企业或个人提供信息和依据。
结合第二方面及其可选的实施方式,可选地,还包括为每个所述地址簇标注身份信息的处理,包括:获取每个地址簇中的部分或全部交易地址的实名信息;将权重最高的实名信息作为该地址簇的实名信息。由于每个地址簇中的交易地址有多个,每个地址可以通过网络抓取数据、交易所实名信息或通过算法进行标注或众包等方式获取实名信息,如果多种方式获得的实名信息不同,选择置信度最高的作为该交易地址的实名信息;同时每个地址簇中的多个交易地址,得到的实名信息也可能不同,将权重最高的作为该地址簇的交易信息,提高了地址簇实名信息的准确性。将权重最高的实名信息作为该地址簇的实名信息的处理,包括:将地址簇标成实名信息c的权重为Pc=(P1/P2)*(k/n),其中n为地址簇中交易地址的个数,k为已经标注实名信息的交易地址的个数,P1为地址被标成实名信息c的信息源权重之和,P2为k个地址的信息源权重之和;取使Pc取值最大的实名信息c作为地址簇的实名信息。该方案中,通过将信息源权重以及标注的实名信息的占比来更好的标识实名信息,使得地址簇的实名信息更加准确。
结合第一方面、第二方面或其他实施例,根据第三方面,本发明实施例中还提供一种数字货币的实***置提取装置,包括交易记录获取单元,用于通过探测节点获取从多个数字货币节点收到的交易记录,所述交易记录包括交易标识、网络地址、交易时间,所述网络地址为交易输入的网络地址;第一获取单元,每个交易标识对应一个或多个数字货币地址,对于每个交易标识获取其对应的交易记录中交易时间最早的网络地址作为目标网络地址;第二获取单元,用于对于一个数字货币地址,获取其对应的多个目标网络地址;第三获取单元,用于在多个目标网络地址中,获取概率最高的目标网络地址;实***置输出单元,用于获取所述目标网络地址对应的位置信息,作为该数字货币地址关联的实***置。
结合第一方面、第二方面或其他实施例,根据第四方面,本发明实施例中还提供一种数字货币的信息提取装置,包括交易信息提取单元,用于获取多笔数字货币的交易信息,所述交易信息至少包括交易地址及其对应的交易金额;实***置获取单元,用于通过所述的装置获取所述数字货币地址对应的实***置;地址簇生成单元,用于根据交易地址生成地址簇;地址簇实名信息标记单元,根据所述数字货币地址对应的实名信息为所述地址簇标注实名信息;地址簇交易图生成单元,根据所述交易信息构建地址簇交易图;地址簇金额标记单元,用于根据所述交易金额为所述地址簇标记余额;关联单元,用于建立所述数字货币地址与地址簇余额的对应关系。
根据第五方面,本发明实施例中还提供一种服务器,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行第一方面或其可选实施例中的所述的数字货币的实***置提取方法或第二方面或其可选实施例中的数字货币的信息提取方法。
根据第六方面,本发明实施例中还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行第一方面或其可选实施例中的所述的数字货币的实***置提取方法或第二方面或其可选实施例中的数字货币的信息提取方法。
根据第七方面,本发明实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行第一方面或其可选实施例中的所述的数字货币的实***置提取方法或第二方面或其可选实施例中的数字货币的信息提取方法。
附图说明
通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
图1示出了实施例1中的数字货币的实***置提取方法的流程图;
图2示出了实施例2中的数字货币信息的提取方法的流程图;
图3-图8示出了实施例3中数字货币信息提取中的各个示意图;
图9示出了实施例4中数字货币的实***置提取装置的结构框图;
图10示出了实施例5中数字货币信息的提取方法的结构框图。
图11示出了实施例6中服务器结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本实施例中提供一种数字货币的实***置提取方法,用于对数字货币的信息进行分析,获取数字货币对应的实***置信息,该方法适用于采用UTXO方式(UnspentTransaction Output,未消费交易输出)的数字加密货币,包括比特币以及比特币的各种分叉币。该方案中,通过将数字货币地址与IP地址对应,得到其对应地实***置位置信息。
本实施例中的数字货币的实***置提取方法,以比特币为例进行说明,该方法包括以下步骤:
S11、在网络中设置探测节点,通过探测节点从多个数字货币节点收到交易记录,所述交易记录包括交易标识、网络地址、交易时间,所述网络地址为交易输入的网络地址,所述交易信息记录包括交易标识、网络地址、交易时间。其中交易标识为交易哈希,即交易hash,网络地址为数字货币交易输入地址对应的IP地址,交易时间是数字货币节点收到该交易记录的时间,距离发起交易的数字货币最近的节点,收到的交易记录的时间最早。
具体地,监测过程如下:
第一步,在网络上放置探测服务软件;探测服务软件通过数字货币协议,与数字货币节点建立连接,然后接收从数字货币节点广播的信息。
第二步,通过探测服务软件连接多个数字货币节点。由于在区块链中,交易信息是全局广播,因此通过探测服务软件连接多个数字货币节点,从数字货币节点接收数字货币的交易信息,得到交易记录。此处交易记录可包括交易hash、数字货币交易输入的IP地址、接收交易的时间time,形成三元组(交易hash,IP地址,time)。当数字货币节点产生一个交易时,会在数字货币网络中进行广播,因此探测软件可以在多个位置探测到该交易记录。
S12、每个交易标识对应一个或多个数字货币地址,对于每个交易标识获取其对应的交易记录中交易时间最早的网络地址作为目标网络地址。
对于每个交易标识即交易hash,将数字货币网络中首次发出该交易的数字货币节点的IP地址,做为该数字货币交易输入地址对应的IP地址。一个交易标识也可以对应多个交易输入地址,也就是有多个数字货币地址,将这些数字货币地址都与该IP地址对应,通过该关联,可以将数字货币的地址与其对应的IP地址关联起来。
S13、对于一个数字货币地址,获取其对应的多个目标网络地址。
根据上述方式可以获得数字货币交易地址对应的多个IP地址。即,根据多个交易hash所对应交易中的输入地址,将各数字货币地址与IP地址组成二元组(数字货币地址,IP地址)。可选地,将该数字货币地址所在地址簇中的所有数字货币地址与该IP地址关联起来,形成多个二元组。
S14、在多个目标网络地址中,获取概率最高的目标网络地址。
统计得到数字货币地址与其对应的IP地址的概率(数字货币地址,IP地址,概率值),对于一个指定数字货币地址,概率值=(指定数字货币地址在指定IP地址时的二元组数)/(指定数字货币地址的二元组数)。
这样就可以计算出在数字货币地址对应的IP地址中,占比最高的IP地址,将该地址作为数字货币地址关联的IP地址。
S15、获取所述目标网络地址对应的位置信息,作为该数字货币地址关联的实***置。
根据IP地址,能够确定地理位置信息。根据IP地址和地理位置信息库确定即可;此外,一些搜索引擎,例如百度,也提供根据IP地址查询地址位置信息的服务。
该方案中,为数字货币地址关联实体的位置地址,由于在全局网中,交易信息是全局广播,存储在数字货币节点的,数字货币节点也会产生新的交易信息,通过探测节点来获取数字货币节点的交易信息,对于一笔数字货币的交易,对于一个数字货币地址,其对应多个IP地址时,将出现频率最高的IP地址对应的位置信息作为该数字货币地址对应的实***置进行关联。因此通过上述方法,可以将每个数字货币地址合理的标记上实***置信息,为金融监管部门提供参考,可靠性较高,从而为政府监管数字货币提供更快捷的手段,具有很高的价值。
实施例2
本实施例中提供一种数字货币的信息提取方法,用于对数字货币的信息进行分析,获取数字货币对应的实***置信息,该方法适用于采用UTXO方式(UnspentTransaction Output,未消费交易输出)的数字加密货币,包括比特币以及比特币的各种分叉币。
该数字货币的信息提取方法,包括以下步骤:
S21、取多笔数字货币的交易信息,所述交易信息至少包括交易地址及其对应的交易金额。
比特币的交易信息是存在区块链中的,通过全局账本可以获得所有的交易信息。首先解析区块链数据,得到所有交易。通过解析得到链上的所有区块B={B1,B2,...,Bn},其中Bi为其中的一个区块,n为总区块数。对于每个区块Bi,获取该区块中的所有交易Ti={ti1,ti2,...,tim},其中tij为该区块内的一个交易,m为该区块内的总交易数。每个交易包括交易发生的时间、金额、输入地址、输出地址等。通过汇总所有交易得到T=UTi,其中i=1,2,...,n。
混币(Coin Shuffle)是比特币交易中的一种交易方式,可以让用户快速高效地与其他用户的资金进行混合,在现有的用户账户和混币后的新账户之间创建随机的映射关系,从而实现完全匿名。作为本实施例中进一步优选的实施方案中,为了避免混币交易造成的后续分析的不准确性,本发明实施例中只考虑除混币交易外的交易信息,因此在上述所有交易信息中可以先删除混币交易。
删除混币交易的一种方式为:定义输入地址数阈值hi和输出地址数阈值ho,当一个交易的输入地址数大于等于hi,且/或输出地址数大于等于ho,则判定为混币交易。在可选的实施方案中,输入地址数阈值hi可选为100,输出地址数阈值ho可选择为100,也可以根据当前数据的情况合理设置。
删除混币交易的另一种方式为:使用混币交易和非混币交易数据训练分类器,例如SVM分类器,采用的特征包括交易的输入地址数,交易的输出地址数,交易的输入和输出地址数差值等;然后使用分类器判定混币交易。
通过上述方法可以有效删除混币交易,保证了后续交易分析的准确性。
根据上述交易中的输入地址和输出地址,生成全部数字货币地址集合A。对于每个交易tij∈T,得到该交易的所有输入地址和输出地址并形成集合Aij={aij1,aij2,…,aijs},将Aij合并到集合A中。
然后,为上述数字货币地址关联统计信息。对于每个数字货币地址a∈A,根据交易T统计地址余额、总输入金额、总输出金额、地址财富排行、输入交易数、输出交易数、总交易数、最近一次交易的金额、最近一次交易的时间。计算方法如下:
地址余额balance:balance的初始值赋0;对于每个交易t∈T,如果地址在t的输入地址中,则将balance减去该地址的输出金额,如果地址在t的输出地址中,则将balance加上该地址的输入金额。
总输入金额totalInput,总输出金额totalOutput,输入交易数inputTxNum、输出交易数outputTxNum、总交易数totalTxNum、最近一次交易的金额latestValue、最近一次交易的时间latestTxTime:这些特征的初始值赋0,设置临时变量value为0。按t的时间先后顺序遍历T,对于每个交易t∈T,做如下操作:
如果地址在t的输入地址中,则将value减去该地址的输出金额,如果地址在t的输出地址中,则将value加上该地址的输入金额。如果value大于等于0,则totalInput加value,inputTxNum加1,totalTxNum加1。如果value小于0,则totalOutput加value,outputTxNum加1,totalTxNum加1。如果t的输入地址或输出地址中包含数字货币地址a,则将latestValue设置为value,将latestTxTime设置为交易t的发生时间。
地址财富排行rank:对于所有地址,按地址余额balance由大到小进行排序,根据排序后的次序作为rank。
S22、通过实施例1中的所述的方法获取所述数字货币地址对应的实***置。具体见实施例1,此处不再赘述。
S23、根据交易地址生成地址簇。
对于每个数字货币地址a∈A,生成一个地址簇。然后根据T对数字货币地址进行聚类,对于任意t∈T,t的所有输入地址属于同一个地址簇。
对于比特币,可以通过将具有相同交易地址的多笔交易信息的交易地址合并成一个地址簇。本实施例中,交易地址选择为交易输入地址。在其他可选的实施例中,交易地址也可以选择为输出地址,或者输入地址和输出地址的集合。如下所述的生成地址簇的方法,适用于对于比特币,比特币的分叉币,以及机制与比特币相似使用UTXO模式的币种,对交易地址进行合并得到地址簇。对于其他币种,在生成地址簇时,可以不对交易地址进行合并,以单独的交易地址作为地址簇。
本实施例中合成地址簇的过程为:
第一步,将每笔交易信息中的所有输入地址作为一个集合。由于每笔交易信息中一般包括多个地址,将这些地址作为一个地址集合。
对于每个交易tij∈T,得到该交易的输入地址集合Aij={aij1,aij2,…,aijs},其中aijk是交易tij中的一个输入地址,s为该交易内的总输入地址数(Aij中的地址可以根据地址哈希去重,也可以不去重)。所有的输入地址集合A=UAij,其中i=1,2,…,n,j=1,2,…,m。
第二步,判断所述集合中是否存在相同的输入地址。
在建立地址簇时,考虑的是存在相同输入地址的用户的相似性,因此任何两个Aij中的地址如果相交,则这两个Aij中的所有地址属于同一个地址簇;通过判断是否存在相同的输入地址,来得出地址簇。
第三步,如果存在相同的输入地址,则将所述集合合并,直至所有的集合中任意两个集合都不存在相同的元素,剩余的每个集合作为一个地址簇。
地址簇的具体计算方式可以有两种,第一种方式为:将每个Aij作为一个初始地址簇,然后查看两个地址簇是否有交集,如果有交集,则归并成一个地址簇,不断循环,直到不能归并。
第二种方式为:当集合中有相同元素时,设置两个集合的距离d=0;当集合中不存在相同元素时,设置d=1。然后通过聚类算法,不断地将距离为0的集合聚成地址簇。
通过上述方式,根据交易T形成地址簇CA={CA1,CA2,...,CAg},其中CAi为其中一个地址簇,g为地址簇个数。任何两个地址簇CAi中的地址不相交;任何两个Aij中的地址如果相交,则这两个Aij中的所有地址属于同一个地址簇;CA中的地址包含了交易T中的所有输入地址。
由于在交易信息中,一笔交易存在多个输入地址,这多个输入地址一般可以认为是一个用户地址或者是相关地址,如果两笔交易中存在相同的输入地址,则说明这两笔交易的输入地址存在关联例如用户相同,根据该性质将存在相同输入地址的集合合并,形成地址簇,通过合并地址簇的方式,使得每个地址簇可以通过多个交易地址验证,从而可以过滤错误的标注信息,从而提高了实名标注的准确性。通过合并使得需要分析的数据量大大降低,从而大大降低了海量数据分析的难度。在其他的实施方式中,也可以通过输出地址来合并地址簇,或者同时使用输入地址和输出地址来合并地址簇。
S24、根据数字货币地址对应的实名信息为所述地址簇标记实名信息。
数字货币地址是数字货币交易的输入地址或者输出地址。为了更好的标注地址簇,还可以为每个所述地址簇标注实名信息。如果一个数字货币地址被标注了实名信息,则将该数字货币地址所在地址簇及该地址簇的其它数字货币地址也标注成该实名信息。
为每个所述地址簇标注实名信息,包括下述步骤:
首先,获取每个地址簇中的部分或全部输入地址的实名信息;
如果每个地址簇中有多个输入地址信息,通过这些输入地址信息来为地址簇进行实名标注。可以从链下获取地址的实名标注信息或者在已有的实名标注信息基础上通过算法继续进行标注。输入地址的实名信息的获取可以通过爬虫从互联网上抓取数据后清洗得到;也可以从交易所和矿池获取比特币地址对应的实名信息;还可以通过众包方式,让大家提供地址的实名信息;或者可以构造分类器通过分类算法进行标注,也可以利用启发式算法或专家***进行标注,等等。
对于地址簇CAi,其中的输入地址可能会被不同的信息源标上不同的实名信息。为不同的信息源设置权重,如果是官方认证或者多用户验证过的信息源权重较高,个人的信息源权重较低,此处的权重可以通过本领域技术人员对信息源的合理分析进行量化来得出。对于同一个输入地址,如果从不同的信息源获取的实名信息不一致,可以以权重最高的信息源获取的实名信息为该输入地址的实名信息。
然后,将权重最高的实名信息作为该地址簇的实名信息。
设CAi共包含n个地址,其中k个地址已经标注了实名信息,k≤n,确定地址簇CAi的实名信息,此处的权重最高可以有两种方式,方式一为:k个地址中权重最高的信息源标注的输入地址的实名信息作为地址簇CAi的实名信息;
方式二为:将地址簇标成实名信息c的概率定义为Pc=(P1/P2)*(k/n),其中P1为地址被标成实名信息c的信息源权重之和,也就是有多个信息源将P1的地址标成c时,将这些信息源的权重相加;P2为k个地址的信息源权重之和,以Pc作为该实名信息c的权重,取使Pc取值最大的c作为地址簇CAi的实名信息。
通过上述方法,可以对比特币交易中的所有交易信息的输入地址按照地址簇的方式进行实名标注,通过构建地址簇可以极大降低所需标注的数量,如目前的比特币交易中,可以将413695310个地址,合并为约198424095个地址簇,从而大大降低了海量数据分析的难度,为用户分析数据创造了条件。此外,根据地址簇内地址的混合标注信息为地址簇标注,使得每个地址簇可以通过多个交易地址验证,从而可以过滤错误的标注信息,从而提高了实名标注的准确性。这些实名标注数据也可以给监管部门或相关的企业作为参考依据,为分析用户的交易信息提供实名的基础信息。
S25、根据所述交易信息构建地址簇交易图。
根据所述地址簇和所述交易信息生成地址簇交易信息,由于为地址簇标注了实名信息,因此可以形成实名交易图,得到交易实名信息。构建地址簇交易图时,地址簇交易图中的每个顶点为地址簇,根据交易信息建立有向边,包括以下步骤:
第一步,获取存在交易的输入地址和输出地址,其中输入地址所在的地址簇为第一地址簇,输出地址所在的地址簇为第二地址簇。
由于本实施例中的地址簇是根据输入地址来构建的,因此地址簇中包含了交易中的全部的输入地址,其余未包含在输入地址中的每个输出地址单独构成一个地址簇,从而所有的输入地址和输出地址都可以分配到地址簇中,通过上述实施例中的实名标注方法就可以获得这些地址簇的实名信息。
将输入地址形成的地址簇和未包含在输入地址中的输出地址的地址簇进行合并,然后也可以进行实名信息标注。
对于一笔交易t,a为t的输入地址,b为t的输出地址,地址a∈CAi和地址b∈CAj,也就是两个地址簇CAi和CAj之间存在一条交易t∈T。
第二步,建立一条从第一地址簇到第二地址簇的有向边。
如果两个地址簇CAi和CAj之间的地址a∈CAi和地址b∈CAj存在一条交易t∈T,其中a为t的输入地址,b为t的输出地址,则在实名地址簇交易图中添加一条从CAi到CAj的有向边。在可选的实施方案中,将交易t的信息映射到该有向边时,可以将映射信息保存到数据库或索引文件***中。
第三步,遍历所有存在交易的输入地址和输出地址,绘制地址簇交易图。
针对全局账本中的所有交易,进行遍历后就构建了所有交易的有向图谱,形成地址簇交易图。该方案通过有效地分析数字货币如比特币交易的关联信息,可以构建所有交易信息的地址簇交易图,表示出交易过程中的双方信息以及交易情况,结合实名信息,从而为政府提供交易者的真实身份,具有很高的社会价值,为个人和企业提供更加简便的交易流查询服务,具有很好的经济效益,为监管机构或相关企业或个人提供信息和依据。
对于每一个t∈T,取得输入地址对应的地址簇ACI,如果该地址簇不在地址簇交易图中,则作为顶点添加到地址簇交易图中;取得输出地址对应的所有地址簇,如果这些地址簇不在地址簇交易图中,则作为顶点添加到地址簇交易图中,添加从ACI到所有这些地址簇的边。
在地址簇交易图中,找到该数字货币地址所对应的地址簇,然后找到该地址簇的源地址簇和目标地址簇。如果源地址簇和目标地址簇已经被标注了实名信息,则将这些实名信息作为该数字货币地址所关联的交易实名信息。
S26、根据所述交易金额为所述地址簇标记余额。
具体步骤如下:
第一步,获取地址簇中每个交易地址对应的初始金额;
第二步,获取每个交易地址对应的输入金额、输出金额;
第三步,根据所述初始金额、输入金额、输出金额确定每个地址的当前余额;
第四步,根据每个地址的当前余额确定地址簇的余额。
该步骤中,根据数字货币地址所在的地址簇,对于地址簇中的所有数字货币地址,获取S21中得到的这些数字货币的地址余额balance,将其累加,得到地址簇余额。地址簇余额即该数字货币地址所在地址簇的余额。
S27、建立所述数字货币地址与地址簇余额的对应关系。从而将数字货币地址与当前的地址簇余额信息对应起来。
在进一步的方案中,还可以数字货币地址与其他信息进行关联。如可以包括如下信息中的一种或几种:地址余额,总输入金额,总输出金额,地址财富排行,输入交易数,输出交易数,总交易数,最近一次交易的金额,最近一次交易的时间,IP地址、实***置,实名信息,交易实名信息,地址簇余额。其中,特征的优先级如下:1.实名信息,交易实名信息,地址余额,地址簇余额;2.实***置,最近一次交易的金额,最近一次交易的时间;3.总输入金额,总输出金额,地址财富排行,输入交易数,输出交易数,总交易数。
通过上述数字货币的信息提取方法,可以生成数字货币的相关信息。根据输入的一个数字货币地址,能够查询得到其对应的特征信息,作为该数字货币地址的画像。
该方案中的数字货币的信息提取方法,将数字货币地址对应的实***置、地址簇信息、交易金额信息等有效的关联起来,通过解析区块获取交易信息,根据交易信息生成数字货币地址信息,然后为数字货币地址关联交易金额的信息、实***置、实名信息等,从而生成数字货币地址的画像,以方便监管机构进行查询并了解数字货币地址所对应实体的行为特征。
实施例3
本实施例中提供一种数字货币信息的提取方法,用于提取数字货币的特征信息,为后续查询数字货币提供基础信息。
第一步,解析区块获取交易信息。解析区块获取交易信息。通过解析得到链上的所有区块B={B1,B2,...,Bn},其中Bi为其中的一个区块,n为总区块数。对于每个区块Bi,获取该区块中的所有交易Ti={ti1,ti2,...,tim},其中tij为该区块内的一个交易,m为该区块内的总交易数。每个交易包括交易发生的时间、交易金额、输入地址、输出地址等。通过汇总所有交易得到T=UTi,其中i=1,2,...,n。以三条交易为例,记为交易a、交易b和交易c。
交易a的部分信息如下,
交易哈希:
423f0ff62d34ba62b55dc9ea44f69516b2bbde12d46b16948145c8383f3cf189
时间:
2017-12-20 11:38:16(GMT+8时区)
交易费:
0.00228669BTC
区块哈希:
000000000000000000268411603ce97362d2236db5673854361614fad41548de
总输入金额:
0.04344293BTC
总输出金额:
0.04115624BTC
输入地址和交易金额:
17ZYtkA8KMLV8ujJApyKHu7bdWxASXJ136 0.04344293BTC
输出地址和交易金额:
3EikD7mfPtvpaEUazqmaoARzg414E2K3wn 0.03957607BTC
1KdqybxckoubnKh7yzPedrPZxgxRvYY37z 0.00158017BTC
交易b的部分信息如下,
交易哈希:
5e56ec1b427e7a60ee7d1d0c4d2838235c461acb41558b46d02de9e1a01e8279
时间:
2017-12-20 13:53:01(GMT+8时区)
交易费:
0.00172521BTC
区块哈希:
000000000000000000357acc11e6e75a2a131622b447ec78eba3b7aff0c3f13e
总输入金额:
0.04107646BTC
总输出金额:
0.03935125BTC
输入地址和交易金额:
3EikD7mfPtvpaEUazqmaoARzg414E2K3wn 0.03957607BTC
3DizWK4d4wTdZV11UcJBTbHpJi3qtPTF9Y 0.00150039BTC
输出地址和交易金额:
1GFW8Q16v7MSkgXgUiuPuqAKqjFtQvc8RE 0.00828788BTC
1FkKaVz5ZhfK8P3D7rP87ibo7r1QC9yL3y 0.03106337BTC
交易c的部分信息如下,
交易哈希:
97d6089252c09004e18e3d019a5e5f48edf8f769fe8f9e4fdb6dfcd619cb9028
时间:
2018-01-23 08:02:28(GMT+8时区)
交易费:
0.00300671BTC
区块哈希:
0000000000000000004647e97e20a19f3135228e453fa9a882b6b71c4deb1b78
总输入金额:
0.23140281BTC
总输出金额:
0.2283961BTC
输入地址和交易金额:
1Ppfdpu6pZNB556bc4QVdyWyU3qRd9b2Vh 0.03309347BTC
17ZYtkA8KMLV8ujJApyKHu7bdWxASXJ136 0.08035049BTC
17bLy2i46ihqppL5GS2GfXZLGM9kPwQygK 0.00181419BTC
1JLwVhYB8yWvzLBXF2BpjFnL3uVatgKfzU 0.00061381BTC
1KdqybxckoubnKh7yzPedrPZxgxRvYY37z 0.00158017BTC
1LoCQThyMmhXuG72zMiKArjz4Drs7whCNC 0.11395068BTC
输出地址和交易金额:
13Bmqxx6NXDqaa8JyGEFhhj23KxaxGYqb7 0.22814476BTC
17KWzXhpAXTMhHDcCHVEtniCpMkisNDhdG 0.00025134BTC
第二步,生成全部数字货币地址集合A。对于每个交易tij∈T,得到该交易的所有输入地址和输出地址并形成集合Aij={aij1,aij2,…,aijs},将Aij合并到集合A中。
A={17ZYtkA8KMLV8ujJApyKHu7bdWxASXJ136,
17bLy2i46ihqppL5GS2GfXZLGM9kPwQygK,
1JLwVhYB8yWvzLBXF2BpjFnL3uVatgKfzU,
1KdqybxckoubnKh7yzPedrPZxgxRvYY37z,
1LoCQThyMmhXuG72zMiKArjz4Drs7whCNC,
1Ppfdpu6pZNB556bc4QVdyWyU3qRd9b2Vh,
3EikD7mfPtvpaEUazqmaoARzg414E2K3wn,
3DizWK4d4wTdZV11UcJBTbHpJi3qtPTF9Y,
1GFW8Q16v7MSkgXgUiuPuqAKqjFtQvc8RE,
1FkKaVz5ZhfK8P3D7rP87ibo7r1QC9yL3y,
13Bmqxx6NXDqaa8JyGEFhhj23KxaxGYqb7,
17KWzXhpAXTMhHDcCHVEtniCpMkisNDhdG}
第三步,为数字货币地址关联统计信息。对于每个数字货币地址a∈A,根据交易T统计地址余额、总输入金额、总输出金额、地址财富排行、输入交易数、输出交易数、总交易数、最近一次交易的金额、最近一次交易的时间。计算方法如下:
地址余额balance:balance的初始值赋0;对于每个交易t∈T,如果地址在t的输入地址中,则将balance减去该地址的输出金额,如果地址在t的输出地址中,则将balance加上该地址的输入金额。
总输入金额totalInput,总输出金额totalOutput,输入交易数inputTxNum、输出交易数outputTxNum、总交易数totalTxNum、最近一次交易的金额latestValue、最近一次交易的时间latestTxTime:这些特征的初始值赋0,设置临时变量value为0。按t的时间先后顺序遍历T,对于每个交易t∈T,做如下操作:
如果地址在t的输入地址中,则将value减去该地址的输出金额,如果地址在t的输出地址中,则将value加上该地址的输入金额。如果value大于等于0,则totalInput加value,inputTxNum加1,totalTxNum加1。如果value小于0,则totalOutput加value,outputTxNum加1,totalTxNum加1。如果t的输入地址或输出地址中包含数字货币地址a,则将latestValue设置为value,将latestTxTime设置为交易t的发生时间。
地址财富排行rank:对于所有地址,按地址余额balance由大到小进行排序,根据排序后的次序作为rank。
计算获取的数据如下:(由于不是从区块上的首交易开始计算,所以balance存在为负数的情况,在真实的场景下,balance大于等于0),如图3所示。
第四步,为数字货币地址关联IP地址和地理位置信息(即实***置)。该方法如下:
1.在网络上放置探测服务软件;
2.让探测服务软件连接尽量多的数字货币节点,接收广播的交易;
3.探测服务软件从远程数字货币节点接收交易时,记录交易hash、远程数字货币节点的IP地址、接收交易的时间time,形成三元组(交易hash,IP地址,time);
例如:
(423f0ff62d34ba62b55dc9ea44f69516b2bbde12d46b16948145c8383f3cf189,52.198.128.121,2017-12-20 11:38:16)
(423f0ff62d34ba62b55dc9ea44f69516b2bbde12d46b16948145c8383f3cf189,74.15.230.112,2017-12-20 11:38:17)
(5e56ec1b427e7a60ee7d1d0c4d2838235c461acb41558b46d02de9e1a01e8279,101.65.249.58,2017-12-20 13:53:01)
(5e56ec1b427e7a60ee7d1d0c4d2838235c461acb41558b46d02de9e1a01e8279,120.78.211.91,2017-12-20 13:53:02)
(97d6089252c09004e18e3d019a5e5f48edf8f769fe8f9e4fdb6dfcd619cb9028,159.253.47.202,2018-01-23 08:02:28)
(97d6089252c09004e18e3d019a5e5f48edf8f769fe8f9e4fdb6dfcd619cb9028,157.13.61.131,2018-01-23 08:02:29)
4.根据所有3中形成的三元组,统计数字货币地址与IP地址的概率关系。对于同一个交易hash,取time最早的三元组所对应的IP地址。取得该交易hash所对应交易中的输入地址,将各输入地址与IP地址组成二元组(数字货币地址,IP地址)。
(17ZYtkA8KMLV8ujJApyKHu7bdWxASXJ136,52.198.128.121)
(3EikD7mfPtvpaEUazqmaoARzg414E2K3wn,101.65.249.58)
(3DizWK4d4wTdZV11UcJBTbHpJi3qtPTF9Y,101.65.249.58)
(1Ppfdpu6pZNB556bc4QVdyWyU3qRd9b2Vh,159.253.47.202)
(17ZYtkA8KMLV8ujJApyKHu7bdWxASXJ136,159.253.47.202)
(17bLy2i46ihqppL5GS2GfXZLGM9kPwQygK,159.253.47.202)
(1JLwVhYB8yWvzLBXF2BpjFnL3uVatgKfzU,159.253.47.202)
(1KdqybxckoubnKh7yzPedrPZxgxRvYY37z,159.253.47.202)
(1LoCQThyMmhXuG72zMiKArjz4Drs7whCNC,159.253.47.202)
统计得到数字货币地址与IP地址的关联概率,得到三元组(数字货币地址,IP地址,概率值),对于一个指定数字货币地址,概率值=(指定数字货币地址在指定IP地址时的二元组数)/(指定数字货币地址的二元组数)。
(17ZYtkA8KMLV8ujJApyKHu7bdWxASXJ136,52.198.128.121,0.5)
(3EikD7mfPtvpaEUazqmaoARzg414E2K3wn,101.65.249.58,1)
(3DizWK4d4wTdZV11UcJBTbHpJi3qtPTF9Y,101.65.249.58,1)
(1Ppfdpu6pZNB556bc4QVdyWyU3qRd9b2Vh,159.253.47.202,1)
(17ZYtkA8KMLV8ujJApyKHu7bdWxASXJ136,159.253.47.202,0.5)
(17bLy2i46ihqppL5GS2GfXZLGM9kPwQygK,159.253.47.202,1)
(1JLwVhYB8yWvzLBXF2BpjFnL3uVatgKfzU,159.253.47.202,1)
(1KdqybxckoubnKh7yzPedrPZxgxRvYY37z,159.253.47.202,1)
(1LoCQThyMmhXuG72zMiKArjz4Drs7whCNC,159.253.47.202,1)
5.根据IP地址,确定地理位置信息。根据IP地址和地理位置信息库确定即可;此外,一些搜索引擎,例如百度,也提供根据IP地址查询地址位置信息的服务。
52.198.128.121日本
101.65.249.58中国浙江省温州市
159.253.47.202土耳其
第五步,生成数字货币地址簇。对于每个数字货币地址a∈A,生成一个地址簇。然后根据T对数字货币地址进行聚类,对于任意t∈T,t的所有输入地址属于同一个地址簇。
形成六个地址簇AC1、AC2、AC3、AC4、AC5、AC6
其中AC1包含6个地址:
{17ZYtkA8KMLV8ujJApyKHu7bdWxASXJ136,17bLy2i46ihqppL5GS2GfXZLGM9kPwQygK,
1JLwVhYB8yWvzLBXF2BpjFnL3uVatgKfzU,
1KdqybxckoubnKh7yzPedrPZxgxRvYY37z,
1LoCQThyMmhXuG72zMiKArjz4Drs7whCNC,
1Ppfdpu6pZNB556bc4QVdyWyU3qRd9b2Vh}
AC2包含2个地址:
{3EikD7mfPtvpaEUazqmaoARzg414E2K3wn,3DizWK4d4wTdZV11UcJBTbHpJi3qtPTF9Y}
AC3包含1个地址:
{1GFW8Q16v7MSkgXgUiuPuqAKqjFtQvc8RE}
AC4包含1个地址:
{1FkKaVz5ZhfK8P3D7rP87ibo7r1QC9yL3y}
AC5包含1个地址:
{13Bmqxx6NXDqaa8JyGEFhhj23KxaxGYqb7}
AC6包含1个地址:
{17KWzXhpAXTMhHDcCHVEtniCpMkisNDhdG}
第六步,为数字货币地址关联实名信息。
6.1从互联网上获取数字货币地址对应的实名信息,或通过人工方式为数字货币地址标注实名信息,或者通过算法为数字货币地址标注实名信息,如图4所示。
6.2如果一个数字货币地址被标注了实名信息,则将该数字货币地址所在地址簇及该地址簇的其它数字货币地址也标注成该实名信息。
数字货币地址标注信息,如图5所示。
地址簇标注信息,如图6所示。
第七步,为数字货币地址关联交易实名信息。
7.1构建地址簇交易图。
对于每一个t∈T,取得输入地址对应的地址簇ACI,如果该地址簇不在地址簇交易图中,则作为顶点添加到地址簇交易图中;取得输出地址对应的所有地址簇,如果这些地址簇不在地址簇交易图中,则作为顶点添加到地址簇交易图中,添加从ACI到所有这些地址簇的边。
形成的地址簇交易图如下:该地址簇交易图为有向图,将地址簇作为顶点,有向边表示地址簇的关系。其中顶点W1、W2、W3、W4、W5和W6表示地址簇,分别对应地址簇AC1、AC2、AC3、AC4、AC5和AC6。有向边E15、E16、E12、E23和E24表示地址簇之间的关系。如图7所示。
7.2在地址簇交易图中,找到该数字货币地址所对应的地址簇,然后找到该地址簇的源地址簇和目标地址簇。如果源地址簇和目标地址簇已经被标注了实名信息,则将这些实名信息作为该数字货币地址所关联的交易实名信息。
例如,对于数字货币地址1KdqybxckoubnKh7yzPedrPZxgxRvYY37z,其在地址簇AC1中,对应地址簇交易图中的顶点W1,该顶点关联的顶点是W2,W5和W6,这3个顶点对应的地址簇分别为AC2,AC5和AC6,这3个地址簇的实名信息分别为Entity2,Entity5和Entity6,所以数字货币地址1KdqybxckoubnKh7yzPedrPZxgxRvYY37z所关联的交易实名信息为Entity2,Entity5和Entity6。
第八步,为数字货币地址关联地址簇余额。取得数字货币地址所在的地址簇,对于地址簇中的所有数字货币地址,获取第三步中得到的这些数字货币的地址余额balance,将其累加,得到地址簇余额。地址簇余额即该数字货币地址所在钱包的余额。
数字货币地址1KdqybxckoubnKh7yzPedrPZxgxRvYY37z的地址簇余额是-0.27326557(由于不是从区块上的首交易开始计算,所以balance存在为负数的情况,在真实的场景下,balance大于等于0)。
第九步,查询数字货币地址的相关信息。如根据输入的一个地址,查询得到其对应的特征信息,作为该数字货币地址关联的实体画像。这些特征包含:地址余额,总输入金额,总输出金额,地址财富排行,输入交易数,输出交易数,总交易数,最近一次交易的金额,最近一次交易的时间,IP地址、地理位置信息,实名信息,交易实名信息,地址簇余额。特征的优先级:1.实名信息,交易实名信息,地址余额,地址簇余额;2.IP地址和地理位置信息,最近一次交易的金额,最近一次交易的时间;3.总输入金额,总输出金额,地址财富排行,输入交易数,输出交易数,总交易数。
查询地址1KdqybxckoubnKh7yzPedrPZxgxRvYY37z,得到其实***置如下,其中IPaddress和location的value中p=1表示概率为1,如图8所示。
实施例4
本实施例中提供一种数字货币的实***置提取装置,如图9所示,包括:
交易记录获取单元31,用于在网络中设置探测节点,通过探测节点获取从多个数字货币节点收到的交易记录,所述交易记录包括交易标识、网络地址、交易时间,所述网络地址为交易输入的网络地址;
第一获取单元32,用于每个交易标识对应一个或多个数字货币地址,对于每个交易标识获取其对应的交易记录中交易时间最早的网络地址作为目标网络地址;
第二获取单元33,对于一个数字货币地址,获取其对应的多个目标网络地址;
第三获取单元34,在多个目标网络地址中,获取概率最高的目标网络地址;
实***置输出单元35,获取所述目标网络地址对应的位置信息,作为该数字货币地址关联的实***置。
实施例5
本实施例中提供一种数字货币的信息提取装置,如图10所示,包括:
交易信息提取单元41,用于获取多笔数字货币的交易信息,所述交易信息至少包括交易地址及其对应的交易金额;
实***置获取单元42,用于通过实施例4所述的装置获取所述数字货币地址对应的实***置;
地址簇生成单元43,用于根据交易地址生成地址簇;
地址簇实名信息标记单元44,根据所述数字货币地址对应的实名信息为所述地址簇标记实名信息;
地址簇交易图生成单元45,根据所述交易信息构建地址簇交易图;
地址簇金额标记单元46,用于根据所述交易金额为所述地址簇标记余额;
关联单元47,用于建立所述数字货币地址与地址簇余额的对应关系。
实施例6
本实施例中提供一种服务器,用于进行数字货币交易信息的数据挖掘,其包括:存储器51和处理器52,所述存储器51和所述处理器52之间互相通信连接,其中存储器51和处理器52可以通过总线或者其他方式连接,图11中以通过总线连接为例。所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行实施例1或实施例2或实施例3所述的数字货币的信息提取方法。
存储器51作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块。处理器52通过运行存储在存储器51中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现实施例1或实施例2或实施例3所述的数字货币的信息提取方法。
处理器52可以为中央处理器(Central Processing Unit,CPU)。处理器52还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器51可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储处理器52所创建的数据等。此外,存储器51可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器51可选包括相对于处理器52远程设置的存储器,这些远程存储器可以通过网络连接至处理器52。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器51中,当被所述处理器52执行时,执行实施例1或实施例2或实施例3所述的数字货币的信息提取方法。。
实施例7
本实施例中提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令从而执行实施例1或实施例2或实施例3所述的数字货币的信息提取方法。本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (12)

1.一种数字货币的实***置提取方法,其特征在于,包括:
在网络中设置探测节点,通过探测节点获取从多个数字货币节点收到的交易记录,所述交易记录包括交易标识、网络地址、交易时间,所述网络地址为交易输入的网络地址;
每个交易标识对应一个或多个数字货币地址,对于每个交易标识获取其对应的交易记录中交易时间最早的网络地址作为目标网络地址;
对于一个数字货币地址,获取其对应的多个目标网络地址;
在多个目标网络地址中,获取概率最高的目标网络地址;
获取所述目标网络地址对应的位置信息,作为该数字货币地址关联的实***置。
2.根据权利要求1所述的方法,其特征在于,所述在网络中设置探测节点,通过探测节点获取从多个数字货币节点收到的交易记录,包括:
在网络上放置探测服务软件;
通过探测服务软件连接多个数字货币节点,从数字货币节点接收数字货币的交易信息,得到交易记录。
3.根据权利要求1所述的方法,其特征在于,所述目标网络地址包括IP地址,所述实***置包括地理位置信息。
4.根据权利要求1或2或3所述的方法,其特征在于,所述对于一个数字货币地址,获取其对应的多个目标网络地址的处理中,包括:将该数字货币地址所在地址簇中的所有数字货币地址与该目标网络地址关联起来。
5.一种数字货币的信息提取方法,其特征在于,包括:
获取多笔数字货币的交易信息,所述交易信息至少包括交易地址及其对应的交易金额;
通过权利要求1-4任一所述的方法获取所述数字货币地址对应的实***置;
根据交易地址生成地址簇;根据所述数字货币地址对应的实名信息为所述地址簇标注实名信息;
根据所述交易信息构建地址簇交易图;
根据所述交易金额为所述地址簇标记余额;
建立所述数字货币地址与地址簇余额的对应关系。
6.根据权利要求5所述的方法,其特征在于,所述数字货币地址的信息还包括:地址余额、总输入金额、总输出金额、地址财富排行、输入交易数、输出交易数、总交易数、最近一次交易金额、最近一次交易时间、最近一次交易对应的IP地址、实***置、实名信息、交易实名信息中的一种或几种。
7.根据权利要求5所述的方法,其特征在于,所述根据所述交易金额为所述地址簇标记余额的步骤,包括:
获取地址簇中每个交易地址对应的初始金额;
获取每个交易地址对应的输入金额、输出金额;
根据所述初始金额、输入金额、输出金额确定每个地址的当前余额;
根据每个地址的当前余额确定地址簇的余额。
8.根据权利要求5所述的方法,其特征在于,根据所述交易信息构建地址簇交易图,包括:
获取存在交易的输入地址和输出地址,其中输入地址所在的地址簇为第一地址簇,输出地址所在的地址簇为第二地址簇;
建立一条从第一地址簇到第二地址簇的有向边;
遍历所有存在交易的输入地址和输出地址,绘制地址簇交易图。
9.根据权利要求5所述的方法,其特征在于,为所述地址簇标注实名信息,包括:
获取每个地址簇中的部分或全部交易地址的实名信息;
将权重最高的实名信息作为该地址簇的实名信息,包括:
将地址簇标成实名信息c的权重:Pc=(P1/P2)*(k/n),其中n为地址簇中交易地址的个数,k为已经标注实名信息的交易地址的个数,P1为地址被标成实名信息c的信息源权重之和,P2为k个地址的信息源权重之和;
取使Pc取值最大的实名信息c作为地址簇的实名信息。
10.一种数字货币的实***置提取装置,其特征在于,包括:
交易记录获取单元,用于通过探测节点获取从多个数字货币节点收到的交易记录,所述交易记录包括交易标识、网络地址、交易时间,所述网络地址为交易输入的网络地址;
第一获取单元,每个交易标识对应一个或多个数字货币地址,对于每个交易标识获取其对应的交易记录中交易时间最早的网络地址作为目标网络地址;
第二获取单元,用于对于一个数字货币地址,获取其对应的多个目标网络地址;
第三获取单元,用于在多个目标网络地址中,获取概率最高的目标网络地址;
实***置输出单元,用于获取所述目标网络地址对应的位置信息,作为该数字货币地址关联的实***置。
11.一种数字货币的信息提取装置,其特征在于,包括:
交易信息提取单元,用于获取多笔数字货币的交易信息,所述交易信息至少包括交易地址及其对应的交易金额;
实***置获取单元,用于通过权利要求10所述的装置获取所述数字货币地址对应的实***置;
地址簇生成单元,用于根据交易地址生成地址簇;
地址簇实名信息标记单元,根据所述数字货币地址对应的实名信息为所述地址簇标注实名信息;
地址簇交易图生成单元,根据所述交易信息构建地址簇交易图;
地址簇金额标记单元,用于根据所述交易金额为所述地址簇标记余额;
关联单元,用于建立所述数字货币地址与地址簇余额的对应关系。
12.一种服务器,其特征在于,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1-4任一所述的数字货币的实***置提取方法或5-9任一所述的数字货币的信息提取方法;一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-4任一所述的数字货币的实***置提取方法或5-9任一所述的数字货币的信息提取方法。
CN201811641544.0A 2018-12-29 2018-12-29 数字货币的实***置提取方法、信息的提取方法及其装置 Pending CN111383004A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811641544.0A CN111383004A (zh) 2018-12-29 2018-12-29 数字货币的实***置提取方法、信息的提取方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811641544.0A CN111383004A (zh) 2018-12-29 2018-12-29 数字货币的实***置提取方法、信息的提取方法及其装置

Publications (1)

Publication Number Publication Date
CN111383004A true CN111383004A (zh) 2020-07-07

Family

ID=71218168

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811641544.0A Pending CN111383004A (zh) 2018-12-29 2018-12-29 数字货币的实***置提取方法、信息的提取方法及其装置

Country Status (1)

Country Link
CN (1) CN111383004A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112351119A (zh) * 2021-01-11 2021-02-09 北京知帆科技有限公司 一种基于概率的区块链交易始发ip地址确定方法及装置
CN112650890A (zh) * 2020-12-28 2021-04-13 杭州趣链科技有限公司 一种基于图数据库的加密货币流向追踪方法与装置
CN112801783A (zh) * 2020-12-31 2021-05-14 北京知帆科技有限公司 一种基于数字货币交易特征的实体识别方法及装置
CN113570464A (zh) * 2021-09-07 2021-10-29 北京科技大学 一种数字货币交易社区识别方法、***、设备及存储介质
US20220027900A1 (en) * 2019-01-22 2022-01-27 S2W Lab Inc. Cryptocurrency transaction analysis method and system
CN115049493A (zh) * 2022-06-29 2022-09-13 北京知帆科技有限公司 一种区块链数据追踪方法、装置及电子设备
CN115660837A (zh) * 2022-09-05 2023-01-31 淮阴工学院 一种基于知识图谱的虚拟货币地址画像构建方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160140546A1 (en) * 2013-07-25 2016-05-19 Visa Europe Limited Processing electronic tokens
US20170091764A1 (en) * 2015-09-30 2017-03-30 Bank Of America Corporation Non-intrusive geo-location determination associated with transaction authorization
CN107085812A (zh) * 2016-12-06 2017-08-22 雷盈企业管理(上海)有限公司 区块链数字资产的反洗钱***及方法
CN108009807A (zh) * 2017-10-17 2018-05-08 国家计算机网络与信息安全管理中心 一种比特币交易身份标识方法
CN109087079A (zh) * 2018-07-09 2018-12-25 北京知帆科技有限公司 数字货币交易信息分析方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160140546A1 (en) * 2013-07-25 2016-05-19 Visa Europe Limited Processing electronic tokens
US20170091764A1 (en) * 2015-09-30 2017-03-30 Bank Of America Corporation Non-intrusive geo-location determination associated with transaction authorization
CN107085812A (zh) * 2016-12-06 2017-08-22 雷盈企业管理(上海)有限公司 区块链数字资产的反洗钱***及方法
CN108009807A (zh) * 2017-10-17 2018-05-08 国家计算机网络与信息安全管理中心 一种比特币交易身份标识方法
CN109087079A (zh) * 2018-07-09 2018-12-25 北京知帆科技有限公司 数字货币交易信息分析方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220027900A1 (en) * 2019-01-22 2022-01-27 S2W Lab Inc. Cryptocurrency transaction analysis method and system
CN112650890A (zh) * 2020-12-28 2021-04-13 杭州趣链科技有限公司 一种基于图数据库的加密货币流向追踪方法与装置
CN112801783A (zh) * 2020-12-31 2021-05-14 北京知帆科技有限公司 一种基于数字货币交易特征的实体识别方法及装置
CN112351119A (zh) * 2021-01-11 2021-02-09 北京知帆科技有限公司 一种基于概率的区块链交易始发ip地址确定方法及装置
CN112351119B (zh) * 2021-01-11 2021-04-02 北京知帆科技有限公司 一种基于概率的区块链交易始发ip地址确定方法及装置
CN113570464A (zh) * 2021-09-07 2021-10-29 北京科技大学 一种数字货币交易社区识别方法、***、设备及存储介质
CN113570464B (zh) * 2021-09-07 2022-06-03 北京科技大学 一种数字货币交易社区识别方法、***、设备及存储介质
CN115049493A (zh) * 2022-06-29 2022-09-13 北京知帆科技有限公司 一种区块链数据追踪方法、装置及电子设备
CN115660837A (zh) * 2022-09-05 2023-01-31 淮阴工学院 一种基于知识图谱的虚拟货币地址画像构建方法及装置

Similar Documents

Publication Publication Date Title
CN109087079B (zh) 数字货币交易信息分析方法
CN111383004A (zh) 数字货币的实***置提取方法、信息的提取方法及其装置
US11294981B2 (en) System and method for large scale crowdsourcing of map data cleanup and correction
CN110428091B (zh) 基于数据分析的风险识别方法及相关设备
US10848951B2 (en) Detecting and validating planned event information
CN111383005B (zh) 数字货币流向追踪方法及装置
WO2017202006A1 (zh) 数据处理方法和装置、计算机存储介质
US9582719B2 (en) Geographical area condition determination
CN111949834A (zh) 选址方法和选址平台
US10083186B2 (en) System and method for large scale crowdsourcing of map data cleanup and correction
CN110956547A (zh) 一种基于搜索引擎的实时识别欺诈团伙的方法及***
US20210056299A1 (en) Methods and systems for updating a database based on object recognition
CN110851552A (zh) 物流订单的自动分配方法及装置、电子设备、存储介质
CN112269805A (zh) 数据处理方法、装置、设备及介质
US20240095734A1 (en) Embedded data transaction exchange platform
CN112925899B (zh) 排序模型建立方法、案件线索推荐方法、装置及介质
CN107798450B (zh) 业务分配方法和装置
CN110347925B (zh) 信息处理方法及计算机可读存储介质
CN111861139A (zh) 商户推荐方法、装置及计算机设备
CN115203354B (zh) 一种车码轨迹预关联方法、装置、计算机设备及存储介质
KR102271234B1 (ko) Pnu를 활용한 부동산 유사사례 db 생성 방법
CN113205442A (zh) 基于区块链的电子政务数据反馈管理方法及装置
CN109034938B (zh) 信息快速筛选匹配方法、装置、电子设备及存储介质
CN111382343A (zh) 一种标签体系生成方法及装置
CN116933123A (zh) 客用户的常住地预测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination