CN117290401B - 一种数据交易方法和*** - Google Patents

一种数据交易方法和*** Download PDF

Info

Publication number
CN117290401B
CN117290401B CN202311571243.6A CN202311571243A CN117290401B CN 117290401 B CN117290401 B CN 117290401B CN 202311571243 A CN202311571243 A CN 202311571243A CN 117290401 B CN117290401 B CN 117290401B
Authority
CN
China
Prior art keywords
data
resource
classification
node
source node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311571243.6A
Other languages
English (en)
Other versions
CN117290401A (zh
Inventor
伊世林
卫骞
舒盛明
赵华宇
卞阳
张伟奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Fudata Technology Co ltd
Beijing Fucun Technology Co ltd
Original Assignee
Shanghai Fudata Technology Co ltd
Beijing Fucun Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Fudata Technology Co ltd, Beijing Fucun Technology Co ltd filed Critical Shanghai Fudata Technology Co ltd
Priority to CN202311571243.6A priority Critical patent/CN117290401B/zh
Publication of CN117290401A publication Critical patent/CN117290401A/zh
Application granted granted Critical
Publication of CN117290401B publication Critical patent/CN117290401B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供一种数据交易方法和***,包括:数源节点对第一本地存储资源进行分类分级标注,得到具有分类分级信息的标签数据资源;数源节点基于标签数据资源生成数据资源查询接口,并将数据资源查询接口上传至服务器中;需方节点在服务器中请求多个数源节点;需方节点基于多个数源节点中每个数源节点对应的数据资源查询接口,获取每个数源节点对应的标签数据资源,并基于每个数源节点对应的标签数据资源确定数据资源列表;需方节点从数据资源列表中确定目标数据资源。从而,需方节点能够快速确定出所需数据资源,实现快速高效的数据交易。

Description

一种数据交易方法和***
技术领域
本公开的实施例涉及数联网技术领域,具体地,涉及适用于一种数据交易方法和***。
背景技术
数联网(Internet of Data),即数据与数据之间相互连接的互联网,其本质是构建了一套能够识别每个节点数据及数据服务的协议规范和框架,便于用户按需获取。
在数联网方案中,数据需求方与数据提供方进行数据交易时,数据需求方需要查看所有数据提供方的数据资源,选择一个符合数据需求方需求的数据资源进行数据交易和使用。现有的数据交易模式下,数据需求方需要依次查看每个数据提供方的数据资源,才能选择出符合需求的数据资源进行数据交易。
然而,上述实现方式,在面对大量数据提供方的众多数据场景下,数据需求方难以高效筛选出所需数据资源。
发明内容
本文中描述的实施例提供了一种数据交易方法和***,克服了上述问题。
第一方面,根据本公开的内容,提供了一种数据交易方法,包括:
数源节点对第一本地存储资源进行分类分级标注,得到具有分类分级信息的标签数据资源,所述数源节点用于描述数据提供方;
所述数源节点基于所述标签数据资源生成数据资源查询接口,并将所述数据资源查询接口上传至服务器中;
需方节点在所述服务器中请求多个所述数源节点,所述需方节点用于描述数据需求方;
所述需方节点基于多个所述数源节点中每个数源节点对应的数据资源查询接口,获取每个所述数源节点对应的标签数据资源,并基于每个所述数源节点对应的标签数据资源确定数据资源列表;
所述需方节点从所述数据资源列表中确定目标数据资源,以通过所述服务器与所述目标数据资源对应的数源节点进行所述目标数据资源相应的数据交易。
第二方面,根据本公开的内容,提供了一种数据交易***,包括:数源节点和需方节点;
所述数源节点,用于对第一本地存储资源进行分类分级标注,得到具有分类分级信息的标签数据资源,所述数源节点用于描述数据提供方;基于所述标签数据资源生成数据资源查询接口,并将所述数据资源查询接口上传至服务器中;
所述需方节点,用于在所述服务器中请求多个所述数源节点,所述需方节点用于描述数据需求方;基于多个所述数源节点中每个数源节点对应的数据资源查询接口,获取每个所述数源节点对应的标签数据资源,并基于每个所述数源节点对应的标签数据资源确定数据资源列表;从所述数据资源列表中确定目标数据资源,以通过所述服务器与所述目标数据资源对应的数源节点进行所述目标数据资源相应的数据交易。
第三方面,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,处理器执行计算机程序时实现如以上任意一个实施例中数据交易方法的步骤。
第四方面,提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如以上任意一个实施例中数据交易方法的步骤。
本申请实施例提供的数据交易方法,数源节点对第一本地存储资源进行分类分级标注,得到具有分类分级信息的标签数据资源,数源节点用于描述数据提供方;数源节点基于标签数据资源生成数据资源查询接口,并将数据资源查询接口上传至服务器中;需方节点在服务器中请求多个数源节点,需方节点用于描述数据需求方;需方节点基于多个数源节点中每个数源节点对应的数据资源查询接口,获取每个数源节点对应的标签数据资源,并基于每个数源节点对应的标签数据资源确定数据资源列表;需方节点从数据资源列表中确定目标数据资源,以通过服务器与目标数据资源对应的数源节点进行目标数据资源相应的数据交易。如此,每个数源节点通过对其本地存储资源进行分类分级打标处理,使得需方节点能够在确定出的数据资源列表中快速确定出所需数据资源,实现快速高效的数据交易。
上述说明仅是本申请实施例技术方案的概述,为了能够更清楚了解本申请实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本申请实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
为了更清楚地说明本公开的实施例的技术方案,下面将对实施例的附图进行简要说明,应当知道,以下描述的附图仅仅涉及本公开的一些实施例,而非对本公开的限制,其中:
图1是本公开提供的一种数据交易方法的流程示意图。
图2是本公开提供的一种数联网的节点交易示意图。
图3是本公开提供的一种需方节点与数源节点交易的流程示意图。
图4是本公开提供的一种数据交易***的结构示意图。
图5是本公开提供的一种计算机设备的结构示意图。
需要注意的是,附图中的元素是示意性的,没有按比例绘制。
具体实施方式
为了使本公开的实施例的目的、技术方案和优点更加清楚,下面将结合附图,对本公开的实施例的技术方案进行清楚、完整的描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域技术人员在无需创造性劳动的前提下所获得的所有其它实施例,也都属于本公开保护的范围。
除非另外定义,否则在此使用的所有术语(包括技术和科学术语)具有与本公开主题所属领域的技术人员所通常理解的相同含义。进一步将理解的是,诸如在通常使用的词典中定义的那些的术语应解释为具有与说明书上下文和相关技术中它们的含义一致的含义,并且将不以理想化或过于正式的形式来解释,除非在此另外明确定义。如在此所使用的,将两个或更多部分“连接”或“耦接”到一起的陈述应指这些部分直接结合到一起或通过一个或多个中间部件结合。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语“实施例”并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:存在A,同时存在A和B,存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。诸如“第一”和“第二”的术语仅用于将一个部件(或部件的一部分)与另一个部件(或部件的另一部分)区分开。
在本申请的描述中,除非另有说明,“多个”的含义是指两个以上(包括两个),同理,“多组”指的是两组以上(包括两组)。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
图1是本公开实施例提供的一种数据交易方法的流程示意图。如图1所示,数据交易方法的具体过程包括:
S110、数源节点对第一本地存储资源进行分类分级标注,得到具有分类分级信息的标签数据资源。
其中,数源节点可用于描述数据提供方,即需方节点所需数据资源的提供方。可以理解的是,数源节点可不等同于数据提供方,数源节点可作为数据提供方与数据需求方之间的一个数据处理方。
第一本地存储资源为数据提供方预先将本地数据添加至数源节点得到的,本地数据可包括但不限于是CSV文本、MySQL数据源文本、HBASE数据源文本等。
数据资源为能够体现一个数据的价值数据(信息),即第一本地存储资源为能够体现本地数据的一个或多个价值数据,标签数据资源为能够体现相应数据的一个或多个价值数据。
分类分级标注即为对第一本地存储资源进行分类处理、分类处理之后的分级处理、打标签处理。例如,将第一本地存储资源进行分类,分为类别1、类别2和类别3,每个类别下可以有二级、三级分类,如类别1对应的二级分类为类别11和类别12,类别1对应的三级分类为类别111和类别112。
一些实施例中,数源节点对第一本地存储资源进行分类分级标注,得到具有分类分级信息的标签数据资源,包括:
数源节点基于数据信息、数据特征以及隐私保护等级,采用预设匹配算法对第一本地存储资源进行分类分级打标,确定第一本地存储资源所属的分类分级标签;数源节点向数联网服务器发送第一本地存储资源所属的分类分级标签以及每个分类分级标签对应的标签关键词,使得数联网服务器基于每个分类分级标签对应的标签关键词对第一本地存储资源所属的分类分级标签进行校准核验;数源节点接收数联网服务器发送的校准核验结果,并基于校准核验结果对第一本地存储资源所属的分类分级标签进行修正,得到具有分类分级信息的标签数据资源。
其中,数源节点可基于数据信息、数据特征以及隐私保护等级,采用预设匹配算法对第一本地存储资源进行分类分级打标。例如,把第一本地存储资源分为:个人信息、金融行业信息、电力行业信息、运营商行业信息、医疗行业信息等,每个分类下可以有二级、三级分类,如个人信息/个人身份信息、个人信息/个人自然信息/个人职业信息、医疗行业信息/患者身份信息等。
数据资源特征也会有对应的分类分级信息,如个人身份信息包含身份证号对应的分类就是个人信息/个人身份信息/身份证号,数据资产的分类分级信息是由数据资产内部特征分类分级汇总得到的,例如某个数据资源下50%的特征的分类分级都划分在个人信息/个人身份信息下的子类中,则该数据资源就被划分为个人身份信息。
根据数据隐私保护等级,将数据资源特征和数据资源的分级分为一级、二级、三级、四级、五级,数值越大,隐私保护等级越高,数据安全性越重要。分类分级信息可以参考国家标准文件或行业规范文件,也可以根据业务场景进行划分。
本实施例中,分类分级标注方式包括但不限于:人工标注、规则标注、规则标注+人工审核。
其中,人工标注:通过人工的方式,对数据资源和数据资源内的特征,进行分类分级手动标注,选择一个合适的分类分级标签进行标注。如通过人工的方式,对数据资源ABC进行标注(分类:个人信息/个人身份信息;分级:3级),对数据资源ABC中的特征ID Card进行标注(分类:个人信息/个人身份信息/身份证号;分级:3级)。
规则标注:首先定义分类分级标注的规则,定义规则后,读取数据资源的数据信息,根据规则对数据资源和特征进行识别和标注。如读取数据资源ABC的数据后,命中数据资源的个人基础信息规则和特征的身份证号规则,则数据资源ABC被标注为(分类:个人信息/个人身份信息;分级:3级),数据资源ABC中的特征ID Card被标注为(分类:个人信息/个人身份信息/身份证号;分级:3级)。
规则标注+人工审核:首先基于规则的标注方式进行识别和标注,再进行人工确认和修正。
每个分类分级标签对应有标签关键词。标签关键词可展示分类分级标签对应的分类标识、分级标识以及标签标识,分类标识、分级标识和标签标识可采用字母、数字或文字等不同显示形式显示,便于进行标识区分。
预设匹配算法包括:基于数据的正则匹配算法、基于数据的关键字匹配算法以及基于特征名称的匹配算法。
数联网服务器基于标签关键词对分类分级标签进行校准核验,为基于标签关键词验证分类分级标签与对应的第一本地存储资源之间的匹配度,从而,避免第一本地存储资源与其所属的分类分级标签之间不匹配的问题。
数联网服务器返回给需方节点的校准核验结果可包括:核验通过信息和核验不通过信息。核验通过信息可包括:核验通过指示和标签关联数据,标签关联数据为数联网服务器基于相应的第一本地存储资源确定的备份分类分级标签。校准核验不通过信息可包括:核验不通过指示和标签重命名数据,标签重命名数据为数联网服务器基于相应的第一本地存储资源重新确定出的一个分类分级标签。
基于校准核验结果对第一本地存储资源所属的分类分级标签进行修正,得到具有分类分级信息的标签数据资源,可包括:在校准核验结果为校验通过信息时,可基于标签关联信息对第一本地存储资源所属的分类分级标签进行替换,或者,基于标签关联信息对第一本地存储资源所属的分类分级标签进行微调(如替换部分字体或标识等),或者,继续保持第一本地存储资源所属的分类分级标签,得到具有分类分级信息的标签数据资源。
基于校准核验结果对第一本地存储资源所属的分类分级标签进行修正,得到具有分类分级信息的标签数据资源,可包括:在校准核验结果为校验不通过信息时,可基于标签重命名信息对第一本地存储资源所属的分类分级标签进行替换,得到具有分类分级信息的标签数据资源。从而,有效提升第一本地存储资源与其对应的分类分级标签之间的适配度。
一些实施例中,数源节点基于数据信息、数据特征以及隐私保护等级,采用预设匹配算法对第一本地存储资源进行分类分级打标,确定第一本地存储资源所属的分类分级标签,包括:
数源节点采用基于数据的正则匹配算法,基于数据信息、数据特征以及隐私保护等级对第一本地存储资源进行正则匹配,确定第一本地存储资源所属的分类分级标签。
举例而言,基于数据信息、数据特征以及隐私保护等级,对数据的内容进行正则匹配,当第一本地存储资源中符合正则匹配的某个数据达到设定的阈值时,则认为此数据符合该规则对应的分类分级标签。
或者,数源节点采用基于数据的关键字匹配算法,基于数据信息、数据特征以及隐私保护等级对第一本地存储资源进行关键字匹配,确定第一本地存储资源所属的分类分级标签。
举例而言,基于数据信息、数据特征以及隐私保护等级,对数据的内容进行关键字匹配,当第一本地存储资源中符合关键字匹配的某个数据达到设定的阈值时,则认为此数据符合该规则对应的分类分级标签。如定义国籍分类分级的关键字:[中国|韩国|日本|越南|…],当第一本地存储资源中某个特征的数据为中国时,则命中该规则,当该特征中80%的数据都命中该规则时,则认为该特征命中国籍分类分级标签(分类:个人信息/个人身份信息/国籍;分级:3级);当某个数据中超过50%的特征都符合个人身份信息下的分类分级时,则认为该数据属于个人身份信息分类分级标签(分类:个人信息/个人身份信息;分级:3级)。
或者,数源节点采用基于特征名称的匹配算法,基于数据信息、数据特征以及隐私保护等级对第一本地存储资源进行特征名称匹配,确定第一本地存储资源所属的分类分级标签。
举例而言,如定义手机号分类分级规则:特征名=“Phone Number”或”TelephoneNumber”或”手机号”,当数据ABC特征含” Telephone Number”时,则认为该特征被标注为手机号分类分级(分类:个人信息/个人联系信息/手机号;分级:3级);当某个数据中超过50%的特征都符合个人联系信息下的分类分级时,则认为该数据属于个人联系信息分类分级标签(分类:个人信息/个人联系信息;分级:3级)。
或者,数源节点采用算法组合规则,基于数据信息、数据特征以及隐私保护等级对第一本地存储资源进行相应匹配,确定第一本地存储资源所属的分类分级标签,算法组合规则用于描述基于数据的正则匹配算法、基于数据的关键字匹配算法以及基于特征名称的匹配算法的部分组合筛选方式。
举例而言,当第一本地存储资源同时满足多条算法,或仅满足部分算法时,对数据进行打标。如第一本地存储资源同时满足基于数据的正则匹配算法和基于特征名称的匹配算法时,并且两个算法指向的分类分级相同时,才会对数据和特征进行分类分级标注。
或者,数源节点采用算法互斥规则,基于数据信息、数据特征以及隐私保护等级对第一本地存储资源进行相应匹配,确定第一本地存储资源所属的分类分级标签,算法互斥规则用于描述基于数据的正则匹配算法、基于数据的关键字匹配算法以及基于特征名称的匹配算法的部分互斥筛选方式。
举例而言,第一本地存储资源同时满足基于数据的正则匹配算法和基于特征名称的匹配算法时,且两个算法指向的分类分级不相同时,可对数据和特征进行分类分级标注,如标注基于数据的正则匹配算法/基于特征名称的匹配算法指向的分类分级标签。
S120、数源节点基于标签数据资源生成数据资源查询接口,并将数据资源查询接口上传至数联网服务器中。
其中,数源节点能够提供分类分级信息的数据资源查询接口,数据资源查询接口能够返回含有分类分级标签的数据资源信息。
数源节点可为所有的标签数据资源生成一个数据资源查询接口,或者,数源节点也可为同一类或具有关联关系的多个标签数据资源生成一个共用的数据资源查询接口。
S130、需方节点在数联网服务器中请求多个数源节点。
其中,需方节点可用于描述数据需求方。需方节点可通过向数联网服务器发送节点访问请求的方式向数联网服务器请求多个数源节点。
S140、需方节点基于多个数源节点中每个数源节点对应的数据资源查询接口,获取每个数源节点对应的标签数据资源,并基于每个数源节点对应的标签数据资源确定数据资源列表。
其中,数据资源列表中按照指定顺序先后排列了多个数据资源。
一些实施例中,需方节点基于每个数源节点对应的标签数据资源确定数据资源列表,包括:
需方节点基于每个数源节点对应的标签数据资源的时间信息,对多个标签数据资源进行排序,得到初始资源列表;需方节点基于预设时间数据,对初始资源列表进行数据资源筛选,得到数据资源列表。
其中,每个数源节点对应的标签数据资源的时间信息可为标签数据资源上传至数源节点的上传时间,或者,为标签数据资源的生成时间。
预设时间数据为需方节点预先设置的一个时间段,需方节点可通过此时间段对初始资源列表进行数据筛选,得到符合需求的数据资源列表。
另外,每个数源节点对应的标签数据资源均具有其对应的资源优先等级,每个标签数据资源对应的资源优先等级为数源节点基于数据资源利用率预先设置出的。
需方节点基于每个数源节点对应的标签数据资源确定数据资源列表,还可包括:需方节点基于每个标签数据资源对应的资源优先等级,对所有的标签数据资源进行优先等级排序,得到数据资源列表,在数据资源列表中,处于列表位置越靠前的标签数据资源,其对应的资源优先等级越高。
S150、需方节点从数据资源列表中确定目标数据资源。
其中,需方节点从数据资源列表中确定目标数据资源,以通过数联网服务器与目标数据资源对应的数源节点进行目标数据资源的相应的数据交易,数联网的节点交易示意图如图2所示。
一些实施例中,需方节点从数据资源列表中确定目标数据资源,包括:
需方节点匹配对应的本地搜索词与每个标签关键词,得到目标检索词;需方节点采用目标检索词对具有分类分级信息的标签数据资源进行数据检索,得到目标数据资源。
其中,本地搜索词是需方节点基于检索需求生成的,以使得需方节点可基于自身需求从数据资源列表中快速检索出所需数据资源,进一步提升需方节点的数据资源筛选效率。
需方节点采用目标检索词对具有分类分级信息的标签数据资源进行数据检索,得到目标数据资源,可包括:需方节点采用目标检索词对具有分类分级信息的标签数据资源进行数据检索,得到至少两个初始数据资源,基于每个初始数据资源对应于数源节点的上传时间/生成时间/资源优先等级,对至少两个初始数据资源进行排序,选取预设数量个对应于数源节点的上传时间最晚/生成时间最晚/资源优先等级最高的数据资源为目标数据资源,从而,有效保证目标数据资源的资源实用性。
本实施例中,数源节点对第一本地存储资源进行分类分级标注,得到具有分类分级信息的标签数据资源,数源节点用于描述数据提供方;数源节点基于标签数据资源生成数据资源查询接口,并将数据资源查询接口上传至数联网服务器中;需方节点在数联网服务器中请求多个数源节点,需方节点用于描述数据需求方;需方节点基于多个数源节点中每个数源节点对应的数据资源查询接口,获取每个数源节点对应的标签数据资源,并基于每个数源节点对应的标签数据资源确定数据资源列表;需方节点从数据资源列表中确定目标数据资源,以通过数联网服务器与目标数据资源对应的数源节点进行目标数据资源相应的数据交易。如此,每个数源节点通过对其本地存储资源进行分类分级打标处理,使得需方节点能够在确定出的数据资源列表中快速确定出所需数据资源,实现快速高效的数据交易。
基于上述实施例的描述,本实施例方法还可以包括:
需方节点向数联网服务器发送携带有目标数据资源的资源标识的资源访问请求,使得数联网服务器对资源访问请求进行安全验证,并在验证通过后建立需方节点与目标数据资源对应的数源节点之间的交易通道,并将资源访问请求发送至目标数据资源对应的数源节点;需方节点基于交易通道接收目标数据资源对应的数源节点发送的数据资源包。
其中,数据资源包中包括目标数据资源。据资源数包中还可以包括目标数据资源所关联的其它数据资源。
从而,需方节点在与数源节点进行数据交易时,通过数联网服务器保证数据交易安全性,便于提升需方节点与数源节点之间数据交易安全性。
一些实施例中,需方节点通过交易通道与对应的数源节点进行数据交易之后,本实施例方法还可以包括:
需方节点从第二本地存储资源中确定目标数据资源的关联数据资源;需方节点基于交易通道,向目标数据资源对应的数源节点发送目标数据资源的关联数据资源。
其中,需方节点在从第二本地存储资源中确定目标数据资源的关联数据资源时,可从第二本地存储资源中选取与目标数据资源的资源上传时间相同/资源生成时间相同/资源交易渠道相同/资源匹配度高的一个或多个数据资源作为目标数据资源的关联数据资源。目标数据资源的资源上传时间为目标数据资源上传至对应数源节点的时间。
从而,需方节点在与数源节点进行数据交易时,能够向数源节点主动推送关联数据资源,便于提升与数源节点之间的交易粘度。
如图3所示,本实施例中,数源节点对自有数据进行分类分级标注,需方节点请求多个数源节点,获取含分类分级标注信息的数据资源列表,通过对分类分级进行检索,快速定位到符合自身需求的分类分级数据资源,再按照数联网的交易规则,需方节点和数源节点进行数据交易等后续操作,从而实现快速高效的数据流通和交易流程。
图4为本实施例提供的一种数据交易***的结构示意图。数据交易***可以包括:数源节点410和需方节点420。
所述数源节点410,用于对第一本地存储资源进行分类分级标注,得到具有分类分级信息的标签数据资源,所述数源节点410用于描述数据提供方;基于所述标签数据资源生成数据资源查询接口,并将所述数据资源查询接口上传至服务器中。
所述需方节点420,用于在所述服务器中请求多个所述数源节点410,所述需方节点420用于描述数据需求方;基于多个所述数源节点410中每个数源节点410对应的数据资源查询接口,获取每个所述数源节点410对应的标签数据资源,并基于每个所述数源节点410对应的标签数据资源确定数据资源列表;从所述数据资源列表中确定目标数据资源,以通过所述服务器与所述目标数据资源对应的数源节点410进行所述目标数据资源相应的数据交易。
在本实施例中,可选的,所述数源节点410,具体用于:
基于数据信息、数据特征以及隐私保护等级,采用预设匹配算法对所述第一本地存储资源进行分类分级打标,确定所述第一本地存储资源所属的分类分级标签,每个所述分类分级标签对应有标签关键词,所述预设匹配算法包括:基于数据的正则匹配算法、基于数据的关键字匹配算法以及基于特征名称的匹配算法;向所述服务器发送所述第一本地存储资源所属的分类分级标签以及每个所述分类分级标签对应的标签关键词,使得所述服务器基于每个所述分类分级标签对应的标签关键词对所述第一本地存储资源所属的分类分级标签进行校准核验;接收所述服务器发送的校准核验结果,并基于所述校准核验结果对所述第一本地存储资源所属的分类分级标签进行修正,得到具有分类分级信息的标签数据资源。
在本实施例中,可选的,所述数源节点410,具体用于:
采用基于数据的正则匹配算法,基于所述数据信息、所述数据特征以及所述隐私保护等级对所述第一本地存储资源进行正则匹配,确定所述第一本地存储资源所属的分类分级标签;或者,采用基于数据的关键字匹配算法,基于所述数据信息、所述数据特征以及所述隐私保护等级对所述第一本地存储资源进行关键字匹配,确定所述第一本地存储资源所属的分类分级标签;或者,采用基于特征名称的匹配算法,基于所述数据信息、所述数据特征以及所述隐私保护等级对所述第一本地存储资源进行特征名称匹配,确定所述第一本地存储资源所属的分类分级标签;或者,采用算法组合规则,基于所述数据信息、所述数据特征以及所述隐私保护等级对所述第一本地存储资源进行相应匹配,确定所述第一本地存储资源所属的分类分级标签,所述算法组合规则用于描述基于数据的正则匹配算法、基于数据的关键字匹配算法以及基于特征名称的匹配算法的部分组合筛选方式;或者,采用算法互斥规则,基于所述数据信息、所述数据特征以及所述隐私保护等级对所述第一本地存储资源进行相应匹配,确定所述第一本地存储资源所属的分类分级标签,所述算法互斥规则用于描述基于数据的正则匹配算法、基于数据的关键字匹配算法以及基于特征名称的匹配算法的部分互斥筛选方式。
在本实施例中,可选的,所述需方节点420,具体用于:
匹配对应的本地搜索词与每个所述标签关键词,得到目标检索词,所述本地搜索词是所述需方节点420基于检索需求生成的;采用所述目标检索词对具有分类分级信息的所述标签数据资源进行数据检索,得到所述目标数据资源。
在本实施例中,可选的,所述需方节点420,具体用于:
基于每个所述数源节点410对应的标签数据资源的时间信息,对多个所述标签数据资源进行排序,得到初始资源列表;基于预设时间数据,对所述初始资源列表进行数据资源筛选,得到所述数据资源列表。
在本实施例中,可选的,所述需方节点420,还用于向所述服务器发送携带有所述目标数据资源的资源标识的资源访问请求,使得所述服务器对所述资源访问请求进行安全验证,并在验证通过后建立所述需方节点420与所述目标数据资源对应的数源节点410之间的交易通道,并将所述资源访问请求发送至所述目标数据资源对应的数源节点410;基于所述交易通道接收所述目标数据资源对应的数源节点410发送的数据资源包,所述数据资源包中包括所述目标数据资源。
在本实施例中,可选的,所述需方节点420,还用于从第二本地存储资源中确定所述目标数据资源的关联数据资源;基于所述交易通道,向所述目标数据资源对应的数源节点410发送所述目标数据资源的关联数据资源。
本公开提供的数据交易***,可执行上述方法实施例,其具体实现原理和技术效果,可参见上述方法实施例,本公开此处不再赘述。
本申请实施例还提供了一种计算机设备。计算机设备可为需方节点或数源节点对应的设备。具体请参阅图5,图5为本实施例计算机设备基本结构框图。
计算机设备包括通过***总线相互通信连接存储器510和处理器520。需要指出的是,图中仅示出了具有组件510-520的计算机设备,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程门阵列(Field-ProgrammableGate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
存储器510至少包括一种类型的可读存储介质,可读存储介质包括非易失性存储器(non-volatile memory)或易失性存储器,例如,闪存(flash memory)、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(random accessmemory,RAM)、只读存储器(read-only memory,ROM)、可擦写可编程只读存储器(erasableprogrammableread-only memory,EPROM)、电可擦写可编程只读存储器(electrically erasableprogrammable read-only memory,EEPROM)、可编程只读存储器(programmable read-onlymemory,PROM)、磁性存储器、磁盘、光盘等,RAM可以包括静态RAM或动态RAM。在一些实施例中,存储器510可以是计算机设备的内部存储单元,例如,该计算机设备的硬盘或内存。在另一些实施例中,存储器510也可以是计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡或闪存卡(Flash Card)等。当然,存储器510还可以既包括计算机设备的内部存储单元也包括其外部存储设备。本实施例中,存储器510通常用于存储安装于计算机设备的操作***和各类应用软件,例如上述方法的程序代码等。此外,存储器510还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器520通常用于执行计算机设备的总体操作。本实施例中,存储器510用于存储程序代码或指令,程序代码包括计算机操作指令,处理器520用于执行存储器510存储的程序代码或指令或者处理数据,例如运行上述方法的程序代码。
本文中,总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外设部件互连标准(Peripheral Component Interconnect,PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture,EISA)总线等。该总线***可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
本申请的另一实施例还提供一种计算机可读介质,计算机可读介质可以是计算机可读信号介质或者计算机可读介质。计算机中的处理器读取存储在计算机可读介质中的计算机可读程序代码,使得处理器能够执行在上述方法中每个步骤、或各步骤的组合中规定的功能动作;生成实施在框图的每一块、或各块的组合中规定的功能动作的装置。
计算机可读介质包含但不限于电子、磁性、光学、电磁、红外的存储器或半导体***、设备或者装置,或者前述的任意适当组合,存储器用于存储程序代码或指令,程序代码包括计算机操作指令,处理器用于执行存储器存储的上述方法的程序代码或指令。
在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
在本申请各个实施例中的各功能单元或模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。本申请描述的“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了装置若干的单元权利要求中,这些装置中的若干个单元可以是通过同一个硬件项来具体体现。第一、第二、以及第三等的使用不表示任何顺序,可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (9)

1.一种数据交易方法,其特征在于,包括:
数源节点对第一本地存储资源进行分类分级标注,得到具有分类分级信息的标签数据资源,所述数源节点用于描述数据提供方;
所述数源节点基于所述标签数据资源生成数据资源查询接口,并将所述数据资源查询接口上传至服务器中;
需方节点在所述服务器中请求多个所述数源节点,所述需方节点用于描述数据需求方;
所述需方节点基于多个所述数源节点中每个数源节点对应的数据资源查询接口,获取每个所述数源节点对应的标签数据资源,并基于每个所述数源节点对应的标签数据资源确定数据资源列表,所述标签数据资源为能够体现相应数据的一个或多个价值数据,所述需方节点基于每个所述数源节点对应的标签数据资源确定数据资源列表,包括:所述需方节点基于每个所述数源节点对应的标签数据资源的时间信息,对多个所述标签数据资源进行排序,得到初始资源列表;基于预设时间数据,对所述初始资源列表进行数据资源筛选,得到所述数据资源列表;所述预设时间数据为所述需方节点预先设置的一个时间段,使得所述需方节点通过所述一个时间段对所述初始资源列表进行数据资源筛选,得到符合需求的所述数据资源列表;
所述需方节点从所述数据资源列表中确定目标数据资源,以通过所述服务器与所述目标数据资源对应的数源节点进行所述目标数据资源相应的数据交易。
2.根据权利要求1所述的方法,其特征在于,所述数源节点对第一本地存储资源进行分类分级标注,得到具有分类分级信息的标签数据资源,包括:
所述数源节点基于数据信息、数据特征以及隐私保护等级,采用预设匹配算法对所述第一本地存储资源进行分类分级打标,确定所述第一本地存储资源所属的分类分级标签,每个所述分类分级标签对应有标签关键词,所述预设匹配算法包括:基于数据的正则匹配算法、基于数据的关键字匹配算法以及基于特征名称的匹配算法;
所述数源节点向所述服务器发送所述第一本地存储资源所属的分类分级标签以及每个所述分类分级标签对应的标签关键词,使得所述服务器基于每个所述分类分级标签对应的标签关键词对所述第一本地存储资源所属的分类分级标签进行校准核验;
所述数源节点接收所述服务器发送的校准核验结果,并基于所述校准核验结果对所述第一本地存储资源所属的分类分级标签进行修正,得到具有分类分级信息的标签数据资源。
3.根据权利要求2所述的方法,其特征在于,所述数源节点基于数据信息、数据特征以及隐私保护等级,采用预设匹配算法对所述第一本地存储资源进行分类分级打标,确定所述第一本地存储资源所属的分类分级标签,包括:
所述数源节点采用基于数据的正则匹配算法,基于所述数据信息、所述数据特征以及所述隐私保护等级对所述第一本地存储资源进行正则匹配,确定所述第一本地存储资源所属的分类分级标签;
或者,所述数源节点采用基于数据的关键字匹配算法,基于所述数据信息、所述数据特征以及所述隐私保护等级对所述第一本地存储资源进行关键字匹配,确定所述第一本地存储资源所属的分类分级标签;
或者,所述数源节点采用基于特征名称的匹配算法,基于所述数据信息、所述数据特征以及所述隐私保护等级对所述第一本地存储资源进行特征名称匹配,确定所述第一本地存储资源所属的分类分级标签;
或者,所述数源节点采用算法组合规则,基于所述数据信息、所述数据特征以及所述隐私保护等级对所述第一本地存储资源进行相应匹配,确定所述第一本地存储资源所属的分类分级标签,所述算法组合规则用于描述基于数据的正则匹配算法、基于数据的关键字匹配算法以及基于特征名称的匹配算法的部分组合筛选方式;
或者,所述数源节点采用算法互斥规则,基于所述数据信息、所述数据特征以及所述隐私保护等级对所述第一本地存储资源进行相应匹配,确定所述第一本地存储资源所属的分类分级标签,所述算法互斥规则用于描述基于数据的正则匹配算法、基于数据的关键字匹配算法以及基于特征名称的匹配算法的部分互斥筛选方式。
4.根据权利要求2所述的方法,其特征在于,所述需方节点从所述数据资源列表中确定目标数据资源,包括:
所述需方节点匹配对应的本地搜索词与每个所述标签关键词,得到目标检索词,所述本地搜索词是所述需方节点基于检索需求生成的;
所述需方节点采用所述目标检索词对具有分类分级信息的所述标签数据资源进行数据检索,得到所述目标数据资源。
5.根据权利要求1所述的方法,其特征在于,还包括:
所述需方节点向所述服务器发送携带有所述目标数据资源的资源标识的资源访问请求,使得所述服务器对所述资源访问请求进行安全验证,并在验证通过后建立所述需方节点与所述目标数据资源对应的数源节点之间的交易通道,并将所述资源访问请求发送至所述目标数据资源对应的数源节点;
所述需方节点基于所述交易通道接收所述目标数据资源对应的数源节点发送的数据资源包,所述数据资源包中包括所述目标数据资源。
6.根据权利要求5所述的方法,其特征在于,还包括:
所述需方节点从第二本地存储资源中确定所述目标数据资源的关联数据资源;
所述需方节点基于所述交易通道,向所述目标数据资源对应的数源节点发送所述目标数据资源的关联数据资源。
7.一种数据交易***,其特征在于,包括:数源节点和需方节点;
所述数源节点,用于对第一本地存储资源进行分类分级标注,得到具有分类分级信息的标签数据资源,所述数源节点用于描述数据提供方;基于所述标签数据资源生成数据资源查询接口,并将所述数据资源查询接口上传至服务器中;
所述需方节点,用于在所述服务器中请求多个所述数源节点,所述需方节点用于描述数据需求方;基于多个所述数源节点中每个数源节点对应的数据资源查询接口,获取每个所述数源节点对应的标签数据资源,并基于每个所述数源节点对应的标签数据资源确定数据资源列表;从所述数据资源列表中确定目标数据资源,以通过所述服务器与所述目标数据资源对应的数源节点进行所述目标数据资源相应的数据交易,所述标签数据资源为能够体现相应数据的一个或多个价值数据;
其中,所述需方节点,具体用于:
基于每个所述数源节点对应的标签数据资源的时间信息,对多个所述标签数据资源进行排序,得到初始资源列表;基于预设时间数据,对所述初始资源列表进行数据资源筛选,得到所述数据资源列表;所述预设时间数据为所述需方节点预先设置的一个时间段,使得所述需方节点通过所述一个时间段对所述初始资源列表进行数据资源筛选,得到符合需求的所述数据资源列表。
8.根据权利要求7所述的***,其特征在于,所述数源节点,具体用于:
基于数据信息、数据特征以及隐私保护等级,采用预设匹配算法对所述第一本地存储资源进行分类分级打标,确定所述第一本地存储资源所属的分类分级标签,每个所述分类分级标签对应有标签关键词,所述预设匹配算法包括:基于数据的正则匹配算法、基于数据的关键字匹配算法以及基于特征名称的匹配算法;
向所述服务器发送所述第一本地存储资源所属的分类分级标签以及每个所述分类分级标签对应的标签关键词,使得所述服务器基于每个所述分类分级标签对应的标签关键词对所述第一本地存储资源所属的分类分级标签进行校准核验;
接收所述服务器发送的校准核验结果,并基于所述校准核验结果对所述第一本地存储资源所属的分类分级标签进行修正,得到具有分类分级信息的标签数据资源。
9.根据权利要求8所述的***,其特征在于,所述需方节点,具体用于:
匹配对应的本地搜索词与每个所述标签关键词,得到目标检索词,所述本地搜索词是所述需方节点基于检索需求生成的;
采用所述目标检索词对具有分类分级信息的所述标签数据资源进行数据检索,得到所述目标数据资源。
CN202311571243.6A 2023-11-23 2023-11-23 一种数据交易方法和*** Active CN117290401B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311571243.6A CN117290401B (zh) 2023-11-23 2023-11-23 一种数据交易方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311571243.6A CN117290401B (zh) 2023-11-23 2023-11-23 一种数据交易方法和***

Publications (2)

Publication Number Publication Date
CN117290401A CN117290401A (zh) 2023-12-26
CN117290401B true CN117290401B (zh) 2024-03-15

Family

ID=89240986

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311571243.6A Active CN117290401B (zh) 2023-11-23 2023-11-23 一种数据交易方法和***

Country Status (1)

Country Link
CN (1) CN117290401B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9542482B1 (en) * 2012-04-06 2017-01-10 Amazon Technologies Inc. Providing items of interest
CN108076133A (zh) * 2016-11-17 2018-05-25 成都勤智未来科技有限公司 数联网
CN108763389A (zh) * 2018-05-18 2018-11-06 上海数据交易中心有限公司 数据的整合方法及装置、存储介质、终端
CN111400559A (zh) * 2020-03-09 2020-07-10 上海数据交易中心有限公司 数据查询方法及装置、计算机设备和存储介质
CN115168401A (zh) * 2022-07-19 2022-10-11 北京大数据先进技术研究院 数据分级处理方法及装置、电子设备及计算机可读介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9542482B1 (en) * 2012-04-06 2017-01-10 Amazon Technologies Inc. Providing items of interest
CN108076133A (zh) * 2016-11-17 2018-05-25 成都勤智未来科技有限公司 数联网
CN108763389A (zh) * 2018-05-18 2018-11-06 上海数据交易中心有限公司 数据的整合方法及装置、存储介质、终端
CN111400559A (zh) * 2020-03-09 2020-07-10 上海数据交易中心有限公司 数据查询方法及装置、计算机设备和存储介质
CN115168401A (zh) * 2022-07-19 2022-10-11 北京大数据先进技术研究院 数据分级处理方法及装置、电子设备及计算机可读介质

Also Published As

Publication number Publication date
CN117290401A (zh) 2023-12-26

Similar Documents

Publication Publication Date Title
US11243990B2 (en) Dynamic document clustering and keyword extraction
US10599774B1 (en) Evaluating content items based upon semantic similarity of text
US11195099B2 (en) Detecting content items in violation of an online system policy using semantic vectors
CN110929125A (zh) 搜索召回方法、装置、设备及其存储介质
US20210157817A1 (en) Context-aware dynamic content assist
US20040039753A1 (en) Record relationship processing
CN112163207B (zh) 基于动态权限的业务数据查询方法及相关设备
CN112925898B (zh) 基于人工智能的问答方法、装置、服务器及存储介质
US11120064B2 (en) Transliteration of data records for improved data matching
WO2019056496A1 (zh) 图片复审概率区间生成方法及图片复审判定方法
US20230281306A1 (en) System and method for detecting leaked documents on a computer network
CN111368697A (zh) 一种信息识别方法和装置
CN113434672B (zh) 文本类型智能识别方法、装置、设备及介质
CN110910178A (zh) 一种生成广告的方法和装置
CN113177407A (zh) 数据字典的构建方法、装置、计算机设备及存储介质
CN117290401B (zh) 一种数据交易方法和***
CN112612817B (zh) 数据处理方法、装置、终端设备及计算机可读存储介质
CN111695327B (zh) 一种乱码修复方法、装置、电子设备及可读存储介质
CN113064984A (zh) 意图识别方法、装置、电子设备及可读存储介质
CN111816277B (zh) 用户信息管理方法、医疗信息管理***及主信息管理端
CN115392389B (zh) 跨模态信息匹配、处理方法、装置、电子设备及存储介质
US11194841B2 (en) Value classification by contextual classification of similar values in additional documents
US11861384B2 (en) Methods and systems for generating recommendations based on explainable decision trees for users of a software application
CN111882293B (zh) 应用软件签审方法、装置、计算机设备和存储介质
CN112905191B (zh) 数据处理方法、装置、计算机可读存储介质和计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant