CN114254212A - 基于区块链的地址检索方法、***、电子设备及存储介质 - Google Patents
基于区块链的地址检索方法、***、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114254212A CN114254212A CN202111561736.2A CN202111561736A CN114254212A CN 114254212 A CN114254212 A CN 114254212A CN 202111561736 A CN202111561736 A CN 202111561736A CN 114254212 A CN114254212 A CN 114254212A
- Authority
- CN
- China
- Prior art keywords
- address
- keyword
- user
- retrieval
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 239000013598 vector Substances 0.000 claims abstract description 182
- 238000012795 verification Methods 0.000 claims abstract description 43
- 230000006870 function Effects 0.000 claims description 37
- 238000012216 screening Methods 0.000 claims description 24
- 230000011218 segmentation Effects 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 claims description 8
- 238000002372 labelling Methods 0.000 claims description 8
- 238000013524 data verification Methods 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 239000000126 substance Substances 0.000 claims 1
- 238000005406 washing Methods 0.000 claims 1
- 238000004364 calculation method Methods 0.000 abstract description 10
- 238000013473 artificial intelligence Methods 0.000 abstract description 6
- 230000000694 effects Effects 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 238000013500 data storage Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000013475 authorization Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9532—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Bioethics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及人工智能,提供一种基于区块链的地址检索方法、***、电子设备以及存储介质,通过利用用户身份密钥的加密数据进行用户身份密钥验证;以及利用用户搜索密钥的加密数据进行用户搜索密钥验证;进而通过智能地址识别模型在用户搜索密钥对应的预先获取的用户感兴趣的关键字数据集合中,利用地址检索文本将筛选获得的符合预设规则的关键字向量组合作为最佳关键字向量组合;将最佳关键字向量组合解码为输出地址文本,并返回给用户。本发明通过区块链增加地址解析模型安全性以及通过增加用户搜索密钥,缩小检索范围,实现计算开销的节约,达到提升地址解析效率的技术效果。
Description
技术领域
本发明涉及人工智能技术领域,涉及一种基于区块链的地址检索方法、***、电子设备及存储介质。
背景技术
现有的信息检索***,一般会分成检索部分和排序部分;而地址信息检索***一般是基于先搜索后排序(retrieve-than-rank)的范式,这种检索方法虽然给用户提供了大量的潜在选项。但是具有如下弊端:
1)大量的潜在选项给用户带来了较大的筛选负担;尤其是对于地址类待检索信息,往往需要按照地址内容以及地址格式输入检索关键词,并需要对关键词顺序进行反复调整,才能得到准确的检索结果;
2)计算开销较大,安全性有待提高。
因此,亟需一种精准有效地提供地址类检索关键词的地址检索方法。
发明内容
本发明提供一种基于区块链的地址检索方法、***、电子设备及计算机可读存储介质,用于解决现有技术中无法安全、精准地提供地址类检索关键词的问题。
为实现上述目的,本发明提供的一种基于区块链的地址检索方法,方法包括:
获取用户信息,所述用户信息包括用户身份密钥的加密数据和用户搜索密钥的加密数据;
利用用户身份密钥的加密数据进行用户身份密钥验证;
若所述用户身份密钥验证通过,则通过分布式应用界面获取用户请求检索的地址检索文本;
利用所述用户搜索密钥的加密数据,对所述地址检索文本进行搜索密钥验证;
若所述搜索密钥验证通过,则通过预设的智能地址识别模型在所述用户搜索密钥对应的预先获取的用户感兴趣的关键字数据集合中,利用所述地址检索文本获得关键字特征向量;
对所述关键字特征向量进行筛选,将筛选获得的符合预设规则的关键字向量组合作为最佳关键字向量组合;
将所述最佳关键字向量组合解码为输出地址文本,并返回给用户。
进一步,优选的,所述预先获取用户感兴趣的关键字数据集合的方法,包括:
获取用户的地址信息数据集;
将所述地址信息数据集通过智能地址识别模型形成关键字特征向量;
对所述关键字特征向量进行EFKS加密生成密文关键字特征向量;
将密文关键字特征向量上传至基于区块链的分布式地址信息检索模型的存储***内,形成用户感兴趣的关键字数据集合。
进一步,优选的,通过智能地址识别模型在所述用户搜索密钥对应的预先获取的用户感兴趣的关键字数据集合中,利用所述地址检索文本获得关键字特征向量,方法包括:
将所述地址检索文本进行分词预处理,获得标准的地址字符;
将所获得的标准地址字符经过编码器计算,获得查询向量集合;通过用户搜索密钥的加密数据验证,获得查询向量集合与用户感兴趣的关键字数据集合的交集作为检索向量集合;
对所述查询向量集合和检索向量集合进行笛卡尔积获得关键字向量集合,对所述关键字向量集合中的每两个关键字向量进行计算欧式距离;
筛选所述检索向量集合和查询向量集合中欧式距离小于设定阈值的关键字向量;
将检索向量集合和查询向量集合中欧式距离小于设定阈值的关键字向量组成最佳关键字向量组合。
进一步,优选的,所述分词预处理包括清洗和标准化处理;其中,所述清洗通过随机掩码技术进行,所述标准化处理包括将所述地址检索文本按照行政区、关键信息和信息点进行分类。
进一步,优选的,所述分词预处理通过预训练的基于BERT的地址识别模型实现;其中,所述基于BERT的地址识别模型的训练方法,包括:
采用BERT作为编码器模型;
根据样本地址以及样本地址分词,对编码器模型中的分词功能进行训练;
根据样本地址分词以及每个样本分词对应的地址等级,对编码器模型中的序列标注功能进行训练;
获得具有分词功能和序列标注功能的基于BERT的地址识别模型。
进一步,优选的,通过智能地址识别模型在所述用户搜索密钥对应的预先获取的用户感兴趣的关键字数据集合中,利用所述地址检索文本获得关键字特征向量,方法包括:
将所述地址检索文本进行分词预处理,获得标准的地址字符;
将所获得的标准地址字符经过编码器计算,获得查询向量集合;通过用户搜索密钥的加密数据验证,获得查询向量集合与用户感兴趣的关键字数据集合的交集作为检索向量集合;
对所述查询向量集合和检索向量集合进行笛卡尔积获得关键字向量集合,对所述关键字向量集合中的每两个关键字向量分别进行计算经纬度欧式距离、莱文斯坦距离和特征向量欧式距离;
通过经纬度欧式距离、莱文斯坦距离和特征向量欧式距离构建目标函数;通过所述目标函数筛选相似度符合设定阈值的关键字向量组成最佳关键字向量组合。
进一步,优选的,所述目标函数通过公式获得:
其中,L为目标函数,Lev(xid1,xid1′)表示两个关键字向量的莱温斯坦距离,a表示莱温斯坦距离的权重,Lrgd(xid1,xid2)表示两个关键字向量的经纬度欧式距离,Lved(xid1,xid2)表示两个关键字向量的特征向量欧式距离,b表示经纬度欧式距离Lrgd和特征向量欧式距离Lved的均方误差的权重,batch_size为每个批次的数据条数。
为了解决上述问题,本发明还提供一种基于区块链的地址检索***,所述***包括:
用户信息获取单元,用于获取用户信息,所述用户信息包括用户身份密钥的加密数据和用户搜索密钥的加密数据;
身份密钥验证单元,用于利用用户身份密钥的加密数据进行用户身份密钥验证;
搜索密钥验证单元,用于若所述用户身份密钥验证通过,则通过分布式应用界面获取用户请求检索的地址检索文本;利用所述用户搜索密钥的加密数据,对所述地址检索文本进行搜索密钥验证;
关键字向量组合获取单元,用于若所述搜索密钥验证通过,则通过预设的智能地址识别模型在所述用户搜索密钥对应的预先获取的用户感兴趣的关键字数据集合中,利用所述地址检索文本获得关键字特征向量;对所述关键字特征向量进行筛选,将筛选获得的符合预设规则的关键字向量组合作为最佳关键字向量组合;
输出单元,用于将所述最佳关键字向量组合解码为输出地址文本,并返回给用户。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现上述所述的基于区块链的地址检索方法中的步骤。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的基于区块链的地址检索方法。
本发明的基于区块链的地址检索方法、***、电子设备及存储介质,通过获取用户信息,所述用户信息包括用户身份密钥的加密数据和用户搜索密钥的加密数据;利用用户身份密钥的加密数据进行用户身份密钥验证;若所述用户身份密钥验证通过,则通过分布式应用界面获取用户请求检索的地址检索文本;利用所述用户搜索密钥的加密数据,对所述地址检索文本进行搜索密钥验证;若所述搜索密钥验证通过,则通过预设的智能地址识别模型在所述用户搜索密钥对应的预先获取的用户感兴趣的关键字数据集合中,利用所述地址检索文本获得关键字特征向量;对所述关键字特征向量进行筛选,将筛选获得的符合预设规则的关键字向量组合作为最佳关键字向量组合;将所述最佳关键字向量组合解码为输出地址文本,并返回给用户;本发明通过区块链增加地址解析模型安全性以及通过增加搜索密钥,缩小检索范围,实现计算开销的节约,进而提升解析效率;并且无需变现有信息检索***的检索和排序方法,具有应用成本较低的技术效果。
附图说明
图1为本发明一实施例提供的基于区块链的地址检索方法的流程示意图;
图2为本发明一实施例提供的基于区块链的地址检索***的模块示意图;
图3为本发明一实施例提供的实现基于区块链的地址检索方法的电子设备的内部结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
现有技术中,由于地址的关键字段含义可能存在多义性,例如输入“南山区”,深圳和鹤岗市都有这个行政区划,因此没有办法基于地址检索***本身来进行优化解决。另外,关键字段的输入往往存在一定的语义的模糊性,(比如说客户输入南三,但是实际上指代的是南山),这给传统的信息检索(搜索-排序)的范式带来巨大挑战。
本发明的基于区块链的地址检索方法的通过智能地址识别模型进行地址解析,无需对关键词顺序进行反复调整,即可提供较为精准,少量的地址选项,从而提高解析效率和准确性;另外,通过区块链增加地址解析模型安全性以及通过增加搜索密钥,缩小检索范围,实现计算开销的节约,进而提升解析效率。达到了无需变现有信息检索***的检索和排序方法,应用成本较低的技术效果。解决了由于开发信息检索***所需的知识库与预设的检索和排序方法具有强耦合性,导致改变现有信息检索***的检索和排序方法的成本较高,灵活性差的技术问题。
参照图1所示,为本发明一实施例提供的基于区块链的地址检索方法的流程示意图。该方法可以由一个***执行,该***可以由软件和/或硬件实现,尤其适用于具有一定语义的模糊性的地址检索场景中。
在本实施例中,基于区块链的地址检索方法包括S110~S150:
S110、获取用户信息,所述用户信息包括用户身份密钥的加密数据和用户搜索密钥的加密数据。
需要说明的是,本实施例的用户的信息的获取方法的执行主体可为具有数据信息处理能力的硬件设备和/或驱动该硬件设备工作所需的必要软件。可选地,执行主体可包括工作站、服务器,计算机、用户终端及其他智能设备。其中,用户终端包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端等。
服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
需要说明的是,所述用户身份密钥和用户搜索密钥均是通过数据拥有者进行上传并授权的。其中,对于同一个区块链***中的所有节点来说,存储在区块链上的交易信息是公开的,那么为了保证交易的安全性,需要对账户身份信息进行高度加密,只有在数据拥有者授权的情况下才能访问到。在这个过程中,通常采用非对称加密技术来实现用户身份信息的认证。而所述基于区块链的地址检索方法是应用于基于区块链的分布式地址信息检索模型;分布式地址信息检索模型是人工智能检索模型与区块链交互形成;分布式地址信息检索模型是区块链数据存储***,整个***的交互以及存储***具有功能包括分布式的加密数据存储***匿名访问控制以及地址信息的关键字搜索。其中,前两者的实现基础是区块链。是基于区块链的常规功能,具体的实现方式,在此不做赘述。以解决现有的地址信息检索的过程中,计算开销大以及安全性有待提高的问题。
S120、利用用户身份密钥的加密数据进行用户身份密钥验证。
具体地说,用户身份密钥就是用于验证用户身份的密码***密钥,实现将加密的元数据存储在区块链中,仅仅允许授权的客户通过区块链进行搜索。
S130、若所述用户身份密钥验证通过,则通过分布式应用界面获取用户请求检索的地址检索文本;利用所述用户搜索密钥的加密数据,对所述地址检索文本进行搜索密钥验证。其中,数据使用者的用户身份密钥和用户搜索密钥均为数据拥有者发送的。举例来说,输入的地址检索文本为:上海浦东新区陆家嘴东方明珠。
用户搜索密钥通过密钥衍生算法生成搜索密钥,是用于实现数据使用者仅仅识别其感兴趣的特定的加密数据,而无需对整个数据集进行搜索。
在现有技术中,关键字搜索方法由四个通用方法组成1)密钥生成方法,生成密码***密钥2)暗门方法,为关键字生成对应的暗门;3)加密方法,为关键字生成EFKS密文4)测试方法,测试关键字是否与EFKS文本匹配。
在一个具体的实施例中,为了确保客户仅仅搜索他感兴趣的部分,利用一个额外的算法密钥衍生为数据使用者生成一个秘密搜索密钥以及秘密搜索密钥对应的用户感兴趣的关键字数据集合。所述预先获取用户感兴趣的关键字数据集合的方法,包括:S131、获取用户的地址信息数据集;S132、将所述地址信息数据集通过智能地址识别模型形成关键字特征向量;S133、数据拥有者对所述关键字特征向量进行EFKS加密生成密文关键字特征向量;S134、将密文关键字特征向量上传至基于区块链的分布式地址信息检索模型的存储***内,形成用户感兴趣的关键字数据集合。
也就是说,数据所有者在存储数据时,为用户感兴趣的关键字数据集合中的关键字生成密钥,并进行EFKS加密;派送用数据使用者的搜索密钥;数据使用者获得数据拥有者的假名映射生成的秘密字段,所述秘密字段属于用户感兴趣的关键字数据集合;用户根据秘密字段和所述用户感兴趣的关键字数据集合生成搜索密钥。
在具体的实施过程中,设定H:{0,1}*→G1和H2:GT×GT→{0,1}*,这里的G1,GT表示的是两个素数阶的群,命名G2也是两个素数阶的群,G1,G2,Gt是这三个群的生成子。则上述方法可以改写成以下伪代码:密钥生成:k←Zp;密钥衍生K(k,s):ks←gk/s;暗门T(w,s):Tw←e(H(w)s,ks);加密:E(k,w):Random r←GT,输出:c=(r,H2(r,e(H(w),gw)k);测试:解析c=(r,h),符合以下条件时H2(r,tk)=h测试;也就是说,数据所有者为关键字生成密钥k,并进行EFKS加密,并派送数据使用者的搜索密钥,数据使用者获得一个秘密字段s,属于Zp这个集合,s由数据拥有者的假名映射生成所得,基于k和s,数据拥有者可以快速计算出一个搜索密钥ks,用于后续构建暗门。具体地说,关键字加密的过程包括:首先定义EFKS为支持模糊关键字搜索(Encrypted Fuzzy Keyword Search,EFKS)的加密方案,在存储时数据所有者想访问密钥附加上每个关键字的EFKS密文列表,比如关键字为W1,…Wn对应文档在区块链下的结构为H(F)||(EFKS(W1))||…||EFKS(Wn)||,这里的H(F)表示的是上述分布式加密数据存储***H表示分布式哈希表,F表示某一份文本,这里是常规操作,不做赘述。
S140、若所述搜索密钥验证通过,则通过预设的智能地址识别模型在所述用户搜索密钥对应的预先获取的用户感兴趣的关键字数据集合中,利用所述地址检索文本获得关键字特征向量;对所述关键字特征向量进行筛选,获得符合预设规则的关键字向量组合作为最佳关键字向量组合。
也就是说,利用智能地址识别模型完成对地址信息的检索。而智能地址识别模型是将关键字文本映射为关键字特征向量,相似的文本表述会通过编码器映射为相应的关键字特征向量,进而存储至区块链节点中。
在一个具体的实施例中,通过智能地址识别模型在所述用户搜索密钥对应的预先获取的用户感兴趣的关键字数据集合中,利用所述地址检索文本获得关键字特征向量,方法包括:
S1411、将所述地址检索文本进行分词预处理,获得标准的地址字符;所述分词预处理包括清洗和标准化处理;其中,所述清洗通过随机掩码技术进行,所述标准化处理包括将所述地址检索文本按照行政区、关键信息和信息点进行分类。标准化处理中可以包括地址等级划分,其中,地址等级可以但不限制于按行政区域等级进行划分。地址分词对应的地址等级可以包括省、市、区、街道办事处、社区、居委会、乡镇、自然村、-级道路、二级道路、门牌号、级小区、二级小区、建筑物、单元、建筑楼栋、楼层、户室号和其它地址名词中的至少一项。标准地址可以是公安部门牌地址数据标准的地址。标准地址从逻辑上可以分为三部分,即行政区、关键信息、信息点(Point of Interesting,P0I)。在分词预处理环节,采用随机掩码技术(Random Mask)随机去掉训练数据文本中的若干个字,以提高模型对用户多种地址表述的兼容性。
S1412、将所获得的标准地址字符经过编码器计算,获得查询向量集合;通过用户搜索密钥的加密数据验证,获得查询向量集合与用户感兴趣的关键字数据集合的交集作为检索向量集合;
S1413、对所述查询向量集合和检索向量集合进行笛卡尔积获得关键字向量集合,对所述关键字向量集合中的每两个关键字向量进行计算欧式距离。
两个集合X和Y的笛卡尓积(Cartesian product),又称直积,表示为X×Y,第一个对象是X的成员而第二个对象是Y的所有可能有序对的其中一个成员。假设集合A={a,b},集合B={0,1,2},则两个集合的笛卡尔积为{(a,0),(a,1),(a,2),(b,0),(b,1),(b,2)}。具体地说,客户输入地址文本xq,经编码器M计算得到查询向量集合{C1,C2,…,Cq}。通过检索获取特定加密数据得到检索向量集合{C1,C2,…,Cd}。对查询向量集合和检索向量集合做笛卡尔积,并计算欧式距离。筛选检索向量集合和查询向量集合中欧式距离小于阈值β的关键字向量,得到最符合要求的地址特征向量组合{C1,C2,…,Ce}。利用解码器D的特性,将特征向量解码为输出地址文本xout。
{C1,C2,…,Ce}=M(xq)
{C1,C2,…,Ce}=Threshold(Distance({C1,C2,…,Ca},{C1,C2,…,Cd}))
xout=D({C1,C2,…,Ce})
对所述查询向量集合和检索向量集合进行两个字符串的莱文斯坦距离计算,也就是差异化程度的量化测量。
设字符串a,b的莱温斯坦距离为lev(a,b),则计算步骤如下:
设m,n为a,b的字符串长度,如果min(m,n)=0,则lev(a,b)=max(m,n)
如果min(m,n)>0,则
其中,leva,b(i,j)表示a的前i个字符和b的前j个字符间的莱温斯坦距离。
S1414、筛选所述检索向量集合和查询向量集合中欧式距离小于设定阈值的关键字向量。
具体地说,假设有以下地址:A市C路的经纬度为21,30;B市D大道的经纬度为23,32;则经纬度的欧式距离Lrgd=(23-21)^2+(30-32)^2=8。模型优化的目标是希望通过训练,让地址1和地址2输出的特征向量c1和c2的欧式距离Lved逐步接近8。其中,设定阈值根据实际应用场景中的具体要求设定,在本实施例中,设定阈值为8。
S1415、将检索向量集合和查询向量集合中欧式距离小于设定阈值的关键字向量组成最佳关键字向量组合。
举个例子,假设待输入的地址信息文本为“岱岳区泰安市岱岳区粥店街道办事处驾院社98号5单元9层”,关键地址分词是“粥店街道办事处”和“98号”,利用基于区块链的地址检索模型,候选地址包括以下三种:候选地址1:山东省泰安市岱岳区泰山大街398号粥店街道办事处1单元8层;候选地址2:山东省泰安市岱岳区泰山大街398号粥店街道办事处2单元3层;候选地址3:山东省泰安市岱岳区泰山大街398号粥店街道办事处5单元9层。通过计算,候选地址3与输入地址之间的欧式距离最小,因此,可以将候选地址3确定为目标地址。
在另一个具体的实施例中,通过智能地址识别模型在所述用户搜索密钥对应的预先获取的用户感兴趣的关键字数据集合中,利用所述地址检索文本获得关键字特征向量,方法包括:
S1421、将所述地址检索文本进行分词预处理,获得标准的地址字符。
其中,所述分词预处理通过预训练的基于BERT的地址识别模型实现;其中,所述基于BERT的地址识别模型的训练方法,包括:采用BERT作为编码器模型;根据样本地址以及样本地址分词,对编码器模型中的分词功能进行训练;根据样本地址分词以及每个样本分词对应的地址等级,对编码器模型中的序列标注功能进行训练;获得具有分词功能和序列标注功能的基于BERT的地址识别模型。
需要说明的是,智能地址识别模型的具体实现方式可以但不限制为基于变换器的双向编码器,自编码器(Autoencoder)是一种无监督学习方法,通过尝试从编码重新生成输入来验证和改进编码。自编码器通过训练网络忽略无关紧要的数据来学习一组数据的表示,通常用于降维。本提案采用了基于变换器的双向编码器表示技术(BidirectionalEncoder Representations from Transformers,BERT)作为编码器模型。BERT起源于预训练的上下文表示学习,是一种深度双向的、无监督的语言表示。一经推出即在GLUE、SQuAD、SWAG等自然语言理解任务上取得了卓越表现。如果采用BERT作为编码器模型,首次使用BERT处理地址信息检索,大大提高了目标地址信息的准确率。采用BERT作为编码器模型具体的训练过程如下:根据样本地址以及样本地址分词,对BERT模型中的分词功能进行训练;以及,根据样本地址分词以及每个样本分词对应的地址等级,对BERT模型中的序列标注功能进行训练;进而,根据训练后的BERT模型中分词功能和训练后的BERT模型中序列标注功能,得到预设的地址识别模型。
具体来说,智能地址识别模型的标准输出结果的数据集可以来源于各行各业的地址数据库,例如可以来源于快递行业的地址数据库,或者也可以来源于城市交通行业的地址数据库,具体不做限定。标准地址可以是公安部门牌地址数据标准的地址。
S1422、将所获得的标准地址字符经过编码器计算,获得查询向量集合;通过用户搜索密钥的加密数据验证,获得查询向量集合与用户感兴趣的关键字数据集合的交集作为检索向量集合;
S1423、对所述查询向量集合和检索向量集合进行笛卡尔积获得关键字向量集合,对所述关键字向量集合中的每两个关键字向量分别进行计算经纬度欧式距离、莱文斯坦距离和特征向量欧式距离。
在具体的实施过程中,作为本实施例的改进,针对地址信息,经纬度的差异也能很好地反映目标地址之间的差异。因此经度(longitude,lng)、纬度(latitude,lat)欧式距离(Lrgd)接近的两个输入文本(x1,x2)对应的n维地址特征向量c(c1,c2)也有接近的欧式距离(Lved),即训练过程中让Lrgd和Lved的均方误差尽可能小。公式如下:
Lrgd(x1,x2)=(latx1-latx2)2+(lngx1-lngx2)2
S1424、通过经纬度欧式距离、莱文斯坦距离和特征向量欧式距离构建目标函数;所述目标函数通过公式获得:
其中,L为目标函数,Lev(xid1,xid1′)表示两个关键字向量的莱温斯坦距离,a表示莱温斯坦距离的权重,Lrgd(xid1,xid2)表示两个关键字向量的经纬度欧式距离,Lved(xid1,xid2)表示两个关键字向量的特征向量欧式距离,b表示经纬度欧式距离Lrgd和特征向量欧式距离Lved的均方误差的权重,batch_size为每个批次的数据条数。
S1425、通过所述目标函数筛选相似度符合设定阈值的关键字向量组成最佳关键字向量组合。
S150、将所述最佳关键字向量组合解码为输出地址文本,并返回给用户。
在具体的实施过程中,利用解码器实现最佳关键字向量组合解码为输出地址文本。具体地说,编码器可以但不限制为:多头注意力机制、残差连接、归一化和前馈网络;所述解码器可以但不限制为:程序注意力机制、功能注意力机制和前馈网络。
仍然以输入的地址检索文本为例:上海浦东新区陆家嘴东方明珠,通过地址解析模型之后,得到的建筑物名:东方明珠,则对所述地址信息进行清理,获得输出的地址文本信息为上海浦东新区世纪大道1号。
总之,利用本发明的基于区块链的地址检索方法,通过区块链增加地址解析模型安全性以及通过增加搜索密钥,缩小检索范围,进而提升地址解析效率;另外,通过采用区块链技术安全地获取客户的特定加密数据,达到提升地址解析的安全性和降低计算开销的技术效果。
如图2所示,本发明提供一种基于区块链的地址检索***200,本发明可以安装于电子设备中。根据实现的功能,该基于区块链的地址检索***200可以包括用户信息获取单元210、身份密钥验证单元220、搜索密钥验证单元230、关键字向量组合获取单元240以及输出单元250。本发明所述单元也可以称之为模块,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
用户信息获取单元210,用于获取用户信息,所述用户信息包括用户身份密钥的加密数据和用户搜索密钥的加密数据。
身份密钥验证单元220,用于利用用户身份密钥的加密数据进行用户身份密钥验证。
搜索密钥验证单元230,用于若所述用户身份密钥验证通过,则通过分布式应用界面获取用户请求检索的地址检索文本;利用所述用户搜索密钥的加密数据,对所述地址检索文本进行搜索密钥验证。
关键字向量组合获取单元240,用于若所述搜索密钥验证通过,则通过预设的智能地址识别模型在所述用户搜索密钥对应的预先获取的用户感兴趣的关键字数据集合中,利用所述地址检索文本获得关键字特征向量;对所述关键字特征向量进行筛选,获得符合预设规则的关键字向量组合作为最佳关键字向量组合。
输出单元250,用于将所述最佳关键字向量组合解码为输出地址文本,并返回给用户。
本发明的基于区块链的地址检索***200是通过区块链增加地址解析模型安全性以及通过增加搜索密钥,缩小检索范围,进而提升地址解析效率;另外,通过采用区块链技术安全地获取客户的特定加密数据,达到提升地址解析的安全性和降低计算开销的技术效果。
如图3所示,本发明提供一种基于区块链的地址检索方法的电子设备3。
该电子设备3可以包括处理器30、存储器31和总线,还可以包括存储在存储器31中并可在所述处理器30上运行的计算机程序,如基于区块链的地址检索程序32。存储器31还可以既包括人工智能的基于区块链的地址检索***的内部存储单元也包括外部存储设备。存储器31不仅可以用于存储安装于人工智能辅助装置的应用软件及各类数据,例如人工智能辅助程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
其中,所述存储器31至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器31在一些实施例中可以是电子设备3的内部存储单元,例如该电子设备3的移动硬盘。所述存储器31在另一些实施例中也可以是电子设备3的外部存储设备,例如电子设备3上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器31还可以既包括电子设备3的内部存储单元也包括外部存储设备。所述存储器31不仅可以用于存储安装于电子设备3的应用软件及各类数据,例如基于区块链的地址检索程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器30在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器30是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块(例如基于区块链的地址检索程序等),以及调用存储在所述存储器31内的数据,以执行电子设备3的各种功能和处理数据。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器31以及至少一个处理器30等之间的连接通信。
图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备3的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备3还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理***与所述至少一个处理器30逻辑相连,从而通过电源管理***实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电***、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备3还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备3与其他电子设备之间建立通信连接。
可选地,该电子设备3还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备3中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备3中的所述存储器31存储的基于区块链的地址检索程序32是多个指令的组合,在所述处理器30中运行时,可以实现:获取用户信息,所述用户信息包括用户身份密钥的加密数据和用户搜索密钥的加密数据;利用用户身份密钥的加密数据进行用户身份密钥验证;若所述用户身份密钥验证通过,则通过分布式应用界面获取用户请求检索的地址检索文本;利用所述用户搜索密钥的加密数据,对所述地址检索文本进行搜索密钥验证;若所述搜索密钥验证通过,则通过预设的智能地址识别模型在所述用户搜索密钥对应的预先获取的用户感兴趣的关键字数据集合中,利用所述地址检索文本获得关键字特征向量;对所述关键字特征向量进行筛选,将筛选获得的符合预设规则的关键字向量组合作为最佳关键字向量组合;将所述最佳关键字向量组合解码为输出地址文本,并返回给用户。
具体地,所述处理器30对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。需要强调的是,为进一步保证上述基于区块链的地址检索程序的私密和安全性,上述数据库高可用处理数据存储于本服务器集群所处区块链的节点中。
进一步地,所述电子设备3集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或***、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明实施例还提供一种计算机可读存储介质,所述存储介质可以是非易失性的,也可以是易失性的,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现:获取用户信息,所述用户信息包括用户身份密钥的加密数据和用户搜索密钥的加密数据;利用用户身份密钥的加密数据进行用户身份密钥验证;若所述用户身份密钥验证通过,则通过分布式应用界面获取用户请求检索的地址检索文本;利用所述用户搜索密钥的加密数据,对所述地址检索文本进行搜索密钥验证;若所述搜索密钥验证通过,则通过预设的智能地址识别模型在所述用户搜索密钥对应的预先获取的用户感兴趣的关键字数据集合中,利用所述地址检索文本获得关键字特征向量;对所述关键字特征向量进行筛选,将筛选获得的符合预设规则的关键字向量组合作为最佳关键字向量组合;将所述最佳关键字向量组合解码为输出地址文本,并返回给用户。
具体地,所述计算机程序被处理器执行时具体实现方法可参考实施例基于区块链的地址检索方法中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,***和方法,可以通过其它的方式实现。例如,以上所描述的***实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。***权利要求中陈述的多个单元或***也可以由一个单元或***通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种基于区块链的地址检索方法,其特征在于,方法包括:
利用区块链平台获取用户信息,所述用户信息包括用户身份密钥的加密数据和用户搜索密钥的加密数据;
利用所述用户身份密钥的加密数据进行用户身份密钥验证;
若所述用户身份密钥验证通过,则通过分布式应用界面获取用户请求检索的地址检索文本;
利用所述用户搜索密钥的加密数据,对所述地址检索文本进行搜索密钥验证;
若所述搜索密钥验证通过,则通过预设的智能地址识别模型在所述用户搜索密钥对应的预先获取的用户感兴趣的关键字数据集合中,利用所述地址检索文本获得关键字特征向量;
对所述关键字特征向量进行筛选,将筛选获得的符合预设规则的关键字向量组合作为最佳关键字向量组合;
将所述最佳关键字向量组合解码为输出地址文本,并返回给用户。
2.如权利要求1所述的基于区块链的地址检索方法,其特征在于,所述预先获取用户感兴趣的关键字数据集合,包括:
获取用户的地址信息数据集;
将所述地址信息数据集通过智能地址识别模型形成关键字特征向量;
对所述关键字特征向量进行EFKS加密生成密文关键字特征向量;
将密文关键字特征向量上传至基于区块链的分布式地址信息检索模型的存储***内,形成用户感兴趣的关键字数据集合。
3.如权利要求1所述的基于区块链的地址检索方法,其特征在于,通过智能地址识别模型在所述用户搜索密钥对应的预先获取的用户感兴趣的关键字数据集合中,利用所述地址检索文本获得关键字特征向量,方法包括:
将所述地址检索文本进行分词预处理,获得标准的地址字符;
将所获得的标准地址字符经过编码器计算,获得查询向量集合;通过用户搜索密钥的加密数据验证,获得查询向量集合与用户感兴趣的关键字数据集合的交集作为检索向量集合;
对所述查询向量集合和检索向量集合进行笛卡尔积获得关键字向量集合,对所述关键字向量集合中的每两个关键字向量进行计算欧式距离;
筛选所述检索向量集合和查询向量集合中欧式距离小于设定阈值的关键字向量;
将检索向量集合和查询向量集合中欧式距离小于设定阈值的关键字向量组成最佳关键字向量组合。
4.如权利要求3所述的基于区块链的地址检索方法,其特征在于,所述分词预处理包括清洗和标准化处理;其中,所述清洗通过随机掩码技术进行,所述标准化处理包括将所述地址检索文本按照行政区、关键信息和信息点进行分类。
5.如权利要求3所述的基于区块链的地址检索方法,其特征在于,所述分词预处理通过预训练的基于BERT的地址识别模型实现;其中,所述基于BERT的地址识别模型的训练方法,包括:
采用BERT作为编码器模型;
根据样本地址以及样本地址分词,对编码器模型中的分词功能进行训练;
根据样本地址分词以及每个样本分词对应的地址等级,对编码器模型中的序列标注功能进行训练;
获得具有分词功能和序列标注功能的基于BERT的地址识别模型。
6.如权利要求1所述的基于区块链的地址检索方法,其特征在于,通过智能地址识别模型在所述用户搜索密钥对应的预先获取的用户感兴趣的关键字数据集合中,利用所述地址检索文本获得关键字特征向量,方法包括:
将所述地址检索文本进行分词预处理,获得标准的地址字符;
将所获得的标准地址字符经过编码器计算,获得查询向量集合;通过用户搜索密钥的加密数据验证,获得查询向量集合与用户感兴趣的关键字数据集合的交集作为检索向量集合;
对所述查询向量集合和检索向量集合进行笛卡尔积获得关键字向量集合,对所述关键字向量集合中的每两个关键字向量分别进行计算经纬度欧式距离、莱文斯坦距离和特征向量欧式距离;
通过经纬度欧式距离、莱文斯坦距离和特征向量欧式距离构建目标函数;通过所述目标函数筛选相似度符合设定阈值的关键字向量组成最佳关键字向量组合。
8.一种基于区块链的地址检索***,其特征在于,所述***包括:
用户信息获取单元,用于获取用户信息,所述用户信息包括用户身份密钥的加密数据和用户搜索密钥的加密数据;
身份密钥验证单元,用于利用用户身份密钥的加密数据进行用户身份密钥验证;
搜索密钥验证单元,用于若所述用户身份密钥验证通过,则通过分布式应用界面获取用户请求检索的地址检索文本;利用所述用户搜索密钥的加密数据,对所述地址检索文本进行搜索密钥验证;
关键字向量组合获取单元,用于若所述搜索密钥验证通过,则通过预设的智能地址识别模型在所述用户搜索密钥对应的预先获取的用户感兴趣的关键字数据集合中,利用所述地址检索文本获得关键字特征向量;对所述关键字特征向量进行筛选,将筛选获得的符合预设规则的关键字向量组合作为最佳关键字向量组合;
输出单元,用于将所述最佳关键字向量组合解码为输出地址文本,并返回给用户。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一所述的基于区块链的地址检索方法中的步骤。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一所述的基于区块链的地址检索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111561736.2A CN114254212A (zh) | 2021-12-20 | 2021-12-20 | 基于区块链的地址检索方法、***、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111561736.2A CN114254212A (zh) | 2021-12-20 | 2021-12-20 | 基于区块链的地址检索方法、***、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114254212A true CN114254212A (zh) | 2022-03-29 |
Family
ID=80793108
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111561736.2A Pending CN114254212A (zh) | 2021-12-20 | 2021-12-20 | 基于区块链的地址检索方法、***、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114254212A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130024144A (ko) * | 2011-08-30 | 2013-03-08 | 고려대학교 산학협력단 | 프라이버시를 보장하는 가중치 기반의 키워드 검색을 위한 방법 및 장치 |
CN106227833A (zh) * | 2016-07-26 | 2016-12-14 | 宁圣金融信息服务(上海)有限公司 | 区块链搜索引擎方法、***和装置 |
CN109145079A (zh) * | 2018-07-24 | 2019-01-04 | 南京邮电大学 | 基于个人兴趣用户模型的云端可搜索加密方法 |
CN112732789A (zh) * | 2021-01-12 | 2021-04-30 | 宁波云麟信息科技有限公司 | 基于区块链的可搜索加密方法和电子设备 |
CN112861172A (zh) * | 2021-01-26 | 2021-05-28 | 石家庄铁道大学 | 基于pbft共识机制的对称可搜索加密方法 |
-
2021
- 2021-12-20 CN CN202111561736.2A patent/CN114254212A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130024144A (ko) * | 2011-08-30 | 2013-03-08 | 고려대학교 산학협력단 | 프라이버시를 보장하는 가중치 기반의 키워드 검색을 위한 방법 및 장치 |
CN106227833A (zh) * | 2016-07-26 | 2016-12-14 | 宁圣金融信息服务(上海)有限公司 | 区块链搜索引擎方法、***和装置 |
CN109145079A (zh) * | 2018-07-24 | 2019-01-04 | 南京邮电大学 | 基于个人兴趣用户模型的云端可搜索加密方法 |
CN112732789A (zh) * | 2021-01-12 | 2021-04-30 | 宁波云麟信息科技有限公司 | 基于区块链的可搜索加密方法和电子设备 |
CN112861172A (zh) * | 2021-01-26 | 2021-05-28 | 石家庄铁道大学 | 基于pbft共识机制的对称可搜索加密方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112000805A (zh) | 基于预训练模型的文本匹配方法、装置、终端及存储介质 | |
CN110929125B (zh) | 搜索召回方法、装置、设备及其存储介质 | |
CN112380343B (zh) | 问题解析方法、装置、电子设备及存储介质 | |
CN114565104A (zh) | 语言模型的预训练方法、结果推荐方法及相关装置 | |
CN113312461A (zh) | 基于自然语言处理的智能问答方法、装置、设备及介质 | |
CN113657495B (zh) | 基于概率预测模型的保险产品推荐方法、装置、设备 | |
WO2018223331A1 (en) | Systems and methods for text attribute determination using conditional random field model | |
CN112988979A (zh) | 实体识别方法、装置、计算机可读介质及电子设备 | |
CN112395390B (zh) | 意图识别模型的训练语料生成方法及其相关设备 | |
CN114491077A (zh) | 文本生成方法、装置、设备及介质 | |
CN113887941B (zh) | 业务流程生成方法、装置、电子设备及介质 | |
CN113821622B (zh) | 基于人工智能的答案检索方法、装置、电子设备及介质 | |
CN109858024B (zh) | 一种基于word2vec的房源词向量训练方法及装置 | |
CN115438674B (zh) | 实体数据处理、实体链接方法、装置和计算机设备 | |
CN115455161A (zh) | 对话处理方法、装置、电子设备及存储介质 | |
CN112820269A (zh) | 文本转语音方法、装置、电子设备及存储介质 | |
CN114077841A (zh) | 基于人工智能的语义提取方法、装置、电子设备及介质 | |
CN113378970A (zh) | 语句相似性检测方法、装置、电子设备及存储介质 | |
CN113064994A (zh) | 会议质量评估方法、装置、设备及存储介质 | |
CN115795517A (zh) | 资产数据存储方法及装置 | |
CN113591881B (zh) | 基于模型融合的意图识别方法、装置、电子设备及介质 | |
CN114385817A (zh) | 实体关系的识别方法、设备及可读存储介质 | |
CN112269875A (zh) | 文本分类方法、装置、电子设备及存储介质 | |
CN114254212A (zh) | 基于区块链的地址检索方法、***、电子设备及存储介质 | |
CN116843150A (zh) | 基于智慧物联网的社区服务方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |