CN113641796A - 数据搜索方法、***及存储介质 - Google Patents

数据搜索方法、***及存储介质 Download PDF

Info

Publication number
CN113641796A
CN113641796A CN202111007463.7A CN202111007463A CN113641796A CN 113641796 A CN113641796 A CN 113641796A CN 202111007463 A CN202111007463 A CN 202111007463A CN 113641796 A CN113641796 A CN 113641796A
Authority
CN
China
Prior art keywords
data
search
query
target
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111007463.7A
Other languages
English (en)
Inventor
姚小丰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ping An Medical Health Technology Service Co Ltd
Original Assignee
Ping An Medical and Healthcare Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Medical and Healthcare Management Co Ltd filed Critical Ping An Medical and Healthcare Management Co Ltd
Priority to CN202111007463.7A priority Critical patent/CN113641796A/zh
Publication of CN113641796A publication Critical patent/CN113641796A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请为人工智能技术领域,本申请提供了一种数据搜索方法、***及存储介质,其中,该方法包括:中转服务器获取用户的搜索请求,根据搜索请求确定用户的操作意向,根据操作意向查询搜索请求所需使用的分发服务器,从搜索请求提取搜索数据,将搜索数据发送至操作意向对应的分发服务器,分发服务器对搜索数据进行拆分,得到子搜索数据,并将各个子搜索数据分发给预设查询引擎,各个预设查询引擎从预设数据库中获取子搜索数据对应的目标数据;分发服务器对各目标数据合并后生成查询结果,中转服务器基于查询结果生成目标查询结果,将目标查询结果发送给用户。本申请基于不同的操作意向选择相应的分发服务器,避免大量的无效搜索,提高数据查询效率。

Description

数据搜索方法、***及存储介质
技术领域
本申请涉及人工智能技术领域,具体而言,本申请涉及一种数据搜索方法、***及存储介质。
背景技术
在信息技术日益发达,企业生产数据日益庞大,知识***性增长的今天,如何快速有效检索企业内部的运营数据,提升知识管理的效果,是每个企业不得不面对的一个现实问题。
目前常见的数据搜索技术为采用关系型数据库进行数据存储,对***内关键数据检索通常是基于数据库部分字段的精确匹配及部分字段的模糊搜索,在数据量比较大时,这种搜索方式的搜索性能较差,搜索效率较低。
发明内容
本申请的主要目的为提供一种数据搜索方法、***及存储介质,以提高数据搜索效率。
为了实现上述发明目的,本申请提供一种数据搜索方法,应用于数据搜索***,所述数据搜索***包括中转服务器、分发服务器及预设查询引擎,所述数据搜索方法包括:
所述中转服务器获取用户的搜索请求,根据所述搜索请求确定所述用户的操作意向,根据所述操作意向查询所述搜索请求所需使用的分发服务器,并从所述搜索请求提取搜索数据,将所述搜索数据发送至所述操作意向对应的分发服务器;
所述分发服务器对接收到的所述搜索数据进行拆分,得到多个子搜索数据,并将各个所述子搜索数据分发给不同的预设查询引擎;
各个所述预设查询引擎基于接收到的子搜索数据,从预设数据库中获取所述子搜索数据对应的目标数据,将所述目标数据发送给所述分发服务器;
所述分发服务器接收各个所述预设查询引擎发送的所述目标数据,将所有所述目标数据进行合并后生成查询结果,将所述查询结果发送给所述中转服务器;
所述中转服务器对所述查询结果的所有字段进行敏感词过滤,并将含有敏感词的字段替换为无法识别的目标文本,生成目标查询结果,将所述目标查询结果发送给所述用户。
优选地,所述用户的操作意向包括对业务数据的查询,各个所述预设查询引擎配置有自然语言处理模型,所述各个所述预设查询引擎基于接收到的子搜索数据,从预设数据库中获取所述子搜索数据对应的目标数据,包括:
各个所述预设查询引擎对所述子搜索数据进行特征提取,并转换为特征向量;
将所述特征向量输入所述自然语言处理模型中,得到目标数据;其中,所述自然语言处理模型为预先训练好的神经网络模型,用于根据所述特征向量从预设数据库中获取目标数据。
优选地,所述子搜索数据为文本,所述各个所述预设查询引擎对所述子搜索数据进行特征提取,包括:
各个所述预设查询引擎对所述文本进行分词,得到分词结果;
对所述分词结果进行词性标注,得到标注结果;
根据所述标注结果确定所述文本的关键字,将所述关键字转换为字向量,得到所述特征向量。
进一步地,所述将所述特征向量输入所述自然语言处理模型中之前,还包括:
各个所述预设查询引擎获取样本数据,对所述样本数据进行特征抽取,形成样本特征向量;
将所述样本特征向量和期望的标准查询结果输入初始自然语言处理模型中进行训练;
判断所述初始自然语言处理模型输出的训练结果是否满足要求;
若是,将训练结果满足要求的初始自然语言处理模型作为所述自然语言处理模型;
若否,根据所述训练结果调整所述初始自然语言处理模型的参数,并返回执行所述将所述样本特征向量和期望的标准查询结果输入初始自然语言处理模型中进行训练的步骤,以对调整参数后的所述初始自然语言处理模型再次训练,直至所述初始自然语言处理模型输出的训练结果满足要求为止。
优选地,所述操作意向对应的分发服务器包括自助查询SQL服务,所述将所述搜索数据发送至所述操作意向对应的分发服务器,包括:
所述中转服务器判断所述搜索数据是否为SQL查询语句;
若是,则将所述搜索数据发送至自助查询SQL服务。
优选地,所述将所述目标查询结果发送给所述用户,包括:
所述中转服务器从所述搜索请求中确定所述用户的权限范围;
将所述目标查询结果中不属于所述权限范围内的数据删除,并将删除数据后的所述目标查询结果发送给所述用户。
优选地,所述将所述目标查询结果发送给所述用户,包括:
所述中转服务器将所述目标查询结果进行封装,并确定所述目标查询结果的数据类型;
将封装后的所述目标查询结果及数据类型发送至所述用户所在终端,以使所述终端解析所述目标查询结果后,按照所述数据类型进行展示。
本申请还提供一种数据搜索***,其包括:
中转服务器,用于获取用户的搜索请求,根据所述搜索请求确定所述用户的操作意向,根据所述操作意向查询所述搜索请求所需使用的分发服务器,并从所述搜索请求提取搜索数据,将所述搜索数据发送至所述操作意向对应的分发服务器;
分发服务器,用于对接收到的所述搜索数据进行拆分,得到多个子搜索数据,并将各个所述子搜索数据分发给不同的预设查询引擎;
多个预设查询引擎,各个所述预设查询引擎用于基于接收到的子搜索数据,从预设数据库中获取所述子搜索数据对应的目标数据,将所述目标数据发送给所述分发服务器;
所述分发服务器还用于接收各个所述预设查询引擎发送的所述目标数据,将所有所述目标数据进行合并后生成查询结果,将所述查询结果发送给所述中转服务器;
所述中转服务器还用于对所述查询结果的所有字段进行敏感词过滤,并将含有敏感词的字段替换为无法识别的目标文本,生成目标查询结果,将所述目标查询结果发送给所述用户。
优选地,所述用户的操作意向包括对业务数据的查询,各个所述预设查询引擎配置有自然语言处理模型;其中,
各个所述预设查询引擎还用于对所述子搜索数据进行特征提取,并转换为特征向量,将所述特征向量输入所述自然语言处理模型中,得到目标数据;其中,所述自然语言处理模型为预先训练好的神经网络模型,用于根据所述特征向量从预设数据库中获取目标数据。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述任一项所述方法的步骤。
本申请所提供的一种数据搜索方法、***及存储介质,通过中转服务器获取用户的搜索请求,根据搜索请求确定用户的操作意向,根据操作意向查询搜索请求所需使用的分发服务器,然后从搜索请求提取搜索数据,将搜索数据发送至对应操作意向的分发服务器,分发服务器对搜索数据进行拆分,得到多个子搜索数据,并将各个子搜索数据分发给不同的预设查询引擎,预设查询引擎从预设数据库中获取子搜索数据对应的目标数据;分发服务器对各目标数据合并后生成查询结果,中转服务器对查询结果的所有字段进行敏感词过滤,并将含有敏感词的字段替换为无法识别的目标文本,生成目标查询结果,确保数据的安全性;最后将所述目标查询结果发送给用户。本申请根据用户的搜索请求确定用户的操作意向,基于不同的操作意向选择相应的分发服务器,以快速找到所需的数据,避免大量的无效搜索,提高了数据查询效率,同时支持不同的查询方式;此外,通过将各个子搜索数据分发给不同的预设查询引擎,以通过多个预设查询引擎同时从预设数据库中获取子搜索数据对应的目标数据,实现了同步查询,进一步提高了查询效率。
附图说明
图1为本申请一实施例的数据搜索方法的流程示意图;
图2为本申请一实施例的数据搜索***的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
参考图1,本申请提出一种数据搜索方法,以数据搜索***为执行主体,数据搜索***可以可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的计算机集群。
本申请中,该数据搜索方法用于提高数据搜索效率,数据搜索成为很多场景中用户快速获取所需信息的渠道。例如在医疗领域中,可以基于人工智能模型从海量的电子病历中查询用户所需的病历信息,有助于为用户提供病历参考。参照图1,其中一个实施例中,所述数据搜索***包括中转服务器、分发服务器及预设查询引擎,该数据搜索方法包括如下步骤:
S11、所述中转服务器获取用户的搜索请求,根据所述搜索请求确定所述用户的操作意向,根据所述操作意向查询所述搜索请求所需使用的分发服务器,并从所述搜索请求提取搜索数据,将所述搜索数据发送至所述操作意向对应的分发服务器;
S12、所述分发服务器对接收到的所述搜索数据进行拆分,得到多个子搜索数据,并将各个所述子搜索数据分发给不同的预设查询引擎;
S13、各个所述预设查询引擎基于接收到的子搜索数据,从预设数据库中获取所述子搜索数据对应的目标数据,将所述目标数据发送给所述分发服务器;
S14、所述分发服务器接收各个所述预设查询引擎发送的所述目标数据,将所有所述目标数据进行合并后生成查询结果,将所述查询结果发送给所述中转服务器;
S15、所述中转服务器对所述查询结果的所有字段进行敏感词过滤,并将含有敏感词的字段替换为无法识别的目标文本,生成目标查询结果,将所述目标查询结果发送给所述用户。
为了解决搜索框支持SQL(Structured Query Language,结构化查询语言)执行、业务数据查询、表查询、字段查询、***菜单查询、产品数据查询、权限数据查询等等的查询问题,本申请引入了不同的分发服务器进行业务搜索检测判断。在实际业务使用上,本申请根据用户的搜索请求,去甄别当前用户具体的操作意向,如用户是需要访问界面菜单,还是查询数据库相关表数据,亦或者查询公司具体的某块业务数据,或查询某张表的某些字段、或者执行一段自助查询的SQL语句等等的一系列操作,当确定用户的操作意向后,将用户的操作意向进行区分处理,利用相应的分发服务器进行数据获取。若需要进行执行自助查询的SQL语句,则进行自助查询服务的相关业务逻辑执行。若是查询业务界面数据、快速界面跳转等等,则进行NLU(Natural Language Understanding,自然语言理解技术)服务进行用户操作意向与查询结果的匹配。
具体的,如上述步骤S11所述,中转服务器与用户所在的终端直接连接,用于接收用户的搜索请求,并将搜索结果返回给用户。用户可在搜索栏输入搜索条件,发起搜索请求,中转服务器获取该搜索请求,搜索请求中可包括用户的身份信息、用户权限、搜索数据,搜索数据的类型可以是文本、语音或图片等等。
其中,操作意向是指用户需要获取什么数据或从何处获取所需数据的意愿。该操作意向可基于用户信息或搜索数据的数据类型确定,可预先构建操作意向与用户信息或数据类型的关系列表,基于关系列表确定用户的操作意向。例如,在接收到搜索请求后,可根据搜索请求中搜索数据的数据类型从所述关系列表中查询该用户的操作意向,如用户是需要访问界面菜单,还是查询数据库相关表数据,亦或者查询公司具体的某块业务数据,或查询某张表的某些字段、或者执行一段自助查询的SQL语句等等的一系列操作。例如,当数据类型为业务数据类型时,则该用户的操作意向是从该业务数据类型对应的分发服务器中获取公司具体的某块业务数据。又如,还可提取搜索请求中的用户信息,基于用户信息查询该用户历史使用过次数最多的分发服务器作为目标分发服务器,将调用目标分发服务器进行数据获取的动作作为用户的操作意向,从而在明确用户的操作意向后进行相应的数据搜索,降低搜索范围,提高数据搜索效率。
因此,不同的操作意向对应不同的分发服务器,以根据用户的操作意向选择相应的分发服务器,在该分发服务器中进行数据获取,以避免大量的无效搜索,提高搜索效率。其中,该分发服务器与预设查询引擎连接,用于将拆分后的搜索数据分配至相应的预设查询引擎进行查询,并接收与搜索数据相匹配的查询结果,查询结果可以是一句话或一段文本,例如,搜索数据是若干个关键词,则查询结果可以是包括至少一个关键词的文本。
如上述步骤S12-S13所述,可通过消息中间件将各个子搜索数据分发给预设查询引擎,以供所述预设查询引擎从预设数据库中获取所述子搜索数据对应的目标数据。其中,预设查询引擎可以存在多个,当预设查询引擎存在多个时,可以通过均分的方式将子搜索数据发给不同的预设查询引擎,各个所述预设查询引擎从预设数据库中获取所述子搜索数据对应的目标数据,将目标数据发送给分发服务器。
在本实施例中,预设查询引擎直接和预设数据库进行交互,负责数据的存取。在预设查询引擎进行数据的存取过程中,首先将子搜索数据进行数据转换,并提交给查询执行器,查询执行器多路并发地向预设数据库对应各个集群发起查询,当其中一路集群查询成功后,结束其他各路集群查询并返回目标数据。
如上述步骤S14所述,分发服务器接收各个预设查询引擎发送的目标数据,将目标数据进行合并后,生成查询结果,将所述查询结果发送给所述中转服务器。
本实施例通过预设消息中间件的设置,实现为分发服务器和查询引擎提供高吞吐量、高可靠的消息通信通道,以满足不断增长的数据查询需求。
如上述步骤S15所述,分发服务器在生成查询结果之后,将查询结果进行压缩后发送给中转服务器,本实施例的中转服务器接收所述分发服务器发送的查询结果,并对查询结果进行解压后,提取其中的数据,然后对所述查询结果的所有字段进行敏感词过滤,并将含有敏感词的字段替换为无法识别的文本,如乱码,最后得到目标查询结果,最后将目标查询结果发送给用户,并在用户所在的终端以列表的形式显示目标查询结果。
本申请所提供的一种数据搜索方法,通过中转服务器获取用户的搜索请求,根据搜索请求确定用户的操作意向,根据操作意向查询搜索请求所需使用的分发服务器,然后从搜索请求提取搜索数据,将搜索数据发送至操作意向对应的分发服务器,分发服务器对搜索数据进行拆分,得到多个子搜索数据,并将各个子搜索数据分发给不同的预设查询引擎,预设查询引擎从预设数据库中获取子搜索数据对应的目标数据;分发服务器对各目标数据合并后生成查询结果,中转服务器对查询结果的所有字段进行敏感词过滤,并将含有敏感词的字段替换为无法识别的目标文本,生成目标查询结果,确保数据的安全性;最后将所述目标查询结果发送给用户。本申请根据用户的搜索请求确定用户的操作意向,基于不同的操作意向选择相应的分发服务器,以快速找到所需的数据,避免大量的无效搜索,提高了数据查询效率,同时支持不同的查询方式;此外,通过将各个子搜索数据分发给不同的预设查询引擎,以通过多个预设查询引擎同时从预设数据库中获取子搜索数据对应的目标数据,实现了同步查询,进一步提高了查询效率。
在一实施例中,所述用户的操作意向包括对业务数据的查询,各个所述预设查询引擎配置有自然语言处理模型,所述各个所述预设查询引擎基于接收到的子搜索数据,从预设数据库中获取所述子搜索数据对应的目标数据,可具体包括:
各个所述预设查询引擎对所述子搜索数据进行特征提取,并转换为特征向量;
将所述特征向量输入所述自然语言处理模型中,得到目标数据;其中,所述自然语言处理模型为预先训练好的神经网络模型,用于根据所述特征向量从预设数据库中获取目标数据。
本实施例可利用结巴分词工具对用户输入的搜索数据进行结巴分词,得到多个词,以及确定搜索数据的开始信息和结束信息,对搜索数据的多个词进行特征抽取,得到特征向量,将搜索数据的特征向量再传入到自然语言处理模型中进行数据查询,自然语言处理模型对特征向量进行识别后,从预设数据库中查询该特征向量对应的目标数据。具体的,利用自然语言处理模型确定特征向量对应的起始查询实体以及结束查询实体,从预设数据库中查询以起始查询实体为起始节点、以结束查询实体为结束节点的数据链,将数据链作为目标数据。例如,用户输入的搜索数据对应的特征向量是“小李见到张三”对应的句向量,利用自然语言处理模型解析“小李见到张三”对应的句向量,得到“小李”、“张三”两个词向量,并确定起始查询实体为“小李”、结束查询实体为“张三”。最终从数据库中查询出数据链:“小李”->“公园”->“湖边”->“张三”-&gt。
在一实施例中,所述子搜索数据为文本,所述各个所述预设查询引擎对所述子搜索数据进行特征提取,可具体包括:
各个所述预设查询引擎对所述文本进行分词,得到分词结果;
对所述分词结果进行词性标注,得到标注结果;
根据所述标注结果确定所述文本的关键字,将所述关键字转换为字向量,得到所述特征向量。
本实施例可利用结巴分词工具对文本进行结巴分词,得到由多个词构成的分词结果,对分词结果中的分词进行词性标注,得到标注结果,如将多个词分别标注为形容词、动词、副词、语气词等等。最后根据所述标注结果确定文本的关键字,利用向量工具将关键字转换为字向量,得到所述特征向量。例如,将文本中的动词标注为关键字,并转换为特征向量。
在一实施例中,所述将所述特征向量输入所述自然语言处理模型中之前,还可包括:
各个所述预设查询引擎获取样本数据,对所述样本数据进行特征抽取,形成样本特征向量;
将所述样本特征向量和期望的标准查询结果输入初始自然语言处理模型中进行训练;
判断所述初始自然语言处理模型输出的训练结果是否满足要求;
若是,将训练结果满足要求的初始自然语言处理模型作为所述自然语言处理模型;
若否,根据所述训练结果调整所述初始自然语言处理模型的参数,并返回执行所述将所述样本特征向量和期望的标准查询结果输入初始自然语言处理模型中进行训练的步骤,以对调整参数后的所述初始自然语言处理模型再次训练,直至所述初始自然语言处理模型输出的训练结果满足要求为止。
本实施例可采集AI平台相关数据,包含模型相关数据、API(Application ProgramInterface,应用程序接口)数据、SDK(Software Development Kit,软件开发工具包)数据、医生数据、医疗数据、疾病数据等等,采集公司和国家层面的敏感词汇,作为训练数据中安全防范相关处理数据,采集数据中台运营相关数据,包含用户数据、权限数据、团队数据、菜单数据等等作为站内二次搜索相关支持数据,然后将采集的所有数据作为样本数据。
在一实施例中,所述样本数据可存储在医疗云(Medical cloud),医疗云是指在云计算、移动技术、多媒体、4G通信、大数据、以及物联网等新技术基础上,结合医疗技术,使用“云计算”来创建医疗健康服务云平台,实现了医疗资源的共享和医疗范围的扩大。因为云计算技术的运用于结合,医疗云提高医疗机构的效率,方便居民就医。像现在医院的预约挂号、电子病历、医保等都是云计算与医疗领域结合的产物,医疗云还具有数据安全、信息共享、动态扩展、布局全局的优势。
在一实施例中,可采用词袋模型的权重计算方法对采集的AI平台数据、安全数据、中台数据等等的样本数据进行抽取特征,形成样本特征向量,然后使用机器学习算法对提取后相关数据的样本特征向量和期望的标准查询结果输入初始自然语言处理模型中进行多次训练,并在每次训练之后计算所述初始自然语言处理模型的损失值,判断所述损失值是否低于预设损失值,若是,则判定初始自然语言处理模型输出的训练结果满足要求。
若否,则调整初始自然语言处理模型的参数,对其再次训练,直至所述损失值低于预设损失值时为止,从而将当前的初始自然语言处理模型作为自然语言处理模型。
在一实施例中,所述操作意向对应的分发服务器包括自助查询SQL服务,所述将所述搜索数据发送至所述操作意向对应的分发服务器,可具体包括:
所述中转服务器判断所述搜索数据是否为SQL查询语句;
若是,则将所述搜索数据发送至自助查询SQL服务。
在本实施例中,可在中转服务器上配置安全验证模块,并在安全验证模块上添加安全服务单元与过滤服务单元,以进行数据的敏感词识别及过滤。它的运行原理是:对输入的搜索数据进行格式检测,判断到当前搜索数据是否是SQL(Structured Query Language,结构化查询语言)查询语句,若是,则进行链接自助分发服务器,当搜索数据并非全SQL查询语句时,则进行NLU(Natural Language Understanding,自然语言理解技术)相关业务的逻辑处理,得到查询结果,然后对查询结果的所有字段进行敏感词过滤,并将含有敏感词的字段替换为无法识别的目标文本,最终生成目标查询结果。
其中,结构化查询语言(Structured Query Language)简称SQL,是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库***。在本申请实施例中,SQL查询语句是根据结构化查询语言进行编写的查询语句,用于对大数据进行数据查询。
自助查询SQL服务接收到SQL查询语句后,对SQL查询语句进行解析,以获取SQL查询语句中对应的执行计划,该执行计划包括了数据查询任务需要访问的各种查询表、过滤条件和文件字段信息等元数据信息,所以对执行计划进行元数据信息提取后,获取到执行计划中对应的查询表和过滤信息。
其中,过滤信息是指在SQL查询语句中对待查询文件进行限定的过滤条件和筛选信息。其中,过滤条件和筛选信息可以分别包括日期筛选信息和文件字段信息,其为后续进行数据查询时,提供筛选条件,以减少文件扫描范围,进而提高对大数据的数据查询效率。
然后获取预设匹配规则,并通过预设匹配规则对SQL查询语句进行匹配处理,得到匹配后SQL查询语句。其中,预设匹配规则可以是由开发人员事先设置的SQL对应的匹配规则,其目的是将SQL查询语句进行优化,便于后续通过大数据查询引擎对SQL查询语句进行数据查询。预设匹配规则可以由SQL优化器执行对SQL查询语句匹配处理。
具体的,服务器在获取到SQL查询语句后,再获取该SQL查询语句对应的预设匹配规则,通过预设的SQL优化器,根据预设匹配规则对SQL查询语句进行匹配处理,也即预设匹配规则对SQL查询语句进行转化,从而得到匹配的目标SQL查询语句。
最后通过调用查询引擎对目标SQL查询语句进行数据查询,其查询引擎通过解析目标SQL查询语句,获取其目标查询表中的相关信息,得到文件扫描范围,并对该范围的文件信息进行扫描,从而得到查询结果,并将该查询结果返回该用户,从而大大减小了数据查询范围,有利于提高对大数据的数据查询效率。
在一实施例中,所述将所述目标查询结果发送给所述用户,可具体包括:
所述中转服务器从所述搜索请求中确定所述用户的权限范围;
将所述目标查询结果中不属于所述权限范围内的数据删除,并将删除数据后的所述目标查询结果发送给所述用户。
在本实施例中,对涉及公司安全、战略、客户信息等一系列数据进行用户权限检测,但凡有非权限人员通过非法手段试图查询数据,都予以反馈无权访问,如无权限则进行搜索撤销操作,反馈:{type:‘DBSQLSearchNoAuth’,data:‘暂无搜索权限’},或者将目标查询结果中不属于所述权限范围内的数据删除,并将删除数据后的目标查询结果发送给用户,以提高数据的安全性。
在一实施例中,所述将所述目标查询结果发送给所述用户,可具体包括:
所述中转服务器将所述目标查询结果进行封装,并确定所述目标查询结果的数据类型;
将封装后的所述目标查询结果及数据类型发送至所述用户所在终端,以使所述终端解析所述目标查询结果后,按照所述数据类型进行展示。
在本实施例中,中转服务器对目标查询结果进行数据结构化封装,结构化封装是根据用户所在终端的界面需求创建结构匹配,并进行数据识别后的二次封装,用于让用户所在终端调用目标查询结果后可以正常处理、使用和分析。中转服务器对目标查询结果进行封装后,向用户所在终端返回目标查询结果及其数据类型,以告知终端区别展示目标查询结果。
参照图2,本申请实施例中还提供一种数据搜索***,包括:
中转服务器11,用于获取用户的搜索请求,根据所述搜索请求确定所述用户的操作意向,根据所述操作意向查询所述搜索请求所需使用的分发服务器,并从所述搜索请求提取搜索数据,将所述搜索数据发送至所述操作意向对应的分发服务器;
分发服务器12,用于对接收到的所述搜索数据进行拆分,得到多个子搜索数据,并将各个所述子搜索数据分发给不同的预设查询引擎;
多个预设查询引擎13,各个所述预设查询引擎13用于基于接收到的子搜索数据,从预设数据库中获取所述子搜索数据对应的目标数据,将所述目标数据发送给所述分发服务器12;
所述分发服务器12还用于接收各个所述预设查询引擎13发送的所述目标数据,将所有所述目标数据进行合并后生成查询结果,将所述查询结果发送给所述中转服务器11;
所述中转服务器11还用于对所述查询结果的所有字段进行敏感词过滤,并将含有敏感词的字段替换为无法识别的目标文本,生成目标查询结果,将所述目标查询结果发送给所述用户。
为了解决搜索框支持SQL(Structured Query Language,结构化查询语言)执行、业务数据查询、表查询、字段查询、***菜单查询、产品数据查询、权限数据查询等等的查询问题,本申请引入了不同的分发服务器12进行业务搜索检测判断。在实际业务使用上,本申请根据用户的搜索请求,去甄别当前用户具体的操作意向,如用户是需要访问界面菜单,还是查询数据库相关表数据,亦或者查询公司具体的某块业务数据,或查询某张表的某些字段、或者执行一段自助查询的SQL语句等等的一系列操作,当确定用户的操作意向后,将用户的操作意向进行区分处理,利用相应的分发服务器12进行数据获取。若需要进行执行自助查询的SQL语句,则进行自助查询服务的相关业务逻辑执行。若是查询业务界面数据、快速界面跳转等等,则进行NLU(Natural Language Understanding,自然语言理解技术)服务进行用户操作意向与查询结果的匹配。
具体的,中转服务器11与用户所在的终端直接连接,用于接收用户的搜索请求,并将搜索结果返回给用户。用户可在搜索栏输入搜索条件,发起搜索请求,中转服务器11获取该搜索请求,搜索请求中可包括用户的身份信息、用户权限、搜索数据,搜索数据的类型可以是文本、语音或图片等等。
其中,操作意向是指用户需要获取什么数据或从何处获取所需数据的意愿。该操作意向可基于用户信息或搜索数据的数据类型确定,可预先构建操作意向与用户信息或数据类型的关系列表,基于关系列表确定用户的操作意向。例如,在接收到搜索请求后,可根据搜索请求中搜索数据的数据类型从所述关系列表中查询该用户的操作意向,如用户是需要访问界面菜单,还是查询数据库相关表数据,亦或者查询公司具体的某块业务数据,或查询某张表的某些字段、或者执行一段自助查询的SQL语句等等的一系列操作。例如,当数据类型为业务数据类型时,则该用户的操作意向是从该业务数据类型对应的分发服务器12中获取公司具体的某块业务数据。又如,还可提取搜索请求中的用户信息,基于用户信息查询该用户历史使用过次数最多的分发服务器12作为目标分发服务器,将调用目标分发服务器进行数据获取的动作作为用户的操作意向,从而在明确用户的操作意向后进行相应的数据搜索,降低搜索范围,提高数据搜索效率。
因此,不同的操作意向对应不同的分发服务器12,以根据用户的操作意向选择相应的分发服务器12,在该分发服务器12中进行数据获取,以避免大量的无效搜索,提高搜索效率。其中,该分发服务器12与预设查询引擎13连接,用于将拆分后的搜索数据分配至相应的预设查询引擎13进行查询,并接收与搜索数据相匹配的查询结果,查询结果可以是一句话或一段文本,例如,搜索数据是若干个关键词,则查询结果可以是包括至少一个关键词的文本。
可通过消息中间件将各个子搜索数据分发给预设查询引擎13,以供所述预设查询引擎13从预设数据库中获取所述子搜索数据对应的目标数据。其中,预设查询引擎13可以存在多个,当预设查询引擎13存在多个时,可以通过均分的方式将子搜索数据发给不同的预设查询引擎13,各个所述预设查询引擎13从预设数据库中获取所述子搜索数据对应的目标数据,将目标数据发送给分发服务器12。
在本实施例中,预设查询引擎13直接和预设数据库进行交互,负责数据的存取。在预设查询引擎13进行数据的存取过程中,首先将子搜索数据进行数据转换,并提交给查询执行器,查询执行器多路并发地向预设数据库对应各个集群发起查询,当其中一路集群查询成功后,结束其他各路集群查询并返回目标数据。
分发服务器12接收各个预设查询引擎13发送的目标数据,将目标数据进行合并后,生成查询结果,将所述查询结果发送给所述中转服务器11。
本实施例通过预设消息中间件的设置,实现为分发服务器12和查询引擎提供高吞吐量、高可靠的消息通信通道,以满足不断增长的数据查询需求。
分发服务器12在生成查询结果之后,将查询结果进行压缩后发送给中转服务器11,本实施例的中转服务器11接收所述分发服务器12发送的查询结果,并对查询结果进行解压后,提取其中的数据,然后对所述查询结果的所有字段进行敏感词过滤,并将含有敏感词的字段替换为无法识别的文本,如乱码,最后得到目标查询结果,最后将目标查询结果发送给用户,并在用户所在的终端以列表的形式显示目标查询结果。
优选地,所述用户的操作意向包括对业务数据的查询,各个所述预设查询引擎13配置有自然语言处理模型;其中,
各个所述预设查询引擎13还用于对所述子搜索数据进行特征提取,并转换为特征向量,将所述特征向量输入所述自然语言处理模型中,得到目标数据;其中,所述自然语言处理模型为预先训练好的神经网络模型,用于根据所述特征向量从预设数据库中获取目标数据。
本实施例可利用结巴分词工具对用户输入的搜索数据进行结巴分词,得到多个词,以及确定搜索数据的开始信息和结束信息,对搜索数据的多个词进行特征抽取,得到特征向量,将搜索数据的特征向量再传入到自然语言处理模型中进行数据查询,自然语言处理模型对特征向量进行识别后,从预设数据库中查询该特征向量对应的目标数据。具体的,利用自然语言处理模型确定特征向量对应的起始查询实体以及结束查询实体,从预设数据库中查询以起始查询实体为起始节点、以结束查询实体为结束节点的数据链,将数据链作为目标数据。例如,用户输入的搜索数据对应的特征向量是“小李见到张三”对应的句向量,利用自然语言处理模型解析“小李见到张三”对应的句向量,得到“小李”、“张三”两个词向量,并确定起始查询实体为“小李”、结束查询实体为“张三”。最终从数据库中查询出数据链:“小李”->“公园”->“湖边”->“张三”-&gt。
如上所述,可以理解地,本申请中提出的所述数据搜索***的各组成部分可以实现如上所述数据搜索方法任一项的功能,具体结构不再赘述。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种数据搜索方法,应用于数据搜索***,所述数据搜索***包括中转服务器、分发服务器及预设查询引擎,所述数据搜索方法包括步骤:
所述中转服务器获取用户的搜索请求,根据所述搜索请求确定所述用户的操作意向,根据所述操作意向查询所述搜索请求所需使用的分发服务器,并从所述搜索请求提取搜索数据,将所述搜索数据发送至所述操作意向对应的分发服务器;
所述分发服务器对接收到的所述搜索数据进行拆分,得到多个子搜索数据,并将各个所述子搜索数据分发给不同的预设查询引擎;
各个所述预设查询引擎基于接收到的子搜索数据,从预设数据库中获取所述子搜索数据对应的目标数据,将所述目标数据发送给所述分发服务器;
所述分发服务器接收各个所述预设查询引擎发送的所述目标数据,将所有所述目标数据进行合并后生成查询结果,将所述查询结果发送给所述中转服务器;
所述中转服务器对所述查询结果的所有字段进行敏感词过滤,并将含有敏感词的字段替换为无法识别的目标文本,生成目标查询结果,将所述目标查询结果发送给所述用户。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
综上所述,本申请的最大有益效果在于:
本申请所提供的一种数据搜索方法、***及存储介质,通过中转服务器获取用户的搜索请求,根据搜索请求确定用户的操作意向,根据操作意向查询搜索请求所需使用的分发服务器,然后从搜索请求提取搜索数据,将搜索数据发送至操作意向对应的分发服务器,分发服务器对搜索数据进行拆分,得到多个子搜索数据,并将各个子搜索数据分发给不同的预设查询引擎,预设查询引擎从预设数据库中获取子搜索数据对应的目标数据;分发服务器对各目标数据合并后生成查询结果,中转服务器对查询结果的所有字段进行敏感词过滤,并将含有敏感词的字段替换为无法识别的目标文本,生成目标查询结果,确保数据的安全性;最后将所述目标查询结果发送给用户。本申请根据用户的搜索请求确定用户的操作意向,基于不同的操作意向选择相应的分发服务器,以快速找到所需的数据,避免大量的无效搜索,提高了数据查询效率,同时支持不同的查询方式;此外,通过将各个子搜索数据分发给不同的预设查询引擎,以通过多个预设查询引擎同时从预设数据库中获取子搜索数据对应的目标数据,实现了同步查询,进一步提高了查询效率。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种数据搜索方法,应用于数据搜索***,所述数据搜索***包括中转服务器、分发服务器及预设查询引擎,其特征在于,所述数据搜索方法包括:
所述中转服务器获取用户的搜索请求,根据所述搜索请求确定所述用户的操作意向,根据所述操作意向查询所述搜索请求所需使用的分发服务器,并从所述搜索请求提取搜索数据,将所述搜索数据发送至所述操作意向对应的分发服务器;
所述分发服务器对接收到的所述搜索数据进行拆分,得到多个子搜索数据,并将各个所述子搜索数据分发给不同的预设查询引擎;
各个所述预设查询引擎基于接收到的子搜索数据,从预设数据库中获取所述子搜索数据对应的目标数据,将所述目标数据发送给所述分发服务器;
所述分发服务器接收各个所述预设查询引擎发送的所述目标数据,将所有所述目标数据进行合并后生成查询结果,将所述查询结果发送给所述中转服务器;
所述中转服务器对所述查询结果的所有字段进行敏感词过滤,并将含有敏感词的字段替换为无法识别的目标文本,生成目标查询结果,将所述目标查询结果发送给所述用户。
2.根据权利要求1所述的方法,其特征在于,所述用户的操作意向包括对业务数据的查询,各个所述预设查询引擎配置有自然语言处理模型,所述各个所述预设查询引擎基于接收到的子搜索数据,从预设数据库中获取所述子搜索数据对应的目标数据,包括:
各个所述预设查询引擎对所述子搜索数据进行特征提取,并转换为特征向量;
将所述特征向量输入所述自然语言处理模型中,得到目标数据;其中,所述自然语言处理模型为预先训练好的神经网络模型,用于根据所述特征向量从预设数据库中获取目标数据。
3.根据权利要求2所述的方法,其特征在于,所述子搜索数据为文本,所述各个所述预设查询引擎对所述子搜索数据进行特征提取,包括:
各个所述预设查询引擎对所述文本进行分词,得到分词结果;
对所述分词结果进行词性标注,得到标注结果;
根据所述标注结果确定所述文本的关键字,将所述关键字转换为字向量,得到所述特征向量。
4.根据权利要求2所述的方法,其特征在于,所述将所述特征向量输入所述自然语言处理模型中之前,还包括:
各个所述预设查询引擎获取样本数据,对所述样本数据进行特征抽取,形成样本特征向量;
将所述样本特征向量和期望的标准查询结果输入初始自然语言处理模型中进行训练;
判断所述初始自然语言处理模型输出的训练结果是否满足要求;
若是,将训练结果满足要求的初始自然语言处理模型作为所述自然语言处理模型;
若否,根据所述训练结果调整所述初始自然语言处理模型的参数,并返回执行所述将所述样本特征向量和期望的标准查询结果输入初始自然语言处理模型中进行训练的步骤,以对调整参数后的所述初始自然语言处理模型再次训练,直至所述初始自然语言处理模型输出的训练结果满足要求为止。
5.根据权利要求1所述的方法,其特征在于,所述操作意向对应的分发服务器包括自助查询SQL服务,所述将所述搜索数据发送至所述操作意向对应的分发服务器,包括:
所述中转服务器判断所述搜索数据是否为SQL查询语句;
若是,则将所述搜索数据发送至自助查询SQL服务。
6.根据权利要求1所述的方法,其特征在于,所述将所述目标查询结果发送给所述用户,包括:
所述中转服务器从所述搜索请求中确定所述用户的权限范围;
将所述目标查询结果中不属于所述权限范围内的数据删除,并将删除数据后的所述目标查询结果发送给所述用户。
7.根据权利要求1所述的方法,其特征在于,所述将所述目标查询结果发送给所述用户,包括:
所述中转服务器将所述目标查询结果进行封装,并确定所述目标查询结果的数据类型;
将封装后的所述目标查询结果及数据类型发送至所述用户所在终端,以使所述终端解析所述目标查询结果后,按照所述数据类型进行展示。
8.一种数据搜索***,其特征在于,包括:
中转服务器,用于获取用户的搜索请求,根据所述搜索请求确定所述用户的操作意向,根据所述操作意向查询所述搜索请求所需使用的分发服务器,并从所述搜索请求提取搜索数据,将所述搜索数据发送至所述操作意向对应的分发服务器;
分发服务器,用于对接收到的所述搜索数据进行拆分,得到多个子搜索数据,并将各个所述子搜索数据分发给不同的预设查询引擎;
多个预设查询引擎,各个所述预设查询引擎用于基于接收到的子搜索数据,从预设数据库中获取所述子搜索数据对应的目标数据,将所述目标数据发送给所述分发服务器;
所述分发服务器还用于接收各个所述预设查询引擎发送的所述目标数据,将所有所述目标数据进行合并后生成查询结果,将所述查询结果发送给所述中转服务器;
所述中转服务器还用于对所述查询结果的所有字段进行敏感词过滤,并将含有敏感词的字段替换为无法识别的目标文本,生成目标查询结果,将所述目标查询结果发送给所述用户。
9.根据权利要求8所述的数据搜索***,其特征在于,所述用户的操作意向包括对业务数据的查询,各个所述预设查询引擎配置有自然语言处理模型;其中,
各个所述预设查询引擎还用于对所述子搜索数据进行特征提取,并转换为特征向量,将所述特征向量输入所述自然语言处理模型中,得到目标数据;其中,所述自然语言处理模型为预先训练好的神经网络模型,用于根据所述特征向量从预设数据库中获取目标数据。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现权利要求1-7任一项所述的数据搜索方法。
CN202111007463.7A 2021-08-30 2021-08-30 数据搜索方法、***及存储介质 Pending CN113641796A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111007463.7A CN113641796A (zh) 2021-08-30 2021-08-30 数据搜索方法、***及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111007463.7A CN113641796A (zh) 2021-08-30 2021-08-30 数据搜索方法、***及存储介质

Publications (1)

Publication Number Publication Date
CN113641796A true CN113641796A (zh) 2021-11-12

Family

ID=78424487

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111007463.7A Pending CN113641796A (zh) 2021-08-30 2021-08-30 数据搜索方法、***及存储介质

Country Status (1)

Country Link
CN (1) CN113641796A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117076494A (zh) * 2023-10-16 2023-11-17 北京英视睿达科技股份有限公司 实时数据的查询方法、装置、计算机设备及可读存储介质
CN117290411A (zh) * 2023-11-22 2023-12-26 深圳九有数据库有限公司 一种多模数据库查询方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110516142A (zh) * 2019-08-29 2019-11-29 深圳前海微众银行股份有限公司 数据查询方法、装置、设备及介质
CN110765275A (zh) * 2019-10-14 2020-02-07 平安医疗健康管理股份有限公司 搜索方法、装置、计算机设备和存储介质
US20200210496A1 (en) * 2017-07-05 2020-07-02 Beijing Sankuai Online Technology Co., Ltd Distributed search method, index update method, system, server, and computer device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200210496A1 (en) * 2017-07-05 2020-07-02 Beijing Sankuai Online Technology Co., Ltd Distributed search method, index update method, system, server, and computer device
CN110516142A (zh) * 2019-08-29 2019-11-29 深圳前海微众银行股份有限公司 数据查询方法、装置、设备及介质
CN110765275A (zh) * 2019-10-14 2020-02-07 平安医疗健康管理股份有限公司 搜索方法、装置、计算机设备和存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117076494A (zh) * 2023-10-16 2023-11-17 北京英视睿达科技股份有限公司 实时数据的查询方法、装置、计算机设备及可读存储介质
CN117290411A (zh) * 2023-11-22 2023-12-26 深圳九有数据库有限公司 一种多模数据库查询方法、装置、电子设备及存储介质
CN117290411B (zh) * 2023-11-22 2024-02-13 深圳九有数据库有限公司 一种多模数据库查询方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN110765275B (zh) 搜索方法、装置、计算机设备和存储介质
CA3174601C (en) Text intent identifying method, device, computer equipment and storage medium
US8224772B2 (en) Data management apparatus, method and program
EP3855324A1 (en) Associative recommendation method and apparatus, computer device, and storage medium
CN101408876B (zh) 一种电子文档全文检索的方法及***
KR101450358B1 (ko) 구조형 지리적 데이터 검색
CN110263317B (zh) 一种生成文档模板的方法及装置
US20120117051A1 (en) Multi-modal approach to search query input
US20070022096A1 (en) Method and system for searching a plurality of web sites
CN113641796A (zh) 数据搜索方法、***及存储介质
KR102521963B1 (ko) 임상시험 검색을 위한 데이터 분류 장치, 시스템 및 방법
CN112883030A (zh) 数据收集方法、装置、计算机设备和存储介质
CN113127519A (zh) 文件的查询方法、装置、计算机设备及存储介质
CN110413882B (zh) 信息推送方法、装置及设备
CN111752922A (zh) 一种建立知识数据库、实现知识查询的方法及装置
CN111191153A (zh) 一种信息技术咨询服务展示装置
US20110252313A1 (en) Document information selection method and computer program product
CN113792195A (zh) 跨***的数据获取方法、装置、计算机设备和存储介质
CN114253990A (zh) 数据库查询方法、装置、计算机设备和存储介质
CN112035655B (zh) 银行人力资源***及工作方法
US20040010556A1 (en) Electronic document information expansion apparatus, electronic document information expansion method , electronic document information expansion program, and recording medium which records electronic document information expansion program
CN115935042B (zh) 一种基于融合模型的质押资产智能查重方法及***
JP3786233B2 (ja) 情報検索方法および情報検索システム
US11314793B2 (en) Query processing
CN116361428A (zh) 一种问答召回方法、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220523

Address after: 518000 China Aviation Center 2901, No. 1018, Huafu Road, Huahang community, Huaqiang North Street, Futian District, Shenzhen, Guangdong Province

Applicant after: Shenzhen Ping An medical and Health Technology Service Co.,Ltd.

Address before: Room 12G, Block H, 666 Beijing East Road, Huangpu District, Shanghai 200000

Applicant before: PING AN MEDICAL AND HEALTHCARE MANAGEMENT Co.,Ltd.