CN111985241B - 医学信息查询方法、装置、电子设备及介质 - Google Patents
医学信息查询方法、装置、电子设备及介质 Download PDFInfo
- Publication number
- CN111985241B CN111985241B CN202010917937.0A CN202010917937A CN111985241B CN 111985241 B CN111985241 B CN 111985241B CN 202010917937 A CN202010917937 A CN 202010917937A CN 111985241 B CN111985241 B CN 111985241B
- Authority
- CN
- China
- Prior art keywords
- entity
- query
- preset
- medical information
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Mathematical Optimization (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及智慧医疗,提供一种医学信息查询方法、装置、电子设备及介质。该方法能够提取查询文本,对查询文本进行纠错处理,得到多个查询词语,识别多个查询词语,得到对象实体及属性实体,获取对象实体的实体识别码,获取关联识别码,确定关联识别码对应的关联对象,确定关联对象与对象实体的关联强度,选取关联强度大于预设阈值的关联对象作为目标对象,获取同时与对象实体及属性实体对应的信息作为搜索结果,获取与目标对象对应的信息作为关联结果。本发明不仅能够准确识别出用户的意图,进而搜索出用户所需的搜索结果,还能搜索出与搜索意图相关联的关联结果。此外,本发明还涉及区块链技术,所述搜索结果及所述关联结果可存储于区块链中。
Description
技术领域
本发明涉及智慧医疗技术领域,尤其涉及一种医学信息查询方法、装置、电子设备及介质。
背景技术
在医学知识平台上搜寻相关信息,能够获取医疗行业从业人员所需的医学信息,进而为临床诊断、治疗等医疗工作提供了重要参考价值。目前的搜索方式大多根据关键字进行搜索,然而,在用户提供的关键字中出现错别字等错误信息时,导致无法为用户准确提供所需的搜索结果,此外,现有的医学知识平台中模块之间的关联性差,导致无法为用户提供与搜索信息相关联的关联结果。
发明内容
鉴于以上内容,有必要提供一种医学信息查询方法、装置、电子设备及介质,不仅能够准确识别出用户的意图,进而搜索出用户所需的搜索结果,还能搜索出与搜索意图相关联的关联结果。
一方面,本发明提出一种医学信息查询方法,所述医学信息查询方法包括:
当接收到医学信息查询请求时,从所述医学信息查询请求中提取查询文本;
对所述查询文本进行纠错处理,得到多个查询词语;
对所述多个查询词语进行命名实体识别,得到所述查询文本的对象实体及所述查询文本的属性实体;
从预设关联表中获取所述对象实体的实体识别码,并获取与所述实体识别码关联的关联识别码;
确定所述关联识别码对应的关联对象,并确定所述关联对象与所述对象实体的关联强度;
选取关联强度大于预设阈值的关联对象作为目标对象;
从医学知识平台中获取同时与所述对象实体及所述属性实体对应的信息作为所述医学信息查询请求的搜索结果,并从所述医学知识平台中获取与所述目标对象对应的信息作为所述医学信息查询请求的关联结果。
根据本发明优选实施例,所述从所述医学信息查询请求中提取查询文本包括:
确定所述医学信息查询请求所属的请求类型;
根据所述请求类型从预设线程池中确定目标线程;
利用所述目标线程解析所述医学信息查询请求的方法体,得到所述医学信息查询请求携带的请求信息;
从标签配置表中获取预设标签,所述标签配置表中存储多个预先定义好的标签;
从所述请求信息中获取与所述预设标签对应的信息作为所述查询文本。
根据本发明优选实施例,所述对所述查询文本进行纠错处理,得到多个查询词语包括:
利用预先构建的语法检测模型检测所述查询文本中是否存在待纠错词;
当检测到所述查询文本中存在所述待纠错词时,确定所述待纠错词的词语长度;
根据所述词语长度确定备选集,并计算所述待纠错词与所述备选集中的每个备选词的相似度;
将相似度最大的备选词确定为替换词,并在所述查询文本中将所述待纠错词替换为所述替换词,得到纠错后的查询文本;
根据预设词典对所述查询文本进行切分,得到多个切分序列,所述预设词典中包括自定义词与所述自定义词的权值;
根据所述预设词典中的权值计算每个切分序列的切分概率;
将切分概率最大的切分序列确定为所述多个查询词语。
根据本发明优选实施例,所述对所述多个查询词语进行命名实体识别,得到所述查询文本的对象实体及所述查询文本的属性实体包括:
对所述多个查询词语进行向量化处理,得到输入向量序列;
将所述输入向量序列输入至预先构建的实体识别模型中,并获取所述实体识别模型的激活层中每个序列位置上所有标签的输出概率及每个序列位置上所有标签的转移概率;
对于每个序列位置,将所述输出概率及所述转移概率进行加权和运算,得到每个序列位置的上所有标签的目标概率;
将目标概率最高的标签确定为每个序列位置上的输出标签,并组合每个序列位置上的输出标签,得到所述查询文本的实体列表;
从所述实体列表中选取出与预设对象匹配的实体作为所述对象实体,并从所述实体列表中选取出与预设属性匹配的实体作为所述属性实体。
根据本发明优选实施例,在从预设关联表获取所述对象实体的实体识别码之前,所述方法还包括:
从预设词表中爬取与所述对象实体对应的目标词条;
从所述目标词条中识别出多个预设实体,所述预设实体包括疾病实体及药品实体;
计算每个预设实体在所述目标词条中的目标数量,并计算所述目标词条中所述多个预设实体的实体数量;
将所述目标数量除以所述实体数量,得到每个预设实体与所述对象实体的关联强度;
利用编码生成器生成所述对象实体的实体识别码,并利用所述编码生成器生成所述多个预设实体的关联识别码;
根据所述实体识别码、所述关联识别码及所述关联强度生成三元组,得到所述预设关联表。
根据本发明优选实施例,所述从医学知识平台中获取同时与所述对象实体及所述属性实体对应的信息作为所述医学信息查询请求的搜索结果包括:
确定所述对象实体与所述属性实体中实体的目标个数;
调用线程数量为所述目标个数的闲置线程;
利用所述闲置线程中任一线程从所述医学知识平台中获取与所述对象实体对应的第一信息,并利用所述闲置线程中的其他线程从所述医学知识平台中获取与所述属性实体对应的第二信息;
获取所述第一信息与所述第二信息的交集作为所述搜索结果。
根据本发明优选实施例,所述方法还包括:
确定所述医学信息查询请求的触发用户,并确定所述医学信息查询请求的触发设备;
获取所述触发用户的用户行为数据;
根据所述用户行为数据确定所述触发用户的关注对象;
从所述医学知识平台中获取与所述关注对象对应的关注信息;
向所述触发设备推送所述关注信息。
另一方面,本发明还提出一种医学信息查询装置,所述医学信息查询装置包括:
提取单元,用于当接收到医学信息查询请求时,从所述医学信息查询请求中提取查询文本;
处理单元,用于对所述查询文本进行纠错处理,得到多个查询词语;
识别单元,用于对所述多个查询词语进行命名实体识别,得到所述查询文本的对象实体及所述查询文本的属性实体;
获取单元,用于从预设关联表中获取所述对象实体的实体识别码,并获取与所述实体识别码关联的关联识别码;
确定单元,用于确定所述关联识别码对应的关联对象,并确定所述关联对象与所述对象实体的关联强度;
选取单元,用于选取关联强度大于预设阈值的关联对象作为目标对象;
所述获取单元,还用于从医学知识平台中获取同时与所述对象实体及所述属性实体对应的信息作为所述医学信息查询请求的搜索结果,并从所述医学知识平台中获取与所述目标对象对应的信息作为所述医学信息查询请求的关联结果。
另一方面,本发明还提出一种电子设备,所述电子设备包括:
存储器,存储计算机可读指令;及
处理器,执行所述存储器中存储的计算机可读指令以实现所述医学信息查询方法。
另一方面,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现所述医学信息查询方法。
由以上技术方案可以看出,本发明能够当接收到医学信息查询请求时,从所述医学信息查询请求中提取查询文本,对所述查询文本进行纠错处理,得到多个查询词语,通过对查询文本进行纠错处理,有利于准确识别出用户的搜索意图,对所述多个查询词语进行命名实体识别,得到所述查询文本的对象实体及所述查询文本的属性实体,能够确定出规范化的标准用词,进而有利于准确确定搜索结果,从预设关联表获取所述对象实体的实体识别码,并获取与所述实体识别码关联的关联识别码,确定所述关联识别码对应的关联对象,并确定所述关联对象与所述对象实体的关联强度,选取关联强度大于预设阈值的关联对象作为目标对象,能够确定出关联强度大于预设阈值的关联对象,进而确定出与所述医学信息查询请求中的对象实体相关联的关联结果,有利于用户了解与对象实体相关的医学信息,从医学知识平台中获取同时与所述对象实体及所述属性实体对应的信息作为所述医学信息查询请求的搜索结果,并从所述医学知识平台中获取与所述目标对象对应的信息作为所述医学信息查询请求的关联结果。本发明在利用对象实体与属性实体进行查询医学信息之前对查询文本进行纠错处理及命名实体识别,能够准确识别出用户的意图,进而搜索出用户所需的搜索结果,此外,本发明在提供用户所需的搜索结果的同时,还能搜索出与搜索意图相关联的关联结果,进而为用户的临床诊断等医疗工作提供重要的参考价值。本发明还应用于智慧医疗场景中,从而推动智慧城市的建设。
附图说明
图1是本发明医学信息查询方法的较佳实施例的流程图。
图2是本发明医学信息查询装置的较佳实施例的功能模块图。
图3是本发明实现医学信息查询方法的较佳实施例的电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
如图1所示,是本发明医学信息查询方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
所述医学信息查询方法应用于智慧医疗场景中,从而推动智慧城市的建设。所述医学信息查询方法应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的计算机可读指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital SignalProcessor,DSP)、嵌入式设备等。
所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能穿戴式设备等。
所述电子设备可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络电子设备、多个网络电子设备组成的电子设备组或基于云计算(CloudComputing)的由大量主机或网络电子设备构成的云。
所述电子设备所处的网络包括,但不限于:互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
S10,当接收到医学信息查询请求时,从所述医学信息查询请求中提取查询文本。
在本发明的至少一个实施例中,所述医学信息查询请求可以由医生触发,也可以由医学院学生触发,本发明对所述医学信息查询请求的触发用户不作限制。
进一步地,所述医学信息查询请求携带的请求信息包括:所述查询文本、触发所述医学信息查询请求的用户ID。所述用户ID可以是医学知识平台的用户登录账号。
在本发明的至少一个实施例中,所述电子设备从所述医学信息查询请求中提取查询文本包括:
确定所述医学信息查询请求所属的请求类型;
根据所述请求类型从预设线程池中确定目标线程;
利用所述目标线程解析所述医学信息查询请求的方法体,得到所述医学信息查询请求携带的请求信息;
从标签配置表中获取预设标签,所述标签配置表中存储多个预先定义好的标签;
从所述请求信息中获取与所述预设标签对应的信息作为所述查询文本。
例如,所述请求类型包括查询类型等。
进一步地,所述预设标签可以是text。
具体地,所述电子设备获取所述医学信息查询请求的请求标识,根据所述请求标识确定所述医学信息查询请求所属的请求类型。
通过确定所述请求类型,能够确定出适合解析所述医学信息查询请求的线程,此外,上述实施方式无需解析整个所述医学信息查询请求,能够提高所述医学信息查询请求的解析效率,进而利用预设标签与查询文本的映射关系,能够准确确定所述查询文本。
S11,对所述查询文本进行纠错处理,得到多个查询词语。
在本发明的至少一个实施例中,所述多个查询词语是经过对所述查询文本进行分词、纠错、标准化处理后得到的。
在本发明的至少一个实施例中,所述电子设备对所述查询文本进行纠错处理,得到多个查询词语包括:
利用预先构建的语法检测模型检测所述查询文本中是否存在待纠错词;
当检测到所述查询文本中存在所述待纠错词时,确定所述待纠错词的词语长度;
根据所述词语长度确定备选集,并计算所述待纠错词与所述备选集中的每个备选词的相似度;
将相似度最大的备选词确定为替换词,并在所述查询文本中将所述待纠错词替换为所述替换词,得到纠错后的查询文本;
根据预设词典对所述查询文本进行切分,得到多个切分序列,所述预设词典中包括自定义词与所述自定义词的权值;
根据所述预设词典中的权值计算每个切分序列的切分概率;
将切分概率最大的切分序列确定为所述多个查询词语。
通过上述实施方式,不仅能够将所述查询文本中的待纠错词进行替换,进而得到准确的所述纠错后的查询文本,还能够通过预设词典切分所述第一文本,能够根据需求切分所述纠错后的查询文本,进而得到所述多个查询词语。
具体地,所述电子设备可以利用所述语法检测模型检测所述查询文本中语句是否通顺,用词是否错误等,进而对所述待纠错词进行标注,标注的方式可以是对所述待纠错词进行加粗。
S12,对所述多个查询词语进行命名实体识别,得到所述查询文本的对象实体及所述查询文本的属性实体。
在本发明的至少一个实施例中,所述对象实体可以是所述查询文本中的查询对象,所述属性实体可以是所述查询文本中的查询维度。例如:所述查询文本为:糖尿病的检验检查,所述对象实体可以是:糖尿病,所述属性实体可以是检查。
在本发明的至少一个实施例中,所述电子设备对所述多个查询词语进行命名实体识别,得到所述查询文本的对象实体及所述查询文本的属性实体包括:
对所述多个查询词语进行向量化处理,得到输入向量序列;
将所述输入向量序列输入至预先构建的实体识别模型中,并获取所述实体识别模型的激活层中每个序列位置上所有标签的输出概率及每个序列位置上所有标签的转移概率;
对于每个序列位置,将所述输出概率及所述转移概率进行加权和运算,得到每个序列位置的上所有标签的目标概率;
将目标概率最高的标签确定为每个序列位置上的输出标签,并组合每个序列位置上的输出标签,得到所述查询文本的实体列表;
从所述实体列表中选取出与预设对象匹配的实体作为所述对象实体,并从所述实体列表中选取出与预设属性匹配的实体作为所述属性实体。
其中,所述预设对象包括:糖尿病等各种疾病、头孢地尼胶囊等各种药品。
进一步地,所述预设属性包括:诊断、检查等维度。
通过输出概率及转移概率能够准确确定出所述查询文本对应的实体列表,进而根据所述预设对象能够准确确定出所述对象实体,及根据所述预设属性能够准确确定出所述属性实体。
具体地,所述实体识别模型包括:
基于长短期记忆网络(Long Short-Term Memory,LSTM)和条件随机场(Conditional Random Fields,CRF)的模型;或基于双向长短期记忆网络(Bi LSTM)和条件随机场的模型;或基于BiGRU和条件随机场的模型。
S13,从预设关联表中获取所述对象实体的实体识别码,并获取与所述实体识别码关联的关联识别码。
在本发明的至少一个实施例中,所述实体识别码是指与所述对象实体对应的编码,例如,所述实体识别码可以是23546。
在本发明的至少一个实施例中,在所述预设关联表中存储多个对象实体对应的多个实体识别码,与所述多个实体识别码关联的识别码、所述实体识别码与所述关联识别码的关联强度。
在本发明的至少一个实施例中,在从预设关联表中获取所述对象实体的实体识别码之前,所述方法还包括:
从预设词表中爬取与所述对象实体对应的目标词条;
从所述目标词条中识别出多个预设实体,所述预设实体包括疾病实体及药品实体;
计算每个预设实体在所述目标词条中的目标数量,并计算所述目标词条中所述多个预设实体的实体数量;
将所述目标数量除以所述实体数量,得到每个预设实体与所述对象实体的关联强度;
利用编码生成器生成所述对象实体的实体识别码,并利用所述编码生成器生成所述多个预设实体的关联识别码;
根据所述实体识别码、所述关联识别码及所述关联强度生成三元组,得到所述预设关联表。
其中,所述预设词表包括医生指南用书、药品说明书、病历处方、超说明书等。
进一步地,所述目标词条是指包含所述对象实体的预设词表。
更进一步地,所述三元组可以是((实体识别码,关联识别码),关联强度)。
通过上述实施方式,能够生成所述预设关联表,以便电子设备获取实体识别码等信息。
S14,确定所述关联识别码对应的关联对象,并确定所述关联对象与所述对象实体的关联强度。
在本发明的至少一个实施例中,所述电子设备从与所述编码生成器对应的编码表中获取与所述关联识别码对应的对象作为所述关联对象。
在本发明的至少一个实施例中,所述预设关联表中存储所述实体识别码、所述关联识别码及所述关联强度,可以理解的是,所述电子设备能够直接从所述预设关联表中获取与所述关联对象与所述对象实体的关联强度。
S15,选取关联强度大于预设阈值的关联对象作为目标对象。
在本发明的至少一个实施例中,所述预设阈值可以根据用户需求设定,本发明对所述预设阈值的取值不作限制。
在本发明的至少一个实施例中,所述电子设备选取关联强度大于预设阈值的关联对象作为目标对象包括:
将所述关联对象的关联强度与所述预设阈值进行比较;
当检测到任意关联强度大于所述预设阈值时,将所述任意关联强度对应的关联对象确定为所述目标对象。
S16,从医学知识平台中获取同时与所述对象实体及所述属性实体对应的信息作为所述医学信息查询请求的搜索结果,并从所述医学知识平台中获取与所述目标对象对应的信息作为所述医学信息查询请求的关联结果。
需要强调的是,为进一步保证上述搜索结果及上述关联结果的私密和安全性,上述搜索结果及上述关联结果还可以存储于一区块链的节点中。
在本发明的至少一个实施例中,所述电子设备从医学知识平台中获取同时与所述对象实体及所述属性实体对应的信息作为所述医学信息查询请求的搜索结果包括:
确定所述对象实体与所述属性实体中实体的目标个数;
调用线程数量为所述目标个数的闲置线程;
利用所述闲置线程中任一线程从所述医学知识平台中获取与所述对象实体对应的第一信息,并利用所述闲置线程中的其他线程从所述医学知识平台中获取与所述属性实体对应的第二信息;
获取所述第一信息与所述第二信息的交集作为所述搜索结果。
通过上述实施方式,由于调用线程数量为所述目标个数的闲置线程获取所述搜索结果,因此,能够快速获取到所述搜索结果。
在本发明的至少一个实施例中,所述方法还包括:
确定所述医学信息查询请求的触发用户,并确定所述医学信息查询请求的触发设备;
获取所述触发用户的用户行为数据;
根据所述用户行为数据确定所述触发用户的关注对象;
从所述医学知识平台中获取与所述关注对象对应的关注信息;
向所述触发设备推送所述关注信息。
通过上述实施方式,能够向所述触发用户个性化推送所述关注信息,有利于提高所述触发用户的体验度。
由以上技术方案可以看出,本发明能够当接收到医学信息查询请求时,从所述医学信息查询请求中提取查询文本,对所述查询文本进行纠错处理,得到多个查询词语,通过对查询文本进行纠错处理,有利于准确识别出用户的搜索意图,对所述多个查询词语进行命名实体识别,得到所述查询文本的对象实体及所述查询文本的属性实体,能够确定出规范化的标准用词,进而有利于准确确定搜索结果,从预设关联表获取所述对象实体的实体识别码,并获取与所述实体识别码关联的关联识别码,确定所述关联识别码对应的关联对象,并确定所述关联对象与所述对象实体的关联强度,选取关联强度大于预设阈值的关联对象作为目标对象,能够确定出关联强度大于预设阈值的关联对象,进而确定出与所述医学信息查询请求中的对象实体相关联的关联结果,有利于用户了解与对象实体相关的医学信息,从医学知识平台中获取同时与所述对象实体及所述属性实体对应的信息作为所述医学信息查询请求的搜索结果,并从所述医学知识平台中获取与所述目标对象对应的信息作为所述医学信息查询请求的关联结果。本发明在利用对象实体与属性实体进行查询医学信息之前对查询文本进行纠错处理及命名实体识别,能够准确识别出用户的意图,进而搜索出用户所需的搜索结果,此外,本发明在提供用户所需的搜索结果的同时,还能搜索出与搜索意图相关联的关联结果,进而为用户的临床诊断等医疗工作提供重要的参考价值。本发明还应用于智慧医疗场景中,从而推动智慧城市的建设。
如图2所示,是本发明医学信息查询装置的较佳实施例的功能模块图。所述医学信息查询装置11包括提取单元110、处理单元111、识别单元112、获取单元113、确定单元114、选取单元115、爬取单元116、计算单元117、生成单元118及推送单元119。本发明所称的模块/单元是指一种能够被处理器13所获取,并且能够完成固定功能的一系列计算机可读指令段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
当接收到医学信息查询请求时,提取单元110从所述医学信息查询请求中提取查询文本。
在本发明的至少一个实施例中,所述医学信息查询请求可以由医生触发,也可以由医学院学生触发,本发明对所述医学信息查询请求的触发用户不作限制。
进一步地,所述医学信息查询请求携带的请求信息包括:所述查询文本、触发所述医学信息查询请求的用户ID。所述用户ID可以是医学知识平台的用户登录账号。
在本发明的至少一个实施例中,所述提取单元110从所述医学信息查询请求中提取查询文本包括:
确定所述医学信息查询请求所属的请求类型;
根据所述请求类型从预设线程池中确定目标线程;
利用所述目标线程解析所述医学信息查询请求的方法体,得到所述医学信息查询请求携带的请求信息;
从标签配置表中获取预设标签,所述标签配置表中存储多个预先定义好的标签;
从所述请求信息中获取与所述预设标签对应的信息作为所述查询文本。
例如,所述请求类型包括查询类型等。
进一步地,所述预设标签可以是text。
具体地,所述提取单元110获取所述医学信息查询请求的请求标识,根据所述请求标识确定所述医学信息查询请求所属的请求类型。
通过确定所述请求类型,能够确定出适合解析所述医学信息查询请求的线程,此外,上述实施方式无需解析整个所述医学信息查询请求,能够提高所述医学信息查询请求的解析效率,进而利用预设标签与查询文本的映射关系,能够准确确定所述查询文本。
处理单元111对所述查询文本进行纠错处理,得到多个查询词语。
在本发明的至少一个实施例中,所述多个查询词语是经过对所述查询文本进行分词、纠错、标准化处理后得到的。
在本发明的至少一个实施例中,所述处理单元111对所述查询文本进行纠错处理,得到多个查询词语包括:
利用预先构建的语法检测模型检测所述查询文本中是否存在待纠错词;
当检测到所述查询文本中存在所述待纠错词时,确定所述待纠错词的词语长度;
根据所述词语长度确定备选集,并计算所述待纠错词与所述备选集中的每个备选词的相似度;
将相似度最大的备选词确定为替换词,并在所述查询文本中将所述待纠错词替换为所述替换词,得到纠错后的查询文本;
根据预设词典对所述查询文本进行切分,得到多个切分序列,所述预设词典中包括自定义词与所述自定义词的权值;
根据所述预设词典中的权值计算每个切分序列的切分概率;
将切分概率最大的切分序列确定为所述多个查询词语。
通过上述实施方式,不仅能够将所述查询文本中的待纠错词进行替换,进而得到准确的所述纠错后的查询文本,还能够通过预设词典切分所述第一文本,能够根据需求切分所述纠错后的查询文本,进而得到所述多个查询词语。
具体地,所述处理单元111可以利用所述语法检测模型检测所述查询文本中语句是否通顺,用词是否错误等,进而对所述待纠错词进行标注,标注的方式可以是对所述待纠错词进行加粗。
识别单元112对所述多个查询词语进行命名实体识别,得到所述查询文本的对象实体及所述查询文本的属性实体。
在本发明的至少一个实施例中,所述对象实体可以是所述查询文本中的查询对象,所述属性实体可以是所述查询文本中的查询维度。例如:所述查询文本为:糖尿病的检验检查,所述对象实体可以是:糖尿病,所述属性实体可以是检查。
在本发明的至少一个实施例中,所述识别单元112对所述多个查询词语进行命名实体识别,得到所述查询文本的对象实体及所述查询文本的属性实体包括:
对所述多个查询词语进行向量化处理,得到输入向量序列;
将所述输入向量序列输入至预先构建的实体识别模型中,并获取所述实体识别模型的激活层中每个序列位置上所有标签的输出概率及每个序列位置上所有标签的转移概率;
对于每个序列位置,将所述输出概率及所述转移概率进行加权和运算,得到每个序列位置的上所有标签的目标概率;
将目标概率最高的标签确定为每个序列位置上的输出标签,并组合每个序列位置上的输出标签,得到所述查询文本的实体列表;
从所述实体列表中选取出与预设对象匹配的实体作为所述对象实体,并从所述实体列表中选取出与预设属性匹配的实体作为所述属性实体。
其中,所述预设对象包括:糖尿病等各种疾病、头孢地尼胶囊等各种药品。
进一步地,所述预设属性包括:诊断、检查等维度。
通过输出概率及转移概率能够准确确定出所述查询文本对应的实体列表,进而根据所述预设对象能够准确确定出所述对象实体,及根据所述预设属性能够准确确定出所述属性实体。
具体地,所述实体识别模型包括:
基于长短期记忆网络(Long Short-Term Memory,LSTM)和条件随机场(Conditional Random Fields,CRF)的模型;或基于双向长短期记忆网络(Bi LSTM)和条件随机场的模型;或基于BiGRU和条件随机场的模型。
获取单元113从预设关联表中获取所述对象实体的实体识别码,并获取与所述实体识别码关联的关联识别码。
在本发明的至少一个实施例中,所述实体识别码是指与所述对象实体对应的编码,例如,所述实体识别码可以是23546。
在本发明的至少一个实施例中,在所述预设关联表中存储多个对象实体对应的多个实体识别码,与所述多个实体识别码关联的识别码、所述实体识别码与所述关联识别码的关联强度。
在本发明的至少一个实施例中,在从预设关联表中获取所述对象实体的实体识别码之前,爬取单元116从预设词表中爬取与所述对象实体对应的目标词条;
所述识别单元112从所述目标词条中识别出多个预设实体,所述预设实体包括疾病实体及药品实体;
计算单元117计算每个预设实体在所述目标词条中的目标数量,并计算所述目标词条中所述多个预设实体的实体数量;
所述计算单元117将所述目标数量除以所述实体数量,得到每个预设实体与所述对象实体的关联强度;
生成单元118利用编码生成器生成所述对象实体的实体识别码,并利用所述编码生成器生成所述多个预设实体的关联识别码;
所述生成单元118根据所述实体识别码、所述关联识别码及所述关联强度生成三元组,得到所述预设关联表。
其中,所述预设词表包括医生指南用书、药品说明书、病历处方、超说明书等。
进一步地,所述目标词条是指包含所述对象实体的预设词表。
更进一步地,所述三元组可以是((实体识别码,关联识别码),关联强度)。
通过上述实施方式,能够生成所述预设关联表,以便获取实体识别码等信息。
确定单元114确定所述关联识别码对应的关联对象,并确定所述关联对象与所述对象实体的关联强度。
在本发明的至少一个实施例中,所述确定单元114从与所述编码生成器对应的编码表中获取与所述关联识别码对应的对象作为所述关联对象。
在本发明的至少一个实施例中,所述预设关联表中存储所述实体识别码、所述关联识别码及所述关联强度,可以理解的是,所述确定单元114能够直接从所述预设关联表中获取与所述关联对象与所述对象实体的关联强度。
选取单元115选取关联强度大于预设阈值的关联对象作为目标对象。
在本发明的至少一个实施例中,所述预设阈值可以根据用户需求设定,本发明对所述预设阈值的取值不作限制。
在本发明的至少一个实施例中,所述选取单元115选取关联强度大于预设阈值的关联对象作为目标对象包括:
将所述关联对象的关联强度与所述预设阈值进行比较;
当检测到任意关联强度大于所述预设阈值时,将所述任意关联强度对应的关联对象确定为所述目标对象。
所述获取单元113从医学知识平台中获取同时与所述对象实体及所述属性实体对应的信息作为所述医学信息查询请求的搜索结果,并从所述医学知识平台中获取与所述目标对象对应的信息作为所述医学信息查询请求的关联结果。
需要强调的是,为进一步保证上述搜索结果及上述关联结果的私密和安全性,上述搜索结果及上述关联结果还可以存储于一区块链的节点中。
在本发明的至少一个实施例中,所述获取单元113从医学知识平台中获取同时与所述对象实体及所述属性实体对应的信息作为所述医学信息查询请求的搜索结果包括:
确定所述对象实体与所述属性实体中实体的目标个数;
调用线程数量为所述目标个数的闲置线程;
利用所述闲置线程中任一线程从所述医学知识平台中获取与所述对象实体对应的第一信息,并利用所述闲置线程中的其他线程从所述医学知识平台中获取与所述属性实体对应的第二信息;
获取所述第一信息与所述第二信息的交集作为所述搜索结果。
通过上述实施方式,由于调用线程数量为所述目标个数的闲置线程获取所述搜索结果,因此,能够快速获取到所述搜索结果。
在本发明的至少一个实施例中,所述确定单元114确定所述医学信息查询请求的触发用户,并确定所述医学信息查询请求的触发设备;
所述获取单元113获取所述触发用户的用户行为数据;
所述确定单元114根据所述用户行为数据确定所述触发用户的关注对象;
所述获取单元113从所述医学知识平台中获取与所述关注对象对应的关注信息;
推送单元119向所述触发设备推送所述关注信息。
通过上述实施方式,能够向所述触发用户个性化推送所述关注信息,有利于提高所述触发用户的体验度。
由以上技术方案可以看出,本发明能够当接收到医学信息查询请求时,从所述医学信息查询请求中提取查询文本,对所述查询文本进行纠错处理,得到多个查询词语,通过对查询文本进行纠错处理,有利于准确识别出用户的搜索意图,对所述多个查询词语进行命名实体识别,得到所述查询文本的对象实体及所述查询文本的属性实体,能够确定出规范化的标准用词,进而有利于准确确定搜索结果,从预设关联表获取所述对象实体的实体识别码,并获取与所述实体识别码关联的关联识别码,确定所述关联识别码对应的关联对象,并确定所述关联对象与所述对象实体的关联强度,选取关联强度大于预设阈值的关联对象作为目标对象,能够确定出关联强度大于预设阈值的关联对象,进而确定出与所述医学信息查询请求中的对象实体相关联的关联结果,有利于用户了解与对象实体相关的医学信息,从医学知识平台中获取同时与所述对象实体及所述属性实体对应的信息作为所述医学信息查询请求的搜索结果,并从所述医学知识平台中获取与所述目标对象对应的信息作为所述医学信息查询请求的关联结果。本发明在利用对象实体与属性实体进行查询医学信息之前对查询文本进行纠错处理及命名实体识别,能够准确识别出用户的意图,进而搜索出用户所需的搜索结果,此外,本发明在提供用户所需的搜索结果的同时,还能搜索出与搜索意图相关联的关联结果,进而为用户的临床诊断等医疗工作提供重要的参考价值。本发明还应用于智慧医疗场景中,从而推动智慧城市的建设。
如图3所示,是本发明实现医学信息查询方法的较佳实施例的电子设备的结构示意图。
在本发明的一个实施例中,所述电子设备1包括,但不限于,存储器12、处理器13,以及存储在所述存储器12中并可在所述处理器13上运行的计算机可读指令,例如医学信息查询程序。
本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备1还可以包括输入输出设备、网络接入设备、总线等。
所述处理器13可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器13是所述电子设备1的运算核心和控制中心,利用各种接口和线路连接整个电子设备1的各个部分,及执行所述电子设备1的操作***以及安装的各类应用程序、程序代码等。
示例性的,所述计算机可读指令可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该计算机可读指令段用于描述所述计算机可读指令在所述电子设备1中的执行过程。例如,所述计算机可读指令可以被分割成提取单元110、处理单元111、识别单元112、获取单元113、确定单元114、选取单元115、爬取单元116、计算单元117、生成单元118及推送单元119。
所述存储器12可用于存储所述计算机可读指令和/或模块,所述处理器13通过运行或执行存储在所述存储器12内的计算机可读指令和/或模块,以及调用存储在存储器12内的数据,实现所述电子设备1的各种功能。所述存储器12可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。存储器12可以包括非易失性和易失性存储器,例如:硬盘、内存、插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他存储器件。
所述存储器12可以是电子设备1的外部存储器和/或内部存储器。进一步地,所述存储器12可以是具有实物形式的存储器,如内存条、TF卡(Trans-flash Card)等等。
所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一计算机可读存储介质中,该计算机可读指令在被处理器执行时,可实现上述各个方法实施例的步骤。
其中,所述计算机可读指令包括计算机可读指令代码,所述计算机可读指令代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机可读指令代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
结合图1,所述电子设备1中的所述存储器12存储计算机可读指令实现一种医学信息查询方法,所述处理器13可执行所述计算机可读指令从而实现:
当接收到医学信息查询请求时,从所述医学信息查询请求中提取查询文本;
对所述查询文本进行纠错处理,得到多个查询词语;
对所述多个查询词语进行命名实体识别,得到所述查询文本的对象实体及所述查询文本的属性实体;
从预设关联表中获取所述对象实体的实体识别码,并获取与所述实体识别码关联的关联识别码;
确定所述关联识别码对应的关联对象,并确定所述关联对象与所述对象实体的关联强度;
选取关联强度大于预设阈值的关联对象作为目标对象;
从医学知识平台中获取同时与所述对象实体及所述属性实体对应的信息作为所述医学信息查询请求的搜索结果,并从所述医学知识平台中获取与所述目标对象对应的信息作为所述医学信息查询请求的关联结果。
具体地,所述处理器13对上述计算机可读指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述计算机可读存储介质上存储有计算机可读指令,其中,所述计算机可读指令被处理器13执行时用以实现以下步骤:
当接收到医学信息查询请求时,从所述医学信息查询请求中提取查询文本;
对所述查询文本进行纠错处理,得到多个查询词语;
对所述多个查询词语进行命名实体识别,得到所述查询文本的对象实体及所述查询文本的属性实体;
从预设关联表中获取所述对象实体的实体识别码,并获取与所述实体识别码关联的关联识别码;
确定所述关联识别码对应的关联对象,并确定所述关联对象与所述对象实体的关联强度;
选取关联强度大于预设阈值的关联对象作为目标对象;
从医学知识平台中获取同时与所述对象实体及所述属性实体对应的信息作为所述医学信息查询请求的搜索结果,并从所述医学知识平台中获取与所述目标对象对应的信息作为所述医学信息查询请求的关联结果。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。***权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (8)
1.一种医学信息查询方法,其特征在于,所述医学信息查询方法包括:
当接收到医学信息查询请求时,从所述医学信息查询请求中提取查询文本;
对所述查询文本进行纠错处理,得到多个查询词语,包括:利用预先构建的语法检测模型检测所述查询文本中是否存在待纠错词;当检测到所述查询文本中存在所述待纠错词时,确定所述待纠错词的词语长度;根据所述词语长度确定备选集,并计算所述待纠错词与所述备选集中的每个备选词的相似度;将相似度最大的备选词确定为替换词,并在所述查询文本中将所述待纠错词替换为所述替换词,得到纠错后的查询文本;根据预设词典对所述查询文本进行切分,得到多个切分序列,所述预设词典中包括自定义词与所述自定义词的权值;根据所述预设词典中的权值计算每个切分序列的切分概率;将切分概率最大的切分序列确定为所述多个查询词语;
对所述多个查询词语进行命名实体识别,得到所述查询文本的对象实体及所述查询文本的属性实体,包括:对所述多个查询词语进行向量化处理,得到输入向量序列;将所述输入向量序列输入至预先构建的实体识别模型中,并获取所述实体识别模型的激活层中每个序列位置上所有标签的输出概率及每个序列位置上所有标签的转移概率;对于每个序列位置,将所述输出概率及所述转移概率进行加权和运算,得到每个序列位置的上所有标签的目标概率;将目标概率最高的标签确定为每个序列位置上的输出标签,并组合每个序列位置上的输出标签,得到所述查询文本的实体列表;从所述实体列表中选取出与预设对象匹配的实体作为所述对象实体,并从所述实体列表中选取出与预设属性匹配的实体作为所述属性实体;
从预设关联表中获取所述对象实体的实体识别码,并获取与所述实体识别码关联的关联识别码;
确定所述关联识别码对应的关联对象,并确定所述关联对象与所述对象实体的关联强度;
选取关联强度大于预设阈值的关联对象作为目标对象;
从医学知识平台中获取同时与所述对象实体及所述属性实体对应的信息作为所述医学信息查询请求的搜索结果,并从所述医学知识平台中获取与所述目标对象对应的信息作为所述医学信息查询请求的关联结果。
2.如权利要求1所述的医学信息查询方法,其特征在于,所述从所述医学信息查询请求中提取查询文本包括:
确定所述医学信息查询请求所属的请求类型;
根据所述请求类型从预设线程池中确定目标线程;
利用所述目标线程解析所述医学信息查询请求的方法体,得到所述医学信息查询请求携带的请求信息;
从标签配置表中获取预设标签,所述标签配置表中存储多个预先定义好的标签;
从所述请求信息中获取与所述预设标签对应的信息作为所述查询文本。
3.如权利要求1所述的医学信息查询方法,其特征在于,在从预设关联表获取所述对象实体的实体识别码之前,所述方法还包括:
从预设词表中爬取与所述对象实体对应的目标词条;
从所述目标词条中识别出多个预设实体,所述预设实体包括疾病实体及药品实体;
计算每个预设实体在所述目标词条中的目标数量,并计算所述目标词条中所述多个预设实体的实体数量;
将所述目标数量除以所述实体数量,得到每个预设实体与所述对象实体的关联强度;
利用编码生成器生成所述对象实体的实体识别码,并利用所述编码生成器生成所述多个预设实体的关联识别码;
根据所述实体识别码、所述关联识别码及所述关联强度生成三元组,得到所述预设关联表。
4.如权利要求1所述的医学信息查询方法,其特征在于,所述从医学知识平台中获取同时与所述对象实体及所述属性实体对应的信息作为所述医学信息查询请求的搜索结果包括:
确定所述对象实体与所述属性实体中实体的目标个数;
调用线程数量为所述目标个数的闲置线程;
利用所述闲置线程中任一线程从所述医学知识平台中获取与所述对象实体对应的第一信息,并利用所述闲置线程中的其他线程从所述医学知识平台中获取与所述属性实体对应的第二信息;
获取所述第一信息与所述第二信息的交集作为所述搜索结果。
5.如权利要求1所述的医学信息查询方法,其特征在于,所述方法还包括:
确定所述医学信息查询请求的触发用户,并确定所述医学信息查询请求的触发设备;
获取所述触发用户的用户行为数据;
根据所述用户行为数据确定所述触发用户的关注对象;
从所述医学知识平台中获取与所述关注对象对应的关注信息;
向所述触发设备推送所述关注信息。
6.一种医学信息查询装置,其特征在于,所述医学信息查询装置包括:
提取单元,用于当接收到医学信息查询请求时,从所述医学信息查询请求中提取查询文本;
处理单元,用于对所述查询文本进行纠错处理,得到多个查询词语,包括:利用预先构建的语法检测模型检测所述查询文本中是否存在待纠错词;当检测到所述查询文本中存在所述待纠错词时,确定所述待纠错词的词语长度;根据所述词语长度确定备选集,并计算所述待纠错词与所述备选集中的每个备选词的相似度;将相似度最大的备选词确定为替换词,并在所述查询文本中将所述待纠错词替换为所述替换词,得到纠错后的查询文本;根据预设词典对所述查询文本进行切分,得到多个切分序列,所述预设词典中包括自定义词与所述自定义词的权值;根据所述预设词典中的权值计算每个切分序列的切分概率;将切分概率最大的切分序列确定为所述多个查询词语;
识别单元,用于对所述多个查询词语进行命名实体识别,得到所述查询文本的对象实体及所述查询文本的属性实体,包括:对所述多个查询词语进行向量化处理,得到输入向量序列;将所述输入向量序列输入至预先构建的实体识别模型中,并获取所述实体识别模型的激活层中每个序列位置上所有标签的输出概率及每个序列位置上所有标签的转移概率;对于每个序列位置,将所述输出概率及所述转移概率进行加权和运算,得到每个序列位置的上所有标签的目标概率;将目标概率最高的标签确定为每个序列位置上的输出标签,并组合每个序列位置上的输出标签,得到所述查询文本的实体列表;从所述实体列表中选取出与预设对象匹配的实体作为所述对象实体,并从所述实体列表中选取出与预设属性匹配的实体作为所述属性实体;
获取单元,用于从预设关联表中获取所述对象实体的实体识别码,并获取与所述实体识别码关联的关联识别码;
确定单元,用于确定所述关联识别码对应的关联对象,并确定所述关联对象与所述对象实体的关联强度;
选取单元,用于选取关联强度大于预设阈值的关联对象作为目标对象;
所述获取单元,还用于从医学知识平台中获取同时与所述对象实体及所述属性实体对应的信息作为所述医学信息查询请求的搜索结果,并从所述医学知识平台中获取与所述目标对象对应的信息作为所述医学信息查询请求的关联结果。
7. 一种电子设备,其特征在于,所述电子设备包括:
存储器,存储有计算机可读指令;及
处理器,执行所述存储器中存储的计算机可读指令以实现如权利要求1至5中任意一项所述的医学信息查询方法。
8.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现如权利要求1至5中任意一项所述的医学信息查询方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010917937.0A CN111985241B (zh) | 2020-09-03 | 2020-09-03 | 医学信息查询方法、装置、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010917937.0A CN111985241B (zh) | 2020-09-03 | 2020-09-03 | 医学信息查询方法、装置、电子设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111985241A CN111985241A (zh) | 2020-11-24 |
CN111985241B true CN111985241B (zh) | 2023-08-08 |
Family
ID=73447456
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010917937.0A Active CN111985241B (zh) | 2020-09-03 | 2020-09-03 | 医学信息查询方法、装置、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111985241B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112687403B (zh) * | 2021-01-08 | 2022-12-02 | 拉扎斯网络科技(上海)有限公司 | 药品词典的生成及药品搜索方法及装置 |
CN112988789B (zh) * | 2021-02-02 | 2023-07-25 | 腾讯科技(深圳)有限公司 | 医学数据查询方法、装置及终端 |
CN112818088B (zh) * | 2021-02-23 | 2023-09-29 | 平安科技(深圳)有限公司 | 商品搜索数据处理方法、装置、设备及存储介质 |
CN113326438A (zh) * | 2021-06-28 | 2021-08-31 | 北京百度网讯科技有限公司 | 信息查询方法、装置、电子设备以及存储介质 |
CN113657102B (zh) * | 2021-08-17 | 2023-05-30 | 北京百度网讯科技有限公司 | 信息抽取方法、装置、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109146610A (zh) * | 2018-07-16 | 2019-01-04 | 众安在线财产保险股份有限公司 | 一种智能保险推荐方法、装置及智能保险机器人设备 |
CN109215796A (zh) * | 2018-08-14 | 2019-01-15 | 平安医疗健康管理股份有限公司 | 搜索方法、装置、计算机设备和存储介质 |
WO2019085779A1 (zh) * | 2017-11-01 | 2019-05-09 | 阿里巴巴集团控股有限公司 | 机器处理及文本纠错方法和装置、计算设备以及存储介质 |
WO2019085236A1 (zh) * | 2017-10-31 | 2019-05-09 | 北京小度信息科技有限公司 | 检索意图识别方法、装置、电子设备及可读存储介质 |
WO2020007224A1 (zh) * | 2018-07-06 | 2020-01-09 | 中兴通讯股份有限公司 | 知识图谱构建及智能应答方法、装置、设备及存储介质 |
CN111581337A (zh) * | 2020-03-19 | 2020-08-25 | 平安科技(深圳)有限公司 | 医疗文本搜索方法、装置、计算机设备及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8041733B2 (en) * | 2008-10-14 | 2011-10-18 | Yahoo! Inc. | System for automatically categorizing queries |
US11789952B2 (en) * | 2018-09-26 | 2023-10-17 | Salesforce, Inc. | Ranking enterprise search results based on relationships between users |
-
2020
- 2020-09-03 CN CN202010917937.0A patent/CN111985241B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019085236A1 (zh) * | 2017-10-31 | 2019-05-09 | 北京小度信息科技有限公司 | 检索意图识别方法、装置、电子设备及可读存储介质 |
WO2019085779A1 (zh) * | 2017-11-01 | 2019-05-09 | 阿里巴巴集团控股有限公司 | 机器处理及文本纠错方法和装置、计算设备以及存储介质 |
WO2020007224A1 (zh) * | 2018-07-06 | 2020-01-09 | 中兴通讯股份有限公司 | 知识图谱构建及智能应答方法、装置、设备及存储介质 |
CN109146610A (zh) * | 2018-07-16 | 2019-01-04 | 众安在线财产保险股份有限公司 | 一种智能保险推荐方法、装置及智能保险机器人设备 |
CN109215796A (zh) * | 2018-08-14 | 2019-01-15 | 平安医疗健康管理股份有限公司 | 搜索方法、装置、计算机设备和存储介质 |
CN111581337A (zh) * | 2020-03-19 | 2020-08-25 | 平安科技(深圳)有限公司 | 医疗文本搜索方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111985241A (zh) | 2020-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111985241B (zh) | 医学信息查询方法、装置、电子设备及介质 | |
CN112417096B (zh) | 问答对匹配方法、装置、电子设备及存储介质 | |
WO2022105122A1 (zh) | 基于人工智能的答案生成方法、装置、计算机设备及介质 | |
WO2021114736A1 (zh) | 医疗问诊辅助方法、装置、电子设备及介质 | |
CN112860848B (zh) | 信息检索方法、装置、设备及介质 | |
CN111883251A (zh) | 医疗误诊检测方法、装置、电子设备及存储介质 | |
CN113032528A (zh) | 案件分析方法、装置、设备及存储介质 | |
CN111986793A (zh) | 基于人工智能的导诊处理方法、装置、计算机设备及介质 | |
CN115346634A (zh) | 一种体检报告解读预测方法、***、电子设备和存储介质 | |
CN113111159A (zh) | 问答记录生成方法、装置、电子设备及存储介质 | |
CN112199494B (zh) | 医疗信息搜索方法、装置、电子设备及存储介质 | |
CN113470775B (zh) | 信息采集方法、装置、设备及存储介质 | |
CN115222443A (zh) | 客户群体划分方法、装置、设备及存储介质 | |
CN114706985A (zh) | 文本分类方法、装置、电子设备及存储介质 | |
CN114328968A (zh) | 医学知识图谱的构建方法、装置、电子设备和介质 | |
WO2021174923A1 (zh) | 概念词序列生成方法、装置、计算机设备及存储介质 | |
CN113705468A (zh) | 基于人工智能的数字图像识别方法及相关设备 | |
CN112199483A (zh) | 信息录入辅助方法、装置、电子设备及存储介质 | |
CN113420143B (zh) | 文书摘要生成方法、装置、设备及存储介质 | |
CN113326365B (zh) | 回复语句生成方法、装置、设备及存储介质 | |
CN114360732B (zh) | 医疗数据分析方法、装置、电子设备及存储介质 | |
CN111933241B (zh) | 医疗数据解析方法、装置、电子设备及存储介质 | |
CN112949305B (zh) | 负反馈信息采集方法、装置、设备及存储介质 | |
CN111507109A (zh) | 电子病历的命名实体识别方法及装置 | |
CN115358817A (zh) | 基于社交数据的智能产品推荐方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220929 Address after: Room 2601 (Unit 07), Qianhai Free Trade Building, No. 3048, Xinghai Avenue, Nanshan Street, Qianhai Shenzhen-Hong Kong Cooperation Zone, Shenzhen, Guangdong 518000 Applicant after: Shenzhen Ping An Smart Healthcare Technology Co.,Ltd. Address before: 1-34 / F, Qianhai free trade building, 3048 Xinghai Avenue, Mawan, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong 518000 Applicant before: Ping An International Smart City Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |