CN117690581A

CN117690581A - 一种基于大语言模型的疾病问诊过程辅助信息生成方法

Info

Publication number: CN117690581A
Application number: CN202311706134.0A
Authority: CN
Inventors: 曹黎俊; 张云飞; 蔡占毅
Original assignee: Jiangsu Jiyuan Medical Technology Co ltd
Current assignee: Jiangsu Jiyuan Medical Technology Co ltd
Priority date: 2023-12-13
Filing date: 2023-12-13
Publication date: 2024-03-12

Abstract

本发明公开了一种基于大语言模型的疾病问诊过程辅助信息生成方法，属于医疗问诊领域。该方法主要包括以下步骤：一、信息识别：***自动记录医生与患者的交流内容，支持语音和文本输入，将语音输入转换为文本，然后理解对话内容，提取关键信息，根据关键信息在疾病库中匹配相应疾病作为参考。二、病例信息生成与导出：自动整合问诊内容、病史、症状、体征等，根据整合信息，自动生成病例模板，医生可根据需要编辑病例模板和相关信息，再将编辑好的病例以文本、PDF等格式导出。本发明能为医生和患者提供一个便捷、高效的疾病问诊过程的辅助信息生成功能，有助于提高医疗服务的质量和效率。

Description

一种基于大语言模型的疾病问诊过程辅助信息生成方法

技术领域

本发明涉及一种基于大语言模型的疾病问诊过程辅助信息生成方法，属于医疗问诊领域。

背景技术

随着科技的发展，人工智能技术在医疗领域的应用越来越广泛。尤其是在辅助疾病问诊和医疗信息查询生成方面，人工智能技术具有很高的实用价值。然而，传统的基于小型语言模型的辅助疾病问诊***在处理复杂问题和多领域知识时，仍然存在一定的局限性。因此，开发一种基于大语言模型的疾病问诊过程辅助信息生成方法具有重要的研究意义和实用价值。

首先，大语言模型具有更强的语义理解和表达能力。相较于传统的小型语言模型，大语言模型可以更好地理解疾病相关的复杂问题，为患者提供更准确、全面的问诊建议。此外，大语言模型还可以根据患者的病情和需求，生成个性化的治疗方案和健康指导，提高医疗服务的质量和效率。其次，大语言模型可以实现多领域知识的融合。在辅助疾病问诊和信息生成过程中，大语言模型可以自动调用相关领域的医学知识，为患者提供更专业、全面的医疗服务。此外，大语言模型还可以通过不断学习医学领域的最新研究和技术动态，不断提高自身的疾病信息生成能力，为患者提供更加精准的医疗服务。此外，基于大语言模型的疾病问诊过程的辅助信息生成方法具有较高的可靠性和安全性。同时，通过对大语言模型的训练和优化，可以不断提高其在辅助疾病信息生成方面的准确性和可靠性，确保患者获得高质量的医疗服务。最后，基于大语言模型的疾病问诊过程的辅助信息生成方法可以降低医疗成本和提高医疗服务可及性。通过线上问诊的方式，患者可以更方便地获得医生的问诊建议，减少不必要的线下就诊次数。同时，大语言模型可以协助医生处理大量病例和医学文献，提高医生的工作效率，降低医疗成本。

总之，基于大语言模型的疾病问诊过程辅助信息生成方法具有广泛的应用前景和重要的研究价值。随着人工智能技术的不断发展，这种方法将为我国医疗行业带来更加专业、高效、便捷的医疗服务，助力健康中国战略的实施。本发明就是基于大语言模型，提出了一种疾病问诊过程辅助信息生成方法。

发明内容

本发明的目的在于提出一种基于大语言模型的疾病问诊过程辅助信息生成方法，通过实时疾病匹配、先进的语音识别技术、强大的自然语言处理能力、信息整合与病例生成、灵活的编辑功能和多格式导出等功能，实现医疗工作者和患者之间的高效、智能的疾病问诊与信息获取。这种方法旨在减轻医疗工作者的负担，为患者提供更为准确、详细的疾病信息，有助于促进医疗资源的优化配置和提高医疗服务质量。通过引入大语言模型技术，本发明提供了一种创新性的医疗问诊与信息生成解决方案，具有广泛的应用前景。

本发明的目的通过以下技术方案予以实现：

一种基于大语言模型的疾病问诊过程辅助信息生成方法，包括以下步骤：

步骤1：对话记录：在医生与患者的交流过程中，***会自动记录对话内容，同时支持语音和文本输入。

步骤2：语音识别与文本转换：当用户选择语音输入时，***通过语音识别技术将语音转换为文本。使用端到端语音识别语境化模型，对比一般性预训练大型语言模型，仅通过适配器添加几个可训练的参数，使得预训练模型能够适应语音识别任务，提高性能。

步骤3：自然语言处理：***对输入的文本进行自然语言处理，理解医生和患者的对话，提取关键信息，如姓名、年龄、症状、持续天数等。

步骤4：匹配疾病库：***根据提取的关键信息，在疾病库中匹配相应的疾病。当***检测到关键信息后，会立即启动，分析输入内容，然后利用Chat GPT和大模型技术在庞大的疾病库中进行匹配，寻找与这些关键信息最为匹配的疾病，再对匹配到的疾病进行详细的解释和描述，包括疾病的症状、病因、治疗方法等等，以此作为参考。

步骤5：反馈结果：将匹配到的疾病及相关信息以文字或图表的形式展示给医生。

步骤6：整合问诊内容：***会自动将问诊过程中的对话内容、病史、症状、体征等信息进行整合。

步骤7：生成病例模板：根据整合的信息，***会自动生成病例模板，包括疾病信息、治疗建议、预防措施等内容。

步骤8：信息编辑：医生可以根据需要，对生成的病例模板和信息进行编辑，添加或删除相关信息。

步骤9：导出文档：医生可以选择将编辑好的病例以文本、PDF等格式导出，以便于保存和打印。

进一步地，所述步骤2中语音识别技术的具体步骤为：

步骤2.1：声学模型：使用一个神经网络来表示声学模型；输入特征为x，输出为声学隐藏状态h，声学模型表示为：

h = f(x;θ_a)

其中，f()是神经网络的函数，θ_a是声学模型的参数。

步骤2.2：语言模型：使用另一个神经网络作为语言模型；输入为声学隐藏状态h，输出为字符或单词序列y；语言模型表示为：

P(yh) = g(h;θ_l)

其中，g()是神经网络的函数，θ_l是语言模型的参数；

步骤2.3：适配器：适配器是一种将预训练模型的输出与特定任务相关的输出相连接的方法；预训练模型M，其输入为x，输出为z，通过在M的输出层添加一个适配器A来适应语音识别任务：

z = M(x)，y_pred = A(z)

其中，y_pred是适应性训练后的输出，θ_a和θ_l分别为声学模型和语言模型的参数；

步骤2.4：适配器训练：为了使适配器A适应语音识别任务，需要对其进行训练；训练目标是最小化预测损失，即：

L(θ_A) = -Σ P(yx, A) log P(yx, M)

其中，Σ表示对所有输入x和标注y进行的求和；

步骤2.5：解码器：在解码器阶段，需要将声学隐藏状态h映射回文字或字符序列；这通过连接主义解码器来实现；解码器的输入为声学隐藏状态h，输出为字符或单词序列y：

P(yh) = Σ P(yh, A)

其中，P(yh, A)表示在给定声学隐藏状态h和适配器A的情况下，输出y的概率；使用适应性训练后的模型进行推理，将拼音序列转换为单词或字符序列。

进一步地，所述步骤4中统根据提取的关键信息，在疾病库中匹配相应的疾病的具体步骤为：

步骤4.1：疾病库构建：收集疾病相关数据，包括症状、病因、治疗方法；利用文本预处理、分词、词性标注这些NLP技术对数据进行处理；使用词向量模型将疾病相关文本转换为向量表示；存储疾病向量及其相关信息构建疾病库；

步骤4.2：疾病匹配：将输入对话中的关键信息进行分词、词性标注这些NLP处理；使用词向量模型将处理后的关键信息转换为向量表示；在疾病库中查找与输入关键信息向量最相似的疾病向量；计算疾病匹配度：

similarity = cos(input_vector, disease_vector)

其中，input_vector 表示输入关键信息的向量，disease_vector 表示疾病库中某疾病的向量；

步骤4.3：疾病排序：根据疾病匹配度对疾病库中的疾病进行排序，匹配度越高，排序越靠前；

步骤4.4：疾病描述和解释：从排序后的疾病列表中选取匹配度最高的疾病；利用NLP技术从疾病库中提取与所选疾病相关的信息，包括症状、病因、治疗方法；根据提取的信息，使用Chat GPT或大模型技术生成疾病描述和解释；

步骤4.5：反馈结果：将生成的疾病描述和解释反馈给用户。

进一步地，使用深度学习技术对疾病库进行持续优化和更新，以便更好地匹配医生的需求。利用多模态信息，提高疾病识别的准确性和全面性。利用边缘计算技术，使***具备较强的实时性和并发处理能力，应对大量问诊请求。

进一步地，引入知识图谱技术，将疾病、症状、药物等信息以图谱形式存储，提高查询和匹配的效率。

进一步地，使用强化学习技术，让***在与医生和患者的互动中不断学习和优化，提高问诊信息的准确性和服务质量。引入医生专家***，将医生的经验以规则或模型形式融入***，提高权威性和可靠性。集成医疗大数据，为医生提供疾病趋势分析、病例统计等服务，助力医生做出更明智的决策。提供医生和患者端的应用程序，方便双方进行问诊、查看病例、交流等操作。

本发明高度自动化：该方法全程自动化，包括对话记录、语音识别、文本转换、自然语言处理、疾病匹配、反馈结果、信息整合、病例生成和信息编辑等环节。先进的语音识别技术：采用端到端语音识别语境化模型，仅通过适配器添加几个可训练的参数，使预训练模型能够适应语音识别任务，提高性能。强大的自然语言处理能力：对输入的文本进行深度处理，提取关键信息，实现对医生和患者对话的理解。实时疾病匹配：利用Chat GPT和大模型技术在疾病库中进行实时匹配，迅速找到与关键信息最为匹配的疾病，并给出详细解释和描述。信息整合与病例生成：***会自动将问诊过程中的对话内容、病史、症状、体征等信息进行整合，并根据整合的信息生成病例模板。灵活的编辑功能：医生可以根据需要对生成的病例模板和信息进行编辑，添加或删除相关信息。多格式导出：医生可以选择将编辑好的病例以文本、PDF 等格式导出，方便保存和打印

有益效果：

本发明方法采用大语言模型技术，能够充分理解医生和患者的对话内容，有效提取关键信息，提高辅助疾病问诊和信息生成的准确性；通过语音识别与文本转换技术，本发明方法支持语音和文本输入，方便用户进行交流，提高问诊的便捷性；利用Chat GPT和大模型技术在疾病库中进行匹配，迅速找到与关键信息最为匹配的疾病，提高匹配效率；能够自动整合问诊过程中的对话内容、病史、症状、体征等信息，减轻医生工作负担，提高问诊的准确性；根据整合的信息，***会自动生成病例模板，包括疾病信息、治疗建议、预防措施等内容，方便医生和患者查阅；医生可以对生成的病例模板和信息进行编辑，根据需要添加或删除相关信息，提高病例的个性化程度；支持导出病例文档，便于医生和患者保存、打印和分享，提高就诊体验；可以不断学习和优化疾病库，使***具备自我更新和升级的能力，适应医学领域的发展。

附图说明

图1是本发明中疾病问诊过程辅助信息生成方法流程图。

具体实施方式

下面结合附图对本发明作进一步说明。

如图1所示，一种基于大语言模型的疾病问诊过程辅助信息生成方法，包括以下步骤：

步骤1：对话记录：在医生与患者的交流过程中，***会自动记录对话内容。为了实现高效的对话记录，***可以使用自然语言处理技术对语音和文本进行实时处理。同时，***需要支持语音和文本输入，以满足不同用户的需求。录音设备或麦克风可以用于捕捉医生的语音，将其转换为数字信号。数字信号经过采样和编码后，存储在计算机***中。此外，用户还可以选择通过文本输入方式提供病史、症状等信息。

步骤2：语音识别与文本转换：当用户选择语音输入时，***通过语音识别技术将语音转换为文本。语音识别技术包括声学模型、语言模型和解码器等组件。在本发明中，采用端到端语音识别语境化模型，该模型相较于一般性预训练大型语言模型，仅通过适配器添加几个可训练的参数，使得预训练模型能够适应语音识别任务，提高性能。在语音识别过程中，模型会将语音信号转换为拼音序列，再通过拼音拼写成文本。

步骤2.1：声学模型：使用一个神经网络来表示声学模型。输入特征为x，输出为声学隐藏状态h，声学模型可以表示为：

h = f(x;θ_a)

其中，f()是神经网络的函数，θ_a是声学模型的参数。

步骤2.2：语言模型：使用另一个神经网络作为语言模型。输入为声学隐藏状态h，输出为字符或单词序列y。语言模型可以表示为：

P(yh) = g(h;θ_l)

其中，g()是神经网络的函数，θ_l是语言模型的参数。

步骤2.3：适配器：适配器是一种将预训练模型的输出与特定任务相关的输出相连接的方法。预训练模型M，其输入为x，输出为z，通过在M的输出层添加一个适配器A来适应语音识别任务：

z = M(x)，y_pred = A(z)

其中，y_pred是适应性训练后的输出，θ_a和θ_l分别为声学模型和语言模型的参数。

步骤2.4：适配器训练：为了使适配器A适应语音识别任务，需要对其进行训练。训练目标是最小化预测损失，即：

L(θ_A) = -Σ P(yx, A) log P(yx, M)

其中，Σ表示对所有输入x和标注y进行的求和。

步骤2.5：解码器：在解码器阶段，需要将声学隐藏状态h映射回文字或字符序列。这可以通过连接主义解码器来实现。解码器的输入为声学隐藏状态h，输出为字符或单词序列y：

P(yh) = Σ P(yh, A)

其中，P(yh, A)表示在给定声学隐藏状态h和适配器A的情况下，输出y的概率。使用适应性训练后的模型进行推理，将拼音序列转换为单词或字符序列。

步骤3：自然语言处理：***对输入的文本进行自然语言处理，理解医生和患者的对话，提取关键信息，如姓名、年龄、症状、持续天数等。自然语言处理技术包括分词、词性标注、命名实体识别、依存句法分析等。通过这些技术，***能够识别文本中的关键词和实体，为后续的疾病匹配提供依据。

步骤4：匹配疾病库：***根据提取的关键信息，在疾病库中匹配相应的疾病。疾病库是一个庞大的知识体系，包含各种疾病的症状、病因、治疗方法等信息。在本发明中，利用Chat GPT 和大模型技术在疾病库中进行匹配。Chat GPT 是一种大型语言模型，具有强大的语言理解和生成能力。通过将患者提供的关键信息与疾病库中的疾病描述进行匹配，***可以找到与患者症状最为匹配的疾病，以此作为参考。

步骤4.1：疾病库构建：收集疾病相关数据，如症状、病因、治疗方法等；利用文本预处理、分词、词性标注等NLP技术对数据进行处理；使用词向量模型（如Word2Vec、GloVe）将疾病相关文本转换为向量表示；存储疾病向量及其相关信息（如症状、病因、治疗方法等）构建疾病库。

步骤4.2：疾病匹配：将输入对话中的关键信息进行分词、词性标注等NLP处理；使用词向量模型将处理后的关键信息转换为向量表示；在疾病库中查找与输入关键信息向量最相似的疾病向量；计算疾病匹配度：

similarity = cos(input_vector, disease_vector)

其中，input_vector 表示输入关键信息的向量，disease_vector 表示疾病库中某疾病的向量。

步骤4.3：疾病排序：根据疾病匹配度对疾病库中的疾病进行排序，匹配度越高，排序越靠前。

步骤4.4：疾病描述和解释：从排序后的疾病列表中选取匹配度最高的疾病；利用NLP技术（如文本生成、信息抽取等）从疾病库中提取与所选疾病相关的信息，如症状、病因、治疗方法等；根据提取的信息，使用Chat GPT或大模型技术生成疾病描述和解释。

步骤4.5：反馈结果：将生成的疾病描述和解释反馈给用户。

步骤5：反馈结果：将匹配到的疾病及相关信息以文字或图表的形式展示给医生。为了提高用户体验，***可以使用自然语言生成技术生成易于理解的描述。此外，还可以利用可视化技术将疾病相关信息以图表形式展示，帮助用户更直观地了解病情。

步骤6：整合问诊内容：***会自动将问诊过程中的对话内容、病史、症状、体征等信息进行整合。这一步骤可以通过自然语言处理技术实现。首先，对问诊过程中的文本进行分词和实体识别，然后将各个实体之间的关系进行建模，最终形成一个结构化的病例描述。

步骤7：生成病例模板：根据整合的信息，***会自动生成病例模板，包括疾病信息、治疗建议、预防措施等内容。病例模板的生成可以通过模板匹配、逻辑推理等技术实现。此外，***还可以利用预训练的模板匹配模型，如BERT、GPT等，根据问诊内容自动生成病例模板。

步骤8：信息编辑：医生可以根据需要，对生成的病例模板和信息进行编辑，添加或删除相关信息。为了方便医生编辑，***可以提供直观的界面和简单的操作方式。编辑后的病例信息可以实时更新，以确保医生和患者能够获取最新的病情信息。

步骤9：导出文档：医生可以选择将编辑好的病例以文本、PDF 等格式导出，以便于保存和打印。导出功能可以通过文件处理和格式转换技术实现。例如，***可以将病例模板转换为HTML文档，然后通过浏览器或其他查看器打开。此外，***还可以支持将病例发送给患者或其他医护人员，以实现病例的共享和协作。除上述实施例外，本发明还可以有其他实施方式，凡采用等同替换或等效变换形成的技术方案，均落在本发明要求的保护范围内。

Claims

1.一种基于大语言模型的疾病问诊过程辅助信息生成方法，其特征在于，包括以下步骤：

步骤1：对话记录：在医生与患者的交流过程中，***会自动记录对话内容，同时支持语音和文本输入；

步骤2：语音识别与文本转换：当用户选择语音输入时，***通过语音识别技术将语音转换为文本；使用端到端语音识别语境化模型，对比一般性预训练大型语言模型，仅通过适配器添加几个可训练的参数，使得预训练模型能够适应语音识别任务，提高性能；

步骤3：自然语言处理：***对输入的文本进行自然语言处理，理解医生和患者的对话，提取关键信息，包括姓名、年龄、症状、持续天数；

步骤4：匹配疾病库：***根据提取的关键信息，在疾病库中匹配相应的疾病；当***检测到关键信息后，会立即启动，分析输入内容，然后利用Chat GPT和大模型技术在庞大的疾病库中进行匹配，寻找与这些关键信息最为匹配的疾病，再对匹配到的疾病进行详细的解释和描述，包括疾病的症状、病因、治疗方法，以此作为参考；

步骤5：反馈结果：将匹配到的疾病及相关信息以文字或图表的形式展示给医生；

步骤6：整合问诊内容：***会自动将问诊过程中的对话内容、病史、症状、体征信息进行整合；

步骤7：生成病例模板：根据整合的信息，***会自动生成病例模板，包括疾病信息、治疗建议、预防措施内容；

步骤8：信息编辑：医生根据需要，对生成的病例模板和信息进行编辑，添加或删除相关信息；

步骤9：导出文档：医生选择将编辑好的病例以文本、PDF格式导出，以便于保存和打印。

2.如权利要求1所述的一种基于大语言模型的疾病问诊过程辅助信息生成方法，其特征在于，所述步骤2中语音识别技术的具体步骤为：

h = f(x;θ_a)

其中，f()是神经网络的函数，θ_a是声学模型的参数；

P(yh) = g(h;θ_l)

其中，g()是神经网络的函数，θ_l是语言模型的参数；

z = M(x)，y_pred = A(z)

L(θ_A) = -Σ P(yx, A) log P(yx, M)

其中，Σ表示对所有输入x和标注y进行的求和；

P(yh) = Σ P(yh, A)

3.如权利要求1所述的一种基于大语言模型的疾病问诊过程辅助信息生成方法，其特征在于，所述步骤4中统根据提取的关键信息，在疾病库中匹配相应的疾病的具体步骤为：

similarity = cos(input_vector, disease_vector)

步骤4.4：疾病描述和解释：从排序后的疾病列表中选取匹配度最高的疾病；利用NLP技术从疾病库中提取与所选疾病相关的信息；根据提取的信息，使用Chat GPT或大模型技术生成疾病描述和解释；

步骤4.5：反馈结果：将生成的疾病描述和解释反馈给用户。

4.如权利要求1所述的一种基于大语言模型的疾病问诊过程辅助信息生成方法，其特征在于：使用深度学习技术对疾病库进行持续优化和更新，以便更好地匹配医生的需求；利用多模态信息，提高疾病识别的准确性和全面性；利用边缘计算技术，使***具备较强的实时性和并发处理能力，应对大量问诊请求。

5.如权利要求1所述的一种基于大语言模型的疾病问诊过程辅助信息生成方法，其特征在于：引入知识图谱技术，将疾病、症状、药物信息以图谱形式存储，提高查询和匹配的效率。

6.如权利要求1所述的一种基于大语言模型的疾病问诊过程辅助信息生成方法，其特征在于：使用强化学习技术，让***在与医生和患者的互动中不断学习和优化，提高问诊信息的准确性和服务质量；引入医生专家***，将医生的经验以规则或模型形式融入***，提高权威性和可靠性；集成医疗大数据，为医生提供疾病趋势分析、病例统计服务，助力医生做出更明智的决策；提供医生和患者端的应用程序，方便双方进行问诊、查看病例、交流操作。