CN117931985A - 一种国际工程规范问答助手的高级提示工程***、方法和电子设备 - Google Patents

一种国际工程规范问答助手的高级提示工程***、方法和电子设备 Download PDF

Info

Publication number
CN117931985A
CN117931985A CN202410338158.3A CN202410338158A CN117931985A CN 117931985 A CN117931985 A CN 117931985A CN 202410338158 A CN202410338158 A CN 202410338158A CN 117931985 A CN117931985 A CN 117931985A
Authority
CN
China
Prior art keywords
engineering
prompt
question
round
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410338158.3A
Other languages
English (en)
Other versions
CN117931985B (zh
Inventor
高雯
杜修力
林波荣
吴承霖
张轩铭
王洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202410338158.3A priority Critical patent/CN117931985B/zh
Publication of CN117931985A publication Critical patent/CN117931985A/zh
Application granted granted Critical
Publication of CN117931985B publication Critical patent/CN117931985B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种国际工程规范问答助手的高级提示工程***、方法和电子设备,属于数据处理技术领域;包括用户界面层Ⅰ、多轮提示工程层Ⅱ、规范库搜索层Ⅲ、数据库层Ⅳ、大语言模型层Ⅴ;收集国际工程规范书籍目录与多专业“问‑答”案例的文本资料。构建第一轮提示工程信息模板。基于第一轮提示工程信息模板构建规范库搜索层Ⅲ。构建第二轮提示工程信息模板。针对技术层面:弥补了处理对象的局限性。针对应用层面:基于GPT的多轮提示信息的高级提示工程方法巧妙的将提问、关键词识别与抽取、工程规范数据库、数据库搜索逻辑、国际工程规范问答助理这几个功能环节有效区分、参数化并形成串联,提升国际工程规范咨询助理***的整体性能和应用价值。

Description

一种国际工程规范问答助手的高级提示工程***、方法和电 子设备
技术领域
本发明涉及数据处理技术领域,尤其涉及一种用于国际工程规范问答助手的高级提示工程***、方法及电子设备。
背景技术
当下,国际工程项目中的工程师和项目管理者面临两大挑战:第一方面是处理大量分散的国际工程规范和标准;第二方面是应对国际工程项目中的多维度挑战。对于第一方面,国际项目涉及多国多语种的工程规范和标准,规范涵盖了从建筑安全到环境保护等多个方面,体量和内容十分庞杂,每项都有其独特性和复杂性;而工程师和项目管理者遇到的工程规范问题形式多样、难以清晰界定,通常是基于自然语言而非术语化的描述,在查找时需耗费大量时间和人力反复循证,无法及时获取特定需求的信息;同时,多语种的规范文本使得查找难度进一步提升,效率进一步降低。对于第二方面,在国际工程项目中,通常存在投标周期紧迫、项目环境风险高、跨文化沟通困难、政治经济因素不稳定等多方面挑战,在此背景下,工程师和项目管理者对于工程规范错误的解读导致的违规或决策失误,可能为项目带来重大的财务损失、法律责任甚至项目失败。
为了应对这些挑战,工程师和项目管理者需要依赖大量的数据和信息。然而,传统的信息处理工具往往无法有效地整合和分析跨国界的复杂数据集;尤其是在多国多语种工程规范条款的理解上,通常要求工程师及项目管理者积累多年的国际工程经验,并对各国工程规范通读熟悉、融会贯通的理解,才能在短时间内对国际工程项目问题做出较为准确的决策。尽管某些检索***可以实现工程规范信息搜索的目标,但它们通常仅提供特定范围内的规范文本片段,而非直接回答工程师和项目管理者遇到的特定需求问题。此外,随着技术的发展和规范的不断更新,持续跟踪并深入理解最新的工程技术和规范变得越来越困难。
近年来,随着大语言模型的发展,基于自然语言的文本处理和问答推理技术得到了巨大的提升。其中,基于生成式语言模型的提示工程为解决上述困难提供了一种创新的解决方案。提示工程是一种基于人工智能模型的技术方法,可用于优化人工智能模型的输出。它涉及精心设计的提问信息或指令信息,即“提示”,旨在指导和改善模型如何理解和回应提问或请求。这种方法的关键在于可以在预训练大语言模型的基础上,通过构建有效的提示激发和引导预训练模型产生更准确、更相关的回应;例如在像ChatGPT这样的生成式预训练大语言处理模型中,提示工程直接影响问答对话在一般或特定场景下的质量和实用性。
目前,极少学者提出了基于生成预训练转换器应用的国际工程规范问答高级提示工程方法、***和电子设备。中国专利申请号CN202310258606.4提出了基于提示学习的中文建筑规范文本实体识别方法及***,以解决中文建筑规范文本实体识别效果低的问题。
中国专利申请号CN202310255916.0提出了一种面向建筑规范的抽取式文本问答方法,以准确、稳定的在对应文本段落中抽取出所提建筑规范问题的正确答案。
经分析,现有技术方案存在如下不足之处:
1)所处理的规范对象的语言范围仅限中文,尚未涉及多语种、多国的规范文本的复杂处理问题;并且未能直接说明上述技术方案在多国、多语种规范文本处理上的效果。
2)现有技术方案主要基于规范文本实体识别技术,尚未采用基于生成式预训练模型的高级提示工程方法;其在面对复杂市场环境和不同时效场景下的新的规范问题时存在延展性不强、迭代成本高、无法获取问题相应的答案的不足。
发明内容
为解决上述背景技术中的问题,本发明的技术目的之一在于提出了一种基于GPT应用的国际工程规范问答提示工程***,该***通过集成GPT应用提示工程***,能够有效地处理和分析多语种、多语言的国际工程规范数据,针对用户提出的特定需求提供直接回答,并确保回答信息的实时性、稳定性与准确性,避免生成式预训练模型存在的“幻觉”效应。
本发明的技术目的之二在于提出了一种基于GPT应用的国际工程规范问答提示工程方法,该方法针对面向国际工程项目的工程规范提问设计了关键词抽取技术;通过开发从提问中准确地识别和提取与国际工程规范相关的关键词技术,以提升在国际工程项目中对工程规范提问的准确性和效率。
本发明的技术目的之三在于提出了一种基于GPT应用的国际工程规范问答提示工程电子设备,基于上述***及方法,该电子设备基于提问关键词的多语种、多国规范条款的搜索技术;通过精确地理解和使用提问中的关键词,有效地搜索和定位涉及多语言的复杂工程规范的具体条款的精确信息。
本发明的技术目的之四在于,通过融合多轮提示工程与规范文本库搜索实现对多国多语种工程规范的稳定快速查找与推理回答,即国际工程规范问答助手的功能;其中,回答包含查找的规范条款内容及其出处,推理回答的规范条款依据及其出处信息,以构建国际工程规范问答助手的准确、稳定回答技术。
为实现上述目的,本发明采用的技术方案为一种国际工程规范问答助手的高级提示工程***,包括用户界面层Ⅰ、多轮提示工程层Ⅱ、规范库搜索层Ⅲ、数据库层Ⅳ、大语言模型层Ⅴ;所述用户界面层Ⅰ包括用户提问模块与显示答案模块;用户界面层Ⅰ是***前端的用户与***交互的界面,使用响应式设计以适应不同的设备和屏幕尺寸。
所述多轮提示工程层Ⅱ包括第一轮提示工程模板、返回关键词列表、第二轮提示工程模板、返回搜索条目;多轮提示工程层Ⅱ用于负责处理前端用户界面层Ⅰ发送的请求,并与***所选GPT模型接入部分和规范库搜索层Ⅲ部分交互。前端用户界面层Ⅰ发送的请求包括用户提问信息,与GPT模型接入部分包括第一轮提示工程信息模板和第二轮提示工程信息模板。
所述规范库搜索层Ⅲ包括关键词匹配算法模块、条目排序算法模块;规范库搜索层Ⅲ用于与国际工程规范文本库交互并将搜索条目结果以固定格式返回给多轮提示工程层Ⅱ。
所述数据库层Ⅳ包括多专业“问-答”案例文本库模块、国际工程规范文本库模块、运行记录;数据库层Ⅳ用于存储***执行过程中输入和输出的所有数据资料。
所述大语言模型层Ⅴ包括所选GPT模型;大语言模型层Ⅴ用于安装配置***所选GPT模型及其环境。
进一步地,所述用户提问模块是用户与***交互的界面功能模块,即工程师或工程项目管理人员通过用户提问模块输入以自然语言形式表达的提问文本。
进一步地,所述显示答案模块是用户与***交互的界面功能模块,即工程师或工程项目管理人员通过此模块查看国际工程规范问答助手***的回答文本。
进一步地,所述第一轮提示工程信息模板用于负责将用户以自然语言方式表达的提问文本,和第一轮提示工程文本按照特定的模板规则融合形成第一轮提示工程信息,并将第一轮提示工程信息通过所选GPT模型的API发送给所选GPT模型,以实现利用GPT模型从提问文本中提取核心关键词的功能。
进一步地,所述返回关键词列表用于接收和储存所选GPT模型针对第一轮提示工程信息返回的答案,即针对用户的提问文本提取其中的关键词所形成的关键词列表。
进一步地,所述第二轮提示工程信息模板用于负责将返回搜索条目传递的国际工程规范的条款文本,和第二轮提示工程文本按照特定的模板规则融合形成第二轮提示工程信息,并将第二轮提示工程信息通过所选GPT模型的API发送给所选GPT模型,以实现国际工程规范问答助手的功能。
进一步地,所述返回搜索条目用于接收和储存规范库搜索Ⅲ层从国际工程规范文本库中搜索得到的规范条目。
进一步地,所述关键词匹配算法模块用于负责将返回关键词列表与国际工程规范文本库模块中的规范条目进行匹配,将匹配的规范条目传递给条目排序算法模块。
进一步地,所述条目排序算法模块用于负责对关键词匹配算法模块传递的规范条目进行排序和筛选,将排序筛选后的规范条目传送给返回搜索条目。
进一步地,所述多专业“问-答”案例文本库模块用于存储预设的来自建筑、结构、给排水、电气、暖通等多个专业的工程师及工程项目管理人员,关于国际工程规范的问答案例文本。
进一步地,所述国际工程规范文本库模块用于存储预设的国际工程规范文本范围内的规范书籍名称、具体的规范条款编号、具体的规范条款内容文本。
进一步地,所述运行记录负责与多轮提示工程层Ⅱ、规范搜索层Ⅲ进行交互,用于记录***运行中产生日志数据,如:用户的提问文本、GPT模型返回的关键词列表、显示给用户的问题答案等数据,便于发现和修复问题。
进一步地,所述所选GPT模型用于与多轮提示工程层Ⅱ进行通信,基于所选GPT模型的API对来自多轮提示工程层Ⅱ的请求予以回应。
本发明还涉及一种国际工程规范问答助手的高级提示工程方法,该方法的具体实施步骤如下:
步骤S1,通过对国际工程建设企业总部的各个专业工程师、工程项目管理人员进行访谈、问卷形式的调研,收集国际工程规范书籍目录与多专业“问-答”案例的文本资料。
根据收集的国际工程规范书籍目录,建立国际工程规范文本库,国际工程规范文本库以两级查询目录的形式进行组织:第一级查询目录组织为规范书籍名称的编号,第二级查询目录组织为对应的规范书籍包含的所有条款编号。所述国际工程规范文本库的最小单元为一条规范条款的文本。根据收集的多专业“问-答”案例的文本资料,建立多专业“问-答”案例文本库。所述多专业“问-答”案例文本库的最小单元为一对“提问文本”和“回答文本”组成。其中“提问文本”来自于工程师、工程项目管理人员在实际工作过程中产生的问题;“回答文本”来自于工程师、工程项目管理人员通过人工查询、集中讨论、复核审定,最终得到的针对于“提问文本”答案。
步骤S2,构建第一轮提示工程信息模板。第一步,确定第一轮提示工程目标,包括按步骤实现对用户提问文本的关键词抽取、对抽取的关键词进行排序、对排序的关键词进行多语种翻译、对关键词及其翻译进行固定格式的书写、对关键词及其翻译形成稳定输出。第二步,根据目标设定设计提示词,包括:第一部分,构建用户提问文本关键词抽取规则;第二部分,基于多专业“问-答”案例文本库构建用户提问与回答案例。第三步,根据目标设定,通过所选GPT模型的API对GPT模型进行测试和根据返回结果调整提示词。第四步,经过多轮提示词优化,形成第一轮提示工程信息模板。
步骤S3,基于第一轮提示工程信息模板构建规范库搜索层Ⅲ。第一步,基于第一轮提示工程信息模板,通过所选GPT模型对国际工程规范文本库最小单元进行关键词提取,建立对应规范条目的关键词列表。第二步,以国际工程规范库中每条规范条目对应的关键词列表为匹配对象,根据用户提问文本的关键词匹配返回每条规范条目对应的关键词列表中的关键词计数。第三步,根据关键词计数计算所匹配规范条目的排序权重。第四步,根据排序权重对所匹配规范条目进行相关度排序。第五步,设定Tokens限值,计算Tokens限值内能够返回的前n条规范条目。第六步,返回前n条搜索条目的文本信息。
步骤S4,构建第二轮提示工程信息模板。第一步,确定第二轮提示工程目标,针对用户提问文本实现多国多语种工程规范的稳定快速查找与推理回答的国际工程规范咨询助手,包括返回用户提问所涉及的规范条目、基于所涉及的规范条目返回回答、回答格式固定以及回答语言风格固定。第二步,根据目标设定设计国际工程规范问答助手的提示词,包括:第一部分,构建国际工程规范问答助手回答规则;第二部分,基于多专业“问-答”案例文本库构建国际工程规范问答助手回答案例。第三步,根据目标设定,通过所选GPT模型的API对GPT模型进行反复测试和根据返回结果调整提示词,以实现优化提示词。第四步,经过多轮提示词优化,形成第二轮提示工程信息模板。
一种计算机电子设备,包括存储单元和处理单元;所述存储单元中存储在所述处理单元上运行的计算机程序;所述处理单元执行所述计算机程序时实现上述的国际工程规范问答助手的高级提示工程方法。
与现有技术相比较,本发明针对技术层面:弥补了处理对象的局限性,即之前的技术路径仅限于中文语言范围内容的工程规范问答,并未涉及多语种、多国的规范文本的复杂处理问题。改进了基于词向量嵌入的神经网络模型的现有技术,引入基于GPT应用的高级提示工程方法,通过结合GPT强大的语言处理能力,以及多轮提示工程的巧妙方式,能够更加灵活地适应国际工程规范问答的多样性和变化性,有效减少迭代成本,同时提供更准确、及时的回答。
本发明针对应用层面:基于GPT的多轮提示信息的高级提示工程方法巧妙的将提问、关键词识别与抽取、工程规范数据库、数据库搜索逻辑、国际工程规范问答助理这几个功能环节有效区分、参数化并形成串联,实现***分步骤、有逻辑的针对用户提问作答,并有效避免“幻觉”效应,提供稳定、准确的“多规快查”与推理的规范咨询服务,此技术方案同时基于了***针对不同工程项目适应性要求的参数可变能力,如提示工程模板信息、国际工程规范数据库信息、数据库搜索逻辑等,极大提升了国际工程规范咨询助理***的整体性能和应用价值。
另外,基于GPT应用的国际工程规范问答助理的***架构和全套技术方案流程,尤其是本发明提出的用于多语种的工程规范关键词抽取的第一提示工程、基于第一提示工程的国际工程规范数据库搜索逻辑、以及基于国际工程规范数据库搜索逻辑的国际工程规范问答助理提示工程。
附图说明
图1为本发明***架构图。
图2为本发明***实施示意图。
图3为实施例1的问询示例图。
图4、5为实施例1的答复示例图。
图6为实施例2的问询示例图。
图7、8为实施例2的答复示例图。
具体实施方式
以下结合附图和实施例对本发明进行详细说明。
如图1所示为本发明***架构图。
一种国际工程规范问答助手的高级提示工程***,包括用户界面层Ⅰ、多轮提示工程层Ⅱ、规范库搜索层Ⅲ、数据库层Ⅳ、大语言模型层Ⅴ;所述用户界面层Ⅰ包括用户提问模块1与显示答案模块2;用户界面层Ⅰ是***前端的用户与***交互的界面,使用响应式设计以适应不同的设备和屏幕尺寸。
所述多轮提示工程层Ⅱ包括第一轮提示工程模板3、返回关键词列表4、第二轮提示工程模板5、返回搜索条目6;多轮提示工程层Ⅱ用于负责处理前端用户界面层Ⅰ发送的请求,并与***所选GPT模型接入部分和规范库搜索层Ⅲ部分交互。前端用户界面层Ⅰ发送的请求包括用户提问信息,与GPT模型接入部分包括第一轮提示工程信息模板和第二轮提示工程信息模板。
所述规范库搜索层Ⅲ包括关键词匹配算法模块7、条目排序算法模块8;规范库搜索层Ⅲ用于与国际工程规范文本库交互并将搜索条目结果以固定格式返回给多轮提示工程层Ⅱ。
所述数据库层Ⅳ包括多专业“问-答”案例文本库模块9、国际工程规范文本库模块10、运行记录11;数据库层Ⅳ用于存储***执行过程中输入和输出的所有数据资料。
所述大语言模型层Ⅴ包括所选GPT模型12;大语言模型层Ⅴ用于安装配置***所选GPT模型及其环境;大语言模型层Ⅴ属于***所选的外部服务(例如OpenAI开发的GPT-Turbo-3.5模型),不属于本发明专利申请的保护内容。
所述用户提问模块1是用户与***交互的界面功能模块,即工程师或工程项目管理人员通过此模块输入以自然语言形式表达的提问文本。
所述显示答案模块2是用户与***交互的界面功能模块,即工程师或工程项目管理人员通过此模块查看国际工程规范问答助手***的回答文本。
所述第一轮提示工程信息模板3用于负责将用户以自然语言方式表达的提问文本,和第一轮提示工程文本按照特定的模板规则融合形成第一轮提示工程信息,并将第一轮提示工程信息通过所选GPT模型12的API发送给所选GPT模型12,以实现利用GPT模型从提问文本中提取核心关键词的功能。
所述返回关键词列表4用于接收和储存所选GPT模型12针对第一轮提示工程信息返回的答案,即针对用户的提问文本提取其中的关键词所形成的关键词列表。
所述第二轮提示工程信息模板5用于负责将返回搜索条目6传递的国际工程规范的条款文本,和第二轮提示工程文本按照特定的模板规则融合形成第二轮提示工程信息,并将第二轮提示工程信息通过所选GPT模型12的API发送给所选GPT模型,以实现国际工程规范问答助手的功能。
所述返回搜索条目6用于接收和储存规范库搜索Ⅲ层从国际工程规范文本库中搜索得到的规范条目。
所述关键词匹配算法模块7用于负责将返回关键词列表4与国际工程规范文本库模块10中的规范条目进行匹配,将匹配的规范条目传递给条目排序算法模块8。
所述条目排序算法模块8用于负责对关键词匹配算法模块7传递的规范条目进行排序和筛选,将排序筛选后的规范条目传送给返回搜索条目6。
所述多专业“问-答”案例文本库模块9用于存储预设的来自建筑、结构、给排水、电气、暖通等多个专业的工程师及工程项目管理人员,关于国际工程规范的问答案例文本。
所述国际工程规范文本库模块10用于存储预设的国际工程规范文本范围内的规范书籍名称、具体的规范条款编号、具体的规范条款内容文本。
所述运行记录11负责与多轮提示工程层Ⅱ、规范搜索层Ⅲ进行交互,用于记录***运行中产生日志数据,如:用户的提问文本、GPT模型返回的关键词列表、显示给用户的问题答案等数据,便于发现和修复问题。
所述所选GPT模型12用于与多轮提示工程层Ⅱ进行通信,基于所选GPT模型12的API对来自多轮提示工程层Ⅱ的请求予以回应。
图2为本发明***实施示意图。
一种国际工程规范问答助手的高级提示工程方法,具体实施步骤如下:
步骤S1,通过对国际工程建设企业总部的建筑、结构、给排水、电气、暖通等多个专业工程师、工程项目管理人员进行访谈、问卷形式的调研,收集国际工程规范书籍目录与多专业“问-答”案例的文本资料。根据收集的国际工程规范书籍目录,建立国际工程规范文本库,文本库以两级查询目录的形式进行组织:第一级查询目录组织为规范书籍名称的编号,第二级查询目录组织为对应的规范书籍包含的所有条款编号。所述国际工程规范文本库的最小单元为一条规范条款的文本,格式为.json。所述最小单元的文本信息可容括:一、来自不同专业,如:建筑、结构、电气、给排水、暖通等的规范条款;二、来自不同规范条款;三、来自不同语种的条款;四、出自不同时间的规范条款。根据收集的多专业“问-答”案例的文本资料,建立多专业“问-答”案例文本库。所述多专业“问-答”案例文本库的最小单元为一对“提问文本”和“回答文本”组成,格式为.txt。其中“提问文本”来自于工程师、工程项目管理人员在实际工作过程中产生的问题;“回答文本”来自于工程师、工程项目管理人员通过人工查询、集中讨论、复核审定等多个过程,最终得到的针对于“提问文本”的答案。
步骤S2,构建第一轮提示工程信息模板。第一步,确定第一轮提示工程目标,包括按步骤实现对用户提问文本的关键词抽取、对抽取的关键词进行排序、对排序的关键词进行多语种翻译、对关键词及其翻译进行固定格式的书写、对关键词及其翻译形成稳定输出等。第二步,根据目标设定设计提示词,包括:第一部分,构建用户提问文本关键词抽取的规则;第二部分,基于多专业“问-答”案例文本库构建用户提问与回答案例。第三步,根据目标设定,通过***所选GPT模型的API对GPT模型进行反复测试和根据返回结果调整提示词,以实现优化提示词的目的。第四步,经过多轮提示词优化,形成第一轮提示工程信息模板。
步骤S3,基于第一轮提示工程信息模板构建规范库搜索层III。第一步,基于第一轮提示工程信息模板,通过所选GPT模型对国际工程规范文本库最小单元(即规范条目文本)进行关键词提取,建立对应规范条目的关键词列表。第二步,以国际工程规范库中每条规范条目对应的关键词列表为匹配对象,根据用户提问文本的关键词匹配返回每条规范条目对应的关键词列表中的关键词计数。第三步,根据计数计算所匹配规范条目的排序权重。第四步,根据排序权重对所匹配规范条目进行相关度排序。第五步,设定Tokens限值,计算限值内可返回的前n条规范条目。第六步,返回前n条搜索条目的文本信息。
步骤S4,构建第二轮提示工程信息模板。第一步,确定第二轮提示工程目标,即针对全新的用户提问文本实现多国多语种工程规范的稳定快速查找与推理回答的国际工程规范咨询助手,包括返回用户提问所涉及的规范条目、基于所涉及的规范条目返回回答、回答格式固定、回答语言风格固定等。第二步,根据目标设定设计国际工程规范问答助手的提示词,包括:第一部分,构建国际工程规范问答助手回答规则;第二部分,基于多专业“问-答”案例文本库构建国际工程规范问答助手回答案例。第三步,根据目标设定,通过***所选GPT模型的API对GPT模型进行反复测试和根据返回结果调整提示词,以实现优化提示词的目的。第四步,经过多轮提示词优化,形成第二轮提示工程信息模板。
实施例
第1步,工程师或项目管理用户通过用户界面层Ⅰ中的用户提问1输入问题,点击发送(send);
第2步,多轮提示工程Ⅱ中的第一轮提示工程信息模板3将第一轮提示工程信息和用户问题合并,通过所选GPT(本例使用OpanAI开发的GPT-3.5-turbo-16k模型)的API发送给大语言模型层Ⅴ中的所选GPT模型12并请求回应;
第3步,返回关键词列表4接收到所选GPT模型12针对第一轮提示工程信息回应的信息,进行格式检查,并输入规范库搜索层Ⅲ的关键词匹配算法7;
第4步,关键词匹配算法7根据返回的关键词列表,对国际工程规范文本库10中的规范条目进行关键词匹配,将匹配到的规范条目及其关键词传送给条目排序算法8;规范条目以.json格式存储;此处的关键词匹配算法可以采用基于关键词字符编辑距离的匹配算法、基于关键词语义相似度的匹配算法等。
第5步,条目排序算法将匹配到的规范条目进行排序筛选,将排序筛选后的规范条目传送给返回搜索条目6;条目排序为匹配关键词无重计数的降序排序;条目筛选为条目文本总token数值不大于10000的前n条规范条目。
第6步,第二轮提示工程信息模板5将返回搜索条目6按条目、用户提问1拼接为第二轮提示工程信息,通过所选GPT(本例使用OpanAI开发的GPT-3.5-turbo-16k模型)的API发送给大语言模型层Ⅴ中的所选GPT模型12并请求回应;
第7步,多轮提示信息工程Ⅱ接收到所选GPT模型12针对第二轮提示工程信息回应的信息,传送给用户界面Ⅰ显示答案;显示***括返回搜索条目、基于返回搜索条目的国际工程规范问答助手的推理回答。
工程师或项目管理人员用中文输入提问,如图3所示。返回关键词列表:[疏散门][Evacuation Door][1个][One][教学][Education][教学建筑][Education building][公共][Public][公共建筑][Public building];
***返回与问题最相关的规范条目,国际工程规范问答助手对问题的直接回答,回答语言与提问语言一致,如图4、5所示。
工程师或项目管理人员用英文输入提问;如图6所示。
返回关键词列表:[消防救援口][Fire Rescue Exit][每层][Each Floor][设置][Installation];***返回与问题最相关的规范条目,国际工程规范问答助手对问题的直接回答,回答语言与提问语言一致,如图7、8所示。
以上具体实施方式仅用以说明本发明的技术方案而非限制,尽管参照实例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (10)

1.一种国际工程规范问答助手的高级提示工程方法,其特征在于:该方法的具体实施步骤如下:
步骤S1,通过对国际工程建设企业总部各个专业工程师、工程项目管理人员进行访谈以及问卷形式调研,收集国际工程规范书籍目录与多专业“问-答”案例的文本资料;根据收集的国际工程规范书籍目录,建立国际工程规范文本库;
步骤S2,构建第一轮提示工程信息模板;第一步,确定第一轮提示工程目标,包括按步骤实现对用户提问文本的关键词抽取、对抽取的关键词进行排序、对排序的关键词进行多语种翻译、对关键词及其翻译进行固定格式的书写、对关键词及其翻译形成稳定输出;第二步,根据目标设定设计提示词,包括:第一部分,构建用户提问文本关键词抽取规则;第二部分,基于多专业“问-答”案例的文本资料构建用户提问与回答案例;第三步,根据目标设定,通过所选GPT模型的API对GPT模型进行测试和根据返回结果调整提示词;第四步,经过多轮提示词优化,形成第一轮提示工程信息模板;
步骤S3,基于第一轮提示工程信息模板构建规范库搜索层Ⅲ;第一步,基于第一轮提示工程信息模板,通过所选GPT模型对国际工程规范文本库最小单元进行关键词提取,建立对应规范条目的关键词列表;第二步,以国际工程规范库中每条规范条目对应的关键词列表为匹配对象,根据用户提问文本的关键词匹配返回每条规范条目对应的关键词列表中的关键词计数;第三步,根据关键词计数计算所匹配规范条目的排序权重;第四步,根据排序权重对所匹配规范条目进行相关度排序;第五步,设定Tokens限值,计算Tokens限值内能够返回的前n条规范条目;第六步,返回前n条搜索条目的文本信息;
步骤S4,构建第二轮提示工程信息模板;第一步,确定第二轮提示工程目标,包括返回用户提问所涉及的规范条目、基于所涉及的规范条目返回回答、回答格式固定以及回答语言风格固定;第二步,根据目标设定设计国际工程规范问答助手的提示词,包括:第一部分,构建国际工程规范问答助手回答规则;第二部分,基于多专业“问-答”案例的文本资料构建国际工程规范问答助手回答案例;第三步,根据目标设定,通过所选GPT模型的API对GPT模型进行反复测试和根据返回结果调整提示词,以实现优化提示词;第四步,经过多轮提示词优化,形成第二轮提示工程信息模板。
2.根据权利要求1所述的国际工程规范问答助手的高级提示工程方法,其特征在于:步骤S1中,国际工程规范文本库以两级查询目录的形式进行组织:第一级查询目录组织为规范书籍名称的编号,第二级查询目录组织为对应的规范书籍包含的所有条款编号;所述国际工程规范文本库的最小单元为一条规范条款的文本;根据收集的多专业“问-答”案例的文本资料,建立多专业“问-答”案例文本库;所述多专业“问-答”案例文本库的最小单元为一对“提问文本”和“回答文本”组成;其中“提问文本”来自于各个专业工程师、工程项目管理人员在实际工作过程中产生的问题;“回答文本”来自于各个专业工程师、工程项目管理人员通过人工查询、集中讨论、复核审定,最终得到的针对于“提问文本”答案。
3.一种实现如权利要求1或2所述方法的国际工程规范问答助手的高级提示工程***,其特征在于:包括用户界面层Ⅰ、多轮提示工程层Ⅱ、规范库搜索层Ⅲ、数据库层Ⅳ、大语言模型层Ⅴ;所述用户界面层Ⅰ包括用户提问模块与显示答案模块;用户界面层Ⅰ是***前端的用户与***交互的界面,使用响应式设计;
所述多轮提示工程层Ⅱ包括第一轮提示工程模板、返回关键词列表、第二轮提示工程模板、返回搜索条目;多轮提示工程层Ⅱ用于负责处理前端用户界面层Ⅰ发送的请求,并与所选GPT模型接入部分和规范库搜索层Ⅲ部分交互;前端用户界面层Ⅰ发送的请求包括用户提问信息,与GPT模型接入部分包括第一轮提示工程信息模板和第二轮提示工程信息模板;
所述规范库搜索层Ⅲ包括关键词匹配算法模块、条目排序算法模块;规范库搜索层Ⅲ用于与国际工程规范文本库交互并将搜索条目结果以固定格式返回给多轮提示工程层Ⅱ;
所述数据库层Ⅳ包括多专业“问-答”案例文本库模块、国际工程规范文本库模块、运行记录;数据库层Ⅳ用于存储***执行过程中输入和输出的所有数据资料;
所述大语言模型层Ⅴ包括所选GPT模型;大语言模型层Ⅴ用于安装配置***所选GPT模型及其环境。
4.如权利要求3所述的国际工程规范问答助手的高级提示工程***,其特征在于:所述用户提问模块是用户与***交互的界面功能模块,即各个专业工程师或工程项目管理人员通过用户提问模块输入以自然语言形式表达的提问文本;
所述显示答案模块是用户与国际工程规范问答助手***交互的界面功能模块,即各个专业工程师或工程项目管理人员通过此模块查看国际工程规范问答助手***的回答文本。
5.如权利要求3所述的国际工程规范问答助手的高级提示工程***,其特征在于:所述第一轮提示工程信息模板用于负责将用户以自然语言方式表达的提问文本,和第一轮提示工程文本按照特定的模板规则融合形成第一轮提示工程信息,并将第一轮提示工程信息通过所选GPT模型的API发送给所选GPT模型,以实现利用GPT模型从提问文本中提取核心关键词的功能;
所述返回关键词列表用于接收和储存所选GPT模型针对第一轮提示工程信息返回的答案,即针对用户的提问文本提取其中的关键词所形成的关键词列表。
6.如权利要求3所述的国际工程规范问答助手的高级提示工程***,其特征在于:所述第二轮提示工程信息模板用于负责将返回搜索条目传递的国际工程规范的条款文本,和第二轮提示工程文本按照模板规则融合形成第二轮提示工程信息,并将第二轮提示工程信息通过所选GPT模型的API发送给所选GPT模型,以实现国际工程规范问答助手的功能;
所述返回搜索条目用于接收和储存规范库搜索Ⅲ层从国际工程规范文本库中搜索得到的规范条目;
所述关键词匹配算法模块用于负责将返回关键词列表与国际工程规范文本库模块中的规范条目进行匹配,将匹配的规范条目传递给条目排序算法模块;
所述条目排序算法模块用于负责对关键词匹配算法模块传递的规范条目进行排序和筛选,将排序筛选后的规范条目传送给返回搜索条目。
7.如权利要求3所述的国际工程规范问答助手的高级提示工程***,其特征在于:所述多专业“问-答”案例文本库模块用于存储预设的来自建筑、结构、给排水、电气、暖通多个专业的工程师及工程项目管理人员,关于国际工程规范的问答案例文本。
8.如权利要求3所述的国际工程规范问答助手的高级提示工程***,其特征在于:所述国际工程规范文本库模块用于存储预设的国际工程规范文本范围内的规范书籍名称、规范条款编号以及规范条款内容文本;
所述运行记录负责与多轮提示工程层Ⅱ、规范搜索层Ⅲ进行交互,用于记录***运行中产生日志数据。
9.如权利要求3所述的国际工程规范问答助手的高级提示工程***,其特征在于:所述所选GPT模型用于与多轮提示工程层Ⅱ进行通信,基于所选GPT模型的API对来自多轮提示工程层Ⅱ的请求予以回应。
10.一种实现如权利要求1所述国际工程规范问答助手的高级提示工程方法的计算机电子设备,其特征在于,包括存储单元和处理单元;所述存储单元中存储在所述处理单元上运行的计算机程序;所述处理单元执行所述计算机程序时实现国际工程规范问答助手的高级提示工程方法。
CN202410338158.3A 2024-03-25 2024-03-25 一种国际工程规范问答助手的高级提示工程***、方法和电子设备 Active CN117931985B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410338158.3A CN117931985B (zh) 2024-03-25 2024-03-25 一种国际工程规范问答助手的高级提示工程***、方法和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410338158.3A CN117931985B (zh) 2024-03-25 2024-03-25 一种国际工程规范问答助手的高级提示工程***、方法和电子设备

Publications (2)

Publication Number Publication Date
CN117931985A true CN117931985A (zh) 2024-04-26
CN117931985B CN117931985B (zh) 2024-06-21

Family

ID=90761488

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410338158.3A Active CN117931985B (zh) 2024-03-25 2024-03-25 一种国际工程规范问答助手的高级提示工程***、方法和电子设备

Country Status (1)

Country Link
CN (1) CN117931985B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160017755A (ko) * 2014-08-04 2016-02-17 이선웅 국제 전문가 자문 시스템 및 자문 제공 방법
KR20160024368A (ko) * 2016-02-11 2016-03-04 이선웅 국제 전문가 자문 시스템 및 자문 제공 방법
KR101662450B1 (ko) * 2015-05-29 2016-10-05 포항공과대학교 산학협력단 다중 소스 하이브리드 질의응답 방법 및 시스템
WO2017051936A1 (ko) * 2015-09-21 2017-03-30 케이씨지엘오 주식회사 국제 전문가 자문 시스템 및 자문 제공 방법
CN116644168A (zh) * 2023-06-01 2023-08-25 重庆长安汽车股份有限公司 一种交互数据构建方法、装置、设备及存储介质
CN117094304A (zh) * 2023-10-18 2023-11-21 湖北华中电力科技开发有限责任公司 一种应用于电网领域技术标准制修订的提示方法和***
CN117271716A (zh) * 2023-07-11 2023-12-22 红塔烟草(集团)有限责任公司 一种基于生成式语言模型的法律法规问答***及构建方法
CN117668182A (zh) * 2023-11-24 2024-03-08 中铁第四勘察设计院集团有限公司 融合知识图谱和大语言模型的规范智能问答方法及***
CN117708288A (zh) * 2023-12-07 2024-03-15 中国建筑第八工程局有限公司 多gpt协同的海外工程建设标准检索***及其构建方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160017755A (ko) * 2014-08-04 2016-02-17 이선웅 국제 전문가 자문 시스템 및 자문 제공 방법
KR101662450B1 (ko) * 2015-05-29 2016-10-05 포항공과대학교 산학협력단 다중 소스 하이브리드 질의응답 방법 및 시스템
WO2017051936A1 (ko) * 2015-09-21 2017-03-30 케이씨지엘오 주식회사 국제 전문가 자문 시스템 및 자문 제공 방법
KR20160024368A (ko) * 2016-02-11 2016-03-04 이선웅 국제 전문가 자문 시스템 및 자문 제공 방법
CN116644168A (zh) * 2023-06-01 2023-08-25 重庆长安汽车股份有限公司 一种交互数据构建方法、装置、设备及存储介质
CN117271716A (zh) * 2023-07-11 2023-12-22 红塔烟草(集团)有限责任公司 一种基于生成式语言模型的法律法规问答***及构建方法
CN117094304A (zh) * 2023-10-18 2023-11-21 湖北华中电力科技开发有限责任公司 一种应用于电网领域技术标准制修订的提示方法和***
CN117668182A (zh) * 2023-11-24 2024-03-08 中铁第四勘察设计院集团有限公司 融合知识图谱和大语言模型的规范智能问答方法及***
CN117708288A (zh) * 2023-12-07 2024-03-15 中国建筑第八工程局有限公司 多gpt协同的海外工程建设标准检索***及其构建方法

Also Published As

Publication number Publication date
CN117931985B (zh) 2024-06-21

Similar Documents

Publication Publication Date Title
CN110825882B (zh) 一种基于知识图谱的信息***管理方法
Neculoiu et al. Learning text similarity with siamese recurrent networks
JP2008033931A (ja) テキストを追補する方法、クエリーに応答してテキストを取得する方法、およびシステム
CN112163424A (zh) 数据的标注方法、装置、设备和介质
CN113886604A (zh) 一种职位知识图谱生成方法和***
CN110941702A (zh) 一种法律法规和法条的检索方法及装置、可读存储介质
CN112836018A (zh) 应急预案的处理方法及装置
CN111767334A (zh) 信息抽取方法、装置、电子设备及存储介质
CN111782793A (zh) 智能客服处理方法和***及设备
Föll et al. Exploring information systems curricula: a text mining approach
CN111369294A (zh) 软件造价估算方法及装置
KR101794547B1 (ko) 단어장 자동 생성 및 학습훈련 시스템 및 방법
CN117034949A (zh) 咨询工单的分类方法、装置、电子设备及存储介质
CN112182150A (zh) 基于多元数据的聚合检索方法、装置、设备及存储介质
CN111881695A (zh) 一种审计知识的检索方法及装置
CN117931985B (zh) 一种国际工程规范问答助手的高级提示工程***、方法和电子设备
Mohanan et al. Natural Language Processing Approach for UML Class Model Generation from Software Requirement Specifications via SBVR.
CN114417010A (zh) 面向实时工作流的知识图谱构建方法、装置和存储介质
CN111460258B (zh) 司法鉴定信息提取方法、***、设备及存储介质
CN114548314A (zh) 文本匹配方法、装置、存储介质及电子设备
CN114491209A (zh) 基于互联网信息抓取的企业业务标签挖掘的方法和***
CN113761081A (zh) 一种用于对企业信息进行多维度组合检索的方法及其***
Loughnane et al. Linked data for language-learning applications
Bakar Latent Semantic Analysis and Particle Swarm Optimization for Requirements Reuse in Software Product Line: A Research Plan
CN115082174B (zh) 债券质控相似识别方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant