CN117493511B - 基于大语言模型的生猪领域自动问答***及方法 - Google Patents

基于大语言模型的生猪领域自动问答***及方法 Download PDF

Info

Publication number
CN117493511B
CN117493511B CN202311449858.1A CN202311449858A CN117493511B CN 117493511 B CN117493511 B CN 117493511B CN 202311449858 A CN202311449858 A CN 202311449858A CN 117493511 B CN117493511 B CN 117493511B
Authority
CN
China
Prior art keywords
user
information
answer
language model
answers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311449858.1A
Other languages
English (en)
Other versions
CN117493511A (zh
Inventor
申洪杰
何伟
柳静
张亮
王娟
杨祺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guonong Chongqing Pig Big Data Industry Development Co ltd
Original Assignee
Guonong Chongqing Pig Big Data Industry Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guonong Chongqing Pig Big Data Industry Development Co ltd filed Critical Guonong Chongqing Pig Big Data Industry Development Co ltd
Priority to CN202311449858.1A priority Critical patent/CN117493511B/zh
Publication of CN117493511A publication Critical patent/CN117493511A/zh
Application granted granted Critical
Publication of CN117493511B publication Critical patent/CN117493511B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Business, Economics & Management (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Mining & Mineral Resources (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Animal Husbandry (AREA)
  • Agronomy & Crop Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及人工智能技术领域,具体公开了基于大语言模型的生猪领域自动问答***及方法,其中方法包括如下内容:S1、获取生猪领域的相关数据;S2、对相关数据进行整理和清洗;S3、对相关数据预处理进行预处理和标注,建立训练集;S4、构建大语言模型,通过训练集内的相关数据对大语言模型进行训练,得到生猪领域的大语言模型;S5、获取用户的问询信息,判断问询信息为语音格式还是文本格式,如果为语音格式,将语音格式转换为文本格式;将文本格式的问询信息输入大语言模型,获得对应的答案。采用本发明的技术方案能够有效解决用户在生猪养殖领域的疑问。

Description

基于大语言模型的生猪领域自动问答***及方法
技术领域
本发明涉及人工智能技术领域,特别涉及基于大语言模型的生猪领域自动问答***及方法。
背景技术
当前,我国养殖业产能巨大,从事养殖业的人员众多,社会需求稳步增长,尤其是生猪养殖行业,我国对于猪肉的需求量巨大。事实上,从事生猪养殖的养殖人员并非每个都具备丰富和专业的养殖技术,对此,我国政府设立了畜牧兽医站为从事养猪的养殖人员提供技术服务。然而因为畜牧兽医站的技术服务人员人手不足的问题,难免无法及时地为所有养殖人员提供一对一服务。
当养殖人员遇到问题时,还可能自主进行解决,例如依靠口口相传的经验进行处理,或者通过网上搜索相关资料后进行处理。但是,口口相传的经验其效果难以保证,网上搜索相关资料,信息量大,难以从海量的信息中筛选出真实性和可靠性均符合需求的内容。
为此,需要一种能够有效解决用户在生猪养殖领域疑问的基于大语言模型的生猪领域自动问答***及方法。
发明内容
本发明提供了基于大语言模型的生猪领域自动问答方法,能够有效解决用户在生猪养殖领域的疑问。
为了解决上述技术问题,本申请提供如下技术方案:
基于大语言模型的生猪领域自动问答方法,包括如下内容:
S1、获取生猪领域的相关数据;
S2、对相关数据进行整理和清洗;
S3、对相关数据预处理进行预处理和标注,建立训练集;
S4、构建大语言模型,通过训练集内的相关数据对大语言模型进行训练,得到生猪领域的大语言模型;
S5、获取用户的问询信息,判断问询信息为语音格式还是文本格式,如果为语音格式,将语音格式转换为文本格式;将文本格式的问询信息输入大语言模型,获得对应的答案。
基础方案原理及有益效果如下:
本方案中,通过整理、清洗和预处理生猪领域的相关数据,提高了训练集的质量,使得训练出的大语言模型更能适应生猪领域的特定需求,减少了模型对无关信息的敏感性。通过语音到文本的转换,增加了***的用户友好性,用户方便或不会文本输入时,通过语音输入,也能享受到***提供的专业知识。训练后的大语言模型,能够为用户提供关于养殖技术、疾病防治、饲料管理等生猪领域的准确信息,从而有效解决用户在生猪领域的疑问。
综上,本方案具有显著的实际应用价值,能够有效地满足用户在生猪养殖领域的需求,提供高质量的信息支持。
进一步,所述步骤S1中,相关数据包括标准文件、养殖手册、专家建议、行业报告和产业链相关信息,产业链相关信息包括饲料信息、药品信息和加工信息。
本优选方案综合了多种生猪领域相关信息源,包括标准规范、实用指南、专业建议和行业研究,使用户能够获得全面、多层次的信息支持。通过包含产业链相关信息,如饲料和药品信息,使***能够提供与养殖环境、健康管理以及产品加工相关的详细信息,提高了答案的精准度。
进一步,所述步骤S5具体包括:
S501、获取用户的基础信息,基础信息包括用户姓名、联系方式、学历、养殖地点、养殖模式和身份;
S502、获取用户的问询信息,判断问询信息为语音格式还是文本格式,如果为语音格式,将语音格式转换为文本格式;
S503、根据用户的基础信息生成答案生成条件;
S504、将答案生成条件以及文本格式的问询信息输入大语言模型,获得对应的答案。
本优选方案通过获取用户的基础信息,能更好地了解用户的背景和目标,***可以生成个性化的答案生成条件,通过答案生成条件生成有针对性的答案,使得答案更符合用户的特定需求和情境,提高了用户满意度。例如,对于用户具有高学历或专业身份的情况,***可以保持答案的高度专业性,以满足其更深层次的需求。
进一步,所述步骤S5还包括:
S505、分析问询信息的主题,确定基于同一主题的问答内容中问答次数,判断问答次数是否超过对话阈值;如果未超过对话阈值,结束处理;如果超过对话阈值转跳至步骤S506;
S506、判断该问答内容对应的用户问询信息中,是否存在相同的关注点,如果存在,将该关注点标记为待验证关注点,并记录待验证关注点;
S507、在待验证关注点的数量满足预设要求后,筛选出与用户的基础信息具有关联性的待验证关注点,标记为有效关注点,并与对应的基础信息关联。
关注点,即问答内容包含的相同关键词,当问答次数超过对话阈值,且存在相同的关注点,表明用户对该关注点重视的程度高。
本优选方案能够监测同一主题下的问答次数,当问答次数超过对话阈值时,执行更复杂的关注点管理,以确保有效地处理重复的用户关注点。
通过自动识别和捕捉用户问询信息中的关注点,从中了解用户的真正兴趣和需求,有助于提供更有针对性的答案,还可以减少用户针对同一主题进行询问的次数,从而减少资源浪费,提高***效率。
进一步,所述步骤S503中,还根据用户的基础信息匹配有效关注点,如果匹配成功,识别问询信息的主题,判断有效关注点与主题是否相关,如果相关,根据用户的基础信息和有效关注点生成答案生成条件;如果不相关,根据用户的基础信息生成答案生成条件;
S504中,还将根据用户的基础信息和有效关注点生成的答案生成条件对应的答案标记为专属答案。
本优选方案可以根据用户的基础信息和有效关注点,为每个用户生成个性化的答案,提供更符合其需求的解决方案,从而提高了用户体验。
通过匹配有效关注点和主题的相关性,可以确保生成的答案与用户当前问题的主题密切相关,提高了答案的相关性,避免提供不相关或通用的答案。
进一步,所述步骤S505中,如果问答次数超过对话阈值,还判断问答内容中的答案是否为专属答案,如果不是,转跳至步骤S506;如果是,转跳至步骤S508;
S508、判断该问答内容对应的用户问询信息中,是否存在相同的关注点,如果存在相同的关注点,判断该关注点与生成专属答案的有效关注点是否相同,如果相同,转跳至步骤S509;如果不相同,转跳至步骤S506;
S509、根据当前问答内容的主题,筛选出相同主题的历史问答内容,获取历史问答内容对应的用户以及当前用户的养殖地点,判断是否在预设范围内,如果在,展示历史问答内容对应的用户的联系方式。
当生成专属答案后,问答次数依旧超过对话阈值,且存在与专属答案相同的有效关注点,表明用户对关注点的重视程度高,在生成专属答案后,继续提出包含有效关注点的问题。
本优选方案中,通过匹配预设范围内的问过相同主题的其他用户,展示其联系方式,用户可以直接联系具有相关经验的其他用户,获取更多实用性的信息和建议,从而提高答案的实用性。还能够满足当前用户进行交流的需求,同时鼓励用户之间的互动和知识分享,有助于建立更加紧密的养殖社区。
进一步,所述步骤S502中,如果是问询信息为语音格式,还用于获取用户的定位信息,根据定位信息判断是否处于对应的养殖地点,如果不处于对应的养殖地点,设置为基础模式;
如果处于对应的养殖地点,还从语音格式的问询信息中提取环境音频,根据环境音频分析是否存在生猪音频,如果存在,设置为预测模式;
如果不存在生猪音频,获取用户的运动数据,根据运动数据判断预设时间内用户的状态,如果状态为运动,设置为预测模式;如果状态为静止,设置为自适应模式。
当用户处于不同的位置,或者处于不同的工作状态时,对于答案的需求不同。本优选方案,通过获取用户的定位信息,可以判断用户是否位于用户对应的养殖地点,从而根据地理位置提供更精准的答案或信息。
对于在居住地址旁建造养殖场地的农户,难以通过养殖地点的定位判断其状态,本优选方案通过提取环境音频并分析生猪音频的存在,可以帮助判断用户处于生猪养殖场内,且处于工作状态,以进一步提供相关答案或信息。
通过获取用户的运动数据,***可以预测用户的状态,例如状态为运动,可以表征用户正在养殖场内进行相关工作,从而选择适当的问答模式,提供更符合用户当前情境的服务。
进一步,所述步骤S503中,还判断当前的模式,如果处于基础模式,取消答案生成条件;
如果处于自适应模式,根据用户的基础信息生成答案生成条件;
如果处于预测模式,根据用户的基础信息匹配有效关注点,如果匹配成功,识别问询信息的主题,判断有效关注点与主题是否相关,如果相关,根据用户的基础信息和有效关注点生成答案生成条件;如果不相关,根据用户的基础信息生成答案生成条件。
本优选方案的基础模式:当用户不处于对应的养殖地点,用户有更多的时间研究、查看回答的内容。取消答案生成条件,提供更为完整,专业的内容,同时以避免提供不相关或不必要的答案。
自适应模式:在用户处于对应的养殖地点,且未工作时,用户时间相对较多,且有更多的精力进行交互,根据用户的基础信息生成答案生成条件,以提供通用性的答案,确保用户在各种情境下都能获得基本信息支持。
预测模式:当用户处于对应的养殖地点,且工作时,进行交互的时间相对较少,且需要快速得到有关的答案,根据用户的基础信息和关注点生成答案生成条件,以提供对于关注点更深入和更有针对性的答案,满足用户特定需求。
综上,本优选方案能够更好地根据用户的环境和状态提供个性化的问答服务,提高答案的实用性和相关性,增强了***的适应性和用户体验。
进一步,所述步骤S504中,基础模式下,将文本格式的问询信息输入大语言模型,获得对应的答案。
预测模式和自适应模式下,将答案生成条件以及文本格式的问询信息输入大语言模型,获得对应的答案。
进一步,基于大语言模型的生猪领域自动问答***,其特征在于,使用上述方法。
附图说明
图1为基于大语言模型的生猪领域自动问答方法实施例一的流程图。
具体实施方式
下面通过具体实施方式进一步详细说明:
实施例一
如图1所示,本实施例的基于大语言模型的生猪领域自动问答方法,包括如下内容:
S1、获取生猪领域的相关数据;相关数据包括标准文件、养殖手册、专家建议、行业报告和产业链相关信息,产业链相关信息包括饲料信息、药品信息和加工信息。标准文件包括团体标准、行业标准、国家标准等。
S2、对相关数据进行整理和清洗。例如将相关数据整理成结构化的格式,去除重复项、错误数据和不相关的信息。
S3、对相关数据预处理进行预处理和标注,建立数据集;预处理例如对相关数据中的文本数据进行分词、停用词去除、词干化等文本处理操作;
S4、构建大语言模型,通过数据集内的相关数据对大语言模型进行训练,得到生猪领域的大语言模型,以便大语言模型理解生猪养殖领域的语境和知识,包括仔猪选育、养殖疫苗、养殖饲料、生猪医学检查、疾病症状、药品介绍、猪场管理等。本实施例中,选择GPT-4或其他基于Transformer网络结构自行构建的大语言模型。将生猪领域的大语言模型进行部署,以及定期更新大语言模型以反映最新的行业数据和知识。
S5、获取用户的问询信息,判断问询信息为语音格式还是文本格式,如果为语音格式,将语音格式转换为文本格式;将文本格式的问询信息输入大语言模型,获得对应的答案。
具体包括:
S501、获取用户的基础信息,基础信息包括用户姓名、联系方式、学历、养殖地点、养殖模式和身份;养殖模式包括农户散养、“公司+农户”合作养殖和公司自养,身份包括养殖户(对应农户散养、“公司+农户”合作养殖两种养殖模式)、技术员(对应“公司+农户”合作养殖和公司自养两种养殖模式)、管理人员(对应“公司+农户”合作养殖和公司自养两种养殖模式)。
S502、获取用户的问询信息,判断问询信息为语音格式还是文本格式,如果为语音格式,将语音格式转换为文本格式;
S503、根据用户的基础信息匹配有效关注点,如果匹配成功,识别问询信息的主题,判断有效关注点与主题是否相关,如果相关,根据用户的基础信息和有效关注点生成答案生成条件;如果不相关,根据用户的基础信息生成答案生成条件。本实施例中,建立基础信息到答案生成条件的转换规则,学历、养殖模式和身份对应不同的转换规则。例如,学历为小学,通过转换规则得到简化答案专业性的答案生成条件,学历为大学,通过转换规则得到保持答案专业性的答案生成条件;养殖模式为农户散养,通过转换规则得到使答案符合散养场景的答案生成条件。
S504、将答案生成条件以及文本格式的问询信息输入大语言模型,获得对应的答案。还将根据用户的基础信息和有效关注点生成的答案生成条件对应的答案标记为专属答案。
例如,问询信息为:促生长添加剂是什么?
根据保持答案专业性的答案生成条件,得到的答案为:“促生长添加剂是一类可以提高生猪的生长速度和饲料转化率的饲料添加剂。常见的促生长添加剂有以下几种:半胱胺,化学名为B-硫基乙胺,是一种白色结晶,呈碱性。它可以刺激生长激素的分泌,增加肌肉蛋白质的合成降低脂肪含量,提高屠宰率和瘦肉率。哇乙醇,化学名为2-甲基哇咻乙醇,是一种有机化合物,具有抗菌和抗炎作用。它可以抑制肠道内有害菌的生长改善肠道微生态平衡,增强免疫力,促进食欲和消化吸收。猪快长,是一种由多种中草药提取物组成的复合型促生长添加剂。它可以调节内分泌***,增加生长激素的分泌,提高饲料利用率和肉质品质。速育精,是一种由多种氨基酸、维生素、微量元素等组成的复合型促生长添加剂。它可以补充日粮中的营养素,提高肠道消化酶的活性,增强新陈代谢和免疫功能。多素是一种由多种动物血液提取物组成的复合型促生长添加剂。它可以提供丰富的血浆蛋白、免疫球蛋白、生长因子等,增强机体抵抗力和修复能力。肝渣,是一种由动物肝脏提取物组成的单一型促生长添加剂。它可以提供丰富的维生素A、D、E、K等,调节机体代谢和内分泌平衡。畜禽乐,是一种由多种中草药提取物和微量元素组成的复合型促生长添加剂。它可以改善日粮的适口性和营养价值,增加食欲和消化吸收率。肥猪旺,是一种由多种中草药提取物和氨基酸组成的复合型促生长添加剂。它可以调节内分泌***和神经***,增加生长激素和胰岛素的分泌,促进脂肪分解和肌肉合成。”
根据简化答案专业性的答案生成条件,得到的答案为:
“促生长添加剂是一类可以提高生猪的生长速度和饲料转化率的饲料添加剂。
常见的促生长添加剂包括:半胱胺、哇乙醇、猪快长、速育精、血多素、肝渣、畜禽乐、肥猪旺等。
可以输入促生长添加剂的名称获得更为详细的信息”
用户输入:“猪快长”
生成答案:“是一种由多种中草药提取物组成的复合型促生长添加剂。它可以调节内分泌***,增加生长激素的分泌,提高饲料利用率和肉质品质。”
再例如,问询信息为:想让猪长快一点用什么饲料添加剂?获取问询信息的主题,促生长添加剂,用户的基础信息中,学历为小学,养殖模式为农户散养,身份为养殖户,匹配有效关注点为“猪快长”,
生成的专属答案为:
“促生长添加剂是一类可以提高生猪的生长速度和饲料转化率的饲料添加剂。
常见的促生长添加剂包括:半胱胺、哇乙醇、猪快长、速育精、血多素、肝渣、畜禽乐、肥猪旺等。
其中,猪快长,是一种由多种中草药提取物组成的复合型促生长添加剂。它可以调节内分泌***,增加生长激素的分泌,提高饲料利用率和肉质品质。
可以输入促生长添加剂的名称获得更为详细的信息”,即在生成的专属答案中,将对“猪快长”这一促生长添加剂进行重点介绍。
S505、分析问询信息的主题,确定基于同一主题的问答内容中问答次数,判断问答次数是否超过对话阈值;如果未超过对话阈值,结束处理;如果问答次数超过对话阈值,还判断问答内容中的答案是否为专属答案,如果不是,转跳至步骤S506;如果是,转跳至步骤S508;本实施例中,对话阈值为3次。
S506、判断该问答内容对应的用户问询信息中,是否存在相同的关注点,如果存在,将该关注点标记为待验证关注点,并记录待验证关注点;
S507、在待验证关注点的数量满足预设要求后,筛选出与用户的基础信息具有关联性的待验证关注点,标记为有效关注点,并与对应的基础信息关联。
例如,用户问询信息的主题为促生长添加剂,就这一主题,问答次数(用户提问,大语言模型生成答案记为1次问答)为5次,超过对话阈值,用户问询信息中,3次提到“猪快长”,将“猪快长”作为待验证关注点。
从不同的问答内容中,提取的“猪快长”这一待验证关注点的数量满足预设要求(例如100次),即,有100次的问答内容中,都包含“猪快长”这一待验证关注点。
通过筛选发现,100次的问答内容对应的用户,其中80%有养殖模式为农户散养,身份为养殖户这两项相同的基础信息,故将“猪快长”作为有效关注点,与养殖模式为农户散养,身份为养殖户这两项相同的基础信息关联。
S508、判断该问答内容对应的用户问询信息中,是否存在相同的关注点,如果存在相同的关注点,判断该关注点与生成专属答案的有效关注点是否相同,如果相同,转跳至步骤S509;如果不相同,转跳至步骤S506;
S509、根据当前问答内容的主题,筛选出相同主题的历史问答内容,获取历史问答内容对应的用户以及当前用户的养殖地点,判断是否在预设范围内,如果在,展示历史问答内容对应的用户的联系方式。预设范围为1-5公里,本实施例中为1公里。
例如,用户A问询促生长添加剂这一主题的内容,得到专属答案,用户A继续在促生长添加剂这一主题下对话4次,超过对话阈值,且存在相同的关注点-“猪快长”,该关注点与专属答案的有效关注点相同。通过促生长添加剂这一主题,以及“猪快长”这一关注点,筛选出主题相同、关注点相同的历史问答内容,该历史问答内容对应的用户B的养殖地点与用户A的养殖地点相距在1公里以内,则展示用户B的联系方式。本实施例中,需要预先和用户签订许可协议,获得展示其联系方式的授权。
本实施例还提供基于大语言模型的生猪领域自动问答***,包括服务器和用户终端,用户终端用于获取用户的基础信息和问询信息;
服务器用于大语言模型的训练,以及部署训练后的大语言模型。还用于通过大语言模型执行方法S5的步骤。用户终端例如台式电脑、笔记本电脑、智能手机、平板电脑等,本实施例中采用智能手机。
实施例二
本实施例和实施例一的区别在于,本实施例的步骤S502中,如果是问询信息为语音格式,还用于获取用户的定位信息,根据定位信息判断是否处于对应的养殖地点,如果不处于对应的养殖地点,设置为基础模式;本实施例中,从用户的智能手机获取定位信息。
如果处于对应的养殖地点,还从语音格式的问询信息中提取环境音频,根据环境音频分析是否存在生猪音频,如果存在,设置为预测模式。本实施例中,通过预先采集生猪发出的叫声等音频,提取特征,再将环境音频中的特征与提前的特征进行匹配分析,如果匹配成功,判断存在生猪音频。
如果不存在生猪音频,获取用户的运动数据,根据运动数据判断预设时间内用户的状态,如果状态为运动,设置为预测模式;如果状态为静止,设置为自适应模式。本实施例中,运动数据包括行走步数数据,如果预设时间内(例如接收问询信息向前推1分钟内)的行走步数数据超过步数值(例如20步),判断为运动状态,否则判断为静止状态。本实施例中,从用户的智能手机获取运动数据。
S503中,还判断当前的模式,如果处于基础模式,取消答案生成条件;
如果处于自适应模式,根据用户的基础信息生成答案生成条件;
如果处于预测模式,根据用户的基础信息匹配有效关注点,如果匹配成功,识别问询信息的主题,判断有效关注点与主题是否相关,如果相关,根据用户的基础信息和有效关注点生成答案生成条件;如果不相关,根据用户的基础信息生成答案生成条件。
S504中,基础模式下,将文本格式的问询信息输入大语言模型,获得对应的答案。
预测模式和自适应模式下,将答案生成条件以及文本格式的问询信息输入大语言模型,获得对应的答案。
实施例三
本实施例与实施例二的不同之处在于,本实施例的步骤S502中,如果问询信息为文字格式,还用于获取用户的定位信息,根据定位信息判断是否处于对应的养殖地点,如果不处于对应的养殖地点,设置为基础模式;如果处于对应的养殖地点,设置为自适应模式。问询信息为文字信息,表明有更多的时间对回答进行研究、查看。如果用户不处于对应的养殖地点,即离开养殖地点,没有处理问题的急迫性,取消答案生成条件,提供更为完整,专业的内容供用户研究。处于对应的养殖地点,以提供通用性的答案,确保用户在各种情境下都能获得基本信息支持。
如果问询信息为语音格式,还用于获取用户的定位信息,根据定位信息判断是否处于对应的养殖地点,如果不处于对应的养殖地点,设置为基础模式;
如果处于对应的养殖地点,还识别用户的身份,如果身份为技术人员或管理人员,设置为自适应模式;技术人员和管理人员具有一定的专业知识,对于答案具有更好的判断能力以及明确的需求,根据用户的基础信息生成答案生成条件,以提供通用性的答案,确保用户在各种情境下都能获得基本信息支持,一定程度上减少对答案的干预。
如果身份为养殖户,还从语音格式的问询信息中提取环境音频,根据环境音频分析是否存在生猪音频,如果存在,设置为预测模式;对于在居住地址旁建造养殖场地的农户,难以通过养殖地点的定位判断其状态,通过提取环境音频并分析生猪音频的存在,可以帮助判断用户处于生猪养殖场内,且处于工作状态,进行交互的时间相对较少,且需要快速得到有关的答案,根据用户的基础信息和关注点生成答案生成条件,以提供对于关注点更深入和更有针对性答案,满足养殖户的特定需求。
如果不存在生猪音频,获取用户的运动数据,根据运动数据判断预设时间内用户的状态,如果状态为运动,设置为预测模式;如果状态为静止,设置为自适应模式。
过获取用户的运动数据,***可以预测用户的状态,例如状态为运动,可以表征用户正在养殖场内进行相关工作;静止状态,则用户此时未进行相关工作的概率较高。
实施例四
本实施例与实施例三的不同之处在于,本实施例的步骤S502中,如果问询信息为语音格式,根据定位信息判断不处于对应的养殖地点时,还识别用户的身份,如果身份为技术人员,且处于其他用户的养殖地点,设置为预测模式。
当技术人员处于其他用户的养殖地点时,外出协助其他养猪户解决问题的概率较高,此时,提供对于关注点更深入和更有针对性的答案,帮助技术人员快速得到有关信息,快速完成协助任务。
实施例五
本实施例与实施例四的区别在于,本实施例的步骤S502中,在处于对应的养殖地点,识别用户的身份为技术人员后,还判断用户对应的养殖地点是否接入监控视频,如果接入监控视频,获取监控视频,判断监控视频内是否同时包含用户与猪舍的围栏,如果同时包含,计算用户与围栏的距离,判断距离是否小于预设距离,如果小于预设距离,设置为预测模式,如果大于或等于预设距离,设置为自适应模式。本实施例中,围栏指猪舍内限制生猪活动范围的栏杆,生猪被养殖在围栏圈出的范围内。例如,预设距离为50cm。
对于聘用技术人员的养殖地点,通常会建立监控视频,通过监控视频分析技术人员与猪舍围栏的距离,可以间接反应技术人员的工作状态,即,距离小于预设距离,技术人员正在巡视的概率高,大于或等于预设距离,工作人员路过的概率更高。在巡视的情况下,进行交互的时间相对较少,且需要快速得到有关的答案,根据用户的基础信息和关注点生成答案生成条件,以提供对于关注点更深入和更有针对性答案,满足技术人员的特定需求。
以上的仅是本发明的实施例,该发明不限于此实施案例涉及的领域,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。

Claims (4)

1.基于大语言模型的生猪领域自动问答方法,其特征在于,包括如下内容:
S1、获取生猪领域的相关数据;相关数据包括标准文件、养殖手册、专家建议、行业报告和产业链相关信息,产业链相关信息包括饲料信息、药品信息和加工信息;
S2、对相关数据进行整理和清洗;
S3、对相关数据预处理进行预处理和标注,建立训练集;
S4、构建大语言模型,通过训练集内的相关数据对大语言模型进行训练,得到生猪领域的大语言模型;
S5、获取用户的问询信息,判断问询信息为语音格式还是文本格式,如果为语音格式,将语音格式转换为文本格式;将文本格式的问询信息输入大语言模型,获得对应的答案,具体包括:
S501、获取用户的基础信息,基础信息包括用户姓名、联系方式、学历、养殖地点、养殖模式和身份;
S502、获取用户的问询信息,判断问询信息为语音格式还是文本格式,如果为语音格式,将语音格式转换为文本格式;如果是问询信息为语音格式,还用于获取用户的定位信息,根据定位信息判断是否处于对应的养殖地点,如果不处于对应的养殖地点,设置为基础模式;
如果处于对应的养殖地点,还从语音格式的问询信息中提取环境音频,根据环境音频分析是否存在生猪音频,如果存在,设置为预测模式;
如果不存在生猪音频,获取用户的运动数据,根据运动数据判断预设时间内用户的状态,如果状态为运动,设置为预测模式;如果状态为静止,设置为自适应模式;
S503、根据用户的基础信息生成答案生成条件;还根据用户的基础信息匹配有效关注点,如果匹配成功,识别问询信息的主题,判断有效关注点与主题是否相关,如果相关,根据用户的基础信息和有效关注点生成答案生成条件;如果不相关,根据用户的基础信息生成答案生成条件;
S504、将答案生成条件以及文本格式的问询信息输入大语言模型,获得对应的答案;还将根据用户的基础信息和有效关注点生成的答案生成条件对应的答案标记为专属答案;
S505、分析问询信息的主题,确定基于同一主题的问答内容中问答次数,判断问答次数是否超过对话阈值;如果未超过对话阈值,结束处理;如果问答次数超过对话阈值,还判断问答内容中的答案是否为专属答案,如果不是,转跳至步骤S506;如果是,转跳至步骤S508;
S506、判断该问答内容对应的用户问询信息中,是否存在相同的关注点,如果存在,将该关注点标记为待验证关注点,并记录待验证关注点;
S507、在待验证关注点的数量满足预设要求后,筛选出与用户的基础信息具有关联性的待验证关注点,标记为有效关注点,并与对应的基础信息关联;
S508、判断该问答内容对应的用户问询信息中,是否存在相同的关注点,如果存在相同的关注点,判断该关注点与生成专属答案的有效关注点是否相同,如果相同,转跳至步骤S509;如果不相同,转跳至步骤S506;
S509、根据当前问答内容的主题,筛选出相同主题的历史问答内容,获取历史问答内容对应的用户以及当前用户的养殖地点,判断是否在预设范围内,如果在,展示历史问答内容对应的用户的联系方式。
2.根据权利要求1所述的基于大语言模型的生猪领域自动问答方法,其特征在于:所述步骤S503中,还判断当前的模式,如果处于基础模式,取消答案生成条件;
如果处于自适应模式,根据用户的基础信息生成答案生成条件;
如果处于预测模式,根据用户的基础信息匹配有效关注点,如果匹配成功,识别问询信息的主题,判断有效关注点与主题是否相关,如果相关,根据用户的基础信息和有效关注点生成答案生成条件;如果不相关,根据用户的基础信息生成答案生成条件。
3.根据权利要求2所述的基于大语言模型的生猪领域自动问答方法,其特征在于:所述步骤S504中,基础模式下,将文本格式的问询信息输入大语言模型,获得对应的答案。
4.基于大语言模型的生猪领域自动问答***,其特征在于,使用权利要求1-3任一项所述的方法。
CN202311449858.1A 2023-11-02 2023-11-02 基于大语言模型的生猪领域自动问答***及方法 Active CN117493511B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311449858.1A CN117493511B (zh) 2023-11-02 2023-11-02 基于大语言模型的生猪领域自动问答***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311449858.1A CN117493511B (zh) 2023-11-02 2023-11-02 基于大语言模型的生猪领域自动问答***及方法

Publications (2)

Publication Number Publication Date
CN117493511A CN117493511A (zh) 2024-02-02
CN117493511B true CN117493511B (zh) 2024-06-07

Family

ID=89677604

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311449858.1A Active CN117493511B (zh) 2023-11-02 2023-11-02 基于大语言模型的生猪领域自动问答***及方法

Country Status (1)

Country Link
CN (1) CN117493511B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118152430B (zh) * 2024-05-13 2024-07-23 厦门农芯数字科技有限公司 一种基于大语言模型的养殖场数据指标分析方法、装置以及设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140065672A (ko) * 2012-11-20 2014-05-30 주식회사 글로비트 해상 가두리 시설 지능형 통합 관리 시스템
CN105677927A (zh) * 2016-03-31 2016-06-15 百度在线网络技术(北京)有限公司 用于提供搜索结果的方法和装置
KR20170119112A (ko) * 2016-04-18 2017-10-26 네이버 주식회사 웹 서버, 사용자 단말 및 이에 의한 q&a 컨텐츠 정보의 제공 방법
CN113129866A (zh) * 2021-04-13 2021-07-16 重庆度小满优扬科技有限公司 语音处理方法、装置、存储介质及计算机设备
CN114328881A (zh) * 2022-01-19 2022-04-12 重庆长安汽车股份有限公司 一种基于短文本匹配的语音问答方法及***
CN114416942A (zh) * 2021-12-29 2022-04-29 南京视察者智能科技有限公司 一种基于深度学习的自动化问答方法
CN115757726A (zh) * 2022-11-16 2023-03-07 四川启睿克科技有限公司 一种面向特定领域的智能问答***冷启动方法及装置
CN116127045A (zh) * 2023-03-03 2023-05-16 北京百度网讯科技有限公司 生成式大语言模型训练方法、基于模型的人机语音交互方法
KR20230079969A (ko) * 2021-11-29 2023-06-07 에스엠티정보기술(주) 축산업 비 전문가 생산성 증대를 위한 자동 제어 생육 분석 시스템
CN116881441A (zh) * 2023-07-05 2023-10-13 浙江工业大学 提升用户对话理解和ChatGPT回答质量的可视分析方法和***

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016199464A1 (ja) * 2015-06-12 2016-12-15 ソニー株式会社 情報処理装置、情報処理方法及びプログラム
US10747758B2 (en) * 2016-04-29 2020-08-18 Rovi Guides, Inc. Methods and systems for identifying an information resource for answering natural language queries

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140065672A (ko) * 2012-11-20 2014-05-30 주식회사 글로비트 해상 가두리 시설 지능형 통합 관리 시스템
CN105677927A (zh) * 2016-03-31 2016-06-15 百度在线网络技术(北京)有限公司 用于提供搜索结果的方法和装置
KR20170119112A (ko) * 2016-04-18 2017-10-26 네이버 주식회사 웹 서버, 사용자 단말 및 이에 의한 q&a 컨텐츠 정보의 제공 방법
CN113129866A (zh) * 2021-04-13 2021-07-16 重庆度小满优扬科技有限公司 语音处理方法、装置、存储介质及计算机设备
KR20230079969A (ko) * 2021-11-29 2023-06-07 에스엠티정보기술(주) 축산업 비 전문가 생산성 증대를 위한 자동 제어 생육 분석 시스템
CN114416942A (zh) * 2021-12-29 2022-04-29 南京视察者智能科技有限公司 一种基于深度学习的自动化问答方法
CN114328881A (zh) * 2022-01-19 2022-04-12 重庆长安汽车股份有限公司 一种基于短文本匹配的语音问答方法及***
CN115757726A (zh) * 2022-11-16 2023-03-07 四川启睿克科技有限公司 一种面向特定领域的智能问答***冷启动方法及装置
CN116127045A (zh) * 2023-03-03 2023-05-16 北京百度网讯科技有限公司 生成式大语言模型训练方法、基于模型的人机语音交互方法
CN116881441A (zh) * 2023-07-05 2023-10-13 浙江工业大学 提升用户对话理解和ChatGPT回答质量的可视分析方法和***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
规模化养殖环境影响评价实证研究;刘丽青;谢海燕;;环境科学与管理;20130315(第03期);全文 *

Also Published As

Publication number Publication date
CN117493511A (zh) 2024-02-02

Similar Documents

Publication Publication Date Title
Neo et al. Geographies of meat: Politics, economy and culture
CN117493511B (zh) 基于大语言模型的生猪领域自动问答***及方法
Damron Introduction to Animal Science: Global Biological, Social and Industry
Ekakoro et al. Drivers of antimicrobial use practices among tennessee dairy cattle producers
Adamczyk Dairy cattle welfare as a result of human-animal relationship–a review
Munda et al. Indigenous Knowledge Research System [IKRS] for treatment of bloat and its significance towards greenhouse gas emission: Jharkhand, India
KR20210147206A (ko) 반려동물 맞춤상품 제공을 위한 문진 서비스 제공 시스템
McConnel et al. Conceptual modeling of postmortem evaluation findings to describe dairy cow deaths
Kaufmann Second-order cybernetics as a tool to understand why pastoralists do what they do
Flint et al. Long-lasting chews elicit positive emotional states in dogs during short periods of social isolation
de Souza Farias et al. Two hours of separation prior to milking: Is this strategy stressful for jennies and their foals?
Sandøe et al. Animal welfare: What is the role of science?
CN117436614A (zh) 用于生猪养殖的综合服务平台
Lawrence et al. Welfare of extensively farmed animals: principles and practice
Al-Marashdeh et al. Short-term grazing and urination behaviour of dairy cows differing in their genetic merit
Ekanayake et al. Pre-exposure of early-weaned lambs to a herb-clover mix does not improve their subsequent growth
Bateki Adaptation of herd simulation models to predict the efficiency of the use of resources in tropical ruminant production systems
McConnel et al. Invited Review: Why cows die in US dairy herds
Naidu et al. Analysing the profile characteristics and perception of veterinarians towards organic dairy standards
Rault et al. 5. Cognitive approaches and new technologies: changing methodologies in applied ethology
Capetillo Hernandez What is farm animal welfare?
Mylostyvyi et al. Veterinary, economic and social aspects of cattle welfare: a review
Mason et al. Farm-level risk factors and treatment protocols for lameness in New Zealand dairy cattle
Bateki Adjogo Adaptation of herd simulation models to predict the efficiency of the use of resources in tropical ruminant production systems
Singh MBBS, MS, FMAS

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant