CN117992594A - 基于生成式ai的用户陪伴方法、***、设备及存储介质 - Google Patents

基于生成式ai的用户陪伴方法、***、设备及存储介质 Download PDF

Info

Publication number
CN117992594A
CN117992594A CN202410173537.1A CN202410173537A CN117992594A CN 117992594 A CN117992594 A CN 117992594A CN 202410173537 A CN202410173537 A CN 202410173537A CN 117992594 A CN117992594 A CN 117992594A
Authority
CN
China
Prior art keywords
question
user
answer information
information
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410173537.1A
Other languages
English (en)
Inventor
李扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202410173537.1A priority Critical patent/CN117992594A/zh
Publication of CN117992594A publication Critical patent/CN117992594A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于生成式AI的用户陪伴方法、***、设备及存储介质,方法包括:获取注册信息进行注册,并设定人机交互方式;构建基于人机交互的后台问答模型,用于进行主动关怀、私人助理和疾病预测;构建用于存储问答信息的数据池,问答信息用于生成报告和模型训练;根据存储的问答信息,采用大语言模型进行分析,确定问答信息的话题领域;根据话题领域提取对应的专业领域知识,并与问答信息一并进行向量化,得到向量序列;获取用户提问,提炼向量化表示的待检索数据,基于待检索数据采用检索增强生成方法,对与用户提问相关的向量序列进行处理,生成目标回答信息。本发明能够根据注册信息进行个性化陪伴,满足不同需求,填补养老服务缺口。

Description

基于生成式AI的用户陪伴方法、***、设备及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于生成式AI的用户陪伴方法、***、电子设备及计算机可读存储介质。
背景技术
生成式AI是指一种通过学习大规模数据集生成新的原创内容的新型人工智能,它是基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术,提供生成式人工智能产品或服务。
而随着老龄化进程的加速,养老产业面临着庞大的时长需求。但是,现有的养老服务供给不足,且没有针对有生活自理能力的养老服务供给。
因此,亟需一种能够填补现有养老服务缺口,提供个性化陪伴服务的生成式AI用户陪伴方法。
发明内容
基于此,有必要针对上述技术问题,提供一种基于生成式AI的用户陪伴方法、***、电子设备及计算机可读存储介质。
一种基于生成式AI的用户陪伴方法,包括以下步骤:获取注册信息进行注册,并设定人机交互方式;构建基于人机交互的后台问答模型,用于进行主动关怀、私人助理和疾病预测;构建用于存储问答信息的数据池,所述问答信息用于生成报告和模型训练;根据存储的问答信息,采用大语言模型进行分析,确定问答信息的话题领域;根据所述话题领域提取对应的专业领域知识,并与所述问答信息一并进行向量化,得到向量序列;获取用户提问,提炼向量化表示的提问内容得到待检索数据,基于所述待检索数据采用检索增强生成方法,对与所述用户提问相关的所述向量序列进行处理,生成目标回答信息。
在其中一个实施例中,所述注册信息包括用户性格调查分析报告。
在其中一个实施例中,所述构建基于人机交互的后台问答模型,用于进行主动关怀、私人助理和疾病预测,包括:构建得到基于人机交互的后台问答模型;基于所述用户性格调查分析报告确定用户的性格类型,通过后台问答模型发起主动关怀话题,并利用大语言模型完成语音和文字的实时转换,所述主动关怀话题包括天气状况、嘘寒问暖、用药提醒、娱乐点播和紧急呼救;接入大语言模型AI的应用程序接口,利用大语言模型进行用户私人助理方面的沟通,包括疾病预防、订票缴费和旅游咨询,并将问答的对话内容以文本的形式存储到所述数据池中;接入疾病AI接口,根据实时声音进行疾病探测,得到探测信息,并记录在所述数据池中,用于进行当日汇报和领域分析。
在其中一个实施例中,所述根据存储的问答信息,采用大语言模型进行分析,确定问答信息的话题领域,包括:采用大语言模型,从存储的问答信息中提取当日问答信息中的话题关键词,并基于所述话题关键词确定话题领域;基于所述话题关键词和话题领域对用户的情感倾向进行分析,得到分析结果;基于对话内容的分析结果,生成当日的汇报文件,所述汇报文件包括话题、情感倾向以及行动建议;对每日问答信息的话题进行综合分析和归类,提炼出话题的简要描述和标签。
在其中一个实施例中,所述根据所述话题领域提取对应的专业领域知识,并与所述问答信息一并进行向量化,得到向量序列,包括:基于所述话题领域查找对应的专业领域数据库,在所述专业领域数据库中提取得到对应的专业领域知识;将所述问答信息和专业领域知识进行切分,划分得到块或句子;对每个块或句子进行分词,进一步划分为单个词或标记;对每个词或标记进行嵌入词向量化,得到对应的向量表示;将所有向量化后的词或标记进行组合,得到向量序列并存储至向量数据库中。
在其中一个实施例中,所述获取用户提问,提炼向量化表示的提问内容得到待检索数据,基于所述待检索数据采用检索增强生成方法,对与所述用户提问相关的向量序列进行处理,生成目标回答信息,包括:获取用户提问,将用户提问转换为向量化表示的提问内容,提炼得到待检索数据;采用检索增强生成方法,对所述向量序列进行索引化处理,所述索引化处理包括数据加载、数据清洗和元数据提取,其中,所述元数据包括文件名、时间、章节标题和图片描述的关键信息;采用文本编码技术将索引化后的数据转化为向量表示;基于索引算法,根据编码后的数据构建索引;基于所述待检索数据,采用检索算法根据所述索引进行检索操作,得到所述查询信息对应的文档或段落,生成检索结果;采用排序算法对所述检索结果进行排序;根据排序后的检索结果结合所述用户提问,采用大语言模型生成对应的目标回答信息。
一种基于生成式AI的用户陪伴***,用于实现如上所述的一种基于生成式AI的用户陪伴方法,包括:人机交互模块、后台问答模块、数据池构建模块、AI离线分析模块、AI在线分析模块和回答生成模块,且所述人机交互模块、后台问答模块、数据池构建模块、AI离线分析模块、AI在线分析模块和回答生成模块之间通信连接;所述人机交互模块用于获取注册信息进行注册,并根据设定的人机交互方式进行人机交互;所述后台问答模块用于构建基于人机交互的后台问答模型,用于进行主动关怀、私人助理和疾病预测;所述数据池构建模块用于构建存储问答信息的数据池,所述问答信息用于生成报告和模型训练;所述AI离线分析模块用于根据存储的问答信息,采用大语言模型进行分析,确定问答信息的话题领域;所述AI在线分析模块用于根据所述话题领域提取对应的专业领域知识,并与所述问答信息一并进行向量化,得到向量序列;所述回答生成模块用于获取用户提问,提炼向量化表示的提问内容得到待检索数据,基于所述待检索数据采用检索增强生成方法,对与所述用户提问相关的所述向量序列进行处理,生成目标回答信息。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述各个实施例中所述的基于生成式AI的用户陪伴方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述各个实施例中所述的基于生成式AI的用户陪伴方法的步骤。
相比于现有技术,本发明的优点及有益效果在于:通过获取注册信息进行注册,并设定人机交互方式,构建基于人机交互的后台问答模型,用于实现主动关怀、私人助理和疾病预测的功能,构建用于存储问答信息的数据池,问答信息能够用于报告的生成和模型的训练;根据存储的问答信息,采用大语言模型进行分析,确定问答信息的话题领域,基于话题领域提取对应的专业领域知识,并与问答信息一并进行向量化,得到向量序列,获取用户提问提炼出向量化表示的待检索数据,基于待检索数据采用检索增强生成方法,对与用户提问相关的向量序列进行处理,生成目标回答信息,从而能够实现基于生成式AI的用户陪伴,且能够根据用户的注册信息进行个性化且安全的陪伴,以满足不同用户的需求,填补了现有养老服务的缺口。
附图说明
图1为一个实施例中一种基于生成式AI的用户陪伴方法的流程示意图;
图2为一个实施例中一种基于生成器AI的用户陪伴方法的整体流程图;
图3为一个实施例中采用大语言模型进行AI离线分析的流程示意图;
图4为一个实施例中AI在线分析获取采集数据的向量序列的流程示意图;
图5为一个实施例中检索增强生成回答的流程示意图;
图6为一个实施例中一种基于生成式AI的用户陪伴***的结构示意图;
图7为一个实施例中电子设备的内部结构示意图。
具体实施方式
在进行本发明具体实施方式说明之前,先对本发明的整体构思进行如下说明:
本发明主要是基于AI养老服务过程研发的,现有技术中缺乏养老服务和养老产品。
因此本发明提出了一种基于生成式AI的用户陪伴方法,通过获取注册信息进行注册,并设定人机交互方式,构建基于人机交互的后台问答模型,用于实现主动关怀、私人助理和疾病预测的功能,构建用于存储问答信息的数据池,问答信息能够用于报告的生成和模型的训练;根据存储的问答信息,采用大语言模型进行分析,确定问答信息的话题领域,基于话题领域提取对应的专业领域知识,并与问答信息一并进行向量化,得到向量序列,获取用户提问提炼出向量化表示的待检索数据,基于待检索数据采用检索增强生成方法,对与用户提问相关的向量序列进行处理,生成目标回答信息,从而实现对有生活自理能力的老年人的陪伴,且能够根据用户的注册信息进行个性化且安全的陪伴,以满足不同用户的需求,填补了现有养老服务的缺口。
介绍完本发明的整体构思后,为了使本发明的目的、技术方案及优点更加清楚明白,下面通过具体实施方式结合附图对本发明做进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
在一个实施例中,如图1-2所示,提供了一种基于生成式AI的用户陪伴方法,包括以下步骤:
步骤S101,获取注册信息进行注册,并设定人机交互方式。
具体地,获取用户的年龄、性别、需求侧重类型(例如日常陪伴、疾病预测、资讯处理等)、性格类型等注册信息,进行用户注册,且能够根据用户的注册信息进行个性化陪伴设置,以便于满足不同用户的需求,并设定人机交互方式,人机交互方式可以是智能手机软件、或者能够便于互动的触摸平板设备,或语音激活的交互式人工智能机器人等,通过设定的人机交互方式实现人机交互。
其中,注册信息包括用户性格调查分析报告,以便于根据用户性格对陪伴方式进行对应调整,以基于用户需求实现个性化、精准的用户陪伴。
步骤S102,构建基于人机交互的后台问答模型,用于进行主动关怀、私人助理和疾病预测。
具体地,基于人机交互的模式,构建后台问答模型,从而能够实现软件***发起的主动关怀功能、用户发起的私人助理功能以及疾病预测功能。
其中,步骤S102包括:构建得到基于人机交互的后台问答模型;基于用户性格调查分析报告确定用户的性格类型,通过后台问答模型发起主动关怀话题,并利用大语言模型进行语音和文字的转换,主动关怀话题包括天气状况、嘘寒问暖、用药提醒、娱乐点播和紧急呼救;接入大语言模型AI的应用程序接口,利用大语言模型进行用户私人助理方面的沟通,包括疾病预防、订票缴费和旅游咨询,并将问答的对话内容以文本的形式存储到数据池中;接入疾病AI接口,根据实时声音进行疾病探测,得到探测信息,并记录在数据池中,用于进行当日汇报和领域分析。
具体地,为了更好地实现陪伴任务,通过构建基于人机交互的后台问答模型,发起主动关怀,结合用户性格确定对应的关怀话题,关怀话题可以是天气状况、嘘寒问暖、用药提醒、娱乐点播和紧急呼救等,并利用大语言模型的语言中立特性,进行语音和文字的实时转换,扩大可收集信息的来源和可服务的人群。在用户主动发起问答时,能够实现私人助理功能,采用接入公共大语言模型的应用程序接口,例如百度的文心一言、OpenAI的GPT系列,谷歌的PaLM系列、脸书的Llama系列、Antropic的Claude等,采用已经训练完成的大语言模型,进行用户需要的沟通,例如疾病预防、订票缴费和旅游资讯等,并将问答过程中的内容以文本的形式存储到数据池中。此外,还可以通过接入公共AI接口,例如klick Labs接口,从而实时根据在一段时间内的声音探测可能存在的疾病,例如糖尿病、老年痴呆等,并将记录得到的探测结果存储至数据池中,作为当日汇报和领域分析的参考。
步骤S103,构建用于存储问答信息的数据池,问答信息用于生成报告和模型训练。
具体地,构建数据池,用于存放用户发起的问答信息,存储后的问答信息可以用于后续报告的生成和自主AI模型的训练,原始数据仅对数据所有人和监护人进行开放,以确保数据的安全性。
步骤S104,根据存储的问答信息,采用大语言模型进行分析,确定问答信息的话题领域。
具体地,在离线时,根据数据池中存储的问答信息,采用大语言模型进行分析,可以通过大语言模型的摘要功能实现对问答信息话题领域的确定。
其中,步骤S104包括:采用大语言模型,从存储的问答信息中提取当日问答信息中的话题关键词,并基于话题关键词确定话题领域;基于话题关键词和话题领域对用户的情感倾向进行分析,得到分析结果;基于对话内容的分析结果,生成当日的汇报文件,汇报文件包括话题、情感倾向以及行动建议;对每日问答信息的话题进行综合分析和归类,提炼出话题的简要描述和标签。
具体地,如图3所示,采用大语言模型分析数据池中的问答信息,通过大语言模型的摘要总结功能提取得到特定用户的当日话题关键词,以帮助监护人了解用户关注的内容;基于话题关键词和话题领域对用户在对话中表达的情感倾向进行分析,得到分析结果,情感倾向包括正面情绪、中性情绪和负面情绪,以便于了解用户的情绪状态,并及时采取相应的行动;基于对话内容的分析结果,生成一个当日的汇报文件,汇报文件可以包括用户讨论的话题、情感倾向以及相应的行动建议,例如就医、体检、生日节日等,以便于更好的了解用户的情况并采取适当的行动;此外,还可以对每日问答信息的话题进行综合分析和归类,提炼得到话题的简要描述和标签,以供下一步自主AI模型的提炼,进一步了解用户群体的兴趣和关注点,从而提高用户陪伴的个性化和精准性。
步骤S105,根据话题领域提取对应的专业领域知识,并与问答信息一并进行向量化,得到向量序列。
具体地,通过AI在线分析,根据话题领域提取对应的专业领域知识,并与问答信息一并进行向量化,得到对应的向量序列,便于后续进行数据分析和检索。
其中,步骤S105包括:基于话题领域查找对应的专业领域数据库,在专利领域数据库中提取得到对应的专利领域知识;将问答信息和专业领域知识进行切分,划分得到块或句子;对每个块或句子进行分词,进一步划分为单个词或标记;对每个词或标记进行嵌入词向量化,得到对应的向量表示;将所有向量化后的词或标记进行组合,得到向量序列并存储至向量数据库中。
具体地,如图4所示,基于得到的话题领域查找对应的专业领域数据库,并基于话题关键词在专业领域数据库中提取对应的专业领域知识;将问答信息和专业领域知识进行数据切分,将每个对话划分为不同的块或句子,并对每个块或句子进行分词,将其划分为单个词或标记;对每个词或标记进行嵌入向量化,将其转换为向量表示,该过程可以采用向量化模型,例如Word2Vec或GloVe等,将每个词映射到一个高维向量空间中;将向量化后的词或标记组合成一个向量序列,用于表示整个对话内容;将向量序列存储到向量数据库中,以便于进行分析、归类和检索,向量数据库可以采用Pinecone、Faiss或ChromaDB等。通过上述步骤,能够将用户主动发起的问答信息进行分块和向量化,并存储到向量数据库中,以供后续的分析和处理,便于实现对话内容的分析、归类和检索,以及提炼行业专业领域知识的目标。
步骤S106,获取用户提问,提炼向量化表示的提问内容得到待检索数据,基于待检索数据采用检索增强生成方法,对与用户提问相关的向量序列进行处理,生成目标回答信息。
具体地,采用RAG(Retrieval Augmented Generation,检索增强生成)方法,对向量数据库中的数据进行处理,以允许创建代理来构建复杂的对话型人工智能***,从而能够根据用户提问生成对应的目标回答信息。
其中,步骤S106包括:获取用户提问,将用户提问转换为向量化表示的提问内容,提炼得到待检索数据;采用检索增强生成方法,对向量序列进行索引化处理,索引化处理包括数据加载、数据清洗和元数据提取,其中,元数据包括文件名、时间、章节标题和图片描述的关键信息;采用文本编码技术将索引化后的数据转化为向量表示;基于索引算法,根据编码后的数据构建索引;基于待检索数据,采用检索算法根据索引进行检索操作,得到查询信息对应的文档段落,生成检索结果;采用排序算法对检索结果进行排序;根据排序后的检索结果结合用户提问,采用大语言模型生成对应的目标回答信息。
具体地,如图5所示,获取用户提问,将用户提问转化为向量化表示的提问内容,并根据向量化表示的提问内容提炼得到待检索数据;采用检索增强方法,对向量序列进行索引化处理,包括数据加载(从PDF、Word、Markdown等文件格式、数据库和API等获取数据)、数据清洗(去除无关内容、压缩和格式化等)和元数据提取(提取文件名、时间、章节标题、图片描述等关键信息)。
采用文本编码技术,例如词嵌入(Word Embedding)或与训练的大语言模型(例如BERT、GPT等),将索引化后的数据转化为向量表示,以便后续的检索和生成任务。
根据用户的查询,采用检索算法,例如BM25(okapi BM25)或向量相似度计算等,通过代理使用索引在向量数据库中进行检索操作,查找得到与待检索数据相关的文档或段落,生成与用户提问相关的检索结果。
采用排序算法或模型,例如BMRT、RankNet等,基于得到的检索结果,进行排序,以提供更准确和相关的检索结果。
根据排序后的检索结果,采用大语言模型或生成模型,基于各种生成技术,例如循环神经网络、Transformer等,生成对应的目标回答信息,以通过后台问答模型对用户提问进行回答,实现对老年人的陪伴和辅助。
在一个实施例中,例如,采用检索增强生成方法生成某城市55-65岁老人第三季度的旅行计划和目的地的图表,其实现步骤如下:
代理利用存储在向量数据库中的行业数据理解问题的上下文,了解用户想要生成旅行计划和目的地的图标,且是针对某个城市和特定年龄段的老人;
将问题分为多个步骤,并向大语言模型提问,先询问用户想要旅行的城市,然后询问用户的年龄段,最后询问用户想要旅行的具体时间;
将问题的回答进行整合,并向大语言模型提供更具体的问题,以获取关于旅行计划和目的地更详细的信息;
生成高质量的旅行计划和目的地图标,并呈现给用户。
上述步骤中,通过采用RAG技术,代理能够利用向量数据库中的数据增强问题的理解和回答过程,从而实现更复杂的对话性人工智能***功能,使得***能够更为高效地生成旅行计划和目的地图标,而无需用户进行多个步骤完成问答,且减少了人工生成图标的可能性。
在本实施例中,通过获取注册信息进行注册,并设定人机交互方式,构建基于人机交互的后台问答模型,用于实现主动关怀、私人助理和疾病预测的功能,构建用于存储问答信息的数据池,问答信息能够用于报告的生成和模型的训练;根据存储的问答信息,采用大语言模型进行分析,确定问答信息的话题领域,基于话题领域提取对应的专业领域知识,并与问答信息一并进行向量化,得到向量序列,获取用户提问并转化为向量化表示的提问内容,提炼出待检索数据,基于待检索数据采用检索增强生成方法,对与用户提问相关的向量序列进行处理,生成目标回答信息,从而能够实现基于生成式AI的用户陪伴,且能够根据用户的注册信息进行个性化且安全的陪伴,以满足不同用户的需求,填补了现有养老服务的缺口。
如图6所示,提供了一种基于生成式AI的用户陪伴***60,用于实现如上所述的一种基于生成式AI的用户陪伴方法,包括:人机交互模块61、后台问答模块62、数据池构建模块63、AI离线分析模块64、AI在线分析模块65和回答生成模块66,且人机交互模块61、后台问答模块62、数据池构建模块63、AI离线分析模块64、AI在线分析模块65和回答生成模块66之间通信连接;其中:
人机交互模块61用于获取注册信息进行注册,并根据设定的人机交互方式进行人机交互;
后台问答模块62用于构建基于人机交互的后台问答模型,用于进行主动关怀、私人助理和疾病预测;
数据池构建模块63用于构建存储问答信息的数据池,问答信息用于生成报告和模型训练;
AI离线分析模块64用于根据存储的问答信息,采用大语言模型进行分析,确定问答信息的话题领域;
AI在线分析模块65用于根据话题领域提取对应的专业领域知识,并与问答信息一并进行向量化,得到向量序列;
回答生成模块66用于获取用户提问,提炼向量化表示的提问内容得到待检索数据,基于待检索数据采用检索增强生成方法,对与用户提问相关的向量序列进行处理,生成目标回答信息。
在一个实施例中,后台问答模块62具体用于:构建得到基于人机交互的后台问答模型;基于用户性格调查分析报告确定用户的性格类型,通过后台问答模型发起主动关怀话题,并利用大语言模型完成语音和文字的实施转换,主动关怀话题包括天气状况、嘘寒问暖、用药提醒、娱乐点播和紧急呼救;接入大语言模型AI的应用程序接口,利用大语言模型进行用户私人助理方面的沟通,包括疾病预防、订票缴费和旅游咨询,并将问答的对话内容以文本的形式存储到数据池中;接入疾病AI接口,根据实时声音进行疾病探测,得到探测信息,并记录在数据池中,用于进行当日汇报和领域分析。
在一个实施例中,AI离线分析模块64具体用于:采用大语言模型,从存储的问答信息中提取当日问答信息中的话题关键词,并基于话题关键词确定话题领域;基于话题关键词和话题领域对用户的情感倾向进行分析,得到分析结果;基于对话内容的分析结果,生成当日的汇报文件,汇报文件包括话题、情感倾向以及行动建议;对每日问答信息的话题进行综合分析和归类,提炼出话题的简要描述和标签。
在一个实施例中,AI在线分析模块65具体用于:基于话题领域查找对应的专业领域数据库,在专利领域数据库中提取得到对应的专利领域知识;将问答信息和专业领域知识进行切分,划分得到块或句子;对每个块或句子进行分词,进一步划分为单个词或标记;对每个词或标记进行嵌入词向量化,得到对应的向量表示;将所有向量化后的词或标记进行组合,得到向量序列并存储至向量数据库中。
在一个实施例中,回答生成模块66具体用于:获取用户提问,将用户提问转换为向量化表示的提问内容,提炼得到待检索数据;采用检索增强生成方法,对向量序列进行索引化处理,索引化处理包括数据加载、数据清洗和元数据提取,其中,元数据包括文件名、时间、章节标题和图片描述的关键信息;采用文本编码技术将索引化后的数据转化为向量表示;基于索引算法,根据编码后的数据构建索引;基于待检索数据,采用检索算法根据索引进行检索操作,得到查询信息对应的文档段落,生成检索结果;采用排序算法对检索结果进行排序;根据排序后的检索结果结合用户提问,采用大语言模型生成对应的目标回答信息。
在一个实施例中,提供了一种电子设备,该设备可以是服务器,其内部结构图可以如图7所示。该设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该设备的处理器用于提供计算和控制能力。该设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该设备的数据库用于存储配置模板,还可用于存储目标网页数据。该设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现基于生成式AI的用户陪伴方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的设备的限定,具体的设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还可以提供一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被计算机执行时使所述计算机执行如前述实施例所述的方法,所述计算机可以为上述提到的基于生成式AI的用户陪伴***的一部分。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件(例如,中央处理器CPU与图形处理器GPU协同工作)来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(Random Access Memory,RAM)或云端存储等。
显然,本领域的技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在计算机存储介质(ROM/RAM、磁碟、光盘)中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。所以,本发明不限制于任何特定的硬件和软件结合。
以上内容是结合具体的实施方式对本发明所做的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (9)

1.一种基于生成式AI的用户陪伴方法,其特征在于,包括以下步骤:
获取注册信息进行注册,并设定人机交互方式;
构建基于人机交互的后台问答模型,用于进行主动关怀、私人助理和疾病预测;
构建用于存储问答信息的数据池,所述问答信息用于生成报告和模型训练;
根据存储的问答信息,采用大语言模型进行分析,确定问答信息的话题领域;
根据所述话题领域提取对应的专业领域知识,并与所述问答信息一并进行向量化,得到向量序列;
获取用户提问,提炼向量化表示的提问内容得到待检索数据,基于所述待检索数据采用检索增强生成方法,对与所述用户提问相关的所述向量序列进行处理,生成目标回答信息。
2.根据权利要求1所述的基于生成式AI的用户陪伴方法,其特征在于,所述注册信息包括用户性格调查分析报告。
3.根据权利要求2所述的基于生成式AI的用户陪伴方法,其特征在于,所述构建基于人机交互的后台问答模型,用于进行主动关怀、私人助理和疾病预测,包括:
构建得到基于人机交互的后台问答模型;
基于所述用户性格调查分析报告确定用户的性格类型,通过后台问答模型发起主动关怀话题,并利用大语言模型完成语音和文字的实时转换,所述主动关怀话题包括天气状况、嘘寒问暖、用药提醒、娱乐点播和紧急呼救;
接入大语言模型AI的应用程序接口,利用大语言模型进行用户私人助理方面的沟通,包括疾病预防、订票缴费和旅游咨询,并将问答的对话内容以文本的形式存储到所述数据池中;
接入疾病AI接口,根据实时声音进行疾病探测,得到探测信息,并记录在所述数据池中,用于进行当日汇报和领域分析。
4.根据权利要求1所述的基于生成式AI的用户陪伴方法,其特征在于,所述根据存储的问答信息,采用大语言模型进行分析,确定问答信息的话题领域,包括:
采用大语言模型,从存储的问答信息中提取当日问答信息中的话题关键词,并基于所述话题关键词确定话题领域;
基于所述话题关键词和话题领域对用户的情感倾向进行分析,得到分析结果;
基于对话内容的分析结果,生成当日的汇报文件,所述汇报文件包括话题、情感倾向以及行动建议;
对每日问答信息的话题进行综合分析和归类,提炼出话题的简要描述和标签。
5.根据权利要求1所述的基于生成式AI的用户陪伴方法,其特征在于,所述根据所述话题领域提取对应的专业领域知识,并与所述问答信息一并进行向量化,得到向量序列,包括:
基于所述话题领域查找对应的专业领域数据库,在所述专业领域数据库中提取得到对应的专业领域知识;
将所述问答信息和专业领域知识进行切分,划分得到块或句子;
对每个块或句子进行分词,进一步划分为单个词或标记;
对每个词或标记进行嵌入词向量化,得到对应的向量表示;
将所有向量化后的词或标记进行组合,得到向量序列并存储至向量数据库中。
6.根据权利要求1所述的基于生成式AI的用户陪伴方法,其特征在于,所述获取用户提问,提炼向量化表示的提问内容得到待检索数据,基于所述待检索数据采用检索增强生成方法,对与所述用户提问相关的所述向量序列进行处理,生成目标回答信息,包括:
获取用户提问,将用户提问转换为向量化表示的提问内容,提炼得到待检索数据;
采用检索增强生成方法,对所述向量序列进行索引化处理,所述索引化处理包括数据加载、数据清洗和元数据提取,其中,所述元数据包括文件名、时间、章节标题和图片描述的关键信息;
采用文本编码技术将索引化后的数据转化为向量表示;
基于索引算法,根据编码后的数据构建索引;基于所述待检索数据,采用检索算法根据所述索引进行检索操作,得到所述查询信息对应的文档或段落,生成检索结果;
采用排序算法对所述检索结果进行排序;
根据排序后的检索结果结合所述用户提问,采用大语言模型生成对应的目标回答信息。
7.一种基于生成式AI的用户陪伴***,其特征在于,用于实现如权利要求1-6中任一项所述的一种基于生成式AI的用户陪伴方法,包括:
人机交互模块、后台问答模块、数据池构建模块、AI离线分析模块、AI在线分析模块和回答生成模块,且所述人机交互模块、后台问答模块、数据池构建模块、AI离线分析模块、AI在线分析模块和回答生成模块之间通信连接;
所述人机交互模块用于获取注册信息进行注册,并根据设定的人机交互方式进行人机交互;
所述后台问答模块用于构建基于人机交互的后台问答模型,用于进行主动关怀、私人助理和疾病预测;
所述数据池构建模块用于构建存储问答信息的数据池,所述问答信息用于生成报告和模型训练;
所述AI离线分析模块用于根据存储的问答信息,采用大语言模型进行分析,确定问答信息的话题领域;
所述AI在线分析模块用于根据所述话题领域提取对应的专业领域知识,并与所述问答信息一并进行向量化,得到向量序列;
所述回答生成模块用于获取用户提问,提炼向量化表示的提问内容得到待检索数据,基于所述待检索数据采用检索增强生成方法,对与所述用户提问相关的所述向量序列进行处理,生成目标回答信息。
8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202410173537.1A 2024-02-07 2024-02-07 基于生成式ai的用户陪伴方法、***、设备及存储介质 Pending CN117992594A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410173537.1A CN117992594A (zh) 2024-02-07 2024-02-07 基于生成式ai的用户陪伴方法、***、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410173537.1A CN117992594A (zh) 2024-02-07 2024-02-07 基于生成式ai的用户陪伴方法、***、设备及存储介质

Publications (1)

Publication Number Publication Date
CN117992594A true CN117992594A (zh) 2024-05-07

Family

ID=90899081

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410173537.1A Pending CN117992594A (zh) 2024-02-07 2024-02-07 基于生成式ai的用户陪伴方法、***、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117992594A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118152430A (zh) * 2024-05-13 2024-06-07 厦门农芯数字科技有限公司 一种基于大语言模型的养殖场数据指标分析方法、装置以及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118152430A (zh) * 2024-05-13 2024-06-07 厦门农芯数字科技有限公司 一种基于大语言模型的养殖场数据指标分析方法、装置以及设备
CN118152430B (zh) * 2024-05-13 2024-07-23 厦门农芯数字科技有限公司 一种基于大语言模型的养殖场数据指标分析方法、装置以及设备

Similar Documents

Publication Publication Date Title
Luo et al. A critical review of state‐of‐the‐art chatbot designs and applications
Athota et al. Chatbot for healthcare system using artificial intelligence
Guo Deep learning approach to text analysis for human emotion detection from big data
CN112131350B (zh) 文本标签确定方法、装置、终端及可读存储介质
CN111708873A (zh) 智能问答方法、装置、计算机设备和存储介质
CN112131393A (zh) 一种基于bert和相似度算法的医疗知识图谱问答***构建方法
US20200183928A1 (en) System and Method for Rule-Based Conversational User Interface
US20220405484A1 (en) Methods for Reinforcement Document Transformer for Multimodal Conversations and Devices Thereof
US20180075354A1 (en) Method and system for using existing models in connection with new model development
CN117992594A (zh) 基于生成式ai的用户陪伴方法、***、设备及存储介质
CN116796857A (zh) 一种llm模型训练方法、装置、设备及其存储介质
CN113705191A (zh) 样本语句的生成方法、装置、设备及存储介质
Giachos et al. Inquiring natural language processing capabilities on robotic systems through virtual assistants: A systemic approach
CN116662522B (zh) 问题答案推荐方法、存储介质和电子设备
CN117275466A (zh) 一种业务意图识别方法、装置、设备及其存储介质
CN115714002B (zh) 抑郁风险检测模型训练方法、抑郁症状预警方法及相关设备
Muangnak et al. The neural network conversation model enables the commonly asked student query agents
Karpagam et al. Deep learning approaches for answer selection in question answering system for conversation agents
Schuller et al. New avenues in audio intelligence: Towards holistic real-life audio understanding
Foote et al. A computational analysis of social media scholarship
CN115292460A (zh) 一种话题推荐方法、装置、电子设备及存储介质
CN115270746A (zh) 问题样本生成方法和装置、电子设备及存储介质
CN116226320A (zh) 一种预测下文信息的方法、装置、电子设备及存储介质
Tao et al. Validation and optimization framework for indoor navigation systems using user comments in spatial-temporal context
Ahmed et al. Automatically temporal labeled data generation using positional lexicon expansion for focus time estimation of news articles

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination