CN117750050A - 基于大语言模型的信息处理方法、装置以及电子设备 - Google Patents

基于大语言模型的信息处理方法、装置以及电子设备 Download PDF

Info

Publication number
CN117750050A
CN117750050A CN202311763376.3A CN202311763376A CN117750050A CN 117750050 A CN117750050 A CN 117750050A CN 202311763376 A CN202311763376 A CN 202311763376A CN 117750050 A CN117750050 A CN 117750050A
Authority
CN
China
Prior art keywords
live broadcast
task
live
target
strategy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311763376.3A
Other languages
English (en)
Inventor
徐伟涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu com Times Technology Beijing Co Ltd
Original Assignee
Baidu com Times Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu com Times Technology Beijing Co Ltd filed Critical Baidu com Times Technology Beijing Co Ltd
Priority to CN202311763376.3A priority Critical patent/CN117750050A/zh
Publication of CN117750050A publication Critical patent/CN117750050A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供了基于大语言模型的信息处理方法、装置以及电子设备,涉及人工智能技术领域,尤其涉及深度学习、大模型等技术领域,可应用于人工智能的内容生成、人机交互、直播过程交互等场景。具体实现方案为:响应于获取到直播需求描述信息,利用大语言模型处理直播需求描述信息,得到直播任务策略;响应于与直播任务策略相关的直播过程启动,根据与直播过程相对应的直播相关数据更新直播任务策略,得到适用于控制直播过程的目标直播任务策略;以及展示目标直播任务策略。

Description

基于大语言模型的信息处理方法、装置以及电子设备
技术领域
本公开涉及人工智能技术领域,尤其涉及深度学习、大模型等技术领域,可应用于人工智能的内容生成、人机交互、直播过程交互等场景。
背景技术
随着互联网技术的快速发展,越来越多的互联网络服务平台推出直播功能服务,用户可以通过智能手机等终端设备来开启直播,进而可以便捷地开启知识分享、产品介绍等实时内容分发功能,以提升内容分发的效率,并提升被分发的内容的展示效果。
发明内容
本公开提供了一种基于大语言模型的信息处理方法、装置、电子设备以及存储介质。
根据本公开的一方面,提供了一种基于大语言模型的信息处理方法,包括:响应于获取到直播需求描述信息,利用大语言模型处理直播需求描述信息,得到直播任务策略;响应于与直播任务策略相关的直播过程启动,根据与直播过程相对应的直播相关数据更新直播任务策略,得到适用于控制直播过程的目标直播任务策略;以及展示目标直播任务策略。
根据本公开的另一方面,提供了一种基于大语言模型的信息处理装置,包括:直播任务策略获得模块,用于响应于获取到直播需求描述信息,利用大语言模型处理直播需求描述信息,得到直播任务策略;更新模块,用于响应于与直播任务策略相关的直播过程启动,根据与直播过程相对应的直播相关数据更新直播任务策略,得到适用于控制直播过程的目标直播任务策略;以及第一展示模块,用于展示目标直播任务策略。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行根据本公开实施例提供的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据本公开实施例提供的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本公开实施例提供的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1示意性示出了根据本公开实施例的可以应用基于大语言模型的信息处理方法及装置的示例性***架构;
图2示意性示出了根据本公开实施例的基于大语言模型的信息处理方法的流程图;
图3示意性示出了根据本公开实施例的基于大语言模型的信息处理方法的应用场景图;
图4A示意性示出了根据本公开实施例的根据待更新位置和目标直播任务更新直播任务策略的原理图;
图4B示意性示出了根据本公开另一实施例的根据待更新位置和目标直播任务更新直播任务策略的原理图;
图4C示意性示出了根据本公开又一实施例的根据待更新位置和目标直播任务更新直播任务策略的原理图;
图5示意性示出了根据本公开另一实施例的基于大语言模型的信息处理方法的应用场景图;
图6示意性示出了根据本公开实施例的基于大语言模型的信息处理装置的框图;以及
图7示出了可以用来实施本公开的实施例的适于实现基于大语言模型的信息处理方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
在本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
随着互联网产业的快速发展,越来越多的主播用户通过智能手机等终端设备来开启直播,以便于快捷地分享知识、介绍产品。观看直播的用户也可以通过终端设备进行提问交流、产品购买,从而可以通过直播过程快捷地了解需要的知识,或者便捷地完成产品购买过程,提升了用户的便捷性。
本公开的实施例提供了一种基于大语言模型的信息处理方法、装置、电子设备以及存储介质。该基于大语言模型的信息处理方法包括:响应于获取到直播需求描述信息,利用大语言模型处理直播需求描述信息,得到直播任务策略;响应于与直播任务策略相关的直播过程启动,根据与直播过程相对应的直播相关数据更新直播任务策略,得到适用于控制直播过程的目标直播任务策略;以及展示目标直播任务策略。
根据本公开的实施例,通过大语言模型处理来处理基于自然语言表征的直播需求描述信息,可以使大语言模型生成的直播任务策略与直播需求描述信息表征的需求意图相匹配,从而可以使目标对象通过开放式地自然语言表达直播需求的条件下,便捷地获取直播任务策略,减少目标对象在直播前的准备时长,减少生成直播任务策略的操作步骤。同时在直播过程启动后,根据直播相关数据来更新直播任务策略,可以使更新得到的目标直播任务策略能够更适配于当前的直播互动过程,使目标对象可以及时参考更新后的目标直播任务策略来及时调整直播方式,改进直播效果,避免目标对象通过手动操作或执行新的直播任务产生的操作时长,提升直播过程的时效性,提升直播的展示效果。
图1示意性示出了根据本公开实施例的可以应用基于大语言模型的信息处理方法及装置的示例性***架构。
需要注意的是,图1所示仅为可以应用本公开实施例的***架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、***、环境或场景。例如,在另一实施例中,可以应用基于大语言模型的信息处理方法及装置的示例性***架构可以包括终端设备,但终端设备可以无需与服务器进行交互,即可实现本公开实施例提供的基于大语言模型的信息处理方法及装置。
如图1所示,根据该实施例的***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备1 01、102、103上可以安装有各种通讯客户端应用,例如知识阅读类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的内容提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的基于大语言模型的信息处理方法一般可以由服务器105执行。相应地,本公开实施例所提供的基于大语言模型的信息处理装置一般可以设置于服务器105中。本公开实施例所提供的基于大语言模型的信息处理方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的基于大语言模型的信息处理装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2示意性示出了根据本公开实施例的基于大语言模型的信息处理方法的流程图。
如图2所示,该基于大语言模型的信息处理方法包括操作S210~S230。
在操作S210,响应于获取到直播需求描述信息,利用大语言模型处理直播需求描述信息,得到直播任务策略;
在操作S220,响应于与直播任务策略相关的直播过程启动,根据与直播过程相对应的直播相关数据更新直播任务策略,得到适用于控制直播过程的目标直播任务策略;以及
在操作S230,展示目标直播任务策略。
根据本公开的实施例,直播需求描述信息可以包括基于自然语言方式表达的信息,直播需求描述信息可以包含有文本、图像等任意数据类型的信息,例如直播需求描述信息可以包含产品示例图像,以及包含与产品示例图像相关的描述文本。本公开的实施例对直播需求描述信息的具体信息格式不做限定,只要能够包含表征自然语言文本的信息即可。
根据本公开的实施例,直播任务策略可以包括指示目标对象完成直播的直播任务计划,直播任务策略可以包括一个或多个直播任务,直播任务可以包括直播表达提示文本、直播任务组件类型描述等,直播任务策略还可以包括各个直播任务执行的时间属性,例如可以包括直播任务的开始时刻、直播任务持续时长等。目标对象可以根据直播任务策略来手动操作开启直播过程,或者还可以根据直播任务策略设置的直播开启时刻来自动化开启直播过程。
根据本公开的实施例,大语言模型(LLM:Large Language Model)可以包括预训练后的模型,大语言模型具有较强地语义学习能力的深度学习模型,其模型参数量规模可以较大,例如大语言模型可以包括亿级的模型参数。通过利用大语言模型处理直播需求描述信息,可以基于大语言模型较强的自然语言理解能力与任务预测能力,输出包含多样化的直播任务的直播任务策略,节省目标对象用于制定直播任务计划的操作时长与学习时长,提升目标对象开启直播过程的便捷性。
根据本公开的实施例,直播相关数据可以包括在直播过程中产生的交互数据,例如可以包括观看直播的用户的点赞数量、收藏数量、评论数量等统计数据,或者还可以包括直播评论内容等文本类数据,或者还可以包括直播过程中的产品购买数量等交易数据,本公开的实施例对直播相关数据的具体数据类型不做限定,本领域技术人员可以根据实际需求进行选择。
根据本公开的实施例,根据与直播过程相对应的直播相关数据更新直播任务策略,可以包括基于神经网络模型来处理直播相关输出,得到更新后的目标直播任务策略。但不仅限于此,还可以包括基于直播相关数据与预设的直播任务表进行匹配,将相匹配的直播任务***至当前的直播任务策略中。或者还可以根据相匹配的直播任务替换当前的直播任务策略中的至少一个直播策略任务。本公开的实施例对更新直播任务策略的具体方式不做限定,本领域技术人员可以根据实际需求进行选择。
根据本公开的实施例,目标直播任务策略可以包括对当前的直播任务策略进行更新后得到的,或者还可以将更新后得到的目标直播任务策略作为当前的直播任务策略,进而可以根据需求迭代地根据当前已经获得到的直播相关数据来更新当前的直播任务策略,生成新的目标直播任务策略。
根据本公开的实施例,展示目标直播任务策略,可以包括在与目标对象相关的交互界面来展示目标直播任务策略的全部。或者还可以包括在交互界面中展示部分目标直播任务策略,例如展示当前时刻需要提示目标对象执行的直播任务。本公开的实施例对展示目标直播策略的具体展示方式不做限定,只要能够展示至少部分目标直播策略即可。
根据本公开的实施例,还可以在直播过程启动前和/或直播过程中,展示当前的直播任务策略,以便于目标对象清晰地了解当前的直播任务,进而根据被展示的当前的直播策略来准确地、及时地执行直播任务,满足直播效果需求以及观看用户的相关需求。
根据本公开的实施例,直播需求描述信息是基于目标对象的输入操作生成的。
在本公开的一个实施例中,可以基于目标对象在交互界面中的信息输入框执行输入操作,进而根据输入的文本、图像等信息确定直播需求描述信息。
在本公开的另一个实施例中,可以基于目标对象的输入操作,通过图像采集装置或声音采集装置等信息采集装置采集到目标对象输入的图像信息或声音信息,并根据图像文本识别技术对采集到的图像信息进行文本识别,得到直播需求描述信息,或者还可以基于声音识别技术来处理采集到的声音信息,生成直播需求描述信息。
根据本公开的实施例,利用大语言模型处理直播需求描述信息,得到直播任务策略可以包括:利用大语言模型处理直播需求描述信息,以及与目标对象相关的直播偏好信息,得到直播任务策略。
根据本公开的实施例,直播偏好信息可以包括根据目标对象的操作生成的偏好信息,例如目标对象可以通过输入表征直播风格、直播目标等直播的偏好属性来生生直播偏好信息。或者还可以在获得目标对象授权的条件下,通过对获取到的目标对象的历史交互操作进行统计分析,确定与目标对象相关的直播偏好信息。
在本公开的一个实施例中,还可以通过深度学习模型来对直播需求信息进行需求意图分析,并根据得到的需求意图来确定直播偏好信息。
在本公开的一个实施例中,直播偏好信息可以包括直播语言风格偏好信息(直播语言风格偏好信息例如可以为“与古诗风格相匹配的产品介绍语句”),可以将直播需求描述信息和直播语言风格偏好信息输入预训练的大语言模型,输出与直播需求描述信息的需求意图相匹配,且与直播语言风格偏好信息相匹配的产品介绍语句,该产品介绍语句可以包含于直播任务策略的直播任务中,以便于目标对象能够根据展示的产品介绍语句来对产品信息进行介绍,提升直播的效果。
图3示意性示出了根据本公开实施例的基于大语言模型的信息处理方法的应用场景图。
如图3所示,目标对象301可以通过智能手机等终端设备在客户端中输入直播需求信息311,直播需求信息311可以包括直播的主题文本,主题文本例如可以为“服装产品售卖销售”。直播需求信息311可以发送至服务端的智能体模块320。智能体模块320可以包括预训练的大语言模型,利用大语言模型处理直播需求信息311,以及目标对象301预先设置的直播偏好信息,可以得到直播任务策略321。直播任务策略321可以从服务端发送至客户端,以便于目标对象301查看直播任务策略321。直播任务策略321可以包括多个直播任务,直播任务可以包括待展示的封面、标题、直播内容简介、直播主题介绍等等。直播任务可以通过在直播展示界面中进行展示,或者还可以在与目标对象301相关的客户端进行展示来执行直播任务。目标对象301可以直接根据直播任务策略321开启直播过程,或者还可以对直播任务策略321进行编辑调整后,根据调整后的直播任务策略开启直播过程。
如图3所示,目标对象301可以通过对客户端进行操作,开启与直播任务策略321相关的直播过程。客户端可以在直播过程中获取到观看用户评论、产品销售数据、当前点赞数量等A直播相关数据312,并通过周期性地发送,或者实时发送等发送方式向智能体模块320发送A直播相关数据312。智能体模块320可以利用大语言模型处理A直播相关数据31 2,得到更新后的第1个目标直播任务策略322。客户端可以通过展示第1个目标直播任务策略322,来提示目标对象301及时调整直播过程,目标对象301可以根据展示的第1个目标直播任务策略322执行后续的直播过程以提升直播效果。
如图3所示,可以将第1个目标直播任务策略作为当前的直播任务策略,客户端可以在直播过程中获取到预设时间段中产生的B直播相关数据313,并将B直播相关数据313发送至智能体模块320,智能体模块320可以利用大语言模型处理B直播相关数据313,得到更新后的第2个目标直播任务策略323。智能体模块320将第2个目标直播任务策略323发送至客户端,进而可以提示目标对象301可以根据获得到的第2个目标直播任务策略323执行后续的直播过程。在直播过程中,可以迭代地获取并向智能体模块320发送实时地直播相关数据,智能体模块320可以及时地利用大语言模型来处理实时地直播相关数据,并通过向客户端发送实时生成的新的目标直播任务策略来辅助目标对象301实时地调整直播过程,以迭代地提升直播过程的展示效果。
根据本公开的实施例,根据与直播过程相对应的直播相关数据更新直播任务策略可以包括:利用大语言模型处理直播相关数据,得到策略更新信息;根据策略更新信息更新直播任务策略。
根据本公开的实施例,策略更新信息可以指示针对当前的直播任务策略的更新方式,策略更新信息可以包括需要添加的新的目标直播任务,以及与该目标直播任务对应的执行时刻,通过将新的目标直播任务按照执行时刻添加至当前的直播任务策略中,可以得到目标直播任务策略。又或者,策略更新信息可以包括指示当前的直播任务策略中需要删除的直播任务,根据策略更新信息删除当前的直播任务策略中的直播任务,可以得到目标直播任务策略。
需要说明的是,本公开的实施例对策略更新信息的具体形式不做限定,只要能够指示针对当前的直播任务策略的更新方式即可。
根据本公开的实施例,策略更新信息包括目标直播任务,直播任务策略包括按照任务时间属性排列的多个直播任务,直播任务具有任务时间属性。
根据本公开的实施例,任务时间属性可以包括直播任务需要执行的执行时刻,例如直播任务可以包括添加福袋任务,任务时间属性可以包括添加福袋任务的添加时刻。但不仅限于此,任务时间属性还可以包括直播任务的执行时间段,例如,添加福袋任务的任务时间属性可以包括指示添加福袋的添加时刻,以及在直播过程中展示该福袋的时间段。任务时间属性可以用于精确地控制直播任务执行。
根据本公开的实施例,根据策略更新信息更新直播任务策略可以包括:根据目标直播任务的目标任务时间属性,在多个直播任务中确定待更新位置;以及根据待更新位置和目标直播任务更新直播任务策略。
根据本公开的实施例,可以通过目标任务时间属性表征目标直播任务与当前的直播任务策略中的直播任务之间的时序关系,进而可以根据目标任务时间属性表征的目标任务的执行时刻,从当前的直播任务策略中确定待更新位置,从而可以将目标直播任务***至当前的直播任务策略中,以实现***新的目标直播任务,或者对当前的直播任务策略中需要被替换的直播任务进行替换,得到目标直播任务策略。
在本公开的一个实施例中,直播任务策略可以基于直播任务链表征,直播任务链可以包括表征直播任务的直播任务节点,多个直播任务节点之间可以包括直播任务之间的边关系。该边关系可以表征不同的直播任务之间的间隔时长,还可以表征多个直播任务之间的执行逻辑关系。待更新位置可以包括边关系中的位置,从而可以将目标直播任务***至当前的直播任务策略的边关系中的位置,得到目标直播任务策略。
在本公开的一个实施例中,待更新位置或者还可以包括与当前的直播任务策略中需要被替换的直播任务节点对应的位置。这样可以在当前的直播任务策略中基于待更新位置,利用目标直播任务来替换需要被替换的直播任务,得到目标直播任务。
根据本公开的实施例,待更新位置包括待替换位置。待替换位置可以包括指示当前的直播任务当前的直播任务策略中,需要被替换的直播任务节点对应的位置。
根据本公开的实施例,根据待更新位置和目标直播任务更新直播任务策略包括:根据待替换位置从直播任务策略的多个直播任务中确定待替换直播任务;以及根据目标直播任务更新待替换直播任务。
图4A示意性示出了根据本公开实施例的根据待更新位置和目标直播任务更新直播任务策略的原理图。
如图4A所示,当前的直播任务策略410可以包括分别表征“直播开场白”、“商品A购买链接”、……、“商品C购买链接”等多个按照任务时间数据排列的直播任务。在直播过程中,可以将直播相关数据输入至大语言模型,输出策略更新信息。策略更新信息可以包括目标直播任务421“商品B购买链接”。可以通过向目标对象展示策略更新信息,并根据目标对象针对策略更新信息的确认操作对当前的直播任务策略410进行更新。
如图4A所示,例如可以根据目标直播任务421的目标任务时间属性,从当前的直播任务策略410中确定待替换位置为与直播任务411相对应的位置,直播任务411可以为待替换直播任务。根据目标直播任务421替换直播任务411,可以得到目标直播任务策略420。
图4B示意性示出了根据本公开另一实施例的根据待更新位置和目标直播任务更新直播任务策略的原理图。
如图4B所示,当前的直播任务策略410可以包括分别表征“直播开场白”、“商品A购买链接”、……、“商品C购买链接”等多个按照任务时间数据排列的直播任务。在直播过程中,可以将直播相关数据输入至大语言模型,输出策略更新信息。策略更新信息可以包括目标直播任务431“添加福袋贴纸”。可以通过向目标对象展示策略更新信息,并根据目标对象针对策略更新信息的确认操作,对当前的直播任务策略410进行更新。
如图4B所示,例如可以根据目标直播任务431的目标任务时间属性,从当前的直播任务策略410中确定待替换位置为直播任务411结束之后的位置。可以将目标直播任务431***至当前的直播任务策略410中,直播任务411结束之后的位置,得到目标直播任务策略430。
图4C示意性示出了根据本公开又一实施例的根据待更新位置和目标直播任务更新直播任务策略的原理图。
如图4C所示,当前的直播任务策略410可以包括分别表征“直播开场白”、“商品A购买链接”、……、“商品C购买链接”等多个按照任务时间数据排列的直播任务。在直播过程中,可以将直播相关数据输入至大语言模型,输出策略更新信息。策略更新信息可以表征针对当前的直播任务413执行删除操作。可以通过向目标对象展示策略更新信息,并根据目标对象针对策略更新信息的确认操作,删除当前的直播任务策略410中的直播任务413,以下架直播过程中对于商品C的购买链接,得到目标直播任务策略440。
需要说明的是,图4A至图4C中所示的直播任务中,与虚线框对应的直播任务可以为已经执行完成的直播任务,与实线框相对应的直播任务可以为尚未执行完成的直播任务。
应该理解的是,图4A至图4C为更新当前的直播任务策略的示例性方式,本公开的实施例提供的方法还可以基于图4A至图4C中的至少两类示例性的更新方式相结合来更新当前的直播任务策略。
根据本公开的实施例,通过一种或多种更新方式来对当前的直播任务策略进行更新,可以使当前的直播过程实时地与当前的直播相关数据相适配,从而可以吸引观看直播的用户关注直播过程,在节省目标对象的操作步骤的同时提升直播效果。
根据本公开的实施例,基于大语言模型的信息处理方法还可以包括:控制虚拟主播对象执行目标直播任务策略。
根据本公开的实施例,虚拟主播对象可以包括虚拟数字人、虚拟卡通模型等虚拟的人物对象,通过控制虚拟主播对象来执行目标直播任务策略,可以在直播画面中不展示目标对象的条件下,控制直播过程推进的同时实现根据目标直播任务策略来实时地调整直播过程,从而可以使同一个目标对象来控制多个虚拟主播对象来同时进行多个直播过程,提升直播效率。
根据本公开的实施例,基于大语言模型的信息处理方法还可以包括:根据获取到的视频剪辑需求信息,生成视频剪辑任务;根据与视频剪辑任务,对与直播过程相关的直播视频进行剪辑,得到目标视频片段。
根据本公开的实施例,视频剪辑需求信息可以基于自然语言表征,或者也可以基于结构化的需求标识来表征,本公开的实施例对视频剪辑需求信息的具体表征形式不做限定。
在本公开的一个实施例中,可以利用大语言模型来处理基于自然语言表征的视频剪辑需求信息,得到视频剪辑任务,视频剪辑任务可以指示针对直播视频进行分割、删除、拼接等任意类型的剪辑操作。通过大语言模型处理视频剪辑需求信息来得到视频剪辑任务,可以使目标对象通过开放式的自然语言表达来便捷地生成与视频剪辑需求意图相匹配的视频剪辑任务,实现对直播视频的快速自动化剪辑。
根据本公开的实施例,目标视频片段可以包括对直播视频中的精彩视频片段,或者目标视频片段还可以包括针对直播视频中与待推荐的产品相关的视频片段,本公开的实施例对目标视频片段的具体属性不做限定,只要与视频剪辑需求信息的需求意图相匹配即可。
根据本公开的实施例,通过根据视频剪辑需求信息来自动化生成视频剪辑任务,并进一步通过执行视频剪辑任务来得到目标视频片段,可以在直播过程结束后快速地完成营销视频产品制作,实现营销视频产品的快速制作与分发,提升直播视频传播效率。
根据本公开的实施例,基于大语言模型的信息处理方法还可以包括:利用大语言模型处理直播相关数据,得到直播分析文案;以及展示直播分析文案。
根据本公开的实施例,直播相关数据可以包括直播过程中任意时间段产生的。直播分析文案可以包括针对直播过程的任意阶段进行分析产生的分析结果。直播分析文案可以包括数据分析结果,数据分析结果可以包括数据表等任意格式的信息,也可以包括直播改进方案等文本信息。
在本公开的一个实施例中,可以在直播过程结束后,将直播过程中产生的评论信息、观看直播人数、产品购买信息等直播相关数据填充至预设的提示模板得到提示信息,并将提示信息输入大语言模型输出直播分析文案,以便于高效地对直播过程进行复盘分析,并及时向目标对象展现,以提升针对直播效果分析的效率与准确性。
图5示意性示出了根据本公开另一实施例的基于大语言模型的信息处理方法的应用场景图。
如图5所示,目标对象501可以通过智能手机等终端设备在客户端中输入直播需求信息511,直播需求信息511可以包括直播的主题文本,主题文本例如可以为“手机产品售卖销售”。直播需求信息511可以发送至服务端的智能体模块520。智能体模块520可以包括预训练的大语言模型,利用大语言模型处理直播需求信息511,以及目标对象501预先设置的直播偏好信息,可以得到直播任务策略521。直播任务策略521可以从服务端发送至客户端,以便于目标对象501查看直播任务策略521。
如图5所示,目标对象501可以通过对客户端进行操作,开启与直播任务策略521相关的直播过程。客户端可以在直播过程中获取到观看用户评论、产品销售数据、当前点赞数量等C直播相关数据512,并通过周期性地发送,或者实时发送等发送方式向智能体模块520发送C直播相关数据512。智能体模块520可以利用大语言模型处理C直播相关数据512,得到更新后的目标直播任务策略522。客户端可以通过展示目标直播任务策略522,来提示目标对象501及时调整直播过程,目标对象501可以根据展示的目标直播任务策略522来进行如商品链接上架、提供直播福袋等直播任务,从而可以调整后续的直播过程以及时提升直播效果。
如图5所示,智能体模块520还可以通过获取与直播过程相关的用户交互问题信息514,并利用大语言模型处理用户交互问题信息514,生成并发送自动回复信息523,以实现自动化回复观看直播用户的问题,节省目标对象501进行答复的答复时长,提升直播效率。
如图5所示,在直播过程结束后,智能体模块520还可以利用大语言模型来处理直播过程中产生的直播相关数据,进而生成直播分析文案524。客户端通过从服务端获取直播分析文案524,可以使目标对象较为便捷地对直播过程的效果进行查看,并及时根据直播分析文案524包含的改进建议进行直播的需求调整。
如图5所示,智能体模块520还可以利用大语言模型来处理预设的视频剪辑需求信息,进而生成视频剪辑任务,通过执行视频剪辑任务来对直播过程产生的直播视频进行自动化剪辑,得到目标视频片段525,以便于目标对象501可以快速地实现针对直播过程中的产品相关视频进行分发,提升针对产品的营销视频片段的剪辑效率与分发效率,节省直播后期的操作步骤。
图6示意性示出了根据本公开实施例的基于大语言模型的信息处理装置的框图。
如图6所示,基于大语言模型的信息处理装置600包括:直播任务策略获得模块610、更新模块620和第一展示模块630。
直播任务策略获得模块610,用于响应于获取到直播需求描述信息,利用大语言模型处理直播需求描述信息,得到直播任务策略。
更新模块620,用于响应于与直播任务策略相关的直播过程启动,根据与直播过程相对应的直播相关数据更新直播任务策略,得到适用于控制直播过程的目标直播任务策略。
第一展示模块630,用于展示目标直播任务策略。
根据本公开的实施例,更新模块包括:策略更新信息获得子模块和更新子模块。
策略更新信息获得子模块,用于利用大语言模型处理直播相关数据,得到策略更新信息。
更新子模块,用于根据策略更新信息更新直播任务策略。
根据本公开的实施例,策略更新信息包括目标直播任务,直播任务策略包括按照任务时间属性排列的多个直播任务,直播任务具有任务时间属性。
根据本公开的实施例,更新子模块包括:待更新位置确定单元和更新单元。
待更新位置确定单元,用于根据目标直播任务的目标任务时间属性,在多个直播任务中确定待更新位置。
更新单元,用于根据待更新位置和目标直播任务更新直播任务策略。
根据本公开的实施例,待更新位置包括待替换位置。
根据本公开的实施例,更新单元包括:待替换直播任务确定子单元和更新子单元。
待替换直播任务确定子单元,用于根据待替换位置从直播任务策略的多个直播任务中确定待替换直播任务。
更新子单元,用于根据目标直播任务更新待替换直播任务。
根据本公开的实施例,直播需求描述信息是基于目标对象的输入操作生成的。
根据本公开的实施例,直播任务策略获得模块包括直播任务策略获得子模块。
直播任务策略获得子模块,用于利用大语言模型处理直播需求描述信息,以及与目标对象相关的直播偏好信息,得到直播任务策略。
根据本公开的实施例,基于大语言模型的信息处理装置还包括:视频剪辑任务获得模块和剪辑模块。
视频剪辑任务获得模块,用于根据获取到的视频剪辑需求信息,生成视频剪辑任务。
剪辑模块,用于根据与视频剪辑任务,对与直播过程相关的直播视频进行剪辑,得到目标视频片段。
根据本公开的实施例,基于大语言模型的信息处理装置还包括:直播分析文案获得模块和第二展示模块。
直播分析文案获得模块,用于利用大语言模型处理直播相关数据,得到直播分析文案。
第二展示模块,用于展示直播分析文案。
根据本公开的实施例,基于大语言模型的信息处理装置还包括目标直播任务策略执行模块。
目标直播任务策略执行模块,用于控制虚拟主播对象执行目标直播任务策略。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
根据本公开的实施例,一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如上所述的方法。
根据本公开的实施例,一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行如上所述的方法。
根据本公开的实施例,一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如上所述的方法。
图7示出了可以用来实施本公开的实施例的适于实现基于大语言模型的信息处理方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图7所示,设备700包括计算单元701,其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序,来执行各种适当的动作和处理。在RAM 703中,还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
设备700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如基于大语言模型的信息处理方法。例如,在一些实施例中,基于大语言模型的信息处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时,可以执行上文描述的基于大语言模型的信息处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行基于大语言模型的信息处理方法。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以是分布式***的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (19)

1.一种基于大语言模型的信息处理方法,包括:
响应于获取到直播需求描述信息,利用大语言模型处理所述直播需求描述信息,得到直播任务策略;
响应于与所述直播任务策略相关的直播过程启动,根据与所述直播过程相对应的直播相关数据更新所述直播任务策略,得到适用于控制所述直播过程的目标直播任务策略;以及
展示所述目标直播任务策略。
2.根据权利要求1所述的方法,其中,所述根据与所述直播过程相对应的直播相关数据更新所述直播任务策略包括:
利用大语言模型处理所述直播相关数据,得到策略更新信息;
根据所述策略更新信息更新所述直播任务策略。
3.根据权利要求2所述的方法,其中,所述策略更新信息包括目标直播任务,所述直播任务策略包括按照任务时间属性排列的多个直播任务,所述直播任务具有所述任务时间属性;
其中,所述根据所述策略更新信息更新所述直播任务策略包括:
根据所述目标直播任务的目标任务时间属性,在多个所述直播任务中确定待更新位置;以及
根据所述待更新位置和所述目标直播任务更新所述直播任务策略。
4.根据权利要求3所述的方法,其中,所述待更新位置包括待替换位置,
其中,所述根据所述待更新位置和所述目标直播任务更新所述直播任务策略包括:
根据所述待替换位置从所述直播任务策略的多个直播任务中确定待替换直播任务;以及
根据所述目标直播任务更新所述待替换直播任务。
5.根据权利要求1至4中任一项所述的方法,其中,所述直播需求描述信息是基于目标对象的输入操作生成的;
其中,所述利用大语言模型处理所述直播需求描述信息,得到直播任务策略包括:
利用大语言模型处理所述直播需求描述信息,以及与所述目标对象相关的直播偏好信息,得到所述直播任务策略。
6.根据权利要求1至4中任一项所述的方法,还包括:
根据获取到的视频剪辑需求信息,生成视频剪辑任务;
根据与所述视频剪辑任务,对与所述直播过程相关的直播视频进行剪辑,得到目标视频片段。
7.根据权利要求1至4中任一项所述的方法,还包括:
利用大语言模型处理所述直播相关数据,得到直播分析文案;以及
展示所述直播分析文案。
8.根据权利要求1至4中任一项所述的方法,还包括:
控制虚拟主播对象执行所述目标直播任务策略。
9.一种基于大语言模型的信息处理装置,包括:
直播任务策略获得模块,用于响应于获取到直播需求描述信息,利用大语言模型处理所述直播需求描述信息,得到直播任务策略;
更新模块,用于响应于与所述直播任务策略相关的直播过程启动,根据与所述直播过程相对应的直播相关数据更新所述直播任务策略,得到适用于控制所述直播过程的目标直播任务策略;以及
第一展示模块,用于展示所述目标直播任务策略。
10.根据权利要求9所述的装置,其中,所述更新模块包括:
策略更新信息获得子模块,用于利用大语言模型处理所述直播相关数据,得到策略更新信息;
更新子模块,用于根据所述策略更新信息更新所述直播任务策略。
11.根据权利要求10所述的装置,其中,所述策略更新信息包括目标直播任务,所述直播任务策略包括按照任务时间属性排列的多个直播任务,所述直播任务具有所述任务时间属性;
其中,所述更新子模块包括:
待更新位置确定单元,用于根据所述目标直播任务的目标任务时间属性,在多个所述直播任务中确定待更新位置;以及
更新单元,用于根据所述待更新位置和所述目标直播任务更新所述直播任务策略。
12.根据权利要求11所述的装置,其中,所述待更新位置包括待替换位置,
其中,所述更新单元包括:
待替换直播任务确定子单元,用于根据所述待替换位置从所述直播任务策略的多个直播任务中确定待替换直播任务;以及
更新子单元,用于根据所述目标直播任务更新所述待替换直播任务。
13.根据权利要求9至12中任一项所述的装置,其中,所述直播需求描述信息是基于目标对象的输入操作生成的;
其中,所述直播任务策略获得模块包括:
直播任务策略获得子模块,用于利用大语言模型处理所述直播需求描述信息,以及与所述目标对象相关的直播偏好信息,得到所述直播任务策略。
14.根据权利要求9至12中任一项所述的装置,还包括:
视频剪辑任务获得模块,用于根据获取到的视频剪辑需求信息,生成视频剪辑任务;
剪辑模块,用于根据与所述视频剪辑任务,对与所述直播过程相关的直播视频进行剪辑,得到目标视频片段。
15.根据权利要求9至12中任一项所述的装置,还包括:
直播分析文案获得模块,用于利用大语言模型处理所述直播相关数据,得到直播分析文案;以及
第二展示模块,用于展示所述直播分析文案。
16.根据权利要求9至12中任一项所述的装置,还包括:
目标直播任务策略执行模块,用于控制虚拟主播对象执行所述目标直播任务策略。
17.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至8中任一项所述的方法。
18.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1至8中任一项所述的方法。
19.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1至8中任一项所述的方法。
CN202311763376.3A 2023-12-20 2023-12-20 基于大语言模型的信息处理方法、装置以及电子设备 Pending CN117750050A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311763376.3A CN117750050A (zh) 2023-12-20 2023-12-20 基于大语言模型的信息处理方法、装置以及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311763376.3A CN117750050A (zh) 2023-12-20 2023-12-20 基于大语言模型的信息处理方法、装置以及电子设备

Publications (1)

Publication Number Publication Date
CN117750050A true CN117750050A (zh) 2024-03-22

Family

ID=90257428

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311763376.3A Pending CN117750050A (zh) 2023-12-20 2023-12-20 基于大语言模型的信息处理方法、装置以及电子设备

Country Status (1)

Country Link
CN (1) CN117750050A (zh)

Similar Documents

Publication Publication Date Title
EP3244312B1 (en) A personal digital assistant
US11132114B2 (en) Method and apparatus for generating customized visualization component
US11244153B2 (en) Method and apparatus for processing information
US10951486B2 (en) Terminal device, UI expansion method, and UI expansion program
US20230107213A1 (en) Method of generating virtual character, electronic device, and storage medium
CN111240669A (zh) 界面生成方法、装置、电子设备及计算机存储介质
CN108509442B (zh) 搜索方法和装置、服务器以及计算机可读存储介质
CN113655895A (zh) 应用于输入法的信息推荐方法、装置及电子设备
CN117492743A (zh) 基于大语言模型的目标应用生成方法、装置及存储介质
CN116992000A (zh) 交互信息处理方法、装置、电子设备、计算机可读介质
CN113360590B (zh) 兴趣点信息的更新方法、装置、电子设备及存储介质
CN115860877A (zh) 一种产品营销方法、装置、设备及介质
CN117750050A (zh) 基于大语言模型的信息处理方法、装置以及电子设备
CN114118937A (zh) 基于任务的信息推荐方法、装置、电子设备及存储介质
CN112947918A (zh) 数据展示方法和装置
CN113342450A (zh) 页面处理的方法、装置、电子设备及计算机可读介质
CN113127058A (zh) 数据标注方法、相关装置及计算机程序产品
CN112487164A (zh) 一种人工智能交互方法
CN113190779B (zh) 网页评估方法和装置
CN112860962B (zh) 处理提问信息的方法、装置、电子设备和介质
CN113032620B (zh) 针对音频数据的数据处理方法、装置、电子设备和介质
EP4071690A2 (en) Method and apparatus for task information management, device and storage medium
CN113012679A (zh) 通过语音播报消息的方法、设备和介质
CN117313670A (zh) 文案生成方法、装置、电子设备以及存储介质
CN118170378A (zh) 页面生成方法、装置、电子设备、存储介质以及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination