CN115994536A - 一种文本信息处理方法、***、设备及计算机存储介质 - Google Patents
一种文本信息处理方法、***、设备及计算机存储介质 Download PDFInfo
- Publication number
- CN115994536A CN115994536A CN202310294417.2A CN202310294417A CN115994536A CN 115994536 A CN115994536 A CN 115994536A CN 202310294417 A CN202310294417 A CN 202310294417A CN 115994536 A CN115994536 A CN 115994536A
- Authority
- CN
- China
- Prior art keywords
- text information
- target
- content
- word
- content type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Machine Translation (AREA)
Abstract
本申请公开了一种文本信息处理方法、***、设备及计算机存储介质,涉及AIGC技术领域,获取待处理的目标文本信息;对目标文本信息进行分词处理,得到目标词语;基于目标词语解析目标文本信息所描述的内容类型;若内容类型为静态内容,则基于文本生成图像模型生成目标文本信息对应的目标图片;若内容类型为动态内容,则基于文本生成视频模型生成目标文本信息对应的目标视频。本申请在内容类型为静态内容时,基于AIGC生成目标文本信息对应的目标图片,可以在内容类型为动态内容时,基于AIGC生成目标文本信息对应的目标视频,实现了自动应用AIGC来将目标文本信息转换为对应的目标图片或目标视频,提高了AIGC的自主处理能力。
Description
技术领域
本申请涉及AI-Generated Content(AIGC,人工智能生成的内容)技术领域,更具体地说,涉及一种文本信息处理方法、***、设备及计算机存储介质。
背景技术
随着人工智能理论和技术的发展,利用AIGC能够在短时间内生成画作,比如为文本类的数字作品(新闻、诗词、小说、文案、论文、专利等)配上生动的图片、视频,可以让作品描述更加生动。
然而,现有的AIGC中,是由用户自己决定将一个文本转换成图片还是视频的,也即当用户决定将文本转换成图片时,应用AIGC中的文本生成图像模型来生成文本对应的图片,当用户决定将文本转换成视频时,应用AIGC中的文本生成视频模型来生成文本对应的视频,使得现有AIGC的应用离不开用户的操作,需要依赖用户,自主处理能力差。
综上所述,如何提高AIGC的自主处理能力是目前本领域技术人员亟待解决的问题。
发明内容
本申请的目的是提供一种文本信息处理方法,其能在一定程度上解决如何提高AIGC技术的自主处理能力的技术问题。本申请还提供了一种文本信息处理***、设备及计算机可读存储介质。
为了实现上述目的,本申请提供如下技术方案:
一种文本信息处理方法,包括:
获取待处理的目标文本信息;
对所述目标文本信息进行分词处理,得到目标词语;
基于所述目标词语解析所述目标文本信息所描述的内容类型;
若所述内容类型为静态内容,则基于文本生成图像模型生成所述目标文本信息对应的目标图片;
若所述内容类型为动态内容,则基于文本生成视频模型生成所述目标文本信息对应的目标视频。
在一些实施例中,所述基于所述目标词语解析所述目标文本信息所描述的内容类型,包括:
预测所述目标词语属于目标词典库中各个已知词语的概率值;
基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型;
其中,所述目标词性包括所述静态内容对应的所述已知词语或所述动态内容对应的所述已知词语。
在一些实施例中,所述基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型,包括:
将所述静态内容对应的所述已知词语的所述概率值相加,得到第一概率值;
将所述动态内容对应的所述已知词语的所述概率值相加,得到第二概率值;
若所述第一概率值大于所述第二概率值,则确定所述目标文本信息所描述的所述内容类型为所述静态内容;
若所述第一概率值小于所述第二概率值,则确定所述目标文本信息所描述的所述内容类型为所述动态内容。
在一些实施例中,所述基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型,包括:
对于各个所述目标词语,将值最大的所述概率值所对应的所述已知词语确定为所述目标词语的选定词语;
确定所述选定词语中属于所述静态内容对应的所述已知词语的第一数量值;
确定所述选定词语中属于所述动态内容对应的所述已知词语的第二数量值;
计算所述第一数量值与所述第二数量值间的差值;
若所述差值大于第一预设值,则确定所述目标文本信息所描述的所述内容类型为所述静态内容;
若所述差值小于所述第一预设值,则确定所述目标文本信息所描述的所述内容类型为所述动态内容。
在一些实施例中,所述基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型,包括:
对于各个所述目标词语,将值最大的所述概率值所对应的所述已知词语确定为所述目标词语的选定词语;
确定所述选定词语中属于所述动态内容对应的所述已知词语的第二数量值;
若所述第二数量值小于第二预设值,则确定所述目标文本信息所描述的所述内容类型为所述静态内容;
若所述第二数量值大于所述第二预设值,则确定所述目标文本信息所描述的所述内容类型为所述动态内容。
在一些实施例中,所述预测所述目标词语属于目标词典库中各个已知词语的概率值,基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型,包括:
将所述目标词语输入预先训练好的语言神经网络模型;
获取所述语言神经网络模型输出的所述内容类型;
其中,所述语言神经网络模型用于:预测所述目标词语属于目标词典库中各个所述已知词语的概率值,基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型。
在一些实施例中,所述语言神经网络模型的类型包括提示学习模型。
在一些实施例中,所述获取待处理的目标文本信息,包括:
获取待处理的初始文本信息;
对所述初始文本信息进行翻译,得到翻译文本信息;
基于所述翻译文本信息得到所述目标文本信息。
在一些实施例中,所述基于所述翻译文本信息得到所述目标文本信息,包括:
对所述翻译文本信息进行扩展,得到所述目标文本信息。
在一些实施例中,所述对所述翻译文本信息进行扩展,得到所述目标文本信息,包括:
提取所述翻译文本信息中的目标关键词;
在预设的内容扩展描述知识库中选取出与所述目标关键词相似的目标描述语;
基于所述目标描述语与所述翻译文本信息生成所述目标文本信息。
在一些实施例中,所述基于所述目标描述语与所述翻译文本信息生成所述目标文本信息,包括:
在预设的画质经验限定词中选取出与所述目标关键词对应的目标限定词;
基于所述目标描述语、所述目标限定词及所述翻译文本信息生成所述目标文本信息。
在一些实施例中,所述获取待处理的目标文本信息,包括:
获取待处理的初始文本信息;
对所述初始文本信息进行拆分,得到拆分文本信息;
基于所述拆分文本信息得到所述目标文本信息。
在一些实施例中,所述对所述初始文本信息进行拆分,得到拆分文本信息,包括:
基于自然语言处理算法对所述初始文本信息进行等长拆分,得到所述拆分文本信息。
在一些实施例中,所述基于所述拆分文本信息得到所述目标文本信息,包括:
对于每个所述拆分文本信息,生成所述拆分文本信息的总语义向量,生成所述拆分文本信息中各个文本段落的段落语义向量,计算各个所述段落语义向量与所述总语义向量的相似度值,将目标数量个值最大的所述相似度值对应的所述文本段落确定为目标文本段落;
基于所述目标文本段落生成所述目标文本信息。
在一些实施例中,所述计算各个所述段落语义向量与所述总语义向量的相似度值,包括:
基于余弦相似度法计算各个所述段落语义向量与所述总语义向量的所述相似度值。
在一些实施例中,所述基于所述目标文本段落生成所述目标文本信息,包括:
提取所述目标文本段落中的目标语句;
将所述目标语句作为所述目标文本信息。
在一些实施例中,所述生成所述拆分文本信息的总语义向量,生成所述拆分文本信息中各个文本段落的段落语义向量,包括:
通过Sentence-BERT模型生成所述拆分文本信息的所述总语义向量,生成所述拆分文本信息中各个所述文本段落的所述段落语义向量。
一种文本信息处理***,包括:
获取模块,用于获取待处理的目标文本信息;
处理模块,用于对所述目标文本信息进行分词处理,得到目标词语;
解析模块,用于基于所述目标词语解析所述目标文本信息所描述的内容类型;
生成模块,用于若所述内容类型为静态内容,则基于文本生成图像模型生成所述目标文本信息对应的目标图片;若所述内容类型为动态内容,则基于文本生成视频模型生成所述目标文本信息对应的目标视频。
一种文本信息处理设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上任一所述文本信息处理方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行是实现如上任一所述文本信息处理方法的步骤。
本申请提供的一种文本信息处理方法,获取待处理的目标文本信息;对目标文本信息进行分词处理,得到目标词语;基于目标词语解析目标文本信息所描述的内容类型;若内容类型为静态内容,则基于文本生成图像模型生成目标文本信息对应的目标图片;若内容类型为动态内容,则基于文本生成视频模型生成目标文本信息对应的目标视频。本申请中,可以根据目标文本信息分词得到的目标词语来解析目标文本信息所描述的内容类型,并且可以在内容类型为静态内容时,基于AIGC生成目标文本信息对应的目标图片,可以在内容类型为动态内容时,基于AIGC生成目标文本信息对应的目标视频,实现了自动应用AIGC来将目标文本信息转换为对应的目标图片或目标视频,提高了AIGC对文本信息的自主处理能力。本申请提供的一种文本信息处理***、设备及计算机可读存储介质也解决了相应技术问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种文本信息处理方法的流程图;
图2为本申请实施例提供的一种文本信息处理方法的另一流程图;
图3为本申请实施例提供的一种文本信息处理方法的另一流程图;
图4为本申请中对初始文本信息进行翻译、扩展的过程示意图;
图5为本申请实施例提供的一种文本信息处理方法的另一流程图;
图6为本申请实施例提供的一种文本信息处理***的结构示意图;
图7为本申请实施例提供的一种文本信息处理设备的结构示意图;
图8为本申请实施例提供的一种文本信息处理设备的另一结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参阅图1,图1为本申请实施例提供的一种文本信息处理方法的流程图。
本申请实施例提供的一种文本信息处理方法,可以包括以下步骤:
步骤S101:获取待处理的目标文本信息。
实际应用中,可以先获取待处理的目标文本信息,目标文本信息的内容及来源等可以根据实际需要确定,比如目标文本信息可以为来自用户客户端的场景描述信息、可以为来自报纸的实时热点新闻、可以为来自书籍的摘要等,本申请在此不做具体限定。
步骤S102:对目标文本信息进行分词处理,得到目标词语。
实际应用中,在获取待处理的目标文本信息之后,可以对目标文本信息进行分词处理,得到目标文本信息中的各个目标词语,具体应用场景中,可以通过自然语言处理技术来对目标文本信息进行分词处理来得到目标词语等,本申请在此不做具体限定。
步骤S103:基于目标词语解析目标文本信息所描述的内容类型。
实际应用中,在对目标文本信息进行分词处理,得到目标词语之后,便可以基于目标词语解析目标文本信息所描述的内容类型,也即基于目标词语分析目标文本信息所描述是静态内容还是动态内容,以便后续基于该内容类型对目标文本信息进行相应处理。
步骤S104:若内容类型为静态内容,则基于文本生成图像模型生成目标文本信息对应的目标图片。
实际应用中,在基于目标词语解析目标文本信息所描述的内容类型之后,且在内容类型为静态内容的情况下,可以基于AIGC中的文本生成图像模型生成目标文本信息对应的目标图片,具体的,可以应用AIGC中的稳定扩散模型或者DALL·E2模型或者Imagen模型等来生成目标文本信息对应的目标图片,本申请在此不做具体限定。
步骤S105:若内容类型为动态内容,则基于文本生成视频模型生成目标文本信息对应的目标视频。
实际应用中,在基于目标词语解析目标文本信息所描述的内容类型之后,且在内容类型为动态内容的情况下,可以基于AIGC中的文本生成视频模型生成目标文本信息对应的目标视频,具体的,可以应用AIGC中的CogVideo模型等来生成目标文本信息对应的目标视频,本申请在此不做具体限定。
需要说明的是,具体应用场景中,在基于AIGC生成目标文本信息对应的目标图片或目标视频之后,还可以对目标图片或目标图像进行风格迁移、图像增强、定制化等处理,以便目标图片或目标视频能够进一步满足用户的使用需求。
本申请提供的一种文本信息处理方法,获取待处理的目标文本信息;对目标文本信息进行分词处理,得到目标词语;基于目标词语解析目标文本信息所描述的内容类型;若内容类型为静态内容,则基于文本生成图像模型生成目标文本信息对应的目标图片;若内容类型为动态内容,则基于文本生成视频模型生成目标文本信息对应的目标视频。本申请中,可以根据目标文本信息分词得到的目标词语来解析目标文本信息所描述的内容类型,并且可以在内容类型为静态内容时,基于AIGC生成目标文本信息对应的目标图片,可以在内容类型为动态内容时,基于AIGC生成目标文本信息对应的目标视频,实现了自动应用AIGC来将目标文本信息转换为对应的目标图片或目标视频,提高了AIGC对文本信息的自主处理能力。
请参阅图2,图2为本申请实施例提供的一种文本信息处理方法的另一流程图。
本申请实施例提供的一种文本信息处理方法,可以包括以下步骤:
步骤S201:获取待处理的目标文本信息。
步骤S202:对目标文本信息进行分词处理,得到目标词语。
步骤S203:预测目标词语属于目标词典库中各个已知词语的概率值;
步骤S204:基于已知词语的目标词性及概率值确定目标文本信息所描述的内容类型;其中,目标词性包括静态内容对应的已知词语或动态内容对应的已知词语。
实际应用中,在基于目标词语解析目标文本信息所描述的内容类型的过程中,可以借助预设的用于确定文本信息所描述的内容类型的目标词典库来解析目标文本信息所描述的内容类型,具体的,可以预测目标词语属于目标词典库中各个已知词语的概率值;基于已知词语的目标词性及概率值确定目标文本信息所描述的内容类型;其中,目标词性包括静态内容对应的已知词语或动态内容对应的已知词语。
具体应用场景中,在基于已知词语的目标词性及概率值确定目标文本信息所描述的内容类型的过程中,可以基于计算得到的概率值从整体评估目标文本信息所描述的内容类型,也即可以将静态内容对应的已知词语的概率值相加,得到第一概率值;将动态内容对应的已知词语的概率值相加,得到第二概率值;若第一概率值大于第二概率值,则确定目标文本信息所描述的内容类型为静态内容;若第一概率值小于第二概率值,则确定目标文本信息所描述的内容类型为动态内容。
具体应用场景中,在基于已知词语的目标词性及概率值确定目标文本信息所描述的内容类型的过程中,可以仅根据目标词语在目标词典库中的对应词语来评估文本信息所描述的内容类型,也即对于各个目标词语,可以将值最大的概率值所对应的已知词语确定为目标词语的选定词语;确定选定词语中属于静态内容对应的已知词语的第一数量值;确定选定词语中属于动态内容对应的已知词语的第二数量值;计算第一数量值与第二数量值间的差值;若差值大于第一预设值,则确定目标文本信息所描述的内容类型为静态内容;若差值小于第一预设值,则确定目标文本信息所描述的内容类型为动态内容。需要说明的是,第一预设值的具体数值可以根据具体应用场景来确定,本申请在此不做具体限定。
具体应用场景中,在基于已知词语的目标词性及概率值确定目标文本信息所描述的内容类型的过程中,可以在目标文本信息中包含的描述动态内容的词语的数量达到设定值时,便认为目标文本信息所描述的是动态内容,也即对于各个目标词语,可以将值最大的概率值所对应的已知词语确定为目标词语的选定词语;确定选定词语中属于动态内容对应的已知词语的第二数量值;若第二数量值小于第二预设值,则确定目标文本信息所描述的内容类型为静态内容;若第二数量值大于第二预设值,则确定目标文本信息所描述的内容类型为动态内容。需要说明的是,第二预设值的具体数值可以根据具体应用场景来确定,本申请在此不做具体限定。
具体应用场景中,在预测目标词语属于目标词典库中各个已知词语的概率值,基于已知词语的目标词性及概率值确定目标文本信息所描述的内容类型的过程中,可以借助神经网络模型来快速对该内容类型进行预测,也即将目标词语输入预先训练好的语言神经网络模型;获取语言神经网络模型输出的内容类型;其中,语言神经网络模型用于:预测目标词语属于目标词典库中各个已知词语的概率值,基于已知词语的目标词性及概率值确定目标文本信息所描述的内容类型。需要说明的是,语言神经网络模型的类型可以根据具体应用场景来确定,比如语言神经网络模型可以包括提示学习模型,且该提示学习模型可以包括输入层、与输入层连接的多头自注意力层,与输入层及多头自注意力层连接的第一相加归一化层、与第一相加归一化层连接的前向网络、与前向网络及第一相加归一化层连接的第二相加归一化层、与第二相加归一化层连接的输出等,本申请在此不对提示学习模型的具体架构进行限定。
需要说明的是,目标词典库的内容可以根据实际需要确定,比如目标词典库中的静态内容对应的词语可以包括苹果、水果、高山、风景、动物、旅馆、酒店、兔子、小猫、火箭、小狗、房屋、建筑、水杯、星空、食物、月亮、太阳、山川等,目标词典库中的动态内容对应的词语可以包括编织、撰写、跑步、投资、跳远、事件、运动、攻击、飞起、摔倒、滑雪、投掷、拔剑、练习、发生、争夺、制裁、炸毁、阅读、浏览、比划、点击、奔腾、跳跃、修改、上升、下降、坐下等。
步骤S205:若内容类型为静态内容,则基于文本生成图像模型生成目标文本信息对应的目标图片。
步骤S206:若内容类型为动态内容,则基于文本生成视频模型生成目标文本信息对应的目标视频。
请参阅图3,图3为本申请实施例提供的一种文本信息处理方法的另一流程图。
本申请实施例提供的一种文本信息处理方法,可以包括以下步骤:
步骤S301:获取待处理的初始文本信息。
步骤S302:对初始文本信息进行翻译,得到翻译文本信息。
步骤S303:基于翻译文本信息得到目标文本信息。
实际应用中,由于语言的多样性,导致文本信息的语言版本较多,为了使得AIGC可以对不同语言的文本信息进行处理,在获取目标文本信息的过程中,可以获取待处理的初始文本信息;对初始文本信息进行翻译,得到翻译文本信息,比如得到中文的翻译文本信息等;基于翻译文本信息得到目标文本信息。需要说明的是,对初始文本信息进行翻译的方式可以根据实际需要确定,比如可以借助基于Transformer的神经机器翻译模型来对初始文本信息进行翻译得到翻译文本信息等。
具体应用场景中,考虑到待处理的初始文本信息的内容较为单一,比如初始文本信息的内容为“穿铠甲的马”,如果仅仅依据该内容生成图片或视频的话,内容单一,不能满足用户需求,为了解决此问题,本申请在基于翻译文本信息得到目标文本信息的过程中,可以对翻译文本信息进行扩展,得到目标文本信息,此过程可以如图4所示,具体的,可以提取翻译文本信息中的目标关键词;在预设的内容扩展描述知识库中选取出与目标关键词相似的目标描述语;基于目标描述语与翻译文本信息生成目标文本信息,且在基于目标描述语与翻译文本信息生成目标文本信息的过程中,可以在预设的画质经验限定词中选取出与目标关键词对应的目标限定词,目标限定词可以包括4k、8k、漫画风、现实主义、印象主义、梵高创作等;基于目标描述语、目标限定词及翻译文本信息生成目标文本信息。则经过本申请处理,内容为“穿铠甲的马”的初始文本信息可以被扩展成内容为“拟人化的雄伟马骑士,肖像,精致的盔甲,电影灯光,复杂的金属丝设计,4k,8k,虚幻引擎,辛烷值渲染”的目标文本信息等;再比如,初始文本信息的内容为“一朵闪着光的紫色莲花”,则经本申请方案处理后,目标文本信息的内容可以为“透高清CG,浅紫火紫大莲花,闪电,灯光效果,8K,超高清,暴雪风格的艺术趋势,夜光雾夜光,音量灯体积光--ar9:166”等,本申请在此不做具体限定。
步骤S304:对目标文本信息进行分词处理,得到目标词语。
步骤S305:基于目标词语解析目标文本信息所描述的内容类型。
步骤S306:若内容类型为静态内容,则基于文本生成图像模型生成目标文本信息对应的目标图片。
步骤S307:若内容类型为动态内容,则基于文本生成视频模型生成目标文本信息对应的目标视频。
请参阅图5,图5为本申请实施例提供的一种文本信息处理方法的另一流程图。
本申请实施例提供的一种文本信息处理方法,可以包括以下步骤:
步骤S401:获取待处理的初始文本信息。
步骤S402:对初始文本信息进行拆分,得到拆分文本信息。
步骤S403:基于拆分文本信息得到目标文本信息。
实际应用中,在获取待处理的目标文本信息的过程中,考虑到获取的初始文本信息的内容较多,而AIGC只能生成一个画面的图片或几个画面的视频,也即AIGC对大文本信息的处理能力较弱,为了解决此问题,可以在获取待处理的初始文本信息之后,自动对初始文本信息进行拆分,得到拆分文本信息;再基于拆分文本信息得到目标文本信息。
具体应用场景中,在对初始文本信息进行拆分,得到拆分文本信息的过程中,可以基于自然语言处理算法对初始文本信息进行等长拆分,得到拆分文本信息,当然,也可以有其他拆分方式,比如基于内容连续性进行拆分等,本申请在此不做具体限定。
具体应用场景中,在基于拆分文本信息得到目标文本信息的过程中,对于每个拆分文本信息,可以生成拆分文本信息的总语义向量,生成拆分文本信息中各个文本段落的段落语义向量,计算各个段落语义向量与总语义向量的相似度值,将目标数量个值最大的相似度值对应的文本段落确定为目标文本段落,以便将描述拆分文本信息的核心内容的文本段落筛选出来;基于所有的目标文本段落生成目标文本信息。
具体应用场景中,在计算各个段落语义向量与总语义向量的相似度值的过程中,可以基于余弦相似度法来快速计算各个段落语义向量与总语义向量的相似度值等,本申请在此不做具体限定。
具体应用场景中,在基于目标文本段落生成目标文本信息的过程中,可以提取目标文本段落中的核心语句作为目标语句,比如按照预设的规则对目标文段段落进行提取,得到该目标语句;将目标语句作为目标文本信息,以便借助该目标语句来简便、精准的描述初始文本信息的核心内容。
具体应用场景中,在生成拆分文本信息的总语义向量,生成拆分文本信息中各个文本段落的段落语义向量的过程中,可以通过Sentence-BERT模型来快速生成拆分文本信息的总语义向量,生成拆分文本信息中各个文本段落的段落语义向量等。
步骤S404:对目标文本信息进行分词处理,得到目标词语。
步骤S405:基于目标词语解析目标文本信息所描述的内容类型。
步骤S406:若内容类型为静态内容,则基于文本生成图像模型生成目标文本信息对应的目标图片。
步骤S407:若内容类型为动态内容,则基于文本生成视频模型生成目标文本信息对应的目标视频。
需要说明的是,具体应用场景中,在获取待处理的初始文本信息之后,可能需要对初始文本信息进行翻译、扩展、拆分才能得到目标文本信息,也即可以根据具体应用需求来对本申请实施例所描述的方法进行组合继而得到满足用户需求的文本信息处理方法,本申请在此不对其过程进行具体限定。
请参阅图6,图6为本申请实施例提供的一种文本信息处理***的结构示意图。
本申请实施例提供的一种文本信息处理***,可以包括:
获取模块101,用于获取待处理的目标文本信息;
处理模块102,用于对目标文本信息进行分词处理,得到目标词语;
解析模块103,用于基于目标词语解析目标文本信息所描述的内容类型;
生成模块104,用于若内容类型为静态内容,则基于文本生成图像模型生成目标文本信息对应的目标图片;若内容类型为动态内容,则基于文本生成视频模型生成目标文本信息对应的目标视频。
本申请实施例提供的一种文本信息处理***,解析模块可以包括:
预测单元,用于预测目标词语属于目标词典库中各个已知词语的概率值;
确定单元,用于基于已知词语的目标词性及概率值确定目标文本信息所描述的内容类型;
其中,目标词性包括静态内容对应的已知词语或动态内容对应的已知词语。
本申请实施例提供的一种文本信息处理***,确定单元可以具体用于:将静态内容对应的已知词语的概率值相加,得到第一概率值;将动态内容对应的已知词语的概率值相加,得到第二概率值;若第一概率值大于第二概率值,则确定目标文本信息所描述的内容类型为静态内容;若第一概率值小于第二概率值,则确定目标文本信息所描述的内容类型为动态内容。
本申请实施例提供的一种文本信息处理***,确定单元可以具体用于:对于各个目标词语,将值最大的概率值所对应的已知词语确定为目标词语的选定词语;确定选定词语中属于静态内容对应的已知词语的第一数量值;确定选定词语中属于动态内容对应的已知词语的第二数量值;计算第一数量值与第二数量值间的差值;若差值大于第一预设值,则确定目标文本信息所描述的内容类型为静态内容;若差值小于第一预设值,则确定目标文本信息所描述的内容类型为动态内容。
本申请实施例提供的一种文本信息处理***,确定单元可以具体用于:对于各个目标词语,将值最大的概率值所对应的已知词语确定为目标词语的选定词语;确定选定词语中属于动态内容对应的已知词语的第二数量值;若第二数量值小于第二预设值,则确定目标文本信息所描述的内容类型为静态内容;若第二数量值大于第二预设值,则确定目标文本信息所描述的内容类型为动态内容。
本申请实施例提供的一种文本信息处理***,解析模块可以具体用于:将目标词语输入预先训练好的语言神经网络模型;获取语言神经网络模型输出的内容类型;其中,语言神经网络模型用于:预测目标词语属于目标词典库中各个已知词语的概率值,基于已知词语的目标词性及概率值确定目标文本信息所描述的内容类型。
本申请实施例提供的一种文本信息处理***,语言神经网络模型的类型包括提示学习模型。
本申请实施例提供的一种文本信息处理***,获取模块可以包括:
第一获取单元,用于获取待处理的初始文本信息;
翻译单元,用于对初始文本信息进行翻译,得到翻译文本信息;
第一处理单元,用于基于翻译文本信息得到目标文本信息。
本申请实施例提供的一种文本信息处理***,第一处理单元可以具体用于:对翻译文本信息进行扩展,得到目标文本信息。
本申请实施例提供的一种文本信息处理***,第一处理单元可以具体用于:提取翻译文本信息中的目标关键词;在预设的内容扩展描述知识库中选取出与目标关键词相似的目标描述语;基于目标描述语与翻译文本信息生成目标文本信息。
本申请实施例提供的一种文本信息处理***,第一处理单元可以具体用于:在预设的画质经验限定词中选取出与目标关键词对应的目标限定词;基于目标描述语、目标限定词及翻译文本信息生成目标文本信息。
本申请实施例提供的一种文本信息处理***,获取模块可以包括:
第二获取单元,用于获取待处理的初始文本信息;
拆分单元,用于对初始文本信息进行拆分,得到拆分文本信息;
第二处理单元,用于基于拆分文本信息得到目标文本信息。
本申请实施例提供的一种文本信息处理***,拆分单元可以具体用于:基于自然语言处理算法对初始文本信息进行等长拆分,得到拆分文本信息。
本申请实施例提供的一种文本信息处理***,第二处理单元可以具体用于:对于每个拆分文本信息,生成拆分文本信息的总语义向量,生成拆分文本信息中各个文本段落的段落语义向量,计算各个段落语义向量与总语义向量的相似度值,将目标数量个值最大的相似度值对应的文本段落确定为目标文本段落;基于目标文本段落生成目标文本信息。
本申请实施例提供的一种文本信息处理***,第二处理单元可以具体用于:基于余弦相似度法计算各个段落语义向量与总语义向量的相似度值。
本申请实施例提供的一种文本信息处理***,第二处理单元可以具体用于:提取目标文本段落中的目标语句;将目标语句作为目标文本信息。
本申请实施例提供的一种文本信息处理***,第二处理单元可以具体用于:通过Sentence-BERT模型生成拆分文本信息的总语义向量,生成拆分文本信息中各个文本段落的段落语义向量。
本申请还提供了一种文本信息处理设备及计算机可读存储介质,其均具有本申请实施例提供的一种文本信息处理方法具有的对应效果。请参阅图7,图7为本申请实施例提供的一种文本信息处理设备的结构示意图。
本申请实施例提供的一种文本信息处理设备,包括存储器201和处理器202,存储器201中存储有计算机程序,处理器202执行计算机程序时实现如上任一实施例所描述文本信息处理方法的步骤。
请参阅图8,本申请实施例提供的另一种文本信息处理设备中还可以包括:与处理器202连接的输入端口203,用于传输外界输入的命令至处理器202;与处理器202连接的显示单元204,用于显示处理器202的处理结果至外界;与处理器202连接的通信模块205,用于实现文本信息处理设备与外界的通信。显示单元204可以为显示面板、激光扫描使显示器等;通信模块205所采用的通信方式包括但不局限于移动高清链接技术(HML)、通用串行总线(USB)、高清多媒体接口(HDMI)、无线连接:无线保真技术(WiFi)、蓝牙通信技术、低功耗蓝牙通信技术、基于IEEE802.11s的通信技术。
本申请实施例提供的一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,计算机程序被处理器执行时实现如上任一实施例所描述文本信息处理方法的步骤。
本申请所涉及的计算机可读存储介质包括随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质。
本申请实施例提供的文本信息处理***、设备及计算机可读存储介质中相关部分的说明请参见本申请实施例提供的文本信息处理方法中对应部分的详细说明,在此不再赘述。另外,本申请实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明,以免过多赘述。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (20)
1.一种文本信息处理方法,其特征在于,包括:
获取待处理的目标文本信息;
对所述目标文本信息进行分词处理,得到目标词语;
基于所述目标词语解析所述目标文本信息所描述的内容类型;
若所述内容类型为静态内容,则基于文本生成图像模型生成所述目标文本信息对应的目标图片;
若所述内容类型为动态内容,则基于文本生成视频模型生成所述目标文本信息对应的目标视频。
2.根据权利要求1所述的文本信息处理方法,其特征在于,所述基于所述目标词语解析所述目标文本信息所描述的内容类型,包括:
预测所述目标词语属于目标词典库中各个已知词语的概率值;
基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型;
其中,所述目标词性包括所述静态内容对应的所述已知词语或所述动态内容对应的所述已知词语。
3.根据权利要求2所述的文本信息处理方法,其特征在于,所述基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型,包括:
将所述静态内容对应的所述已知词语的所述概率值相加,得到第一概率值;
将所述动态内容对应的所述已知词语的所述概率值相加,得到第二概率值;
若所述第一概率值大于所述第二概率值,则确定所述目标文本信息所描述的所述内容类型为所述静态内容;
若所述第一概率值小于所述第二概率值,则确定所述目标文本信息所描述的所述内容类型为所述动态内容。
4.根据权利要求2所述的文本信息处理方法,其特征在于,所述基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型,包括:
对于各个所述目标词语,将值最大的所述概率值所对应的所述已知词语确定为所述目标词语的选定词语;
确定所述选定词语中属于所述静态内容对应的所述已知词语的第一数量值;
确定所述选定词语中属于所述动态内容对应的所述已知词语的第二数量值;
计算所述第一数量值与所述第二数量值间的差值;
若所述差值大于第一预设值,则确定所述目标文本信息所描述的所述内容类型为所述静态内容;
若所述差值小于所述第一预设值,则确定所述目标文本信息所描述的所述内容类型为所述动态内容。
5.根据权利要求2所述的文本信息处理方法,其特征在于,所述基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型,包括:
对于各个所述目标词语,将值最大的所述概率值所对应的所述已知词语确定为所述目标词语的选定词语;
确定所述选定词语中属于所述动态内容对应的所述已知词语的第二数量值;
若所述第二数量值小于第二预设值,则确定所述目标文本信息所描述的所述内容类型为所述静态内容;
若所述第二数量值大于所述第二预设值,则确定所述目标文本信息所描述的所述内容类型为所述动态内容。
6.根据权利要求2所述的文本信息处理方法,其特征在于,所述预测所述目标词语属于目标词典库中各个已知词语的概率值,基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型,包括:
将所述目标词语输入预先训练好的语言神经网络模型;
获取所述语言神经网络模型输出的所述内容类型;
其中,所述语言神经网络模型用于:预测所述目标词语属于目标词典库中各个所述已知词语的概率值,基于所述已知词语的目标词性及所述概率值确定所述目标文本信息所描述的所述内容类型。
7.根据权利要求6所述的文本信息处理方法,其特征在于,所述语言神经网络模型的类型包括提示学习模型。
8.根据权利要求1所述的文本信息处理方法,其特征在于,所述获取待处理的目标文本信息,包括:
获取待处理的初始文本信息;
对所述初始文本信息进行翻译,得到翻译文本信息;
基于所述翻译文本信息得到所述目标文本信息。
9.根据权利要求8所述的文本信息处理方法,其特征在于,所述基于所述翻译文本信息得到所述目标文本信息,包括:
对所述翻译文本信息进行扩展,得到所述目标文本信息。
10.根据权利要求9所述的文本信息处理方法,其特征在于,所述对所述翻译文本信息进行扩展,得到所述目标文本信息,包括:
提取所述翻译文本信息中的目标关键词;
在预设的内容扩展描述知识库中选取出与所述目标关键词相似的目标描述语;
基于所述目标描述语与所述翻译文本信息生成所述目标文本信息。
11.根据权利要求10所述的文本信息处理方法,其特征在于,所述基于所述目标描述语与所述翻译文本信息生成所述目标文本信息,包括:
在预设的画质经验限定词中选取出与所述目标关键词对应的目标限定词;
基于所述目标描述语、所述目标限定词及所述翻译文本信息生成所述目标文本信息。
12.根据权利要求1至11任一项所述的文本信息处理方法,其特征在于,所述获取待处理的目标文本信息,包括:
获取待处理的初始文本信息;
对所述初始文本信息进行拆分,得到拆分文本信息;
基于所述拆分文本信息得到所述目标文本信息。
13.根据权利要求12所述的文本信息处理方法,其特征在于,所述对所述初始文本信息进行拆分,得到拆分文本信息,包括:
基于自然语言处理算法对所述初始文本信息进行等长拆分,得到所述拆分文本信息。
14.根据权利要求12所述的文本信息处理方法,其特征在于,所述基于所述拆分文本信息得到所述目标文本信息,包括:
对于每个所述拆分文本信息,生成所述拆分文本信息的总语义向量,生成所述拆分文本信息中各个文本段落的段落语义向量,计算各个所述段落语义向量与所述总语义向量的相似度值,将目标数量个值最大的所述相似度值对应的所述文本段落确定为目标文本段落;
基于所述目标文本段落生成所述目标文本信息。
15.根据权利要求14所述的文本信息处理方法,其特征在于,所述计算各个所述段落语义向量与所述总语义向量的相似度值,包括:
基于余弦相似度法计算各个所述段落语义向量与所述总语义向量的所述相似度值。
16.根据权利要求14所述的文本信息处理方法,其特征在于,所述基于所述目标文本段落生成所述目标文本信息,包括:
提取所述目标文本段落中的目标语句;
将所述目标语句作为所述目标文本信息。
17.根据权利要求14所述的文本信息处理方法,其特征在于,所述生成所述拆分文本信息的总语义向量,生成所述拆分文本信息中各个文本段落的段落语义向量,包括:
通过Sentence-BERT模型生成所述拆分文本信息的所述总语义向量,生成所述拆分文本信息中各个所述文本段落的所述段落语义向量。
18.一种文本信息处理***,其特征在于,包括:
获取模块,用于获取待处理的目标文本信息;
处理模块,用于对所述目标文本信息进行分词处理,得到目标词语;
解析模块,用于基于所述目标词语解析所述目标文本信息所描述的内容类型;
生成模块,用于若所述内容类型为静态内容,则基于文本生成图像模型生成所述目标文本信息对应的目标图片;若所述内容类型为动态内容,则基于文本生成视频模型生成所述目标文本信息对应的目标视频。
19.一种文本信息处理设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至17任一项所述文本信息处理方法的步骤。
20.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行是实现如权利要求1至17任一项所述文本信息处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310294417.2A CN115994536B (zh) | 2023-03-24 | 2023-03-24 | 一种文本信息处理方法、***、设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310294417.2A CN115994536B (zh) | 2023-03-24 | 2023-03-24 | 一种文本信息处理方法、***、设备及计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115994536A true CN115994536A (zh) | 2023-04-21 |
CN115994536B CN115994536B (zh) | 2023-07-14 |
Family
ID=85995431
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310294417.2A Active CN115994536B (zh) | 2023-03-24 | 2023-03-24 | 一种文本信息处理方法、***、设备及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115994536B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116233491A (zh) * | 2023-05-04 | 2023-06-06 | 阿里巴巴达摩院(杭州)科技有限公司 | 视频生成的方法及服务器 |
CN116304356A (zh) * | 2023-05-11 | 2023-06-23 | 环球数科集团有限公司 | 一种基于aigc的景区多场景内容创作及应用*** |
CN116306317A (zh) * | 2023-05-12 | 2023-06-23 | 环球数科集团有限公司 | 一种基于人工智能的aigc自动建模*** |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107506377A (zh) * | 2017-07-20 | 2017-12-22 | 南开大学 | 基于推荐***的互动绘本生成*** |
US20180249193A1 (en) * | 2017-02-28 | 2018-08-30 | Alibaba Group Holding Limited | Method and apparatus for generating video data using textual data |
WO2020228376A1 (zh) * | 2019-05-16 | 2020-11-19 | 华为技术有限公司 | 文本处理方法、模型训练方法和装置 |
CN113705198A (zh) * | 2021-10-21 | 2021-11-26 | 北京达佳互联信息技术有限公司 | 场景图生成方法、装置、电子设备及存储介质 |
CN113822067A (zh) * | 2021-08-17 | 2021-12-21 | 深圳市东信时代信息技术有限公司 | 关键信息提取方法、装置、计算机设备及存储介质 |
CN114398482A (zh) * | 2021-12-06 | 2022-04-26 | 腾讯数码(天津)有限公司 | 一种词典构造方法、装置、电子设备及存储介质 |
CN114610948A (zh) * | 2022-03-11 | 2022-06-10 | 北京明略昭辉科技有限公司 | 视频分类方法、装置、电子设备及存储介质 |
CN114638232A (zh) * | 2022-03-22 | 2022-06-17 | 北京美通互动数字科技股份有限公司 | 一种文本转换成视频的方法、装置、电子设备及存储介质 |
WO2022232672A1 (en) * | 2021-04-30 | 2022-11-03 | Capital One Services, Llc | Computer-based systems involving machine learning associated with generation of predictive content for data structure segments and methods of use thereof |
-
2023
- 2023-03-24 CN CN202310294417.2A patent/CN115994536B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180249193A1 (en) * | 2017-02-28 | 2018-08-30 | Alibaba Group Holding Limited | Method and apparatus for generating video data using textual data |
CN107506377A (zh) * | 2017-07-20 | 2017-12-22 | 南开大学 | 基于推荐***的互动绘本生成*** |
WO2020228376A1 (zh) * | 2019-05-16 | 2020-11-19 | 华为技术有限公司 | 文本处理方法、模型训练方法和装置 |
WO2022232672A1 (en) * | 2021-04-30 | 2022-11-03 | Capital One Services, Llc | Computer-based systems involving machine learning associated with generation of predictive content for data structure segments and methods of use thereof |
CN113822067A (zh) * | 2021-08-17 | 2021-12-21 | 深圳市东信时代信息技术有限公司 | 关键信息提取方法、装置、计算机设备及存储介质 |
CN113705198A (zh) * | 2021-10-21 | 2021-11-26 | 北京达佳互联信息技术有限公司 | 场景图生成方法、装置、电子设备及存储介质 |
CN114398482A (zh) * | 2021-12-06 | 2022-04-26 | 腾讯数码(天津)有限公司 | 一种词典构造方法、装置、电子设备及存储介质 |
CN114610948A (zh) * | 2022-03-11 | 2022-06-10 | 北京明略昭辉科技有限公司 | 视频分类方法、装置、电子设备及存储介质 |
CN114638232A (zh) * | 2022-03-22 | 2022-06-17 | 北京美通互动数字科技股份有限公司 | 一种文本转换成视频的方法、装置、电子设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
李雄;丁治明;苏醒;郭黎敏;: "基于词项聚类的文本语义标签抽取研究", 计算机科学, no. 2 * |
许炎骏;陈端端;: "人工智能艺术领域阶段性应用调研报告", 艺术学界, no. 01 * |
谷学汇;: "基于信息融合算法的暴力视频内容识别", 济南大学学报(自然科学版), no. 03 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116233491A (zh) * | 2023-05-04 | 2023-06-06 | 阿里巴巴达摩院(杭州)科技有限公司 | 视频生成的方法及服务器 |
CN116304356A (zh) * | 2023-05-11 | 2023-06-23 | 环球数科集团有限公司 | 一种基于aigc的景区多场景内容创作及应用*** |
CN116304356B (zh) * | 2023-05-11 | 2023-07-18 | 环球数科集团有限公司 | 一种基于aigc的景区多场景内容创作及应用*** |
CN116306317A (zh) * | 2023-05-12 | 2023-06-23 | 环球数科集团有限公司 | 一种基于人工智能的aigc自动建模*** |
Also Published As
Publication number | Publication date |
---|---|
CN115994536B (zh) | 2023-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115994536B (zh) | 一种文本信息处理方法、***、设备及计算机存储介质 | |
CN104735468B (zh) | 一种基于语义分析将图像合成新视频的方法及*** | |
CN107818085B (zh) | 阅读机器人进行阅读理解的答案选择方法及*** | |
JP2023535709A (ja) | 言語表現モデルシステム、事前訓練方法、装置、機器及び媒体 | |
CN109145152A (zh) | 一种基于查询词的自适应智能生成图文视频缩略图方法 | |
KR20190125863A (ko) | 다중언어 번역 장치 및 다중언어 번역 방법 | |
EP3885966B1 (en) | Method and device for generating natural language description information | |
JP2015201169A (ja) | 多様な意味カテゴリに基づいた翻訳結果提供方法およびシステム | |
CN108304376B (zh) | 文本向量的确定方法、装置、存储介质及电子装置 | |
CN110297897B (zh) | 问答处理方法及相关产品 | |
CN111814496B (zh) | 文本处理方法、装置、设备及存储介质 | |
CN109446496A (zh) | 一种测试语言文件的转换方法、装置、设备及存储介质 | |
CN112035622A (zh) | 一种自然语言处理的集成平台及方法 | |
CN116579304A (zh) | 多模态文档的编辑方法及装置 | |
CN115909390B (zh) | 低俗内容识别方法、装置、计算机设备以及存储介质 | |
CN113591493B (zh) | 翻译模型的训练方法及翻译模型的装置 | |
CN112749364B (zh) | 基于人工智能的网页生成方法、装置、设备及存储介质 | |
CN110309517B (zh) | 表情文案处理方法、装置、***及存储介质 | |
CN114138929A (zh) | 问答方法及装置 | |
CN110750989A (zh) | 一种语句分析的方法及装置 | |
CN111401057B (zh) | 一种语义解析方法、存储介质及终端设备 | |
CN114399782B (zh) | 文本图像处理方法、装置、设备、存储介质及程序产品 | |
CN116486421B (zh) | 一种图像翻译模型的训练方法及相关产品 | |
CN114328990B (zh) | 图像完整性识别方法、装置、计算机设备和存储介质 | |
CN117151126A (zh) | 文本翻译方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |