CN114969544A - 基于热点数据的推荐内容生成方法、装置、设备及介质 - Google Patents
基于热点数据的推荐内容生成方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN114969544A CN114969544A CN202210680764.4A CN202210680764A CN114969544A CN 114969544 A CN114969544 A CN 114969544A CN 202210680764 A CN202210680764 A CN 202210680764A CN 114969544 A CN114969544 A CN 114969544A
- Authority
- CN
- China
- Prior art keywords
- data
- hot
- recommended content
- image
- initial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000004458 analytical method Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 18
- 230000007613 environmental effect Effects 0.000 claims abstract description 16
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 238000012549 training Methods 0.000 claims description 34
- 238000005516 engineering process Methods 0.000 claims description 30
- 238000003860 storage Methods 0.000 claims description 17
- 238000012986 modification Methods 0.000 claims description 10
- 230000004048 modification Effects 0.000 claims description 10
- 238000013145 classification model Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 4
- 230000008485 antagonism Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Animal Behavior & Ethology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及分类模型领域,尤其涉及一种基于热点数据的推荐内容生成方法、装置、设备及介质。其方法包括:对热点数据进行预处理,得到热点图文数据和热点音频数据;对热点音频数据进行语音识别,得到第二文本数据;对第一文本数据和第二文本数据进行语义分析,得到热点数据的热点关键词;对图像数据进行图像识别并分类,得到图像分类数据;根据热点关键词和图像分类数据,为热点数据匹配环境属性和话题;通过基于知识图谱的生成对抗网络处理环境属性和话题,得到与热点数据对应的推荐内容。本发明生成的推荐内容具有多样性,提高用户体验感。同时,提高推荐内容的质量和准确率。
Description
技术领域
本发明涉及分类模型领域,尤其涉及一种基于热点数据的推荐内容生成方法、装置、设备及介质。
背景技术
随着互联网和大数据的快速发展,热点推荐成为了自媒体常用的增加用户关注度和自身曝光度的手段。自媒体的热点推荐,通常由自媒体运营人进行热点信息收集,继而进行整理加工生成推荐内容。每天都有不同的热点数据,需要花费大量的人力和时间进行热点信息收集以及推荐内容的制作,且由于当前大数据内容更新过快,很容易出现信息收集不及时的情况,从而导致制作的推荐内容滞后而无法实现很好的推荐效果。
发明内容
基于此,有必要针对上述技术问题,提供一种基于热点数据的推荐内容生成方法、装置、设备及介质,以解决现有企业在营销过程中,需要花费大量的人力和时间进行推荐内容的制作且存在的推荐内容滞后的问题。
一种基于热点数据的推荐内容生成方法,包括:
对热点数据进行预处理,得到热点图文数据和热点音频数据;所述热点图文数据包括图像数据和第一文本数据;
通过语音识别技术对所述热点音频数据进行语音识别,得到第二文本数据;
对所述第一文本数据和所述第二文本数据进行语义分析,得到所述热点数据的热点关键词;
通过图像识别技术对所述图像数据进行图像识别并分类,得到图像分类数据;
根据所述热点关键词和所述图像分类数据,为所述热点数据匹配环境属性和话题;
通过基于知识图谱的生成对抗网络处理所述环境属性和所述话题,得到与所述热点数据对应的推荐内容。
一种基于热点数据的推荐内容生成装置,包括:
预处理模块,用于对热点数据进行预处理,得到热点图文数据和热点音频数据;所述热点图文数据包括图像数据和第一文本数据;
语音识别模块,用于通过语音识别技术对所述热点音频数据进行语音识别,得到第二文本数据;
语义分析模块,用于对所述第一文本数据和所述第二文本数据进行语义分析,得到所述热点数据的热点关键词;
图像识别模块,用于通过图像识别技术对所述图像数据进行图像识别并分类,得到图像分类数据;
匹配模块,用于根据所述热点关键词和所述图像分类数据,为所述热点数据匹配环境属性和话题;
推荐内容模块,用于通过基于知识图谱的生成对抗网络处理所述环境属性和所述话题,得到与所述热点数据对应的推荐内容。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述基于热点数据的推荐内容生成方法。
一个或多个存储有计算机可读指令的可读存储介质,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如上述基于热点数据的推荐内容生成方法。
上述基于热点数据的推荐内容生成方法、装置、计算机设备及存储介质,对热点数据进行预处理,得到热点图文数据和热点音频数据;所述热点图文数据包括图像数据和第一文本数据;通过语音识别技术对所述热点音频数据进行语音识别,得到第二文本数据;对所述第一文本数据和所述第二文本数据进行语义分析,得到所述热点数据的热点关键词;通过图像识别技术对所述图像数据进行图像识别并分类,得到图像分类数据;根据所述热点关键词和所述图像分类数据,为所述热点数据匹配环境属性和话题;通过基于知识图谱的生成对抗网络处理所述环境属性和所述话题,得到与所述热点数据对应的推荐内容。本发明通过对热点数据的进行预处理,然后对不同的数据类型进行不同的识别分析,得到与热点数据的环境属性和话题属性,并通过基于知识图谱的生成对抗网络对该环境属性与话题属性进行分析处理,生成具有多样性的推荐内容,提高用户体验感。同时,由于生成对抗网络的对抗性,可提高推荐内容的质量和准确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中基于热点数据的推荐内容生成方法的一应用环境示意图;
图2是本发明一实施例中基于热点数据的推荐内容生成方法的一流程示意图;
图3是本发明一实施例中基于热点数据的推荐内容生成装置的一结构示意图;
图4是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施例提供的基于热点数据的推荐内容生成方法,可应用在如图1的应用环境中,其中,客户端与服务端进行通信。其中,客户端包括但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种基于热点数据的推荐内容生成方法,以该方法应用在图1中的服务端为例进行说明,包括如下步骤:
S10、对热点数据进行预处理,得到热点图文数据和热点音频数据;所述热点图文数据包括图像数据和第一文本数据。
可理解的,热点数据可通过预设工具获取。热点数据是指与热点事件相关的数据。例如,热点事件可以是当天的热点新闻,可通过爬虫工具获取热点事件的相关数据。该热点数据可以是图文数据、视频数据以及语音数据等。通过对这些数据进行标准化的预处理,可将热点数据整理为标准化的热点图文数据和热点音频数据。其中,预处理包括但不限于删除或修改不符合预设要求的图文数据、视频数据、以及语音数据。热点图文数据包括图像数据和第一文本数据。其中,图像数据是指与热点事件对应的图片或视频数据。例如,图像数据为包含人物、景色或文字的图片或视频。第一文本数据是指与热点事件对应的文字数据。
优选的,当热点数据包含视频数据时,上述预处理还包括将该视频数据进行分流处理。
S20、通过语音识别技术对所述热点音频数据进行语音识别,得到第二文本数据。
可理解的,语音识别技术是一种基于语音特征参数将音频数据转换为文本数据的技术。语音识别技术包括但不限于基于人工神经网络、深度神经网络以及循环神经网络进行语音识别。语音识别是指通过语音识别技术对热点音频数据进行识别,得到第二文本数据的过程。其中,第二文本数据是指通过语音识别技术对热点音频数据进行识别得到包含文字的相关数据。
S30、对所述第一文本数据和所述第二文本数据进行语义分析,得到所述热点数据的热点关键词。
可理解的,可通过自然语言技术处理第一文本数据和第二文本数据,对第一文本数据和第二文本数据进行语义分析。具体的,通过自然语言技术对第一文本数据和第二文本数据中的文本进行语义消歧、词语相似度等的分析,得到热点数据中的热点关键词。
S40、通过图像识别技术对所述图像数据进行图像识别并分类,得到图像分类数据。
可理解的,图像识别技术是指对图像进行对象识别,以识别各种不同模式的目标和对象的技术。图像识别是指通过图像识别技术对图像数据进行识别分析,并根据分析结果进行分类,得到图像分类数据的过程。例如,热点事件中的包含若干人物图片,通过图像识别技术对人物图片进行识别分析,可分析出人物图片中的人物的年龄或性别,根据年龄或性别可将该女性图片分类到对应的类别。图像分类数据包含若干图像的分类结果。
S50、根据所述热点关键词和所述图像分类数据,为所述热点数据匹配环境属性和话题。
可理解的,环境属性是指热点数据产生的环境的属性。话题是指与对应的主题或中心意思。例如,环境属性可以是某个节日,如妇女节,则“3月8日妇女节”为环境属性,对应的话题可为“妇女能顶半边天”。即,当热点关键词为“妇女节”、“3月8日”等词且图像分类数据为女性图片时,与热点数据匹配的环境属性为“3月8日妇女节”,与热点数据匹配的为“妇女能顶半边天”。
S60、通过基于知识图谱的生成对抗网络处理所述环境属性和所述话题,得到与所述热点数据对应的推荐内容。
可理解的,在得到与热点数据对应的环境属性和话题之后,将该环境属性和话题输入基于知识图谱的生成对抗网络处理,通过该生成对抗网络处理对环境属性和话题进行分析处理,并生成与热点数据对应的推荐内容。其中,生成对抗网络为基于知识图谱进行训练且已训练完成的网络模型。该生成对抗网络的训练过程为无监督学习过程,不需要进行人工标注,可节省人力成本和时间。知识图谱是指根据环境属性、话题和推荐内容构建的知识关系图,其包括环境属性、话题和推荐内容之间的关联关系。由于知识图谱中环境属性、话题和推荐内容之间的关联关系不是唯一对应的,因此,基于知识图谱训练得到的生成对抗网络可根据输入的环境属性和话题,匹配出与环境属性和话题关联的推荐内容,具有多样性,可满足不同用户的需求,且智能生成的推荐内容,节省了时间和人力。进一步的,由于生成对抗网络的对抗性,可将模糊的图片转为高清图片,提高图片质量的同时提高匹配的准确率,可提高推荐内容的质量和准确率。
在步骤S10-S60中,对热点数据进行预处理,得到热点图文数据和热点音频数据;所述热点图文数据包括图像数据和第一文本数据;通过语音识别技术对所述热点音频数据进行语音识别,得到第二文本数据;对所述第一文本数据和所述第二文本数据进行语义分析,得到所述热点数据的热点关键词;通过图像识别技术对所述图像数据进行图像识别并分类,得到图像分类数据;根据所述热点关键词和所述图像分类数据,为所述热点数据匹配环境属性和话题;通过基于知识图谱的生成对抗网络处理所述环境属性和所述话题,得到与所述热点数据对应的推荐内容。本发明通过对热点数据的进行预处理,然后对不同的数据类型进行不同的识别分析,得到与热点数据的环境属性和话题属性,并通过基于知识图谱的生成对抗网络对该环境属性与话题属性进行分析处理,生成具有多样性的推荐内容,提高用户体验感。同时,由于生成对抗网络的对抗性,可提高推荐内容的质量和准确率。
可选的,在所述通过基于知识图谱的生成对抗网络处理所述环境属性和所述话题,得到与所述热点数据对应的推荐内容之后,包括:
S601、将所述推荐内容发送至用户端;
S602、接收包含编辑内容的编辑指令;所述编辑指令为用户在所述用户端的操作界面对所述推荐内容进行编辑时生成的指令;
S603、根据所述编辑内容对所述推荐内容进行更新,生成新的推荐内容。
可理解的,在生成推荐内容后,将推荐内容推送给不同的用户,以供用户对该推荐内容进行选择和使用。编辑内容是指用户在用户端输入的内容,包括图像数据、文字数据等。具体的,用户在收到推荐内容之后,可对推荐内容进行编辑,编辑的内容即为编辑内容。例如,对推荐内容的图片进行更换、添加、删除等。编辑指令是为用户在用户端的操作界面对推荐内容进行编辑时生成的指令,该编辑指令用于根据编辑内容对推荐内容进行更新。
在步骤S601-S603中,将所述推荐内容发送至用户端;接收包含编辑内容的编辑指令;所述编辑指令为用户在所述用户端的操作界面对所述推荐内容进行编辑时生成的指令;根据所述编辑内容对所述推荐内容进行更新,生成新的推荐内容。本发明通过将推荐内容发送至用户端,可使用户及时接收到具有多样性的推荐内容,可根据自己的需求选择不同风格的推荐内容。进一步的,还可以对选定的推荐内容进行编辑,操作简单方便,且生成的新的推荐内容更加符合用户的需求,提高用户体验度。
可选的,在所述根据所述编辑内容对所述推荐内容进行更新,生成新的推荐内容之后,包括:
S6031、获取所述推荐内容的第一内容数量和所述编辑内容的第二内容数量;
S6032、根据所述第一内容数量和所述第二内容数量,得到所述推荐内容的修改率;
S6033、根据所述修改率、所述环境属性、所述话题和所述推荐内容生成反馈信息;
S6034、将所述反馈信息输入所述生成对抗网络,以对所述生成对抗网络进行校正。
可理解的,第一内容数量是指推荐内容所包含的数据量大小,包括但不限于推荐内容包含的文字的数量和包含的图片的数量。第二内容数量是指编辑内容所包含的数据量大小,包括但不限于编辑内容包含的文字的数量和包含的图片的数量。在获取到第一内容数量和第二内容数量之后,将第一内容数量和第二内容数量作商,得到推荐内容的修改率。根据将修改率、环境属性、话题和推荐内容生成反馈信息,并将反馈信息输入生成对抗网络,以对该生成对抗网络进行校正,以提高后续生成的推荐内容的准确性。
可选的,在所述通过基于知识图谱的生成对抗网络处理所述环境属性和所述话题之前,包括:
S604、根据样本环境属性、样本话题和样本推荐内容之间的关联关系构建第一知识图谱;
S605、将所述第一知识图谱作为训练样本输入初始生成对抗网络中;
S606、通过所述初始生成对抗网络对所述第一知识图谱进行训练,得到所述生成对抗网络。
可理解的,样本环境属性、样本话题和样本推荐内容是预先收集的用于构建第一知识图谱的样本数据。具体的,样本环境属性可以是时间、地点、人物等,样本话题可以是母亲节、纪念日、医保政策、利率下行等,业务内容可以是储蓄险、医疗险等等。将收集的这些样本环境属性、样本话题和样本推荐内容进行训练,构建包含样本环境属性、样本话题和样本推荐内容之间的关联关系的第一知识图谱。将得到的第一知识图谱的数据作为训练样本输入初始生成对抗网络中,通过初始生成对抗网络进一步进行学习训练,得到训练完成的生成对抗网络。通过第一知识图谱进行生成对抗网络的训练,可提高生成对抗网络的准确性。
可选的,所述初始生成对抗网络包括初始生成器和初始判别器;
所述通过所述初始生成对抗网络对所述第一知识图谱进行训练,得到所述生成对抗网络,包括:
S6061、通过所述初始生成器对所述第一知识图谱进行训练学习,生成固定生成器;
S6062、通过所述初始判别器对所述固定生成器生成的第二知识图谱和所述第一知识图谱进行训练学习,生成固定判别器;
S6063、根据所述固定生成器和所述固定判别器,生成所述生成对抗网络。
可理解的,初始生成器用于生成数据,训练初始生成器的目标是使该初始生成器生成的数据无线接近第一知识图谱中的数据。具体的,通过初始生成器对第一知识图谱进行学习,生成第三知识图谱。通过初始判别器对第三知识图谱和第一知识图谱进行相似度识别,得到生成相似度。根据生成相似度更新初始生成器的第一参数,当生成相似度大于第一预设阈值时,停止对初始生成器的第一参数进行更新,并将停止更新时的初始生成器作为固定生成器。
在步骤S6061-S6063中通过所述初始生成器对所述第一知识图谱进行训练学习,生成固定生成器;通过所述初始判别器对所述固定生成器生成的第二知识图谱和所述第一知识图谱进行训练学习,生成固定判别器;根据所述固定生成器和所述固定判别器,生成所述生成对抗网络,在训练生成器的过程,也是不断提高初始判别器的识别能力的过程,也即可同时实现生成器和判别器的训练,节省训练时间,提高得到的生成对抗网络的准确性。
可选的,所述通过所述初始生成器对所述第一知识图谱进行训练学习,生成固定生成器,包括:
S60611、通过所述初始生成器对所述第一知识图谱进行学习,生成第三知识图谱;
S60612、通过所述初始判别器对所述第三知识图谱和所述第一知识图谱进行相似度识别,得到生成相似度;
S60613、根据所述生成相似度更新所述初始生成器的第一参数,当所述生成相似度大于第一预设阈值时,停止对所述初始生成器的第一参数进行更新,并将停止更新时的初始生成器作为固定生成器。
可理解的,初始生成器对输入的第一知识图谱的知识特征进行提取学习,生成与第一知识图谱相似的第三知识图谱,通过初始判别器对第三知识图谱和第一知识图谱进行相似度识别,得到第三知识图谱和第一知识图谱之间的相似度值,即生成相似度的值。在得到相似度值之后,对该生成相似度的大小进行判断,当生成相似度小于或等于第一预设阈值时,根据该相似度值对初始生成器的初始参数进行更新,得到更新后的初始生成器。其中,第一预设阈值是预先设置的相似度阈值,例如,该第一预设阈值可设置为0.85。即当第三知识图谱和第一知识图谱的生成相似度小于或等于0.85时,则根据该生成相似度对初始生成器进行更新。直到生成相似度大于第一预设阈值时,停止对初始生成器的第一参数进行更新,并将停止更新时的初始生成器作为固定生成器。即当初始判别器识别到初始生成器生成的数据与输入的数据的相似度达到目标相似度时,则认为该初始生成器趋于稳定,将该趋于稳定的初始生成器作为固定生成器。优选的,其中,初始判别器为识别能力较好的判别器。
在步骤S60611-S60613中,通过所述初始生成器对所述第一知识图谱进行学习,生成第三知识图谱;通过所述初始判别器对所述第三知识图谱和所述第一知识图谱进行相似度识别,得到生成相似度;根据所述生成相似度更新所述初始生成器的第一参数,当所述生成相似度大于第一预设阈值时,停止对所述初始生成器的第一参数进行更新,并将停止更新时的初始生成器作为固定生成器。通过初始生成器对第一知识图谱进行训练学习,可提高初始生成器生成的第三知识图谱的准确性,同时,提高最终生成的推荐内容的准确性。
可选的,所述通过所述初始判别器对所述固定生成器生成的第二知识图谱和所述第一知识图谱进行训练学习,生成固定判别器,包括:
S60621、通过所述初始判别器对所述第二知识图谱和所述第一知识图谱进行相似度识别,得到判别相似度;
S60622、根据若干所述判别相似度,确定所述初始判别器的识别准确率;
S60623、根据所述识别准确率更新所述初始判别器的第二参数,当所述识别准确率大于第二预设阈值时,停止对所述初始判别器的第二参数进行更新,并将最后一次更新参数的初始判别器作为固定判别器。
可理解的,初始判别器对输入的第一知识图谱和第二知识图谱进行相似度识别,得到第一知识图谱和第二知识图谱之间的相似度值,即判别相似度的值。在得到若干判别相似度之后,对该初始判别器的若干判别相似度的准确率进行判断,即对初始判别器的识别准确率进行判断。当该识别准确率小于或等于第二预设阈值时,根据该识别准确率对初始判别器的初始参数进行更新,得到更新后的初始判别器。其中,第二预设阈值是预先设置的识别准确率阈值,例如,该第二预设阈值可设置为0.95。即当识别准确率小于或等于0.95时,则根据该生成相似度对初始判别器进行更新。直到识别准确率大于第一预设阈值时,停止对初始判别器的第二参数进行更新,并将停止更新时的初始判别器作为固定判别器。
在步骤S60621-S60623中,通过所述初始判别器对所述第二知识图谱和所述第一知识图谱进行相似度识别,得到判别相似度;根据若干所述判别相似度,确定所述初始判别器的识别准确率;根据所述识别准确率更新所述初始判别器的第二参数,当所述识别准确率大于第二预设阈值时,停止对所述初始判别器的第二参数进行更新,并将最后一次更新参数的初始判别器作为固定判别器。可提高初始判别器的识别准确率,同时,提高最终生成的推荐内容的准确性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种基于热点数据的推荐内容生成装置,该基于热点数据的推荐内容生成装置与上述实施例中基于热点数据的推荐内容生成方法一一对应。如图3所示,该基于热点数据的推荐内容生成装置包括预处理模块10、语音识别模块20、语义分析模块30、图像识别模块40、匹配模块50和推荐内容模块60。各功能模块详细说明如下:
预处理模块10,用于对热点数据进行预处理,得到热点图文数据和热点音频数据;所述热点图文数据包括图像数据和第一文本数据;
语音识别模块20,用于通过语音识别技术对所述热点音频数据进行语音识别,得到第二文本数据;
语义分析模块30,用于对所述第一文本数据和所述第二文本数据进行语义分析,得到所述热点数据的热点关键词;
图像识别模块40,用于通过图像识别技术对所述图像数据进行图像识别并分类,得到图像分类数据;
匹配模块50,用于根据所述热点关键词和所述图像分类数据,为所述热点数据匹配环境属性和话题;
推荐内容模块60,用于通过基于知识图谱的生成对抗网络处理所述环境属性和所述话题,得到与所述热点数据对应的推荐内容。
可选的,在推荐内容模块60之后,包括:
推荐内容发送模块,用于将所述推荐内容发送至用户端;
编辑指令模块,用于接收包含编辑内容的编辑指令;所述编辑指令为用户在所述用户端的操作界面对所述推荐内容进行编辑时生成的指令;
更新模块,用于根据所述编辑内容对所述推荐内容进行更新,生成新的推荐内容。
在所述更新模块之后,包括:
数据获取单元,用于获取所述推荐内容的第一内容数量和所述编辑内容的第二内容数量;
修改率单元,用于根据所述第一内容数量和所述第二内容数量,得到所述推荐内容的修改率;
反馈信息单元,用于根据所述修改率、所述环境属性、所述话题和所述推荐内容生成反馈信息;
校正单元,用于将所述反馈信息输入所述生成对抗网络,以对所述生成对抗网络进行校正。
可选的,在推荐内容模块60之前,包括:
第一知识图谱模块,用于根据样本环境属性、样本话题和样本推荐内容之间的关联关系构建第一知识图谱;
训练样本模块,用于将所述第一知识图谱作为训练样本输入初始生成对抗网络中;
生成对抗网络训练模块,用于通过所述初始生成对抗网络对所述第一知识图谱进行训练,得到所述生成对抗网络。
可选的,所述生成对抗网络训练模块,包括:
固定生成器单元,用于通过所述初始生成器对所述第一知识图谱进行训练学习,生成固定生成器;
固定判别器单元,用于通过所述初始判别器对所述固定生成器生成的第二知识图谱和所述第一知识图谱进行训练学习,生成固定判别器;
生成对抗网络生成单元,用于根据所述固定生成器和所述固定判别器,生成所述生成对抗网络。
可选的,所述固定生成器单元,包括:
第三知识图谱单元,用于通过所述初始生成器对所述第一知识图谱进行学习,生成第三知识图谱;
生成相似度单元,用于通过所述初始判别器对所述第三知识图谱和所述第一知识图谱进行相似度识别,得到生成相似度;
固定生成器确定单元,用于根据所述生成相似度更新所述初始生成器的第一参数,当所述生成相似度大于第一预设阈值时,停止对所述初始生成器的第一参数进行更新,并将停止更新时的初始生成器作为固定生成器。
可选的,所述固定判别器单元,包括:
判别相似度单元,用于通过所述初始判别器对所述第二知识图谱和所述第一知识图谱进行相似度识别,得到判别相似度;
识别准确率单元,用于根据若干所述判别相似度,确定所述初始判别器的识别准确率;
固定判别器生成单元,用于根据所述识别准确率更新所述初始判别器的第二参数,当所述识别准确率大于第二预设阈值时,停止对所述初始判别器的第二参数进行更新,并将最后一次更新参数的初始判别器作为固定判别器。
关于基于热点数据的推荐内容生成装置的具体限定可以参见上文中对于基于热点数据的推荐内容生成方法的限定,在此不再赘述。上述基于热点数据的推荐内容生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图4所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括可读存储介质、内存储器。该非易失性存储介质存储有操作***和计算机可读指令。该内存储器为可读存储介质中的操作***和计算机可读指令的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机可读指令被处理器执行时以实现一种基于热点数据的推荐内容生成方法。本实施例所提供的可读存储介质包括非易失性可读存储介质和易失性可读存储介质。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令,处理器执行计算机可读指令时实现以下步骤:
对热点数据进行预处理,得到热点图文数据和热点音频数据;所述热点图文数据包括图像数据和第一文本数据;
通过语音识别技术对所述热点音频数据进行语音识别,得到第二文本数据;
对所述第一文本数据和所述第二文本数据进行语义分析,得到所述热点数据的热点关键词;
通过图像识别技术对所述图像数据进行图像识别并分类,得到图像分类数据;
根据所述热点关键词和所述图像分类数据,为所述热点数据匹配环境属性和话题;
通过基于知识图谱的生成对抗网络处理所述环境属性和所述话题,得到与所述热点数据对应的推荐内容。
在一个实施例中,提供了一个或多个存储有计算机可读指令的计算机可读存储介质,本实施例所提供的可读存储介质包括非易失性可读存储介质和易失性可读存储介质。可读存储介质上存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时实现以下步骤:
对热点数据进行预处理,得到热点图文数据和热点音频数据;所述热点图文数据包括图像数据和第一文本数据;
通过语音识别技术对所述热点音频数据进行语音识别,得到第二文本数据;
对所述第一文本数据和所述第二文本数据进行语义分析,得到所述热点数据的热点关键词;
通过图像识别技术对所述图像数据进行图像识别并分类,得到图像分类数据;
根据所述热点关键词和所述图像分类数据,为所述热点数据匹配环境属性和话题;
通过基于知识图谱的生成对抗网络处理所述环境属性和所述话题,得到与所述热点数据对应的推荐内容。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一非易失性可读取存储介质或易失性可读存储介质中,该计算机可读指令在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于热点数据的推荐内容生成方法,其特征在于,包括:
对热点数据进行预处理,得到热点图文数据和热点音频数据;所述热点图文数据包括图像数据和第一文本数据;
通过语音识别技术对所述热点音频数据进行语音识别,得到第二文本数据;
对所述第一文本数据和所述第二文本数据进行语义分析,得到所述热点数据的热点关键词;
通过图像识别技术对所述图像数据进行图像识别并分类,得到图像分类数据;
根据所述热点关键词和所述图像分类数据,为所述热点数据匹配环境属性和话题;
通过基于知识图谱的生成对抗网络处理所述环境属性和所述话题,得到与所述热点数据对应的推荐内容。
2.如权利要求1所述的基于热点数据的推荐内容生成方法,其特征在于,在所述通过基于知识图谱的生成对抗网络处理所述环境属性和所述话题,得到与所述热点数据对应的推荐内容之后,包括:
将所述推荐内容发送至用户端;
接收包含编辑内容的编辑指令;所述编辑指令为用户在所述用户端的操作界面对所述推荐内容进行编辑时生成的指令;
根据所述编辑内容对所述推荐内容进行更新,生成新的推荐内容。
3.如权利要求2所述的基于热点数据的推荐内容生成方法,其特征在于,在所述根据所述编辑内容对所述推荐内容进行更新,生成新的推荐内容之后,包括:
获取所述推荐内容的第一内容数量和所述编辑内容的第二内容数量;
根据所述第一内容数量和所述第二内容数量,得到所述推荐内容的修改率;
根据所述修改率、所述环境属性、所述话题和所述推荐内容生成反馈信息;
将所述反馈信息输入所述生成对抗网络,以对所述生成对抗网络进行校正。
4.如权利要求1所述的基于热点数据的推荐内容生成方法,其特征在于,在所述通过基于知识图谱的生成对抗网络处理所述环境属性和所述话题之前,包括:
根据样本环境属性、样本话题和样本推荐内容之间的关联关系构建第一知识图谱;
将所述第一知识图谱作为训练样本输入初始生成对抗网络中;
通过所述初始生成对抗网络对所述第一知识图谱进行训练,得到所述生成对抗网络。
5.如权利要求4所述的基于热点数据的推荐内容生成方法,其特征在于,所述初始生成对抗网络包括初始生成器和初始判别器;
所述通过所述初始生成对抗网络对所述第一知识图谱进行训练,得到所述生成对抗网络,包括:
通过所述初始生成器对所述第一知识图谱进行训练学习,生成固定生成器;
通过所述初始判别器对所述固定生成器生成的第二知识图谱和所述第一知识图谱进行训练学习,生成固定判别器;
根据所述固定生成器和所述固定判别器,生成所述生成对抗网络。
6.如权利要求5所述的基于热点数据的推荐内容生成方法,其特征在于,所述通过所述初始生成器对所述第一知识图谱进行训练学习,生成固定生成器,包括:
通过所述初始生成器对所述第一知识图谱进行学习,生成第三知识图谱;
通过所述初始判别器对所述第三知识图谱和所述第一知识图谱进行相似度识别,得到生成相似度;
根据所述生成相似度更新所述初始生成器的第一参数,当所述生成相似度大于第一预设阈值时,停止对所述初始生成器的第一参数进行更新,并将停止更新时的初始生成器作为固定生成器。
7.如权利要求5所述的基于热点数据的推荐内容生成方法,其特征在于,所述通过所述初始判别器对所述固定生成器生成的第二知识图谱和所述第一知识图谱进行训练学习,生成固定判别器,包括:
通过所述初始判别器对所述第二知识图谱和所述第一知识图谱进行相似度识别,得到判别相似度;
根据若干所述判别相似度,确定所述初始判别器的识别准确率;
根据所述识别准确率更新所述初始判别器的第二参数,当所述识别准确率大于第二预设阈值时,停止对所述初始判别器的第二参数进行更新,并将最后一次更新参数的初始判别器作为固定判别器。
8.一种基于热点数据的推荐内容生成装置,其特征在于,包括:
预处理模块,用于对热点数据进行预处理,得到热点图文数据和热点音频数据;所述热点图文数据包括图像数据和第一文本数据;
语音识别模块,用于通过语音识别技术对所述热点音频数据进行语音识别,得到第二文本数据;
语义分析模块,用于对所述第一文本数据和所述第二文本数据进行语义分析,得到所述热点数据的热点关键词;
图像识别模块,用于通过图像识别技术对所述图像数据进行图像识别并分类,得到图像分类数据;
匹配模块,用于根据所述热点关键词和所述图像分类数据,为所述热点数据匹配环境属性和话题;
推荐内容模块,用于通过基于知识图谱的生成对抗网络处理所述环境属性和所述话题,得到与所述热点数据对应的推荐内容。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述基于热点数据的推荐内容生成方法。
10.一个或多个存储有计算机可读指令的可读存储介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1至7中任一项所述基于热点数据的推荐内容生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210680764.4A CN114969544A (zh) | 2022-06-16 | 2022-06-16 | 基于热点数据的推荐内容生成方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210680764.4A CN114969544A (zh) | 2022-06-16 | 2022-06-16 | 基于热点数据的推荐内容生成方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114969544A true CN114969544A (zh) | 2022-08-30 |
Family
ID=82963857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210680764.4A Pending CN114969544A (zh) | 2022-06-16 | 2022-06-16 | 基于热点数据的推荐内容生成方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114969544A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115792919A (zh) * | 2023-01-19 | 2023-03-14 | 合肥中科光博量子科技有限公司 | 一种气溶胶激光雷达水平扫描监测污染热点区域识别方法 |
-
2022
- 2022-06-16 CN CN202210680764.4A patent/CN114969544A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115792919A (zh) * | 2023-01-19 | 2023-03-14 | 合肥中科光博量子科技有限公司 | 一种气溶胶激光雷达水平扫描监测污染热点区域识别方法 |
CN115792919B (zh) * | 2023-01-19 | 2023-05-16 | 合肥中科光博量子科技有限公司 | 一种气溶胶激光雷达水平扫描监测污染热点区域识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111191078B (zh) | 基于视频信息处理模型的视频信息处理方法及装置 | |
CN111444428B (zh) | 基于人工智能的信息推荐方法、装置、电子设备及存储介质 | |
CN110444198B (zh) | 检索方法、装置、计算机设备和存储介质 | |
CN111666401B (zh) | 基于图结构的公文推荐方法、装置、计算机设备及介质 | |
CN110717514A (zh) | 会话意图识别方法、装置、计算机设备和存储介质 | |
CN111753060A (zh) | 信息检索方法、装置、设备及计算机可读存储介质 | |
CN113157863B (zh) | 问答数据处理方法、装置、计算机设备及存储介质 | |
CN110569356B (zh) | 基于智能面试交互***的面试方法、装置和计算机设备 | |
CN110287297A (zh) | 对话答复方法、装置、计算机设备及计算机可读存储介质 | |
CN111324713B (zh) | 对话自动回复方法、装置、存储介质和计算机设备 | |
CN114245203B (zh) | 基于剧本的视频剪辑方法、装置、设备及介质 | |
CN110750523A (zh) | 数据标注方法、***、计算机设备和存储介质 | |
US20200202068A1 (en) | Computing apparatus and information input method of the computing apparatus | |
CN113343108B (zh) | 推荐信息处理方法、装置、设备及存储介质 | |
US20210151038A1 (en) | Methods and systems for automatic generation and convergence of keywords and/or keyphrases from a media | |
CN112699923A (zh) | 文档分类预测方法、装置、计算机设备及存储介质 | |
CN117332072B (zh) | 对话处理、语音摘要提取以及目标对话模型训练方法 | |
CN114399396A (zh) | 保险产品推荐方法、装置、计算机设备及存储介质 | |
CN111859916A (zh) | 古诗关键词提取、诗句生成方法、装置、设备及介质 | |
CN110310169A (zh) | 基于兴趣值的信息推送方法、装置、设备及介质 | |
CN110909768B (zh) | 一种标注数据获取方法及装置 | |
CN113420203B (zh) | 对象推荐方法、装置、电子设备及存储介质 | |
CN114969544A (zh) | 基于热点数据的推荐内容生成方法、装置、设备及介质 | |
CN116756576B (zh) | 数据处理方法、模型训练方法、电子设备及存储介质 | |
CN113590798A (zh) | 对话意图识别、用于识别对话意图的模型的训练方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |