CN111212303B - 视频推荐方法、服务器和计算机可读存储介质 - Google Patents

视频推荐方法、服务器和计算机可读存储介质 Download PDF

Info

Publication number
CN111212303B
CN111212303B CN201911401182.2A CN201911401182A CN111212303B CN 111212303 B CN111212303 B CN 111212303B CN 201911401182 A CN201911401182 A CN 201911401182A CN 111212303 B CN111212303 B CN 111212303B
Authority
CN
China
Prior art keywords
video
videos
content
similarity
labels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911401182.2A
Other languages
English (en)
Other versions
CN111212303A (zh
Inventor
李立锋
白保军
徐丽莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
MIGU Video Technology Co Ltd
MIGU Culture Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
MIGU Video Technology Co Ltd
MIGU Culture Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, MIGU Video Technology Co Ltd, MIGU Culture Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201911401182.2A priority Critical patent/CN111212303B/zh
Publication of CN111212303A publication Critical patent/CN111212303A/zh
Application granted granted Critical
Publication of CN111212303B publication Critical patent/CN111212303B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/75Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44204Monitoring of content usage, e.g. the number of times a movie has been viewed, copied or the amount which has been watched
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44222Analytics of user selections, e.g. selection of programs or purchase activity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4662Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms
    • H04N21/4665Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms involving classification methods, e.g. Decision trees
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Social Psychology (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)

Abstract

本发明实施例涉及多媒体技术领域,公开了一种视频推荐方法、服务器和计算机可读存储介质。本发明中,上述视频推荐方法,包括:对待推荐的各视频进行同质化分类;根据同质化分类的结果,在属于相同分类结果的多个视频中进行筛选;将筛选出的视频推送至客户端,有利于避免向用户推荐过多同质化即相似的视频,从而增强用户在浏览视频过程中的新鲜感。

Description

视频推荐方法、服务器和计算机可读存储介质
技术领域
本发明实施例涉及多媒体技术领域,特别涉及一种视频推荐方法、服务器和计算机可读存储介质。
背景技术
目前,用户通常会通过一些短视频平台浏览短视频,短视频平台为用户从海量的短视频中选取感兴趣的内容。相关技术中,往往是通过关键词,以及标题等来进行短视频的推荐或屏蔽,即向用户推荐关键词相似或标题相似的短视频。
然而,发明人发现相关技术中至少存在如下问题:通过关键词、标题等推荐的短视频通常为同样套路、同样故事,但是不同人发布的视频。即用户最终看到的为一系列相似度很高的同质视频,而一系列同质视频可能会持续占用推荐界面,用户在浏览的过程中一直观看相似度很高的短视频,缺乏新鲜感,容易造成相似信息过多,使用户厌倦。
发明内容
本发明实施方式的目的在于提供一种视频推荐方法、服务器和计算机可读存储介质,有利于避免向用户推荐过多同质化即相似的视频,从而增强用户在浏览视频过程中的新鲜感。
为解决上述技术问题,本发明的实施方式提供了一种视频推荐方法,包括以下步骤:对待推荐的各视频进行同质化分类;根据同质化分类的结果,在属于相同分类结果的多个视频中进行筛选;将筛选出的视频推送至客户端。
本发明的实施方式还提供了一种服务器,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的视频推荐方法。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的视频推荐方法。
本发明实施方式相对于现有技术而言,对待推荐的各视频进行同质化分类;根据同质化分类的结果,在属于相同分类结果的多个视频中进行筛选;将筛选出的视频推送至客户端;通过对各视频进行同质化分类,即将同质化视频作为一个单独的类别,在属于相同分类结果中的多个视频中进行筛选,将筛选出的视频推送至客户端。也就是说,由于对同质化视频进行了筛选,使得可以避免向用户推荐过多同质化即相似的视频,从而有利于增强用户在浏览视频过程中的新鲜感。
另外,所述对待推荐的各视频进行同质化分类,包括:获取待推荐的各视频之间的相似度;其中,所述相似度包括台词相似度和/或桥段相似度;根据所述相似度,对所述待推荐的各视频进行同质化分类。提供了一种同质化分类的实现方式,通过各视频之间的台词相似度和/或桥段相似度,方便了准确的对各视频进行同质化分类。
另外,所述相似度包括桥段相似度,所述桥段相似度的获取方式,包括:获取待推荐的各视频的内容标签;其中,所述内容标签至少包括在各视频中识别出的目标和所述目标的动作;根据所述内容标签和预先建立的知识图谱,推理得到各视频中的推理标签;其中,所述知识图谱存储有内容标签与推理标签之间的推理关系,所述推理标签为推理出的内容;将所述内容标签和所述推理标签输入预先训练的模型,输出各视频所属的桥段;根据所述各视频所属的桥段,获取各视频之间的桥段相似度。提供了一种桥段相似性的获取方式,结合在各视频中识别出的目标和目标的动作等内容标签以及推理出的内容对应的推理标签,有利于通过预先训练的模型来输出各视频中的桥段,从而方便了根据各视频中的桥段,以进一步获取各视频之间的相似度。
另外,所述内容标签还包括在各视频中识别出的以下任意之一或其组合:场景、背景音乐、台词、所述目标的动作关联的物体;其中,所述目标的动作关联的物体为视频中随所述目标的动作的变化而变化的物体。考虑到视频中可能出现的多种不同的元素,使得确定的各视频中的桥段更加准确,即进一步提高了匹配的准确度。
另外,所述根据同质化分类的结果,在属于相同分类结果的多个视频中进行筛选,包括:获取属于相同分类结果的多个视频的排序权重特征;其中,所述排序权重特征包括:发布账号信息和/或浏览次数;根据所述排序权重特征,确定所述多个视频分别对应的排序权重;根据所述排序权重,在属于相同分类结果的多个视频中进行筛选。视频的发布账号信息和/或浏览次数在一定程度上可以体现出该视频的受欢迎程度,因此,结合发布账号信息和/或浏览次数,确定的多个视频分别对应的排序权重,有利于准确的衡量每个视频的受欢迎程度。进而,根据排序权重,在属于相同分类结果的多个视频中进行筛选,使得可以结合每个视频的受欢迎程度,在属于相同分类结果的同质化视频中进行筛选,有利于将同质化视频中受欢迎程度高的视频推荐给用户。
另外,在所述将筛选出的视频推送至客户端之后,还包括:若检测到来自所述客户端对目标视频的屏蔽操作,则同时屏蔽和所述目标视频属于相同分类结果的视频。也就是说,当用户在观看视频中,觉得某个视频不好,质量太差,选择屏蔽该视频后,所有与该视频属于相同分类结果的视频均被屏蔽,即与该视频相同套路、相同故事的其他视频均被屏蔽,有利于提高用户的观看体验。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定。
图1是根据本发明第一实施方式的视频推荐方法的流程图;
图2是根据本发明第一实施方式的桥段相似度的获取方式的流程图;
图3是根据本发明第二实施方式的知识图谱的示意图;
图4是根据本发明第二实施方式的视频推荐方法的流程图;
图5是根据本发明第三实施方式的服务器的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本发明的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
本发明的第一实施方式涉及一种视频推荐方法,应用于服务器,该服务器可以为用于进行视频推荐的视频推荐平台。下面对本实施方式的视频推荐方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
本实施方式中的视频推荐方法的流程图可以如图1所示,具体包括:
步骤101:对待推荐的各视频进行同质化分类。
其中,待推荐的各视频可以为发布在视频推荐平台上的所有视频,比如短视频推荐平台上的所有短视频。可以理解的是,视频推荐平台上一些比较火的短视频,通常会被很多人模仿后再发布到视频推荐平台上,使得视频推荐平台上会存在很多套路相似、情节相似但由不同人发布的同质化视频。本步骤中的同质化分类指的是,将视频推荐平台套路相似、情节相似的同质化视频归为一类,比如,同属于套路1的视频归为一类,同属于套路2的视频归为一类。
具体的说,同质化分类的方式可以为:获取待推荐的各视频之间的相似度,根据相似度,对待推荐的各视频进行同质化分类。比如,可以任意选择一个视频为参考视频,其他视频作为被参考视频,分别获取参考视频与其他被参考视频的相似度,选择出与参考视频的相似度大于预设相似度的被参考视频,将选择出的被参考视频与参考视频视为同质化视频并归为一类。比如,将属于相同套路或属于相同故事的视频归为一类。
在一个例子中,各视频之间的相似度包括台词相似度。台词相似度的获取方式可以如下:对待推荐的各视频进行语音分析,并提取各视频中的语音台词,将语音台词转化为文本台词,将各视频中的文本台词进行对比,并根据对比的结果获取各视频之间的台词相似度。比如,针对所有视频进行语音分析,通过语音转文字的功能,把视频中的语音台词转为文本台词。然后可以通过卷积神经网络深度语义相似度算法DSSM(ConvolutionalNeural Network Deep Structured Semantic Models,简称:CNN-DSSM),把具有相似台词的视频进行归为一类。
在一个例子中,各视频之间的相似度包括桥段相似度。桥段相似度的获取方式可以如下,参考图2:
步骤201:获取待推荐的各视频的内容标签。
其中,内容标签包括在各视频中识别出的目标和目标的动作,目标可以理解为人物、动物、机器人等。
在一个例子中,目标为人物,则可以使用人脸识别技术,对各视频中的人物进行识别。比如,可以预设人脸数据库,人脸数据库中包括不同人物的人脸,且不同的人脸可以设置不同的编号,从而可以利用不同的编号代表不同的人脸。当在视频中检测到人脸时,可以在检人脸数据库中检索,如果检索到视频中的人脸,则可以对视频中的人物添加检索到的人脸的编号;如果没有检索到视频中的人脸,则可以将该视频中的人脸加入人脸数据库中,并为该人脸建立新的编号。如,在同一个视频中,识别出的人物可以用A、B、C等编号表示。可以理解的是,识别出的人物可以包括:人物姓名、年龄、职业、表情、服装等。
在一个例子中,目标的动作为人物的动作,则可以使用深度学习中的人体动作识别技术,识别出人物的动作。比如,可以通过3D卷积神经网络识别出人物的动作,3D卷积神经网络将连续的视频帧看作一个盒子,使用一个三维的卷积核进行卷积,通过这种结构,就能捕获人物的动作。在具体实现中,还可以通过RGB+光流算法等识别出人物的动作。然而,本实施方式中只是提供上述两种示例进行人物动作的识别,在具体实现中识别人物的动作的方式并不以此为限。
可选的,内容特征还可以包括以下任意之一或其组合:在各视频中识别出的场景、背景音乐、台词、与目标的动作关联的物体。其中,识别出的场景可以为,目标的动作发生时的场景,目标的动作关联的物体为视频中随目标的动作的变化而变化的物体。
在一个例子中,各视频中的场景的识别方式可以为:抽取各视频中的视频帧图像,根据深度学习中的场景识别能力,识别出抽取的视频帧图像中人物发生动作时的场景。比如,提取视频帧图像中的Gist信息即全局特征信息,Gist信息为场景的低维签名向量。采用全局特征信息对场景进行识别与分类不需要对图像进行分割和局部特征提取,可以实现快速场景识别与分类。
在一个例子中,各视频中与目标的动作关联的物体的识别方式可以为:使用深度学习能力,如YOLO网络,对视频中的物体进行识别。YOLO网络将物体检测作为一个回归问题进行求解,将视频帧图像输入YOLO网络,便能得到该视频帧图像中所有物体的位置和其所属类别。由于,该视频帧图像中所有物体不一定都与目标的动作相关,因此可以对视频帧图像中所有物体进行筛选,筛选出与目标的动作关联的物体。比如,可以根据视频帧图像中的物体的位置或大小是否随目标的动作的变化而变化,筛选出与目标的动作关联的物体。另外,在具体实现中,在筛选时,当物体的大小在视频中占比小于一定比例时,该物体可以被忽略。而且,为了保证效果,物体识别的粒度不需要很细,识别至该物体的分类就可以。如:宝马 x6,其分类为:汽车;三A扑克牌,其分类为:扑克。
在一个例子中,可以对待推荐的各视频进行拆分,得到多个视频片段;其中,每个视频片段对应一个桥段,然后分别获取多个视频片段的内容标签,即每一个视频片段可以具有对应的内容标签。对待推荐的各视频进行拆分的方式可以为:通过自然语言处理(natural language processing,简称:NLP)对台词进行分析,分析上下文的语义连贯性。当语义连贯性的出现突然大幅下滑或中断时,则判定剧情结束,两个断点之间就是独立的剧情,即一个视频片段。对待推荐的各视频进行拆分的方式还可以为:通过背景、角色、角色服饰进行判断;比如,当角色服饰特征突然出现较大变化时,可能剧情的连贯性出现问题,这时可以结合其它要素进行判断。如:主角掉到水坑里,衣服变形导致无法识别,这时可以结合背景来判断剧情是否连贯,比如人物背景发生大幅度变化时,判定剧情不连贯,则以不连贯点作为分割点,两个分割点之间的就是独立剧情,即一个视频片段。如果人物背景变化幅度不大,如在狭小的屋子中,则可以通过NLP来进一步判断剧情是否连贯。
步骤202:根据内容标签和预先建立的知识图谱,推理得到各视频中的推理标签。
其中,知识图谱存储有内容标签与推理标签之间的推理关系,推理标签为从各视频中推理出的内容。知识图谱是通过节点和边组成,每个节点表示一个实体,每个边,表示关系,可以参考图3。内容标签与推理标签之间的推理关系可以预先定义,也可以自动从网上爬取数据,建立推理关系。
在一个例子中,视频中的内容标签为:A,男性,35岁,医生,使用同一手法杀死了患者 B、C、D,则通过知识图谱推理得到的内容即推理标签可以为:杀人犯、连环杀人犯、伪装者。在另一个例子中,视频中的内容标签为:A,主角,穿着警服,追赶,B,正面题材,则通过知识图谱推理得到的内容即推理标签可以为:A是好人。可以理解的是,如果A是主角,且视频的题材是正面的话,那么极有可能他是好人。简单而言,好人这一推理标签对应的内容标签可以包括:“B(人物),帮助(动作),路人(人物)”;“B(人物),在公园(场景),救(动作),动物”;“B,与坏人,对立”;“B,与中立角色,友善”等。坏人这一推理标签对应的内容标签可以包括:“A,枪杀,警察”;“A,打伤,路人”;“A,绑架,主角”等。可以理解的是,推理标签是通过视觉层面的识别,难以得到的,但可以通过知识图谱推理得到。
在一个例子中,还可以根据对待推荐的各视频进行拆分后得到的多个视频片段的内容标签和预先建立的知识图谱,推理得到多个视频片段的推理标签。即每一个视频片段可以具有对应的推理标签。
步骤203:将内容标签和推理标签输入预先训练的模型,输出各视频所属的桥段。
在一个例子中,可以将各视频的内容标签和推理标签分别输入预先训练的模型,输出各视频所属的桥段。若视频中存在多个桥段,则模型可以直接输出视频所属的多个桥段。在具体实现中,输出的可以为桥段的名称或是编号等信息。
在另一个例子中,可以预先对各视频进行了分段,得到多个视频片段,且获取了多个视频片段分别对应的内容标签和推理标签,则可以依次将多个视频片段分别对应的内容标签和推理标签输入预先训练的模型,输出多个视频片段各自所属的桥段。
在具体实现中,可以将内容标签和推理标签结合,转化为对应的文本,即这些标签可以以文本的形式存在,称为文本标签。还可以把视频时间及文本标签进行一一对应,如:00:00:12 -00:00:18,对应的文本标签为:姓名A、男性、35岁、医生、杀人犯、连环杀人犯、伪装者、夜晚、马路、奔跑、树林、情绪紧张、气氛诡异。最后将文本标签输入预先训练的模型,输出各视频所属的桥段。其中,预先训练的模型可以为词向量模型,根据输入的文本标签,输出该文本标签对应的桥段。
下面对上述模型的训练方式进行简单说明:
首先,选择训练样本;即,选取大量视频作为训练样本。
其次,选择样本特征;样本特征可以包括内容标签、推理标签、标注的桥段。比如,通过识别各视频中的人、物、动作、场景、人物表情、背景音乐、台词等得到内容标签。基于知识图谱和内容标签,建立基于视频整体内容的推理标签。还可以将内容标签与推理标签结合,转换为文本的形式称为文本标签。对视频进行桥段标注,比如可以通过人工进行标注,标注的桥段可以为:跳崖必不死、女扮男装、英雄救美等。
最后,样本训练;即,基于训练样本和样本特征进行样本训练,如使用机器学习,以某类桥段的文本标签作为输入进行训练,获得词向量模型。
在一个例子中,在训练得到词向量模型后,可以每隔一段时间对词向量模型进行更新。还可以将利用词向量模型输出的桥段与实际桥段进行对比,从而对词向量模型的参数进行调整,比如说,可以通过增加样本数据量或者增加训练次数来对词向量模型的参数进行调整,使得利用词向量模型确定的桥段更加准确。
在一个例子中,确定各视频中的桥段的方式还可以为:将内容标签与预设桥段库中的各桥段进行匹配,确定各视频中的桥段。其中,预设桥段库可以预先建立,预设桥段库中包括种类多样的桥段。比如,“英雄救美”,其桥段为:B受C欺负,A打倒了C,解救了B,且 A和B是异性。在具体实现中,可以把识别出来的目标、物体、目标的动作、场景之间的关系,与预设桥段库中的各桥段进行匹配,获得当前视频中的桥段。可以理解的是,除目标和目标的动作是进行匹配时必要的内容特征。场景、背景音乐、台词、与目标关联的物体等为可选的内容特征,但是这两个可选的内容特征可以方便更精准的匹配。
步骤204:根据各视频中的桥段,获取各视频之间的桥段相似度。
在一个例子中,可以根据各视频中是否存在相同的桥段,获取各视频之间的桥段相似度。比如,存在相同的桥段的视频之间的桥段相似度,大于不存在相同的桥段的视频之间的相似度。假设,视频1与视频2之间存在相同的桥段,视频1与视频3之间不存在相同的桥段,则视频1与视频2之间的桥段相似度大于视频1与视频3之间的桥段相似度。
在另一个例子中,当视频中存在多个桥段时,还可以结合各视频中存在的相同的桥段的数目,获取各视频之间的桥段相似度。比如,存在相同的桥段的数目越多的视频之间,桥段相似度越大。假设,视频1与视频2中存在2个相同的桥段,视频1与视频3中存在3个相同的桥段,则视频1与视频3之间的桥段相似度大于视频1与视频2之间的桥段相似度。
步骤102:根据同质化分类的结果,在属于相同分类结果的多个视频中进行筛选。
其中,筛选出的视频的数量可以小于预设阈值,预设阈值可以根据实际需要进行设置,旨在控制筛选出的视频数量不会很多。在具体实现中,也可以在属于相同分类结果的多个视频中筛选出1个视频,比如在同属于套路1的多个视频中选择1个,在同属于套路2的多个视频中选择1个。在一个例子中,筛选的方式可以为:
首先,获取属于相同分类结果的多个视频的排序权重特征。其中,排序权重特征包括:发布账号信息和/或浏览次数。浏览次数可以有由视频服务平台统计得到。在具体实现中,可以统计预设时间段内多个视频对应的浏览次数,比如可以统计3天内的多个视频被浏览的次数。发布账号信息可以从视频服务平台获取,发布账号信息可以包括以下任意之一或其组合:发布账号的级别、发布账号的关注人数、发布账号是否被请求推荐视频的用户关注。可以理解的是,不同的发布账号可能对应不同的级别,级别越高表明通过该发布账号发布的视频通常质量较高。另外,不同的发布账号可能对应不同的关注人数,关注人数越多表明通过该发布账号发布的视频通常质量较高。另外,可以理解的是,视频推荐平台通常是在接收到来自客户端的推荐请求后,向该客户端推送视频,即向该客户端对应的用户推荐视频。考虑到不同的用户的兴趣不同,关注的发布账号存在差异,因此,属于相同分类结果的多个视频的发布账号信息还可以包括请求推荐视频的用户是否关注这些发布账号。
接着,根据排序权重特征,确定多个视频分别对应的排序权重。
在一个例子中,可以根据发布账号的信息,确定多个视频分别对应的排序权重。比如,发布账号的级别越高,通过该发布账号发布的视频对应的排序权重越大,发布账号的关注人数越多,通过该发布账号发布的视频对应的排序权重越大。发布账号被请求推荐视频的用户关注,通过该发布账号发布的视频对应的排序权重越大。
在另一个例子中,可以根据浏览次数,确定多个视频分别对应的排序权重。可以理解的是,一个视频的浏览次数越多,则该视频对应的排序权重越大。
可选的,可以根据发布账号信息和浏览次数,确定多个视频分别对应的排序权重。比如,多个视频中,用户是否关注其发布账号记为F,其中,关注该发布账号对应F=1.2,未关注该发布账号对应F=1,F可根据实际情况调整。视频的浏览次数记为V(V取3天内数值),则排序权重可以记为:F×V。也就是说,若向用户1推荐视频,则考虑用户1是否关注发布账号,若向用户2推荐视频,则考虑用户2是否关注发布账号。即在确定多个视频分别对应的排序权重时,可以结合请求推荐视频的用户是否关注多个视频的发布账号,使得确定的多个视频分别对应的排序权重对于请求推荐视频的用户更具针对性,有利于实现对不同用户的个性化推荐。
最后,根据排序权重,在属于相同分类结果的多个视频中进行筛选。比如,可以筛选出排序权重最大的视频或者排序权重大于预设权重的视频;其中,预设权重可以根据实际需要进行设置,本实施方式对此不做具体限定。
在具体实现中,在属于相同分类结果的多个视频中进行筛选也可以采取随机筛选的方式,然而,本实施方式对筛选的方式不做具体限定。
步骤103:将筛选出的视频推送至客户端。
其中,筛选出的视频的数量小于预设阈值,预设阈值可以根据实际需要进行设置,旨在控制向客户端推送的同一套路的视频数量较少。比如,在同属于套路1的多个视频中筛选出 1个推送至客户端,在同属于套路2的多个视频中筛选出1个推送至客户端。
与现有技术相比,本实施方式,对待推荐的各视频进行同质化分类;根据同质化分类的结果,在属于相同分类结果的多个视频中进行筛选;将筛选出的视频推送至客户端;其中,筛选出的视频的数量小于预设阈值。通过对各视频进行同质化分类,即将同质化视频作为一个单独的类别,在属于相同分类结果中的多个视频中进行筛选,将筛选出的视频推送至客户端。也就是说,对同质化视频进行了筛选,筛选出的视频的数量小于预设阈值,使得可以避免向用户推荐过多同质化即相似的视频,从而有利于增强用户在浏览视频过程中的新鲜感。
本发明的第二实施方式涉及一种视频推荐方法。下面对本实施方式的视频推荐方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。本实施方式中的视频推荐方法的流程图可以如图4所示,其中,步骤301至步骤303与第一实施方式中步骤101至步骤103大致相同,为避免重复本实施方式对步骤301至步骤303不再展开描述。
步骤301:对待推荐的各视频进行同质化分类。
步骤302:根据同质化分类的结果,在属于相同分类结果的多个视频中进行筛选。
步骤303:将筛选出的视频推送至客户端。
步骤304:若检测到来自客户端对目标视频的屏蔽操作,则同时屏蔽和目标视频属于相同分类结果的视频。
其中,目标视频即为用户在浏览过程中屏蔽的视频。具体的说,客户端的显示界面上可以设置有屏蔽功能的触发按键,该触发按键可以为虚拟按键。用户在浏览视频的过程中,如果不喜欢某个视频可以点击该虚拟按键,以对该视频进行屏蔽操作。视频推荐平台在检测到该视频即目标视频被屏蔽后,确定与目标视频属于相同分类结果的其他视频,对其他视频也同时进行屏蔽。比如,用户对视频1进行了屏蔽,视频推荐平台确定视频1的分类结果为套路1,则视频推荐平台同时屏蔽属于同样属于套路1的其他视频。
与现有技术相比,本实施方式中,当用户在观看视频中,觉得某个视频不好,质量太差,选择屏蔽该视频后,所有与该视频属于相同分类结果的视频均被屏蔽,即与该视频相同套路、相同故事的其他视频均被屏蔽,有利于提高用户的观看体验。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明第三实施方式涉及一种服务器,如图5所示,包括至少一个处理器401;以及,与至少一个处理器401通信连接的存储器402;其中,存储器402存储有可被至少一个处理器401执行的指令,指令被至少一个处理器401执行,以使至少一个处理器401能够执行第一、或第二实施方式中的视频推荐方法。
其中,存储器402和处理器401采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器401和存储器402的各种电路连接在一起。总线还可以将诸如***设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器401处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器401。
处理器401负责管理总线和通常的处理,还可以提供各种功能,包括定时,***接口,电压调节、电源管理以及其他控制功能。而存储器402可以被用于存储处理器401在执行操作时所使用的数据。
本发明第四实施方式涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM, Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (9)

1.一种视频推荐方法,其特征在于,包括:
对待推荐的各视频进行同质化分类;
根据同质化分类的结果,在属于相同分类结果的多个视频中进行筛选;
将筛选出的视频推送至客户端;
其中,所述对待推荐的各视频进行同质化分类,包括:
获取待推荐的各视频之间的相似度;
根据所述相似度,对所述待推荐的各视频进行同质化分类;
其中,所述相似度包括桥段相似度,所述桥段相似度的获取方式,包括:
获取待推荐的各视频的内容标签;其中,所述内容标签至少包括在各视频中识别出的目标和所述目标的动作;
根据所述内容标签和预先建立的知识图谱,推理得到各视频中的推理标签;其中,所述知识图谱存储有内容标签与推理标签之间的推理关系,所述推理标签为推理出的内容;
将所述内容标签和所述推理标签输入预先训练的模型,输出各视频所属的桥段;
根据所述各视频所属的桥段,获取各视频之间的桥段相似度。
2.根据权利要求1所述的视频推荐方法,其特征在于,所述相似度还包括台词相似度。
3.根据权利要求1所述的视频推荐方法,其特征在于,所述内容标签还包括在各视频中识别出的以下任意之一或其组合:
场景、背景音乐、台词、所述目标的动作关联的物体;其中,所述目标的动作关联的物体为视频中随所述目标的动作的变化而变化的物体。
4.根据权利要求1所述的视频推荐方法,其特征在于,所述获取待推荐的各视频的内容标签,包括:
对待推荐的各视频进行拆分,得到多个视频片段;其中,每个视频片段对应一个桥段;
分别获取所述多个视频片段的内容标签;
所述根据所述内容标签和预先建立的知识图谱,推理得到各视频中的推理标签,包括:
根据所述多个视频片段的内容标签和预先建立的知识图谱,推理得到所述多个视频片段的推理标签;
所述将所述内容标签和所述推理标签输入预先训练的模型,输出各视频所属的桥段,包括:
依次将所述多个视频片段分别对应的内容标签和推理标签输入预先训练的模型,输出所述多个视频片段各自所属的桥段。
5.根据权利要求1所述的视频推荐方法,其特征在于,所述根据同质化分类的结果,在属于相同分类结果的多个视频中进行筛选,包括:
获取属于相同分类结果的多个视频的排序权重特征;其中,所述排序权重特征包括:发布账号信息和/或浏览次数;
根据所述排序权重特征,确定所述多个视频分别对应的排序权重;
根据所述排序权重,在属于相同分类结果的多个视频中进行筛选。
6.根据权利要求5所述的视频推荐方法,其特征在于,所述排序权重特征包括:发布账号信息,所述发布账号信息包括以下任意之一或其组合:
发布账号的级别、发布账号的关注人数、发布账号是否被请求推荐视频的用户关注。
7.根据权利要求1所述的视频推荐方法,其特征在于,在所述将筛选出的视频推送至客户端之后,还包括:
若检测到来自所述客户端对目标视频的屏蔽操作,则同时屏蔽和所述目标视频属于相同分类结果的视频。
8.一种服务器,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一所述的视频推荐方法。
9.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的视频推荐方法。
CN201911401182.2A 2019-12-30 2019-12-30 视频推荐方法、服务器和计算机可读存储介质 Active CN111212303B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911401182.2A CN111212303B (zh) 2019-12-30 2019-12-30 视频推荐方法、服务器和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911401182.2A CN111212303B (zh) 2019-12-30 2019-12-30 视频推荐方法、服务器和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111212303A CN111212303A (zh) 2020-05-29
CN111212303B true CN111212303B (zh) 2022-05-10

Family

ID=70789428

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911401182.2A Active CN111212303B (zh) 2019-12-30 2019-12-30 视频推荐方法、服务器和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111212303B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111918137B (zh) * 2020-06-29 2021-07-20 北京大学 一种基于视频特征的推送方法、装置、存储介质及终端
CN112016613A (zh) * 2020-08-26 2020-12-01 广州市百果园信息技术有限公司 视频内容分类模型的训练方法、装置、计算机设备及介质
CN112487248A (zh) * 2020-12-01 2021-03-12 深圳市易平方网络科技有限公司 视频文件的标签生成方法、装置、智能终端及存储介质
CN112989115B (zh) * 2021-02-04 2024-06-25 有米科技股份有限公司 待推荐视频的筛选控制方法及装置
CN113426101B (zh) * 2021-06-22 2023-10-20 咪咕互动娱乐有限公司 教学方法、装置、设备及计算机可读存储介质
CN113347082A (zh) * 2021-08-06 2021-09-03 深圳康易世佳科技有限公司 智能显示包含短视频的分享消息的方法及装置
CN113641855A (zh) * 2021-08-13 2021-11-12 北京奇艺世纪科技有限公司 一种视频推荐方法、装置、设备及存储介质
CN115905670A (zh) * 2021-08-20 2023-04-04 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及可读存储介质
CN114979767B (zh) * 2022-05-07 2023-11-21 咪咕视讯科技有限公司 视频推荐方法、装置、设备及计算机可读存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101834837A (zh) * 2009-12-18 2010-09-15 北京邮电大学 基于宽带网络的旅游景区景点在线景观视频主动信息服务***
CN102999640B (zh) * 2013-01-09 2016-03-09 公安部第三研究所 基于语义推理和结构化描述的视频与图像检索***及方法
US20140223466A1 (en) * 2013-02-01 2014-08-07 Huawei Technologies Co., Ltd. Method and Apparatus for Recommending Video from Video Library
CN106331778B (zh) * 2015-07-06 2020-08-14 腾讯科技(深圳)有限公司 视频推荐方法和装置
CN105916032A (zh) * 2015-12-08 2016-08-31 乐视网信息技术(北京)股份有限公司 视频推荐的方法及视频推荐的终端设备
CN107391509B (zh) * 2016-05-16 2023-06-02 中兴通讯股份有限公司 标签推荐方法及装置
CN106649848B (zh) * 2016-12-30 2020-12-29 阿里巴巴(中国)有限公司 视频推荐方法及装置
CN107133263B (zh) * 2017-03-31 2021-06-11 百度在线网络技术(北京)有限公司 Poi推荐方法、装置、设备及计算机可读存储介质
CN110020122B (zh) * 2017-10-16 2022-06-03 Tcl科技集团股份有限公司 一种视频推荐方法、***及计算机可读存储介质
CN108563670B (zh) * 2018-01-12 2021-04-27 武汉斗鱼网络科技有限公司 视频推荐方法、装置、服务器及计算机可读存储介质
CN110267097A (zh) * 2019-06-26 2019-09-20 北京字节跳动网络技术有限公司 基于分类特征的视频推送方法、装置及电子设备

Also Published As

Publication number Publication date
CN111212303A (zh) 2020-05-29

Similar Documents

Publication Publication Date Title
CN111212303B (zh) 视频推荐方法、服务器和计算机可读存储介质
CN108280155B (zh) 基于短视频的问题检索反馈方法、装置及其设备
JP5450681B2 (ja) コンテキスト画像入り広告の生成
CN107657056B (zh) 基于人工智能展示评论信息的方法和装置
CN110309114B (zh) 媒体信息的处理方法、装置、存储介质和电子装置
CN107305557A (zh) 内容推荐方法及装置
CN110737783A (zh) 一种推荐多媒体内容的方法、装置及计算设备
CN113779308B (zh) 一种短视频检测和多分类方法、装置及存储介质
CN112131978A (zh) 一种视频分类方法、装置、电子设备和存储介质
CN107169002A (zh) 一种基于脸识别的个性化界面推送方法及装置
CN112948575B (zh) 文本数据处理方法、装置和计算机可读存储介质
CN104142995A (zh) 基于视觉属性的社会事件识别方法
JP2022547248A (ja) コンテンツ配信画像の自動生成のためのスケーラブルアーキテクチャ
Dellagiacoma et al. Emotion based classification of natural images
CN111783903A (zh) 文本处理方法、文本模型的处理方法及装置、计算机设备
CN115659008A (zh) 大数据信息反馈的信息推送***、方法、电子设备及介质
CN117351336A (zh) 图像审核方法和相关设备
CN113244627B (zh) 识别外挂的方法、装置、电子设备以及存储介质
CN110674388A (zh) 推送项目的配图方法、装置、存储介质和终端设备
CN109033078B (zh) 语句类别识别方法及装置、存储介质、处理器
CN110413823A (zh) 服装图片推送方法及相关装置
CN113704623B (zh) 一种数据推荐方法、装置、设备及存储介质
CN116955788A (zh) 一种内容处理的方法、装置、设备、存储介质及程序产品
US20180114093A1 (en) Data analysis system, method for controlling data analysis system, and recording medium
Wieczorek et al. Semantic Image-Based Profiling of Users' Interests with Neural Networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant