CN111565322B - 一种用户情感倾向信息获得方法、装置及电子设备 - Google Patents

一种用户情感倾向信息获得方法、装置及电子设备 Download PDF

Info

Publication number
CN111565322B
CN111565322B CN202010406415.4A CN202010406415A CN111565322B CN 111565322 B CN111565322 B CN 111565322B CN 202010406415 A CN202010406415 A CN 202010406415A CN 111565322 B CN111565322 B CN 111565322B
Authority
CN
China
Prior art keywords
video
comments
comment
target
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010406415.4A
Other languages
English (en)
Other versions
CN111565322A (zh
Inventor
宁宇光
李晨
阳任科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN202010406415.4A priority Critical patent/CN111565322B/zh
Publication of CN111565322A publication Critical patent/CN111565322A/zh
Application granted granted Critical
Publication of CN111565322B publication Critical patent/CN111565322B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2355Processing of additional data, e.g. scrambling of additional data or processing content descriptors involving reformatting operations of additional data, e.g. HTML pages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • H04N21/4355Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream involving reformatting operations of additional data, e.g. HTML pages on a television screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/475End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data
    • H04N21/4756End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data for rating content, e.g. scoring a recommended movie
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computing Systems (AREA)
  • Computer Graphics (AREA)
  • Human Computer Interaction (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请实施例提供了一种用户情感倾向信息获得方法、装置及电子设备,涉及信息处理技术领域,其中,上述方法包括:根据目标用户对目标视频所发表的评论,预估表示目标用户对目标视频情感倾向的初始信息;确定针对目标视频的评论中正向评论与负向评论间的第一混合程度;根据目标用户对已评论视频所发表的评论和针对每一已评论视频的评论中正向评论与负向评论间的第二混合程度,估算目标用户对视频进行评论相对于其他用户对视频进行评论的差异度;采用第一混合程度和差异度对初始信息进行修正,得到表示目标用户对目标视频情感倾向的最终信息。应用本申请实施例提供的方案能够提高所获得的表示用户对视频情感倾向的信息的准确率。

Description

一种用户情感倾向信息获得方法、装置及电子设备
技术领域
本申请涉及信息处理技术领域,特别是涉及一种用户情感倾向信息获得方法、装置及电子设备。
背景技术
为了向用户推荐感兴趣的视频,视频平台往往会评估用户对各个视频的情感倾向。例如,用户U1对视频X的情感倾向是喜欢,而用户U2对视频X的情感倾向是不喜欢,这样在进行视频推荐时,可以向用户U1推荐与视频X相类似的视频,而不向用户U2推荐与视频X相类似的视频。
用户对各个视频的情感倾向可以通过量化的信息表示。现有技术中,一般直接基于用户在观看视频过程中发表的弹幕类评论或者在评论区发表的列表类评论,获得表示用户对所观看视频情感倾向的信息。虽然应用上述方式能够获得表示用户对视频情感倾向的信息,但是由于用户发表的各类评论往往是针对所观看视频的局部视频的评论,具有局限性,所以,应用上述方式获得的表示用户对视频情感倾向的信息准确率低。
发明内容
本申请实施例的目的在于提供一种用户情感倾向信息获得方法、装置及电子设备,以提高所获得的表示用户对视频情感倾向的信息的准确率。具体技术方案如下:
第一方面,本申请实施例提供了一种用户情感倾向信息获得方法,所述方法包括:
根据目标用户对目标视频所发表的评论,预估表示所述目标用户对所述目标视频情感倾向的初始信息;
确定针对所述目标视频的评论中正向评论与负向评论间的第一混合程度;
根据所述目标用户对已评论视频所发表的评论和针对每一已评论视频的评论中正向评论与负向评论间的第二混合程度,估算所述目标用户对视频进行评论相对于其他用户对视频进行评论的差异度,其中,所述已评论视频为所述目标用户发表过评论的视频;
采用所述第一混合程度和差异度对所述初始信息进行修正,得到表示所述目标用户对所述目标视频情感倾向的最终信息。
本申请的一个实施例中,所述根据目标用户对目标视频所发表的评论,预估表示所述目标用户对所述目标视频情感倾向的初始信息,包括:
获得目标用户对目标视频所发表的评论中正向评论的第一总数量和负向评论的第二总数量;
根据所述第一总数量和第二总数量,预估表示所述目标用户对所述目标视频情感倾向的初始信息。
本申请的一个实施例中,所述根据所述第一总数量和第二总数量,预估表示所述目标用户对所述目标视频情感倾向的初始信息,包括:
计算所述第一总数量与第二总数量间的差值;
按照以下表达式,预估表示所述目标用户对所述目标视频情感倾向的初始信息:
Figure BDA0002491460100000021
其中,Vtag表示所述初始信息,diff表示所述差值。
本申请的一个实施例中,所述确定针对所述目标视频的评论中正向评论与负向评论间的第一混合程度,包括:
统计针对所述目标视频的评论中正向评论的总数量,作为第三总数量;
统计针对所述目标视频的评论中负向评论的总数量,作为第四总数量;
计算所述第三总数量与第四总数量之间的信息熵;
根据所述第三总数量、第四总数量和所述信息熵,确定针对所述目标视频的评论中正向评论与负向评论间的第一混合程度。
本申请的一个实施例中,所述根据所述第三总数量、第四总数量和所述信息熵,确定针对所述目标视频的评论中正向评论与负向评论间的第一混合程度,包括:
按照以下表达式,确定针对所述目标视频的评论中正向评论与负向评论间的第一混合程度:
Figure BDA0002491460100000031
其中,v+表示所述第三总数量,v-表示所述第四总数量,H(X)表示所述信息熵,ε表示所述第一混合程度。
本申请的一个实施例中,所述根据所述目标用户对已评论视频所发表的评论和针对每一已评论视频的评论中正向评论与负向评论间的第二混合程度,估算所述目标用户对视频进行评论相对于其他用户对视频进行评论的差异度,包括:
获得每一参考评论反映的、且表示所述目标用户对该参考评论所针对的已评论视频情感倾向的参考信息,其中,所述参考评论为:所述目标用户对每一已评论视频所发表的评论;
根据每一参考评论对应的参考信息相对于该参考信息所针对的已评论视频对应的第二混合程度的差异,估算所述目标用户对视频进行评论相对于其他用户对视频进行评论的差异度,其中,已评论视频对应的第二混合程度为:针对已评论视频的评论中正向评论与负向评论间的混合程度。
本申请的一个实施例中,所述根据每一参考评论对应的参考信息相对于该参考信息所针对的已评论视频对应的第二混合程度的差异,估算所述目标用户对视频进行评论相对于其他用户对视频进行评论的差异度,包括:
按照以下表达式,估算所述目标用户对视频进行评论相对于其他用户对视频进行评论的差异度:
Figure BDA0002491460100000032
其中,c表示所述差异度,f()表示预设的归一化函数,n表示已评论视频的数量,i表示已评论视频的序号,j表示所述目标用户对各个已评论视频所发表评论的序号,mi表示所述目标用户对第i个已评论视频所发表评论的数量,(Vtag)ij表示所述目标用户对第i个已评论视频所发表的第j条评论对应的参考信息,εi表示第i个已评论视频对应的第二混合程度。
本申请的一个实施例中,所述采用所述第一混合程度和差异度对所述初始信息进行修正,得到表示所述目标用户对所述目标视频情感倾向的最终信息,包括:
按照以下表达式,获得表示所述目标用户对所述目标视频情感倾向的最终信息:
Vsrc=cVtag+(1-c)ε
其中,Vsrc表示所述最终信息,c表示所述差异度,Vtag表示所述初始信息,ε表示所述第一混合程度。
第二方面,本申请实施例提供了一种用户情感倾向信息获得装置,所述装置包括:
初始信息预估模块,用于根据目标用户对目标视频所发表的评论,预估表示所述目标用户对所述目标视频情感倾向的初始信息;
混合程度确定模块,用于确定针对所述目标视频的评论中正向评论与负向评论间的第一混合程度;
差异度估算模块,用于根据所述目标用户对已评论视频所发表的评论和针对每一已评论视频的评论中正向评论与负向评论间的第二混合程度,估算所述目标用户对视频进行评论相对于其他用户对视频进行评论的差异度,其中,所述已评论视频为所述目标用户发表过评论的视频;
最终信息获得模块,用于采用所述第一混合程度和差异度对所述初始信息进行修正,得到表示所述目标用户对所述目标视频情感倾向的最终信息。
本申请的一个实施例中,所述初始信息预估模块,包括:
总数量获得单元,用于获得目标用户对目标视频所发表的评论中正向评论的第一总数量和负向评论的第二总数量;
初始信息预估单元,用于根据所述第一总数量和第二总数量,预估表示所述目标用户对所述目标视频情感倾向的初始信息。
本申请的一个实施例中,所述初始信息预估单元,具体用于:
计算所述第一总数量与第二总数量间的差值;
按照以下表达式,预估表示所述目标用户对所述目标视频情感倾向的初始信息:
Figure BDA0002491460100000051
其中,Vtag表示所述初始信息,diff表示所述差值。
本申请的一个实施例中,所述混合程度确定模块,包括:
数量统计单元,用于统计针对所述目标视频的评论中正向评论的总数量,作为第三总数量;统计针对所述目标视频的评论中负向评论的总数量,作为第四总数量;
信息熵计算单元,用于计算所述第三总数量与第四总数量之间的信息熵;
混合度确定单元,用于根据所述第三总数量、第四总数量和所述信息熵,确定针对所述目标视频的评论中正向评论与负向评论间的第一混合程度。
本申请的一个实施例中,所述混合度确定单元,具体用于按照以下表达式,确定针对所述目标视频的评论中正向评论与负向评论间的第一混合程度:
Figure BDA0002491460100000052
其中,v+表示所述第三总数量,v-表示所述第四总数量,H(X)表示所述信息熵,ε表示所述第一混合程度。
本申请的一个实施例中,所述差异度估算模块,包括:
参考信息获得单元,用于获得每一参考评论反映的、且表示所述目标用户对该参考评论所针对的已评论视频情感倾向的参考信息,其中,所述参考评论为:所述目标用户对每一已评论视频所发表的评论;
差异度估算单元,用于根据每一参考评论对应的参考信息相对于该参考信息所针对的已评论视频对应的第二混合程度的差异,估算所述目标用户对视频进行评论相对于其他用户对视频进行评论的差异度,其中,已评论视频对应的第二混合程度为:针对已评论视频的评论中正向评论与负向评论间的混合程度。
本申请的一个实施例中,所述差异度估算单元,具体用于按照以下表达式,估算所述目标用户对视频进行评论相对于其他用户对视频进行评论的差异度:
Figure BDA0002491460100000061
其中,c表示所述差异度,f()表示预设的归一化函数,n表示已评论视频的数量,i表示已评论视频的序号,j表示所述目标用户对各个已评论视频所发表评论的序号,mi表示所述目标用户对第i个已评论视频所发表评论的数量,(Vtag)ij表示所述目标用户对第i个已评论视频所发表的第j条评论对应的参考信息,εi表示第i个已评论视频对应的第二混合程度。
本申请的一个实施例中,所述最终信息获得模块,具体用于按照以下表达式,获得表示所述目标用户对所述目标视频情感倾向的最终信息:
Vsrc=cVtag+(1-c)ε
其中,Vsrc表示所述最终信息,c表示所述差异度,Vtag表示所述初始信息,ε表示所述第一混合程度。
第三方面,本申请实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面所述的方法步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的方法步骤。
第五方面,本申请实施例提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面所述的方法步骤。
由以上可见,应用本申请实施例提供的方案获得用户情感倾向信息时,不仅考虑了根据目标用户对目标视频所发表的评论预估的表示目标用户对目标视频情感倾向的初始信息,还考虑了第一混合程度。由于第一混合程度表示了针对目标视频的评论中正向评论与负向评论间的混合程度,因此,本申请实施例提供的方案中,还考虑了大多数用户对目标视频所发表的评论中正向评论和负向评论的分布情况,也就是,考虑了针对目标视频的评论环境。除此之外,本申请实施例提供的方案中还考虑了目标用户对视频进行评论相对于其他用户对视频进行评论的差异度,也就是,考虑了相对于其他用户而言目标用户对视频进行评论的习惯。所以,综合以上,相对于现有技术中,直接基于用户在观看视频过程中发表的评论获得表示用户对所观看视频情感倾向的信息而言,参考的信息更加丰富、更加全面,因此,应用本申请实施例提供的方案获得用户情感倾向信息,能够提高所获得的表示用户对视频情感倾向的信息的准确率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的第一种用户情感倾向信息获得方法的流程示意图;
图2a-图2f为本申请实施例提供的信息对应关系示例图;
图2g为本申请实施例提供的一种线型示意图;
图3为本申请实施例提供的第二种用户情感倾向信息获得方法的流程示意图;
图4a为本申请实施例提供的第三种用户情感倾向信息获得方法的流程示意图;
图4b为本申请实施例提供的一种信息熵变化曲线图;
图5为本申请实施例提供的第四种用户情感倾向信息获得方法的流程示意图;
图6为本申请实施例提供的第一种用户情感倾向信息获得装置的结构示意图;
图7为本申请实施例提供的第二种用户情感倾向信息获得装置的结构示意图;
图8为本申请实施例提供的第三种用户情感倾向信息获得装置的结构示意图;
图9为本申请实施例提供的第四种用户情感倾向信息获得装置的结构示意图;
图10为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
由于现有技术中确定表示用户对视频情感倾向的信息时,存在准确率低的技术问题,为解决这一技术问题,本申请实施例提供了一种用户情感倾向信息获得方法、装置及电子设备。
本申请的一个实施例中,提供了一种用户情感倾向信息获得方法,该方法包括:
根据目标用户对目标视频所发表的评论,预估表示目标用户对目标视频情感倾向的初始信息;
确定针对目标视频的评论中正向评论与负向评论间的第一混合程度;
根据目标用户对已评论视频所发表的评论和针对每一已评论视频的评论中正向评论与负向评论间的第二混合程度,估算目标用户对视频进行评论相对于其他用户对视频进行评论的差异度,其中,已评论视频为目标用户发表过评论的视频;
采用第一混合程度和差异度对初始信息进行修正,得到表示目标用户对目标视频情感倾向的最终信息。
由以上可见,应用本实施例提供的方案获得用户情感倾向信息时,不仅考虑了根据目标用户对目标视频所发表的评论预估的表示目标用户对目标视频情感倾向的初始信息,还考虑了第一混合程度。由于第一混合程度表示了针对目标视频的评论中正向评论与负向评论间的混合程度,因此,本申请实施例提供的方案中,还考虑了大多数用户对目标视频所发表的评论中正向评论和负向评论的分布情况,也就是,考虑了针对目标视频的评论环境。除此之外,本实施例提供的方案中还考虑了目标用户对视频进行评论相对于其他用户对视频进行评论的差异度,也就是,考虑了相对于其他用户而言目标用户对视频进行评论的习惯。所以,综合以上,相对于现有技术中,直接基于用户在观看视频过程中发表的评论获得表示用户对所观看视频情感倾向的信息而言,参考的信息更加丰富、更加全面,因此,应用本实施例提供的方案获得用户情感倾向信息,能够提高所获得的表示用户对视频情感倾向的信息的准确率。
下面通过具体实施例对本申请实施例提供的用户情感倾向信息获得方法、装置及电子设备分别进行介绍。
参见图1,提供了第一种用户情感倾向信息获得方法的流程示意图,该方法包括以下步骤S101-S104。
S101:根据目标用户对目标视频所发表的评论,预估表示目标用户对目标视频情感倾向的初始信息。
本申请实施例中所提及的视频可以是电视剧的各集视频、各个综艺节目、电影等各种类型的视频。
用户在观看视频过程中可能会针对观看到的视频内容发表弹幕类评论、也可能会在专门的评论区发表列表类评论,另外,用户在观看视频之后也有可能在上述评论区发表列表类评论。不管用户发表的是哪一类评论,均会反映出用户对所观看视频的情感倾向,例如,喜欢所观看的视频、不喜欢所观看的视频等等。
为了能够直观的、量化的表示用户对视频的情感倾向,可以通过不同形式的信息表示用户对视频的情感倾向。例如,可以预先设定用户对视频的可能情感倾向,然后以不同的数值表示每一种可能情感倾向。如,可能情感倾向包括:非常喜欢、喜欢、一般、不喜欢和非常不喜欢,这时可以分别用5、4、3、2和1表示。另外,还可以以不同的程度值表示用户对视频的喜欢程度,如,90、80等。
本申请的一个实施例中,根据目标用户对目标视频所发表的评论,预估表示目标用户对目标视频情感倾向的初始信息时,可以分析目标用户针对目标视频所发表的评论中是否包含预设的词汇和/或表情图形等,例如,“继续追剧”、“表演太烂”、心形表情图形、玫瑰型表情图形等,这些词汇以及表情图形均可以表露出目标用户在观看目标视频时的情绪,也就是情感倾向,然后根据分析结果估计上述初始信息。例如,当分析结果中包含“继续追剧”时,可以认为目标用户非常喜欢目标视频,非常喜欢这一情感倾向以数值“5”表示,则上述初始信息的取值为5;当分析结果中包含“表演太烂”时,可以认为目标用户非常不喜欢目标视频,非常不喜欢这一情感倾向以数值“1”表示,则上述初始信息的取值为1。
还可以采用其他方式预估上述初始信息,详细过程可以参见后续图3所示实施例提供的方案,这里暂不详述。
S102:确定针对目标视频的评论中正向评论与负向评论间的第一混合程度。
除了目标用户会对目标视频发表评论之外,其他用户也可能会对目标视频发表评论,所以可能会存在针对目标视频的多条评论。另外,这些针对目标视频的评论中可能会存在表示喜欢目标视频、对目标视频的内容持积极态度的正向评论,也可能会存在表示不喜欢目标视频、对目标视频的内容持消极态度的负向评论,这些评论形成了用户对目标视频的整体评论环境。
针对目标视频的正向评论和负向评论混杂在针对目标视频的所有评论中,正向评论相对于负向评论越多,表明大多数用户对目标视频的情感倾向趋于正向,用户对目标视频的整体评论环境趋于正向,反之,负向评论相对于正向评论越多,表明大多数用户对目标视频的情感倾向趋于负向,用户对目标视频的整体评论环境趋于负向。综合以上,可以认为这些评论中正向评论和负向评论的分布情况能够反映用户对目标视频的整体评论环境。本申请实施例中,采用正向评论和负向评论间的混合程度来表示针对目标视频的评论中正向评论与负向评论的分布情况。当针对目标视频的评论中正向评论强于负向评论,例如,正向评论的数量多于负向评论的数量时,正向评论与负向评论之间的混合程度越低,目标视频的整体评论环境的纯度越高、且整体评论环境趋于正向评论环境。当针对目标视频的评论中负向评论强于正向评论,例如,负向评论的数量多于正向评论的数量时,正向评论与负向评论之间的混合程度也越低,目标视频的整体评论环境的纯度也越高、但整体评论环境趋于负向评论环境。当针对目标视频的评论中正向评论和负向评论趋于一致,例如,正向评论数量与负向评论的数量趋于一致时,正向评论与负向评论之间的混合程度趋于最高,目标视频的整体评论环境的纯度则趋于最低,这样整体评论环境趋于中立评论环境。
具体的,用于确定上述第一混合程度的正向评论和负向评论可以是基于针对目标视频的所有评论确定的,还可以是基于针对目标视频的部分评论确定的。例如,上述部分评论可以是预设时间段内针对目标视频发表的评论,如,最近一个月内针对目标视频发表的评论、最近两个月内针对目标视频发表的评论等。
另外,确定上述第一混合程度时,可以是基于针对目标视频的评论中正向评论的数量和负向评论的数量确定的,例如,当针对目标视频的评论中正向评论的数量大于负向评论的数量时,以正向评论的数量占第一评论总量的比例作为第一混合程度,当针对目标视频的评论中正向评论的数量不大于负向评论的数量时,以负向评论的数量占评论总量比例的负值作为第一混合程度。其中,上述第一评论总量等于针对目标视频的评论中正向评论的数量与负向评论的数量之和。
当然,还可以通过其他方式确定上述第一混合程度,详细过程可以参见后续图4a所示实施例,这里暂不详述。
再者,在确定上述第一混合程度时,还可以根据针对目标视频的评论中的正向评论确定发表正向评论的用户总数量,作为第五总数量;根据针对目标视频的评论中负向评论确定发表负向评论的用户总数量,作为第六总数量。然后根据第五总数量和第六总数量确定上述第一混合程度。
根据第五总数量和第六总数量确定第一混合程度的方式,可以与根据针对目标视频的评论中正向评论的数量、负向评论的数量确定第一混合程度的方式相似,两种方式中第五总数量与正向评论的数量相对应,第六总数量与负向评论的数量相对应,区别仅在于数量代表的具体含义不同。
S103:根据目标用户对已评论视频所发表的评论和针对每一已评论视频的评论中正向评论与负向评论间的第二混合程度,估算目标用户对视频进行评论相对于其他用户对视频进行评论的差异度。
其中,已评论视频为目标用户发表过评论的视频。具体的,上述已评论视频中可以包括目标视频,也可以不包括目标视频,本申请并不对此进行限定。
目标用户除了对目标视频发表过评论外,还有可能对其他视频发表过评论。另外,每个用户对各个视频发表评论时往往受其性格、认知等因素的影响而呈现个性化特点。例如,有些用户性格比较极端化,其对各个视频发表的评论可能均会偏离于绝大多数用户的评论。
鉴于上述情况,本申请实施例中在获得目标用户对目标视频的情感倾向信息时,还考虑了目标用户对视频进行评论时相对于其他用户对视频进行评论时的差异度。目标用户对一个已评论视频所发表的评论能够反映出目标用户对这一已评论视频的情感倾向,如,正向情感倾向、负向情感请求、中立情感倾向等。基于此,可以综合目标用户对各个已评论视频的情感倾向,从而得出目标用户对视频进行评价的习惯,也即得出目标用户对视频进行评价的个性化特点。另外,与第一混合程度类似,每一已评论视频的第二混合程度表示了针对每一已评论视频的评论中正向评论和负向评论间的分布情况,也就是表示了每一已评论视频的整体评论环境,例如,正向评论环境、负向评论环境、中立评论环境等。所以,综合以上本申请实施例中,能够根据目标用户对已评论视频所发表的评论和各个第二混合程度,估算出目标用户对视频进行评价相对于其他用户对视频进行评论的差异度。
具体的,估算上述差异度时,可以根据目标用户对每一已评论视频所发表的评论,预估表示目标用户对每一已评论视频情感倾向的信息,然后根据预估得到的信息和上述第二混合程度估算上述差异度。
其中,可以采用上述S101中预估初始信息的方式,预估表示目标用户对每一已评论视频情感倾向的信息。
另外,可以参照获得前述第一混合程度的方式得到上述第二混合程度,这里不再赘述。
S104:采用第一混合程度和差异度对初始信息进行修正,得到表示目标用户对目标视频情感倾向的最终信息。
由于上述初始信息是根据目标用户对目标视频所发表的评论预估的表示目标用户对目标视频情感倾向的信息,这一信息仅仅考虑了用户对目标视频所发表的评论,而目标用户对目标视频的真是情感倾向还会受目标用户对视频进行评论的习惯、目标视频的整体评论环境等因素的影响,而上述差异度反映的恰恰是目标用户对视频进行评价时相对于其他用户对视频进行评价时的差异,也就是,目标用户对视频进行评价的习惯,另外,第一混合程度反映的是目标视频的整体评价环境。鉴于此,本步骤中采用上述差异度和第一混合程度对初始信息进行修正,进而得到表示目标用户对目标视频情感倾向的最终信息。
本申请的一个实施例中,由于上述差异度较大时,说明目标用户对视频进行评论的习惯与大多数用户对视频进行评论的习惯不同,这时上述初始信息更加能够表示目标用户对目标视频的真实情感倾向。这种情况下基于上述差异度对初始信息进行修正时,可以进行小幅度的修正。例如,基于预设的第一调整幅度进行调整,这一预设的第一调整幅度可以设置的较小。
反之上述差异度较小时,说明目标用户对视频进行评论的习惯与大多数用户对视频进行评论的习惯相同,这时删除初始信息不能够很好的表示目标用户对目标视频的真实情感倾向。这种情况下基于上述差异度对初始信息进行修正时,可以向着目标视频的整体评论环境表明的方向,大幅度的修正上述初始信息。例如,基于预设的第二调整幅度进行调整,这一预设的第二调整幅度可以设置的较大。
另外,可以采用上述第一混合程度与基于差异度修正后的初始信息累加的方式再次对上述初始信息进行修正。
需要说明的是,本申请仅仅以此为例进行说明,并不对本申请构成限定。获得上述最终信息的其它实现方式可以参照后续实施例。
由以上可见,上述实施例提供的方案获得用户情感倾向信息时,不仅考虑了根据目标用户对目标视频所发表的评论预估的表示目标用户对目标视频情感倾向的初始信息,还考虑了第一混合程度。由于第一混合程度表示了针对目标视频的评论中正向评论与负向评论间的混合程度,因此,本申请实施例提供的方案中,还考虑了大多数用户对目标视频所发表的评论中正向评论和负向评论的分布情况,也就是,考虑了针对目标视频的评论环境。除此之外,上述实施例提供的方案中还考虑了目标用户对视频进行评论相对于其他用户对视频进行评论的差异度,也就是,考虑了相对于其他用户而言目标用户对视频进行评论的习惯。所以,综合以上,相对于现有技术中,直接基于用户在观看视频过程中发表的评论获得表示用户对所观看视频情感倾向的信息而言,参考的信息更加丰富、更加全面,因此,应用上述实施例提供的方案获得用户情感倾向信息,能够提高所获得的表示用户对视频情感倾向的信息的准确率。
本申请的一个实施例中,可以按照以下表达式,获得表示目标用户对目标视频情感倾向的最终信息:
Vsrc=cVtag+(1-c)ε
其中,Vsrc表示上述最终信息,c表示上述差异度,Vtag表示上述初始信息,ε表示上述第一混合程度。
下面结合图2a-图2f介绍Vsrc、Vtag和ε位于不同取值范围时的对应关系。
第一种情况,当0<ε<Vtag时,Vtag>Vsrc>ε>0
以Vtag的取值为9、Vsrc的取值为7、ε的取值为3为例,这些信息与取值间的对应关系如图2a所示。这种情况下,目标视频的整体评论环境为正向评论环境,受正向评论环境的影响,表示目标用户对目标视频情感倾向的信息Vsrc从Vtag减弱,也就是,目标用户对目标视频的真实情感倾向比上述初始信息所表示的情感倾向弱。
第二种情况,当0<Vtag<ε时,ε>Vsrc>Vtag>0
以Vtag的取值为3、Vsrc的取值为7、ε的取值为9为例,这些信息与取值间的对应关系如图2b所示。这种情况下,目标视频的整体评论环境为正向评论环境,受正向评论环境的影响,表示目标用户对目标视频情感倾向的信息Vsrc从Vtag增强,也就是,目标用户对目标视频的真实情感倾向比上述初始信息所表示的情感倾向强烈。
第三种情况,当Vtag<ε<0时,Vtag<Vsrc<ε<0
以Vtag的取值为-9、Vsrc的取值为-7、ε的取值为-3为例,这些信息与取值间的对应关系如图2c所示。这种情况下,目标视频的整体评论环境为负向评论环境,受负向评论环境的影响,表示目标用户对目标视频情感倾向的信息Vsrc从Vtag减弱,也就是,目标用户对目标视频的真实情感倾向比上述初始信息所表示的情感倾向弱。
第四种情况,当ε<Vtag<0时,ε<Vsrc<Vtag<0
以Vtag的取值为-3、Vsrc的取值为-7、ε的取值为-9为例,这些信息与取值间的对应关系如图2d所示。这种情况下,目标视频的整体评论环境为负向评论环境,受负向评论环境的影响,表示目标用户对目标视频情感倾向的信息Vsrc从Vtag增强,也就是,目标用户对目标视频的真实情感倾向比上述初始信息所表示的情感倾向强烈。
第五种情况,当ε<0<Vtag时,ε<Vsrc<Vtag
以Vtag的取值为9、Vsrc的取值为7或-2、ε的取值为-3为例,这些信息与取值间的对应关系如图2e所示。这种情况下,目标视频的整体评论环境为负向评论环境,受负向评论环境的影响,表示目标用户对目标视频情感倾向的信息Vsrc从Vtag变化,目标用户对目标视频的真实情感倾向为负向情感倾向或者比上述初始信息所表示的情感倾向弱的正向情感倾向。
第六种情况,当Vtag<0<ε时,Vtag<Vsrc<ε
以Vtag的取值为-5、Vsrc的取值为3或-3、ε的取值为9为例,这些信息与取值间的对应关系如图2f所示。这种情况下,目标视频的整体评论环境为正向评论环境,受正向评论环境的影响,表示目标用户对目标视频情感倾向的信息Vsrc从Vtag变化,也就是,目标用户对目标视频的真实情感倾向比上述初始信息所表示的情感倾向弱的负向情感倾向或者正向情感倾向。
另外,假设,
Figure BDA0002491460100000151
对上用于获得最终信息的表达式进行变形,可以得到如下结论。
结论1:当Vtag<0<ε,0<c<Opress时,Vsrc>0。
结论2:当Vtag<0<ε,c>Opress时,Vsrc<0。
结论3:当ε<0<Vtag,0<c<Opress时,Vsrc<0。
结论4:当ε<0<Vtag,c>Opress时,Vsrc>0。
再者,参见图2g,示出了采用上述表达式对初始信息进行修正得到的最终信息与修正前初始信息之间的线型示意图。也就是,Vsrc与Vtag的线型示意图。
图2g中实线表示Vsrc的线型图,虚线表示Vtag的线型图,横轴为表示目标用户对目标视频情感倾向的信息,纵轴为对目标视频的评论数量。
从图2g中可以看出,Vtag的线型图并没有明显的规律,而Vsrc的线型图呈现类正态分布。因此,应用本申请实施例提供的方案能够获得较为客观的表示用户对视频情感倾向的信息,从而提高所获得的表示用户对视频情感倾向的信息的准确率。
参见图3,提供了第二种用户情感倾向信息获得方法的流程示意图,与前述图1所示实施例相比,本实施例中,上述S101根据目标用户对目标视频所发表的评论,预估表示目标用户对目标视频情感倾向的初始信息,包括以下步骤S101A和S101B。
S101A:获得目标用户对目标视频所发表的评论中正向评论的第一总数量和负向评论的第二总数量。
本申请的一个实施例中,正向评论可以是包括正向词的评论,其中,上述正向词可以是表示喜欢所评论视频、对所评论视频持积极态度的词。例如,追剧、点赞、棒极了等。
本申请的一个实施例中,负向评论可以是包括负向词的评论,其中,上述负向词可以是表示不喜欢所评论视频、对所评论视频持消极态度的词。例如,糟糕、弃剧等。
当目标用户对目标视频所发表的评论中既包含正向词又包含负向词的时候,可以统计正向词和负向词的数量,若正向词的数量大于负向词的数量,可以认为该评论为正向评论,若正向词的数量小于负向词的数量,可以认为该评论为负向评论,若正向词的数量等于负向词的数量,可以认为该评论为中性评论。
本申请的一个实施例中,可以先对目标用户对目标视频所发表的评论进行分词处理,得到评论中包含的各个词,然后判断所得到的各个词是正向词还是负向词。例如,可以预先设定正向词表和负向词表,然后在得到评论中包含的各个词后,分别与上述预先设定的正向词表、负向词表进行匹配,从而判断出评论中包含的各个词是正向词还是负向词。
具体的,由于目标用户可能会对目标视频发表不止一条评论,所以,上述第一总数量和第二总数量可以是针对目标用户对目标视频所发表的所有评论中进行统计得到的,也可以是对部分评论进行统计得到的。其中,上述部分评论可以是目标用户最近一年、半年、三个月等中对目标视频所发表的评论。
S101B:根据第一总数量和第二总数量,预估表示目标用户对目标视频情感倾向的初始信息。
用户在对一个视频发表评论的时候,所持的正向情感倾向越强烈,例如,喜欢该视频的情感倾向、支持该视频所表达内容的情感倾向越强烈,所发表的正向评论往往越多,反之,所持的负向情感倾向越强烈,例如,不喜欢该视频的情感倾向、反对该视频所表达内容的情感倾向越强烈,所发表的负向评论往往越多。鉴于此,上述第一总数量和第二总数量,能够在一定程度上反映出目标用户对目标视频的情感倾向。
本申请的一个实施例中,可以计算第一总数量与第二总数量间的差值,然后按照以下表达式,预估表示目标用户对目标视频情感倾向的初始信息:
Figure BDA0002491460100000171
其中,Vtag表示上述初始信息,diff表示上述差值。
本申请的另一个实施例中,还可以以上述差值与第二评论总量之间的比例作为上述初始信息。其中,上述第二评论总量等于第一总数量和第二总数量之和。
本申请的再一个实施例中,当第一总数量大于等于第二总数量时,可以以第一总数量与上述第二评论总量之间的比例作为上述初始信息,当第一总数量小于第二总数量时,可以第二总数量与上述第二评论总量之间比例的负值作为上述初始比例。
需要说明的是,本申请仅仅以上述为例进行说明,并不对预估初始信息的具体实现方式进行限定。
由以上可见,本实施例提供的方案中基于目标用户对目标视频发表的评论中正向评论的总数量和负向评论的总数量,预估表示目标用户对目标视频情感倾向的信息。由于目标用户在对目标视频发表评论的时候所发表的正向评论越多表示目标用户对目标视频表达的内容所持的态度越积极,正向情感倾向越强烈,所发表的负向评论越多表示目标用户对目标视频表达的内容所持的态度越消极,负向情感倾向越强烈,因此,应用本实施例提供的方案能够准确的预估表示目标用户对目标视频情感倾向的初始信息。
参见图4a,提供了第三种用户情感倾向信息获得方法的流程示意图,与前述图1所示实施例相比,本实施例中,上述S102确定针对目标视频的评论中正向评论与负向评论间的第一混合程度,包括以下步骤S102A-S102D。
S102A:统计针对目标视频的评论中正向评论的总数量,作为第三总数量。
S102B:统计针对目标视频的评论中负向评论的总数量,作为第四总数量。
由于目标用户以及其他用户均可能会对目标视频发表评论,又由于不同的用户兴趣爱好不同,所以,针对目标视频的评论中可能会存在对目标视频的正向评论,也可能会存在对目标视频的负向评论。
下面对上述S102A和S102B一并进行说明。
具体的,对于针对目标视频的一条评论,可以分别统计这一评论中正向词的数量和负向词的数量,当正向词的数量大于负向词的数量时,认为该条评论为正向评论,当负向词的数量大于正向词的数量时,认为该条评论为负向评论。
当然,还可以通过检测预测词汇的方式判断一条评论属于正向评论,还是属于负向评论。若一条评论中包括预设的正向词汇,则认为该条评论属于正向评论。若一条评论中包括预设的负向词汇,则认为该条评论属于负向评论。
需要说明的是,本申请实施例并不限定上述S102A和S102B的执行顺序,S102A可以在S102B之前执行,也可以在S102B之后执行,还可以与S102B同步执行。
S102C:计算第三总数量与第四总数量之间的信息熵。
具体的,可以按照以下表达式计算上述信息熵。
Figure BDA0002491460100000181
其中,v+表示第三总数量,v-表示第四总数量,H(X)表示信息熵。
参见图4b,示出了按照上述表达式计算信息熵时,信息熵随着p而变化的曲线图。其中,
Figure BDA0002491460100000182
图4b中横轴表示p的取值,纵轴表示信息熵的取值。从图中可以看出,当p的取值接近0.5时,信息熵是不断增加的,在p=0.5时,信息熵达到最大值。当p的取值远离0.5时,信息熵的取值逐渐减小。而从上述关于p的表达式可以看出,p的取值从0开始增大至0.5的过程,表示针对目标视频的评论中负向评论多于正向评论,p的取值越接近0,表示负向评论越多、正向评论越少,正向评论与负向评论之间的混合程度越低。p的取值达到0.5时,正向评论的数量与负向评论的数量相等,这时正向评论与负向评论之间的混合程度达到最高。p的取值从0.5增大至1的过程,表示针对目标视频的评论中正向评论多于负向评论,p的取值越接近1,表示正向评论越多、负向评论越少,正向评论与负向评论之间的混合程度越低。
S102D:根据第三总数量、第四总数量和上述信息熵,确定针对目标视频的评论中正向评论与负向评论间的第一混合程度。
从上述图4b可以看出,信息熵随着p的变化呈现的是非线性变化。在正向评论的数量小于负向评论的数量时,在目标视频的整体评论环境中负向评论处于主导位置,而当正向评论的数量大于负向评论的数量时,在目标视频的整体评论环境中正向评论处于主导位置。
鉴于上述情况,本申请的一个实施例中,可以按照以下表达式,确定针对目标视频的评论中正向评论与负向评论间的第一混合程度:
Figure BDA0002491460100000191
其中,ε表示第一混合程度。
可见,当正向评论的数量大于负向评论的数量时,也就是,第三总数量大于第四总数量时,以第三总数量为基准计算第一混合程度,这种情况下,第三总数量越大、第四总数量越小,信息熵越小,第一混合程度也越小,目标视频的整体评论环境的纯度越高,正向评论占据优势,正向评论对整体评论环境的影响越大。
当负向评论的数量大于正向评论的数量时,也就是,第四总数量大于第三总数量时,以第四总数量为基准计算第一混合程度,这种情况下,第四总数量越大、第三总数量越小,信息熵越小,第一混合程度也越小,目标视频的整体评论环境的纯度越高,负向评论占据优势,负向评论对整体评论环境的影响越大。
由以上可见,本实施例提供的方案中根据针对目标视频的评论中正向评论的总数量和负向评论的总数量,确定正向评论与负向评论之间的混合程度。由于正向评论的总数量和负向评论的总数量相结合能够反映出针对目标视频的评论中正向、负向评论的分布情况,能够表征目标视频的整体评论环境,因此,应用本实施例提供的方案能够准确的确定出正向评论与负向评论间的混合程度。
参见图5,提供了第四种用户情感倾向信息获得方法的流程示意图,与前述实施例相比,本实施例中,上述S103根据目标用户对已评论视频所发表的评论和针对每一已评论视频的评论中正向评论与负向评论间的第二混合程度,估算目标用户对视频进行评论相对于其他用户对视频进行评论的差异度,包括以下步骤S103A和S103B。
S103A:获得每一参考评论反映的、且表示目标用户对该参考评论所针对的已评论视频情感倾向的参考信息。
其中,为与上述初始信息相区分,本申请实施例中,将每一参考评论反映的、且表示目标用户对该参考评论所针对的已评论视频情感倾向的信息称为参考信息。另外,参考评论为:目标用户对每一已评论视频所发表的评论。
S103B:根据每一参考评论对应的参考信息相对于该参考信息所针对的已评论视频对应的第二混合程度的差异,估算目标用户对视频进行评论相对于其他用户对视频进行评论的差异度。
其中,已评论视频对应的第二混合程度为:针对已评论视频的评论中正向评论与负向评论间的混合程度。
本申请的一个实施例中,可以按照以下表达式,估算目标用户对视频进行评论相对于其他用户对视频进行评论的差异度:
Figure BDA0002491460100000201
其中,c表示上述差异度,f()表示预设的归一化函数,n表示已评论视频的数量,i表示已评论视频的序号,j表示目标用户对各个已评论视频所发表评论的序号,mi表示目标用户对第i个已评论视频所发表评论的数量,(Vtag)ij表示目标用户对第i个已评论视频所发表的第j条评论对应的参考信息,εi表示第i个已评论视频对应的第二混合程度。
例如,上述f()可以是max-min归一化函数。
经f()这一归一化函数进行归一化处理后,可以将c的取值范围归并至预设的区间,例如,[0,1]这一区间、[0,10]这一区间等。
除此之外,还可以计算上述差异的方差、最大值、最小值等统计值,作为上述差异度。
由于参考评论是目标用户对已评论视频发表的评论,所以参考评论对应的参考信息反映的是目标用户对各个已评论视频进行评论的情感倾向,又由于已评论视频包括多个视频,所以,各个参考信息反映的是目标用户对视频进行评论的习惯,而各个第二混合程度反映的是各个已评论视频的整体评论环境,也就是,大多数用户对各个已评论视频进行评论的情况,为此,根据每一参考评论对应的参考信息相对于该参考信息所针对的已评论视频对应的第二混合程度的差异,能够准确的估算目标用户对视频进行评论相对于其他用户对视频进行评论的差异度。
与上述用户情感倾向信息获得方法相对应,本申请实施例还提供了一种用户情感倾向信息获得装置。
参见图6,提供了第一种用户情感倾向信息获得装置的结构示意图,所述装置包括:
初始信息预估模块601,用于根据目标用户对目标视频所发表的评论,预估表示所述目标用户对所述目标视频情感倾向的初始信息;
混合程度确定模块602,用于确定针对所述目标视频的评论中正向评论与负向评论间的第一混合程度;
差异度估算模块603,用于根据所述目标用户对已评论视频所发表的评论和针对每一已评论视频的评论中正向评论与负向评论间的第二混合程度,估算所述目标用户对视频进行评论相对于其他用户对视频进行评论的差异度,其中,所述已评论视频为所述目标用户发表过评论的视频;
最终信息获得模块604,用于采用所述第一混合程度和差异度对所述初始信息进行修正,得到表示所述目标用户对所述目标视频情感倾向的最终信息。
本申请的一个实施例中,所述最终信息获得模块604,具体用于按照以下表达式,获得表示所述目标用户对所述目标视频情感倾向的最终信息:
Vsrc=cVtag+(1-c)ε
其中,Vsrc表示所述最终信息,c表示所述差异度,Vtag表示所述初始信息,ε表示所述第一混合程度。
由以上可见,上述实施例提供的方案获得用户情感倾向信息时,不仅考虑了根据目标用户对目标视频所发表的评论预估的表示目标用户对目标视频情感倾向的初始信息,还考虑了第一混合程度。由于第一混合程度表示了针对目标视频的评论中正向评论与负向评论间的混合程度,因此,本申请实施例提供的方案中,还考虑了大多数用户对目标视频所发表的评论中正向评论和负向评论的分布情况,也就是,考虑了针对目标视频的评论环境。除此之外,上述实施例提供的方案中还考虑了目标用户对视频进行评论相对于其他用户对视频进行评论的差异度,也就是,考虑了相对于其他用户而言目标用户对视频进行评论的习惯。所以,综合以上,相对于现有技术中,直接基于用户在观看视频过程中发表的评论获得表示用户对所观看视频情感倾向的信息而言,参考的信息更加丰富、更加全面,因此,应用上述实施例提供的方案获得用户情感倾向信息,能够提高所获得的表示用户对视频情感倾向的信息的准确率。
参见图7,提供了第二种用户情感倾向信息获得装置的结构示意图,与前述图6所示实施例相比,本实施例中,上述初始信息预估模块601,包括:
总数量获得单元601A,用于获得目标用户对目标视频所发表的评论中正向评论的第一总数量和负向评论的第二总数量;
初始信息预估单元601B,用于根据所述第一总数量和第二总数量,预估表示所述目标用户对所述目标视频情感倾向的初始信息。
本申请的一个实施例中,所述初始信息预估单元601B,具体用于:
计算所述第一总数量与第二总数量间的差值;
按照以下表达式,预估表示所述目标用户对所述目标视频情感倾向的初始信息:
Figure BDA0002491460100000231
其中,Vtag表示所述初始信息,diff表示所述差值。
由以上可见,上述实施例提供的方案中基于目标用户对目标视频发表的评论中正向评论的总数量和负向评论的总数量,预估表示目标用户对目标视频情感倾向的信息。由于目标用户在对目标视频发表评论的时候所发表的正向评论越多表示目标用户对目标视频表达的内容所持的态度越积极,正向情感倾向越强烈,所发表的负向评论越多表示目标用户对目标视频表达的内容所持的态度越消极,负向情感倾向越强烈,因此,应用上述实施例提供的方案能够准确的预估表示目标用户对目标视频情感倾向的初始信息。
参见图8,提供了第三种用户情感倾向信息获得装置的结构示意图,与前述图6所示实施例相比,本实施例中,上述混合程度确定模块602,包括:
数量统计单元602A,用于统计针对所述目标视频的评论中正向评论的总数量,作为第三总数量;统计针对所述目标视频的评论中负向评论的总数量,作为第四总数量;
信息熵计算单元602B,用于计算所述第三总数量与第四总数量之间的信息熵;
混合度确定单元602C,用于根据所述第三总数量、第四总数量和所述信息熵,确定针对所述目标视频的评论中正向评论与负向评论间的第一混合程度。
本申请的一个实施例中,所述混合度确定单元602C,具体用于按照以下表达式,确定针对所述目标视频的评论中正向评论与负向评论间的第一混合程度:
Figure BDA0002491460100000232
其中,v+表示所述第三总数量,v-表示所述第四总数量,H(X)表示所述信息熵,ε表示所述第一混合程度。
由以上可见,上述实施例提供的方案中根据针对目标视频的评论中正向评论的总数量和负向评论的总数量,确定正向评论与负向评论之间的混合程度。由于正向评论的总数量和负向评论的总数量相结合能够反映出针对目标视频的评论中正向、负向评论的分布情况,能够表征目标视频的整体评论环境,因此,应用上述实施例提供的方案能够准确的确定出正向评论与负向评论间的混合程度。
参见图9,提供了第四种用户情感倾向信息获得装置的结构示意图,与前述图6所示实施例相比,本实施例中,上述差异度估算模块603,包括:
参考信息获得单元603A,用于获得每一参考评论反映的、且表示该参考评论所针对的已评论用户对所述目标视频情感倾向的参考信息,其中,所述参考评论为:所述目标用户对每一已评论视频所发表的评论;
差异度估算单元603B,用于根据每一参考评论对应的参考信息相对于该参考信息所针对的已评论视频对应的第二混合程度的差异,估算所述目标用户对视频进行评论相对于其他用户对视频进行评论的差异度,其中,已评论视频对应的第二混合程度为:针对已评论视频的评论中正向评论与负向评论间的混合程度。
本申请的一个实施例中,所述差异度估算单元603B,具体用于按照以下表达式,估算所述目标用户对视频进行评论相对于其他用户对视频进行评论的差异度:
Figure BDA0002491460100000241
其中,c表示所述差异度,f()表示预设的归一化函数,n表示已评论视频的数量,i表示已评论视频的序号,j表示所述目标用户对各个已评论视频所发表评论的序号,mi表示所述目标用户对第i个已评论视频所发表评论的数量,(Vtag)ij表示所述目标用户对第i个已评论视频所发表的第j条评论对应的参考信息,εi表示第i个已评论视频对应的第二混合程度。
由于参考评论是目标用户对已评论视频发表的评论,所以参考评论对应的参考信息反映的是目标用户对各个已评论视频进行评论的情感倾向,又由于已评论视频包括多个视频,所以,各个参考信息反映的是目标用户对视频进行评论的习惯,而各个第二混合程度反映的是各个已评论视频的整体评论环境,也就是,大多数用户对各个已评论视频进行评论的情况,为此,根据每一参考评论对应的参考信息相对于该参考信息所针对的已评论视频对应的第二混合程度的差异,能够准确的估算目标用户对视频进行评论相对于其他用户对视频进行评论的差异度。
与上述用户情感倾向信息获得方法相对应,本申请实施例还提供了一种电子设备。
参见图10,本申请实施例提供了一种电子设备的结构示意图,该电子设备包括处理器1001、通信接口1002、存储器1003和通信总线1004,其中,处理器1001,通信接口1002,存储器1003通过通信总线1004完成相互间的通信,
存储器1003,用于存放计算机程序;
处理器1001,用于执行存储器1003上所存放的程序时,实现本申请实施例提供的用户情感倾向信息获得方法。
需要说明的是,上述处理器1001执行存储器1003上所存放的程序而实现的用户情感倾向信息获得方法的具体实现实施例与前述方法实施例部分提及的实施例相同,这里不再赘述。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
与上述用户情感倾向信息获得方法相对应,本申请实施例还提供了一种计算机可读存储介质,上述计算机可读存储介质内存储有计算机程序,上述计算机程序被处理器执行时实现本申请实施例提供的用户情感倾向信息获得方法。
与上述用户情感倾向信息获得方法相对应,本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行本申请实施例提供的用户情感倾向信息获得方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质和计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。

Claims (11)

1.一种用户情感倾向信息获得方法,其特征在于,所述方法包括:
根据目标用户对目标视频所发表的评论,预估表示所述目标用户对所述目标视频情感倾向的初始信息;
确定针对所述目标视频的评论中正向评论与负向评论间的第一混合程度;其中,所述第一混合程度表示针对所述目标视频的评论中正向评论与负向评论的分布情况;
根据所述目标用户对已评论视频所发表的评论和针对每一已评论视频的评论中正向评论与负向评论间的第二混合程度,估算所述目标用户对视频进行评论相对于其他用户对视频进行评论的差异度,其中,所述已评论视频为所述目标用户发表过评论的视频;所述第二混合程度表示每一已评论视频的评论中正向评论和负向评论的分布情况;
采用所述第一混合程度和差异度对所述初始信息进行修正,得到表示所述目标用户对所述目标视频情感倾向的最终信息,其中,所述差异度越大,对初始信息的修正幅度越小。
2.根据权利要求1所述的方法,其特征在于,所述根据目标用户对目标视频所发表的评论,预估表示所述目标用户对所述目标视频情感倾向的初始信息,包括:
获得目标用户对目标视频所发表的评论中正向评论的第一总数量和负向评论的第二总数量;
根据所述第一总数量和第二总数量,预估表示所述目标用户对所述目标视频情感倾向的初始信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一总数量和第二总数量,预估表示所述目标用户对所述目标视频情感倾向的初始信息,包括:
计算所述第一总数量与第二总数量间的差值;
按照以下表达式,预估表示所述目标用户对所述目标视频情感倾向的初始信息:
Figure FDA0003420067320000021
其中,Vtag表示所述初始信息,diff表示所述差值。
4.根据权利要求1所述的方法,其特征在于,所述确定针对所述目标视频的评论中正向评论与负向评论间的第一混合程度,包括:
统计针对所述目标视频的评论中正向评论的总数量,作为第三总数量;
统计针对所述目标视频的评论中负向评论的总数量,作为第四总数量;
计算所述第三总数量与第四总数量之间的信息熵;
根据所述第三总数量、第四总数量和所述信息熵,确定针对所述目标视频的评论中正向评论与负向评论间的第一混合程度。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第三总数量、第四总数量和所述信息熵,确定针对所述目标视频的评论中正向评论与负向评论间的第一混合程度,包括:
按照以下表达式,确定针对所述目标视频的评论中正向评论与负向评论间的第一混合程度:
Figure FDA0003420067320000022
其中,v+表示所述第三总数量,v-表示所述第四总数量,H(X)表示所述信息熵,ε表示所述第一混合程度。
6.根据权利要求1所述的方法,其特征在于,所述根据所述目标用户对已评论视频所发表的评论和针对每一已评论视频的评论中正向评论与负向评论间的第二混合程度,估算所述目标用户对视频进行评论相对于其他用户对视频进行评论的差异度,包括:
获得每一参考评论反映的、且表示所述目标用户对该参考评论所针对的已评论视频情感倾向的参考信息,其中,所述参考评论为:所述目标用户对每一已评论视频所发表的评论;
根据每一参考评论对应的参考信息相对于该参考信息所针对的已评论视频对应的第二混合程度的差异,估算所述目标用户对视频进行评论相对于其他用户对视频进行评论的差异度,其中,已评论视频对应的第二混合程度为:针对已评论视频的评论中正向评论与负向评论间的混合程度。
7.根据权利要求6所述的方法,其特征在于,所述根据每一参考评论对应的参考信息相对于该参考信息所针对的已评论视频对应的第二混合程度的差异,估算所述目标用户对视频进行评论相对于其他用户对视频进行评论的差异度,包括:
按照以下表达式,估算所述目标用户对视频进行评论相对于其他用户对视频进行评论的差异度:
Figure FDA0003420067320000031
其中,c表示所述差异度,f()表示预设的归一化函数,n表示已评论视频的数量,i表示已评论视频的序号,j表示所述目标用户对各个已评论视频所发表评论的序号,mi表示所述目标用户对第i个已评论视频所发表评论的数量,(Vtag)ij表示所述目标用户对第i个已评论视频所发表的第j条评论对应的参考信息,εi表示第i个已评论视频对应的第二混合程度。
8.根据权利要求1-7中任一项所述的方法,其特征在于,所述采用所述第一混合程度和差异度对所述初始信息进行修正,得到表示所述目标用户对所述目标视频情感倾向的最终信息,包括:
按照以下表达式,获得表示所述目标用户对所述目标视频情感倾向的最终信息:
Vsrc=cVtag+(1-c)ε
其中,Vsrc表示所述最终信息,c表示所述差异度,Vtag表示所述初始信息,ε表示所述第一混合程度。
9.一种用户情感倾向信息获得装置,其特征在于,所述装置包括:
初始信息预估模块,用于根据目标用户对目标视频所发表的评论,预估表示所述目标用户对所述目标视频情感倾向的初始信息;
混合程度确定模块,用于确定针对所述目标视频的评论中正向评论与负向评论间的第一混合程度;其中,所述第一混合程度表示针对所述目标视频的评论中正向评论与负向评论的分布情况;
差异度估算模块,用于根据所述目标用户对已评论视频所发表的评论和针对每一已评论视频的评论中正向评论与负向评论间的第二混合程度,估算所述目标用户对视频进行评论相对于其他用户对视频进行评论的差异度,其中,所述已评论视频为所述目标用户发表过评论的视频;所述第二混合程度表示每一已评论视频的评论中正向评论和负向评论的分布情况;
最终信息获得模块,用于采用所述第一混合程度和差异度对所述初始信息进行修正,得到表示所述目标用户对所述目标视频情感倾向的最终信息,其中,所述差异度越大,对初始信息的修正幅度越小。
10.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-8任一所述的方法步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-8任一所述的方法步骤。
CN202010406415.4A 2020-05-14 2020-05-14 一种用户情感倾向信息获得方法、装置及电子设备 Active CN111565322B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010406415.4A CN111565322B (zh) 2020-05-14 2020-05-14 一种用户情感倾向信息获得方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010406415.4A CN111565322B (zh) 2020-05-14 2020-05-14 一种用户情感倾向信息获得方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN111565322A CN111565322A (zh) 2020-08-21
CN111565322B true CN111565322B (zh) 2022-03-04

Family

ID=72071002

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010406415.4A Active CN111565322B (zh) 2020-05-14 2020-05-14 一种用户情感倾向信息获得方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN111565322B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114490952B (zh) * 2022-04-15 2022-07-15 广汽埃安新能源汽车有限公司 一种文本情感分析方法、装置、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104008091A (zh) * 2014-05-26 2014-08-27 上海大学 一种基于情感值的网络文本情感分析方法
CN106295702A (zh) * 2016-08-15 2017-01-04 西北工业大学 一种基于个体情感行为分析的社交平台用户分类方法
CN106599063A (zh) * 2016-11-15 2017-04-26 武汉璞华大数据技术有限公司 基于主题情感语义提取的细粒度观点挖掘方法
CN107491531A (zh) * 2017-08-18 2017-12-19 华南师范大学 基于集成学习框架的中文网络评论情感分类方法
CN109271512A (zh) * 2018-08-29 2019-01-25 中国平安保险(集团)股份有限公司 舆情评论信息的情感分析方法、装置及存储介质
CN110232181A (zh) * 2018-03-06 2019-09-13 优酷网络技术(北京)有限公司 评论分析方法及装置
CN110516249A (zh) * 2019-08-29 2019-11-29 新华三信息安全技术有限公司 一种情感倾向信息获得方法及装置
CN110569495A (zh) * 2018-06-05 2019-12-13 北京四维图新科技股份有限公司 一种基于用户评论的情感倾向分类方法、装置及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130013685A1 (en) * 2011-04-04 2013-01-10 Bagooba, Inc. Social Networking Environment with Representation of a Composite Emotional Condition for a User and/or Group of Users
CN109146625B (zh) * 2018-08-14 2022-04-26 中山大学 一种基于内容的多版本App更新评价方法及***
CN110825876B (zh) * 2019-11-07 2022-07-15 上海德拓信息技术股份有限公司 电影评论观点情感倾向性分析方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104008091A (zh) * 2014-05-26 2014-08-27 上海大学 一种基于情感值的网络文本情感分析方法
CN106295702A (zh) * 2016-08-15 2017-01-04 西北工业大学 一种基于个体情感行为分析的社交平台用户分类方法
CN106599063A (zh) * 2016-11-15 2017-04-26 武汉璞华大数据技术有限公司 基于主题情感语义提取的细粒度观点挖掘方法
CN107491531A (zh) * 2017-08-18 2017-12-19 华南师范大学 基于集成学习框架的中文网络评论情感分类方法
CN110232181A (zh) * 2018-03-06 2019-09-13 优酷网络技术(北京)有限公司 评论分析方法及装置
CN110569495A (zh) * 2018-06-05 2019-12-13 北京四维图新科技股份有限公司 一种基于用户评论的情感倾向分类方法、装置及存储介质
CN109271512A (zh) * 2018-08-29 2019-01-25 中国平安保险(集团)股份有限公司 舆情评论信息的情感分析方法、装置及存储介质
CN110516249A (zh) * 2019-08-29 2019-11-29 新华三信息安全技术有限公司 一种情感倾向信息获得方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于用户评论的深度情感分析和多视图协同融合的混合推荐方法;张宜浩等;《计算机学报》;20190630;第42卷(第6期);全文 *

Also Published As

Publication number Publication date
CN111565322A (zh) 2020-08-21

Similar Documents

Publication Publication Date Title
US11416536B2 (en) Content recommendation system
CN110929052B (zh) 多媒体资源推荐方法、装置、电子设备及存储介质
CN108322829B (zh) 个性化主播推荐方法、装置及电子设备
CN108875022B (zh) 一种视频推荐方法及装置
US9967628B2 (en) Rating videos based on parental feedback
CN108989889B (zh) 一种视频播放量预测方法、装置及电子设备
US20160189198A1 (en) Automated media campaign management system
US10775968B2 (en) Systems and methods for analyzing visual content items
CN111767429B (zh) 一种视频推荐方法、装置及电子设备
US20110145040A1 (en) Content recommendation
US20120036523A1 (en) Adaptive Blending of Recommendation Engines
CN109903086B (zh) 一种相似人群扩展方法、装置及电子设备
US20160379123A1 (en) Entertainment Prediction Favorites
CN112579913B (zh) 一种视频推荐方法、装置、设备和计算机可读存储介质
CN113656681B (zh) 一种对象评价方法、装置、设备及存储介质
Laiche et al. When machine learning algorithms meet user engagement parameters to predict video QoE
CN111062527A (zh) 一种视频集流量预测方法及装置
CN112487300A (zh) 一种视频推荐方法、装置、电子设备及存储介质
CN111565322B (zh) 一种用户情感倾向信息获得方法、装置及电子设备
CN109168044B (zh) 一种视频特征的确定方法及装置
CN111597380B (zh) 一种推荐视频确定方法、装置、电子设备及存储介质
CN112733014A (zh) 推荐方法、装置、设备及存储介质
CN110309361B (zh) 一种视频评分的确定方法、推荐方法、装置及电子设备
CN111353052B (zh) 一种多媒体对象推荐方法、装置、电子设备及存储介质
CN113313511A (zh) 一种视频流量预测方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant