CN107807941A - 信息处理方法和装置 - Google Patents

信息处理方法和装置 Download PDF

Info

Publication number
CN107807941A
CN107807941A CN201610816185.2A CN201610816185A CN107807941A CN 107807941 A CN107807941 A CN 107807941A CN 201610816185 A CN201610816185 A CN 201610816185A CN 107807941 A CN107807941 A CN 107807941A
Authority
CN
China
Prior art keywords
information
described information
credit
scoring
quality score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610816185.2A
Other languages
English (en)
Other versions
CN107807941B (zh
Inventor
陈培炫
李霖
段培
陈谦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201610816185.2A priority Critical patent/CN107807941B/zh
Publication of CN107807941A publication Critical patent/CN107807941A/zh
Application granted granted Critical
Publication of CN107807941B publication Critical patent/CN107807941B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种信息处理方法和装置,属于计算机和互联网技术领域。所述方法包括:获取目标用户帐号发送的信息;获取信息的质量评分和目标用户帐号的信用评分;其中,质量评分用于指示信息的质量状况,信用评分用于指示目标用户帐号的信用状况;根据质量评分和信用评分,确定对应于信息的处理方式。本发明解决了现有技术仅依据信息内容对信息进行甄别,所依据的参考信息较为单一,导致甄别结果的准确性较低的问题;在对信息进行甄别时,除从信息这一角度之外,还参考该信息的发送方用户的信用评分,结合参考信息和用户两方面因素对信息进行甄别,有助于提高甄别结果的准确性。

Description

信息处理方法和装置
技术领域
本发明实施例涉及计算机和互联网技术领域,特别涉及一种信息处理方法和装置。
背景技术
随着计算机和互联网技术的发展,终端中可安装各式各样的应用程序,以丰富终端的功能。例如,用户通过社交类应用程序可以与其他用户沟通互动,通过视频类应用程序可以观看视频、通过直播类应用程序可以观看在线视频直播,等等。
对于提供有信息收发功能的应用程序来说,对用户发送的信息进行甄别,以对该信息采取合理的处理方式是开发者需要考虑的问题。例如,对高质量的信息和低质量的信息进行甄别,允许高质量的信息正常发布,而将低质量的信息过滤(也即不发布)。在现有技术中,通常从信息内容角度,对用户发送的信息的内容进行分析,确定该信息的质量状况。例如,当用户发送的信息中包括低俗、暴力、辱骂性字词时,判定该信息为低质量信息。
在现有技术中,仅依据信息内容对信息进行甄别,所依据的参考信息较为单一,导致甄别结果的准确性较低。
发明内容
为了解决在现有技术中,仅依据信息内容对信息进行甄别,所依据的参考信息较为单一,导致甄别结果的准确性较低的问题,本发明实施例提供了一种信息处理方法和装置。所述技术方案如下:
第一方面,提供了一种信息处理方法,所述方法包括:
获取目标用户帐号发送的信息;
获取所述信息的质量评分和所述目标用户帐号的信用评分;其中,所述质量评分用于指示所述信息的质量状况,所述信用评分用于指示所述目标用户帐号的信用状况;
根据所述质量评分和所述信用评分,确定对应于所述信息的处理方式。
第二方面,提供了一种信息处理装置,所述装置包括:
信息获取模块,用于获取目标用户帐号发送的信息;
质量评分获取模块,用于获取所述信息的质量评分,所述质量评分用于指示所述信息的质量状况;
信用评分获取模块,用于获取所述目标用户帐号的信用评分,所述信用评分用于指示所述目标用户帐号的信用状况;
方式确定模块,用于根据所述质量评分和所述信用评分,确定对应于所述信息的处理方式。
本发明实施例提供的技术方案带来的有益效果包括:
通过在获取到目标用户帐号发送的信息之后,获取信息的质量评分和目标用户帐号的信用评分,根据质量评分和信用评分确定对应于该信息的处理方式;解决了现有技术仅依据信息内容对信息进行甄别,所依据的参考信息较为单一,导致甄别结果的准确性较低的问题;在对信息进行甄别时,除从信息这一角度之外,还参考该信息的发送方用户的信用评分,结合参考信息和用户两方面因素对信息进行甄别,有助于提高甄别结果的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的信息处理方法的流程图;
图2是本发明另一实施例提供的信息处理方法的流程图;
图3是本发明另一实施例提供的信息处理方法的流程图;
图4是本发明一个实施例提供的信息处理装置的框图;
图5是本发明一个实施例提供的服务器的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
在对本发明实施例进行详细说明之前,首先对本发明实施例中涉及的一些概念进行如下解释:
1、信用评分
信用评分用于指示用户的信用状况,是指用于表征用户的信用状况的评价分值。例如,信用评分与用户的信用状况呈正相关关系,信用分值越高表示用户的信用状况越好,信用分值越低表示用户的信用状况越差。在本发明实施例中,对于信用评分的计分方式不作限定,例如可以是百分制,也可是十分制,或者是归一化方式,等等。
信用评分可根据用户的特征信息确定。用户的特征信息是指能够反映用户的信用状况的个人信息。例如,上述特征信息包括但不限于以下至少一项:社交信息、金融信息、行为信息、身份信息。社交信息是指与用户社交情况相关的信息,如用户所属的社交圈子、在社交应用中发表的信息、在社交应用中的基本资料等。社交信息可以从社交应用平台获取。金融信息是指与用户经济情况相关的信息,如银行借贷数据、银行卡消费记录、网络购物信息、在线支付信息等。金融信息可以从银行、网络购物应用平台、支付平台等获取。行为信息是指与用户个人行为相关的信息,如线上行为数据、线下行为数据等。身份信息是指与用户个人身份相关的信息,如年龄、性别、学历、工作等。当然,上述各项特征信息仅是示例性的,在实际应用中,还可选择其它能够反映用户的信用状况的个人信息作为特征信息。
2、质量评分
质量评分用于指示信息的质量状况,是指用于表征信息的质量状况的评价分值。在本发明实施例中,对于质量评分的计分方式不作限定,例如可以是百分制,也可是十分制,或者是归一化方式,等等。
在一个示例中,质量评分为敏感度评分。敏感度评分与信息的质量状况呈负相关关系,敏感度评分越高表示信息的质量状况越差,敏感度评分越低表示信息的质量状况越好。敏感度评分可根据信息中包含的敏感字词确定。敏感字词是指对信息的质量状况有不利影响的字词,如低俗、暴力、辱骂性字词等。
在另一示例中,质量评分为价值评分。价值评分与信息的质量状况呈正相关关系,价值评分越高表示信息的质量状况越好,价值评分越低表示信息的质量状况越差。价值评分可根据信息的有价值特征确定。有价值特征是指对信息的质量状况有有利影响的特征,如信息所属的分类、信息与当前的用户交互场景之间的相关度等。
本发明实施例提供的方法,各步骤的执行主体可以是服务器。例如,该服务器可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心。为了便于描述,在下述各个方法实施例中,仅以各步骤的执行主体为服务器进行举例说明,但对此不构成限定。
另外,本发明实施例提供的方法,可应用于任何信息发布的应用场景,如向联系人发送消息、发布个人动态信息、发布朋友圈消息、发送弹幕消息、发表评论信息,等等。
请参考图1,其示出了本发明一个实施例提供的信息处理方法的流程图。该方法可以包括如下几个步骤。
步骤101,获取目标用户帐号发送的信息。
目标用户帐号是目标用户在目标应用中的身份标识。在本发明实施例中,对目标应用的具体种类不作限定,目标应用可以是任何具备信息收发功能的应用程序,如社交应用、即时通信应用、视频类应用、直播类应用等。
例如,当目标应用是社交应用或即时通信应用时,目标用户帐号发送的信息可以是向其它用户帐号发送的通信消息,也可以是目标用户帐号发布的个人动态信息、朋友圈消息。又例如,当目标应用是视频类应用或直播类应用时,目标用户帐号发送的信息可以是弹幕消息,也可以是评论信息。
步骤102,获取信息的质量评分和目标用户帐号的信用评分。
质量评分用于指示信息的质量状况。信用评分用于指示目标用户帐号的信用状况。有关质量评分和信用评分的介绍可参见上文,此处不再赘述。
在一个示例中,采用如下方式获取信息的质量评分:
1、识别信息中包含的敏感字词;
2、根据各个敏感字词对应的敏感度评分,计算信息的敏感度评分。
其中,信息的敏感度评分与信息的质量状况呈负相关关系。有关敏感度评分的介绍可参见上文,此处不再赘述。在实际应用中,可预先设定敏感字词库,该敏感自词库中包括若干个预先设定的敏感字词,且每一个敏感字词设定有对应的敏感度评分。服务器可采用分词算法、关键字识别算法、语义分析算法等,识别信息中包含的敏感字词。在一种可能的实施方式中,服务器将各个敏感词对应的敏感度评分相加,得到信息的敏感度评分。也即,假设从信息中识别出的敏感字词的数量为n,则信息的敏感度评分其中,ai表示第i个敏感字词对应的敏感度评分,n为正整数。另外,如果从信息中未识别出敏感字词,则信息的敏感度评分可记为0。在另一种可能的实施方式中,服务器将各个敏感词对应的敏感度评分相加,并将相加得到的求和结果除以信息长度,得到信息的敏感度评分。其中,信息长度可以信息中包含的字数或者字符数表示。也即,假设从信息中识别出的敏感字词的数量为n,则信息的敏感度评分其中,ai表示第i个敏感字词对应的敏感度评分,k表示信息长度,n和k均为正整数。另外,如果从信息中未识别出敏感字词,则信息的敏感度评分可记为0。
在另一示例中,采用如下方式获取信息的质量评分:
1、获取信息所属的分类;
在实际应用中,可预先设定多个信息类别。针对不同的用户交互场景,所设定的信息类别也有所不同。用户交互场景是指用户发送信息时与应用之间的交互场景,如即时通信、发布朋友圈消息、在观看在线视频或直播时发送弹幕消息、在观看在线视频或直播时发送评论信息,等等。以用户交互场景为观看在线视频时发送弹幕消息为例,所设定的信息类别可根据视频类别进行确定,如包括体育类、综艺类、电视剧类、电影类、动漫类,等等。又例如,以用户交互场景为发布朋友圈消息时,所设定的信息类别可包括个人动态类、广告宣传类、内容转发类,等等。通过采用相关的自然语言处理方法对信息进行分析,例如分析信息中的关键字词或语义,可确定信息所属的分类。可选地,对于不同的信息类别,预先设定对应的价值评分。
2、获取信息与当前的用户交互场景之间的相关度;
信息与当前的用户交互场景之间的相关度与信息的价值评分呈正相关关系,相关度越高则价值评分也越高,相关度越低则价值评分也越低。
在实际应用中,可采用机器学习算法构建相关度计算模型。相关度计算模型的输入参数为从信息中提取的特征和从当前的用户交互场景中提取的特征,相关度计算模型的输出结果为信息与当前的用户交互场景之间的相关度。
以当前的用户交互场景为观看在线视频为例,信息的特征可采用相关的自然语言处理方法对信息进行分析得到,例如分析信息中的关键字词或语义作为信息的特征;当前的用户交互场景的特征可以对当前播放的视频的标题、描述(如简介)、评论或视频内容等进行分析,得到视频的主题作为当前的用户交互场景的特征。
3、根据信息所属的分类和相关度,计算信息的价值评分;
其中,信息的价值评分与信息的质量状况呈正相关关系。有关价值评分的介绍可参见上文,此处不再赘述。可选地,根据信息所属的分类对应的价值评分和相关度,采用加权求和算法计算信息的价值评分。
在一个示例中,采用如下方式获取目标用户帐号的信用评分:
1、获取目标用户帐号的特征信息;
2、根据目标用户帐号的特征信息,计算目标用户帐号的信用评分。
特征信息包括但不限于以下至少一项:社交信息、金融信息、行为信息、身份信息。有关上述各项特征信息的介绍可参见上文,此处不再赘述。在实际应用中,可采用机器学习(Machine Learning,ML)算法构建信用评分计算模型。信用评分计算模型的输入参数为用户帐号的特征信息,输出结果为用户帐号的信用评分。在本发明实施例中,对机器学习算法的具体种类不作限定,例如可采用回归决策树算法、逻辑回归算法、随机森林算法、神经网络算法、深度学习算法,等等。通过一定数量的训练样本对信用评分计算模型进行训练,而后采用训练完成的模型根据用户帐号的特征信息预测对应的信用评分。另外,在其它可能的实施方式中,也可直接从已有的信用评分库中获取目标用户帐号的信用评分。
步骤103,根据质量评分和信用评分,确定对应于信息的处理方式。
可选地,对应于信息的处理方式包括:过滤信息(也即不发布该信息)和不过滤信息(也即正常发布该信息)。在实际应用中,可预先设定多种不同的处理方式。针对不同的用户交互场景,所设定的处理方式也有所不同。
在一个示例中,步骤103包括如下几个子步骤:
1、从多个质量类别中,确定质量评分所属的质量类别;
2、从多个信用类别中,确定信用评分所属的信用类别;
3、根据质量评分所属的质量类别和信用评分所属的信用类别,采用决策矩阵确定对应于信息的处理方式。
在实际应用中,预先设定多个质量类别,每一个质量类别对应于一个质量评分的取值范围;预先设定多个信用类别,每一个信用类别对应于一个信用评分的取值范围。在本发明实施例中,对类别的数量,以及每一个类别对应的评分的取值范围均不作限定,其可根据实际情况进行设定。
示例性地,假设预先设定3个质量类别,该3个质量类别对应的质量评分的取值范围如下表-1所示:
质量类别 质量评分的取值范围(记质量评分为S)
1 S<第一门限值
2 第一门限值≤S≤第二门限值
3 S>第二门限值
表-1
假设预先设定3个信用类别,该3个信用类别对应的信用评分的取值范围如下表-2所示:
信用类别 信用评分的取值范围(记信用评分为T)
1 T<第三门限值
2 第三门限值≤T≤第三门限值
3 T>第四门限值
表-2
可选地,决策矩阵的行对应m个信用类别,且列对应n个质量类别,决策矩阵的第i行第j列中的项用于指示第i个信用类别和第j个质量类别对应的处理方式;或者,决策矩阵的行对应于n个质量类别,且列对应m个信用类别,决策矩阵的第i行第j列中的项用于指示第i个质量类别和第j个信用类别对应的处理方式;其中,m为预先设定的信用类别的数量,n为预先设定的质量类别的数量,m、n均为大于1的整数。
示例性地,决策矩阵可如下表-3所示:
表-3
例如,当信息的质量评分属于质量类别2,目标用户帐号的信用评分属于信用类别1时,根据上述决策矩阵,可确定对应于该信息的处理方为过滤。
在另一示例中,步骤103包括如下几个子步骤:
1、根据质量评分和信用评分,计算信息的综合评分;
可选地,预先设定质量评分对应的权重和信用评分对应的权重,采用加权求和算法计算信息的综合评分。例如,信息的综合评分E=a×S+b×T;其中,a表示质量评分对应的权重,b表示信用评分对应的权重,S表示质量评分,T表示信用评分。可选地,a+b=1,且a、b均为正数。
2、根据综合评分确定对应于信息的处理方式。
可选地,从多个综合评分类别中,确定综合评分所属的综合评分类别;查询预设对应关系,获取与综合评分所属的综合评分类别对应的处理方式。其中,预设对应关系包括综合评分类别与处理方式之间的对应关系。在实际应用中,预先设定多个综合评分类别,每一个综合评分类别对应于一个综合评分的取值范围。
可选地,当对应于信息的处理方式包括过滤和不过滤时,本实施例提供的方法还包括如下步骤:
第一,检测目标用户帐号是否符合预设条件;
第二,若目标用户帐号符合预设条件,则在根据质量评分和信用评分确定不过滤信息的情况下,抽样过滤该信息。
其中,预设条件包括:目标用户帐号的信用评分小于第一阈值和/或目标用户帐号在目标时段内发送的信息数量大于第二阈值。对信息进行抽样过滤,是指选择性地过滤掉信息。抽样概率可预先设定,假设抽样概率设定为90%,则采用抽样过滤方式对信息进行过滤时,过滤掉该信息的概率为90%,不过滤掉该信息的概率为10%。对于一些信用状况较差的用户和/或频繁发送信息的用户,在采用上述步骤101-103确定出对其发送的信息的处理方式为不过滤时,进一步采用上述抽样过滤方式,选择性地过滤掉该用户发送的信息,可进一步提高对低质量信息的过滤效果,提高***整体性能。
需要补充说明的一点是,在实际应用中,信息的质量评分和目标用户帐号的信用评分可并行(也即同时)获取,也可依次先后获取。在一种可能的实施方式中,上述步骤102包括如下几个子步骤:
1、获取信息的质量评分;
2、检测信息的质量评分是否属于预设取值范围;
3、若信息的质量评分属于预设取值范围,则获取目标用户帐号的信用评分。
例如,当质量评分为敏感度评分时,检测信息的敏感度评分是否小于第一预设分值,若信息的敏感度评分小于第一预设分值,则获取目标用户帐号的信用评分。又例如,当质量评分为价值评分时,检测信息的价值评分是否大于第二预设分值,若信息的价值评分大于第二预设分值,则获取目标用户帐号的信用评分。
可选地,若信息的质量评分不属于预设取值范围,则过滤该信息。例如,当质量评分为敏感度评分时,若信息的敏感度评分大于第一预设分值,则过滤该信息。又例如,当质量评分为价值评分时,若信息的价值评分小于第二预设分值,则过滤该信息。
通过上述方式,对于一些低质量信息直接过滤,可省去后续获取信用评分以及根据质量评分和信用评分决策对该信息所做的处理的步骤,有助于节省处理开销。
综上所述,本实施例提供的方法,通过在获取到目标用户帐号发送的信息之后,获取信息的质量评分和目标用户帐号的信用评分,根据质量评分和信用评分确定对应于该信息的处理方式;解决了现有技术仅依据信息内容对信息进行甄别,所依据的参考信息较为单一,导致甄别结果的准确性较低的问题;在对信息进行甄别时,除从信息这一角度之外,还参考该信息的发送方用户的信用评分,结合参考信息和用户两方面因素对信息进行甄别,有助于提高甄别结果的准确性。
另外,在本发明实施例中,提供了两种获取信息的质量评分的方式,采用敏感度评分的方式从识别低质量信息的角度分析信息的质量状况,采用价值评分的方式从识别高质量信息的角度分析信息的质量状况,在实际应用中,可根据用户交互场景选择适用的方式。
请参考图2,其示出了本发明另一实施例提供的信息处理方法的流程图。在本实施例中,以信息为用户在社交应用/即时通信应用中发送的通信消息为例,对本发明提供的技术方案进行介绍和说明。该方法可以包括如下几个步骤。
步骤201,获取目标用户帐号发送的信息。
在本实施例中,信息是用户在社交应用或者即时通信应用中向其它用户发送的通信消息。例如,信息可以是用户在匿名社交应用中向其它用户发送的匿名消息。
步骤202,获取信息的敏感度评分和目标用户帐号的信用评分。
有关信用评分和敏感度评分的介绍和获取方式可参见上文,此处不再赘述。
在一个示例中,步骤202包括:
1、获取信息的敏感度评分;
2、检测信息的敏感度评分是否小于第一预设分值;
3、若信息的敏感度评分小于第一预设分值,则获取目标用户帐号的信用评分。
可选地,若信息的敏感度评分大于第一预设分值,则过滤该信息。
步骤203,从多个敏感度类别中,确定敏感度评分所属的敏感度类别;从多个信用类别中,确定信用评分所属的信用类别。
在实际应用中,预先设定多个敏感度类别,每一个敏感度类别对应于一个敏感度评分的取值范围;预先设定多个信用类别,每一个信用类别对应于一个信用评分的取值范围。在本发明实施例中,对类别的数量,以及每一个类别对应的评分的取值范围均不作限定,其可根据实际情况进行设定。
步骤204,根据敏感度评分所属的敏感度类别和信用评分所属的信用类别,采用决策矩阵确定对应于信息的处理方式。
对应于信息的处理方式包括:过滤信息(也即不发布该信息)和不过滤信息(也即正常发布该信息)。可选地,对应于信息的处理方式还包括:小范围发布、不过滤但加提示,等等。其中,小范围发布的处理方式,是指向部分用户正常发布该信息,比如仅向部分信息甄别能力较强的用户(如年龄在18-40岁的用户)正常发布该信息。不过滤但加提示的处理方式,是指正常发布该信息,但对应显示提示信息,该提示信息用于提示该信息可能为低质量信息,如存在诈骗风险、安全风险、存在不文明用语等。
在本实施例中,结合用户的信用评分和信息的敏感度评分两方面因素,对用户在社交应用/即时通信应用中发送的通信消息进行甄别,对于一些低质量信息,可采用小范围发布、不过滤但加提示,甚至过滤的处理方式,能够有效遏制低质量信息的传播。
请参考图3,其示出了本发明另一实施例提供的信息处理方法的流程图。在本实施例中,以信息为用户在视频类应用/直播类应用中发送的弹幕消息为例,对本发明提供的技术方案进行介绍和说明。该方法可以包括如下几个步骤。
步骤301,获取目标用户帐号发送的信息。
在本实施例中,信息是用户在视频类应用/直播类应用中发送的弹幕消息。
步骤302,获取信息的价值评分和目标用户帐号的信用评分。
有关信用评分和价值评分的介绍和获取方式可参见上文,此处不再赘述。
在一个示例中,步骤302包括:
1、获取信息的价值评分;
2、检测信息的价值评分是否大于第二预设分值;
3、若信息的价值评分大于第二预设分值,则获取目标用户帐号的信用评分。
可选地,若信息的价值评分小于第二预设分值,则过滤该信息。
步骤303,根据价值评分和信用评分,计算信息的综合评分。
步骤304,根据综合评分确定对应于信息的处理方式。
对应于信息的处理方式包括:过滤信息(也即不发布该信息)和不过滤信息(也即正常发布该信息)。可选地,对应于信息的处理方式还包括:以不同的显示方式显示该信息。例如,以不同的字体、颜色、显示位置,对弹幕消息进行显示。对于综合评分较高的弹幕消息,可以大字体、高亮、屏幕中间位置显示等显示方式进行显示;对于综合评分较低的弹幕消息,可以小字体、屏幕边缘位置等显示方式进行显示,甚至过滤不显示。
在本实施例中,结合用户的信用评分和信息的价值评分两方面因素,对用户在视频类应用/直播类应用中发送的弹幕消息进行甄别,能够有效过滤掉一些垃圾弹幕消息,有助于构建良好的弹幕环境。
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
请参考图4,其示出了本发明一个实施例提供的信息处理装置的框图。该装置具有实现上述方法示例的功能,所述功能可以由硬件实现,也可由硬件执行相应的软件实现。该装置可以包括:信息获取模块410、质量评分获取模块420、信用评分获取模块430和方式确定模块440。
信息获取模块410,用于执行上述步骤101。
质量评分获取模块420,用于获取信息的质量评分。
信用评分获取模块430,用于获取目标用户帐号的信用评分。
方式确定模块440,用于执行上述步骤103。
在一个示例中,方式确定模块440,包括:质量类别确定单元,用于从多个质量类别中,确定质量评分所属的质量类别;信用类别确定单元,用于从多个信用类别中,确定信用评分所属的信用类别;处理方式确定单元,用于根据质量评分所属的质量类别和信用评分所属的信用类别,采用决策矩阵确定对应于信息的处理方式。
在另一示例中,方式确定模块440,包括:评分计算单元,用于根据质量评分和信用评分,计算信息的综合评分;方式确定单元,用于根据综合评分确定对应于信息的处理方式。
可选地,所述装置还包括:质量评分检测模块,用于检测信息的质量评分是否属于预设取值范围。信用评分获取模块430,还用于若信息的质量评分属于预设取值范围,则获取目标用户帐号的信用评分。
可选地,所述装置还包括:信息过滤模块,用于若信息的质量评分不属于预设取值范围,则过滤所述信息。
在一个示例中,质量评分获取模块,包括:敏感字词识别单元,用于识别信息中包含的敏感字词;敏感评分计算单元,用于根据各个敏感字词对应的敏感度评分,计算信息的敏感度评分。
在另一示例中,质量评分获取模块,包括:信息分类获取单元,用于获取信息所属的分类;相关度获取单元,用于获取信息与当前的用户交互场景之间的相关度;价值评分计算单元,用于根据信息所属的分类和相关度,计算信息的价值评分。
在一个示例中,信用评分获取模块,包括:特征信息获取单元,用于获取目标用户帐号的特征信息;信用评分计算单元,用于根据目标用户帐号的特征信息,计算目标用户帐号的信用评分。
相关细节可结合参考上述方法实施例。
需要说明的是:上述实施例提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
请参考图5,其示出了本发明一个实施例提供的服务器的结构示意图。该服务器用于实施上述实施例中提供的信息处理方法。具体来讲:
所述服务器500包括中央处理单元(CPU)501、包括随机存取存储器(RAM)502和只读存储器(ROM)503的***存储器504,以及连接***存储器504和中央处理单元501的***总线505。所述服务器500还包括帮助计算机内的各个器件之间传输信息的基本输入/输出***(I/O***)506,和用于存储操作***513、应用程序514和其他程序模块515的大容量存储设备507。
所述基本输入/输出***506包括有用于显示信息的显示器508和用于用户输入信息的诸如鼠标、键盘之类的输入设备509。其中所述显示器508和输入设备509都通过连接到***总线505的输入输出控制器510连接到中央处理单元501。所述基本输入/输出***506还可以包括输入输出控制器510以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器510还提供输出到显示屏、打印机或其他类型的输出设备。
所述大容量存储设备507通过连接到***总线505的大容量存储控制器(未示出)连接到中央处理单元501。所述大容量存储设备507及其相关联的计算机可读介质为服务器500提供非易失性存储。也就是说,所述大容量存储设备507可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。
不失一般性,所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的***存储器504和大容量存储设备507可以统称为存储器。
根据本发明的各种实施例,所述服务器500还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器500可以通过连接在所述***总线505上的网络接口单元511连接到网络512,或者说,也可以使用网络接口单元511来连接到其他类型的网络或远程计算机***(未示出)。
所述存储器还包括一个或者一个以上的程序,所述一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行。上述一个或者一个以上程序包含用于执行上述方法的指令。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (16)

1.一种信息处理方法,其特征在于,所述方法包括:
获取目标用户帐号发送的信息;
获取所述信息的质量评分和所述目标用户帐号的信用评分;其中,所述质量评分用于指示所述信息的质量状况,所述信用评分用于指示所述目标用户帐号的信用状况;
根据所述质量评分和所述信用评分,确定对应于所述信息的处理方式。
2.根据权利要求1所述的方法,其特征在于,所述根据所述质量评分和所述信用评分,确定对应于所述信息的处理方式,包括:
从多个质量类别中,确定所述质量评分所属的质量类别;
从多个信用类别中,确定所述信用评分所属的信用类别;
根据所述质量评分所属的质量类别和所述信用评分所属的信用类别,采用决策矩阵确定对应于所述信息的处理方式。
3.根据权利要求1所述的方法,其特征在于,所述根据所述质量评分和所述信用评分,确定对应于所述信息的处理方式,包括:
根据所述质量评分和所述信用评分,计算所述信息的综合评分;
根据所述综合评分确定对应于所述信息的处理方式。
4.根据权利要求1所述的方法,其特征在于,所述获取所述信息的质量评分和所述目标用户帐号的信用评分,包括:
获取所述信息的质量评分;
检测所述信息的质量评分是否属于预设取值范围;
若所述信息的质量评分属于所述预设取值范围,则获取所述目标用户帐号的信用评分。
5.根据权利要求4所述的方法,其特征在于,所述检测所述信息的质量评分是否属于预设取值范围之后,还包括:
若所述信息的质量评分不属于所述预设取值范围,则过滤所述信息。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述获取所述信息的质量评分,包括:
识别所述信息中包含的敏感字词;
根据各个所述敏感字词对应的敏感度评分,计算所述信息的敏感度评分;
其中,所述信息的敏感度评分与所述信息的质量状况呈负相关关系。
7.根据权利要求1至5任一项所述的方法,其特征在于,所述获取所述信息的质量评分,包括:
获取所述信息所属的分类;
获取所述信息与当前的用户交互场景之间的相关度;
根据所述信息所属的分类和所述相关度,计算所述信息的价值评分;
其中,所述信息的价值评分与所述信息的质量状况呈正相关关系。
8.根据权利要求1至5任一项所述的方法,其特征在于,所述获取所述目标用户帐号的信用评分,包括:
获取所述目标用户帐号的特征信息;其中,所述特征信息包括以下至少一项:社交信息、金融信息、行为信息、身份信息;
根据所述目标用户帐号的特征信息,计算所述目标用户帐号的信用评分。
9.一种信息处理装置,其特征在于,所述装置包括:
信息获取模块,用于获取目标用户帐号发送的信息;
质量评分获取模块,用于获取所述信息的质量评分,所述质量评分用于指示所述信息的质量状况;
信用评分获取模块,用于获取所述目标用户帐号的信用评分,所述信用评分用于指示所述目标用户帐号的信用状况;
方式确定模块,用于根据所述质量评分和所述信用评分,确定对应于所述信息的处理方式。
10.根据权利要求9所述的装置,其特征在于,所述方式确定模块,包括:
质量类别确定单元,用于从多个质量类别中,确定所述质量评分所属的质量类别;
信用类别确定单元,用于从多个信用类别中,确定所述信用评分所属的信用类别;
处理方式确定单元,用于根据所述质量评分所属的质量类别和所述信用评分所属的信用类别,采用决策矩阵确定对应于所述信息的处理方式。
11.根据权利要求9所述的装置,其特征在于,所述方式确定模块,包括:
评分计算单元,用于根据所述质量评分和所述信用评分,计算所述信息的综合评分;
方式确定单元,用于根据所述综合评分确定对应于所述信息的处理方式。
12.根据权利要求9所述的装置,其特征在于,所述装置还包括:
质量评分检测模块,用于检测所述信息的质量评分是否属于预设取值范围;
信用评分获取模块,还用于若所述信息的质量评分属于所述预设取值范围,则获取所述目标用户帐号的信用评分。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括:
信息过滤模块,用于若所述信息的质量评分不属于所述预设取值范围,则过滤所述信息。
14.根据权利要求9至13任一项所述的装置,其特征在于,所述质量评分获取模块,包括:
敏感字词识别单元,用于识别所述信息中包含的敏感字词;
敏感评分计算单元,用于根据各个所述敏感字词对应的敏感度评分,计算所述信息的敏感度评分;
其中,所述信息的敏感度评分与所述信息的质量状况呈负相关关系。
15.根据权利要求9至13任一项所述的装置,其特征在于,所述质量评分获取模块,包括:
信息分类获取单元,用于获取所述信息所属的分类;
相关度获取单元,用于获取所述信息与当前的用户交互场景之间的相关度;
价值评分计算单元,用于根据所述信息所属的分类和所述相关度,计算所述信息的价值评分;
其中,所述信息的价值评分与所述信息的质量状况呈正相关关系。
16.根据权利要求9至13任一项所述的装置,其特征在于,所述信用评分获取模块,包括:
特征信息获取单元,用于获取所述目标用户帐号的特征信息;其中,所述特征信息包括以下至少一项:社交信息、金融信息、行为信息、身份信息;
信用评分计算单元,用于根据所述目标用户帐号的特征信息,计算所述目标用户帐号的信用评分。
CN201610816185.2A 2016-09-09 2016-09-09 信息处理方法和装置 Active CN107807941B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610816185.2A CN107807941B (zh) 2016-09-09 2016-09-09 信息处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610816185.2A CN107807941B (zh) 2016-09-09 2016-09-09 信息处理方法和装置

Publications (2)

Publication Number Publication Date
CN107807941A true CN107807941A (zh) 2018-03-16
CN107807941B CN107807941B (zh) 2019-07-02

Family

ID=61569761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610816185.2A Active CN107807941B (zh) 2016-09-09 2016-09-09 信息处理方法和装置

Country Status (1)

Country Link
CN (1) CN107807941B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108540864A (zh) * 2018-04-13 2018-09-14 上海哔哩哔哩科技有限公司 网络视频弹幕云屏蔽方法、***及存储介质
CN108833962A (zh) * 2018-05-25 2018-11-16 咪咕音乐有限公司 一种显示信息处理方法及装置和存储介质
CN109033266A (zh) * 2018-07-09 2018-12-18 北京三快在线科技有限公司 信息投放方法、装置、电子设备及计算机可读介质
CN109831682A (zh) * 2018-12-28 2019-05-31 广州华多网络科技有限公司 信息审核方法、装置、电子设备及存储介质
CN110120912A (zh) * 2019-05-10 2019-08-13 腾讯科技(深圳)有限公司 富媒体内容处理方法、装置、可读存储介质和计算机设备
CN110830834A (zh) * 2018-08-09 2020-02-21 北京优酷科技有限公司 弹幕信息颜色的调整方法及装置
CN111031329A (zh) * 2018-10-10 2020-04-17 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN111107380A (zh) * 2018-10-10 2020-05-05 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN111949876A (zh) * 2020-08-14 2020-11-17 北京字节跳动网络技术有限公司 信息处理方法及装置、电子设备和计算机可读存储介质
CN112243156A (zh) * 2019-07-18 2021-01-19 腾讯科技(深圳)有限公司 弹幕显示方法和装置及存储介质
CN113139025A (zh) * 2021-05-14 2021-07-20 恒安嘉新(北京)科技股份公司 一种威胁情报的评价方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101132590A (zh) * 2007-07-27 2008-02-27 ***通信集团江苏有限公司 基于客户感知的通信网络软质量提升方法
CN102291369A (zh) * 2010-06-21 2011-12-21 上海薄荷信息科技有限公司 一种确认垃圾信息设置的控制方法以及相应的控制装置
CN102902675A (zh) * 2011-07-26 2013-01-30 腾讯科技(深圳)有限公司 图片内容审核方法和装置
CN105635080A (zh) * 2014-11-12 2016-06-01 江苏威盾网络科技有限公司 一种基于内容过滤的电子邮件安全管理***和方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101132590A (zh) * 2007-07-27 2008-02-27 ***通信集团江苏有限公司 基于客户感知的通信网络软质量提升方法
CN102291369A (zh) * 2010-06-21 2011-12-21 上海薄荷信息科技有限公司 一种确认垃圾信息设置的控制方法以及相应的控制装置
CN102902675A (zh) * 2011-07-26 2013-01-30 腾讯科技(深圳)有限公司 图片内容审核方法和装置
CN105635080A (zh) * 2014-11-12 2016-06-01 江苏威盾网络科技有限公司 一种基于内容过滤的电子邮件安全管理***和方法

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108540864A (zh) * 2018-04-13 2018-09-14 上海哔哩哔哩科技有限公司 网络视频弹幕云屏蔽方法、***及存储介质
CN108833962A (zh) * 2018-05-25 2018-11-16 咪咕音乐有限公司 一种显示信息处理方法及装置和存储介质
CN109033266A (zh) * 2018-07-09 2018-12-18 北京三快在线科技有限公司 信息投放方法、装置、电子设备及计算机可读介质
CN110830834A (zh) * 2018-08-09 2020-02-21 北京优酷科技有限公司 弹幕信息颜色的调整方法及装置
CN111031329A (zh) * 2018-10-10 2020-04-17 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN111107380A (zh) * 2018-10-10 2020-05-05 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN111107380B (zh) * 2018-10-10 2023-08-15 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN111031329B (zh) * 2018-10-10 2023-08-15 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN109831682B (zh) * 2018-12-28 2021-07-23 广州方硅信息技术有限公司 信息审核方法、装置、电子设备及存储介质
CN109831682A (zh) * 2018-12-28 2019-05-31 广州华多网络科技有限公司 信息审核方法、装置、电子设备及存储介质
CN110120912A (zh) * 2019-05-10 2019-08-13 腾讯科技(深圳)有限公司 富媒体内容处理方法、装置、可读存储介质和计算机设备
CN112243156B (zh) * 2019-07-18 2022-11-08 腾讯科技(深圳)有限公司 弹幕显示方法和装置及存储介质
CN112243156A (zh) * 2019-07-18 2021-01-19 腾讯科技(深圳)有限公司 弹幕显示方法和装置及存储介质
CN111949876A (zh) * 2020-08-14 2020-11-17 北京字节跳动网络技术有限公司 信息处理方法及装置、电子设备和计算机可读存储介质
CN113139025A (zh) * 2021-05-14 2021-07-20 恒安嘉新(北京)科技股份公司 一种威胁情报的评价方法、装置、设备及存储介质
CN113139025B (zh) * 2021-05-14 2024-06-07 恒安嘉新(北京)科技股份公司 一种威胁情报的评价方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN107807941B (zh) 2019-07-02

Similar Documents

Publication Publication Date Title
CN107807941B (zh) 信息处理方法和装置
CN110009174B (zh) 风险识别模型训练方法、装置及服务器
CN106803168B (zh) 一种异常转账侦测方法和装置
CN111507831A (zh) 信贷风险自动评估方法和装置
CN110689438A (zh) 企业类金融风险评分方法、装置、计算机设备及存储介质
CN111461216A (zh) 一种基于机器学习的案件风险识别方法
CN110084468B (zh) 一种风险识别方法及装置
CN110008336B (zh) 一种基于深度学习的舆情预警方法及***
US20190392295A1 (en) Information processing device, method, and program that use deep learning
CN112419029B (zh) 类金融机构风险监控方法、风险模拟***及存储介质
CN112801498A (zh) 风险识别模型的训练方法、风险识别方法、装置及设备
CN112232944B (zh) 一种评分卡创建方法、装置和电子设备
CN111476653A (zh) 一种风险信息识别、确定、模型训练方法及装置
CN113342972A (zh) 舆情识别模型训练方法、***以及舆情风险监测方法和***
Sun The incremental informativeness of the sentiment of conference calls for internal control material weaknesses
CN113011884A (zh) 账户特征的提取方法、装置、设备及可读存储介质
Perez et al. I Call BS: Fraud detection in crowdfunding campaigns
Macanovic et al. The moral embeddedness of cryptomarkets: text mining feedback on economic exchanges on the dark web
Reddy et al. CNN-Bidirectional LSTM based Approach for Financial Fraud Detection and Prevention System
CN112766824A (zh) 数据处理方法、装置、电子设备及存储介质
CN112634048A (zh) 一种反洗钱模型的训练方法及装置
CN113283979A (zh) 一种贷款申请人的贷款信用评估方法、装置及存储介质
CN111914542A (zh) 疑似非法集资市场主体识别方法、装置、终端及存储介质
CN113706258A (zh) 基于组合模型的产品推荐方法、装置、设备及存储介质
CN113051396A (zh) 文档的分类识别方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant