CN113312504A - 一种内容审核项目的管理方法、装置、设备及介质 - Google Patents

一种内容审核项目的管理方法、装置、设备及介质 Download PDF

Info

Publication number
CN113312504A
CN113312504A CN202110867538.2A CN202110867538A CN113312504A CN 113312504 A CN113312504 A CN 113312504A CN 202110867538 A CN202110867538 A CN 202110867538A CN 113312504 A CN113312504 A CN 113312504A
Authority
CN
China
Prior art keywords
audit
data
auditing
engine
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110867538.2A
Other languages
English (en)
Inventor
白世杰
赵宇航
郑榕
伭剑辉
王秋明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yuanjian Information Technology Co Ltd
Original Assignee
Beijing Yuanjian Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yuanjian Information Technology Co Ltd filed Critical Beijing Yuanjian Information Technology Co Ltd
Priority to CN202110867538.2A priority Critical patent/CN113312504A/zh
Publication of CN113312504A publication Critical patent/CN113312504A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/44Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种内容审核项目的管理方法、装置、设备及介质,该方法包括:获取待审核的审核样本;所述审核样本包括审核要求和至少一个审核数据;基于所述审核样本生成对应的审核项目;所述审核项目中包括审核人员、审核引擎、审核流程和审核类别;基于所述审核项目生成对应的审核结果,并将所述审核结果发送给客户端。根据所述方法和装置,解决了现有技术中无法对审核项目进行高效管理的问题,提高了审核项目的管理效率,进而提高了数据审核的效率。

Description

一种内容审核项目的管理方法、装置、设备及介质
技术领域
本申请涉及多媒体技术领域,具体而言,涉及一种内容审核项目的管理方法、装置、设备及介质。
背景技术
随着互联网及媒体制作技术的不断发展,信息内容的形式已经从简单到复杂,从以前单一的文字、图像内容发展到现在具有丰富信息的多媒体内容,而且多媒体资源的数据也越来越多。
随着社交平台的影响力扩大,越来越多的用户喜欢在社交平台上发布自己生产的多媒体数据,进行信息的交流和扩散。为了避免有害信息的传播,危害社会稳定,各个社交平台都建立了内容审核团队,但大多数社交平台均采用对多媒体数据进行直接审核的方式,登录到审核***后台查看相关数据是否合规,但这种方法并不能对审核数据和审核人员进行高效管理,并且由于社交平台的多媒体数据量巨大,审核速度往往都很慢。
发明内容
有鉴于此,本申请的目的在于提供一种内容审核项目的管理方法、装置、设备及介质,解决了现有技术中无法对审核项目进行高效管理的问题。
第一方面,本申请实施例提供了一种内容审核项目的管理方法,所述管理方法包括:
获取待审核的审核样本;所述审核样本包括审核要求和至少一个审核数据;
基于所述审核样本生成对应的审核项目;所述审核项目中包括审核人员、审核引擎、审核流程和审核类别;
基于所述审核项目生成对应的审核结果,并将所述审核结果发送给客户端。
进一步的,所述管理方法,还包括:
将所述审核样本中的至少一个审核数据按照数据类型和数据形式进行分类,并按照消息队列的方式对所述审核数据进行存储;所述数据类型用来表征所述审核数据的媒体种类;所述数据形式用来表征所述审核数据的存储类型。
进一步的,所述管理方法,还包括:
基于预先设置的基础审核引擎,配置与所述审核样本中的审核要求对应的拼接审核引擎;所述拼接审核引擎中至少包括两个所述基础审核引擎。
进一步的,所述管理方法,还包括:
存储预先设置的审核人员的人员信息;所述人员信息包括人员工种及人员级别中的至少一种。
进一步的,所述管理方法,还包括:
存储预先设置好的审核数据对应的基础审核类别以及组合审核类别;所述基础审核类别用来表征所述审核数据的审核主题;所述组合审核类别中包括至少一个所述基础审核类别。
进一步的,所述基于所述审核样本生成对应的审核项目,包括:
基于所述审核要求选择已经配置好的与所述审核要求对应的拼接审核引擎;
基于所述审核要求确定对应的审核类别;
基于所述审核要求确定所需的审核流程;
基于所述审核流程以及所述审核类别确定所需的审核人员;
基于所述审核引擎、所述审核类别、所述审核流程和所述审核人员生成所述审核项目。
进一步的,所述管理方法,还包括:
对各个审核项目的审核进度进行显示;所述审核进度用来表征各个所述审核项目的进展程度。
第二方面,本申请实施例还提供了一种内容审核项目的管理装置,所述管理装置包括:
获取模块,用于获取待审核的审核样本;所述审核样本包括审核要求和至少一个审核数据;
审核项目生成模块,用于基于所述审核样本生成对应的审核项目;所述审核项目中包括审核人员、审核引擎、审核流程和审核类别;
审核结果生成模块,用于基于所述审核项目生成对应的审核结果,并将所述审核结果发送给客户端。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的内容审核项目的管理方法的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的内容审核项目的管理方法的步骤。
本申请实施例提供的一种内容审核项目的管理方法,首先,获取待审核的审核样本;所述审核样本包括审核要求和至少一个审核数据;然后,基于所述审核样本生成对应的审核项目;所述审核项目中包括审核人员、审核引擎、审核流程和审核类别;最后,基于所述审核项目生成对应的审核结果,并将所述审核结果发送给客户端。
本申请实施例提供的内容审核项目的管理方法,能够根据获取的审核样本中的审核数据和审核要求确定对应的审核人员、审核引擎、审核流程和审核类别,已生成对应的审核项目,并将审核项目得到的审核结果反馈给客户端。通过这种方式,可以根据审核数据和审核要求快速生成对应的审核项目,从项目生成上关联审核人员,从审核人员上管理专业知识,使得项目审核简单且高效,提高了审核项目的管理效率。在数据审核上将数据,引擎,人员,类别高效的结合在一起,大大缩短了数据审核的时间,提高了数据审核的效率。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种内容审核项目的管理方法的流程图;
图2为本申请实施例提供的生成审核项目的步骤的流程图;
图3为本申请实施例提供的一种内容审核项目的管理装置的结构示意图;
图4为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
随着互联网及媒体制作技术的不断发展,信息内容的形式已经从简单到复杂,从以前单一的文字、图像内容发展到现在具有丰富信息的多媒体内容,而且多媒体资源的数据也越来越多。
随着社交平台的影响力扩大,越来越多的用户喜欢在社交平台上发布自己生产的多媒体数据,进行信息的交流和扩散。为了避免有害信息的传播,危害社会稳定,各个社交平台都建立了内容审核团队。经研究发现,大多数的社交平台均采用对多媒体数据进行直接审核的方式,登录到审核***后台查看相关数据是否合规,但这种方法并不能对审核数据和审核人员进行高效管理,并且由于社交平台的多媒体数据量巨大,审核速度往往都很慢。因此,如何有效管理审核数据和审核人员,提高审核速度成为了各社交平台亟待解决的问题。
基于此,本申请实施例提供了一种内容审核项目的管理方法及装置,解决了现有技术中无法对审核项目进行高效管理的问题。
请参阅图1,图1为本申请实施例所提供的一种内容审核项目的管理方法的流程图。如图1中所示,本申请实施例提供的内容审核项目的管理方法,包括:
S101,获取待审核的审核样本。
其中,所述审核样本包括审核要求和至少一个审核数据。
需要说明的是,审核样本指的是用户发送的、想要进行审核的样本,其中,审核样本中包括审核要求和至少一个审核数据。这里,审核数据指的是需要进行内容审核的多媒体数据,其中,多媒体数据可以包含多种类型:例如图片、文本、音频片段、音频流、视频片段和视频流等;多媒体数据也可以包括多种数据形式:例如URL(Uniform Resource Locator,统一资源***)地址和非结构化数据。审核要求指的是用户针对多媒体数据提出的审核要求,其中,审核要求中可以包括想要审核的类别,例如涉政治、涉毒和涉毒等审核类别;审核要求中也可以包括想要审核的流程,例如引擎审核、人工审核、先引擎后人工复合审核等审核流程。
这里,应注意,上述对多媒体数据类型和多媒体数据形式的例子仅是示例,实际中,多媒体数据的类型和形式不限于上述例子。
针对上述步骤S101,在具体实施时,响应于用户对于审核样本的上传指令,获取上传指令中携带的审核要求和至少一个审核数据。
作为一种可选的实施方式,例如,用户发送的审核样本中包括是70条音频片段和30条图片的URL地址,用户针对这70条音频片段和30条图片的URL地址提出的审核要求是判断这些审核数据中是否包括涉广告和涉毒的内容,需要引擎审核一次,人工审核两次。因此可以将用户发送的70条音频片段和30条图片的URL地址作为审核数据,将判断这些审核数据中是否包括涉广告和涉毒的内容作为审核要求。
S102,基于所述审核样本生成对应的审核项目。
其中,所述审核项目中包括审核人员、审核引擎、审核流程和审核类别。
需要说明的是,审核项目指的是针对用户发送的审核数据和审核要求生成的项目,审核人员可以基于审核项目进行审核工作。审核人员指的是对审核数据进行审核的人员,审核引擎指的是对审核数据进行机器审核时用到的引擎。审核流程指的是一个审核项目进行的流程,例如引擎审核一次,人工审核一次,这就算一个审核项目的审核流程。
针对上述步骤S102,在具体实施时,基于获取到的审核样本选择对应的审核人员、审核引擎、审核流程和审核类别,以生成对应的审核项目供审核人员工作。
S103,基于所述审核项目生成对应的审核结果,并将所述审核结果发送给客户端。
需要说明的是,审核结果指的是审核人员在执行审核项目中的审核工作时得到的审核结果。具体的,每一条审核数据都会对应一个审核结果,审核结果可以包括合格、和高危两种。
针对上述步骤S103,在具体实施时,审核项目生成后,审核人员就可以开始针对审核项目进行审核工作,并生成对应的审核结果。得到审核结果后,再将审核项目得到的审核结果,供用户查看。
进一步的,所述管理方法,还包括:
将所述审核样本中的至少一个审核数据按照数据类型和数据形式进行分类,并按照消息队列的方式对所述审核数据进行存储;所述数据类型用来表征所述审核数据的媒体种类;所述数据形式用来表征所述审核数据的存储类型。需要说明的是,数据类型指的是获取到的审核数据的类型,也就是审核数据的媒体种类。作为一种可选的实施方式,媒体种类可以是例如图片、文本、音频片段、音频流、视频片段和视频流等这样的类型。数据形式指的是获取到的审核数据的储存形式,用来表征所述审核数据的存储类型,存储类型可以是例如URL地址和非结构化数据这样的类型。消息队列是一种Microsoft 的消息处理技术,指的是在消息的传输过程中保持消息的容器,它在任何安装 Microsoft Windows 的计算机组合中,为任何应用程序提供消息处理和消息队列功能。
这里,应注意,上述对审核数据的数据类型、审核数据的数据形式以及数据的存储形式的例子仅是示例,实际中,审核数据的数据类型、审核数据的数据形式以及数据的存储形式不限于上述例子。
针对上述步骤,在具体实施时,还可配置一个数据存储模块,所有待审核的数据都需要储存在服务端上让审核人员进行审核,因此服务端中可以设有数据存储模块,将获取到的审核样本中的至少一个审核数据按照数据类型和数据形式进行分类,并按照消息队列的方式对获取到的审核数据进行存储。作为一种可选的实施方式,获取到的审核数据储存在由Ceph分布式储存框架构建的数据存储模块中。这里,Ceph是一个开源项目,它提供软件定义的、统一的存储解决方案。Ceph是一个具有高性能、高度可伸缩性、可大规模扩展并且无单点故障的分布式存储***。
这里,应注意,上述对数据存储模块的构建方式的例子仅是示例,实际中,数据存储模块的构建方式不限于上述例子。
延续上一个实施例,例如,接收到用户发送的审核数据为70条音频片段和30条图片的URL地址后,这时数据存储模块将用户发送的审核数据按照数据类型分为音频片段和图片,将用户发送的审核数据按照数据形式分为URL地址和非结构化数据,然后数据存储模块根据分类好的数据类型和数据形式按照消息队列的方式将接收到的审核数据进行存储。
进一步的,所述管理方法,还包括:
基于预先设置的基础审核引擎,配置与所述审核样本中的审核要求对应的拼接审核引擎;所述拼接审核引擎中至少包括两个所述基础审核引擎。
需要说明的是,审核引擎指的是用于审核数据是否符合规定的内容安全模型,可以覆盖图片识别、视频识别、音频识别和文本识别等场景。基础审核引擎指的是底层基础引擎,一般是比较现有的、基础的引擎,具体的,根据本申请提供的实施例,基础审核引擎可以包括图像分类引擎、图像检测引擎、OCR(Optical Character Recognition,光学字符识别)识别引擎、图像URL解析引擎、音频URL解析引擎、视频URL解析引擎、文本分析引擎、文本检测引擎、声纹识别引擎、音频转写引擎、语种识别引擎和视频抽帧引擎等。
拼接审核引擎指的是利用基础审核引擎组合成的拼接审核引擎,其中,拼接审核引擎中至少包括两个基础审核引擎。具体的,例如想要判断一张图片的类别是什么,当获取到的审核数据为图片URL时,基础审核引擎中并没有直接通过图片URL判断图片分类的引擎,因此需要将基础审核引擎进行拼接得到一个图片分类引擎,以使其可以通过图片URL判断图片分类。当输入的审核数据为图片URL时,需在图像分类引擎前添加图片URL解析引擎,图片URL解析引擎的输入为图片url,输出为图片数据,图片URL解析引擎输出了图片数据后,再利用图像分类引擎来输出图片所述类别。这时拼接审核引擎就可以为图片分类引擎,是通过图片URL解析引擎和图像分类引擎拼接而成的,图片分类引擎的输入为一个的图片URL,输出为图片所述类别。拼接审核引擎也可以是音频流分类引擎,输入为音频流的地址,输出为音频流的分类类别,其中音频流先经过音频流解析引擎,得到音频数据,再经过音频转写引擎,得到文本数据。再经过文本分析引擎,得到最终的分类类别,因此音频流分类引擎是通过音频流解析引擎、音频转写引擎和文本分析引擎拼接而成。
这里,应注意,上述对审核引擎的举例仅是示例,实际中,审核引擎不限于上述例子。
针对上述步骤,在具体实施时,还可以配置一个引擎配置模块。引擎配置模块主要负责根据获取到的审核样本中的审核要求来配置对应的引擎,以使配置后的引擎可以得到符合审核要求的审核结果,可针对数据存储模块中的审核数据进行针对性的引擎管理。作为一种可选的实施方式,引擎配置模块可以是一个基于K8s(Kubernetes,容器编排引擎)容器集群的模块,将所有的智能基础审核引擎汇集在一起,并且可以按照数据形式、输出形式进行流程化组合,从而为流程化的审核提供智能审核能力。在具体实施时,引擎配置模块需要基于引擎配置模块中的基础审核引擎,配置与审核样本中的审核要求对应的拼接审核引擎。
延续上一实施例,用户发送的审核数据是70条音频片段和30条图片的URL地址,审核要求是判断这些审核数据中是否包括涉未成年和涉暴力的内容,因此需要一个可以通过音频片段判断音频分类的引擎和一个可以通过图片URL地址判断图片分类的引擎,这时引擎配置模块按照审核要求,利用基础审核引擎中的图片URL解析引擎和图像分类引擎拼接成图片分类引擎,以通过获取到的图片URL地址来判断图片的分类。再利用基础审核引擎中的音频流解析引擎、音频转写引擎和文本分析引擎拼接成音频流分类引擎,以通过获取到的音频片段来判断音频的分类。
进一步的,所述管理方法,还包括:
存储预先设置的审核人员的人员信息;所述人员信息包括人员工种及人员级别中的至少一种。
需要说明的是,人员工种指的是审核人员根据审核数据的不同数据类型而划分的不同工作种类,具体的,人员工种可以包括按数据类型划分的图像工种、音频工种、文本工种和视频工种。例如,有的审核人员擅长审核图片类型的数据,有的审核人员擅长审核声音类型的数据,有的审核人员喜欢审核文本类型的数据。除了数据的类型不同,还有审核主题的类型不同,因此,人员工种也可以按照审核类型来划分,如张三擅长审核涉广告的内容,李四专长是审核涉毒的内容,赵五的专业知识在涉政治方面,就可以分为广告审核工种、涉毒审核工种和政治审核工种。人员级别指的是审核人员的级别,具体的,人员级别可以是按级别划分的初级审核员、高级审核员和专家审核员。而且,除了数据的类型和主题的类型不同,每个审核人员的级别也是不一样的,比如张三是刚毕业的,所以级别低,人员级别为初级审核员。李四已经工作了10年了,经验比较丰富,所以是专家审核员级别的。
这里,应注意,上述对人员工种和人员级别的例子仅是示例,实际中,人员工种和人员级别不限于上述例子。
针对上述步骤,在具体实施时,可以配置一个人员信息模块,人员信息模块主要负责存储全部审核人员的人员信息,如人员工种以及人员级别,也可以包括人员姓名、人员电话等基本信息。人员信息模块中也可以进行人员统计显示,可看到每个审核人员累计审核的数据量,日平均审核量以及今日已经审核的数据量,以及被分配到哪个审核项目上了。而且还可以看每个审核的工作情况。及时淘汰效率低的人,奖励效率高的人。其中一个审核人员只能被一个审核项目占用,即一个审核人员不会存在两个或两个以上的审核项目里面。当审核人员处于被某个审核项目占用时,便不可再分配新的审核项目,若要强行分配新的加急的审核项目,则需要此审核人员完成已拉取到个人的审核数据,提交后,选择解除审核项目绑定,则此人便可被新的审核项目添加占用。
进一步的,所述管理方法,还包括:
存储预先设置好的审核数据对应的基础审核类别以及组合审核类别;所述基础审核类别用来表征所述审核数据的审核主题;所述组合审核类别中包括至少一个所述基础审核类别。
需要说明的是,审核类别指的是审核数据所述的类别,用来表征所述审核数据的审核主题,换句话说就是审核数据的类型。具体的,根据本申请提供的实施例,基础审核类别可以包括涉政治、涉黄、涉毒、涉赌、涉未成年、涉广告、涉暴力、涉恐怖、涉宗教和涉版权。组合审核类别指的是利用基础审核类别组合成的组合审核类别,其中,组合审核类别中至少包括两个基础类别。具体的,组合审核类别可以为涉毒加涉赌加涉未成年类别,或者涉恐怖加涉版权类别这样的组合类别。
这里,应注意,上述对审核类别的例子仅是示例,实际中,审核类别不限于上述例子。针对上述步骤,在具体实施时,还可以配置一个类别存储模块,类别存储模块主要负责存储审核数据的基础审核类别和组合审核类别。在类别存储模块中可以动态增加、删除和更改基础审核类别和组合审核类别,可以利用基础审核类别组成组合审核类别,也可以自定义审核类别。
请参阅图2,图2为本申请实施例所提供的生成审核项目的步骤的流程图。如图2中所示,所述基于所述审核样本生成对应的审核项目,包括:
S201,基于所述审核要求选择已经配置好的与所述审核要求对应的拼接审核引擎。
针对上述步骤S201,在具体实施时,根据获取到的审核要求,已经配置好的与所述审核要求对应的拼接审核引擎。延续上一实施例,在引擎配置模块中已经配置好了可以满足审核要求的图片分类引擎和音频流分类引擎,这时直接从引擎配置模块中选取配置好的这两个引擎即可。
S202,基于所述审核要求确定对应的审核类别。
针对上述步骤S202,在具体实施时,根据获取到的审核要求确定对应的审核类别。作为一种可选的实施方式,若类别存储模块中包括与审核要求对应的审核类别,则可以直接从类别存储模块中选择与审核要求对应的审核类别。若类别存储模块中不包括与审核要求对应的审核类别,则需要基于类别存储模块中的基础审核类别来配置与审核要求对应的审核类别。延续上一实施例,用户发送的审核要求为判断审核数据中是否包括涉广告和涉毒的内容,这时认为需要配置的审核类别为涉广告加涉毒。这时需在类别存储模块中查找是否有涉广告加涉毒的审核类别,若存在,可直接从类别存储模块中选择该类别作为审核类别。若类别存储模块中不存在涉广告加涉毒的审核类别,这时需要利用类别存储模块中的基础审核类别涉广告和基础审核类别涉毒来进行组合,已生成一个类型为涉广告加涉毒的组合审核类型,以满足用户的审核要求。在具体实施时,在配置完审核类型后,可以将新配置的、类别存储模块中之前不存在的审核类别存储在类别存储模块中,方便下次审核时可以快速使用。
在设置好审核类别后,会关联类别存储模块中的关键词知识体系。需要说明的是,关键词知识体系指的是一个审核类别对应的关键词,延续上一实施例,配置的审核类别为涉广告加涉毒,这时对应的关键词体系可以为“广告”、“买卖”、“毒”、“毒品”这样有指向性的汉字。关联关键词知识体系是为了配置好的审核引擎可以根据关键词知识体系来进行审核,当审核引擎检测出审核数据中包含关键词知识体系时,则认为对应的审核数据不合规。
S203,基于所述审核要求确定所需的审核流程。
针对上述步骤S203,在具体实施时,根据获取到的审核要求确定所需的审核流程。延续上一实施例,用户发送的审核要求为引擎审核一次,人工审核两次。这时可以配置审核流程为“引擎审核+人工审核+人工复审”。这里,每个审核环节的审核结果为合格、疑似和高危三种审核结果,当审核环节到最后一级时,审核结果只有合格和高位两种审核结果。其中,数据经过两次以及两次以上的审核过程的,可配置后一次审核前一次的数据比例p,如100个数据被第一次审核后,顺序进入到第二次审核的数据量为100*p,若p=0.8,则第二次审核的数据量为80个数据。其中,数据经过三次以及三次以上的审核的,可配置审核结果不一致的审核比例,如第一次审核给出的结果与第二次审核给出的结果有100个不一致的数据,若设置比例为q,则有100*q个数据会被推送给第三次审核的审核人员。
S204,基于所述审核流程以及所述审核类别确定所需的审核人员。
针对上述步骤S201,在具体实施时,根据确定好的审核流程和审核类别来确定对应的审核人员。在人员存储模块中存储了所有审核人员的信息,包括工种和级别,这时可以适应性的来配置审核人员。延续上一实施例,配置好的审核类别为涉广告和涉毒,这时就需要来配置一些擅长审核涉广告和涉毒内容的审核人员。例如张三擅长审核涉广告的内容,他对应的工种为图像工种,对应的级别为初级审核员,这时可以选择张三来针对图片数据去审核这些图片数据是否包含涉广告的,他需要负责的则是人工审核阶段。李四擅长审核涉毒的内容,他对应的工种为音频工种,对应的级别为高级审核员,这时可以选择李四来针对音频数据去审核这些音频数据中是否包含涉毒的内容,他需要负责的则是人工复审阶段。在具体实施时,人员配置子模块根据配置好的审核流程和审核类别来对应的选择需要负责的审核人员,以使审核人员在审核数据时可以更准确、高效。
S205,基于所述审核引擎、所述审核类别、所述审核流程和所述审核人员生成所述审核项目。
针对上述步骤S205,在具体实施时,当步骤S201中的审核引擎、步骤S202中的审核类别、步骤S203中的审核流程和步骤S204中的审核人员都配置好后,就可以生成对应的审核项目了,对应的审核人员也针对审核项目开始对应的审核工作。
作为一种可选的实施方式,针对上述步骤S201-步骤S205,还可以配置一个项目生成模块,项目生成模块主要负责根据审核要求配置审核要求对应的审核引擎、审核类别、审核流程和审核人员,生成与审核要求对应的审核项目。项目生成模块可以从数据存储单元中获取审核数据,并根据审核要求来配合审核要求对应的审核引擎、审核类别、审核流程和审核人员,以生成与审核要求对应的审核项目,管理人员可以根据审核数据和审核要求快速生成对应的审核项目,提高了数据审核的速度,也提高了审核项目的管理速度。审核项目生成之后,这时审核人员就可以开始工作了,并生成对应的审核结果。
进一步的,所述管理方法,还包括:
对各个审核项目的审核进度进行显示;所述审核进度用来表征各个所述审核项目的进展程度。
针对上述步骤,在具体实施时,还可以配置一个项目信息展示模块,项目信息展示模块主要负责对各个审核项目的审核进度进行显示,显示的信息可以包括已审核数据量、总数据量、审核项目的审核人员数量、审核项目的开始时间、审核项目的已用时间、审核项目的截止时间和审核项目的审核类型。管理人员可以在项目信息展示模块中查看每个审核项目的审核进度,方便对审核项目进行***化管理,减少了人工成本,也提高了审核项目管理的效率。
本申请实施例提供的内容审核项目的管理方法,能够根据获取的审核样本中的审核数据和审核要求确定对应的审核人员、审核引擎、审核流程和审核类别,已生成对应的审核项目,并将审核项目得到的审核结果反馈给客户端。通过这种方式,可以根据审核数据和审核要求快速生成对应的审核项目,从项目生成上关联审核人员,从审核人员上管理专业知识,使得项目审核简单且高效,提高了审核项目的管理效率。在数据审核上将数据,引擎,人员,类别高效的结合在一起,大大缩短了数据审核的时间,提高了数据审核的效率。
请参阅图3,图3为本申请实施例所提供的一种内容审核项目的管理装置的结构示意图。如图3中所示,所述管理装置300包括:
获取模块301,用于获取待审核的审核样本;所述审核样本包括审核要求和至少一个审核数据;
审核项目生成模块302,用于基于所述审核样本生成对应的审核项目;所述审核项目中包括审核人员、审核引擎、审核流程和审核类别;
审核结果生成模块303,用于基于所述审核项目生成对应的审核结果,并将所述审核结果发送给客户端。
进一步的,所述管理装置,还包括:
数据存储模块,用于将所述审核样本中的至少一个审核数据按照数据类型和数据形式进行分类,并按照消息队列的方式对所述审核数据进行存储;所述数据类型用来表征所述审核数据的媒体种类;所述数据形式用来表征所述审核数据的存储类型。
进一步的,所述管理装置,还包括:
引擎配置模块,用于基于预先设置的基础审核引擎,配置与所述审核样本中的审核要求对应的拼接审核引擎;所述拼接审核引擎中至少包括两个所述基础审核引擎。
进一步的,所述管理装置,还包括:
人员信息模块,用于存储预先设置的审核人员的人员信息;所述人员信息包括人员工种及人员级别中的至少一种。
进一步的,所述管理装置,还包括:
类别存储模块,用于存储预先设置好的审核数据对应的基本审核类别以及组合审核类别;所述基础审核类别用来表征所述审核数据的审核主题;所述组合审核类别中包括至少一个所述基础类别。
进一步的,所述管理装置,还包括:
项目生成模块,用于基于所述审核要求选择已经配置好的与所述审核要求对应的拼接审核引擎;
基于所述审核要求确定对应的审核类别;
基于所述审核要求确定所需的审核流程;
基于所述审核流程以及所述审核类别确定所需的审核人员;
基于所述审核引擎、所述审核类别、所述审核流程和所述审核人员生成所述审核项目。
进一步的,所述管理装置,还包括:
项目信息展示模块,用于对各个审核项目的审核进度进行显示;所述审核进度用来表征各个所述审核项目的进展程度。
请参阅图4,图4为本申请实施例所提供的一种电子设备的结构示意图。如图4中所示,所述电子设备400包括处理器410、存储器420和总线430。
所述存储器420存储有所述处理器410可执行的机器可读指令,当电子设备400运行时,所述处理器410与所述存储器420之间通过总线430通信,所述机器可读指令被所述处理器410执行时,可以执行如上述图1以及图2所示方法实施例中的内容审核项目的管理方法的步骤,解决了现有技术中无法对审核项目进行高效管理的问题,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图1以及图2所示方法实施例中的内容审核项目的管理方法的步骤,解决了现有技术中无法对审核项目进行高效管理的问题,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种内容审核项目的管理方法,其特征在于,所述管理方法包括:
获取待审核的审核样本;所述审核样本包括审核要求和至少一个审核数据;
基于所述审核样本生成对应的审核项目;所述审核项目中包括审核人员、审核引擎、审核流程和审核类别;
基于所述审核项目生成对应的审核结果,并将所述审核结果发送给客户端。
2.根据权利要求1所述的管理方法,其特征在于,所述管理方法,还包括:
将所述审核样本中的至少一个审核数据按照数据类型和数据形式进行分类,并按照消息队列的方式对所述审核数据进行存储;所述数据类型用来表征所述审核数据的媒体种类;所述数据形式用来表征所述审核数据的存储类型。
3.根据权利要求1所述的管理方法,其特征在于,所述管理方法,还包括:
基于预先设置的基础审核引擎,配置与所述审核样本中的审核要求对应的拼接审核引擎;所述拼接审核引擎中至少包括两个所述基础审核引擎。
4.根据权利要求3所述的管理方法,其特征在于,所述管理方法,还包括:
存储预先设置的审核人员的人员信息;所述人员信息包括人员工种及人员级别中的至少一种。
5.根据权利要求4所述的管理方法,其特征在于,所述管理方法,还包括:
存储预先设置好的审核数据对应的基础审核类别以及组合审核类别;所述基础审核类别用来表征所述审核数据的审核主题;所述组合审核类别中包括至少一个所述基础审核类别。
6.根据权利要求5所述的管理方法,其特征在于,所述基于所述审核样本生成对应的审核项目,包括:
基于所述审核要求选择已经配置好的与所述审核要求对应的拼接审核引擎;
基于所述审核要求确定对应的审核类别;
基于所述审核要求确定所需的审核流程;
基于所述审核流程以及所述审核类别确定所需的审核人员;
基于所述审核引擎、所述审核类别、所述审核流程和所述审核人员生成所述审核项目。
7.根据权利要求1所述的管理方法,其特征在于,所述管理方法,还包括:
对各个审核项目的审核进度进行显示;所述审核进度用来表征各个所述审核项目的进展程度。
8.一种内容审核项目的管理装置,其特征在于,所述管理装置包括:
获取模块,用于获取待审核的审核样本;所述审核样本包括审核要求和至少一个审核数据;
审核项目生成模块,用于基于所述审核样本生成对应的审核项目;所述审核项目中包括审核人员、审核引擎、审核流程和审核类别;
审核结果生成模块,用于基于所述审核项目生成对应的审核结果,并将所述审核结果发送给客户端。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线进行通信,所述机器可读指令被所述处理器运行时执行如权利要求1至7任一所述的内容审核项目的管理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7任一所述的内容审核项目的管理方法的步骤。
CN202110867538.2A 2021-07-30 2021-07-30 一种内容审核项目的管理方法、装置、设备及介质 Pending CN113312504A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110867538.2A CN113312504A (zh) 2021-07-30 2021-07-30 一种内容审核项目的管理方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110867538.2A CN113312504A (zh) 2021-07-30 2021-07-30 一种内容审核项目的管理方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN113312504A true CN113312504A (zh) 2021-08-27

Family

ID=77382488

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110867538.2A Pending CN113312504A (zh) 2021-07-30 2021-07-30 一种内容审核项目的管理方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN113312504A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114827732A (zh) * 2022-04-25 2022-07-29 康键信息技术(深圳)有限公司 一种多通道内容审核方法、平台及存储介质
CN115052173A (zh) * 2022-06-07 2022-09-13 北京胜视京基数字文化产业发展有限公司 一种网络短视频的内容分析方法及***

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103188530A (zh) * 2011-12-30 2013-07-03 大连天维科技有限公司 分级内容审核***
US20130290339A1 (en) * 2012-04-27 2013-10-31 Yahoo! Inc. User modeling for personalized generalized content recommendations
CN106875156A (zh) * 2017-02-14 2017-06-20 电子科技大学 一种通用化智能审核平台及其审核方法
CN109670055A (zh) * 2018-11-30 2019-04-23 广州市百果园信息技术有限公司 一种多媒体数据审核方法、装置、设备及存储介质
CN111090776A (zh) * 2019-12-20 2020-05-01 广州市百果园信息技术有限公司 一种视频审核的方法、装置、审核服务器和存储介质
CN111382291A (zh) * 2020-03-12 2020-07-07 北京金山云网络技术有限公司 机器审核方法、装置及机器审核服务器
CN112488652A (zh) * 2020-11-30 2021-03-12 乐刷科技有限公司 工单审核方法、***、终端和存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103188530A (zh) * 2011-12-30 2013-07-03 大连天维科技有限公司 分级内容审核***
US20130290339A1 (en) * 2012-04-27 2013-10-31 Yahoo! Inc. User modeling for personalized generalized content recommendations
CN106875156A (zh) * 2017-02-14 2017-06-20 电子科技大学 一种通用化智能审核平台及其审核方法
CN109670055A (zh) * 2018-11-30 2019-04-23 广州市百果园信息技术有限公司 一种多媒体数据审核方法、装置、设备及存储介质
CN111090776A (zh) * 2019-12-20 2020-05-01 广州市百果园信息技术有限公司 一种视频审核的方法、装置、审核服务器和存储介质
CN111382291A (zh) * 2020-03-12 2020-07-07 北京金山云网络技术有限公司 机器审核方法、装置及机器审核服务器
CN112488652A (zh) * 2020-11-30 2021-03-12 乐刷科技有限公司 工单审核方法、***、终端和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
丁志强等: "《计算机***管理与项目管理》", 《计算机***管理与项目管理》 *
章宁: "《信息***项目管理概述》", 《信息***开发与项目管理》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114827732A (zh) * 2022-04-25 2022-07-29 康键信息技术(深圳)有限公司 一种多通道内容审核方法、平台及存储介质
CN115052173A (zh) * 2022-06-07 2022-09-13 北京胜视京基数字文化产业发展有限公司 一种网络短视频的内容分析方法及***

Similar Documents

Publication Publication Date Title
US10613719B2 (en) Generating a form response interface in an online application
Nahon et al. Fifteen minutes of fame: The power of blogs in the lifecycle of viral political information
US8726285B2 (en) Method and apparatus for triggering workflow deployment and/or execution
Fu et al. Why people hate your app: Making sense of user feedback in a mobile app store
US8897424B2 (en) Automatic clustering and visualization of data trends
US20090070121A1 (en) System, Method And Graphical User Interface For Workflow Generation, Deployment And/Or Execution
US20140278406A1 (en) Obtaining data from unstructured data for a structured data collection
US20130013706A1 (en) Method for determining interpersonal relationship influence information using textual content from interpersonal interactions
US20240152558A1 (en) Search activity prediction
CN113312504A (zh) 一种内容审核项目的管理方法、装置、设备及介质
US9177554B2 (en) Time-based sentiment analysis for product and service features
CN108985064A (zh) 一种识别恶意文档的方法及装置
Queiroz et al. A web browser fingerprinting method based on the web audio API
WO2022178192A1 (en) Reputation management and machine learning systems and processes
CN112348560A (zh) 广告素材智能审核方法、装置和电子设备
US9740601B2 (en) Globalization testing management service configuration
CN109949090B (zh) 客户推荐方法、装置、电子设备及介质
US9767011B2 (en) Globalization testing management using a set of globalization testing operations
US20150372955A1 (en) Sorting electronic mail
KR20170102878A (ko) 사용자 인증 방법 및 장치
CN112994900B (zh) 文件会签方法、装置、客户端、服务端和存储介质
CN113836135A (zh) 平台数据监测方法、装置、设备及存储介质
Yin et al. Research of integrated algorithm establishment of a spam detection system
CN111177595A (zh) 一种针对http协议模板化提取资产信息的方法
CN106547913B (zh) 页面信息的收集分类反馈方法、装置及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210827

RJ01 Rejection of invention patent application after publication