CN118227871A

CN118227871A - 基于用户类型的人工智能治理网络内容方法和机器人

Info

Publication number: CN118227871A
Application number: CN202410026645.6A
Authority: CN
Inventors: 朱定局
Original assignee: South China Normal University
Current assignee: South China Normal University
Priority date: 2024-01-08
Filing date: 2024-01-08
Publication date: 2024-06-21

Abstract

基于用户类型的人工智能治理网络内容方法和机器人，利用人工智能模学习网络内容与其使用者类型和生产者类型之间的内在关联，然后根据使用者类型和生产者类型来预测网络内容中的不良内容，能够加快不良内容的检测速度，同时能够提高预测不良内容检测的准确率。

Description

基于用户类型的人工智能治理网络内容方法和机器人

技术领域

本发明涉及人工智能技术领域，特别是涉及一种基于用户类型的人工智能治理网络内容方法和机器人。

背景技术

网络内容的审查，往往是基于内容本身进行。

在实现本发明过程中，发明人发现现有技术中至少存在如下问题：现有技术在进行网络内容的检测时，只关注网络内容本身，而没有关注用户的类型。

因此，现有技术还有待于改进和发展。

发明内容

基于此，有必要针对现有技术的缺陷或不足，提供基于用户类型的人工智能治理网络内容方法和机器人，根据用户类型快速地筛查和检测网络内容中的不良内容，提高了不良内容检测的速度和效率。

第一方面，本发明实施例提供一种人工智能方法，所述方法包括：

网络内容类型识别第一模型使用步骤：若能获取到观看待识别的网络内容的用户的信息，则将观看待识别的网络内容的用户的信息作为输入，通过网络内容类型识别第一模型的计算得到的输出作为所述待识别的网络内容的类型标签。

优选地，所述方法还包括：

网络内容类型识别第二模型使用步骤：若能获取到观看待识别的网络内容的用户的信息、所述网络内容的平台的信息，则将观看待识别的网络内容的用户的信息、所述网络内容的平台的信息作为输入，通过网络内容类型识别第二模型的计算得到的输出作为所述待识别的网络内容的类型标签。

优选地，所述方法还包括：

网络内容类型识别第三模型使用步骤：若能获取到观看待识别的网络内容的用户的信息、所述网络内容的信息，则将观看待识别的网络内容的用户的信息、所述网络内容的平台的信息作为输入，通过网络内容类型识别第三模型的计算得到的输出作为所述待识别的网络内容的类型标签。

优选地，所述方法还包括：

不良内容治理步骤：若若所述待识别的网络内容的类型标签为非健康内容，则通知用户“若所述待识别的网络内容的类型标签为非健康内容，需要及时处理”。

第二方面，本发明实施例提供一种人工智能***，所述***包括：

网络内容类型识别第一模型使用模块：若能获取到观看待识别的网络内容的用户的信息，则将观看待识别的网络内容的用户的信息作为输入，通过网络内容类型识别第一模型的计算得到的输出作为所述待识别的网络内容的类型标签。

优选地，所述***还包括：

网络内容类型识别第二模型使用模块：若能获取到观看待识别的网络内容的用户的信息、所述网络内容的平台的信息，则将观看待识别的网络内容的用户的信息、所述网络内容的平台的信息作为输入，通过网络内容类型识别第二模型的计算得到的输出作为所述待识别的网络内容的类型标签。

优选地，所述***还包括：

网络内容类型识别第三模型使用模块：若能获取到观看待识别的网络内容的用户的信息、所述网络内容的信息，则将观看待识别的网络内容的用户的信息、所述网络内容的平台的信息作为输入，通过网络内容类型识别第三模型的计算得到的输出作为所述待识别的网络内容的类型标签。

优选地，所述***还包括：

不良内容治理模块：若若所述待识别的网络内容的类型标签为非健康内容，则通知用户“若所述待识别的网络内容的类型标签为非健康内容，需要及时处理”。

第三方面，本发明实施例提供一种人工智能装置，所述装置包括第二方面实施例任意一项所述***的模块。

第四方面，本发明实施例提供一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现第一方面实施例任意一项所述方法的步骤。

第五方面，本发明实施例提供一种机器人，包括存储器、处理器及存储在存储器上并可在处理器上运行的人工智能机器人程序，所述处理器执行所述程序时实现第一方面实施例任意一项所述方法的步骤。

本实施例提供的基于用户类型的人工智能治理网络内容方法和机器人，利用人工智能模学习网络内容与其使用者类型和生产者类型之间的内在关联，然后根据使用者类型和生产者类型来预测网络内容中的不良内容，能够加快不良内容的检测速度，同时能够提高预测不良内容检测的准确率。

附图说明

图1为本发明的一个实施例提供的人工智能治理方法的流程图；

图2为本发明的一个实施例提供的人工智能治理***的框架图。

具体实施方式

下面结合本发明实施方式，对本发明实施例中的技术方案进行详细地描述。

本发明的基本实施例

第一方面，如图1所示，本发明实施例提供一种人工智能方法，所述方法包括网络内容类型识别第一模型使用步骤。在一个优选的实施例中，所述方法还包括网络内容类型识别第二模型使用步骤。在一个优选的实施例中，所述方法还包括网络内容类型识别第三模型使用步骤。在一个优选的实施例中，所述方法还包括不良内容治理步骤。

第二方面，如图2所示，本发明实施例提供一种人工智能***，所述***包括网络内容类型识别第一模型使用模块。在一个优选的实施例中，所述***还包括网络内容类型识别第二模型使用模块。在一个优选的实施例中，所述***还包括网络内容类型识别第三模型使用模块。在一个优选的实施例中，所述***还包括不良内容治理模块。

本发明的优选实施例

哪里有臭鸡蛋，哪里就会有苍蝇，反之，哪里有苍蝇，哪里就会有臭鸡蛋。例如，违法违规的网络音视频如果没有用户，那么这种网络音视频就没有生存的空间。

溯源出来观看网络内容的用户来建立用户与网络内容之间的相关性，然后根据用户的类型和数量来快速预测网络内容的类型，进行初步筛选，从而可以对网络内容进行大范围普查。网络内容的类型影响着用户的类型，例如***和男性用户可能更为关注黄色内容，当然有多少用户观看、哪些类型的用户观看还取决于平台的类型，例如流量大的平台的用户观众更多，还取决于网络内容自身的信息，例如已经发布的时长、网络内容的时长、网络内容的标题。

技术效果：不同的用户喜欢看不同的网络内容，从而可以根据用户来预测网络内容的类型，而用户信息相对于网络内容特别是音视频而言要简单很多，所以基于用户信息对网络内容进行预测，比根据网络内容本身进行检测要快速很多，能够快速地筛查出不良内容。

1类型标签集合获取步骤：获取网络内容的类型标签集合，类型标签集合包括健康内容、不良内容、违规内容、违法内容、等，不良内容又包括黄色内容、低俗内容、暴力内容、等。

2网络内容类型识别模型训练测试数据集获取步骤：获取用于训练和测试的网络内容(网络内容包括文字、音频、视频、等)的类型标签、观看所述网络内容的用户的信息(观看所述网络内容的用户若有多个，则所述用户的信息包括多个用户的信息；观看所述网络内容的用户的信息包括每一观看所述网络内容的用户的类型，每一观看所述网络内容的用户的类型包括所述每一观看所述网络内容的用户的性别、年龄、职业、学历、等,每一观看所述网络内容的用户的类型包括所述每一观看所述网络内容的用户的性别、年龄、职业、学历、等)、观看所述网络内容的用户的行为(观看所述网络内容的用户若有多个，则所述用户的信息包括多个用户的信息；观看所述网络内容的用户的行为包括每一观看所述网络内容的用户的行为信息，所述行为信息包括浏览的时长、转发的次数、是否收藏、等)、所述网络内容所在平台的信息(平台的信息包括所述网络内容所在平台的注册用户量、访问用户量、等)、所述网络内容的信息(网络内容的信息包括所述网络内容的从发布至今的时长、网络内容量(包括文字的字数、音视频的时长)、网络内容的标题)。

3网络内容类型识别第一模型训练测试步骤：初始化深度学习模型作为网络内容类型识别模型；将观看所述网络内容的用户的信息作为输入，将所述网络内容的类型标签作为预期输出，对网络内容类型识别模型进行训练和测试。技术效果：只需要到用户的信息，对采集数据的要求低，在只有用户信息的情况下就能使用。

4网络内容类型识别第二模型训练测试步骤：初始化深度学***台的信息作为输入，将所述网络内容的类型标签作为预期输出，对网络内容类型识别模型进行训练和测试。技术效果：不但考虑到用户的信息，而且把影响用户的网络内容所在平台的信息也考虑在内，一起作为预测网络内容类型的依据，可以进一步提高预测的准确率。

步骤3之后，

5网络内容类型识别第三模型训练测试步骤：初始化深度学习模型作为网络内容类型识别模型；将观看所述网络内容的用户的信息、所述网络内容的信息作为输入，将所述网络内容的类型标签作为预期输出，对网络内容类型识别模型进行训练和测试。技术效果：不但考虑到用户的信息，而且把影响用户的所述网络内容的信息也考虑在内，一起作为预测网络内容类型的依据，可以进一步提高预测的准确率。

6网络内容类型识别第四模型训练测试步骤：初始化深度学***台的信息、所述网络内容的信息作为输入，将所述网络内容的类型标签作为预期输出，对网络内容类型识别模型进行训练和测试。技术效果：不但考虑到用户的信息，而且把影响用户的网络内容所在平台的信息、所述网络内容的信息也考虑在内，一起作为预测网络内容类型的依据，可以进一步提高预测的准确率。

7网络内容类型识别第五模型训练测试步骤：初始化深度学***台的信息、所述网络内容的信息作为输入，将所述网络内容的类型标签作为预期输出，对网络内容类型识别模型进行训练和测试。技术效果：不但考虑到用户的信息，还考虑到用户行为、用户的网络内容所在平台的信息、所述网络内容的信息也考虑在内，一起作为预测网络内容类型的依据，可以进一步提高预测的准确率。

步骤7之后，

8网络内容类型识别模型使用数据获取步骤：获取观看待识别的网络内容的用户的信息、观看所述网络内容的用户的行为、所述网络内容的平台的信息、所述网络内容的信息；

9用户信息预测模型训练测试数据获取步骤：获取用于训练和测试的用户的信息、所述用户观看的每一网络内容的信息；

10用户信息预测模型训练测试步骤：将所述用户观看的每一网络内容的信息(若所述用户观看过多个网络内容，则包括多个网络内容的信息)作为输入，将所述用户的信息作为预期输出，对用户信息预测模型进行训练和测试；

11用户信息获取步骤：若观看所述网络内容的用户的信息无法获取，则将所述用户观看的每一网络内容的信息(若所述用户观看过多个网络内容，则包括多个网络内容的信息)作为输入，通过用户信息预测模型的计算得到的输出作为获取到的观看所述网络内容的用户的信息；技术效果：使得所述网络内容的用户的信息无法获取的情况，又能反过来根据用户观看过的网络内容的信息，来根据用户信息预测模型预测出用户的信息；

12网络内容类型识别第五模型使用步骤：若能获取到观看待识别的网络内容的用户的信息、观看所述网络内容的用户的行为、所述网络内容的平台的信息、所述网络内容的信息，则将观看待识别的网络内容的用户的信息、观看所述网络内容的用户的行为、所述网络内容的平台的信息、所述网络内容的信息作为输入，通过网络内容类型识别第五模型的计算得到的输出作为所述待识别的网络内容的类型标签，作为第一标签。

13网络内容类型识别第四模型使用步骤：若只能获取到观看待识别的网络内容的用户的信息、所述网络内容的平台的信息、所述网络内容的信息，则将观看待识别的网络内容的用户的信息、所述网络内容的平台的信息、所述网络内容的信息作为输入，通过网络内容类型识别第四模型的计算得到的输出作为所述待识别的网络内容的类型标签，作为第一标签。

14网络内容类型识别第三模型使用步骤：若只能获取到观看待识别的网络内容的用户的信息、所述网络内容的信息，则将观看待识别的网络内容的用户的信息、所述网络内容的平台的信息作为输入，通过网络内容类型识别第三模型的计算得到的输出作为所述待识别的网络内容的类型标签，作为第一标签。

15网络内容类型识别第二模型使用步骤：若只能获取到观看待识别的网络内容的用户的信息、所述网络内容的平台的信息，则将观看待识别的网络内容的用户的信息、所述网络内容的平台的信息作为输入，通过网络内容类型识别第二模型的计算得到的输出作为所述待识别的网络内容的类型标签，作为第一标签。

16网络内容类型识别第一模型使用步骤：若只能获取到观看待识别的网络内容的用户的信息，则将观看待识别的网络内容的用户的信息作为输入，通过网络内容类型识别第一模型的计算得到的输出作为所述待识别的网络内容的类型标签，作为第一标签。技术效果：考虑到获取不同数据的难度，来根据能获取到的数据来调用不同的模型来进行识别，可以极大地提升模型的适用度。

步骤7之后，

17网络内容类型复核模型训练测试数据集获取步骤：获取用于训练和测试的网络内容、所述网络内容的类型标签。

18网络内容类型复核模型训练测试步骤：初始化深度学习模型作为网络内容类型复核模型；将所述网络内容作为输入，将所述网络内容的类型标签作为预期输出，对网络内容类型复核模型进行训练和测试。

19网络内容类型复核模型使用步骤：若所述待识别的网络内容的类型标签为非健康内容(非健康内容包括不良内容、违规内容、违法内容、等)，则将所述待识别的网络内容输入网络内容类型复核模型，计算得到的输出作为所述待识别的网络内容的类型标签，作为第二标签。技术效果：因为网络内容大部分都是健康内容，只有少部分是其他类型，所以先通过基于用户在深度学习模型将非健康的嫌疑内容快速筛选出来，然后再用比较耗时的基于网络内容的深度学习模型对嫌疑内容进行复核，来提高识别的准确率。

步骤19之后，

20人工复核步骤：若第二标签与第一标签一致，则将第二标签作为所述待识别的网络内容的类型标签返回给用户；若第二标签与第一标签不一致，则请求人工复核，并获取人工复核得到的类型标签作为第三标签；技术效果：通过基于用户信息的快速识别、基于网络内容的复核、基于人工的复核来层层把关，在加快网络内容检测速度的同时，又能确保检测的准确率。

21网络内容类型复核模型增量训练步骤：若第三标签与第一标签不一致，则将观看待识别的网络内容的用户的信息、所述网络内容的平台的信息、所述网络内容的信息作为输入，将第三标签作为预期输出，对网络内容类型识别模型进行增量训练；若第三标签与第二标签不一致，则将待识别的网络内容，将第三标签作为预期输出，对网络内容类型复核模型进行增量训练。技术效果：在通过网络内容类型识别模型、网络内容类型复核模型进行网络内容类型预测的同时，通过预测不准确的网络内容的实际类型对网络内容类型识别模型、网络内容类型复核模型进行增量训练，能够在模型使用过程中不断地提高模型的准确率。

步骤7之后，

22不良内容治理步骤：若若所述待识别的网络内容的类型标签为非健康内容，则通知用户“若所述待识别的网络内容的类型标签为非健康内容，需要及时处理”。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，则对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种人工智能治理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的人工智能治理方法，其特征在于，所述方法还包括：

3.根据权利要求1所述的人工智能治理方法，其特征在于，所述方法还包括：

4.根据权利要求1所述的人工智能治理方法，其特征在于，所述方法还包括：

5.一种人工智能治理***，其特征在于，所述***包括：

6.根据权利要求5所述的人工智能治理***，其特征在于，所述***还包括：

7.根据权利要求5所述的人工智能治理***，其特征在于，所述***还包括：

8.根据权利要求5所述的人工智能治理***，其特征在于，所述***还包括：

9.一种机器人，包括存储器、处理器及存储在存储器上并可在处理器上运行的人工智能机器人程序，其特征在于，所述处理器执行所述程序时实现权利要求1-4任意一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现权利要求1-4任意一项所述方法的步骤。