CN114663246A - 传播仿真中信息制品的表征建模方法及多智能体仿真方法 - Google Patents
传播仿真中信息制品的表征建模方法及多智能体仿真方法 Download PDFInfo
- Publication number
- CN114663246A CN114663246A CN202210566729.XA CN202210566729A CN114663246A CN 114663246 A CN114663246 A CN 114663246A CN 202210566729 A CN202210566729 A CN 202210566729A CN 114663246 A CN114663246 A CN 114663246A
- Authority
- CN
- China
- Prior art keywords
- information
- propagation
- information product
- product
- simulation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004088 simulation Methods 0.000 title claims abstract description 76
- 238000000034 method Methods 0.000 title claims abstract description 65
- 230000005540 biological transmission Effects 0.000 claims abstract description 55
- 230000007246 mechanism Effects 0.000 claims abstract description 39
- 230000008859 change Effects 0.000 claims abstract description 27
- 230000003993 interaction Effects 0.000 claims abstract description 27
- 238000012512 characterization method Methods 0.000 claims abstract description 15
- 230000006870 function Effects 0.000 claims abstract description 6
- 239000003795 chemical substances by application Substances 0.000 claims description 39
- 238000012545 processing Methods 0.000 claims description 31
- 230000000644 propagated effect Effects 0.000 claims description 20
- 230000001902 propagating effect Effects 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 13
- 230000002996 emotional effect Effects 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 12
- 239000002360 explosive Substances 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 11
- 230000008451 emotion Effects 0.000 claims description 9
- 238000012986 modification Methods 0.000 claims description 9
- 230000004048 modification Effects 0.000 claims description 9
- 230000006399 behavior Effects 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 6
- 230000019771 cognition Effects 0.000 claims description 6
- 238000009792 diffusion process Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000007621 cluster analysis Methods 0.000 claims description 4
- 238000009826 distribution Methods 0.000 claims description 4
- 238000004519 manufacturing process Methods 0.000 claims description 4
- 238000004806 packaging method and process Methods 0.000 claims description 4
- 238000012552 review Methods 0.000 claims description 4
- 238000012546 transfer Methods 0.000 claims description 4
- 238000010438 heat treatment Methods 0.000 claims description 3
- 230000001149 cognitive effect Effects 0.000 abstract description 6
- 238000007477 logistic regression Methods 0.000 abstract description 2
- 239000000047 product Substances 0.000 description 238
- 230000007480 spreading Effects 0.000 description 4
- 238000003892 spreading Methods 0.000 description 4
- 230000003930 cognitive ability Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000005541 medical transmission Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Business, Economics & Management (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种传播仿真中信息制品的表征建模方法及多智能体仿真方法,属于认知域传播仿真领域,包括步骤:提取信息制品的显式、隐式特征进行多维度建模,解决了传播仿真中信息的表征问题;设计了建模后的信息制品与传播主体的互作用机制;定义了传播判决机制,将信息制品与传播主体的互作用结果作为特征,使用逻辑回归函数对是否传播进行判定;提出信息制品更改判决机制,设计概率模型模拟传播过程中传播主体对信息制品地更改;将信息制品建模方法、互作用机制、传播判决机制、信息制品更改判决机制运用到多智能体仿真中,模拟现实生活中舆情的传播和演化。本发明解决了多智能体传播仿真要素缺失、仿真结果与真实传播结果差异较大的问题。
Description
技术领域
本发明涉及认知域传播仿真技术领域,更为具体的,涉及一种传播仿真中信息制品的表征建模方法及多智能体仿真方法。
背景技术
随着信息技术的不断进步,互联网、5G移动通信等网络实现了全球互联,大大丰富了信息传播的手段,提高了信息传播的速度、广度,对人类社会的生产与生活带来深远影响。信息传播是个人、组织和团体通过符号和媒介交流信息,向其他个人或团体传递观点、态度或情绪,以期发生相应变化的活动。对信息传播进行仿真,能够科学评估传播造成的影响,为正能量宣传、网络空间治理、企业品牌推广等提供决策支持,具有重大意义。
信息传播仿真涉及两个重要因素,一是信息制品,二是目标受众或媒体(及其构成的传播网络),如图1所示。
目前对信息传播仿真的研究主要集中于后者,如公开号为CN106682991A的中国专利公开了一种基于在线社交网络的信息传播模型及其传播方法,基于图论和传播动力学将传播抽象为复杂网络图及网络节点间的交互行为,以SIR疾病传播模型模拟传播过程。另一类研究关注信息中蕴含的要素,如公开号为CN107122416A的中国专利公开了一种中文事件抽取方法,基于NLP技术抽取事件相关的人物、时间、地点等实体要素。以上两类研究成果应用于信息传播领域时,存在以下问题:
(1)传播行为主要依赖社交关系。信息传播本质是由信息制品驱动的,信息制品的内容、形式是触发受众传播决定的先决条件,社交关系是传播决策链中的后置条件及次要因素,传播仿真中忽视信息本身的驱动力,造成因果倒置。
(2)信息制品在传播过程中一成不变。信息制品与目标受众或媒体会相互作用,每经过一次传播都可能对信息进行加工,即作为传播主体的输入和输出按照一定概率发生改变,多级传播后制品变化累积易造成较大偏差。
(3)受众认知能力固化。不同目标受众或媒体能够认知信息制品的能力存在差异,受到教育水平、生活习惯、兴趣爱好等多种因素影响,忽视该因素则传播驱动力区分度差。
发明内容
本发明的目的在于克服现有技术的不足,提供一种传播仿真中信息制品的表征建模方法及多智能体仿真方法,解决现有多智能体传播仿真要素缺失、仿真结果与真实传播结果差异较大的技术问题。
本发明的目的是通过以下方案实现的:
一种传播仿真中信息制品的表征建模方法,包括以下步骤:将影响信息制品传播扩散的因素分类为显式因素、隐式因素两类因素并进行相应处理后分别得到显式特征、隐式特征,再将得到的显式特征、隐式特征封装成信息制品表征模型。
进一步地,所述显式因素包括:语种,和/或格式,和/或篇幅,和/或命名实体,且对显式因素进行处理包括子步骤:
和/或,
对格式处理:将信息制品的格式分为纯文本、纯图片、文本和图片、纯音频、文本和音频、纯视频、文本和视频,遍历所有格式类别并对其进行离散化编码表示;对于包含图片、视频类别的信息制品,采用颜色直方图来描述图像的颜色特征信息,表示图像的特征分布;对于包含音频、视频的信息制品,提取其音色特征,训练音色分类器对信息制品中的音色进行分类;
和/或,
对篇幅处理:记录信息制品文本的字符长度,音频、视频的时长,根据历史舆情传播数据设置分级阈值,对信息制品篇幅进行分级,多模态信息制品的篇幅表示为其涵盖的每一类模态篇幅等级最高级;
和/或,
对命名实体处理:从两方面去捕捉信息制品的命名实体特征:第一方面,提取信息制品中的提及人,按符号@分割成提及人列表;提取信息制品发布时间,作为衡量新鲜度的标准;第二方面,利用命名实体识别算法提取信息制品文本中蕴含的人名、地名和时间。
进一步地,所述隐式因素包括:主题,和/或热度,和/或信度,和/或新鲜度,和/或情感倾向,和/或易爆性,且对隐式因素处理包括子步骤:
对主题处理:使用三维特征描述信息制品的主题,其中第一维提取信息制品中文本中的标签,标签包括社交平台文本的摘要,并分割成标签列表;第二维使用关键词提取算法提取信息制品关键词,描述信息制品内容;第三维使用事件抽取算法提取信息制品提及事件,生成四元组;
和/或,
和/或,
对信度处理:信息制品的信度即发送方权威度,用其原创信息的转发量来衡量,对舆情传播仿真场景中每一位发送方人工配置初始权威度,发送方权威度的计算公式表示为:
发送方权威度 = (初始权威度 * 总原创信息转发量) / 原创信息条数
和/或,
对新鲜度处理:新鲜度随着信息制品发布天数的增加而衰减,新鲜度使用衰减函数表示为:
其中d表示信息发布的天数,η表示衰减系数,可根据实际仿真情况设置;
和/或,
对情感倾向处理:采用七类情感分析法将信息制品表达的情感分为喜、怒、忧、思、悲、恐、惊;
和/或,
对易爆性处理:信息制品的易爆性由与当前网络热点的关联性和与易爆话题的相
似性组成;对舆情传播数据进行聚类分析,取其中热度属性排名设定值的话题形成网络已
有热点话题列表,信息制品与当前网络热点的关联性为每一个热点话题与信息制品主题的
关联性之和;整理现实生活中易吸引人关注的话题,形成热点话题词组,信息制品与
易爆话题的相似性为每一个热点话题与当前信息制品主题的相似度之和;将信息制
品的易爆性表示为:
进一步地,所述信息制品表征模型,能够针对不同的舆情仿真场景对模型中的显式特征、隐式特征做定制化修改。
一种多智能体仿真方法,包括以下步骤:
按照如上任一所述建模方法得到的信息制品表征模型对仿真环境中的信息建模,并初始化传播主体,配置传播主体间关系,传播主体为有独立记忆单元的智能体;
运行仿真环境,在T 0 时刻将信息制品随机输入到部分传播主体中,单一传播主体根据传播判决机制计算是否对当前输入信息制品进行传播,若传播,则进一步根据信息制品更改判决机制判决是否更改信息制品,若更改,则根据一定概率选择特征进行更改,否则,直接将原始信息在关系链中传播;若不传播,则遗弃本条信息;
T 1 时刻,接收到信息制品的传播主体开始判决是否传播信息,是否更改信息,并执行传播行为;通过N轮迭代模拟真实环境中的舆情传播与演化。
进一步地,所述单一传播主体根据传播判决机制计算是否对当前输入信息制品进行传播,包括子步骤:
当单一信息制品作用于单一传播主体时,其传播判决流程如下:首先判断传播主
体对信息制品的理解度,通过判断信息制品语种集合 与传播主体的语种集合是
否存在交集来决定是否传播;若为空集,则判决结果为不传播;若不为空集,即,则计算传播主体对信息制品的互作用然后更新传播主体认知,所述传
播主体对信息制品的互作用包括形式偏好度、兴趣度、亲疏度;根据所述信息制品
与传播主体的互作用结果设计传播判决机制对应模型为:
进一步地,所述根据信息制品更改判决机制判决是否更改信息制品,包括子步骤:设计概率模型模拟传播主体改变信息制品的现象,并根据实际传播仿真环境设置信息制品被更改的概率为q;
在传播过程中,首先判决传播主体是否会对信息制品进行传播,若是,传播主体有
概率q会对信息制品进行更改,更改体现在信息制品的语种、篇幅、格式、主题、命名实体、情
感倾向中的一种或多种,每一类特征对应被更改概率,按照如下表对应选择更改:
改变后的信息制品由传播主体向下传播,继续在仿真环境中流通。
本发明的有益效果包括:
本发明提供一种传播仿真中信息制品的表征建模方法,没有采用现有方案依赖社交关系的方案,而是根据舆情传播学和认知心理学知识,推导了影响信息制品传播扩散的因素,革新了信息制品的内容、形式,并通过显式、隐式特征抽象处理手段,实现对信息制品显、隐性特征的自动化表征,相比基于社交关系的模型,能够充分表征信息制品本身在传播过程中的驱动力。
本发明内容通过属性概率变化设计,建立认知能力与信息制品表征模型互作用机制,解决现有多智能体传播仿真要素缺失、仿真结果与真实传播结果差异较大的技术问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为信息传播两大要素关系示意图;
图2为信息制品模型;
图3为基于信息制品模型的传播判决流程图。
具体实施方式
下面结合附图和实施例对发明进一步说明。本说明书中所有实施例公开的所有特征,或隐含公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合和/或扩展、替换。
认知域信息传播评估是对信息化社会中的信息影响力的量化分析,主要有三种方法,即调查统计、传播动力学分析和多智能体仿真。其中调查统计、传播动力学分析是从宏观角度进行分析,而多智能体仿真是从微观角度,以个体-群体之间的交互驱动仿真整体传播情况,具有更强的推演能力,特别是对传播中的酝酿、涌现、聚集、衰减等现象可进行有效模拟。但现有的智能体构建模型及表征方法存在不足,针对上述问题,本发明实施例通过显式、隐式特征抽象,内容属性概率变化设计,建立认知能力与信息制品表征模型互作用机制,以解决现有多智能体传播仿真要素缺失、仿真结果与真实传播结果差异较大的技术问题。
实施例中,本发明实施例提出了一种传播仿真中信息制品的表征建模方法及多智能体仿真方法。以认知域传播仿真为例,详述该发明方法。实时例中主要讨论信息制品的表征、信息制品与传播主体的互作用机制、传播判决机制、信息制品更改判决机制和多智能体传播行为仿真等。
一、信息制品的表征
为充分表征信息制品本身在传播过程中的驱动力,结合舆情传播学和认知心理学相关知识,推导影响信息制品传播扩散的因素,并将其分类为显式、隐式两类特征进行抽取,信息制品模型如图2。利用自然语言处理、计算机视觉等相关算法针对每一类特征实现特征抽取算子,封装成信息制品表征模型,实现对信息制品显、隐性特征的自动化表征。
(1)信息制品的显式特征:包括信息制品的语种、格式、篇幅、命名实体等。
2)格式:将信息制品的格式分为纯文本、纯图片、文本+图片、纯音频、文本+音频、纯视频、文本+视频等,遍历所有格式类别并对其进行离散化编码表示。
对于包含图片、视频类别的信息制品,其图片色彩、视频色彩特征也是影响传播的因素之一。采用颜色直方图来描述图像的颜色特征信息,表示图像的特征分布。
对于包含音频、视频的信息制品,提取其音色特征,通常信息制品中的音色包含人声、乐声、噪声,人声又分为男声、女声、童声,训练音色分类器对信息制品中的音色进行分类。
3)篇幅:记录信息制品文本的字符长度,音频、视频的时长,根据历史舆情传播数据设置分级阈值,对信息制品篇幅进行分级,多模态信息制品的篇幅表示为其涵盖的每一类模态篇幅等级最高级。
4)命名实体:从两方面去捕捉信息制品的命名实体特征。浅层地,提取信息制品中形如“@xxx”的提及人,按符号@分割成提及人列表;提取信息制品发布时间,作为衡量新鲜度的标准。深层地,利用命名实体识别算法提取信息制品文本中蕴含的人名、地名、时间等。
(2)信息制品的隐式特征:包括信息制品的主题、热度、信度、新鲜度、情感倾向、易爆度。
1)主题:使用三维特征来描述信息制品的主题,第一维是提取信息制品中文本中形如“#xxx#”的标签,这类标签通常是对社交平台文本的摘要,按符号#分割成标签列表;第二维是使用关键词提取算法提取信息制品关键词,描述信息制品主要内容;第三维是使用事件抽取算法提取信息制品提及事件,生成形如<事件类型、事件触发词、事件要素、要素角色>四元组。
3)信度:信息制品的信度即发送方权威度,用其原创信息的转发量来衡量,对舆情传播仿真场景中每一位发送方人工配置初始权威度,发送方权威度的计算公式可以表示为:
发送方权威度 = (初始权威度 * 总原创信息转发量) / 原创信息条数
4)新鲜度:新鲜度随着信息制品发布天数的增加而衰减,新鲜度可使用衰减函数表示为:
其中d表示信息发布的天数,η表示衰减系数,可根据实际仿真情况设置。
5)情感倾向:采用七类情感分析法将信息制品表达的情感分为喜、怒、忧、思、悲、恐、惊。
6)易爆性:信息制品的易爆性由与当前网络热点的关联性和与易爆话题的相似性
组成。对舆情传播数据进行聚类分析,取其中热度属性排名前十的话题形成网络已有热点
话题列表,信息制品与当前网络热点的关联性为每一个热点话题与信息制品主题的关联性
之和。整理现实生活中易吸引人关注的话题,形成热点话题词组,如“炫富”、“明星”
等,信息制品与易爆话题的相似性为每一个热点话题与当前信息制品主题的相似度之和。信息制品的易爆性可表示为:
本发明列举出的信息制品表征模型为一般通用版本,针对不同的舆情仿真场景可以对表征模型做定制化修改。
二、信息制品与传播主体的互作用机制
信息制品与传播主体之间的互作用由传播主体对信息的理解度、形式偏好度,兴趣度、亲疏度构成。
1)传播主体对信息制品的理解度:
判定传播主体的语种集与信息制品抽取出的语种集是否有交集,需满足下式描述的条件,信息制品才能被理解,进而被传播。
2)传播主体对信息制品的形式偏好度:
3)传播主体对信息制品的兴趣度:
4)传播主体对信息制品的亲疏度:
三、传播判决机制
传播主体的传播策略集合如下表所示:
主体 | 策略集合 |
A | {传播、不传播} |
B | {传播、不传播} |
当单一信息制品作用于单一传播主体时,其传播判决流程如下:首先判断传播主
体对信息制品的理解度,即是否为空集。若为空集,则判决结果为不传
播,若不为空集,则计算传播主体对信息制品的形式偏好度、兴趣度、亲疏度。根据上述信息
制品与传播主体的互作用结果,传播判决机制对应模型为:
四、信息制品更改判决机制
传播主体对信息制品的更改策略集合如下表所示:
主体 | 策略集合 |
A | {更改、不更改} |
B | {更改、不更改} |
为使舆情传播仿真更贴近现实情况,设计概率模型模拟传播主体改变信息制品的
现象。根据实际传播仿真环境设置信息制品被更改的概率为q。在传播过程中,首先判决传
播主体是否会对信息制品进行传播,若是,传播主体有概率q会对信息制品进行更改。更改
主要体现在以下特征,包括信息制品的语种、篇幅、格式、主题、命名实体、情感倾向等,每一
类特征对应被更改概率。
改变后的信息制品由传播主体向下传播,继续在仿真环境中流通,避免了多级传播后制品一成不变造成的传播误差。
五、多智能体传播行为仿真
结合上述模型、机制,采用多智能体建模技术模拟现实生活中舆情传播场景。按照信息制品表征模型对仿真环境中的信息建模,初始化传播主体,配置传播主体间关系,传播主体为有独立记忆单元的智能体。运行仿真环境,T 0 时刻,将信息制品随机输入到部分传播主体中,单一传播主体根据传播判决机制计算是否对当前输入信息制品进行传播,若传播,则进一步根据信息制品更改判决机制判决是否更改信息制品,若更改,则根据一定概率选择特征进行更改,否则,直接将原始信息在关系链中传播,若不传播,则遗弃本条信息。T 1 时刻,接收到信息制品的传播主体开始判决是否传播信息,是否更改信息,并执行传播行为。通过N轮迭代模拟真实环境中的舆情传播与演化。
本发明提取信息制品的显式、隐式特征进行多维度建模,解决了传播仿真中信息的表征问题,充分考虑仿真中信息制品本身的驱动力;设计了一种建模后的信息制品与传播主体的互作用机制;进一步地,定义了传播判决机制,将信息制品与传播主体的互作用结果作为特征,使用逻辑回归函数对是否传播进行判定;创新性地提出信息制品更改判决机制,设计概率模型模拟传播过程中传播主体对信息制品地更改;进一步地,将信息制品建模方法、互作用机制、传播判决机制、信息制品更改判决机制运用到多智能体仿真中,模拟现实生活中舆情的传播和演化。
实施例1:一种传播仿真中信息制品的表征建模方法,包括以下步骤:将影响信息制品传播扩散的因素分类为显式因素、隐式因素两类因素并进行相应处理后分别得到显式特征、隐式特征,再将得到的显式特征、隐式特征封装成信息制品表征模型。
实施例2:在实施例1的基础上,所述显式因素包括:语种,和/或格式,和/或篇幅,和/或命名实体,且对显式因素进行处理包括子步骤:
和/或,
对格式处理:将信息制品的格式分为纯文本、纯图片、文本和图片、纯音频、文本和音频、纯视频、文本和视频,遍历所有格式类别并对其进行离散化编码表示;对于包含图片、视频类别的信息制品,采用颜色直方图来描述图像的颜色特征信息,表示图像的特征分布;对于包含音频、视频的信息制品,提取其音色特征,训练音色分类器对信息制品中的音色进行分类;
和/或,
对篇幅处理:记录信息制品文本的字符长度,音频、视频的时长,根据历史舆情传播数据设置分级阈值,对信息制品篇幅进行分级,多模态信息制品的篇幅表示为其涵盖的每一类模态篇幅等级最高级;
和/或,
对命名实体处理:从两方面去捕捉信息制品的命名实体特征:第一方面,提取信息制品中的提及人,按符号@分割成提及人列表;提取信息制品发布时间,作为衡量新鲜度的标准;第二方面,利用命名实体识别算法提取信息制品文本中蕴含的人名、地名和时间。
实施例3:在实施例1的基础上,所述隐式因素包括:主题,和/或热度,和/或信度,和/或新鲜度,和/或情感倾向,和/或易爆性,且对隐式因素处理包括子步骤:
对主题处理:使用三维特征描述信息制品的主题,其中第一维提取信息制品中文本中的标签,标签包括社交平台文本的摘要,并分割成标签列表;第二维使用关键词提取算法提取信息制品关键词,描述信息制品内容;第三维使用事件抽取算法提取信息制品提及事件,生成四元组;
和/或,
和/或,
对信度处理:信息制品的信度即发送方权威度,用其原创信息的转发量来衡量,对舆情传播仿真场景中每一位发送方人工配置初始权威度,发送方权威度的计算公式表示为:
发送方权威度 = (初始权威度 * 总原创信息转发量) / 原创信息条数
和/或,
对新鲜度处理:新鲜度随着信息制品发布天数的增加而衰减,新鲜度使用衰减函数表示为:
其中d表示信息发布的天数,η表示衰减系数,可根据实际仿真情况设置;
和/或,
对情感倾向处理:采用七类情感分析法将信息制品表达的情感分为喜、怒、忧、思、悲、恐、惊;
和/或,
对易爆性处理:信息制品的易爆性由与当前网络热点的关联性和与易爆话题的相
似性组成;对舆情传播数据进行聚类分析,取其中热度属性排名设定值的话题形成网络已
有热点话题列表,信息制品与当前网络热点的关联性为每一个热点话题与信息制品主题的
关联性之和;整理现实生活中易吸引人关注的话题,形成热点话题词组,信息制品与
易爆话题的相似性为每一个热点话题与当前信息制品主题的相似度之和;将信息制
品的易爆性表示为:
实施例4:在实施例1的基础上,所述信息制品表征模型,能够针对不同的舆情仿真场景对模型中的显式特征、隐式特征做定制化修改。
实施例5:一种多智能体仿真方法,包括以下步骤:
按照实施例1~实施例3任一所述建模方法得到的信息制品表征模型对仿真环境中的信息建模,并初始化传播主体,配置传播主体间关系,传播主体为有独立记忆单元的智能体;
运行仿真环境,在T 0 时刻将信息制品随机输入到部分传播主体中,单一传播主体根据传播判决机制计算是否对当前输入信息制品进行传播,若传播,则进一步根据信息制品更改判决机制判决是否更改信息制品,若更改,则根据一定概率选择特征进行更改,否则,直接将原始信息在关系链中传播;若不传播,则遗弃本条信息;
T 1 时刻,接收到信息制品的传播主体开始判决是否传播信息,是否更改信息,并执行传播行为;通过N轮迭代模拟真实环境中的舆情传播与演化。
实施例6:在实施例5的基础上,所述单一传播主体根据传播判决机制计算是否对当前输入信息制品进行传播,包括子步骤:
当单一信息制品作用于单一传播主体时,其传播判决流程如下:首先判断传播主
体对信息制品的理解度,通过判断信息制品语种集合与传播主体的语种集合是
否存在交集来决定是否传播;若为空集,则判决结果为不传播;若不为空集,即,则计算传播主体对信息制品的互作用然后更新传播主体认知,所述传
播主体对信息制品的互作用包括形式偏好度、兴趣度、亲疏度;根据所述信息制品
与传播主体的互作用结果设计传播判决机制对应模型为:
实施例7:在实施例5的基础上,所述根据信息制品更改判决机制判决是否更改信息制品,包括子步骤:设计概率模型模拟传播主体改变信息制品的现象,并根据实际传播仿真环境设置信息制品被更改的概率为q;
在传播过程中,首先判决传播主体是否会对信息制品进行传播,若是,传播主体有
概率q会对信息制品进行更改,更改体现在信息制品的语种、篇幅、格式、主题、命名实体、情
感倾向中的一种或多种,每一类特征对应被更改概率,按照如下表对应选择更改:
改变后的信息制品由传播主体向下传播,继续在仿真环境中流通。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的方法。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。
上述技术方案只是本发明的一种实施方式,对于本领域内的技术人员而言,在本发明公开了应用方法和原理的基础上,很容易做出各种类型的改进或变形,而不仅限于本发明上述具体实施方式所描述的方法,因此前面描述的方式只是优选的,而并不具有限制性的意义。
除以上实例以外,本领域技术人员根据上述公开内容获得启示或利用相关领域的知识或技术进行改动获得其他实施例,各个实施例的特征可以互换或替换,本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (10)
1.一种传播仿真中信息制品的表征建模方法,其特征在于,包括以下步骤:将影响信息制品传播扩散的因素分类为显式因素、隐式因素两类因素并进行相应处理后分别得到显式特征、隐式特征,再将得到的显式特征、隐式特征封装成信息制品表征模型。
2.根据权利要求1所述的传播仿真中信息制品的表征建模方法,其特征在于,所述显式因素包括:语种,和/或格式,和/或篇幅,和/或命名实体,且对显式因素进行处理包括子步骤:
和/或,
对格式处理:将信息制品的格式分为纯文本、纯图片、文本和图片、纯音频、文本和音频、纯视频、文本和视频,遍历所有格式类别并对其进行离散化编码表示;对于包含图片、视频类别的信息制品,采用颜色直方图来描述图像的颜色特征信息,表示图像的特征分布;对于包含音频、视频的信息制品,提取其音色特征,训练音色分类器对信息制品中的音色进行分类;
和/或,
对篇幅处理:记录信息制品文本的字符长度,音频、视频的时长,根据历史舆情传播数据设置分级阈值,对信息制品篇幅进行分级,多模态信息制品的篇幅表示为其涵盖的每一类模态篇幅等级最高级;
和/或,
对命名实体处理:从两方面去捕捉信息制品的命名实体特征:第一方面,提取信息制品中的提及人,按符号@分割成提及人列表;提取信息制品发布时间,作为衡量新鲜度的标准;第二方面,利用命名实体识别算法提取信息制品文本中蕴含的人名、地名和时间。
3.根据权利要求1所述的传播仿真中信息制品的表征建模方法,其特征在于,所述隐式因素包括:主题,和/或热度,和/或信度,和/或新鲜度,和/或情感倾向,和/或易爆性,且对隐式因素处理包括子步骤:
对主题处理:使用三维特征描述信息制品的主题,其中第一维提取信息制品中文本中的标签,标签包括社交平台文本的摘要,并分割成标签列表;第二维使用关键词提取算法提取信息制品关键词,描述信息制品内容;第三维使用事件抽取算法提取信息制品提及事件,生成四元组;
和/或,
和/或,
对信度处理:信息制品的信度即发送方权威度,用其原创信息的转发量来衡量,对舆情传播仿真场景中每一位发送方人工配置初始权威度,发送方权威度的计算公式表示为:
发送方权威度 = (初始权威度 * 总原创信息转发量) / 原创信息条数
和/或,
对新鲜度处理:新鲜度随着信息制品发布天数的增加而衰减,新鲜度使用衰减函数表示为:
其中d表示信息发布的天数,η表示衰减系数,可根据实际仿真情况设置;
和/或,
对情感倾向处理:采用七类情感分析法将信息制品表达的情感分为喜、怒、忧、思、悲、恐、惊;
和/或,
对易爆性处理:信息制品的易爆性由与当前网络热点的关联性和与易爆话题的相似性
组成;对舆情传播数据进行聚类分析,取其中热度属性排名设定值的话题形成网络已有热
点话题列表,信息制品与当前网络热点的关联性为每一个热点话题与信息制品主题的关联
性之和;整理现实生活中易吸引人关注的话题,形成热点话题词组,信息制品与易爆
话题的相似性为每一个热点话题与当前信息制品主题的相似度之和;将信息制品的
易爆性表示为:
4.根据权利要求1所述的传播仿真中信息制品的表征建模方法,其特征在于,所述信息制品表征模型,能够针对不同的舆情仿真场景对模型中的显式特征、隐式特征做定制化修改。
5.一种多智能体仿真方法,其特征在于,包括以下步骤:
按照权利要求1~3任一所述建模方法得到的信息制品表征模型对仿真环境中的信息建模,并初始化传播主体,配置传播主体间关系,传播主体为有独立记忆单元的智能体;
运行仿真环境,在T 0 时刻将信息制品随机输入到部分传播主体中,单一传播主体根据传播判决机制计算是否对当前输入信息制品进行传播,若传播,则进一步根据信息制品更改判决机制判决是否更改信息制品,若更改,则根据一定概率选择特征进行更改,否则,直接将原始信息在关系链中传播;若不传播,则遗弃本条信息;
T 1 时刻,接收到信息制品的传播主体开始判决是否传播信息,是否更改信息,并执行传播行为;通过N轮迭代模拟真实环境中的舆情传播与演化。
6.根据权利要求5所述的多智能体仿真方法,其特征在于,所述单一传播主体根据传播判决机制计算是否对当前输入信息制品进行传播,包括子步骤:
当单一信息制品作用于单一传播主体时,其传播判决流程如下:首先判断传播主体对
信息制品的理解度,通过判断信息制品语种集合与传播主体的语种集合是否存
在交集来决定是否传播;若为空集,则判决结果为不传播;若不为空集,即,计算传播主体对信息制品的互作用然后更新传播主体认知,所述传播
主体对信息制品的互作用包括形式偏好度、兴趣度、亲疏度;根据所述信息制品与
传播主体的互作用结果设计传播判决机制对应模型为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210566729.XA CN114663246B (zh) | 2022-05-24 | 2022-05-24 | 传播仿真中信息制品的表征建模方法及多智能体仿真方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210566729.XA CN114663246B (zh) | 2022-05-24 | 2022-05-24 | 传播仿真中信息制品的表征建模方法及多智能体仿真方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114663246A true CN114663246A (zh) | 2022-06-24 |
CN114663246B CN114663246B (zh) | 2022-09-23 |
Family
ID=82037619
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210566729.XA Active CN114663246B (zh) | 2022-05-24 | 2022-05-24 | 传播仿真中信息制品的表征建模方法及多智能体仿真方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114663246B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101976231A (zh) * | 2010-08-25 | 2011-02-16 | 孙强国 | 一种多语种短信息的网络监管方法 |
CN102262624A (zh) * | 2011-08-08 | 2011-11-30 | 中国科学院自动化研究所 | 基于多模态辅助的实现跨语言沟通***及方法 |
CN102929918A (zh) * | 2012-09-20 | 2013-02-13 | 西北工业大学 | 虚假网络舆情识别方法 |
CN102945268A (zh) * | 2012-10-25 | 2013-02-27 | 北京腾逸科技发展有限公司 | 产品特征评论挖掘方法及*** |
CN104834632A (zh) * | 2015-05-13 | 2015-08-12 | 北京工业大学 | 一种基于语义扩充的微博话题检测和热度评估方法 |
CN105303998A (zh) * | 2014-07-24 | 2016-02-03 | 北京三星通信技术研究有限公司 | 基于观众之间的关联信息播放广告的方法、装置和设备 |
CN106682991A (zh) * | 2016-12-21 | 2017-05-17 | 重庆邮电大学 | 一种基于在线社交网络的信息传播模型及其传播方法 |
CN109064347A (zh) * | 2017-06-11 | 2018-12-21 | 南京理工大学 | 基于多智能体的信息传播与舆情演化仿真方法 |
CN109299808A (zh) * | 2018-06-04 | 2019-02-01 | 西安电子科技大学 | 基于群体劝说力建模的网民观点演化趋势预测方法 |
CN109657330A (zh) * | 2018-12-14 | 2019-04-19 | 中国人民解放军国防科技大学 | 基于分布式平台的大规模网络信息传播计算方法及装置 |
CN112395417A (zh) * | 2020-11-18 | 2021-02-23 | 长沙学院 | 基于深度学习的网络舆情演化仿真方法及*** |
US20210089579A1 (en) * | 2019-09-23 | 2021-03-25 | Arizona Board Of Regents On Behalf Of Arizona State University | Method and apparatus for collecting, detecting and visualizing fake news |
-
2022
- 2022-05-24 CN CN202210566729.XA patent/CN114663246B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101976231A (zh) * | 2010-08-25 | 2011-02-16 | 孙强国 | 一种多语种短信息的网络监管方法 |
CN102262624A (zh) * | 2011-08-08 | 2011-11-30 | 中国科学院自动化研究所 | 基于多模态辅助的实现跨语言沟通***及方法 |
CN102929918A (zh) * | 2012-09-20 | 2013-02-13 | 西北工业大学 | 虚假网络舆情识别方法 |
CN102945268A (zh) * | 2012-10-25 | 2013-02-27 | 北京腾逸科技发展有限公司 | 产品特征评论挖掘方法及*** |
CN105303998A (zh) * | 2014-07-24 | 2016-02-03 | 北京三星通信技术研究有限公司 | 基于观众之间的关联信息播放广告的方法、装置和设备 |
CN104834632A (zh) * | 2015-05-13 | 2015-08-12 | 北京工业大学 | 一种基于语义扩充的微博话题检测和热度评估方法 |
CN106682991A (zh) * | 2016-12-21 | 2017-05-17 | 重庆邮电大学 | 一种基于在线社交网络的信息传播模型及其传播方法 |
CN109064347A (zh) * | 2017-06-11 | 2018-12-21 | 南京理工大学 | 基于多智能体的信息传播与舆情演化仿真方法 |
CN109299808A (zh) * | 2018-06-04 | 2019-02-01 | 西安电子科技大学 | 基于群体劝说力建模的网民观点演化趋势预测方法 |
CN109657330A (zh) * | 2018-12-14 | 2019-04-19 | 中国人民解放军国防科技大学 | 基于分布式平台的大规模网络信息传播计算方法及装置 |
US20210089579A1 (en) * | 2019-09-23 | 2021-03-25 | Arizona Board Of Regents On Behalf Of Arizona State University | Method and apparatus for collecting, detecting and visualizing fake news |
CN112395417A (zh) * | 2020-11-18 | 2021-02-23 | 长沙学院 | 基于深度学习的网络舆情演化仿真方法及*** |
Non-Patent Citations (8)
Title |
---|
万晓红等: "新传播生态下体育赛事网络舆论特征及治理——基于结构分析与情感分析的双重视角", 《体育科学》 * |
刘德寰等: "国内新闻传播领域人工智能技术研究综述", 《中国记者》 * |
周娜等: "基于潜在主题的知识组合分析研究――以传播学为例", 《农业图书情报学刊》 * |
崔宁: "传播主体实现本体知识建构与思维创新的认知机制", 《现代传播(中国传媒大学学报)》 * |
曾润喜等: "网络舆情信息传播动力机制的比较研究", 《图书情报工作》 * |
朱毅华等: "网络舆情研究中的仿真方法应用综述", 《情报杂志》 * |
李洋等: "微博信息传播预测研究综述", 《软件学报》 * |
陈晓鸥等: "音乐情感识别研究进展", 《复旦学报(自然科学版)》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114663246B (zh) | 2022-09-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111008278B (zh) | 内容推荐方法及装置 | |
CN111858960B (zh) | 面向本质计算的跨dikw图谱的虚拟社区资源处理方法及组件 | |
Preotiuc-Pietro et al. | Studying the Dark Triad of personality through Twitter behavior | |
CN110737783B (zh) | 一种推荐多媒体内容的方法、装置及计算设备 | |
CN107357889A (zh) | 一种基于内容或情感相似性的跨社交平台图片推荐算法 | |
CN111814982B (zh) | 面向多跳问答的动态推理网络***及方法 | |
US20130066823A1 (en) | Knowledge representation systems and methods incorporating customization | |
CN109844741A (zh) | 在自动聊天中生成响应 | |
US20130046723A1 (en) | Knowledge representation systems and methods incorporating customization | |
CN101770487A (zh) | 社交网络中用户影响力的计算方法和*** | |
US12020267B2 (en) | Method, apparatus, storage medium, and device for generating user profile | |
CN110309114A (zh) | 媒体信息的处理方法、装置、存储介质和电子装置 | |
CN112633690A (zh) | 服务人员信息分配方法、装置、计算机设备和存储介质 | |
EP3340073A1 (en) | Systems and methods for processing of user content interaction | |
Van Haeringen et al. | Emotion contagion in agent-based simulations of crowds: a systematic review | |
CN110991742A (zh) | 一种社交网络信息转发概率预测方法及*** | |
CN115659008A (zh) | 大数据信息反馈的信息推送***、方法、电子设备及介质 | |
WO2019242453A1 (zh) | 信息处理方法及装置、存储介质、电子装置 | |
Li et al. | Configurational patterns for COVID-19 related social media rumor refutation effectiveness enhancement based on machine learning and fsQCA | |
CN114357204A (zh) | 媒体信息的处理方法及相关设备 | |
CN117875501A (zh) | 一种基于大数据的社交媒体用户行为预测***及方法 | |
CN111680505B (zh) | 一种Markdown特征感知的无监督关键词提取方法 | |
CN114663246B (zh) | 传播仿真中信息制品的表征建模方法及多智能体仿真方法 | |
Tarwani et al. | Survey of Cyberbulling Detection on Social Media Big-Data. | |
CN111079084A (zh) | 一种基于长短时记忆网络的信息转发概率预测方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |