CN117522479A - 互联网广告精准投放方法及*** - Google Patents
互联网广告精准投放方法及*** Download PDFInfo
- Publication number
- CN117522479A CN117522479A CN202311473736.6A CN202311473736A CN117522479A CN 117522479 A CN117522479 A CN 117522479A CN 202311473736 A CN202311473736 A CN 202311473736A CN 117522479 A CN117522479 A CN 117522479A
- Authority
- CN
- China
- Prior art keywords
- internet advertisement
- sequence
- user
- internet
- semantic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000002716 delivery method Methods 0.000 title claims description 15
- 238000000034 method Methods 0.000 claims abstract description 21
- 239000013598 vector Substances 0.000 claims description 179
- 230000004927 fusion Effects 0.000 claims description 93
- 230000003993 interaction Effects 0.000 claims description 80
- 238000012549 training Methods 0.000 claims description 61
- 238000009826 distribution Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 13
- 238000011176 pooling Methods 0.000 claims description 10
- 230000006978 adaptation Effects 0.000 claims description 8
- 238000012937 correction Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 230000000644 propagated effect Effects 0.000 claims 1
- 238000012482 interaction analysis Methods 0.000 abstract description 4
- 230000006399 behavior Effects 0.000 description 19
- 230000006870 function Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
- G06Q30/0271—Personalized advertisement
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Finance (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请公开了一种互联网广告精准投放方法及***,涉及广告投放领域,其通过用户在互联网上的各种行为数据,如浏览网页、搜索关键词、点击链接、购买商品等,以及用户的基本信息,如年龄、性别、职业、收入等来构建用户画像,并在后端引入语义理解技术来进行用户画像和互联网广告的文本描述的语义交互分析,以此来为用户推送适合其需求和偏好的广告,通过这样的方式,能够实现互联网广告精准投放,提高广告的转化率和效果,同时降低广告的成本和资源浪费。
Description
技术领域
本申请涉及广告投放领域,且更为具体地,涉及一种互联网广告精准投放方法及***。
背景技术
互联网广告投放是一种通过互联网渠道向用户展示广告的方式。传统的互联网广告投放通常采用基于内容的广告投放方式,即根据网页或应用程序的内容将广告展示给用户。但是,基于内容的广告投放主要依赖于网页或应用程序的内容来确定广告的展示对象,而忽略了用户的个体特征和兴趣偏好,导致广告投放的精准度不高,往往无法准确匹配用户的需求和偏好,从而影响广告的效果和用户的体验。并且,由于传统的广告投放缺乏精准性,很多广告被展示给了不感兴趣或不相关的用户,导致广告资源的浪费。同时,频繁的广告干扰也会对用户造成困扰,降低用户对广告的接受度,且降低了广告的转化率和效果。
因此,期望一种优化的互联网广告精准投放方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种互联网广告精准投放方法及***,其通过用户在互联网上的各种行为数据,如浏览网页、搜索关键词、点击链接、购买商品等,以及用户的基本信息,如年龄、性别、职业、收入等来构建用户画像,并在后端引入语义理解技术来进行用户画像和互联网广告的文本描述的语义交互分析,以此来为用户推送适合其需求和偏好的广告,通过这样的方式,能够实现互联网广告精准投放,提高广告的转化率和效果,同时降低广告的成本和资源浪费。
根据本申请的一个方面,提供了一种互联网广告精准投放方法,其包括:
收集被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息;
对所述被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息进行处理和分析以得到用户画像;
对所述用户画像中的各个属性项进行语义理解以得到用户画像属性项语义特征向量的序列;
获取待推送互联网广告的文本描述;
对所述待推送互联网广告的文本描述进行语义理解以得到互联网广告描述词特征向量的序列;
对所述用户画像属性项语义特征向量的序列和所述互联网广告描述词特征向量的序列进行语义特征交互融合以得到互联网广告-被分析用户交互融合特征;以及
基于所述互联网广告-被分析用户交互融合特征,确定是否将所述待推送互联网广告展示给所述被分析用户。
根据本申请的另一个方面,提供了一种互联网广告精准投放***,其包括:
信息采集模块,用于收集被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息;
用户画像生成模块,用于对所述被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息进行处理和分析以得到用户画像;
用户画像属性语义理解模块,用于对所述用户画像中的各个属性项进行语义理解以得到用户画像属性项语义特征向量的序列;
文本描述获取模块,用于获取待推送互联网广告的文本描述;
互联网广告语义理解模块,用于对所述待推送互联网广告的文本描述进行语义理解以得到互联网广告描述词特征向量的序列;
语义特征交互融合模块,用于对所述用户画像属性项语义特征向量的序列和所述互联网广告描述词特征向量的序列进行语义特征交互融合以得到互联网广告-被分析用户交互融合特征;以及
结果生成模块,用于基于所述互联网广告-被分析用户交互融合特征,确定是否将所述待推送互联网广告展示给所述被分析用户。
与现有技术相比,本申请提供的一种互联网广告精准投放方法及***,其通过用户在互联网上的各种行为数据,如浏览网页、搜索关键词、点击链接、购买商品等,以及用户的基本信息,如年龄、性别、职业、收入等来构建用户画像,并在后端引入语义理解技术来进行用户画像和互联网广告的文本描述的语义交互分析,以此来为用户推送适合其需求和偏好的广告,通过这样的方式,能够实现互联网广告精准投放,提高广告的转化率和效果,同时降低广告的成本和资源浪费。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的互联网广告精准投放方法的流程图;
图2为根据本申请实施例的互联网广告精准投放方法的***架构图;
图3为根据本申请实施例的互联网广告精准投放方法的训练阶段的流程图;
图4为根据本申请实施例的互联网广告精准投放方法的子步骤S7的流程图;
图5为根据本申请实施例的互联网广告精准投放***的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
虽然本申请对根据本申请的实施例的***中的某些模块做出了各种引用,然而,任何数量的不同模块可以被使用并运行在用户终端和/或服务器上。所述模块仅是说明性的,并且所述***和方法的不同方面可以使用不同模块。
本申请中使用了流程图用来说明根据本申请的实施例的***所执行的操作。应当理解的是,前面或下面操作不一定按照顺序来精确地执行。相反,根据需要,可以按照倒序或同时处理各种步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
传统的广告投放缺乏精准性,很多广告被展示给了不感兴趣或不相关的用户,导致广告资源的浪费。同时,频繁的广告干扰也会对用户造成困扰,降低用户对广告的接受度,且降低了广告的转化率和效果。因此,期望一种优化的互联网广告精准投放方案。
在本申请的技术方案中,提出了一种互联网广告精准投放方法。图1为根据本申请实施例的互联网广告精准投放方法的流程图。图2为根据本申请实施例的互联网广告精准投放方法的***架构图。如图1和图2所示,根据本申请的实施例的互联网广告精准投放方法,包括步骤:S1,收集被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息;S2,对所述被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息进行处理和分析以得到用户画像;S3,对所述用户画像中的各个属性项进行语义理解以得到用户画像属性项语义特征向量的序列;S4,获取待推送互联网广告的文本描述;S5,对所述待推送互联网广告的文本描述进行语义理解以得到互联网广告描述词特征向量的序列;S6,对所述用户画像属性项语义特征向量的序列和所述互联网广告描述词特征向量的序列进行语义特征交互融合以得到互联网广告-被分析用户交互融合特征;以及,S7,基于所述互联网广告-被分析用户交互融合特征,确定是否将所述待推送互联网广告展示给所述被分析用户。
特别地,所述S1,收集被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息。其中,所述行为数据包括浏览网页、搜索关键词、点击链接和购买商品等,所述基本信息包括年龄、性别、职业和收入等。
特别地,所述S2,对所述被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息进行处理和分析以得到用户画像。也就是,在得到所述被分析用户的行为数据和基本信息后,对所述被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息进行处理和分析以得到用户画像,其中,所述用户画像包括用户的兴趣、需求、偏好等特征描述,以便于后续更为精准地为用户进行广告投放。
特别地,所述S3,对所述用户画像中的各个属性项进行语义理解以得到用户画像属性项语义特征向量的序列。考虑到用户画像通常包括多个属性项,例如用户的兴趣、需求、偏好等数据信息,这些属性项之间具有着语义关联关系,共同对于用户的兴趣、需求和偏好的语义理解和特征刻画产生影响。因此,为了能够为被分析用户投放适配其个性化的广告,在本申请的技术方案中,进一步将所述用户画像中的各个属性项输入包含词嵌入层的第一上下文编码器以得到用户画像属性项语义特征向量的序列。具体地,对所述用户画像中的各个属性项进行分词处理以将所述用户画像中的各个属性项转化为由多个词组成的词序列;使用所述包含词嵌入层的第一上下文编码器的嵌入层分别将所述词序列中各个词映射为词嵌入向量以得到词嵌入向量的序列;使用所述包含词嵌入层的第一上下文编码器的转换器对所述词嵌入向量的序列进行基于转换器思想的全局上下文语义编码以得到多个全局上下文语义特征向量;以及,将所述多个全局上下文语义特征向量进行级联以得到所述用户画像属性项语义特征向量的序列。
值得注意的是,上下文编码器是指一种深度神经网络模型,用于将输入序列中的上下文信息编码为一个固定维度的向量表示。它在自然语言处理和序列建模任务中广泛应用。上下文编码器的目标是捕捉输入序列中的语义和语法信息,以便后续的任务可以更好地理解和处理输入。它通常由循环神经网络(如长短时记忆网络LSTM或门控循环单元GRU)或者是自注意力机制(如Transformer)等模型组成。
特别地,所述S4和所述S5,获取待推送互联网广告的文本描述;以及,对所述待推送互联网广告的文本描述进行语义理解以得到互联网广告描述词特征向量的序列。也就是,获取待推送互联网广告的文本描述,并将所述待推送互联网广告的文本描述通过包含词嵌入层的第二上下文编码器中进行编码,以提取出所述待推送互联网广告的文本描述的语义理解特征信息,从而得到互联网广告描述词特征向量的序列。具体的,对所述待推送互联网广告的文本描述进行分词处理以将所述待推送互联网广告的文本描述转化为由多个词组成的词序列;使用所述包含词嵌入层的第二上下文编码器的嵌入层分别将所述词序列中各个词映射为词嵌入向量以得到词嵌入向量的序列;使用所述包含词嵌入层的第二上下文编码器的转换器对所述词嵌入向量的序列进行基于转换器思想的全局上下文语义编码以得到多个全局上下文语义特征向量;以及,将所述多个全局上下文语义特征向量进行级联以得到所述互联网广告描述词特征向量的序列。
特别地,所述S6,对所述用户画像属性项语义特征向量的序列和所述互联网广告描述词特征向量的序列进行语义特征交互融合以得到互联网广告-被分析用户交互融合特征。考虑到所述用户画像的各属性项语义特征和所述广告文本描述词语义特征之间具有着隐含的关联关系,这种关联关系对于广告和用户之间的适配度评估和精准投放具有重要作用。因此,为了将广告和用户的信息进行交互,从而获取更丰富的特征表示,在本申请的技术方案中,进一步将所述互联网广告描述词特征向量的序列和所述用户画像属性项语义特征向量的序列通过注意力交互融合模块以得到互联网广告-被分析用户交互融合特征向量。应可以理解,在互联网广告投放中,广告的描述词特征可以提供广告的文本语义信息,而用户画像属性项语义特征可以提供用户的个体特征和兴趣偏好,通过将这两者进行交互融合,可以获得更全面、更准确的特征表示,从而更好地理解广告和用户之间的关系。特别地,所述注意力交互融合模块可以通过计算所述各个互联网广告描述词特征向量和所述各个用户画像属性项语义特征向量之间的注意力权重,将两者进行加权交互融合。这样的融合方式可以使得模型更加关注广告和用户之间的相关性,强化相关特征的表示,减弱无关特征的影响,为后续的广告和用户的适配度分析和广告投放决策提供更准确的依据。具体地,首先,计算所述互联网广告描述词特征向量的序列和所述用户画像属性项语义特征向量的序列中任意两个特征向量之间的相关度以得到互联网广告-用户画像语义关联特征矩阵的序列;基于所述互联网广告-用户画像语义关联特征矩阵的序列,对所述互联网广告描述词特征向量的序列和所述用户画像属性项语义特征向量的序列进行特征交互注意力编码以得到注意力增强互联网广告描述词特征向量的序列和注意力增强用户画像属性项语义特征向量的序列;接着,融合所述互联网广告描述词特征向量的序列和所述注意力增强互联网广告描述词特征向量的序列中相应位置的特征向量以得到互联网广告描述词融合语义特征向量的序列,并融合所述用户画像属性项语义特征向量的序列和所述注意力增强用户画像属性项语义特征向量中相应位置的特征向量以得到用户画像属性项融合语义特征向量的序列;然后,对所述互联网广告描述词融合语义特征向量的序列进行最大值池化处理以得到互联网广告描述词融合语义最大值池化特征向量,并对所述用户画像属性项融合语义特征向量的序列进行最大值池化处理以得到用户画像属性项融合语义最大值池化特征向量;最后,融合所述互联网广告描述词融合语义最大值池化特征向量和所述用户画像属性项融合语义最大值池化特征向量以得到所述互联网广告-被分析用户交互融合特征向量。
特别地,所述S7,基于所述互联网广告-被分析用户交互融合特征,确定是否将所述待推送互联网广告展示给所述被分析用户。特别地,在本申请的一个具体示例中,如图4所示,所述S7,包括:S71,将所述互联网广告-被分析用户交互融合特征向量通过分类器以得到分类结果,所述分类结果用于表示待推送互联网广告与被分析用户之间的适配度是否超过预定阈值;以及,S72,基于所述分类结果,确定是否将所述待推送互联网广告展示给所述被分析用户。
具体地,所述S71,将所述互联网广告-被分析用户交互融合特征向量通过分类器以得到分类结果,所述分类结果用于表示待推送互联网广告与被分析用户之间的适配度是否超过预定阈值。也就是,利用所述互联网广告的语义特征和所述用户画像的语义特征之间的交互特征信息来进行分类处理,以此来对于待推送互联网广告与被分析用户之间的适配度进行分析和评估,并基于评估结果,确定是否将所述待推送互联网广告展示给所述被分析用户。这样,能够基于用户画像信息实现互联网广告的精准投放,提高广告投放的精准度和效果,同时降低广告的成本和资源浪费。更具体地,使用所述分类器的多个全连接层对所述互联网广告-被分析用户交互融合特征向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
分类器是指一种机器学习模型或算法,用于将输入数据分为不同的类别或标签。分类器是监督学习的一部分,它通过学习从输入数据到输出类别的映射关系来进行分类任务。
全连接层是神经网络中常见的一种层类型。在全连接层中,每个神经元都与上一层的所有神经元相连接,每个连接都有一个权重。这意味着全连接层中的每个神经元都接收来自上一层所有神经元的输入,并通过权重对这些输入进行加权求和,然后将结果传递给下一层。
Softmax分类函数是一种常用的激活函数,用于多分类问题。它将输入向量的每个元素转化为一个介于0和1之间的概率值,并且这些概率值的和等于1。Softmax函数常用于神经网络的输出层,特别适用于多分类问题,因为它能够将网络输出映射为各个类别的概率分布。在训练过程中,Softmax函数的输出可以用于计算损失函数,并通过反向传播算法来更新网络参数。值得注意的是,Softmax函数的输出并不会改变元素之间的相对大小关系,只是对其进行了归一化处理。因此,Softmax函数并不改变输入向量的特性,只是将其转化为概率分布形式。
具体地,所述S72,基于所述分类结果,确定是否将所述待推送互联网广告展示给所述被分析用户。也就是,在一个示例中,根据模型的输出结果和决策阈值,决定是否将待推送互联网广告展示给被分析用户。如果模型决策为展示广告,则将广告展示给用户;否则,不展示广告。
值得一提的是,在本申请的其他具体示例中,还可以通过其他方式基于所述互联网广告-被分析用户交互融合特征,确定是否将所述待推送互联网广告展示给所述被分析用户,例如:收集所需的互联网广告数据和被分析用户的交互数据;从收集到的数据中提取特征。这可以包括用户的兴趣偏好、行为模式、购买力等特征。同时,还可以提取广告的相关特征,如广告的内容、广告主的品牌等;将用户的交互特征和广告特征进行融合。这可以通过特征组合、特征加权等方式进行;使用融合后的特征作为输入,建立一个预测模型来确定是否将待推送互联网广告展示给被分析用户。这可以是一个分类模型,如逻辑回归、支持向量机等,也可以是一个深度学习模型,如神经网络等;使用已标记的训练数据对模型进行训练;对于新的待推送互联网广告和被分析用户,将其特征输入训练好的模型中进行推断。模型将输出一个概率或预测结果,表示是否将广告展示给用户;根据业务需求和模型性能,确定一个适当的决策阈值。当模型输出的概率高于该阈值时,决策为将广告展示给用户;否则,决策为不展示广告;根据模型的输出结果和决策阈值,决定是否将待推送互联网广告展示给被分析用户。如果模型决策为展示广告,则将广告展示给用户;否则,不展示广告。
应可以理解,在利用上述神经网络模型进行推断之前,需要对所述包含词嵌入层的第一上下文编码器、所述包含词嵌入层的第二上下文编码器、所述注意力交互融合模块和所述分类器进行训练。也就是说,在本申请的互联网广告精准投放方法中,还包括训练阶段,用于对所述包含词嵌入层的第一上下文编码器、所述包含词嵌入层的第二上下文编码器、所述注意力交互融合模块和所述分类器进行训练。
图3为根据本申请实施例的互联网广告精准投放方法的训练阶段的流程图。如图3所示,根据本申请实施例的互联网广告精准投放方法,包括:训练阶段,包括:S110,获取训练数据,所述训练数据包括被分析用户在互联网上的各种训练行为数据和所述被分析用户的训练基本信息,待推送互联网广告的训练文本描述,以及,所述待推送互联网广告与被分析用户之间的适配度是否超过预定阈值的真实值;S120,对所述被分析用户在互联网上的各种训练行为数据和所述被分析用户的训练基本信息进行处理和分析以得到训练用户画像;S130,将所述训练用户画像中的各个属性项输入所述包含词嵌入层的第一上下文编码器以得到训练用户画像属性项语义特征向量的序列;S140,将所述待推送互联网广告的训练文本描述通过所述包含词嵌入层的第二上下文编码器以得到训练互联网广告描述词特征向量的序列;S150,将所述训练互联网广告描述词特征向量的序列和所述训练用户画像属性项语义特征向量的序列通过所述注意力交互融合模块以得到训练互联网广告-被分析用户交互融合特征向量;S160,对所述训练互联网广告-被分析用户交互融合特征向量进行特征分布优化以得到优化训练互联网广告-被分析用户交互融合特征向量;S170,将所述优化训练互联网广告-被分析用户交互融合特征向量通过所述分类器以得到分类损失函数值;以及,S180,基于所述分类损失函数值并通过梯度下降的方向传播来对所述包含词嵌入层的第一上下文编码器、所述包含词嵌入层的第二上下文编码器、所述注意力交互融合模块和所述分类器进行训练。
其中,对所述训练互联网广告-被分析用户交互融合特征向量进行特征分布优化以得到优化训练互联网广告-被分析用户交互融合特征向量,包括:将所述训练互联网广告描述词特征向量的序列进行级联以得到的第一级联特征向量,并将所述训练用户画像属性项语义特征向量的序列进行级联以得到的第二级联特征向量;对所述第一级联特征向量和所述第二级联特征向量进行平衡化融合校正以得到校正特征向量;以及,将所述校正特征向量与所述训练互联网广告-被分析用户交互融合特征向量进行融合以得到所述优化训练互联网广告-被分析用户交互融合特征向量。
特别地,在本申请的技术方案中,所述互联网广告描述词特征向量的序列和所述用户画像属性项语义特征向量的序列分别表达所述待推送互联网广告的文本描述和所述用户画像中的各个属性项文本的文本语义特征,由此,使用注意力交互融合模块来对所述互联网广告描述词特征向量的序列和所述用户画像属性项语义特征向量的序列进行特征交互时,可以实现所述待推送互联网广告的文本描述和所述用户画像中的各个属性项文本的源文本语义特征分布的特征交互式融合。但是,本申请的申请人考虑到所述待推送互联网广告的文本描述和所述用户画像中的各个属性项文本的不同源文本语义分布强度,即,所述用户画像中的各个属性项文本在基于基本信息进行处理和分析的基础上,其源文本语义分布强度会大于所述待推送互联网广告的文本描述的源文本语义分布强度,由此,在通过注意力交互式融合来获得所述互联网广告-被分析用户交互融合特征向量时,可能导致所述互联网广告-被分析用户交互融合特征向量的表达不均衡,影响所述互联网广告-被分析用户交互融合特征向量的表达效果。基于此,优选地,对于所述互联网广告描述词特征向量的序列级联后得到的第一级联特征向量,例如记为V1和所述用户画像属性项语义特征向量的序列级联后得到的第二级联特征向量,例如记为V2进行特征插值式融合的目的损失自监督平衡化,以获得校正特征向量,例如记为Vc:
其中V1是所述第一级联特征向量,V2是所述第二级联特征向量,和/>分别表示所述第一级联特征向量和所述第二级联特征向量的全局均值的倒数,且I是单位向量,⊙表示按位置点乘,/>表示按位置作差,⊕表示按位置相加,Vc是所述校正特征向量。也就是,在考虑到基于语义特征分布的注意力交互式融合的情况下,如果将待融合的所述第二级联特征向量V2视为所述第一级联特征向量V1的强文本语义特征增强输入,则可能损失所述第一级联特征向量V1的目标特征流形在类空间内的目标分布信息,导致类回归目的损失,因此通过对特征分布相对于彼此的离群分布(outlier distribution)进行交叉惩罚的方式,可以在特征插值式融合时实现特征增强和回归鲁棒的自监督式平衡,以提升所述第一级联特征向量V1和所述第二级联特征向量V2的特征融合效果。这样,再将所述校正特征向量Vc与所述互联网广告-被分析用户交互融合特征向量融合,就可以提升所述互联网广告-被分析用户交互融合特征向量的表达效果,以提升其通过分类器得到的分类结果的准确性。这样,能够基于用户画像为用户推送适合其需求和偏好的广告,通过这样的方式,能够实现互联网广告的精准投放,提高广告投放的精准度和效果,同时降低广告的成本和资源浪费。
综上,根据本申请实施例的互联网广告精准投放方法被阐明,其通过用户在互联网上的各种行为数据,如浏览网页、搜索关键词、点击链接、购买商品等,以及用户的基本信息,如年龄、性别、职业、收入等来构建用户画像,并在后端引入语义理解技术来进行用户画像和互联网广告的文本描述的语义交互分析,以此来为用户推送适合其需求和偏好的广告,通过这样的方式,能够实现互联网广告精准投放,提高广告的转化率和效果,同时降低广告的成本和资源浪费。
进一步地,还提供一种互联网广告精准投放***。
图5为根据本申请实施例的互联网广告精准投放***的框图。如图5所示,根据本申请实施例的互联网广告精准投放***300,包括:信息采集模块310,用于收集被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息;用户画像生成模块320,用于对所述被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息进行处理和分析以得到用户画像;用户画像属性语义理解模块330,用于对所述用户画像中的各个属性项进行语义理解以得到用户画像属性项语义特征向量的序列;文本描述获取模块340,用于获取待推送互联网广告的文本描述;互联网广告语义理解模块350,用于对所述待推送互联网广告的文本描述进行语义理解以得到互联网广告描述词特征向量的序列;语义特征交互融合模块360,用于对所述用户画像属性项语义特征向量的序列和所述互联网广告描述词特征向量的序列进行语义特征交互融合以得到互联网广告-被分析用户交互融合特征;以及,结果生成模块370,用于基于所述互联网广告-被分析用户交互融合特征,确定是否将所述待推送互联网广告展示给所述被分析用户。
如上所述,根据本申请实施例的互联网广告精准投放***300可以实现在各种无线终端中,例如具有互联网广告精准投放算法的服务器等。在一种可能的实现方式中,根据本申请实施例的互联网广告精准投放***300可以作为一个软件模块和/或硬件模块而集成到无线终端中。例如,该互联网广告精准投放***300可以是该无线终端的操作***中的一个软件模块,或者可以是针对于该无线终端所开发的一个应用程序;当然,该互联网广告精准投放***300同样可以是该无线终端的众多硬件模块之一。
替换地,在另一示例中,该互联网广告精准投放***300与该无线终端也可以是分立的设备,并且该互联网广告精准投放***300可以通过有线和/或无线网络连接到该无线终端,并且按照约定的数据格式来传输交互信息。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (10)
1.一种互联网广告精准投放方法,其特征在于,包括:
收集被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息;
对所述被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息进行处理和分析以得到用户画像;
对所述用户画像中的各个属性项进行语义理解以得到用户画像属性项语义特征向量的序列;
获取待推送互联网广告的文本描述;
对所述待推送互联网广告的文本描述进行语义理解以得到互联网广告描述词特征向量的序列;
对所述用户画像属性项语义特征向量的序列和所述互联网广告描述词特征向量的序列进行语义特征交互融合以得到互联网广告-被分析用户交互融合特征;以及
基于所述互联网广告-被分析用户交互融合特征,确定是否将所述待推送互联网广告展示给所述被分析用户。
2.根据权利要求1所述的互联网广告精准投放方法,其特征在于,对所述用户画像中的各个属性项进行语义理解以得到用户画像属性项语义特征向量的序列,包括:将所述用户画像中的各个属性项输入包含词嵌入层的第一上下文编码器以得到所述用户画像属性项语义特征向量的序列。
3.根据权利要求2所述的互联网广告精准投放方法,其特征在于,对所述待推送互联网广告的文本描述进行语义理解以得到互联网广告描述词特征向量的序列,包括:将所述待推送互联网广告的文本描述通过包含词嵌入层的第二上下文编码器以得到所述互联网广告描述词特征向量的序列。
4.根据权利要求3所述的互联网广告精准投放方法,其特征在于,对所述用户画像属性项语义特征向量的序列和所述互联网广告描述词特征向量的序列进行语义特征交互融合以得到互联网广告-被分析用户交互融合特征,包括:将所述互联网广告描述词特征向量的序列和所述用户画像属性项语义特征向量的序列通过注意力交互融合模块以得到互联网广告-被分析用户交互融合特征向量作为所述互联网广告-被分析用户交互融合特征。
5.根据权利要求4所述的互联网广告精准投放方法,其特征在于,将所述互联网广告描述词特征向量的序列和所述用户画像属性项语义特征向量的序列通过注意力交互融合模块以得到互联网广告-被分析用户交互融合特征向量作为所述互联网广告-被分析用户交互融合特征,包括:
计算所述互联网广告描述词特征向量的序列和所述用户画像属性项语义特征向量的序列中任意两个特征向量之间的相关度以得到互联网广告-用户画像语义关联特征矩阵的序列;
基于所述互联网广告-用户画像语义关联特征矩阵的序列,对所述互联网广告描述词特征向量的序列和所述用户画像属性项语义特征向量的序列进行特征交互注意力编码以得到注意力增强互联网广告描述词特征向量的序列和注意力增强用户画像属性项语义特征向量的序列;
融合所述互联网广告描述词特征向量的序列和所述注意力增强互联网广告描述词特征向量的序列中相应位置的特征向量以得到互联网广告描述词融合语义特征向量的序列,并融合所述用户画像属性项语义特征向量的序列和所述注意力增强用户画像属性项语义特征向量中相应位置的特征向量以得到用户画像属性项融合语义特征向量的序列;
对所述互联网广告描述词融合语义特征向量的序列进行最大值池化处理以得到互联网广告描述词融合语义最大值池化特征向量,并对所述用户画像属性项融合语义特征向量的序列进行最大值池化处理以得到用户画像属性项融合语义最大值池化特征向量;以及
融合所述互联网广告描述词融合语义最大值池化特征向量和所述用户画像属性项融合语义最大值池化特征向量以得到所述互联网广告-被分析用户交互融合特征向量。
6.根据权利要求5所述的互联网广告精准投放方法,其特征在于,基于所述互联网广告-被分析用户交互融合特征,确定是否将所述待推送互联网广告展示给所述被分析用户,包括:
将所述互联网广告-被分析用户交互融合特征向量通过分类器以得到分类结果,所述分类结果用于表示待推送互联网广告与被分析用户之间的适配度是否超过预定阈值;以及
基于所述分类结果,确定是否将所述待推送互联网广告展示给所述被分析用户。
7.根据权利要求6所述的互联网广告精准投放方法,其特征在于,还包括训练步骤:用于对所述包含词嵌入层的第一上下文编码器、所述包含词嵌入层的第二上下文编码器、所述注意力交互融合模块和所述分类器进行训练。
8.根据权利要求7所述的互联网广告精准投放方法,其特征在于,所述训练步骤,包括:
获取训练数据,所述训练数据包括被分析用户在互联网上的各种训练行为数据和所述被分析用户的训练基本信息,待推送互联网广告的训练文本描述,以及,所述待推送互联网广告与被分析用户之间的适配度是否超过预定阈值的真实值;
对所述被分析用户在互联网上的各种训练行为数据和所述被分析用户的训练基本信息进行处理和分析以得到训练用户画像;
将所述训练用户画像中的各个属性项输入所述包含词嵌入层的第一上下文编码器以得到训练用户画像属性项语义特征向量的序列;
将所述待推送互联网广告的训练文本描述通过所述包含词嵌入层的第二上下文编码器以得到训练互联网广告描述词特征向量的序列;
将所述训练互联网广告描述词特征向量的序列和所述训练用户画像属性项语义特征向量的序列通过所述注意力交互融合模块以得到训练互联网广告-被分析用户交互融合特征向量;
对所述训练互联网广告-被分析用户交互融合特征向量进行特征分布优化以得到优化训练互联网广告-被分析用户交互融合特征向量;
将所述优化训练互联网广告-被分析用户交互融合特征向量通过所述分类器以得到分类损失函数值;以及
基于所述分类损失函数值并通过梯度下降的方向传播来对所述包含词嵌入层的第一上下文编码器、所述包含词嵌入层的第二上下文编码器、所述注意力交互融合模块和所述分类器进行训练。
9.根据权利要求8所述的互联网广告精准投放方法,其特征在于,对所述训练互联网广告-被分析用户交互融合特征向量进行特征分布优化以得到优化训练互联网广告-被分析用户交互融合特征向量,包括:
将所述训练互联网广告描述词特征向量的序列进行级联以得到的第一级联特征向量,并将所述训练用户画像属性项语义特征向量的序列进行级联以得到的第二级联特征向量;
对所述第一级联特征向量和所述第二级联特征向量进行平衡化融合校正以得到校正特征向量;以及
将所述校正特征向量与所述训练互联网广告-被分析用户交互融合特征向量进行融合以得到所述优化训练互联网广告-被分析用户交互融合特征向量。
10.一种互联网广告精准投放***,其特征在于,包括:
信息采集模块,用于收集被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息;
用户画像生成模块,用于对所述被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息进行处理和分析以得到用户画像;
用户画像属性语义理解模块,用于对所述用户画像中的各个属性项进行语义理解以得到用户画像属性项语义特征向量的序列;
文本描述获取模块,用于获取待推送互联网广告的文本描述;
互联网广告语义理解模块,用于对所述待推送互联网广告的文本描述进行语义理解以得到互联网广告描述词特征向量的序列;
语义特征交互融合模块,用于对所述用户画像属性项语义特征向量的序列和所述互联网广告描述词特征向量的序列进行语义特征交互融合以得到互联网广告-被分析用户交互融合特征;以及
结果生成模块,用于基于所述互联网广告-被分析用户交互融合特征,确定是否将所述待推送互联网广告展示给所述被分析用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311473736.6A CN117522479B (zh) | 2023-11-07 | 2023-11-07 | 互联网广告精准投放方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311473736.6A CN117522479B (zh) | 2023-11-07 | 2023-11-07 | 互联网广告精准投放方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117522479A true CN117522479A (zh) | 2024-02-06 |
CN117522479B CN117522479B (zh) | 2024-06-25 |
Family
ID=89746929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311473736.6A Active CN117522479B (zh) | 2023-11-07 | 2023-11-07 | 互联网广告精准投放方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117522479B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118250516A (zh) * | 2024-05-27 | 2024-06-25 | 长沙艾珀科技有限公司 | 一种针对用户的分级处理方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113254785A (zh) * | 2021-06-21 | 2021-08-13 | 腾讯科技(深圳)有限公司 | 推荐模型训练方法、推荐方法和相关设备 |
CN113706211A (zh) * | 2021-08-31 | 2021-11-26 | 平安科技(深圳)有限公司 | 基于神经网络的广告点击率预测方法及*** |
CN116228368A (zh) * | 2023-03-15 | 2023-06-06 | 重庆邮电大学 | 一种基于深度多行为网络的广告点击率预测方法 |
CN116797290A (zh) * | 2023-07-06 | 2023-09-22 | 滁州元宇数字科技有限公司 | 广告智能投放***及其方法 |
CN116821391A (zh) * | 2023-07-13 | 2023-09-29 | 哈尔滨工业大学 | 一种基于多级别语义对齐的跨模态图文检索方法 |
CN116911929A (zh) * | 2023-09-13 | 2023-10-20 | 北京茄豆网络科技有限公司 | 基于大数据的广告服务终端及方法 |
-
2023
- 2023-11-07 CN CN202311473736.6A patent/CN117522479B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113254785A (zh) * | 2021-06-21 | 2021-08-13 | 腾讯科技(深圳)有限公司 | 推荐模型训练方法、推荐方法和相关设备 |
CN113706211A (zh) * | 2021-08-31 | 2021-11-26 | 平安科技(深圳)有限公司 | 基于神经网络的广告点击率预测方法及*** |
CN116228368A (zh) * | 2023-03-15 | 2023-06-06 | 重庆邮电大学 | 一种基于深度多行为网络的广告点击率预测方法 |
CN116797290A (zh) * | 2023-07-06 | 2023-09-22 | 滁州元宇数字科技有限公司 | 广告智能投放***及其方法 |
CN116821391A (zh) * | 2023-07-13 | 2023-09-29 | 哈尔滨工业大学 | 一种基于多级别语义对齐的跨模态图文检索方法 |
CN116911929A (zh) * | 2023-09-13 | 2023-10-20 | 北京茄豆网络科技有限公司 | 基于大数据的广告服务终端及方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118250516A (zh) * | 2024-05-27 | 2024-06-25 | 长沙艾珀科技有限公司 | 一种针对用户的分级处理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117522479B (zh) | 2024-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109345302B (zh) | 机器学习模型训练方法、装置、存储介质和计算机设备 | |
Liu et al. | EDMF: Efficient deep matrix factorization with review feature learning for industrial recommender system | |
CN111222332B (zh) | 一种结合注意力网络和用户情感的商品推荐方法 | |
CN111275521B (zh) | 一种基于用户评论与满意层面嵌入的商品推荐方法 | |
CN111797321B (zh) | 一种面向不同场景的个性化知识推荐方法及*** | |
CN107683469A (zh) | 一种基于深度学习的产品分类方法及装置 | |
CN109189921B (zh) | 评论评估模型的训练方法和装置 | |
CN112256866B (zh) | 一种基于深度学习的文本细粒度情感分析算法 | |
CN117522479B (zh) | 互联网广告精准投放方法及*** | |
CN112288554B (zh) | 商品推荐方法和装置、存储介质及电子装置 | |
CN111563770A (zh) | 一种基于特征差异化学习的点击率预估方法 | |
CN111259140A (zh) | 一种基于lstm多实体特征融合的虚假评论检测方法 | |
WO2022218139A1 (zh) | 融合注意力机制的个性化搜索方法和搜索*** | |
CN109189922B (zh) | 评论评估模型的训练方法和装置 | |
WO2024041483A1 (zh) | 一种推荐方法及相关装置 | |
CN112819024A (zh) | 模型处理方法、用户数据处理方法及装置、计算机设备 | |
CN114529077A (zh) | 一种基于会话内异构行为的点击率预测方法 | |
CN116910357A (zh) | 一种数据处理方法及相关装置 | |
Bonthu et al. | Multi-label and Multi-class Classification on a Custom Dataset using Convolution Neural Networks | |
CN112435079B (zh) | 一种面向纯社交平台的广告推荐方法 | |
CN114519600A (zh) | 一种融合相邻节点方差的图神经网络ctr预估算法 | |
CN117611255B (zh) | 基于大数据的广告运营方法及*** | |
CN117786234B (zh) | 一种基于两阶段对比学习的多模态资源推荐方法 | |
CN117934079A (zh) | 基于物联网的广告精准推送方法、***及存储介质 | |
CN116957740B (zh) | 一种基于词特征的农产品推荐*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |