CN108664585A - 一种基于大数据的广告选词方法 - Google Patents

一种基于大数据的广告选词方法 Download PDF

Info

Publication number
CN108664585A
CN108664585A CN201810425266.9A CN201810425266A CN108664585A CN 108664585 A CN108664585 A CN 108664585A CN 201810425266 A CN201810425266 A CN 201810425266A CN 108664585 A CN108664585 A CN 108664585A
Authority
CN
China
Prior art keywords
word
phrase
app
weight
big data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810425266.9A
Other languages
English (en)
Inventor
李阳
杨翠
曲锐
王友文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panco Technology Co Ltd (chinese) Rui
Original Assignee
Panco Technology Co Ltd (chinese) Rui
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panco Technology Co Ltd (chinese) Rui filed Critical Panco Technology Co Ltd (chinese) Rui
Priority to CN201810425266.9A priority Critical patent/CN108664585A/zh
Publication of CN108664585A publication Critical patent/CN108664585A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于广告选词的技术领域,具体涉及一种基于大数据的广告选词方法;解决的技术问题为:提供一种选词效率较高的基于大数据的广告选词方法;采用的技术方案为:一种基于大数据的广告选词方法,包括自动推荐方法,所述自动推荐方法,包括:建立APP相关的精选词组库;提取出所有候选关键词;计算每个候选关键词的权重,并按权重进行排序;接收选词数量N;推送出N个投放关键词;还包括:手动添加方法,所述手动添加方法,包括:根据投放APP所属行业,分标签对候选词进行展示;接收筛选指令;推送出多个投放词。

Description

一种基于大数据的广告选词方法
技术领域
本发明属于广告选词的技术领域,具体涉及一种基于大数据的广告选词方法。
背景技术
苹果搜索广告是2017年兴起的APPle store应用推广方式,其核心就是选出最具潜力的关键词,从而用有限的预算带来更多的展现和下载。
苹果原生后台提供两种选词方式:(1)手动添加;单个输入或上传表格,(2)苹果一键推荐;这两种方式都存在很大的局限性。
1.手动添加关键词的局限性:
手动添加关键词面临的问题就是如何选择关键词,一般优化师会借助第三方数据统计工具,从第三方平台上下载原始数据,再借助excel等工具,经过一系列筛选后,选出符合投放需求的关键词;然后切换到投放后台的关键词添加页面,上传已选择的关键词;整个过程不仅繁杂,同时由于第三方数据的局限性,使获词的维度很单一,很难选出全面,及与广告主应用更切合的关键词,从而直接影响投放的数据表现。
2.苹果一键推荐选词的局限性:
推荐的关键词不仅数量有限,同时如何对关键词进行分类管理和操作也成为此种选词方式的痛点;一般不同类型的关键词,初始出价会有一定的差异,但是选择苹果一键推荐时没办法实现此类需求。
发明内容
本发明克服现有技术存在的不足,所要解决的技术问题为:提供一种选词效率较高的基于大数据的广告选词方法。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于大数据的广告选词方法,包括自动推荐方法,所述自动推荐方法,包括:建立APP相关的精选词组库;提取出所有候选关键词;计算每个候选关键词的权重,并按权重进行排序;接收选词数量N;推送出N个投放关键词。
优选地,还包括:手动添加方法,所述手动添加方法,包括:根据投放APP所属行业,分标签对候选词进行展示;接收筛选指令;推送出多个投放词。
优选地,还包括:对投放词进行在线翻译。
优选地,所述建立APP相关的精选词组库,具体包括:
S1011,根据APP的标题、描述,抽取出标题、描述中重要的词组;
S1012,根据抽取出的词组,计算得出IDF词典;
S1013,去除标题、描述中的停止词后,结合IDF词典,计算每个词组的TF-IDF值,得到带权重的精选词组;
S104,将APP的主类别扩充到精选词组中;其中:APP的主类别的权重采用扩充位置周边词的权重;
S105,根据权重对精选词组进行排序,形成APP相关的精选词组库。
优选地,所述提取出所有候选关键词中,所述的候选关键词,包括:精选词组库中的所有词组,和/或历史上投放过的词组,和/或覆盖过的词组。
优选地,所述计算每个候选关键词的权重,并按权重进行排序,具体包括:
在精选词组库中选取指定个数的词组;
通过word2vec算法训练词向量模型;
根据训练好的词向量模型,分别计算出选定的几个词组的词向量;
遍历所有候选关键词,利用训练好的词向量模型计算出每个候选关键词的词向量;
分别计算候选关键词词向量与选定词组向量之间的余弦相似度,并求加权平均值;
根据候选关键词的搜索热度以及计算的加权平均值,计算出每个候选关键词的权重;
按权重从大到小对候选关键词进行排序。
优选地,所述在精选词组库中选取指定个数的词组中,所述的指定个数为7个。
优选地,所述根据投放APP所属行业,分标签对候选词进行展示,具体包括:
计算投放APP所属行业的热词、本身覆盖的关键词以及竞品覆盖词,形成候选词;
根据搜索指数、流行度、搜索位置、竞价应用数量,对候选词分标签进行展示;
所述接收筛选指令,包括:
接收一个或多个筛选条件输入指令;其中:
所述的筛选条件包括:关键词名称、搜索热度、应用位置、近期竞价应用数。
本发明与现有技术相比具有以下有益效果:
1、本发明中的自动推荐方法,能够精选出与APP相关的词组库,通过提取候选关键词、权重计算,抓取出指定数量的投放关键词,实现了自动化的选词,选词效率较高。
2、本发明中的手动添加方法,通过关键词的挖掘、分析、筛选、添加,一站式操作,提高了选词效率。
3、本发明中的手动添加方法,能够根据投放APP所属行业,分标签对候选词进行展示,计算投放APP所属行业的热词、本身覆盖的关键词以及竞品覆盖词,形成候选词,并根据搜索指数、流行度、搜索位置、竞价应用数量,对候选词分标签进行展示,候选关键词分类明确,参考价值高。
4、本发明通过对海量数据进行关键词的抓取,提供多维度的关键词数据库,数据抓取效率高。
5、本发明中,通过对对投放词进行在线翻译,解决了小语种关键词投放障碍,运用在线翻译功能辅助决策,快速完成选词。
附图说明
下面结合附图对本发明做进一步详细的说明;
图1为本发明实施例一提供的一种基于大数据的广告选词方法的流程示意图;
图2为本发明实施例二提供的一种基于大数据的广告选词方法的流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例一提供的一种基于大数据的广告选词方法的流程示意图,如图1所示,一种基于大数据的广告选词方法,包括自动推荐方法,所述自动推荐方法,包括:建立APP相关的精选词组库;提取出所有候选关键词;计算每个候选关键词的权重,并按权重进行排序;接收选词数量N;推送出N个投放关键词。
具体地,所述建立APP相关的精选词组库,包括:
S1011,根据APP的标题、描述,抽取出标题、描述中重要的词组;
S1012,根据抽取出的词组,计算得出IDF词典;
S1013,去除标题、描述中的停止词后,结合IDF词典,计算每个词组的TF-IDF值,得到带权重的精选词组;
S104,将APP的主类别扩充到精选词组中;其中:APP的主类别的权重采用扩充位置周边词的权重;
S105,根据权重对精选词组进行排序,形成APP相关的精选词组库。
进一步地,所述提取出所有候选关键词中,所述的候选关键词,包括:精选词组库中的所有词组,和/或历史上投放过的词组,和/或覆盖过的词组。
更进一步地,所述计算每个候选关键词的权重,并按权重进行排序,具体包括:在精选词组库中选取指定个数的词组;通过word2vec算法训练词向量模型;根据训练好的词向量模型,分别计算出选定的几个词组的词向量;遍历所有候选关键词,利用训练好的词向量模型计算出每个候选关键词的词向量;分别计算候选关键词词向量与选定词组向量之间的余弦相似度,并求加权平均值;根据候选关键词的搜索热度以及计算的加权平均值,计算出每个候选关键词的权重;按权重从大到小对候选关键词进行排序。
所述在精选词组库中选取指定个数的词组中,所述的指定个数为7个。
本发明中的自动推荐方法,能够精选出与APP相关的词组库,通过提取候选关键词、权重计算,抓取出指定数量的投放关键词,实现了自动化的选词,扩充了选词的量级,选词效率较高。
图2为本发明实施例一提供的一种基于大数据的广告选词方法的流程示意图,如图2所示,在实施例一的基础上,还包括:手动添加方法,所述手动添加方法,包括:根据投放APP所属行业,分标签对候选词进行展示;接收筛选指令;推送出多个投放词;对投放词进行在线翻译。
具体地,所述根据投放APP所属行业,分标签对候选词进行展示,具体包括:计算投放APP所属行业的热词、本身覆盖的关键词以及竞品覆盖词,形成候选词;根据搜索指数、流行度、搜索位置、竞价应用数量,对候选词分标签进行展示;所述接收筛选指令,包括:接收一个或多个筛选条件输入指令;其中:所述的筛选条件包括:关键词名称、搜索热度、应用位置、近期竞价应用数。
本发明中的手动添加方法,通过关键词的挖掘、分析、筛选、添加,一站式操作,提高了选词效率;能够根据投放APP所属行业,分标签对候选词进行展示,计算投放APP所属行业的热词、本身覆盖的关键词以及竞品覆盖词,形成候选词,并根据搜索指数、流行度、搜索位置、竞价应用数量,对候选词分标签进行展示,候选关键词分类明确,参考价值高;通过对海量数据进行关键词的抓取,提供多维度的关键词数据库,数据抓取效率高。
此外,本发明中,通过对对投放词进行在线翻译,解决了小语种关键词投放障碍,运用在线翻译功能辅助决策,快速完成选词。
本实施例中,IDF词典为:逆文档频率词典,停止词为:stopwords,即:类似a、an、the等没有实际意义的词。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (8)

1.一种基于大数据的广告选词方法,其特征在于:包括自动推荐方法,所述自动推荐方法,包括:
建立APP相关的精选词组库;
提取出所有候选关键词;
计算每个候选关键词的权重,并按权重进行排序;
接收选词数量N;
推送出N个投放关键词。
2.根据权利要求1所述的一种基于大数据的广告选词方法,其特征在于:还包括:手动添加方法,所述手动添加方法,包括:
根据投放APP所属行业,分标签对候选词进行展示;
接收筛选指令;
推送出多个投放词。
3.根据权利要求2所述的一种基于大数据的广告选词方法,其特征在于:还包括:
对投放词进行在线翻译。
4.根据权利要求1所述的一种基于大数据的广告选词方法,其特征在于:
所述建立APP相关的精选词组库,具体包括:
S1011,根据APP的标题、描述,抽取出标题、描述中重要的词组;
S1012,根据抽取出的词组,计算得出IDF词典;
S1013,去除标题、描述中的停止词后,结合IDF词典,计算每个词组的TF-IDF值,得到带权重的精选词组;
S104,将APP的主类别扩充到精选词组中;其中:APP的主类别的权重采用扩充位置周边词的权重;
S105,根据权重对精选词组进行排序,形成APP相关的精选词组库。
5.根据权利要求1所述的一种基于大数据的广告选词方法,其特征在于:所述提取出所有候选关键词中,所述的候选关键词,包括:
精选词组库中的所有词组,和/或历史上投放过的词组,和/或覆盖过的词组。
6.根据权利要求1所述的一种基于大数据的广告选词方法,其特征在于:所述计算每个候选关键词的权重,并按权重进行排序,具体包括:
在精选词组库中选取指定个数的词组;
通过word2vec算法训练词向量模型;
根据训练好的词向量模型,分别计算出选定的几个词组的词向量;
遍历所有候选关键词,利用训练好的词向量模型计算出每个候选关键词的词向量;
分别计算候选关键词词向量与选定词组向量之间的余弦相似度,并求加权平均值;
根据候选关键词的搜索热度以及计算的加权平均值,计算出每个候选关键词的权重;
按权重从大到小对候选关键词进行排序。
7.根据权利要求6所述的一种基于大数据的广告选词方法,其特征在于:所述在精选词组库中选取指定个数的词组中,所述的指定个数为7个。
8.根据权利要求2所述的一种基于大数据的广告选词方法,其特征在于:
所述根据投放APP所属行业,分标签对候选词进行展示,具体包括:
计算投放APP所属行业的热词、本身覆盖的关键词以及竞品覆盖词,形成候选词;
根据搜索指数、流行度、搜索位置、竞价应用数量,对候选词分标签进行展示;
所述接收筛选指令,包括:
接收一个或多个筛选条件输入指令;其中:
所述的筛选条件包括:关键词名称、搜索热度、应用位置、近期竞价应用数。
CN201810425266.9A 2018-05-07 2018-05-07 一种基于大数据的广告选词方法 Pending CN108664585A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810425266.9A CN108664585A (zh) 2018-05-07 2018-05-07 一种基于大数据的广告选词方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810425266.9A CN108664585A (zh) 2018-05-07 2018-05-07 一种基于大数据的广告选词方法

Publications (1)

Publication Number Publication Date
CN108664585A true CN108664585A (zh) 2018-10-16

Family

ID=63778352

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810425266.9A Pending CN108664585A (zh) 2018-05-07 2018-05-07 一种基于大数据的广告选词方法

Country Status (1)

Country Link
CN (1) CN108664585A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109947913A (zh) * 2019-01-26 2019-06-28 浙江乾冠信息安全研究院有限公司 一种黑灰产推广的关键词查找方法
CN110516030A (zh) * 2019-08-26 2019-11-29 北京百度网讯科技有限公司 意图词的确定方法、装置、设备及计算机可读存储介质
CN110866106A (zh) * 2019-10-10 2020-03-06 重庆金融资产交易所有限责任公司 一种文本推荐方法及相关设备
CN113538062A (zh) * 2021-07-28 2021-10-22 福州果集信息科技有限公司 一种反推商品推广笔记所购买竞价词的方法
CN113836307A (zh) * 2021-10-15 2021-12-24 国网北京市电力公司 一种供电服务工单热点发现方法、***、装置及存储介质
CN116645147A (zh) * 2023-07-27 2023-08-25 深圳千亚商务科技有限公司 基于亚马逊平台的自动化广告方法与***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102043843A (zh) * 2010-12-08 2011-05-04 百度在线网络技术(北京)有限公司 一种用于基于目标应用获取目标词条的方法与获取设备
CN103377232A (zh) * 2012-04-25 2013-10-30 阿里巴巴集团控股有限公司 标题关键词推荐方法及***
CN105893478A (zh) * 2016-03-29 2016-08-24 广州华多网络科技有限公司 一种标签提取方法及设备
CN106227735A (zh) * 2016-07-11 2016-12-14 苏州天梯卓越传媒有限公司 一种用于出版行业的词云选题方法及***
CN107608983A (zh) * 2016-07-11 2018-01-19 阿里巴巴集团控股有限公司 标题信息优化方法、装置、设备及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102043843A (zh) * 2010-12-08 2011-05-04 百度在线网络技术(北京)有限公司 一种用于基于目标应用获取目标词条的方法与获取设备
CN103377232A (zh) * 2012-04-25 2013-10-30 阿里巴巴集团控股有限公司 标题关键词推荐方法及***
CN105893478A (zh) * 2016-03-29 2016-08-24 广州华多网络科技有限公司 一种标签提取方法及设备
CN106227735A (zh) * 2016-07-11 2016-12-14 苏州天梯卓越传媒有限公司 一种用于出版行业的词云选题方法及***
CN107608983A (zh) * 2016-07-11 2018-01-19 阿里巴巴集团控股有限公司 标题信息优化方法、装置、设备及***

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109947913A (zh) * 2019-01-26 2019-06-28 浙江乾冠信息安全研究院有限公司 一种黑灰产推广的关键词查找方法
CN110516030A (zh) * 2019-08-26 2019-11-29 北京百度网讯科技有限公司 意图词的确定方法、装置、设备及计算机可读存储介质
CN110866106A (zh) * 2019-10-10 2020-03-06 重庆金融资产交易所有限责任公司 一种文本推荐方法及相关设备
CN113538062A (zh) * 2021-07-28 2021-10-22 福州果集信息科技有限公司 一种反推商品推广笔记所购买竞价词的方法
CN113538062B (zh) * 2021-07-28 2024-05-07 福州果集信息科技有限公司 一种反推商品推广笔记所购买竞价词的方法
CN113836307A (zh) * 2021-10-15 2021-12-24 国网北京市电力公司 一种供电服务工单热点发现方法、***、装置及存储介质
CN113836307B (zh) * 2021-10-15 2024-02-20 国网北京市电力公司 一种供电服务工单热点发现方法、***、装置及存储介质
CN116645147A (zh) * 2023-07-27 2023-08-25 深圳千亚商务科技有限公司 基于亚马逊平台的自动化广告方法与***
CN116645147B (zh) * 2023-07-27 2024-01-23 深圳千亚商务科技有限公司 基于亚马逊平台的自动化广告方法与***

Similar Documents

Publication Publication Date Title
CN108664585A (zh) 一种基于大数据的广告选词方法
CN110083696B (zh) 基于元结构技术的全局引文推荐方法、推荐***
McCallum et al. A machine learning approach to building domain-specific search engines
US8055608B1 (en) Method and apparatus for concept-based classification of natural language discourse
CN102253982B (zh) 一种基于查询语义和点击流数据的查询建议方法
CN102902806B (zh) 一种利用搜索引擎进行查询扩展的方法及***
CN103605665A (zh) 一种基于关键词的评审专家智能检索与推荐方法
CN101493819B (zh) 一种搜索引擎作弊检测的优化方法
CN109829104A (zh) 基于语义相似度的伪相关反馈模型信息检索方法及***
CN112035658B (zh) 基于深度学习的企业舆情监测方法
CN106156204A (zh) 文本标签的提取方法和装置
CN108334610A (zh) 一种新闻文本分类方法、装置及服务器
Aklouche et al. Query Expansion Based on NLP and Word Embeddings.
CN105117487A (zh) 一种基于内容结构的图书语义检索方法
CN102637179B (zh) 词项加权函数确定及基于该函数进行搜索的方法及装置
CN114065758A (zh) 一种基于超图随机游走的文档关键词抽取方法
CN110555154B (zh) 一种面向主题的信息检索方法
CN101763395A (zh) 采用人工智能技术自动生成网页的方法
CN108491407B (zh) 一种面向代码检索的查询扩展方法
CN107133274A (zh) 一种基于图知识库的分布式信息检索集合选择方法
CN109408100A (zh) 一种基于多源数据的软件缺陷信息融合方法
Yang et al. Fault-tolerant learning for term extraction
Shahbazi et al. Estimation of the investability of real estate properties through text analysis
Algosaibi et al. Using the semantics inherent in sitemaps to learn ontologies
CN107577667A (zh) 一种实体词处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181016

RJ01 Rejection of invention patent application after publication