CN116932858B - 一种关键词优化难度确定方法、装置及电子设备 - Google Patents

一种关键词优化难度确定方法、装置及电子设备 Download PDF

Info

Publication number
CN116932858B
CN116932858B CN202310777925.6A CN202310777925A CN116932858B CN 116932858 B CN116932858 B CN 116932858B CN 202310777925 A CN202310777925 A CN 202310777925A CN 116932858 B CN116932858 B CN 116932858B
Authority
CN
China
Prior art keywords
optimization
search
news
keyword
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310777925.6A
Other languages
English (en)
Other versions
CN116932858A (zh
Inventor
袁学文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Wendao Network Technology Co ltd
Original Assignee
Suzhou Wendao Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Wendao Network Technology Co ltd filed Critical Suzhou Wendao Network Technology Co ltd
Priority to CN202310777925.6A priority Critical patent/CN116932858B/zh
Publication of CN116932858A publication Critical patent/CN116932858A/zh
Application granted granted Critical
Publication of CN116932858B publication Critical patent/CN116932858B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及信息技术领域,尤其是涉及一种关键词优化难度确定方法、装置及电子设备。基于目标搜索引擎,确定目标关键词对应的搜索结果;根据预设新闻链接形式,确定搜索结果的预设范围内是否存在新闻,新闻用于表征允许优化的一类搜索结果;当存在新闻时,确定新闻占位数、目标关键词的字符数、预设时段内目标关键词在目标搜索引擎中的月均搜索量;根据目标搜索引擎的引擎类型,确定对应的优化分值公式;根据目标关键词的字符数、月均搜索量,确定优化分值公式中相关系数的值;根据新闻占位数、优化分值公式中相关系数的值,确定优化分值公式的值,以确定目标关键词的优化难度。提升了确定关键词搜索结果的优化难度的准确性。

Description

一种关键词优化难度确定方法、装置及电子设备
技术领域
本申请涉及信息技术领域,尤其是涉及一种关键词优化难度确定方法、装置及电子设备。
背景技术
随着社会的进步,越来越多大大小小的品牌出现在人们的生活中,相应地,品牌想要进行品牌建设的难度也越来越大。目前人们的生活与互联网息息相关,而互联网的迅猛发展则为具有品牌建设需求的企业提供了广阔的平台。目前可以通过将品牌的相关信息、活动等添加到优化搜索引擎中搜索结果中,使品牌的相关内容得到曝光,让该品牌在行业内占据领先地位,以实现优化搜索引擎中的搜索结果的优化。但是互联网的迅猛发展也大大增加了搜索引擎中输入的搜索词的数量和对应显示出的搜索结果的数量,那么如何确定哪些搜索词的搜索结果有优化的价值显得极为重要。
不同品牌所属的企业或个人都希望自己的品牌能够在品牌相关关键词之下的搜索结果中进行曝光。相关技术中,主要依靠人工,通过对大量关键词的搜索结果的优化判断该关键词不同搜索结果优化的难易程度。但是关键词数量庞大,对应的搜索结果数量庞大,人工对这些搜索结果进行优化时需要耗费大量时间,但是互联网上的搜索结果更新的速度较快,留给人工优化搜索结果的时间比较紧张,使得确定关键词搜索结果的优化难度的准确性较低。
发明内容
为了提升关键词搜索结果的优化难度的准确性,本申请提供一种关键词优化难度确定方法、装置及电子设备。
第一方面,本申请提供了一种关键词优化难度确定方法,包括:
基于目标搜索引擎,确定目标关键词对应的搜索结果;
根据预设新闻链接形式,确定所述搜索结果的预设范围内是否存在新闻,所述新闻用于表征允许优化的一类搜索结果;
当存在新闻时,确定新闻占位数、所述目标关键词的字符数、预设时段内所述目标关键词在所述目标搜索引擎中的月均搜索量;
根据所述目标搜索引擎的引擎类型,确定对应的优化分值公式;
根据所述目标关键词的字符数、所述月均搜索量,确定所述优化分值公式中相关系数的值;
根据所述新闻占位数、所述优化分值公式中相关系数的值,确定所述优化分值公式的值,以确定所述目标关键词的优化难度。
通过采用上述技术方案,可以基于目标搜索引擎确定目标关键词对应的搜索效果,可以针对不同目标搜索引擎,分析各自对应的不同的搜索结果。然后可以根据预设新闻链接形式确定搜索结果的预设范围内是否存在新闻,当存在新闻时才确定相关的数据,能够起到对搜索结果筛选的作用,避免非新闻进行优化时资源的浪费。存在新闻确定相关数据后,可以根据目标搜索引擎的引擎类型,对应得到优化分值公式来进行关键词优化难度的确定,使得使用的优化分值公式因目标搜索引擎的不同而变化,提升得到的优化分值与目标搜索引擎的关联性和准确度。可以根据目标关键词的字符数、月均搜索量确定优化分值公式中相关系数的值,以使填充了相关系数的值的优化分值公式与当前目标关键词的情况相匹配,再结合新闻占位和相关系数的值,得到与目标关键词相匹配的优化分值公式的值,提升了优化分值公式的值的准确性。而优化分值公式的值越高,表示优化难度越低,越推荐优化,确定出的目标关键词的优化难度也更准确。
可选的,所述根据所述目标关键词的字符数、所述月均搜索量,确定所述优化分值公式中相关系数的值,包括:
根据所述目标关键词的字符数、所述月均搜索量、字符数搜索量与系数的对应关系,确定所述优化分值公式中相关系数的值。
通过采用上述技术方案,按照字符数搜索量与系数的对应关系,确定目标关键词的字符数、月均搜索量对应的相关系数的值,使得优化分值公式中相关系数的值的来源清晰可靠。
可选的,所述方法还包括:
获取预设时段的历史优化关键词数据,所述历史优化关键词数据包括历史优化关键词的字符数、历史优化关键词的月均搜索量、历史优化关键词的搜索结果;
将所述历史优化关键词的字符数、所述历史优化关键词的月均搜索量进行区间划分,分别得到若干字符数区间和若干月均搜索量区间;
分别分析每一月均搜索量区间中所述历史优化关键词的搜索结果、每一字符数区间中所述历史优化关键词的搜索结果,确定所述每一月均搜索量区间对应的搜索量系数和所述每一字符数区间对应的字符数系数;
根据所述若干字符数区间、所述若干月均搜索量区间、所述每一月均搜索量区间对应的搜索量系数和所述每一字符数区间对应的字符数系数,构建字符数搜索量与系数的对应关系。
通过采用上述技术方案,可以对获取到的历史关键词数据进行处理,将其中的历史优化关键词的字符数、历史优化关键词的月均搜索量进行区间划分,分别得到若干字符数区间和若干月均搜索量区间,针对每一区间中的历史优化关键词的搜索结果进行分析,确定对应的系数。构建字符数搜索量与系数的对应关系的过程清晰可循,字符数、搜索量、优化分值公式中相关系数的对应关系更加可靠。
可选的,所述历史优化关键词的搜索结果包括预设范围内的历史新闻占位数;所述将所述历史优化关键词的字符数、所述历史优化关键词的月均搜索量进行区间划分,分别得到若干字符数区间和若干月均搜索量区间,包括:
按照历史新闻占位数,确定历史优化关键词的月均搜索量的第一分布特点;
根据所述第一分布特点对所述历史优化关键词的月均搜索量进行区间划分,得到若干月均搜索量区间;
按照历史新闻占位数,确定历史优化关键词的字符数的第二分布特点;
根据所述第二分布特点对所述历史优化关键词的字符数进行区间划分,得到若干字符数区间。
通过采用上述技术方案,按照历史新闻占位数,分别确定历史优化关键词的月均搜索量的第一分布特点和历史优化关键词的字符数的第二分布特点,分别进行了历史优化关键词的月均搜索量的区间划分和历史优化关键词的字符数的区间划分,使得到的每一月均搜索量区间和每一字符数区间更加准确。
可选的,所述分别分析每一月均搜索量区间中所述历史优化关键词的搜索结果、每一字符数区间中所述历史优化关键词的搜索结果,确定所述每一月均搜索量区间对应的搜索量系数和所述每一字符数区间对应的字符数系数,包括:
从所述历史优化关键词数据中提取每一月均搜索量区间中预设范围内的第一新闻占位数;
将所述第一新闻占位数在对应月均搜索量区间中预设范围内的历史优化关键词的搜索结果中的占比,确定为所述月均搜索量区间的搜索量系数;
从所述历史优化关键词数据中提取每一字符数区间中预设范围内的第二新闻占位数;
将所述第二新闻占位数在对应字符数区间中预设范围内的历史优化关键词的搜索结果中的占比,确定为所述字符数区间的字符数系数。
通过采用上述技术方案,基于第一新闻占位数在对应搜索结果中的占比确定搜索量系数,基于第二新闻占位数在对应搜索结果中的占比确定字符数系数,使得搜索量系数、字符数系数更加符合确定目标关键词优化难度的优化分值公式。基于这两个系数组成的优化分值公式,后续进行计算得到的优化分值公式的值更可靠准确,提升了优化难度确定的准确性。
可选的,所述当存在新闻时,确定新闻占位数、所述目标关键词的字符数、预设时段内所述目标关键词在所述目标搜索引擎中的月均搜索量,包括:
当存在新闻时,抓取每一条新闻的名称字段,并根据所述名称字段判断所述新闻是否为聚合新闻;
若是聚合新闻,则抓取所述聚合新闻的聚合字段,并为所述聚合新闻定义所述聚合字段对应的聚合特征;
当所述聚合特征对应的显示数据大于预设优化阈值时,将所述聚合特征、对应的显示数据生成低效优化信息,并发送给对应的客户;
若所述聚合特征对应的显示数据小于等于预设优化阈值或所述新闻不是聚合新闻,则确定新闻占位数、所述目标关键词的字符数、预设时段内所述目标关键词在所述目标搜索引擎中的月均搜索量。
通过采用上述技术方案,在搜索结果中存在新闻时,对新闻是否为聚合新闻进行了判断,大于预设优化阈值的聚合新闻与小于等于预设优化阈值的聚合新闻和非聚合新闻的处理方式不同,避免最终确定的优化难度受到聚合新闻的影响,导致确定出的优化难度不准确。
可选的,所述基于目标搜索引擎,确定目标关键词对应的搜索结果,包括:
获取所述目标搜索引擎的过滤需求;
按照所述过滤需求对待处理关键词进行筛选,得到目标关键词;
确定所述目标关键词对应的搜索结果。
通过采用上述技术方案,先基于目标搜索引擎的过滤需求对待处理关键词进行筛选,被过滤的关键词在整个优化难度确定的过程中属于无用的关键词,筛选这一步骤可以避免无用的关键词对优化难度确定设备的资源浪费,提升了确定关键词搜索结果的优化难度的效率。
可选的,当所述预设范围对应多页搜索结果时,所述根据所述新闻占位数、所述优化分值公式中相关系数的值,确定所述优化分值公式的值,以确定所述目标关键词的优化难度,包括:
针对每一页,根据当页的所述新闻占位数、当页的所述优化分值公式中相关系数的值,确定当页的所述优化分值公式的值;
为所述每一页的所述优化分值公式的值配置权重,确定所述目标关键词的优化难度。
通过采用上述技术方案,可以分别获取每一页的优化分值公式的值,为品牌客户提供每一页的优化分值公式的值和优化难度,提高了目标关键词搜索结果的优化难度的准确性。
第二方面,本申请提供一种关键词优化难度确定装置,包括:
搜索结果确定模块,用于基于目标搜索引擎,确定目标关键词对应的搜索结果;
新闻确定模块,用于根据预设新闻链接形式,确定所述搜索结果的预设范围内是否存在新闻,所述新闻用于表征允许优化的一类搜索结果;
目标关键词相关数据确定模块,用于当存在新闻时,确定新闻占位数、所述目标关键词的字符数、预设时段内所述目标关键词在所述目标搜索引擎中的月均搜索量;
优化分值公式确定模块,用于根据所述目标搜索引擎的引擎类型,确定对应的优化分值公式;
优化分值公式系数值确定模块,用于根据所述目标关键词的字符数、所述月均搜索量,确定所述优化分值公式中相关系数的值;
优化难度确定模块,用于根据所述新闻占位数、所述优化分值公式中相关系数的值,确定所述优化分值公式的值,以确定所述目标关键词的优化难度。
可选的,所述优化分值公式系数值确定模块具体用于:
根据所述目标关键词的字符数、所述月均搜索量、字符数搜索量与系数的对应关系,确定所述优化分值公式中相关系数的值。
可选的,所述关键词优化难度确定装置还包括对应关系构建模块,用于:
获取预设时段的历史优化关键词数据,所述历史优化关键词数据包括历史优化关键词的字符数、历史优化关键词的月均搜索量、历史优化关键词的搜索结果;
将所述历史优化关键词的字符数、所述历史优化关键词的月均搜索量进行区间划分,分别得到若干字符数区间和若干月均搜索量区间;
分别分析每一月均搜索量区间中所述历史优化关键词的搜索结果、每一字符数区间中所述历史优化关键词的搜索结果,确定所述每一月均搜索量区间对应的搜索量系数和所述每一字符数区间对应的字符数系数;
根据所述若干字符数区间、所述若干月均搜索量区间、所述每一月均搜索量区间对应的搜索量系数和所述每一字符数区间对应的字符数系数,构建字符数搜索量与系数的对应关系。
可选的,所述历史优化关键词的搜索结果包括预设范围内的历史新闻占位数;所述对应关系构建模块具体用于:
按照历史新闻占位数,确定历史优化关键词的月均搜索量的第一分布特点;
根据所述第一分布特点对所述历史优化关键词的月均搜索量进行区间划分,得到若干月均搜索量区间;
按照历史新闻占位数,确定历史优化关键词的字符数的第二分布特点;
根据所述第二分布特点对所述历史优化关键词的字符数进行区间划分,得到若干字符数区间。
可选的,所述对应关系构建模块具体用于:
从所述历史优化关键词数据中提取每一月均搜索量区间中预设范围内的第一新闻占位数;
将所述第一新闻占位数在对应月均搜索量区间中预设范围内的历史优化关键词的搜索结果中的占比,确定为所述月均搜索量区间的搜索量系数;
从所述历史优化关键词数据中提取每一字符数区间中预设范围内的第二新闻占位数;
将所述第二新闻占位数在对应字符数区间中预设范围内的历史优化关键词的搜索结果中的占比,确定为所述字符数区间的字符数系数。
可选的,所述目标关键词相关数据确定模块具体用于:
当存在新闻时,抓取每一条新闻的名称字段,并根据所述名称字段判断所述新闻是否为聚合新闻;
若是聚合新闻,则抓取所述聚合新闻的聚合字段,并为所述聚合新闻定义所述聚合字段对应的聚合特征;
当所述聚合特征对应的显示数据大于预设优化阈值时,将所述聚合特征、对应的显示数据生成低效优化信息,并发送给对应的客户;
若所述聚合特征对应的显示数据小于等于预设优化阈值或所述新闻不是聚合新闻,则确定新闻占位数、所述目标关键词的字符数、预设时段内所述目标关键词在所述目标搜索引擎中的月均搜索量。
可选的,所述搜索结果确定模块具体用于:
获取所述目标搜索引擎的过滤需求;
按照所述过滤需求对待处理关键词进行筛选,得到目标关键词;
确定所述目标关键词对应的搜索结果。
可选的,当所述预设范围对应多页搜索结果时,所述优化难度确定模块具体用于:
针对每一页,根据当页的所述新闻占位数、当页的所述优化分值公式中相关系数的值,确定当页的所述优化分值公式的值;
为所述每一页的所述优化分值公式的值配置权重,确定所述目标关键词的优化难度。
第三方面,本申请提供一种电子设备,包括:存储器和处理器,所述存储器上存储有能够被处理器加载并执行第一方面的方法的计算机程序。
第四方面,本申请提供一种计算机可读存储介质,存储有能够被处理器加载并执行第一方面的方法的计算机程序。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的一种应用场景示意图;
图2为本申请一实施例提供的一种关键词优化难度确定方法的流程图;
图3为本申请一实施例提供的一种聚合推荐板块在目标搜索引擎显示时的示意图;
图4为本申请一实施例提供的一种关键词优化难度确定装置的结构示意图;
图5为本申请一实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,如无特殊说明,一般表示前后关联对象是一种“或”的关系。
下面结合说明书附图对本申请实施例作进一步详细描述。
目前人们在生活中遇到问题时,经常会打开搜索引擎搜索有关自己问题的关键词,通过浏览众多的搜索结果得到答案,这为品牌建设的需求提供了机会。可以通过优化搜索引擎中的搜索结果,来让搜索结果中显示有关品牌的信息,进而使品牌的相关信息得到曝光。不同的品牌可能想要优化的搜索结果所属的关键词不相同,当人们在搜索引擎中输入的关键词与品牌想要优化的匹配时,可以通过优化该词的搜索结果,让人们能在搜索结果中看到该品牌的相关信息,以使该品牌在行业中占据领先地位。但是由于互联网的迅猛发展,数据更新迭代的速度较快,如何确定优化哪些关键词的搜索结果,才能使品牌的曝光时间最长、效果最好显得极为重要。
相关技术中主要依靠人工对大量关键词的搜索结果进行分析、计算。由于数据更新较快,需要相关技术人员频繁进行计算的更新、优化,同时受人工的身体状态、工作状态等不稳定因素的影响,面对数量庞大的搜索结果,评估优化难度的过程繁琐且耗时较长,使得确定关键词搜索结果的优化难度的准确性较低。
基于此,本申请提供一种关键词优化难度确定方法、装置及电子设备。基于目标搜索引擎,确定目标关键对应的搜索结果,根据预设新闻链接形式确定搜索结果的预设范围内是否存在新闻。当存在时确定新闻占位数、月均搜索量等数据,然后基于目标搜索引擎的引擎类型确定对应的优化分值公式,结合月均搜索量等数据进一步确定优化分值公式中相关系数的值,进而结合新闻占位数和相关系数的值确定优化分值公式的值。提升了确定关键词搜索结果的优化难度的准确性。
图1为本申请提供的一种应用场景示意图。在图1的应用场景中,本申请的方法可以应用于优化难度确定设备。具体的实现方式可以参考以下实施例。品牌客户想要对自己的品牌进行曝光,依赖于与自身品牌相关的信息,这些信息可能关联某些关键词,这些信息可能会显示在某个搜索引擎搜索该关键词的搜索结果中。在图1的应用场景中,目标搜索引擎可以搭载在服务器上,优化难度确定设备可以与搭载有目标搜索引擎的服务器关联,对输入到该目标搜索引擎中的目标关键词的搜索结果进行分析。确定出搜索结果的预设范围内存在新闻时,对该目标关键词的相关数据进行处理,选择与目标搜索引擎适配的优化分值公式,计算得到优化分值公式的值,进而确定出该目标关键词的优化难度。其中,每一品牌客户想要进行曝光的目标搜索引擎可能不止一个,同时想要优化的搜索结果所属的目标关键词数量也很大。
图2为本申请一实施例提供的一种关键词优化难度确定方法的流程图,本实施例的方法可以应用于以上场景中的优化难度确定设备。如图2所示的,该方法包括:
S201、基于目标搜索引擎,确定目标关键词对应的搜索结果。
搜索引擎可以将不同平台提供的搜索结果进行显示,对全网的信息进行整合;平台可以发布在搜索引擎中搜索某目标关键词时所需的信息;某一平台有时也可以作为搜索引擎。每一品牌客户可以预先设置自己需要在什么样的搜索引擎上曝光,这些搜索引擎可以作为目标搜索引擎,可以是一个或多个。品牌客户可以预先选择在该目标搜索引擎中要进行优化的关键词,这些关键词可以作为目标关键词。目标关键词可以是与品牌客户有关联的关键词。
针对每一目标关键词,要确定在每一目标搜索引擎中的搜索结果,因此可以批量确定不同目标搜索引擎的不同目标关键词对应的搜索结果。
具体的,优化难度确定设备可以与目标搜索引擎连接。优化难度确定设备可以向目标搜索引擎中输入目标关键词,目标搜索引擎显示出对应的搜索结果,此时优化难度确定设备可以将搜索结果进行抓取。
在一些实现方式中,优化难度确定设备可以预先以目标关键词为一级标签,目标搜索引擎为一级标签下的二级标签,创建一个关键词数据库。然后可以将抓取到的搜索结果放置在对应的标签下,进行关键词数据库的更新。
S202、根据预设新闻链接形式,确定搜索结果的预设范围内是否存在新闻,新闻用于表征允许优化的一类搜索结果。
新闻在本实施例中可以是能够被进行内容优化的消息、资讯等包含文字形式的一类搜索结果,可以用于表征搜索结果中允许被优化的类型。预设新闻链接形式可以用于表征可以进行优化的新闻的链接形式,可以是基于品牌客户和其他平台的合作情况,也可以是基于搜索结果对应的信息提供的平台的数据确定的,允许改动的链接的形式。预设新闻链接形式可以是某一平台某类链接;也可以是某一平台的某一条具体的链接,此时预设新闻链接形式中可以包括该链接名称、类型等。
目标关键词在目标搜索引擎中的搜索结果可能较多,会被整合成若干页逐页显示,预设范围可以是首页,也可以是前两页、前三页……若干页,此处不做限定,也可以是首页的前若干条,还可以是若干页中每一页的前若干条。
在一些实现方式中,优化难度确定设备可以获取到目标搜索引擎的属性设置,确定搜索结果的链接显示的位置,然后在预设范围内的前述位置处抓取每一搜索结果的链接形式进行分析,确定与预设新闻链接形式是否相同,以确定搜索结果的预设范围内是否存在新闻。
在另一些实现方式中,目标搜索引擎上每一搜索结果的链接形式可以被显示在每一搜索结果板块上的同一位置,例如显示在每一搜索结果板块的左下方。因此可以截取搜索结果的显示界面,进行图像处理,确定搜索结果的预设范围内是否存在新闻。
在另一些实现方式中,搜索结果的链接名称与预设新闻链接形式中的链接名称相同可以表示该搜索结果为新闻,链接名称不相同则表示该搜索结果不是新闻。
S203、当存在新闻时,确定新闻占位数、目标关键词的字符数、预设时段内目标关键词在目标搜索引擎中的月均搜索量。
新闻占位数可以表示新闻类型的搜索结果的条数,目标关键词的字符数可以是目标关键词中字符的数量,例如目标关键词为“旅行地区推荐”,对应的字符数为6。月均搜索量可以表示该目标关键词在该目标搜索引擎中平均每个月被搜索多少次,预设时段可以默认为一个月,也可以为两个月,此处不做限定。每一目标搜索引擎可以设置有对应的官方数据平台,可以对在该目标搜索引擎中搜索过的关键词的月均搜索量进行汇总。优化难度确定设备可以与这些官方数据平台连接,直接获取目标关键词对应的月均搜索量。可以根据步骤S202中搜索结果的链接名称确定是否存在新闻。
具体的,当存在新闻时,可以将新闻链接形式对应的搜索结果为新闻的条数进行汇总,得到新闻占位数,通过对目标关键词的字符读取,确定目标关键词的字符数。然后可以在官方数据平台中查找目标关键词在预设时段内的月均搜索量。
S204、根据目标搜索引擎的引擎类型,确定对应的优化分值公式。
引擎类型可以是根据目标搜索引擎的搜索算法的不同来确定的。优化分值公式可以用于得到目标关键词的优化分值,基于此确定优化难度。可以预先设置不同引擎类型的目标搜索引擎对应使用的优化分值公式,并对应进行存储。
优化分值公式可以包括参数和系数,参数可以通过获取目标关键词的相关数据获得,系数可以通过历史优化过的关键词进行确定。例如,针对某一目标搜索引擎,对应的优化分值公式可以确定为:优化分值=新闻占位数*(搜索量系数*30+字符数系数*70)。此处参数为新闻占位数,系数可以为搜索量系数和字符数系数。
具体的,可以为目标搜索引擎匹配对应的引擎类型,进而匹配对应的优化分值公式。
优化分值公式与新闻占位数有关联关系,新闻占位数越多,优化越有价值。在一些实现方式中,优化分值公式可以是与新闻占位数相关的一个函数,系数可以根据某些参数来确定,比如搜索量、字符数等,或者他们的组合,为不同的参数配置权重。例如上述的例子中是由搜索量和字符数组合确定了参数。
在另一些实现方式中,新闻类型可能也会影响优化难度,例如聚合新闻可能并不好优化。因此可以将新闻类型作为系数或者参考新闻类型设置新闻占位数的权重,不同类型的新闻的占位数在优化难度中的贡献可能是不相同的。
S205、根据目标关键词的字符数、月均搜索量,确定优化分值公式中相关系数的值。
优化分值公式中相关系数的值可以包括步骤S204中涉及的搜索量系数、字符数系数等。由于优化分值公式是基于目标搜索引擎选取的,在此目标搜索引擎中不同目标关键词的被搜索情况和搜索结果情况,因此基于优化分值公式计算优化分值时也是要计算不同目标关键词的优化分值,那么优化分值公式中相关系数的值与要进行优化分值确定的目标关键词的字符数、月均搜索量有关联。因此根据目标关键词的字符数、月均搜索量,可以确定优化分值公式中相关系数的值。
S206、根据新闻占位数、优化分值公式中相关系数的值,确定优化分值公式的值,以确定目标关键词的优化难度。
上述的关键词数据库可以存储历史优化难度确定过程中优化成功的目标关键词的相关数据。可以预先搭建一个待训练的优化难度确定模型。目标关键词在不同的时期的搜索情况不相同,当进入该目标关键词的热点期时,冷却期的历史数据的参考性就降低了一些。因此可以在目标搜索引擎的官方数据平台中查询该目标关键词的搜索情况,基于此可以将历史相关数据中与当前情况相反的相关数据进行清洗,例如目前是热点期,可以将冷却期的历史相关数据进行清洗。然后将清洗后的历史相关数据输入到待训练的优化难度确定模型,提取清洗后的每一个目标关键词的数据特征,可以包括新闻占位数、优化分值公式中相关系数的值以及目标关键词的优化难度分数,构造训练集。
然后可以从训练集中获取由每一目标关键词的新闻占位数、优化分值公式中相关系数的值组成的训练样本,输入到待训练的优化难度确定模型,得到输出结果,即优化难度分数。可以根据训练得到的优化难度分数和训练集中实际对应的优化难度分数,计算损失函数,利用梯度下降法调整待训练的优化难度确定模型的模型参数,以减小损失函数,直到损失函数不再减小时停止训练,得到优化难度确定模型。
具体的,可以将目标关键词的新闻占位数、优化分值公式中相关系数的值输入到优化难度确定模型,输出优化难度分数。优化难度分数越低,可以表示该目标优化关键词的优化竞争度越小,优化难度越小。
在一些实施例中,优化分值对应的可以是预设范围内所有的数据;在另一些实施例中,当预设范围包含多页时,还可以逐页确定优化分值,以每一页的优化分值综合确定目标关键词的优化难度。
本实施例的方法可以对一个目标搜索引擎中的一个目标关键词进行处理,也可以多次重复处理多个目标搜索引擎对应的多个目标关键词。当需要对多目标搜索引擎、多目标关键词的搜索结果进行优化难度的评估时,可以同步多次执行上述方法。或者将上述实施例中的目标搜索引擎设置为多个目标搜索引擎,将目标关键词设置为多个目标关键词,但是搜索结果的匹配为一个目标关键词在一个目标搜索引擎中匹配出来的。
本实施例可以基于目标搜索引擎确定目标关键词对应的搜索效果,可以针对不同目标搜索引擎,分析各自对应的不同的搜索结果。然后可以根据预设新闻链接形式确定搜索结果的预设范围内是否存在新闻,当存在新闻时才确定相关的数据,能够起到对搜索结果筛选的作用,避免非新闻进行优化时资源的浪费。存在新闻确定相关数据后,可以根据目标搜索引擎的引擎类型,对应得到优化分值公式来进行关键词优化难度的确定,使得使用的优化分值公式因目标搜索引擎的不同而变化,提升得到的优化分值与目标搜索引擎的关联性和准确度。可以根据目标关键词的字符数、月均搜索量确定优化分值公式中相关系数的值,以使填充了相关系数的值的优化分值公式与当前目标关键词的情况相匹配,再结合新闻占位和相关系数的值,得到与目标关键词相匹配的优化分值公式的值,提升了优化分值公式的值的准确性。而优化分值公式的值越高,表示优化难度越低,越推荐优化,确定出的目标关键词的优化难度也更准确。
在一些实施例中,可以通过加入字符数搜索量与系数的对应关系,确定优化分值公式中相关系数的值。具体的,根据目标关键词的字符数、月均搜索量、字符数搜索量与系数的对应关系,确定优化分值公式中相关系数的值。
字符数搜索量与系数的对应关系可以表示不同字符数、不同月均搜索量的目标关键词分别与相关系数的对应关系,可以是根据历史优化过的关键词的数据进行分析得到的。字符数搜索量与系数的对应关系可以预先设置并存储在关键词数据库中。
具体的,根据目标关键词的字符数和月均搜索量,可以在关键词数据库中的字符数搜索量与系数的对应关系里对应匹配优化分值公式相关系数的值。例如字符数搜索量在100到500之间的,系数可以为0.7。
本实施例按照字符数搜索量与系数的对应关系,确定目标关键词的字符数、月均搜索量对应的相关系数的值,使得优化分值公式中相关系数的值的来源清晰可靠。
在一些实施例中,可以获取预设时段的历史优化关键词数据进行分析,得到若干字符数区间、若干月均搜索量区间、每一月均搜索量区间对应的搜索量系数和每一字符数区间对应的字符数系数,进而构建字符数搜索量与系数的对应关系。具体的,获取预设时段的历史优化关键词数据,历史优化关键词数据包括历史优化关键词的字符数、历史优化关键词的月均搜索量、历史优化关键词的搜索结果;将历史优化关键词的字符数、历史优化关键词的月均搜索量进行区间划分,分别得到若干字符数区间和若干月均搜索量区间;分别分析每一月均搜索量区间中历史优化关键词的搜索结果、每一字符数区间中历史优化关键词的搜索结果,确定每一月均搜索量区间对应的搜索量系数和每一字符数区间对应的字符数系数;根据若干字符数区间、若干月均搜索量区间、每一月均搜索量区间对应的搜索量系数和每一字符数区间对应的字符数系数,构建字符数搜索量与系数的对应关系。
预设时段与上述实施例中的预设时段可以是相同的,该预设时段可以包括起始时刻和终止时刻,其中终止时刻为当前进行获取的时刻,可以默认为一个月。
历史关键词数据可以包括过去进行关键词优化难度确定后,已进行优化的关键词的相关数据。其中以进行优化的关键词可以作为历史优化关键词,相关数据可以包括历史优化关键词的字符数、历史优化关键词的月均搜索量、历史优化关键词的搜索结果。历史关键词数据可以被存储在上述的关键词数据库中。
具体的,可以从关键词数据库中获取预设时段的历史优化关键词数据。由于不同字符数的历史优化关键词和不同月均搜索量的历史关键词分别对应的搜索结果中的新闻占位数不相同,新闻占位数越多的目标关键词,得到的优化分值公式的值,即优化分值越高。因此可以按照预设划分需求对历史优化关键词的字符数和历史优化关键词的月均搜索量进行区间划分,分别得到若干字符数区间和若干月均搜索量区间。例如按照字符数1-4,5-7进行划分,月均搜索量按照0-30,31-150进行划分。然后通过分析每一月均搜索量区间中历史优化关键词的搜索结果、每一字符数区间中历史优化关键词的搜索结果,可以按照预设系数选取的要求和实际的分析结果确定每一月均搜索量区间对应的搜索量系数和每一字符数区间对应的字符数系数。然后可以将每一字符数区间、每一字符数区间对应的字符数系数、每一月均搜索量区间、每一月均搜索量区间对应的搜索量系数的对应关系进行整合,得到字符数搜索量与系数的对应关系。
本实施例可以对获取到的历史关键词数据进行处理,将其中的历史优化关键词的字符数、历史优化关键词的月均搜索量进行区间划分,分别得到若干字符数区间和若干月均搜索量区间,针对每一区间中的历史优化关键词的搜索结果进行分析,确定对应的系数。构建字符数搜索量与系数的对应关系的过程清晰可循,字符数、搜索量、优化分值公式中相关系数的对应关系更加可靠。
在一些实施例中,历史优化关键词的搜索结果包括预设范围内的历史新闻占位数。可以按照预设范围内的新闻占位数,确定历史优化关键词的月均搜索量、历史优化关键词的字符数分别的分布特点,进而进行区间划分。具体的,按照预设范围内的历史新闻占位数,确定历史优化关键词的月均搜索量的第一分布特点;根据第一分布特点对历史优化关键词的月均搜索量进行区间划分,得到若干月均搜索量区间;按照预设范围内的历史新闻占位数,确定历史优化关键词的字符数的第二分布特点;根据第二分布特点对历史优化关键词的字符数进行区间划分,得到若干字符数区间。
当搜索某一历史优化关键词时,可能得到若干页的搜索结果,本实施例中的预设范围与上述实施例中的预设范围指代相同。当用来表示前三页的搜索结果的范围时,可以针对首页、第二页、第三页,分别进行区间划分和系数的确定,进而确定每一页的优化分值公式的值;也可以确定前三页整体的优化分值公式的值。由于在进行品牌曝光时,大部分输入关键词的用户主要看首页的搜索结果,因此这里的预设范围可以默认为首页,可以进行修改。
预设范围内的历史新闻占位数可以是预设范围内的历史搜索结果中新闻的条数。分布特点可以表示不同历史新闻占位数对应的月均搜索量或字符数的数据的散点分布情况。其中月均搜索量对应的分布特点为第一分布特点,字符数对应的分布特点为第二分布特点。不同目标关键词对应的月均搜索量的数值必然会受目标关键词的热点期等搜索情况的影响。
具体的,可以根据不同历史新闻占位数对应的历史优化关键词的月均搜索量,建立散点图。不同的历史优化关键词的月均搜索量对应的不同历史新闻占位数的数值点在散点图上的分布有疏有密,即可以得到第一分布特点。基于此可以根据第一分布特点对应的分布密度的不同,将历史新闻占位数对应的数值点进行分层,每一层对应的月均搜索量的区间可以作为一个月均搜索量区间,分层的交界可以作为区间的两端。同样的,可以根据历史优化关键词的字符数,建立散点图,进而划分区间。
本实施例按照历史新闻占位数,分别确定历史优化关键词的月均搜索量的第一分布特点和历史优化关键词的字符数的第二分布特点,分别进行了历史优化关键词的月均搜索量的区间划分和历史优化关键词的字符数的区间划分,使得到的每一月均搜索量区间和每一字符数区间更加准确。
在一些实施例中,可以根据新闻占位数在搜索结果中的占比确定系数。具体的,从历史优化关键词数据中提取每一月均搜索量区间中预设范围内的第一新闻占位数;将第一新闻占位数在对应月均搜索量区间中预设范围内的历史优化关键词的搜索结果中的占比,确定为月均搜索量区间的搜索量系数;从历史优化关键词数据中提取每一字符数区间中预设范围内的第二新闻占位数;将第二新闻占位数在对应字符数区间中预设范围内的历史优化关键词的搜索结果中的占比,确定为字符数区间的字符数系数。
由于优化分值公式是为了得到目标关键词的优化分值,确定目标关键词的优化难度。而目标关键词的可以进行优化的搜索结果是新闻,因此优化分值公式中相关系数的确定可以与新闻相关。
具体的,可以从历史优化关键词数据中提取每一月均搜索量区间中预设范围内的第一新闻占位数。然后将第一新闻占位数在对应的月均搜索量区间中预设范围内的历史优化关键词的搜索结果中的占比,确定为该月均搜索量区间的搜索量系数。同时可以从历史优化关键词数据中提取每一字符数区间中预设范围内的第二新闻占位数,然后将第二新闻占位数在对应的字符数区间中预设范围内的历史优化关键词的搜索结果中的占比,确定为该字符数区间的字符数系数。
在一些实现方式中,预设范围可以是前三页的搜索结果的范围,此时可以对首页、第二页、第三页分别进行上述的处理,确定每一页的搜索量系数和字符数系数。
本实施例基于第一新闻占位数在对应搜索结果中的占比确定搜索量系数,基于第二新闻占位数在对应搜索结果中的占比确定字符数系数,使得搜索量系数、字符数系数更加符合确定目标关键词优化难度的优化分值公式。基于这两个系数组成的优化分值公式,后续进行计算得到的优化分值公式的值更可靠准确,提升了优化难度确定的准确性。
在一些实施例中,当存在新闻时,可以先分析新闻是否是聚合新闻,若是聚类新闻则对应生成低效优化信息。具体的,当存在新闻时,抓取每一条新闻的名称字段,并根据名称字段判断新闻是否为聚合新闻;若是聚合新闻,则抓取聚合新闻的聚合字段,并为聚合新闻定义聚合字段对应的聚合特征;当聚合特征对应的显示数据大于预设优化阈值时,将聚合特征、对应的显示数据生成低效优化信息,并发送给对应的客户;若聚合特征对应的显示数据小于等于预设优化阈值或新闻不是聚合新闻,则确定新闻占位数、目标关键词的字符数、预设时段内目标关键词在目标搜索引擎中的月均搜索量。
聚合新闻可以是能够被优化的搜索结果,但是该搜索结果中包含很多小的文字模块、视频模块等。聚合字段可以是目标搜索引擎中聚合新闻的固定位置上显示的,用于表示聚合新闻的属性信息的字段。聚合特征可以是根据聚合字段中展现出的属性信息得到的聚合新闻的特征,例如视频类的聚合新闻的聚合特征可以为播放量特征,文字类的聚合新闻的聚合特征可能涉及到发布时间特征、评论量特征等。相对应的,聚合特征对应的显示数据可能有很多种,例如最新相关聚合对应时间特征,显示数据可以是聚合新闻内的每一篇的更新频率;视频大全聚合对应播放量特征,显示数据可以是播放量大小;贴吧聚合对应评论特征,显示数据可以是评论条数等。同样的,预设优化阈值也可以随着聚合特征的不同进行不同的设置,存储在关键词数据库中。
当聚合特征对应的显示数据大于预设优化阈值时,可以表示对应的聚合新闻由于更新速度过快等原因导致优化难度较高,不建议进行优化。
具体的,当存在新闻时,可以在名称字段所在的位置抓取每一条新闻的名称字段,当名称字段中包含若干个子名称字段时,可以看作该新闻为聚合新闻。若是聚合新闻,可以在聚合字段的固定位置上抓取聚合新闻的聚合字段,通过分析聚合字段得到对应的聚合特征。根据聚合特征在关键词数据库中查找对应的预设优化阈值,当聚合特征对应的显示数据大于预设优化阈值时,可以将聚合特征、对应的显示数据整合成一条低效优化信息,发送给客户。若不是聚合新闻,可以按照上述实施例的步骤,确定新闻占位数、目标关键词的字符数、预设时段内目标关键词在目标搜索引擎中的月均搜索量。
本实施例在搜索结果中存在新闻时,对新闻是否为聚合新闻进行了判断,大于预设优化阈值的聚合新闻与小于等于预设优化阈值的聚合新闻和非聚合新闻的处理方式不同,避免最终确定的优化难度受到聚合新闻的影响,导致确定出的优化难度不准确。
在一些实施例中,可以先按照目标搜索引擎的过滤需求对整体的待处理关键词进行筛选,得到目标关键词后再确定对应的搜索结果。具体的,获取目标搜索引擎的过滤需求;按照过滤需求对待处理关键词进行筛选,得到目标关键词;确定目标关键词对应的搜索结果。
不同的目标搜索引擎可能有一些固定需要屏蔽的词汇,例如最好,最强等过于极端的词,还可能涉及一些行业违禁词。这些词汇在目标搜索引擎中会被忽略,因此可以对这些词汇进行筛选,而筛选哪些词的需求可以作为目标搜索引擎的过滤需求,可以被预先存储在关键词数据库中。待处理关键词可以是客户想要进行优化难度确定的所有关键词。
具体的,可以在关键词数据库中查找并获取到对应的过滤需求,然后按照过滤需求,将待处理关键词中不允许出现的关键词进行过滤,进而筛选得到目标关键词。然后可以按照上述实施例中的步骤确定目标关键词对应的搜索结果。
本实施例先基于目标搜索引擎的过滤需求对待处理关键词进行筛选,被过滤的关键词在整个优化难度确定的过程中属于无用的关键词,筛选这一步骤可以避免无用的关键词对优化难度确定设备的资源浪费,提升了确定关键词搜索结果的优化难度的效率。
在一些实施例中,当预设范围对应多页的搜索结果时,可以确定每一页的搜索结果的优化分值公式的值。具体的,针对每一页,根据当页的新闻占位数、当页的优化分值公式中相关系数的值,确定当页的优化分值公式的值;为每一页的优化分值公式的值配置权重,确定目标关键词的优化难度。
本实施例可以分别获取每一页的优化分值公式的值,为品牌客户提供每一页的优化分值公式的值和优化难度,提高了目标关键词搜索结果的优化难度的准确性。
在另一些实施例中,搜索引擎优化(Search Engine Optimization,SEO),即利用搜索引擎的规则提高网站在有关搜索引擎内的自然排名。目的是让其在行业内占据领先地位,获得品牌效益。
本***(优化难度确定设备)是通过合法抓取目标搜索引擎的关键词搜索结果并给予分析,以实现批量判定关键词搜索结果展现内容所赋予的价值(是否存在新闻),并输出优质价值关键词(预设范围内的新闻对应的关键词)的优化难度等,其功能可有效的为具有品牌建设需求的客户便捷提供关键词优化建议。
搜索任意关键词之后,判断这个词下面能出多少新闻占位。搜索关键词之后会出现聚合、新闻、视频、歌曲等,前几个一般为广告,仅仅聚焦于新闻、新闻聚合(可进行优化的可以为新闻)。
把客户相关的东西放在新闻位置。客户的需求就是在关键词的下方有其品牌的曝光,曝光主要以文章的形式呈现,标题涵盖也好,点击之后有关于产品或者品牌的介绍也好,在预设的前列中出现,例如前十条(预设范围)即为有效果(有优化价值/预设范围内存在新闻)。
关键词能不能出效果(优化难度)定义了几个数据(判断词的优化难度):
1、关键词的搜索量,搜索量越大的词,该词竞争度越大,出效果的难度越高(PC与移动同理)。
2、新闻占位,抓取前十条排名特点,看大多数的类型,针对文章类型(新闻)进行优化(抓取),可以理解为前几条中新闻占几条,或者说可以进行优化(竞争)的条数,因为一些广告官网是不能优化的。
3、字符数,侧面判断词的竞争度,词越长搜索概率越小,竞争难度越小。
换算出可优化概率,然后计算出可优化分值。例如抓取1000个词,可优化(目标关键词)的有500个,提取500词的以上三个数据算可优化概率。
关于可优化分值公式,字符数为主要影响,搜索量为辅助:
·可优化分值=新闻占位数*(搜索量系数*搜索量系数占比分值+字符数系数*字符数系数占比分值);
·默认搜索量系数占比分值为30,字符数系数占比分值为70。
分值得出后能够在相应的概率对应表中查出能出效果的有多少条(新闻占位),以及出效果的条数不同时的概率有多大。例如50分以下代表很难出效果。
搜索词(待处理关键词)评估之前,需要过滤存有违禁词过滤,这些词可能受平台限制不能展示。
正常情况下可以输出前三页关键词的优化概率,向客户发送优化建议,例如哪一页的优化数和概率多大。
任何搜索词(目标关键词)都有热点期和非热点期,有更新量的参考(历史优化关键词数据的预设时段选取到当前时刻)。
聚合推荐:各平台的搜索结果都存在聚合板块,通过对抓取结果的分析,提取包含的聚合类型并简单定义聚合特征。可以包括可进行优化的新闻聚合,最新相关聚合(时间特征)、视频大全聚合(播放特征)、贴吧聚合(评论特征)、经验集合(时间特征)、百家号聚合、图片聚合、热议聚合等。聚合推荐的板块在目标搜索引擎中的显示方式可以如图3所示,当搜索“美食”这一关键词时,页面上可能出现平台A提供的“如何辨别美食食材”,平台B的“美食-鱼香肉丝做法”,平台C的“美食菜谱中文版”,平台D的“美食制作视频欣赏”,平台E的“美食之乡”以及平台F的“大厨为您讲述美食”等视频聚合到一起的板块。
更新频率可以包括小时级/天级/月级/其他;播放量级可以包括百级/千级/万级/其他;评论量级可以包括百级/千级/万级/其他。
优化难度确定设备中显示无数据可以为屏蔽词(被过滤掉的),月均搜索量小于3000可以为低频词,月均搜索大于3000可以为常量词,月均搜索量大于10000可以为热频词,月均量搜索大于30000可以为极热词。其中低频词可以表示月均搜索量偏小,关注度量较小的词,常量词可以表示月均搜索量中等,大众化类型词,热频词可以表示月均搜索过万,常规属性且搜索偏大的词,极热词可以表示搜索极大,特殊类型且关注度极高的词。
优化难度确定设备中显示年内无更新可以为无更新词,月更新小于5条可以为低量更新词,月更新大于5条可以为常量更新词,日更新大于2条可以为高量更新词,日更新大于5条可以为实时更新词。其中无更新词可以表示近一年栏目内无新增的收录的资讯内容的词;低量更新词可以表示近月内有存在更新但更新量级很低的词;常量更新词可以表示近月内存在更新且数量较自然,相对活跃的词;高量更新词可以表示月更活跃、并存在日更的词;实时更新词可以表示每日更新频率较高,分钟或小时级实时更新的词。
图4为本申请一实施例提供的一种关键词优化难度确定装置的结构示意图,如图4所示的,本实施例的关键词优化难度确定装置400包括:搜索结果确定模块401、新闻确定模块402、目标关键词相关数据确定模块403、优化分值公式确定模块404、优化分值公式系数值确定模块405和优化难度确定模块406。
搜索结果确定模块401,用于基于目标搜索引擎,确定目标关键词对应的搜索结果;
新闻确定模块402,用于根据预设新闻链接形式,确定搜索结果的预设范围内是否存在新闻,新闻用于表征允许优化的一类搜索结果;
目标关键词相关数据确定模块403,用于当存在新闻时,确定新闻占位数、目标关键词的字符数、预设时段内目标关键词在目标搜索引擎中的月均搜索量;
优化分值公式确定模块404,用于根据目标搜索引擎的引擎类型,确定对应的优化分值公式;
优化分值公式系数值确定模块405,用于根据目标关键词的字符数、月均搜索量,确定优化分值公式中相关系数的值;
优化难度确定模块406,用于根据新闻占位数、优化分值公式中相关系数的值,确定优化分值公式的值,以确定目标关键词的优化难度。
可选的,优化分值公式系数值确定模块405具体用于:
根据目标关键词的字符数、月均搜索量、字符数搜索量与系数的对应关系,确定优化分值公式中相关系数的值。
可选的,关键词优化难度确定装置400还包括对应关系构建模块407,用于:
获取预设时段的历史优化关键词数据,历史优化关键词数据包括历史优化关键词的字符数、历史优化关键词的月均搜索量、历史优化关键词的搜索结果;
将历史优化关键词的字符数、历史优化关键词的月均搜索量进行区间划分,分别得到若干字符数区间和若干月均搜索量区间;
分别分析每一月均搜索量区间中历史优化关键词的搜索结果、每一字符数区间中历史优化关键词的搜索结果,确定每一月均搜索量区间对应的搜索量系数和每一字符数区间对应的字符数系数;
根据若干字符数区间、若干月均搜索量区间、每一月均搜索量区间对应的搜索量系数和每一字符数区间对应的字符数系数,构建字符数搜索量与系数的对应关系。
可选的,历史优化关键词的搜索结果包括预设范围内的历史新闻占位数;对应关系构建模块407具体用于:
按照历史新闻占位数,确定历史优化关键词的月均搜索量的第一分布特点;
根据第一分布特点对历史优化关键词的月均搜索量进行区间划分,得到若干月均搜索量区间;
按照历史新闻占位数,确定历史优化关键词的字符数的第二分布特点;
根据第二分布特点对历史优化关键词的字符数进行区间划分,得到若干字符数区间。
可选的,对应关系构建模块407具体用于:
从历史优化关键词数据中提取每一月均搜索量区间中预设范围内的第一新闻占位数;
将第一新闻占位数在对应月均搜索量区间中预设范围内的历史优化关键词的搜索结果中的占比,确定为月均搜索量区间的搜索量系数;
从历史优化关键词数据中提取每一字符数区间中预设范围内的第二新闻占位数;
将第二新闻占位数在对应字符数区间中预设范围内的历史优化关键词的搜索结果中的占比,确定为字符数区间的字符数系数。
可选的,目标关键词相关数据确定模块403具体用于:
当存在新闻时,抓取每一条新闻的名称字段,并根据名称字段判断新闻是否为聚合新闻;
若是聚合新闻,则抓取聚合新闻的聚合字段,并为聚合新闻定义聚合字段对应的聚合特征;
当聚合特征对应的显示数据大于预设优化阈值时,将聚合特征、对应的显示数据生成低效优化信息,并发送给对应的客户;
若聚合特征对应的显示数据小于等于预设优化阈值或新闻不是聚合新闻,则确定新闻占位数、目标关键词的字符数、预设时段内目标关键词在目标搜索引擎中的月均搜索量。
可选的,搜索结果确定模块401具体用于:
获取目标搜索引擎的过滤需求;
按照过滤需求对待处理关键词进行筛选,得到目标关键词;
确定目标关键词对应的搜索结果。
可选的,当预设范围对应多页搜索结果时,优化难度确定模块406具体用于:
针对每一页,根据当页的新闻占位数、当页的优化分值公式中相关系数的值,确定当页的优化分值公式的值;
为每一页的优化分值公式的值配置权重,确定目标关键词的优化难度。
本实施例的装置,可以用于执行上述任一实施例的方法,其实现原理和技术效果类似,此处不再赘述。
图5为本申请一实施例提供的一种电子设备的结构示意图,如图5所示,本实施例的电子设备500可以包括:存储器501和处理器502。
存储器501上存储有能够被处理器502加载并执行上述实施例中方法的计算机程序。
其中,处理器502和存储器501相连,如通过总线相连。
可选地,电子设备500还可以包括收发器。需要说明的是,实际应用中收发器不限于一个,该电子设备500的结构并不构成对本申请实施例的限定。
处理器502可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器502也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线可包括一通路,在上述组件之间传送信息。总线可以是PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器501可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器501用于存储执行本申请方案的应用程序代码,并由处理器502来控制执行。处理器502用于执行存储器501中存储的应用程序代码,以实现前述方法实施例所示的内容。
其中,电子设备包括但不限于:移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。还可以为服务器等。图5示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
本实施例的电子设备,可以用于执行上述任一实施例的方法,其实现原理和技术效果类似,此处不再赘述。
本申请还提供一种计算机可读存储介质,存储有能够被处理器加载并执行如上实施例中的方法的计算机程序。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (8)

1.一种关键词优化难度确定方法,其特征在于,包括:
基于目标搜索引擎,确定目标关键词对应的搜索结果;
根据预设新闻链接形式,确定所述搜索结果的预设范围内是否存在新闻,所述新闻用于表征允许优化的一类搜索结果;
当存在新闻时,确定新闻占位数、所述目标关键词的字符数、预设时段内所述目标关键词在所述目标搜索引擎中的月均搜索量;
根据所述目标搜索引擎的引擎类型,确定对应的优化分值公式,所述优化分值公式包括:优化分值=新闻占位数*(搜索量系数*30+字符数系数*70);
根据所述目标关键词的字符数、所述月均搜索量,确定所述优化分值公式中相关系数的值,所述相关系数包括所述搜索量系数和所述字符数系数;
根据所述新闻占位数、所述优化分值公式中相关系数的值,确定所述优化分值公式的值,以确定所述目标关键词的优化难度;
获取预设时段的历史优化关键词数据,所述历史优化关键词数据包括历史优化关键词的字符数、历史优化关键词的月均搜索量、历史优化关键词的搜索结果;
将所述历史优化关键词的字符数、所述历史优化关键词的月均搜索量进行区间划分,分别得到若干字符数区间和若干月均搜索量区间;
分别分析每一月均搜索量区间中所述历史优化关键词的搜索结果、每一字符数区间中所述历史优化关键词的搜索结果,确定所述每一月均搜索量区间对应的搜索量系数和所述每一字符数区间对应的字符数系数;
根据所述若干字符数区间、所述若干月均搜索量区间、所述每一月均搜索量区间对应的搜索量系数和所述每一字符数区间对应的字符数系数,构建字符数搜索量与系数的对应关系;
所述根据所述目标关键词的字符数、所述月均搜索量,确定所述优化分值公式中相关系数的值,包括:
根据所述目标关键词的字符数、所述月均搜索量、字符数搜索量与系数的对应关系,确定所述优化分值公式中相关系数的值。
2.根据权利要求1所述的方法,其特征在于,所述历史优化关键词的搜索结果包括预设范围内的历史新闻占位数;所述将所述历史优化关键词的字符数、所述历史优化关键词的月均搜索量进行区间划分,分别得到若干字符数区间和若干月均搜索量区间,包括:
按照历史新闻占位数,确定历史优化关键词的月均搜索量的第一分布特点;
根据所述第一分布特点对所述历史优化关键词的月均搜索量进行区间划分,得到若干月均搜索量区间;
按照历史新闻占位数,确定历史优化关键词的字符数的第二分布特点;
根据所述第二分布特点对所述历史优化关键词的字符数进行区间划分,得到若干字符数区间。
3.根据权利要求1所述的方法,其特征在于,所述分别分析每一月均搜索量区间中所述历史优化关键词的搜索结果、每一字符数区间中所述历史优化关键词的搜索结果,确定所述每一月均搜索量区间对应的搜索量系数和所述每一字符数区间对应的字符数系数,包括:
从所述历史优化关键词数据中提取每一月均搜索量区间中预设范围内的第一新闻占位数;
将所述第一新闻占位数在对应月均搜索量区间中预设范围内的历史优化关键词的搜索结果中的占比,确定为所述月均搜索量区间的搜索量系数;
从所述历史优化关键词数据中提取每一字符数区间中预设范围内的第二新闻占位数;
将所述第二新闻占位数在对应字符数区间中预设范围内的历史优化关键词的搜索结果中的占比,确定为所述字符数区间的字符数系数。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述当存在新闻时,确定新闻占位数、所述目标关键词的字符数、预设时段内所述目标关键词在所述目标搜索引擎中的月均搜索量,包括:
当存在新闻时,抓取每一条新闻的名称字段,并根据所述名称字段判断所述新闻是否为聚合新闻;
若是聚合新闻,则抓取所述聚合新闻的聚合字段,并为所述聚合新闻定义所述聚合字段对应的聚合特征;
当所述聚合特征对应的显示数据大于预设优化阈值时,将所述聚合特征、对应的显示数据生成低效优化信息,并发送给对应的客户;
若所述聚合特征对应的显示数据小于等于预设优化阈值或所述新闻不是聚合新闻,则确定新闻占位数、所述目标关键词的字符数、预设时段内所述目标关键词在所述目标搜索引擎中的月均搜索量。
5.根据权利要求1所述的方法,其特征在于,所述基于目标搜索引擎,确定目标关键词对应的搜索结果,包括:
获取所述目标搜索引擎的过滤需求;
按照所述过滤需求对待处理关键词进行筛选,得到目标关键词;
确定所述目标关键词对应的搜索结果。
6.根据权利要求1所述的方法,其特征在于,当所述预设范围对应多页搜索结果时,所述根据所述新闻占位数、所述优化分值公式中相关系数的值,确定所述优化分值公式的值,以确定所述目标关键词的优化难度,包括:
针对每一页,根据当页的所述新闻占位数、当页的所述优化分值公式中相关系数的值,确定当页的所述优化分值公式的值;
为所述每一页的所述优化分值公式的值配置权重,确定所述目标关键词的优化难度。
7.一种关键词优化难度确定装置,其特征在于,包括:
搜索结果确定模块,用于基于目标搜索引擎,确定目标关键词对应的搜索结果;
新闻确定模块,用于根据预设新闻链接形式,确定所述搜索结果的预设范围内是否存在新闻,所述新闻用于表征允许优化的一类搜索结果;
目标关键词相关数据确定模块,用于当存在新闻时,确定新闻占位数、所述目标关键词的字符数、预设时段内所述目标关键词在所述目标搜索引擎中的月均搜索量;
优化分值公式确定模块,用于根据所述目标搜索引擎的引擎类型,确定对应的优化分值公式,所述优化分值公式包括:优化分值=新闻占位数*(搜索量系数*30+字符数系数*70);
优化分值公式系数值确定模块,用于根据所述目标关键词的字符数、所述月均搜索量,确定所述优化分值公式中相关系数的值,所述相关系数包括所述搜索量系数和所述字符数系数;
优化难度确定模块,用于根据所述新闻占位数、所述优化分值公式中相关系数的值,确定所述优化分值公式的值,以确定所述目标关键词的优化难度;
所述关键词优化难度确定装置还包括对应关系构建模块,用于:
获取预设时段的历史优化关键词数据,所述历史优化关键词数据包括历史优化关键词的字符数、历史优化关键词的月均搜索量、历史优化关键词的搜索结果;
将所述历史优化关键词的字符数、所述历史优化关键词的月均搜索量进行区间划分,分别得到若干字符数区间和若干月均搜索量区间;
分别分析每一月均搜索量区间中所述历史优化关键词的搜索结果、每一字符数区间中所述历史优化关键词的搜索结果,确定所述每一月均搜索量区间对应的搜索量系数和所述每一字符数区间对应的字符数系数;
根据所述若干字符数区间、所述若干月均搜索量区间、所述每一月均搜索量区间对应的搜索量系数和所述每一字符数区间对应的字符数系数,构建字符数搜索量与系数的对应关系;
所述优化分值公式系数值确定模块具体用于:
根据所述目标关键词的字符数、所述月均搜索量、字符数搜索量与系数的对应关系,确定所述优化分值公式中相关系数的值。
8.一种电子设备,其特征在于,包括:存储器和处理器;
所述存储器,用于存储程序指令;
所述处理器,用于调用并执行所述存储器中的程序指令,执行如权利要求1-6任一项所述的关键词优化难度确定方法。
CN202310777925.6A 2023-06-28 2023-06-28 一种关键词优化难度确定方法、装置及电子设备 Active CN116932858B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310777925.6A CN116932858B (zh) 2023-06-28 2023-06-28 一种关键词优化难度确定方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310777925.6A CN116932858B (zh) 2023-06-28 2023-06-28 一种关键词优化难度确定方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN116932858A CN116932858A (zh) 2023-10-24
CN116932858B true CN116932858B (zh) 2024-02-27

Family

ID=88391689

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310777925.6A Active CN116932858B (zh) 2023-06-28 2023-06-28 一种关键词优化难度确定方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN116932858B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649795A (zh) * 2016-12-28 2017-05-10 北京奇虎科技有限公司 一种关键词数据的输出方法及装置
CN107122414A (zh) * 2017-03-31 2017-09-01 广东神马搜索科技有限公司 搜索结果推荐方法、设备、搜索引擎及电子设备
CN110443631A (zh) * 2019-06-28 2019-11-12 山东开创云软件有限公司 一种优化网站排名的计费方法、装置及存储介质
CN110502687A (zh) * 2019-08-22 2019-11-26 山东开创云软件有限公司 一种网站优化方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012109175A2 (en) * 2011-02-09 2012-08-16 Brightedge Technologies, Inc. Opportunity identification for search engine optimization

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649795A (zh) * 2016-12-28 2017-05-10 北京奇虎科技有限公司 一种关键词数据的输出方法及装置
CN107122414A (zh) * 2017-03-31 2017-09-01 广东神马搜索科技有限公司 搜索结果推荐方法、设备、搜索引擎及电子设备
CN110443631A (zh) * 2019-06-28 2019-11-12 山东开创云软件有限公司 一种优化网站排名的计费方法、装置及存储介质
CN110502687A (zh) * 2019-08-22 2019-11-26 山东开创云软件有限公司 一种网站优化方法和装置

Also Published As

Publication number Publication date
CN116932858A (zh) 2023-10-24

Similar Documents

Publication Publication Date Title
US10824682B2 (en) Enhanced online user-interaction tracking and document rendition
US8548996B2 (en) Ranking content items related to an event
US8781989B2 (en) Method and system to predict a data value
US9165254B2 (en) Method and system to predict the likelihood of topics
US7996407B2 (en) System, method and computer executable program for information tracking from heterogeneous sources
CN107862022B (zh) 文化资源推荐***
CN110334356B (zh) 文章质量的确定方法、文章筛选方法、以及相应的装置
US20070198459A1 (en) System and method for online information analysis
CN109857938B (zh) 基于企业信息的搜索方法、搜索装置及计算机存储介质
JP2011154668A (ja) ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法
CN110008396B (zh) 对象信息推送方法、装置、设备及计算机可读存储介质
WO2019242453A1 (zh) 信息处理方法及装置、存储介质、电子装置
JP2011107826A (ja) 行動情報抽出システム及び抽出方法
CN111061954A (zh) 搜索结果排序方法、装置及存储介质
JP2006318398A (ja) ベクトル生成方法及び装置及び情報分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記憶媒体
JP5302614B2 (ja) 施設関連情報の検索データベース形成方法および施設関連情報検索システム
JP2009116457A (ja) インターネットサイト情報分析方法と装置
JP5964149B2 (ja) 共起語を特定する装置およびプログラム
JP2015036923A (ja) 評価集計装置、評価順位作成装置、評価集計方法及びプログラム
CN116932858B (zh) 一种关键词优化难度确定方法、装置及电子设备
JP2011100191A (ja) 文書検索装置、文書検索方法、及び文書検索プログラム
CN104063514B (zh) 垂直搜索方法
CN111914154B (zh) 一种智能搜索导向***及方法
JP5361090B2 (ja) 話題語獲得装置、方法、及びプログラム
JP5131565B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant