CN110750682A - 一种标题热词自动计量方法、存储介质、电子设备及*** - Google Patents

一种标题热词自动计量方法、存储介质、电子设备及*** Download PDF

Info

Publication number
CN110750682A
CN110750682A CN201810737959.1A CN201810737959A CN110750682A CN 110750682 A CN110750682 A CN 110750682A CN 201810737959 A CN201810737959 A CN 201810737959A CN 110750682 A CN110750682 A CN 110750682A
Authority
CN
China
Prior art keywords
measured
time period
hot
occurrence
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810737959.1A
Other languages
English (en)
Other versions
CN110750682B (zh
Inventor
王璐
陈少杰
张文明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Douyu Network Technology Co Ltd
Original Assignee
Wuhan Douyu Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Douyu Network Technology Co Ltd filed Critical Wuhan Douyu Network Technology Co Ltd
Priority to CN201810737959.1A priority Critical patent/CN110750682B/zh
Publication of CN110750682A publication Critical patent/CN110750682A/zh
Application granted granted Critical
Publication of CN110750682B publication Critical patent/CN110750682B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measuring Frequencies, Analyzing Spectra (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种标题热词自动计量方法、存储介质、电子设备及***,涉及大数据领域领域,该方法包括获取各个直播间的标题,获取标题中的待计量热词。设置连续的时间周期,统计每一个时间周期内,所有待计量热词的出现次数。累加所有待计量热词的出现次数得到总出现次数,将每个周期的每个待计量热词的出现次数除以总出现次数,得到对应该时间周期的该待计量热词的占空比。根据每个所述时间周期内得到的待计量热词出现次数和占空比,使用预设的热度计量算法计算待计量热词的热度值,且所述占空比越高,待计量热词的热度越高。

Description

一种标题热词自动计量方法、存储介质、电子设备及***
技术领域
本发明涉及大数据领域领域,具体涉及一种标题热词自动计量方法、存储介质、电子设备及***。
背景技术
视频标题是视频内容的直接反映,而视频标题中的某些关键词语通常具有非常重要的意义。如果能对视频标题词语热度度量进行统计,那么就可以随时了解平台上的用户当前对哪些内容比较感兴趣,该结果能够帮助直播平台在推荐和搜索中给用户提供更好的帮助。
通常度量词语热度的方法是统计当前该词语出现的次数,次数越高热度越大。这样做的问题在于高频词和热门词之间存在概念上的差异,高频词因为其泛用性每天出现的次数都很多,但不见得这些高频次就是当前的热门词。为了解决该问题,亟需一种区分热门词和高频词的办法。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种标题热词自动计量方法、存储介质、电子设备及***,能够通过计算词语的热度值判断词语是否是热刺。
第一方面,本发明实施例提一种标题热词自动计量方法,其包括:
获取各个直播间的标题,获取标题中的待计量热词;
设置连续的时间周期,统计每一个时间周期内,所有待计量热词的出现次数,所述出现次数包括被查看次数、搜索次数、使用次数或点击次数;
累加所有待计量热词的出现次数得到总出现次数,将每个周期的每个待计量热词的出现次数除以总出现次数,得到对应该时间周期的该待计量热词的占空比;
根据每个所述时间周期内得到的待计量热词出现次数和占空比,使用预设的热度计量算法计算待计量热词的热度值,且所述占空比越高,待计量热词的热度越高。
优选的,所述预设的热度值计量算法包括以下步骤:
根据每个时间周期内待计量热词的出现次数和待计量热词总数,获得每个时间周期内待计量热词出现的平均次数;
累加每个时间周期内的平均次数,得到总平均次数,将每个周期的平均出现次数处于总平均次数得到平均占空比;
选定一个待计量热词,将该待计量热词在最晚时间周期出现的次数和占空比相乘得到第一乘积,将最晚时间周期的平均次数和平均占空比相乘得到第二乘积,获取第一乘积与第二乘积的和,并用该和除以该待计量热词在最晚时间周期出现的次数与最晚时间周期对应的平均次数的和,得到热度值。
优选的,其具体公式为:
其中,所述H0(i)为词语i在最晚的时间周期内的热度值,W0(i) 为词语i在最晚的时间段内的出现次数,W0为最晚时间的周期内待计量热词出现的平均次数,P0(i)为词语i在最晚的时间周期的占空比, P0为最晚的时间周期内待计量热词出现的平均占空比。
优选的,所述设置连续的时间周期,统计每一个时间周期内,所有待计量热词的出现次数,还包括以下步骤:每次统计一个时间周期,对之前的时间周期进行衰减。
优选的,所述衰减为线性衰减。
优选的,所述线性衰减的计算公式为:
W′k(i)=Wk(i)*(1-k/T)
其中W′k(i)为待计量热词i在第k+1个周期内衰减后的出现次数, Wk(i)为为待计量热词i在第k+1个周期内的出现次数,T为目前统计的时间周期总数。
优选的,所述衰减为指数衰减。
第二方面,本发明实施例还提供一种存储介质,该存储介质上存储有计算机程序:所述计算机程序被处理器执行时实现上述技术方案的方法。
第三方面,本发明实施例还提供一种电子设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序:所述处理器执行所述计算机程序时实现上述技术方案的方法。
第四方面,本发明实施例还提供一种标题热词自动计量***,其包括:
热词获取模块,用于获取各个直播间的标题,获取标题中的待计量热词;
统计模块,用于设置连续的时间周期,统计每一个时间周期内,所有待计量热词的出现次数,所述出现次数包括被查看次数、搜索次数、使用次数或点击次数;
第一计算模块,用于累加所有待计量热词的出现次数得到总出现次数,将每个周期的每个待计量热词的出现次数除以总出现次数,得到对应该时间周期的该待计量热词的占空比;
第二计算模块,用于根据每个所述时间周期内得到的待计量热词出现次数和占空比,使用预设的热度计量算法计算待计量热词的热度值,且所述占空比越高,待计量热词的热度越高。
与现有技术相比,本发明的优点在于:
本发明针对词语出现次数的在本身总次数的占比作为评价标准,减轻了出现频率对词汇热值的影响,进一步的通过衰减减少频率在过去出现次数对现在热值计算的影响,最终计算的热度值能够更叫准确的反应词汇之间热度的程度,即随着热度提升而增大,随着热度下降而减小。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面对实施例对应的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一种标题热词自动计量方法的流程示意图;
图2为本发明实施例一种标题热词自动计量***的结构示意图。
图中:1-热词获取模块,2-统计模块,3-第一计算模块,4-第二计算模块。
具体实施方式
以下结合附图对本发明的实施例作进一步详细说明。
参见图1所示,本发明实施例提供一种标题热词自动计量的方法、存储介质、电子设备及***,其通过获取词汇出现次数,能够合理且较精确的度量词汇热度的数值。
为达到上述技术效果,本申请的总体思路如下:
S1:获取各个直播间的标题,获取标题中的待计量热词;
S2:设置连续的时间周期,统计每一个时间周期内,所有待计量热词的出现次数,所述出现次数包括被查看次数、搜索次数、使用次数或点击次数;
S3:累加所有待计量热词的出现次数得到总出现次数,将每个周期的每个待计量热词的出现次数除以总出现次数,得到对应该时间周期的该待计量热词的占空比;
S4:根据每个所述时间周期内得到的待计量热词出现次数和占空比,使用预设的热度计量算法计算待计量热词的热度值,且所述占空比越高,待计量热词的热度越高。
直播平台获取平台上存在的直播标题,然后划分标题获得待计量的热词,在针对这些热词的出现次数进行统计,为了消除词汇出现频率高,但是并不是热词的影响,设置占空比等于出现次数除以总出现次数,即以当前时间周期出现周期占统计总次数的大小作为参数。
如果待计量热词为高频词,其每段时间周期出现的次数虽然高,但是基本不变,随着统计时间的增加,占空比逐渐下降;如果待计量热词为热词,其出现次数逐渐增高,占空比至少下降速度没有高频词快。因此设置占空比作为预设算法的参数能够减小出现次数/频率对热度值的影响。
为了更好的理解上述技术方案,下面结合具体实施方式进行详细的说明。
实施例一
本发明实施例提供一种标题热词自动计量方法,其包括以下步骤:
获取各个直播间的标题,获取标题中的待计量热词。
需要说明的是,直播平台需要计量热词就需要统计热词,而直播间获取热词需要从标题中获取,其提取热词的方案可以为本领域人员所公知的提取方案,也可以通过去除停词,获取次元,同时更具词元之间的联系,合并同时出现的词元得到热词。
举例来说,对视频的标题文本进行分词,去掉无用的停词,获取词元,但是有的热词是由次元组成的,如“英雄联盟”由“英雄”和“联盟”两个词元组成,可以采用建立分词词典的方式,也可以通过计算词语共同出现次数,建立词元之间的联系:假设分词后的词元出现的次数分别是w1,w2,...,wk,依次搜索相邻的两个词元wiwi+1,计算
Figure RE-GDA0001790398380000061
其中:N(wi)是词元wi出现的次数,N(wiwi+1)是词元 wi和wi+1连续出现的次数。如果pi>η,η为预设的阈值,那么说明wi和wi+1在一起出现的可能性比较高,因此将两个词语进行合并,否则不合并。按照上述步骤,进行多轮搜索,直到没有任意两个词语可以合并即完成了步骤S1。
S2:设置连续的时间周期,统计每一个时间周期内,所有待计量热词的出现次数,所述出现次数包括被查看次数、搜索次数、使用次数或点击次数。
获得待计量热词后,需要获得热词的相关参数,即热词的出现次数,这里出现次数可以是该标题所在直播间被查看的次数,也可以是用户搜索直播间标题时候总的搜索次数,也可以是主播使用该词为标题的次数,还可以是用户看到直播间标题后点击的总次数,或者是上述次数的综合次数,只要是能够一定程度上反映词语热度的次数均可作为统计项目。
S3:累加所有待计量热词的出现次数得到总出现次数,将每个周期的每个待计量热词的出现次数除以总出现次数,得到对应该时间周期的该待计量热词的占空比;
对于热词来说,由于其出现次数是逐渐增加的,在最晚的时间周期中,其占比是逐渐增大的。而对于频率词,其出现次数是基本不变的,在最晚时间周期中,其占比是随着统计时间周期增加而减少的。
举例来说,热词的出现频率是增加的,连续5个周期统计次数为 0次,10次,30次,200次,1000次,那么该热词在最晚时间周期的占空比为1000/(0+10+30+200+1000)≈0.81。高频词设其连续5个时间周期统计次数为5000次、5000次、5000次、5000次、5000次,那么该高频词在最晚时间周期的占空比为5000/(5000*5)=0.2。由此可以看出占空比能够较少的被出现次数影响。
S4:根据每个所述时间周期内得到的待计量热词出现次数和占空比,使用预设的热度计量算法计算待计量热词的热度值,且所述占空比越高,待计量热词的热度越高。
由于占空比能够较少的被出现次数影响,使用占空比作为参数,且该空比越高,待计量热词的热度越高时,本领域技术人员可以很容易的推出,计算的热度值收到次数的影响也较小。。
作为一个可选的实施方案,预设的热度值计量算法包括以下步骤:
B1:根据每个时间周期内待计量热词的出现次数和待计量热词总数,获得每个时间周期内待计量热词出现的平均次数;
B2:累加每个时间周期内的平均次数,得到总平均次数,将每个周期的平均出现次数处于总平均次数得到平均占空比;
B3:选定一个待计量热词,将该待计量热词在最晚时间周期出现的次数和占空比相乘得到第一乘积,将最晚时间周期的平均次数和平均占空比相乘得到第二乘积,获取第一乘积与第二乘积的和,并用该和除以该待计量热词在最晚时间周期出现的次数与最晚时间周期对应的平均次数的和,得到热度值。
其计算公式为:
Figure RE-GDA0001790398380000081
其中,所述H0(i)为词语i在最晚的时间周期内的热度值,W0(i) 为词语i在最晚的时间段内的出现次数,W0为最晚时间的周期内待计量热词出现的平均次数,P0(i)为词语i在最晚的时间周期的占空比, P0为最晚的时间周期内待计量热词出现的平均占空比。
作为一个优选的实施方案,在设置连续的时间周期,统计每一个时间周期内,所有待计量热词的出现次数,还包括以下步骤:每次统计一个时间周期,对之前的时间周期进行衰减。
对于线衰减而言,次数越多,其收到的衰减的影响越大,比如同样时衰减为原来的1/5,500次出现次数被减少了500*4/5=400次,而対于10次的出现次数,只被衰减了10*4/5=8次,因此対于高频词汇来说,其较早时间周期收到的衰减影响会较大,而热词其前期起步次数较小收到衰减的影响少,进而计算热值收到衰减的影响小,相对于高频词更加容易区分。
进一步的该衰减为线性衰减。
线性衰减对于时间约靠前的出现次数衰减越大,进一步的将增加高频词在更早时间周期的影响。
举例来说,线性衰减的公式为:
W′k(i)=Wk(i)*(1-k/T)
其中W′k(i)为待计量热词i在第k+1个周期内衰减后的出现次数, Wk(i)为为待计量热词i在第k+1个周期内的出现次数,T为目前统计的时间周期总数。
作为一个可选的实施方案:所述衰减为指数衰减。
实施例二
如图2所示,本发明还提供一种标题热词自动加量***,其包括
热词获取模块1,用于获取各个直播间的标题,获取标题中的待计量热词;
统计模块2,用于设置连续的时间周期,统计每一个时间周期内,所有待计量热词的出现次数,所述出现次数包括被查看次数、搜索次数、使用次数或点击次数;
第一计算模块3,用于累加所有待计量热词的出现次数得到总出现次数,将每个周期的每个待计量热词的出现次数除以总出现次数,得到对应该时间周期的该待计量热词的占空比;
第二计算模块4,用于根据每个所述时间周期内得到的待计量热词出现次数和占空比,使用预设的热度计量算法计算待计量热词的热度值,且所述占空比越高,待计量热词的热度越高。
前述方法实施例中的各种变化方式和具体实例同样适用于本实施例的***,通过前述方法的详细描述,本领域技术人员可以清楚的知道本实施例中***的实施方法,所以为了说明书的简洁,在此不再详述。
基于同一发明构思,本申请提供实施例三,其具体实施方式如下:
实施例三
对应上述一种标题热词自动计量方法,本发明还提供一种存储介质,存储介质上存储有计算机程序,计算机程序被处理器执行时实现以下步骤。
获取各个直播间的标题,获取标题中的待计量热词;
设置连续的时间周期,统计每一个时间周期内,所有待计量热词的出现次数,所述出现次数包括被查看次数、搜索次数、使用次数或点击次数;
累加所有待计量热词的出现次数得到总出现次数,将每个周期的每个待计量热词的出现次数除以总出现次数,得到对应该时间周期的该待计量热词的占空比;
根据每个所述时间周期内得到的待计量热词出现次数和占空比,使用预设的热度计量算法计算待计量热词的热度值,且所述占空比越高,待计量热词的热度越高。
需要说明的是,所述存储介质包括U盘、移动硬盘、ROM(Read- Only Memory,只读存储器)、RAM(Random Access Memory,随机存取存储器)、磁碟或者光盘等各种可以存储程序代码的介质。这些存储戒指存储的计算机程序执行时,实现上述实施例的方法。
基于同一发明构思,本申请提供实施例四,其具体实施方式如下:
实施例四
对应上述一种标题热词自动计量方法,本发明还提供一种电子设备,该电子设备存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取各个直播间的标题,获取标题中的待计量热词;
设置连续的时间周期,统计每一个时间周期内,所有待计量热词的出现次数,所述出现次数包括被查看次数、搜索次数、使用次数或点击次数;
累加所有待计量热词的出现次数得到总出现次数,将每个周期的每个待计量热词的出现次数除以总出现次数,得到对应该时间周期的该待计量热词的占空比;
根据每个所述时间周期内得到的待计量热词出现次数和占空比,使用预设的热度计量算法计算待计量热词的热度值,且所述占空比越高,待计量热词的热度越高。
总体来说,本发明实施例提供的一种标题热词自动计量的方法、存储介质、电子设备及***,通过计量词语的热度值确认热词,相较于传统的技术,能够通过热词出现次数的占空比减少高频出现的影响,同时对越早的时间周期进行衰减,能够更好的减少因为时间堆积高频词汇统计次数越多的影响,是的计算热度更加合理。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和 /或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种标题热词自动计量方法,其特征在于,其包括:
获取各个直播间的标题,获取标题中的待计量热词;
设置连续的时间周期,统计每一个时间周期内,所有待计量热词的出现次数,所述出现次数包括被查看次数、搜索次数、使用次数或点击次数;
累加所有待计量热词的出现次数得到总出现次数,将每个周期的每个待计量热词的出现次数除以总出现次数,得到对应该时间周期的该待计量热词的占空比;
根据每个所述时间周期内得到的待计量热词出现次数和占空比,使用预设的热度计量算法计算待计量热词的热度值,且所述占空比越高,待计量热词的热度越高。
2.如权利要求1所述的方法,其特征在于,所述预设的热度值计量算法包括以下步骤:
根据每个时间周期内待计量热词的出现次数和待计量热词总数,获得每个时间周期内待计量热词出现的平均次数;
累加每个时间周期内的平均次数,得到总平均次数,将每个周期的平均出现次数处于总平均次数得到平均占空比;
选定一个待计量热词,将该待计量热词在最晚时间周期出现的次数和占空比相乘得到第一乘积,将最晚时间周期的平均次数和平均占空比相乘得到第二乘积,获取第一乘积与第二乘积的和,并用该和除以该待计量热词在最晚时间周期出现的次数与最晚时间周期对应的平均次数的和,得到热度值。
3.如权利要求2所述的方法,其特征在于,所述预设的热度值计量具体公式为:
Figure FDA0001722512190000021
其中,所述H0(i)为词语i在最晚的时间周期内的热度值,W0(i)为词语i在最晚的时间段内的出现次数,W0为最晚时间的周期内待计量热词出现的平均次数,P0(i)为词语i在最晚的时间周期的占空比,P0为最晚的时间周期内待计量热词出现的平均占空比。
4.如权利要求1所述的方法,其特征在于,所述设置连续的时间周期,统计每一个时间周期内,所有待计量热词的出现次数,还包括以下步骤:每次统计一个时间周期,对之前的时间周期进行衰减。
5.如权利要求4所述的方法,其特征在于:所述衰减为线性衰减。
6.如权利要求5所述的方法,其特征在于,所述线性衰减的计算公式为:
W′k(i)=Wk(i)*(1-k/T)
其中W′k(i)为待计量热词i在第k+1个周期内衰减后的出现次数,Wk(i)为为待计量热词i在第k+1个周期内的出现次数,T为目前统计的时间周期总数。
7.如权利要求4所述的方法,其特征在于:所述衰减为指数衰减。
8.一种存储介质,该存储介质上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1至7任一项所述的方法。
9.一种电子设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1至4任一项所述的方法。
10.一种标题热词自动计量***,其特征在于,其包括:
热词获取模块,用于获取各个直播间的标题,获取标题中的待计量热词;
统计模块,用于设置连续的时间周期,统计每一个时间周期内,所有待计量热词的出现次数,所述出现次数包括被查看次数、搜索次数、使用次数或点击次数;
第一计算模块,用于累加所有待计量热词的出现次数得到总出现次数,将每个周期的每个待计量热词的出现次数除以总出现次数,得到对应该时间周期的该待计量热词的占空比;
第二计算模块,用于根据每个所述时间周期内得到的待计量热词出现次数和占空比,使用预设的热度计量算法计算待计量热词的热度值,且所述占空比越高,待计量热词的热度越高。
CN201810737959.1A 2018-07-06 2018-07-06 一种标题热词自动计量方法、存储介质、电子设备及*** Active CN110750682B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810737959.1A CN110750682B (zh) 2018-07-06 2018-07-06 一种标题热词自动计量方法、存储介质、电子设备及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810737959.1A CN110750682B (zh) 2018-07-06 2018-07-06 一种标题热词自动计量方法、存储介质、电子设备及***

Publications (2)

Publication Number Publication Date
CN110750682A true CN110750682A (zh) 2020-02-04
CN110750682B CN110750682B (zh) 2022-08-16

Family

ID=69274755

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810737959.1A Active CN110750682B (zh) 2018-07-06 2018-07-06 一种标题热词自动计量方法、存储介质、电子设备及***

Country Status (1)

Country Link
CN (1) CN110750682B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737553A (zh) * 2020-06-16 2020-10-02 苏州朗动网络科技有限公司 企业关联词的选取方法、设备和存储介质
CN111782702A (zh) * 2020-06-29 2020-10-16 北京金山云网络技术有限公司 一种元数据热度排序方法、装置、设备及存储介质
CN114938477A (zh) * 2022-06-23 2022-08-23 阿里巴巴(中国)有限公司 视频话题确定方法、装置及设备

Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101464898A (zh) * 2009-01-12 2009-06-24 腾讯科技(深圳)有限公司 一种提取文本主题词的方法
US20110199825A1 (en) * 2010-02-17 2011-08-18 Samsung Electronics Co., Ltd. Nonvolatile memory device, operating method thereof, and memory system including the same
CN103164424A (zh) * 2011-12-13 2013-06-19 阿里巴巴集团控股有限公司 一种时效性词的获取方法和装置
CN103294686A (zh) * 2012-02-24 2013-09-11 腾讯科技(深圳)有限公司 一种网页作弊用户、作弊网页的识别方法及***
CN103546326A (zh) * 2013-11-04 2014-01-29 北京中搜网络技术股份有限公司 一种网站流量统计的方法
CN103617169A (zh) * 2013-10-23 2014-03-05 杭州电子科技大学 一种基于Hadoop的微博热点话题提取方法
CN104008106A (zh) * 2013-02-25 2014-08-27 腾讯科技(深圳)有限公司 一种获取热点话题的方法及装置
JP2014182445A (ja) * 2013-03-18 2014-09-29 Mitsubishi Electric Corp 情報処理装置およびナビゲーション装置
CN104102681A (zh) * 2013-04-15 2014-10-15 腾讯科技(深圳)有限公司 一种微博关键事件获取方法和装置
CN104252470A (zh) * 2013-06-26 2014-12-31 重庆新媒农信科技有限公司 一种热词推荐方法及***
CN104679738A (zh) * 2013-11-27 2015-06-03 北京拓尔思信息技术股份有限公司 互联网热词挖掘方法及装置
CN105045882A (zh) * 2015-07-21 2015-11-11 无锡天脉聚源传媒科技有限公司 一种热词处理方法及装置
CN106503256A (zh) * 2016-11-11 2017-03-15 中国科学院计算技术研究所 一种基于社交网络文档的热点信息挖掘方法
CN106919693A (zh) * 2017-03-07 2017-07-04 广州优视网络科技有限公司 一种提高热词曝光覆盖率的方法和装置
CN107122481A (zh) * 2017-05-04 2017-09-01 成都华栖云科技有限公司 新闻热度实时在线预测方法
CN107220384A (zh) * 2017-06-29 2017-09-29 北京拉勾科技有限公司 一种基于相关性的搜索词处理方法、装置及计算设备
CN107391661A (zh) * 2017-07-18 2017-11-24 海信集团有限公司 推荐词显示方法及装置
CN107423444A (zh) * 2017-08-10 2017-12-01 世纪龙信息网络有限责任公司 热词词组提取方法和***
CN108170692A (zh) * 2016-12-07 2018-06-15 腾讯科技(深圳)有限公司 一种热点事件信息处理方法和装置
CN108205572A (zh) * 2016-12-20 2018-06-26 百度在线网络技术(北京)有限公司 一种搜索方法、装置及设备

Patent Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101464898A (zh) * 2009-01-12 2009-06-24 腾讯科技(深圳)有限公司 一种提取文本主题词的方法
US20110199825A1 (en) * 2010-02-17 2011-08-18 Samsung Electronics Co., Ltd. Nonvolatile memory device, operating method thereof, and memory system including the same
CN103164424A (zh) * 2011-12-13 2013-06-19 阿里巴巴集团控股有限公司 一种时效性词的获取方法和装置
CN103294686A (zh) * 2012-02-24 2013-09-11 腾讯科技(深圳)有限公司 一种网页作弊用户、作弊网页的识别方法及***
CN104008106A (zh) * 2013-02-25 2014-08-27 腾讯科技(深圳)有限公司 一种获取热点话题的方法及装置
JP2014182445A (ja) * 2013-03-18 2014-09-29 Mitsubishi Electric Corp 情報処理装置およびナビゲーション装置
CN104102681A (zh) * 2013-04-15 2014-10-15 腾讯科技(深圳)有限公司 一种微博关键事件获取方法和装置
CN104252470A (zh) * 2013-06-26 2014-12-31 重庆新媒农信科技有限公司 一种热词推荐方法及***
CN103617169A (zh) * 2013-10-23 2014-03-05 杭州电子科技大学 一种基于Hadoop的微博热点话题提取方法
CN103546326A (zh) * 2013-11-04 2014-01-29 北京中搜网络技术股份有限公司 一种网站流量统计的方法
CN104679738A (zh) * 2013-11-27 2015-06-03 北京拓尔思信息技术股份有限公司 互联网热词挖掘方法及装置
CN105045882A (zh) * 2015-07-21 2015-11-11 无锡天脉聚源传媒科技有限公司 一种热词处理方法及装置
CN106503256A (zh) * 2016-11-11 2017-03-15 中国科学院计算技术研究所 一种基于社交网络文档的热点信息挖掘方法
CN108170692A (zh) * 2016-12-07 2018-06-15 腾讯科技(深圳)有限公司 一种热点事件信息处理方法和装置
CN108205572A (zh) * 2016-12-20 2018-06-26 百度在线网络技术(北京)有限公司 一种搜索方法、装置及设备
CN106919693A (zh) * 2017-03-07 2017-07-04 广州优视网络科技有限公司 一种提高热词曝光覆盖率的方法和装置
CN107122481A (zh) * 2017-05-04 2017-09-01 成都华栖云科技有限公司 新闻热度实时在线预测方法
CN107220384A (zh) * 2017-06-29 2017-09-29 北京拉勾科技有限公司 一种基于相关性的搜索词处理方法、装置及计算设备
CN107391661A (zh) * 2017-07-18 2017-11-24 海信集团有限公司 推荐词显示方法及装置
CN107423444A (zh) * 2017-08-10 2017-12-01 世纪龙信息网络有限责任公司 热词词组提取方法和***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
侯忠辉等: "面向消防行业的热词分析***的研究与设计", 《》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737553A (zh) * 2020-06-16 2020-10-02 苏州朗动网络科技有限公司 企业关联词的选取方法、设备和存储介质
CN111782702A (zh) * 2020-06-29 2020-10-16 北京金山云网络技术有限公司 一种元数据热度排序方法、装置、设备及存储介质
CN111782702B (zh) * 2020-06-29 2024-05-03 北京金山云网络技术有限公司 一种元数据热度排序方法、装置、设备及存储介质
CN114938477A (zh) * 2022-06-23 2022-08-23 阿里巴巴(中国)有限公司 视频话题确定方法、装置及设备
CN114938477B (zh) * 2022-06-23 2024-05-03 阿里巴巴(中国)有限公司 视频话题确定方法、装置及设备

Also Published As

Publication number Publication date
CN110750682B (zh) 2022-08-16

Similar Documents

Publication Publication Date Title
CN110750682B (zh) 一种标题热词自动计量方法、存储介质、电子设备及***
CN104469508A (zh) 基于弹幕信息内容进行视频定位的方法、服务器和***
CN104599160A (zh) 商品推荐方法和装置
CN109558514B (zh) 视频推荐方法、其装置、信息处理设备及存储介质
CN102890689A (zh) 一种用户兴趣模型的建立方法及***
CN109885656B (zh) 基于量化热度的微博转发预测方法及装置
CN105302807B (zh) 一种获取信息类别的方法和装置
CN108471544A (zh) 一种构建视频用户画像方法及装置
CN109697247B (zh) 一种数据准确性的检测方法及装置
CN106488256B (zh) 一种数据处理方法及装置
CN110290400A (zh) 可疑刷量视频的识别方法、真实播放量预估方法及装置
WO2022007626A1 (zh) 视频内容推荐方法、装置及计算机设备
CN111026965A (zh) 基于知识图谱的热点话题追溯方法及装置
CN110659945A (zh) 一种统计广告曝光次数的方法、装置和计算机设备
CN116522930A (zh) 一种热词提取方法、装置及存储介质
CN105005555A (zh) 基于聊天时间的关键词提取方法及装置
CN108830636B (zh) 一种活跃用户的询量方法和装置
CN101102316A (zh) 一种网页去重的方法及***
CN108664605B (zh) 一种模型评估方法及***
CN112231342A (zh) 一种多条件分页查询优化方法、***、终端及存储介质
CN108495150B (zh) 一种视频点击满意度的确定方法及装置
CN106600300B (zh) 应用程序用户粘度的分析方法及装置
CN109033352B (zh) 一种增值业务推荐方法及装置
CN110110502A (zh) 音频文件的防拷贝方法、装置以及移动式存储设备
CN111666749B (zh) 热点文章识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant