CN111966948A - 信息投放方法、装置、设备及存储介质 - Google Patents

信息投放方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111966948A
CN111966948A CN202011021719.5A CN202011021719A CN111966948A CN 111966948 A CN111966948 A CN 111966948A CN 202011021719 A CN202011021719 A CN 202011021719A CN 111966948 A CN111966948 A CN 111966948A
Authority
CN
China
Prior art keywords
search
website
target
websites
intention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011021719.5A
Other languages
English (en)
Other versions
CN111966948B (zh
Inventor
王晓元
周振宇
叶峻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202011021719.5A priority Critical patent/CN111966948B/zh
Publication of CN111966948A publication Critical patent/CN111966948A/zh
Application granted granted Critical
Publication of CN111966948B publication Critical patent/CN111966948B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种信息投放方法,涉及互联网技术领域,具体的,涉及网络推广领域,可应用于用户意图识别场景。该信息投放方法包括获取多个网站的历史访问数据,并根据历史访问数据确定在多个网站中要进行信息投放的目标网站集合;根据历史访问数据确定用于访问目标网站集合的意图搜索词集合以及意图搜索词集合中各个意图搜索词的权重;根据意图搜索词集合以及权重,对于访问目标网站集合中的至少一个目标网站的用户进行筛选以得到目标用户集合;以及将信息投放给目标用户集合中的用户。本公开还提供了一种信息投放装置、设备和存储介质。

Description

信息投放方法、装置、设备及存储介质
技术领域
本公开涉及互联网技术领域,具体的,涉及网络推广领域,更具体的,涉及一种信息投放方法、装置、设备及存储介质。
背景技术
随着互联网技术的发展,信息投放成为一种主要的信息流营销手段。目前,信息投放方法主要包括基于意图词的信息投放和基于人群包的信息投放。
基于意图词的信息投放通过设置与要进行投放的信息的业务相关的意图词来圈定目标投放人群,这种方法不能充分地反映用户的潜在意图。基于人群包的信息投放通过设置访问预定网站的用户的分群条件来圈定目标投放人群,这种方法虽然可以在一定程度上大致反映用户的潜在意图,但目标投放人群和业务均被限制在一个预定网站。
发明内容
有鉴于此,本公开提供了一种信息投放方法、装置、设备及存储介质。
本公开的第一方面提供了一种信息投放方法,包括:
获取多个网站的历史访问数据,并根据所述历史访问数据确定在所述多个网站中要进行信息投放的目标网站集合;
根据所述历史访问数据确定用于访问所述目标网站集合的意图搜索词集合以及所述意图搜索词集合中各个意图搜索词的权重;
根据所述意图搜索词集合以及所述权重,对于访问所述目标网站集合中的至少一个目标网站的用户进行筛选以得到目标用户集合;以及
将所述信息投放给所述目标用户集合中的用户。
本公开的第二方面提供了一种信息投放装置,包括:
目标网站确定模块,配置为获取多个网站的历史访问数据,并根据所述历史访问数据确定在所述多个网站中要进行信息投放的目标网站集合;
意图表示确定模块,配置为根据所述历史访问数据确定用于访问所述目标网站集合的意图搜索词集合以及所述意图搜索词集合中各个意图搜索词的权重;
目标用户筛选模块,配置为根据所述意图搜索词集合以及所述权重,对于访问所述目标网站集合中的至少一个目标网站的用户进行筛选以得到目标用户集合;以及
信息投放模块,配置为将所述信息投放给所述目标用户集合中的用户。
本公开的第三方面提供了一种信息投放设备,包括:
存储器,存储有程序指令;以及
处理器,被配置为执行所述程序指令,以执行本公开第一方面所提供的信息投放方法。
本公开的第四方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现本公开第一方面所提供的信息投放方法。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了应用根据本公开实施例的信息投放方法的***架构;
图2示意性示出了根据本公开实施例的信息投放方法的流程图;
图3示意性示出了根据本公开另一实施例的在多个网站中确定目标网站集合的方法的流程图;
图4示意性示出了图3所示的在多个网站中确定目标网站集合的方法的执行过程;
图5示意性示出了根据本公开另一实施例的确定意图搜索词的权重的方法的流程图;
图6示意性示出了根据本公开另一实施例的根据意图搜索词和权重筛选目标用户的方法的流程图;
图7示意性示出了根据本公开实施例的信息投放装置的框图;
图8示意性示出了根据本公开实施例的适于执行信息投放的信息投放设备的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。
在利用路侧传感器所采集的图像数据所构建的训练数据集训练并建立灯色识别神经网络模型时,由于黄灯数据在训练数据集中占比较少,从而影响所建立的神经网络模型的识别效果。本公开实施例提出了一种图像数据挖掘方法,用于从利用路侧传感器所采集的图像数据中自动地筛选黄灯点亮的图像数据,以对训练数据集进行补充,从而改进所建立的神经网络模型的识别效果。
图1示意性示出了应用根据本公开实施例的信息投放方法的***架构。如图1所示,终端设备101与服务器102经由网络103进行通信。终端设备101可以是能够用于进行互联网访问的各种电子设备,包括但不限于个人计算机、笔记本电脑、平板电脑、移动电话、智能电话、个人数字助理PDA、可穿戴设备等。服务器102采集用户访问互联网时的各种行为数据,并通过分析用户行为数据来挖掘用户的意图,以根据用户的意图向用户推送业务信息流。服务器102可以是独立的服务器也可以是由多个服务器所组成的集群。图1所示的***架构仅为实例,根据本公开实施例的信息投放方法可以应用于任何合适的场景中,以实现针对意图人群的信息投放。
图2示意性示出了根据本公开实施例的信息投放方法200的流程图。如图2所示,信息投放方法200包括以下步骤:
在步骤S210中,获取多个网站的历史访问数据,并根据历史访问数据确定在多个网站中要进行信息投放的目标网站集合。
在步骤S220中,根据历史访问数据确定用于访问目标网站集合的意图搜索词集合以及意图搜索词集合中各个意图搜索词的权重。
在步骤S230中,根据意图搜索词集合以及权重,对于访问目标网站集合中的至少一个目标网站的用户进行筛选以得到目标用户集合。
在步骤S240中,将信息投放给目标用户集合中的用户。
在基于人群包的信息投放过程中,将信息固定投放于一个目标网站,该目标网站与要进行投放的信息在业务上密切相关,这种业务上的密切相关性可以通过投放信息之前的行业调研来确定。基于人群包的信息投放方法的局限在于,一方面,由于这种信息投放的目标对象局限于到访该目标网站的人群,因此有可能错失实际上对要进行投放的信息有兴趣,但访问了另一个在业务上类似的网站而未到访该目标网站的用户。另一方面,出于对前期调研的成本考虑,不可能在信息投放之前获取到所有业务上类似的网站来进行信息投放。
根据本公开的实施例,首先对要进行信息投放的目标网站进行扩充。具体的,在步骤S210中,获取多个网站的历史访问数据,网站的历史访问数据用于记录用户对网站的历史访问行为。例如,历史访问数据中记录有用户访问行为发生的时间,用户访问的网站,用户访问的网站的具体页面,用户到访该具体页面的时间以及离开该页面的时间等用户访问行为轨迹。进一步地,根据这些历史访问数据,可以获取用户在一个具体网页上的停留时间,用户在一段时间内访问某个网站或某个具体的页面的次数等信息。
网站的历史访问数据可以记录在用户设备上。例如用户通过安装于个人电脑或手持移动设备上的浏览器应用来访问互联网时,浏览器可以将用户的访问行为相应地记录在搜索日志中。例如,在搜索日志中,通常记录由所访问网站的网址和时间、执行访问的用户的身份信息以及用户所使用的搜索语句等。根据实施例,可以利用搜索日志来获取网站的历史访问数据。但本公开的实施例不限于此,可以采用各种合适的方法来获取网站的历史访问数据。
接下来,在根据所获取的历史访问数据所得到的多个网站中确定与要进行信息投放的第一网站在业务上类似的至少一个网站,以对要进行信息投放的网站进行扩充。这里,要进行信息投放的第一网站可以如前所述的通过投放信息之前的行业调研所确定的目标网站,也可以是根据业务属性上的显著相关性所确定的目标网站,也可以是在已有的基于人群包的信息投放应用中所针对的目标网站。本领域技术人员可以根据实际情况来确定该第一网站。根据实施例,对目标网站进行扩充的原则是找出与第一网站在业务上类似的网站。这样,通过对目标网站进行扩充,可以在业务上对信息投放进行扩展。如果用户对与第一网站的相关的业务感兴趣,则即使用户未访问第一网站,也有很大可能访问与第一网站在业务上类似的其他网站。因此,在本实施例中,通过对目标网站进行扩充,能够显著地扩大信息投放方范围。
接下来,在将要进行信息投放的目标网站扩展为目标网站集合之后,需要对访问网站的用户的意图进行进一步判定。这是因为,访问目标网站集合的用户很可能仅是错误地访问了目标网站集合中的一个或几个目标网站,这种情况下,并不能认为该用户对与目标网站集合相关的业务有兴趣,因此有可能造成信息的错误投放。在本公开的实施例中,在步骤S220中和步骤S230中,通过根据历史访问数据确定用于访问目标网站集合的意图搜索词集合以及意图搜索词集合中各个意图搜索词的权重,并根据意图搜索词集合以及意图搜索词集合中各个意图搜索词的权重,对于访问目标网站集合中的至少一个目标网站的用户进行进一步筛选,从而排除实际上只是错误地访问了目标网站集合中的一个或几个目标网站的用户,以避免信息的错误投放。根据实施例,通过对访问目标网站集合中的至少一个目标网站的用户进行进一步筛选来得到目标用户集合,并在步骤S240中,仅对目标用户集合进行信息投放。
根据本公开的实施例,通过对要进行信息投放的目标网站进行扩展来得到目标网站集合,显著地扩大了信息投放的覆盖范围。同时根据用于访问目标网站集合的意图搜索词集合以及意图搜索词的权重来推断访问目标网站集合中的至少一个目标网站的用户实际意图来进行信息投放,保证了信息的准确投放。
图3示意性示出了根据本公开另一实施例的在多个网站中确定目标网站集合的方法的流程图。如图3所示,包括以下步骤:
在步骤S311中,根据历史访问数据确定针对多个网站中的每个网站的搜索语句集合。
在步骤S312中,在多个网站中确定要进行信息投放的第一网站。
在步骤S313中,在多个网站中确定搜索语句集合与第一网站的搜索语句集合有交集的网站作为候选网站。
在步骤S314中,在候选网站中确定搜索语句集合与第一网站的搜索语句集合的相似度大于预设的第二阈值的候选网站作为第二网站。
在步骤S315中,将第一网站和第二网站包含在目标网站集合中。
根据实施例,在步骤S311中,网站的搜索语句集合指的是用户通过搜索并访问该网站时所使用的搜索语句。在本实施例中,搜索语句可以是任何形式的表达式。例如,搜索语句可以是一句语句、一个短语、一个词,也可以是一个包含字符的表达式,例如利用空格相互间隔的多个短语、多个词等。本公开实施例中对搜索语句的形式不做限定。根据实施例,可以通过搜索日志来获得搜索语句以及搜索语句与网站的对应关系。可以借助现有的搜索日志提取工具来获取访问网站的用户的身份信息、用户访问网站的时间、用户所使用的搜索语句以及所访问的网站的网址。根据这些信息,将用户所使用的搜索语句包含在搜索语句集合中。容易理解的是,同一个用户可以通过不同的搜索语句进入相同的网站或网站页面,不同的用户可以通过相同或不同的搜索语句进入相同的网站或网站页面。这些搜索语句都应被包含在与所访问的网站相对应的搜索语句集合中。举例而言,根据搜索日志的记录,用户A通过搜索语句“***软件”访问了IT技术网站C,而用户B通过搜索语句“***无法启动”访问了IT技术网站C,在搜索语句“***软件”和“***无法启动”都将被包含在网站C的搜索语句集合中。
接下来,在步骤S312中,可以采用前述实施例中的方法来确定要进行信息投放的第一网站。例如,将根据要进行投放的信息的业务属性所确定的首选网站作为第一网站。或者在现有基于人群包的信息投放应用的基础上对进行信息投放的目标网站进行扩充,以现有基于人群包的信息投放应用中所针对的目标网站作为第一网站。
接下来,在步骤S313中,在多个网站中确定作为候选网站的网站,即对与第一网站在业务上类似的网站进行初步筛选。根据实施例,将多个网站中除第一网站以外的每个网站的搜索语句集合与第一网站的搜索语句集合进行比较,如果在网站(除第一网站以外)的搜索语句集合中包括第一网站的搜索语句集合中的某个搜索语句,则将该网站确定为候选网站。依次比较多个网站中除第一网站以外的每个网站的搜索语句集合与第一网站的搜索语句集合,最终排除那些搜索语句集合与第一网站的搜索语句集合没有任何交集的网站。举例而言,如果多个网站中的一个网站的搜索语句集合为{***无法启动,***软件,电脑黑屏},而第一网站的搜索语句集合为{***软件,windows,windows10},则由于该网站的搜索语句集合中包括第一网站的搜索语句集合中的“***软件”,因此将该网站确定为候选网站。
接下来,在步骤S314中,在确定的到的多个候选网站中,通过计算每个候选网站的搜索语句集合与第一网站的搜索语句集合之间的相似度来确定作为第二网站的网站,即对与第一网站在业务上类似的候选网站进行进一步筛选。根据实施例,计算每个候选网站的搜索语句集合与第一网站的搜索语句集合之间的相似度包括,根据历史访问数据从第一网站的搜索语句集合提取第一网站的搜索词集合,根据历史访问数据分别从候选网站中的每个候选网站的搜索语句集合提取每个候选网站的搜索词集合,并分别对第一网站的搜索词集合与每个候选网站的搜索词集合所包括的相同搜索词的数量进行统计。
根据历史访问数据从第一网站的搜索语句集合提取第一网站的搜索词集合还包括切分和筛选的步骤。具体的,根据实施例,对第一网站的搜索语句集合所包括的每个搜索语句进行切分处理以获得至少一个第一搜索词,将该至少一个第一搜索词包含在第一网站的搜索词集合中,并根据历史访问数据对通过至少一个第一搜索词来访问第一网站的次数进行统计,并将次数小于预设的第三阈值的第一搜索词从所获得的第一网站的搜索词集合中删除。
对搜索语句进行切分处理是指利用切词工具将搜索语句切分为以单个词为单位的多个搜索词。通常,在切分得到的多个搜索词中,可以去掉一些不具备实际含义的助词和标点符号,而仅保留表征实际含义的词,例如名词和动词。举例而言,对于搜索语句“***为什么无法启动?”进行切分处理的结果是可以得到搜索词集合{***,为,什么,无法,启动,?},可以去掉其中的“为”、“什么”和“?”,而仅保留“***”、“无法”和“启动”作为第一搜索词。然而,在一些实施例中,也可以在搜索词集合中保留“***”和“启动”作为第一搜索词,这可以由所使用的切词工具决定,本公开实施例对词不做限定。
接下来,在经过切分处理而得到的搜索词集合的基础上,对搜索词集合中各搜索词的用户访问量进行筛选。本公开实施例中所说的针对用户访问量是指访问网站的用户通过包含该搜索词的搜索语句访问该网站的次数,可以根据历史访问数据对用户访问量进行统计。举例而言,如果第一网站A的搜索语句集合为{***无法启动,***软件,***故障,电脑黑屏},针对该搜索语句集合进行切分处理后的搜索词集合包括第一搜索词“***”。接下来,根据历史访问数据获取到用户关于第一网站A的访问行为记录包括:用户B在时间a处通过搜索语句“***无法启动”访问了第一网站A的主页面,用户B在时间b处通过搜索语句“***故障”访问了第一网站A的页面A1,用户C在时间c处通过搜索语句“***软件”访问了第一网站A页面A2。因此,在从a到d的时间段中,用户B和用户C先后通过包含第一搜索词“***”的搜索语句访问了第一网站A(对第一网站A的二级页面的访问也记为对第一网站A的访问)3次,因此统计的针对搜索词“***”的用户访问量为3次。用户通过搜索词访问到第一网站的次数越多,说明该搜索词与第一网站的业务的相关性越高,即该搜索词越能更好地反映第一网站的业务。在本公开的实施例中,预设与用户访问量相关的阈值(第三阈值),将统计得到的通过搜索词访问第一网站的次数与该阈值进行比较,将次数小于该阈值的搜索词从先前得到的搜索词集合中删除,仅在搜索词集合中保留次数大于或等于该阈值的搜索词。通过这种基于用户访问量的筛选,可以进一步提高搜索词与第一网站的业务的相关性。
接下来,在根据历史访问数据分别从候选网站中的每个候选网站的搜索语句集合提取每个候选网站的搜索词集合的操作中如上述实施例所述地执行切分和筛选的步骤。具体的,根据实施例,对每个候选网站的搜索语句集合所包括的每个搜索语句进行切分处理以获得至少一个第二搜索词,将至少一个第二搜索词包含在候选网站的搜索词集合中,并根据历史访问数据对通过至少一个第二搜索词来访问候选网站的次数进行统计,并将次数小于第三阈值的第二搜索词从所获得的候选网站的搜索词集合中删除。根据实施例,分别对每个候选网站的搜索语句集合进行上述操作,可以得到每个候选网站的搜索词集合。对搜索语句进行切分和筛选的步骤可以参考前面针对第一网站的搜索语句集合所执行的操作,此处不再赘述。
通过上面对第一网站的搜索语句集合和每个候选网站的搜索语句集合的处理,可以分别得到第一网站的搜索词集合和每个候选网站的搜索词集合。接下来,分别针对每个候选网站,统计该候选网站的搜索词集合中与第一网站的搜索词集合中相同搜索词的数量。根据实施例,可以采用查询的方式。例如,可以针对候选网站的搜索词集合中的每个搜索词,查询第一网站的搜索词集合中是否具有相同的搜索词。根据实施例,也可以基于向量进行计算。例如,可以按照一定排序规则分别对候选网站的搜索词集合中的搜索词和第一网站的搜索词集合中的搜索词进行排序,并在排序后的集合之间根据向量相似度的计算方法进行计算。
每个候选网站的搜索语句集合与第一网站的搜索语句集合之间的相似度反映的是两个集合在搜索词粒度上的相关性,相似度越高,两个集合之间的相关性也越高。容易理解的是,两个集合之间的相关性越高,说明集合中的搜索语句所包含的搜索词越相近,这表明两个网站在业务上越相似。因此,可以预设与集合相似度有关的阈值。例如,在通过统计候选网站的搜索词集合中与第一网站的搜索词集合中相同搜索词的数量来得到集合相似度的情况下,可以设置与相同搜索词数量有关的阈值,例如第二阈值。将统计得到的相同搜索词的数量与第二阈值进行比较,并将相同搜索词的数量大于第二阈值的候选网站确定为第二网站。依次比较针对每个候选网站所做的统计,从中筛选符合条件的候选网站作为第二网站。
接下来,在步骤S315中,以第一网站和筛选得到的至少一个第二网站一起作为目标网站,由此,将目标网站从第一网站扩展为包括第一网站和至少一个第二网站的多个网站的目标网站集合。
图4示意性示出了图3所示的在多个网站中确定目标网站集合的方法的执行过程。如图4所示,根据历史访问数据获取到5个网站,分别为URL1、URL2、URL3、URL4和URL5。图4还示出了根据历史访问数据确定的各网站的搜索数据集合。例如,URL1的搜索语句集合为{A1,A2,A3,A4,A5}。首先,根据业务属性确定第一网站,设确定URL1为与待投放信息在业务上最接近的第一网站,如图4所示,将URL1及其搜索语句集合用矩形框示出。然后,在网站URL2、URL3、URL4和URL5中确定候选网站。如图4所示,网站URL2的搜索语句集合为{A1,A2,A6},其中搜索语句A1和A2也包括在网站URL1的搜索语句集合中,因此网站URL2的搜索语句集合与网站URL1的搜索语句集合存在交集{A1,A2},因此将网站URL2确定为候选网站。同样地,在网站URL3的搜索语句集合与网站URL1的搜索语句集合间取交集,得到集合{A3,A4,A5},在网站URL4的搜索语句集合与网站URL1的搜索语句集合间取交集,得到集合{A5},因此将网站URL4和URL5也确定为候选网站。网站URL5的搜索语句集合为{D1,D2,D3,D4,D5},其中没有任何搜索语句与网站URL1的搜索语句相同。因此,网站URL5的搜索语句集合与网站URL1的搜索语句集合之间不存在交集,因此王章URL5不能作为候选网站。由此,进一步得到了包括网站URL2、URL3和URL4的候选网站集合。接下来,分别通过对各网站的搜索语句集合进行提取,以得到各网站的搜索词集合。如图4所示,第一网站URL1的搜索词集合为{A11,A12,A21,A22,A32},第二网站URL2的搜索词集合为{A11,A12,A61,A62,A63},因此第一网站URL1与第二网站URL2之间具有相同的搜索词的数量为2。同样地,第一网站URL1与第三网站URL3之间具有相同的搜索词的数量为3,第一网站URL1与第四网站URL4之间具有相同的搜索词的数量为1。如果假设在该示例中预设第二阈值为2,则选择第二网站URL2作为第二网站。最终形成的目标网站集合为由第一网站URL1和第三网站URL3构成的集合,如图4所示。
根据本公开的实施例,通过要进行信息投放的仅包括第一网站的目标网站进行扩展,扩大了信息投放的范围。同时基于对第一网站和多个网站中的其他网站之间初步筛选和进一步筛选,保证了所扩展的第二网站与第一网站在业务上的相关性,从而确保信息投放的准确性。
图5示意性示出了根据本公开又一实施例的确定意图搜索词的权重的方法的流程图。如图5所示,包括以下步骤:
在步骤S521中,根据历史访问数据确定针对目标网站集合的搜索语句集合。
在步骤S522中,根据历史访问数据从目标网站集合的搜索语句集合中提取目标网站集合的搜索词集合。
在步骤S523中,根据历史访问数据对通过搜索词来访问目标网站集合中的目标网站的数量进行统计,并以统计得到的数量值作为搜索词的权重。
在步骤S524中,将所得到的搜索词的权重大于预设的第四阈值的搜索词确定为访问目标网站集合中的目标网站的意图搜索词,将意图搜索词包含在意图搜索词集合中,并以所得到的搜索词的权重作为意图搜索词的权重。
根据实施例,在步骤S521中,针对目标网站集合的搜索语句集合指的是用户通过搜索并访问目标网站集合中的任意一个目标网站时所使用的搜索语句。可以参考前面获取多个网站中的每个网站的搜索语句集合的方法来获取。另外,在本实施例中,目标网站集合由第一网站和筛选得到的第二网站构成,因此,针对目标网站集合的搜索语句集合可以通过第一网站的搜索语句集合与筛选得到的第二网站的搜索语句集合的并集得到。
接下来,在步骤S522中,从目标网站集合的搜索语句集合中提取目标网站集合的搜索词集合可以包括切分和筛选的步骤。根据实施例,具体可以包括对目标网站集合的搜索语句集合所包括的每个搜索语句进行切分处理以获得至少一个目标搜索词,将至少一个目标搜索词包含在目标网站集合的搜索词集合中,并根据历史访问数据对通过至少一个目标搜索词来访问目标网站集合中的目标网站的次数进行统计,并将次数小于预设的第三阈值的目标搜索词从所获得的目标网站集合的搜索词集合中删除。更多具体的操作可以参考前述实施例中根据历史访问数据从第一网站的搜索语句集合提取第一网站的搜索词集合的操作进行,此处不再赘述。需要注意的是,目标网站集合的搜索词集合不能通过先前得到的第一网站的搜索词集合与筛选得到的第二网站的搜索词集合之间的并集得到。这是因为,在对切分得到的搜索词进行基于用户访问量的筛选时,根据历史访问数据统计的是通过包含搜索词的搜索语句访问目标网站集合中包括的所有目标网站的次数。
接下来,在步骤S523中,在所得到的目标网站集合的搜索词集合上计算每个搜索词的权重。根据实施例,针对目标网站集合的搜索词集合中所包括的每个搜索词,统计通过包含该搜索词的搜索语句访问目标网站集合中的目标网站的数量。举例而言,如果目标网站集合包括5个目标网站,分别记为目标网站A、B、C、D和E。对于搜索词集合中的某个搜索词,例如搜索词“***”,查询历史访问数据得到以下的行为记录,用户U1在时间a处通过搜索语句“***无法启动”访问了目标网站A,用户U1在时间b处通过搜索语句“***故障”访问了目标网站B,用户U2在时间c处通过搜索语句“***软件”访问了目标网站A的页面A2以及目标网站E。那么通过包含搜索词“***”的搜索语句访问到目标网站集合中的3个网站,即目标网站A、B和E,因此通过包含搜索词“***”的搜索语句访问的目标网站的数量记为3。需要注意的是,在统计过程中,不必区分不同用户对不同网站的访问(例如用户U1访问目标网站B,用户U2访问目标网站E)。并且在统计过程中,通过包含该搜索词的不同搜索语句访问的相同的目标网站(例如用户U1通过“***无法启动”访问目标网站A,用户U2通过“***软件”访问目标网站A的页面A2)不重复计数。因此,在该示例中,统计得到的最大数量为5,即目标网站集合中所包括的目标网站的数量。
通过包含搜索词的搜索语句能够访问的目标网站集合中的目标网站的数量表明了该搜索词与目标网站集合中的目标网站在业务上的关系。通过一个搜索词能够访问的目标网站集合中的目标网站的数量越多,说明该搜索词越能很好地代表与各目标网站相关的业务,即该搜索词在这些目标网站的业务上具有明显的特征。换句话说,如果用户通过这类搜索词对目标网站集合中的目标网站进行访问,则说明用户访问这些目标网站时更多的是由于这些目标网站的代表性业务,因此可以将与目标网站的业务有关的信息投放给这些用户。在本实施例中,以统计得到的数量值作为搜索词的权重。例如,将搜索词“***”的权重确定为“3”。
接下来,在步骤S524中,在统计得到目标网站集合的搜索词集合中的每个搜索词的权重之后,利用搜索词和所确定的搜索词权重来确定目标网站集合中的目标网站的意图搜索词以及意图搜索词的权重。具体为,预设与搜索词权重有关的阈值(第四阈值),将搜索词权重小于或等于该阈值的搜索词删除,仅保留权重大于该阈值的搜索词,作为目标网站的意图搜索词,并以对应的搜索词的权重作为意图搜索词的权重。这是考虑到如果搜索词的权重过小,则说明通过该搜索词仅能够访问目标网站集合中的较小数量的目标网站,这说明该搜索词已经不能够很好地代表目标网站集合中的目标网站的业务。根据本公开的另一实施例,可以在统计得到通过包含搜索词的搜索语句所访问的目标网站的数量之后,对统计得到的数量值进行归一化处理,并以经归一化处理的数量值作为搜索词的权重。这主要是针对目标网站集合中包括大量目标网站的情况,避免权重过大不易存储和计算。
根据本公开的实施例,通过在目标网站集合的搜索词集合上计算目标网站的意图搜索词和意图搜索词的权重,从而挑选出能够更好地代表目标网站业务的搜索词,同时利用权重特征将这种代表关系进行量化,有利于对用户的访问意图进行比较,以更加准确地进行信息投放。
图6示意性示出了根据本公开另一实施例的根据意图搜索词和权重筛选目标用户的方法的流程图。如图6所示,筛选过程包括以下步骤:
在步骤S641中,获取用户访问目标网站集合中的至少一个目标网站所使用的搜索词。
在步骤S642中,在用户所使用的搜索词中确定落入意图搜索词集合中的搜索词作为用户的意图搜索词。
在步骤S643中,根据意图搜索词集合中各个意图搜索词的权重确定用户的意图搜索词的权重。
在步骤S644中,根据用户的意图搜索词的权重计算用户对目标网站集合的意图打分。
在步骤S645中,将意图打分大于预设的第一阈值的用户包含在目标用户集合中。
本实施例提供了根据目标网站的意图搜索词和意图搜索词的权重确定要进行信息投放的目标用户的过程。具体的,在步骤S641中,首先获取用户访问目标网站集合中的至少一个目标网站所使用的搜索语句,然后对所使用的搜索语句进行切分处理以获得至少一个搜索词。在本实施例中,从用户所使用的搜索语句获得搜索词的操作可以参考前述实施例从第一网站的搜索语句集合提取第一网站的搜索词集合的切分处理,此处不再赘述。接下来,在步骤S642和步骤S643中,确定用户所使用的搜索词是否为目标网站的意图搜索词,找出那些落入意图搜索词集合中的搜索词,并将这些搜索词作为用户的意图搜索词,同时获得对应的权重。接下来,在步骤S644中,将用户的意图搜索词的权重相加,并以权重相加的和作为用户对目标网站集合的意图打分。
根据实施例,用户的意图打分越高,说明用户访问该目标网站集合中的目标网站时更倾向于这些目标网站的代表性业务。因此,可以根据投放需求预设与打分的分数有关的阈值(第一阈值),并通过阈值来确定投放规模,即选择进行信息投放的目标人群的数量。具体的,可以设置具有较大数值的第一阈值,并将意图打分大于该第一阈值的用户作为目标用户。这样可以使得目标用户集合中的用户都具有较高的意图打分,因此可以更加精准地进行信息投放。在另外的实施例中,也可以设置具有较小数值的第一阈值,并将意图打分大于该第一阈值的用户作为目标用户。这样可以在目标用户集合中包含更多的用户,既可以保证一定的投放的精准性,又可以适当地扩大信息投放的范围,适用于要求覆盖率较高的信息投放的场合中。在实际使用中,可以根据具体的信息投放要求或业务需要,选取合适的第一阈值,从而对目标用户的数量进行调整,以便进行覆盖范围可控且精准的信息投放。根据本公开实施例的信息投放方法可以广泛应用于各种信息流营销中。
图7示意性地示出了根据本公开实施例的信息投放装置700的框图。如图7所示,信息投放装置700包括目标网站确定模块710、意图表示确定模块720、目标用户筛选模块730和信息投放模块740。
根据实施例,目标网站确定模块710被配置为获取多个网站的历史访问数据,并根据历史访问数据确定在多个网站中要进行信息投放的目标网站集合。意图表示确定模块720被配置为根据历史访问数据确定用于访问目标网站集合的意图搜索词集合以及意图搜索词集合中各个意图搜索词的权重。目标用户筛选模块730被配置为根据意图搜索词集合以及权重,对于访问目标网站集合中的至少一个目标网站的用户进行筛选以得到目标用户集合。信息投放模块740被配置为将信息投放给目标用户集合中的用户。
以上各功能模块的具体操作可以参考前述实施例中的信息投放方法200的操作步骤来获取,此处不再赘述。
图8示意性示出了根据本公开实施例的适于执行信息投放的信息投放设备800的框图。可以利用图8所示的信息投放设备来执行根据本公开实施例的信息投放方法。
如图8所示,根据本公开实施例的信息投放设备800包括处理器801和存储器802。处理器801可以根据存储在存储器802中的程序或指令来执行各种适当的动作和处理。处理器801例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC))等。处理器801还可以包括用于缓存用途的板载存储器。处理器801可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
处理器801与存储器802通过总线彼此相连。处理器801通过执行存储器802中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除存储器802以外的一个或多个存储设备中。处理器801也可以通过执行存储在所述一个或多个存储设备中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,信息投放设备800还可以包括输入装置803和输出装置804,输入装置803和输出装置804也连接至总线。此外,信息投放设备800还可以包括以下部件中的一项或多项:包括键盘、鼠标等的输入部分;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分;包括硬盘等的存储部分;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被处理器801执行时,执行本公开实施例的***中限定的上述功能。根据本公开的实施例,上文描述的***、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/***中所包含的;也可以是单独存在,而未装配入该设备/装置/***中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被处理器801执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是计算机非易失性的计算机可读存储介质,例如可以可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (16)

1.一种信息投放方法,包括:
获取多个网站的历史访问数据,并根据所述历史访问数据确定在所述多个网站中要进行信息投放的目标网站集合;
根据所述历史访问数据确定用于访问所述目标网站集合的意图搜索词集合以及所述意图搜索词集合中各个意图搜索词的权重;
根据所述意图搜索词集合以及所述权重,对于访问所述目标网站集合中的至少一个目标网站的用户进行筛选以得到目标用户集合;以及
将所述信息投放给所述目标用户集合中的用户。
2.根据权利要求1所述的方法,其中,所述对于访问所述目标网站集合中的至少一个目标网站的用户进行筛选以得到目标用户集合包括:
获取所述用户访问所述目标网站集合中的至少一个目标网站所使用的搜索词;
在所述用户所使用的搜索词中确定落入所述意图搜索词集合中的搜索词作为所述用户的意图搜索词;
根据所述意图搜索词集合中各个意图搜索词的权重确定所述用户的意图搜索词的权重;
根据所述用户的意图搜索词的权重计算所述用户对所述目标网站集合的意图打分;以及
将所述意图打分大于预设的第一阈值的用户包含在所述目标用户集合中。
3.根据权利要求1所述的方法,其中,所述根据所述历史访问数据确定在所述多个网站中要进行信息投放的目标网站集合包括:
根据所述历史访问数据确定针对所述多个网站中的每个网站的搜索语句集合;
在所述多个网站中确定要进行信息投放的第一网站;
在所述多个网站中确定搜索语句集合与所述第一网站的搜索语句集合有交集的网站作为候选网站;
在所述候选网站中确定搜索语句集合与所述第一网站的搜索语句集合的相似度大于预设的第二阈值的候选网站作为第二网站;
将所述第一网站和所述第二网站包含在所述目标网站集合中。
4.根据权利要求3所述的方法,其中,所述在所述候选网站中确定搜索语句集合与所述第一网站的搜索语句集合的相似度大于预设的第二阈值的候选网站作为第二网站包括:
根据所述历史访问数据从所述第一网站的搜索语句集合提取第一网站的搜索词集合;
根据所述历史访问数据分别从所述候选网站中的每个候选网站的搜索语句集合提取每个候选网站的搜索词集合;
分别对所述第一网站的搜索词集合与每个候选网站的搜索词集合所包括的相同搜索词的数量进行统计;
在所述相同搜索词的数量大于预设的第二阈值的情况下,将所述候选网站确定为第二网站。
5.根据权利要求4所述的方法,其中,所述根据所述历史访问数据从所述第一网站的搜索语句集合提取第一网站的搜索词集合包括:
对所述第一网站的搜索语句集合所包括的每个搜索语句进行切分处理以获得至少一个第一搜索词;
将所述至少一个第一搜索词包含在所述第一网站的搜索词集合中;以及
根据所述历史访问数据对通过所述至少一个第一搜索词来访问所述第一网站的次数进行统计,并将所述次数小于预设的第三阈值的第一搜索词从所获得的第一网站的搜索词集合中删除。
6.根据权利要求5所述的方法,其中,所述根据所述历史访问数据分别从所述候选网站中的每个候选网站的搜索语句集合提取每个候选网站的搜索词集合包括:
对每个候选网站的搜索语句集合所包括的每个搜索语句进行切分处理以获得至少一个第二搜索词;
将所述至少一个第二搜索词包含在所述候选网站的搜索词集合中;以及
根据所述历史访问数据对通过所述至少一个第二搜索词来访问所述候选网站的次数进行统计,并将所述次数小于所述第三阈值的第二搜索词从所获得的候选网站的搜索词集合中删除。
7.根据权利要求3所述的方法,其中,根据要进行投放的所述信息的业务属性来在所述多个网站中确定要进行信息投放的第一网站。
8.根据权利要求2所述的方法,其中,所述根据所述历史访问数据确定用于访问所述目标网站集合的意图搜索词集合以及所述意图搜索词集合中各个意图搜索词的权重包括:
根据所述历史访问数据确定针对所述目标网站集合的搜索语句集合;
根据所述历史访问数据从所述目标网站集合的搜索语句集合中提取目标网站集合的搜索词集合;
根据所述历史访问数据对通过所述搜索词来访问所述目标网站集合中的目标网站的数量进行统计,并以统计得到的数量值作为所述搜索词的权重;以及
将所得到的搜索词的权重大于预设的第四阈值的搜索词确定为访问所述目标网站集合中的目标网站的意图搜索词,将所述意图搜索词包含在所述意图搜索词集合中,并以所得到的搜索词的权重作为所述意图搜索词的权重。
9.根据权利要求8所述的方法,其中,所述根据所述历史访问数据从所述目标网站集合的搜索语句集合中提取目标网站集合的搜索词集合包括:
对所述目标网站集合的搜索语句集合所包括的每个搜索语句进行切分处理以获得至少一个目标搜索词;
将所述至少一个目标搜索词包含在所述目标网站集合的搜索词集合中;以及
根据所述历史访问数据对通过所述至少一个目标搜索词来访问所述目标网站集合中的目标网站的次数进行统计,并将所述次数小于预设的第三阈值的目标搜索词从所获得的目标网站集合的搜索词集合中删除。
10.根据权利要求2所述的方法,其中,所述获取所述用户访问所述目标网站集合中的至少一个目标网站所使用的搜索词包括:
获取所述用户访问所述目标网站集合中的至少一个目标网站所使用的搜索语句;以及
对所述搜索语句进行切分处理以获得至少一个搜索词。
11.根据权利要求10所述的方法,其中,所述根据所述用户的意图搜索词的权重计算所述用户对所述目标网站集合的意图打分包括:
将所述用户的意图搜索词的权重相加,并以所述权重相加的和作为用户对所述目标网站集合的意图打分。
12.根据权利要求8所述的方法,其中,在根据所述历史访问数据对通过所述搜索词来访问所述目标网站集合中的目标网站的数量进行统计之后,还包括:
对统计得到的数量值进行归一化处理,并以经归一化处理的数量值作为所述搜索词的权重。
13.根据权利要求1所述的方法,其中,所述历史访问数据包括搜索日志,所述搜索日志包括所访问网站的网址和时间、执行访问的用户以及用户所使用的搜索语句。
14.一种信息投放装置,包括:
目标网站确定模块,配置为获取多个网站的历史访问数据,并根据所述历史访问数据确定在所述多个网站中要进行信息投放的目标网站集合;
意图表示确定模块,配置为根据所述历史访问数据确定用于访问所述目标网站集合的意图搜索词集合以及所述意图搜索词集合中各个意图搜索词的权重;
目标用户筛选模块,配置为根据所述意图搜索词集合以及所述权重,对于访问所述目标网站集合中的至少一个目标网站的用户进行筛选以得到目标用户集合;以及
信息投放模块,配置为将所述信息投放给所述目标用户集合中的用户。
15.一种信息投放设备,包括:
存储器,存储有程序指令;以及
处理器,被配置为执行所述程序指令,以执行如权利要求1至13中任一项所述的信息投放方法。
16.一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现权利要求1至13中任一项所述的信息投放方法。
CN202011021719.5A 2020-09-25 2020-09-25 信息投放方法、装置、设备及存储介质 Active CN111966948B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011021719.5A CN111966948B (zh) 2020-09-25 2020-09-25 信息投放方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011021719.5A CN111966948B (zh) 2020-09-25 2020-09-25 信息投放方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111966948A true CN111966948A (zh) 2020-11-20
CN111966948B CN111966948B (zh) 2023-08-01

Family

ID=73387402

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011021719.5A Active CN111966948B (zh) 2020-09-25 2020-09-25 信息投放方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111966948B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113569135A (zh) * 2021-06-30 2021-10-29 深圳市东信时代信息技术有限公司 基于用户画像的推荐方法、装置、计算机设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010092922A (ko) * 2000-03-27 2001-10-27 이현구 유사 웹사이트의 검색 방법
US20100161385A1 (en) * 2008-12-19 2010-06-24 Nxn Tech, Llc Method and System for Content Based Demographics Prediction for Websites
US20110119267A1 (en) * 2009-11-13 2011-05-19 George Forman Method and system for processing web activity data
CN102567494A (zh) * 2011-12-22 2012-07-11 北京亿赞普网络技术有限公司 网站分类方法及装置
CN102663054A (zh) * 2012-03-29 2012-09-12 奇智软件(北京)有限公司 一种确定网站权重的方法及装置
CN103745380A (zh) * 2013-12-24 2014-04-23 亿赞普(北京)科技有限公司 一种广告投放方法和装置
WO2017024884A1 (zh) * 2015-08-07 2017-02-16 广州神马移动信息科技有限公司 一种搜索意图识别方法及装置
CN106959971A (zh) * 2016-01-12 2017-07-18 阿里巴巴集团控股有限公司 用户行为数据的处理方法及装置
CN109801103A (zh) * 2019-01-14 2019-05-24 海南英赛德信息***有限公司 信息投放方法及装置、存储介质及电子设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010092922A (ko) * 2000-03-27 2001-10-27 이현구 유사 웹사이트의 검색 방법
US20100161385A1 (en) * 2008-12-19 2010-06-24 Nxn Tech, Llc Method and System for Content Based Demographics Prediction for Websites
US20110119267A1 (en) * 2009-11-13 2011-05-19 George Forman Method and system for processing web activity data
CN102567494A (zh) * 2011-12-22 2012-07-11 北京亿赞普网络技术有限公司 网站分类方法及装置
CN102663054A (zh) * 2012-03-29 2012-09-12 奇智软件(北京)有限公司 一种确定网站权重的方法及装置
CN103745380A (zh) * 2013-12-24 2014-04-23 亿赞普(北京)科技有限公司 一种广告投放方法和装置
WO2017024884A1 (zh) * 2015-08-07 2017-02-16 广州神马移动信息科技有限公司 一种搜索意图识别方法及装置
CN106959971A (zh) * 2016-01-12 2017-07-18 阿里巴巴集团控股有限公司 用户行为数据的处理方法及装置
CN109801103A (zh) * 2019-01-14 2019-05-24 海南英赛德信息***有限公司 信息投放方法及装置、存储介质及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张瑞芳;郭克华;: "面向个性化站点的用户检索意图建模方法", 计算机工程与应用, no. 06 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113569135A (zh) * 2021-06-30 2021-10-29 深圳市东信时代信息技术有限公司 基于用户画像的推荐方法、装置、计算机设备及存储介质
CN113569135B (zh) * 2021-06-30 2024-03-29 深圳市东信时代信息技术有限公司 基于用户画像的推荐方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN111966948B (zh) 2023-08-01

Similar Documents

Publication Publication Date Title
CN108509482B (zh) 问题分类方法、装置、计算机设备和存储介质
CN106649818B (zh) 应用搜索意图的识别方法、装置、应用搜索方法和服务器
CN111814770B (zh) 一种新闻视频的内容关键词提取方法、终端设备及介质
CN107437038B (zh) 一种网页篡改的检测方法及装置
CN107862022B (zh) 文化资源推荐***
CN109492222B (zh) 基于概念树的意图识别方法、装置及计算机设备
CN106685936B (zh) 网页篡改的检测方法及装置
CN105357586A (zh) 视频弹幕过滤方法及装置
CN107909088B (zh) 获取训练样本的方法、装置、设备和计算机存储介质
CN108446295B (zh) 信息检索方法、装置、计算机设备和存储介质
CN111708909B (zh) 视频标签的添加方法及装置、电子设备、计算机可读存储介质
CN110569419A (zh) 问答***优化方法、装置、计算机设备及存储介质
CN111538903B (zh) 搜索推荐词确定方法、装置、电子设备及计算机可读介质
CN112818200A (zh) 基于静态网站的数据爬取及事件分析方法及***
CN113626704A (zh) 基于word2vec模型的推荐信息方法、装置及设备
CN114330329A (zh) 一种业务内容搜索方法、装置、电子设备及存储介质
CN108280102B (zh) 上网行为记录方法、装置及用户终端
CN102737045B (zh) 一种相关度计算方法和装置
CN111966948B (zh) 信息投放方法、装置、设备及存储介质
CN105786858A (zh) 信息搜索***及方法
CN112269906B (zh) 网页正文的自动抽取方法及装置
WO2015149550A1 (zh) 确定网站内链接等级的方法及装置
CN108171074B (zh) 一种基于内容关联的Web追踪自动检测方法
CN107169065B (zh) 一种特定内容的去除方法和装置
CN116089732A (zh) 基于广告点击数据的用户偏好识别方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant