CN111597413B - 信息推送方法、***、设备及存储介质 - Google Patents

信息推送方法、***、设备及存储介质 Download PDF

Info

Publication number
CN111597413B
CN111597413B CN202010405534.8A CN202010405534A CN111597413B CN 111597413 B CN111597413 B CN 111597413B CN 202010405534 A CN202010405534 A CN 202010405534A CN 111597413 B CN111597413 B CN 111597413B
Authority
CN
China
Prior art keywords
hotel
user
search
text
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010405534.8A
Other languages
English (en)
Other versions
CN111597413A (zh
Inventor
范遥新
肖铨武
申思
陈冬露
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Ctrip Business Co Ltd
Original Assignee
Shanghai Ctrip Business Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Ctrip Business Co Ltd filed Critical Shanghai Ctrip Business Co Ltd
Priority to CN202010405534.8A priority Critical patent/CN111597413B/zh
Publication of CN111597413A publication Critical patent/CN111597413A/zh
Application granted granted Critical
Publication of CN111597413B publication Critical patent/CN111597413B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种信息推送方法、***、设备及存储介质,信息推送方法包括以下步骤:接收用户住宿搜索请求,所述住宿搜索请求包括用户搜索文本;判断已建立的用户搜索意图库中是否存在与所述用户搜索文本相匹配的历史搜索文本;如存在,则将与所述用户搜索文本相匹配的历史搜索文本对应的酒店的信息推送至用户;如不存在,则通过所述用户搜索文本与所述用户搜索意图库的酒店名称的相似度计算获得所述用户搜索文本对应的酒店,将所述酒店的信息推送至用户。本发明的信息推送方法通过自动化匹配用户住宿搜索请求的广告关键词或广告落地页,可以减少运营人员的工作负担,降低人力成本,提高搜索引擎广告的投入产出比。

Description

信息推送方法、***、设备及存储介质
技术领域
本发明涉及互联网领域,具体地说,涉及一种基于需求端的信息推送方法、***、设备及存储介质。
背景技术
搜索引擎广告是指广告主根据自己的产品或服务的内容、特点等,确定相关的关键词,撰写广告内容并自主定价投放的广告。当用户在搜索引擎上搜索到广告主投放的关键词时,相应的广告就会展示(关键词有多个广告主购买时,根据竞价排名原则展示),并在用户点击后按照广告主对该关键词的出价收费,无点击不收费。
许多在线旅行(Online Travel Agency,OTA)都会投入大量资金进行搜索引擎广告的投放,以此获得有住宿需求的搜索流量,以提高订单量和公司收入,比如某在线旅行巨头2019年单季度在一搜索引擎上投放广告就达10亿美元。
因此,对于有搜索引擎广告投放需求的公司来说,提升搜索引擎广告效果是一件重要的事情。搜索引擎效果提升主要是要选对合适的关键词、选择合适的广告定价和设计好的广告创意来吸引用户。
目前的搜索引擎信息推送技术有一种方法是由业务人员手动从用户搜索中找到业务相关的搜索语句,比如OTA公司的业务人员发现有用户进行“上海住宿”这样的搜索,说明存在“上海住宿”搜索这样的住宿需求,业务人员便人工制作搜索引擎广告关键词“上海住宿”,并人工设置该广告关键词的对应广告落地页内容,这种方法的缺点在于需要耗费大量的业务人员人力投入。
如果能自动化匹配用户搜索语句相关的广告关键词或广告落地页,可以减少运营人员的工作负担,降低人力成本,提高搜索引擎广告的投入产出比。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
针对现有技术中的问题,本发明的目的在于提供了一种信息推送方法、***、设备及存储介质,信息推送方法通过自动化匹配用户住宿搜索请求的广告关键词或广告落地页,可以减少运营人员的工作负担,降低人力成本,提高搜索引擎广告的投入产出比。
本发明的实施例还提供了一种信息推送方法,包括以下步骤:
接收用户住宿搜索请求,所述住宿搜索请求包括用户搜索文本;
判断已建立的用户搜索意图库中是否存在与所述用户搜索文本相匹配的历史搜索文本,所述用户搜索意图库至少包括历史搜索文本与酒店的映射关系表;
如存在,则将与所述用户搜索文本相匹配的历史搜索文本对应的酒店的信息推送至用户;
如不存在,则通过所述用户搜索文本与所述用户搜索意图库的酒店名称的相似度计算获得所述用户搜索文本对应的酒店,将所述酒店的信息推送至用户。
根据本发明的一示例,所述通过所述用户搜索文本与所述用户搜索意图库的酒店名称的相似度计算获得所述用户搜索文本对应的酒店,包括如下步骤:
通过训练好的语义相似度计算模型计算所述用户搜索文本与所述用户搜索意图库的酒店名称的第一相似度,所述训练好的语义相似度计算模型包括特征提取层;
根据所述第一相似度获得所述用户搜索文本对应的酒店列表;
通过训练好的BERT语言模型计算所述用户搜索文本与所述酒店列表中的酒店名称的第二相似度;
根据所述第二相似度获得所述用户搜索文本对应的酒店。
根据本发明的一示例,所述语义相似度计算模型为深度结构语义模型。
根据本发明的一示例,采用已建立的所述用户搜索意图库训练初始深度结构语义模型获得训练好的语义相似度计算模型。
根据本发明的一示例,所述通过训练好的语义相似度计算模型计算所述用户搜索文本与所述用户搜索意图库的酒店名称的第一相似度,包括以下步骤:
对所述用户搜索文本进行分词处理,获得所述用户搜索文本的分词集合;
将所述分词集合作为第一神经网络编码器模型的输入,通过所述第一神经网络编码器模型的输出得到所述历史搜索文本的第一向量;
获取根据第二神经网络编码器模型生成的各酒店名称对应的各第二向量;
计算所述第一向量与各第二向量的第一相似度;
其中,所述第一神经网络编码器模型和所述第二神经网络编码器模型为训练好的所述语义相似度计算模型的特征提取层。
根据本发明的一示例,采用余弦相似度或欧式距离计算所述第一向量与各第二向量的第一相似度;
根据本发明的一示例,取与所述第一向量距离最近的设定数目的第二向量,将设定数目的第二向量对应的酒店添加入所述酒店列表。
根据本发明的一示例,所述信息推送方法还包括建立用户搜索意图库,所述建立用户搜索意图库包括如下步骤:
从OTA平台和/或搜索引擎平台的获得历史酒店搜索数据库,所述历史酒店搜索数据包括用户的历史搜索文本和用户的酒店点击操作数据;
获得每个所述历史搜索文本和各个搜索点击的酒店的对应关系;
将每个历史搜索文本与对应的搜索点击次数最高的酒店建立映射关系。
根据本发明的一示例,所述建立用户搜索意图库还包括:
从OTA平台和/或搜索引擎平台的获得历史酒店搜索数据库,所述历史酒店搜索数据包括用户的历史搜索文本和用户的酒店点击操作数据;
对用户历史搜索文本进行分词,获得用户历史搜索文本的各个词性结构,各个所述词性结构为关键词生成规则;
基于关键词生成规则,将所述用户搜索意图库中的酒店生成与酒店对应的搜索文本,将搜索文本与酒店的映射关系添加进所述用户搜索意图库。
根据本发明的一示例,所述信息为酒店的广告关键词或酒店的落地页的一种或多种。
本发明的实施例还提供了一种信息推送***,用于实现上述的信息推送方法,包括用户模块和计算模块,其中:
所述用户模块接收用户住宿搜索请求,所述住宿搜索请求包括搜索文本;
所述计算模块判断已建立的用户搜索意图库中是否存在与所述搜索文本相匹配的历史搜索文本,所述用户搜索意图库至少包括历史搜索文本与酒店的映射关系表;
当用户搜索意图库中存在与所述搜索文本相匹配的历史搜索文本时,所述用户模块将与所述搜索文本相匹配的历史搜索文本对应的酒店的信息推送至用户;
当用户搜索意图库中不存在与所述搜索文本相匹配的历史搜索文本时,所述计算模块通过所述搜索文本与所述用户搜索意图库的酒店名称的相似度计算获得所述搜索文本对应的酒店,所述用户模块将所述酒店的信息推送至用户。
本发明的实施例还提供了一种信息推送设备,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行所述信息推送方法的步骤。
本发明的实施例还提供了一种计算机可读存储介质,用于存储程序,所述程序被执行时实现所述信息推送方法的步骤。
本发明的通过建立并使用用户搜索意图库或语义相似度计算模型自动对用户住宿搜索请求进行匹配,并将相匹配的信息发送给搜素用户,实现减少运营人员的工作负担,降低人力成本,提高搜索引擎广告的投入产出比的效果。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理,通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例的信息推送方法的流程图;
图2为本发明一实施例的用户搜索意图库的建立方法的流程图;
图3为本发明又一实施例的用户搜索意图库的建立方法的流程图;
图4为本发明一实施例相似度计算获得所述用户搜索文本对应的酒店的流程图;
图5为本发明一实施例的信息推送设备的结构示意图;
图6为本发明一实施例的计算机可读存储介质的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
图1为本发明一实施例的信息推送方法的流程图,该方法具体包括以下步骤:
S100:接收用户住宿搜索请求,所述住宿搜索请求包括用户搜索文本;
S200:判断已建立的用户搜索意图库中是否存在与所述用户搜索文本相匹配的历史搜索文本,所述用户搜索意图库至少包括历史搜索文本与酒店的映射关系表;
如存在,则S300:将与所述用户搜索文本相匹配的历史搜索文本对应的酒店的信息推送至用户;
如不存在,则S400:通过所述用户搜索文本与所述用户搜索意图库的酒店名称的相似度计算获得所述用户搜索文本对应的酒店,将所述酒店的信息推送至用户。此处的信息可以为酒店的广告关键词或酒店的落地页的一种或多种,也可以是相关的回调指令等,本发明在此不做限制。***可以通过提供APP、公众号、小程序或网址的形式为用户终端推送上述信息。
S200步骤中所述的用户搜索意图库可以通过如下的方法建立,见图2和图3的本发明实施例中的用户搜索意图库的建立方法的流程图,具体可以包括如下步骤:
S210:从OTA平台和/或搜索引擎平台的获得历史酒店搜索数据库,所述历史酒店搜索数据包括用户的历史搜索文本和用户的酒店点击操作数据;
S220:获得每个所述历史搜索文本和各个搜索点击的酒店的对应关系;
S230:将每个历史搜索文本与对应的搜索点击次数最高的酒店建立映射关系。
在OTA平台和/或搜索引擎平台,每当用户输入一搜索文本时,用户会点击某一个搜索结果对应的酒店,建立一搜索文本对应的搜索点击次数最高的酒店之间的一一对应关系,即本发明所要建立的映射关系。
举例来说,如多个用户输入“上海建滔诺富特”这一用户搜索文本,90%的用户都点击了“上海建滔諾富特酒店”,那么就可以建立的一个映射关系为“上海建滔诺富特”->”上海建滔諾富特酒店”,将上述映射关系添加进用户搜索意图库。
进一步地,所述建立用户搜索意图库还可以包括:
S210’:从OTA平台和/或搜索引擎平台的获得历史酒店搜索数据库,所述历史酒店搜索数据包括用户的历史搜索文本和用户的酒店点击操作数据;从已有的数据显示,用户历史搜索文本主要可以分为如下几种:
(1)城市住宿意图:用户试图搜索在某个城市的住宿相关信息,比如:”上海住宿“,”拉萨民宿“等。
(2)地理兴趣点(POI)住宿意图:用户试图搜索在某个POI的住宿相关信息,比如:“东方明珠附近住宿”,“香港迪士尼过夜”等。
(3)酒店住宿意图:用户试图搜索某个特定酒店的住宿相关信息,比如:“上海建滔诺富特”,“上海玩具总动人酒店”等。
(4)城市酒店品牌住宿意图:用户试图搜索某个城市特定酒店品牌的住宿相关信息,比如:“上海四季酒店”,“广州希尔顿”等。
S220’:对用户历史搜索文本进行分词,获得用户历史搜索文本的各个词性结构,各个所述词性结构为关键词生成规则;
S220’步骤的作用在于基于S210’步骤获得历史酒店搜索数据库建立的关键词生成规则,可能的关键词生成规则包括:
[hotelname,优惠折扣]
[优惠券,hotelname,cityname]
……
S230’:基于关键词生成规则,将所述用户搜索意图库中的酒店生成与酒店对应的搜索文本,将搜索文本与酒店的映射关系添加进所述用户搜索意图库。以用户搜索意图库中的酒店“上海建滔諾富特酒店”为例,S230’基于S220’步骤获得的搜索文本为:
上海建滔諾富特酒店优惠折扣
优惠券上海建滔諾富特酒店上海
……
此时的搜索文本与酒店的映射关系为:
“上海建滔諾富特酒店优惠折扣”->”上海建滔諾富特酒店”
“优惠券上海建滔諾富特酒店上海”->”上海建滔諾富特酒店”
……
将上述映射关系添加进用户搜索意图库。
本发明中可以同时采用S210至S230以及S210’至S230’的步骤建立用户搜索意图库,即可以同时基于OTA平台、搜索引擎平台和用户搜索文本词性结构等业务先验数据建立用户搜索意图库,当用户发出住宿搜索请求时,***可以高效、快速地匹配之相匹配的酒店,在此基础上,再将所述酒店的信息推送至用户,及大地减少运营成本,提高搜索引擎广告的投入产出比的效果。
图4为本发明一实施例相似度计算获得所述用户搜索文本对应的酒店的流程图,即400步骤所述通过所述用户搜索文本与所述用户搜索意图库的酒店名称的相似度计算获得所述用户搜索文本对应的酒店,可以具体包括如下步骤:
S410:通过训练好的语义相似度计算模型计算所述用户搜索文本与所述用户搜索意图库的酒店名称的第一相似度,所述训练好的语义相似度计算模型包括特征提取层;S420:根据所述第一相似度获得所述用户搜索文本对应的酒店列表;
S430:通过训练好的BERT语言模型计算所述用户搜索文本与所述酒店列表中的酒店名称的第二相似度;BERT语言模型可以用样本去微调(fine-tune)模型参数,有效地提高了文本相似度计算的精度。S440:根据所述第二相似度获得所述用户搜索文本对应的酒店。
一些实施例中,S410步骤中的所述语义相似度计算模型可以是深度结构语义模型(Deep Structured Semantic Models,DSSM)。进一步地,可以采用S210至S230以及S210’至S230’的步骤建立用户搜索意图库训练初始深度结构语义模型获得训练好的语义相似度计算模型。
同时,S410步骤中的第一相似度有可以包括以下步骤:
对所述用户搜索文本进行分词处理,获得所述用户搜索文本的分词集合;
将所述分词集合作为第一神经网络编码器模型的输入,通过所述第一神经网络编码器模型的输出得到所述历史搜索文本的第一向量;
获取根据第二神经网络编码器模型生成的各酒店名称对应的各第二向量;
计算所述第一向量与各第二向量的第一相似度,此处,可以采用余弦相似度或欧式距离计算所述第一向量与各第二向量的第一相似度;
其中,所述第一神经网络编码器模型和所述第二神经网络编码器模型为训练好的所述语义相似度计算模型的特征提取层。
S420步骤中可以取与所述第一向量距离最近的设定数目的第二向量,将设定数目的第二向量对应的酒店添加入所述酒店列表。当语义相似度计算模型采用深度结构语义模型时,可以设置较少的训练参数,从而加快第一相似度的计算速度,达到快速获得潜在与用户搜索文本相匹配的酒店列表的效果。
本发明中的一些实施例中采用深度结构语义模型对用户搜索文本进行初步的匹配,如在S420步骤中设定的数目为20,则用户搜索文本会匹配到与其相似度最高的20酒店,建立酒店列表。再通过BERT语言模型计算精确与用户搜索文本匹配的一酒店。BERT是一种预训练语言表示的语言模型,在使用大量语料,比如***、百度百科等的基础上可训练一个通用的语言理解模型。训练好的BERT语言模型能更好地提取搜索语句中的深层语义信息,从而在进行搜索意图匹配时有更好的表现,但BERT语言模型由于模型参数较多,存在运算速度较传统模型较慢的缺点。
本发明中,通过设置训练参数较少的深度结构语义模型计算第一相似度,快速获得一定数量的与用户搜索文本匹配的酒店列表,再针对酒店列表,通过训练好的BERT语言模型计算第二相似度,根据第二相似度获得所述用户搜索文本对应的一酒店,从而避免了BERT运算速度较慢的缺陷。因此,本发明利用的深度结构语义模型的高效性和BERT语言模型精准性,通过上述两次匹配步骤,实现搜索的高效和精准。
本发明的实施例还提供了一种信息推送***,用于实现上述的信息推送方法,包括用户模块和计算模块,其中:
所述用户模块接收用户住宿搜索请求,所述住宿搜索请求包括搜索文本;
所述计算模块判断已建立的用户搜索意图库中是否存在与所述搜索文本相匹配的历史搜索文本,所述用户搜索意图库至少包括历史搜索文本与酒店的映射关系表;
当用户搜索意图库中存在与所述搜索文本相匹配的历史搜索文本时,所述用户模块将与所述搜索文本相匹配的历史搜索文本对应的酒店的信息推送至用户;
当用户搜索意图库中不存在与所述搜索文本相匹配的历史搜索文本时,所述计算模块通过所述搜索文本与所述用户搜索意图库的酒店名称的相似度计算获得所述搜索文本对应的酒店,所述用户模块将所述酒店的信息推送至用户。
上述实施例的信息推送***中的各个功能模块的功能实现方式均可以信息推送方法中各个步骤的具体实施方式来实现。例如,用户模块和计算模块可以分别采用上述步骤S100至S400的具体实施方式实现其功能,此处不予赘述。
下面参照图5来描述根据本发明的这种实施方式的电子设备600。图5显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元610可以执行如图5中所示的步骤。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、***总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储平台等。
本发明实施例还提供一种计算机可读存储介质,用于存储程序,程序被执行实现分拣信息推送方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述方法部分中描述的根据本发明各种示例性实施方式的步骤。
参考图6所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上所述,本发明的信息推送方法通过自动化匹配用户住宿搜索请求的广告关键词或广告落地页,其中,自动化匹配利用的深度结构语义模型的高效性和BERT语言模型精准性,使用多个模型进行相似度的计算,综合两种相似度的分数,从而得到更精准的匹配结果,实现匹配的高效和精准,该信息推送方法可以减少运营人员的工作负担,降低人力成本,提高搜索引擎广告的投入产出比。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (10)

1.一种信息推送方法,其特征在于,包括以下步骤:
接收用户住宿搜索请求,所述住宿搜索请求包括用户搜索文本;
判断已建立的用户搜索意图库中是否存在与所述用户搜索文本相匹配的历史搜索文本,所述用户搜索意图库至少包括历史搜索文本与酒店的映射关系表;
如存在,则将与所述用户搜索文本相匹配的历史搜索文本对应的酒店的信息推送至用户;
如不存在,则通过所述用户搜索文本与所述用户搜索意图库的酒店名称的相似度计算获得所述用户搜索文本对应的酒店,将所述酒店的信息推送至用户;
还包括建立用户搜索意图库,所述建立用户搜索意图库包括如下步骤:
从OTA平台和/或搜索引擎平台的获得历史酒店搜索数据库,所述历史酒店搜索数据包括用户的历史搜索文本和用户的酒店点击操作数据;
获得每个所述历史搜索文本和各个搜索点击的酒店的对应关系;
将每个历史搜索文本与对应的搜索点击次数最高的酒店建立映射关系;
所述建立用户搜索意图库还包括:
从OTA平台和/或搜索引擎平台的获得历史酒店搜索数据库,所述历史酒店搜索数据包括用户的历史搜索文本和用户的酒店点击操作数据;
对用户历史搜索文本进行分词,获得用户历史搜索文本的各个词性结构,各个所述词性结构为关键词生成规则;
基于关键词生成规则,将所述用户搜索意图库中的酒店生成与酒店对应的搜索文本,将搜索文本与酒店的映射关系添加进所述用户搜索意图库。
2.根据权利要求1所述的信息推送方法,其特征在于,所述通过所述用户搜索文本与所述用户搜索意图库的酒店名称的相似度计算获得所述用户搜索文本对应的酒店,包括如下步骤:
通过训练好的语义相似度计算模型计算所述用户搜索文本与所述用户搜索意图库的酒店名称的第一相似度,所述训练好的语义相似度计算模型包括特征提取层;
根据所述第一相似度获得所述用户搜索文本对应的酒店列表;
通过训练好的BERT语言模型计算所述用户搜索文本与所述酒店列表中的酒店名称的第二相似度;
根据所述第二相似度获得所述用户搜索文本对应的酒店。
3.根据权利要求2所述的信息推送方法,其特征在于,所述语义相似度计算模型为深度结构语义模型。
4.根据权利要求3所述的信息推送方法,其特征在于,采用已建立的所述用户搜索意图库训练初始深度结构语义模型获得训练好的语义相似度计算模型。
5.根据权利要求2所述的信息推送方法,其特征在于,所述通过训练好的语义相似度计算模型计算所述用户搜索文本与所述用户搜索意图库的酒店名称的第一相似度,包括以下步骤:
对所述用户搜索文本进行分词处理,获得所述用户搜索文本的分词集合;
将所述分词集合作为第一神经网络编码器模型的输入,通过所述第一神经网络编码器模型的输出得到所述历史搜索文本的第一向量;
获取根据第二神经网络编码器模型生成的各酒店名称对应的各第二向量;
计算所述第一向量与各第二向量的第一相似度;
其中,所述第一神经网络编码器模型和所述第二神经网络编码器模型为训练好的所述语义相似度计算模型的特征提取层。
6.根据权利要求5所述的信息推送方法,其特征在于,采用余弦相似度或欧式距离计算所述第一向量与各第二向量的第一相似度;
所述根据所述第一相似度,取与所述第一向量距离最近的设定数目的第二向量,将设定数目的第二向量对应的酒店添加入所述酒店列表。
7.根据权利要求1所述的信息推送方法,其特征在于,所述信息为酒店的广告关键词或酒店的落地页的一种或多种。
8.一种信息推送***,用于实现权利要求1至7任意一项所述的信息推送方法,其特征在于,包括用户模块和计算模块,其中:
所述用户模块接收用户住宿搜索请求,所述住宿搜索请求包括搜索文本;
所述计算模块判断已建立的用户搜索意图库中是否存在与所述搜索文本相匹配的历史搜索文本,所述用户搜索意图库至少包括历史搜索文本与酒店的映射关系表;
当用户搜索意图库中存在与所述搜索文本相匹配的历史搜索文本时,所述用户模块将与所述搜索文本相匹配的历史搜索文本对应的酒店的信息推送至用户;
当用户搜索意图库中不存在与所述搜索文本相匹配的历史搜索文本时,所述计算模块通过所述搜索文本与所述用户搜索意图库的酒店名称的相似度计算获得所述搜索文本对应的酒店,所述用户模块将所述酒店的信息推送至用户
所述信息推送***还用于建立用户搜索意图库,所述建立用户搜索意图库包括如下步骤:
从OTA平台和/或搜索引擎平台的获得历史酒店搜索数据库,所述历史酒店搜索数据包括用户的历史搜索文本和用户的酒店点击操作数据;
获得每个所述历史搜索文本和各个搜索点击的酒店的对应关系;
将每个历史搜索文本与对应的搜索点击次数最高的酒店建立映射关系;
所述信息推送***还用于
从OTA平台和/或搜索引擎平台的获得历史酒店搜索数据库,所述历史酒店搜索数据包括用户的历史搜索文本和用户的酒店点击操作数据;
对用户历史搜索文本进行分词,获得用户历史搜索文本的各个词性结构,各个所述词性结构为关键词生成规则;
基于关键词生成规则,将所述用户搜索意图库中的酒店生成与酒店对应的搜索文本,将搜索文本与酒店的映射关系添加进所述用户搜索意图库。
9.一种信息推送设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7任意一项所述信息推送方法的步骤。
10.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被处理器执行时实现权利要求1至7任意一项所述信息推送方法的步骤。
CN202010405534.8A 2020-05-14 2020-05-14 信息推送方法、***、设备及存储介质 Active CN111597413B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010405534.8A CN111597413B (zh) 2020-05-14 2020-05-14 信息推送方法、***、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010405534.8A CN111597413B (zh) 2020-05-14 2020-05-14 信息推送方法、***、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111597413A CN111597413A (zh) 2020-08-28
CN111597413B true CN111597413B (zh) 2023-04-18

Family

ID=72185485

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010405534.8A Active CN111597413B (zh) 2020-05-14 2020-05-14 信息推送方法、***、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111597413B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112465555B (zh) * 2020-12-04 2024-05-14 北京搜狗科技发展有限公司 一种广告信息推荐的方法及相关装置
CN112651332A (zh) * 2020-12-24 2021-04-13 携程旅游信息技术(上海)有限公司 基于照片库的场景设施识别方法、***、设备及存储介质
CN112948724B (zh) * 2021-02-26 2023-11-24 携程计算机技术(上海)有限公司 酒店url的生成方法及***、电子设备及介质
CN114399328A (zh) * 2021-12-23 2022-04-26 北京明略软件***有限公司 广告的投放方法和装置、存储介质、电子装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942279A (zh) * 2014-04-01 2014-07-23 百度(中国)有限公司 搜索结果的展现方法和装置
CN107220380A (zh) * 2017-06-27 2017-09-29 北京百度网讯科技有限公司 基于人工智能的问答推荐方法、装置和计算机设备
CN108108379A (zh) * 2016-11-25 2018-06-01 北京国双科技有限公司 关键词拓词的方法及装置
CN109101658A (zh) * 2018-08-31 2018-12-28 优视科技新加坡有限公司 信息搜索方法、装置及设备/终端/服务器

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107491518B (zh) * 2017-08-15 2020-08-04 北京百度网讯科技有限公司 一种搜索召回方法和装置、服务器、存储介质
CN110069698B (zh) * 2017-11-01 2021-09-03 北京京东尚科信息技术有限公司 信息推送方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942279A (zh) * 2014-04-01 2014-07-23 百度(中国)有限公司 搜索结果的展现方法和装置
CN108108379A (zh) * 2016-11-25 2018-06-01 北京国双科技有限公司 关键词拓词的方法及装置
CN107220380A (zh) * 2017-06-27 2017-09-29 北京百度网讯科技有限公司 基于人工智能的问答推荐方法、装置和计算机设备
CN109101658A (zh) * 2018-08-31 2018-12-28 优视科技新加坡有限公司 信息搜索方法、装置及设备/终端/服务器
WO2020044096A1 (zh) * 2018-08-31 2020-03-05 优视科技新加坡有限公司 信息搜索方法、装置及设备/终端/服务器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
闫淑红 ; .基于搜索引擎的信息查询技术研究.办公自动化.2011,(第06期),42-43. *

Also Published As

Publication number Publication date
CN111597413A (zh) 2020-08-28

Similar Documents

Publication Publication Date Title
CN111597413B (zh) 信息推送方法、***、设备及存储介质
US10325033B2 (en) Determination of content score
CN106982256B (zh) 信息推送方法、装置、设备及存储介质
CN107609152B (zh) 用于扩展查询式的方法和装置
US8078617B1 (en) Model based ad targeting
US9336298B2 (en) Dialog-enhanced contextual search query analysis
US8359326B1 (en) Contextual n-gram analysis
US20100250335A1 (en) System and method using text features for click prediction of sponsored search advertisements
JP7023865B2 (ja) ランディングページ生成の改良
US20110295840A1 (en) Generalized edit distance for queries
TW201224976A (en) Display of search ads in local language
JP5968744B2 (ja) コンセプトキーワード拡張データセットを利用した検索方法、装置、及びコンピュータ読み取り可能な記録媒体
CN110147494B (zh) 信息搜索方法、装置,存储介质及电子设备
CN103365876B (zh) 基于关系图谱生成网络操作辅助信息的方法与设备
CN111611452A (zh) 搜索文本的歧义识别方法、***、设备及存储介质
CN109952571A (zh) 基于上下文的图像搜索结果
CN107665442B (zh) 获取目标用户的方法及装置
AU2009355571A1 (en) Content performance estimation
CN111506704B (zh) 日语关键词组生成方法、装置、电子设备、存储介质
RU2589856C2 (ru) Способ обработки целевого сообщения, способ обработки нового целевого сообщения и сервер (варианты)
CN108959555B (zh) 查询式的扩展方法、装置、计算机设备及存储介质
CN113569578A (zh) 一种用户意图识别方法、装置和计算机设备
KR20130033694A (ko) 컨셉 키워드 확장 데이터 셋 생성방법, 장치 및 컴퓨터로 판독 가능한 기록매체
CN114595377A (zh) 词汇推荐方法、装置、终端及可读存储介质
Lee et al. Building place-specific sentiment Lexicon

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant