CN105874452A - 从社交摘要中标记兴趣点 - Google Patents

从社交摘要中标记兴趣点 Download PDF

Info

Publication number
CN105874452A
CN105874452A CN201480071824.6A CN201480071824A CN105874452A CN 105874452 A CN105874452 A CN 105874452A CN 201480071824 A CN201480071824 A CN 201480071824A CN 105874452 A CN105874452 A CN 105874452A
Authority
CN
China
Prior art keywords
entity
term
social media
media message
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201480071824.6A
Other languages
English (en)
Other versions
CN105874452B (zh
Inventor
R·H·A-M·曼苏尔
J·W·佩珀
N·A·E-H·里法伊
D·M·A·M·阿卜杜拉
V·G·默多克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN105874452A publication Critical patent/CN105874452A/zh
Application granted granted Critical
Publication of CN105874452B publication Critical patent/CN105874452B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

提供了一种利用标签来使搜索引擎的本地索引中的实体的条目丰富的方法。该方法包括从实体的邻域内获得有关位置的社交媒体消息;从所获得的消息中确定对实体独特的一个或多个术语;独立地确定一个或多个独特的术语中的一个或多个一同出现的术语;以及使用一个或多个一同出现的术作为标签来标记本地索引中的实体。此外,提供了一种取回与搜索结果相关联的社交媒体消息的方法。

Description

从社交摘要中标记兴趣点
背景技术
诸如餐厅、电影院、银行等之类的兴趣点(POI)表示对搜索引擎的查询的大量份额。搜索引擎常常具有本地(搜索)索引,其通常填充有从不同市场中的数据服务提供商(例如,Yellow)处获得的本地实体。收集关于不同国家中的本地商业场所信息并且在NokiaPrime下提供这些信息。兴趣点的所有者通常想要使它们的商业场所响应于用户的查询而出现,并且同样,当对本地商业场所进行搜索时,用户希望看到尽可能多的相关的结果。有时即使所有者没有采取任何动作,商业场所也可以出现在结果中,这是由于主要的搜索引擎是从许多不同的源中拉取(pull)数据的。一些搜索引擎允许商业场所的所有者将关于他们的商业场所的信息直接加入到本地索引中,这增加了在本地搜索期间被发现的可能性,并且增加了当查看信息时看到的信息的量。一些搜索引擎供应商出售升级服务,并且这帮助商业场所的所有者超越其它竞争者。
然而,就其不覆盖某些市场中的所有本地实体的方面而言,在搜索引擎的本地索引中所发现的数据是不完整的。此外,可能会缺少与每个实体相关联的属性中的一些,例如电话号码、URL、分类等。当查询具有实体的名称或类型而实体在索引中存在时,搜索引擎中的本地查询具有高的概率与存储在本地索引中的本地实体相匹配。然而,由于缺少与现有的实体或不存在的实体相关联的标签,因此本地查询的一部分没有在索引中发现足够的匹配。没有在索引中发现合适的匹配的该部分的查询引起LDCG损失。DCG(折扣累积增益)是通常在信息检索中使用的对网页搜索引擎算法或相关应用的有效性的测量。使用在搜索引擎结果集合中的文档的分等级的相关性尺度,DCG基于文档在结果列表中的位置来测量文档的有用性、或者增益。增益从结果列表的顶部到底部逐渐累积,同时每个结果的增益在更低的排名处(rank)打折扣。更多使用的DCG的形式是NDCG,其是DCG的标准化的版本。LDCG是DCG的本地版本并且其用作搜索引擎领域中的主度量,以用于测量搜索引擎的本地搜索的质量。
因此,存在用额外的词语(通常被称为标签)使已知的实体的条目丰富/完整,以使得发现实体的机会将增加的需求。这些标签帮助在本地搜索过程中增强实体与查询的匹配。从而,改善搜索结果的质量。
人们倾向于通过社交网络分享他们在某些POI中的个人经历。他们表达对宾馆以及对在餐厅中他们最爱吃的食物等的评论。社交摘要(feed)可以是用于发现在索引中不存在的新的实体或者将标签与现有的实体相关联的的好的源。
以下所描述的实施例不限于解决了以上所提及的问题中的任何一个或全部的实现。
发明内容
以下呈现了本公开的简化的概要,以便向读者提供基本的理解。该发明内容不是本公开的详细的综述,并且其不标识关键/重要元素或描绘说明书的范围。其唯一的目的是以简化的形式呈现在本文中所公开的概念的选择,作为之后所呈现的更加详细的说明的前序。
为了得到更快速、更完整、更相关的针对本地搜索的搜索结果,所提出的是向搜索索引的本地索引中的兴趣点的实体添加搜索标签。从兴趣点的邻域内获得有关位置的社交媒体消息(例如,标记有地理标签的推文或者具有与其自身相关联的位置信息的帖子)。接着,从所获得的消息中确定对兴趣点独特的(特定的、特有的)术语(terms)。随后,独立地确定针对独特的术语的一个或多个一同出现的术语,它们可以被用作标签(也被称为“关键字”)来标记本地索引中的兴趣点。从而,兴趣点被更好地表征并且可以在未来的搜索中更好地被发现。
还提出了通过不仅提供搜索结果而且还提供与其相关联的社交媒体消息来向正在搜索引擎中输入本地查询的用户提供增强的用户体验。从用户处接收有关位置的搜索查询。从搜索查询中提取术语。将所提取的术语与本地索引中的实体的标签进行比较。与相关于条目的社交媒体消息一起取回匹配的实体。从而,用户不仅仅发现关于兴趣点的客观信息(名称、地址等),还发现已经访问了该兴趣点的其它用户的主观观点。因此,用户获得关于该兴趣点的更加完整的印象。
通过结合附图而参考以下的具体实施方式,伴随的特征中的许多将更容易被理解为相同的将变得更好理解。
附图说明
本说明将从以下根据附图对具体实施方式的阅读中更好地理解,其中:
图1示出了搜索索引的本地索引中的兴趣点的条目;
图2示出了如何从有关位置的社交媒体消息中确定独特的术语;
图3示出了如何获得针对独特的术语的一同出现的术语;
图4a示出了呈现包括最相关的社交媒体消息的搜索结果的第一种方式;
图4b示出了呈现包括最相关的社交媒体消息的搜索结果的第二种方式;以及
图5示出了其上可以实现在本文中所呈现的方法的实施例的计算环境。
相同的附图标记用于指代附图中相同的部件。
具体实施方式
在下文中结合附图所提供的具体实施方式旨在作为本示例的说明,并且不旨在表示本示例可以被构建或利用的仅有的形式。说明阐述了示例的功能以及用于构建示例和对示例进行操作的步骤的顺序。然而,可以由不同的示例来完成相同或者等价的功能和顺序。
尽管本示例在本文中被描述并被示出为以台式计算机***来实现,但所描述的***是作为示例而非限制而提供的。本领域技术人员将理解的是,本示例适用于应用在多种不同类型的计算***中。
图1示出了搜索引擎的本地索引中的兴趣点的条目。然而,在继续进行对图1的具体描述之前,将讨论实施例的几个项目。
可以被看作后端的第一个方面是指利用一个或多个标签来使搜索引擎的本地索引中的实体的条目丰富的方法。获得来自实体的邻域内的有关位置的社交媒体消息。从所获得的消息中确定对实体独特的一个或多个术语。随后,独立地确定针对一个或多个独特的术语的一个或多个一同出现的术语。接着,将一个或多个一同出现的术语用作一个或多个标签来标记本地索引中的实体。
在实施例的一些中,社交媒体(平台)是而在其它实施例中,社交媒体平台是概括而言,可以在所要求保护的实施例内使用允许标记地理标签(geo-tagging)的所有社交媒体平台。
是使得用户能够发送和阅读消息(“推文”)的在线社交网络和微博客服务,所述消息是限于140个字符的文本消息。已注册的用户可以阅读和发布推文,但未注册用户只能阅读推文。用户通过网站界面、SMS、或者移动设备应用来访问
在实施例的一些中,有关位置的社交媒体消息是标记有地理标签的推文。标记地理标签是向各种媒体(例如,标记有地理标签的照片或视频、网站、SMS消息、QR代码、或RSS馈源)添加地理标识元数据的过程,并且是地理空间元数据的一种形式。该数据通常由纬度和经度坐标组成,然而他们还可以包括海拔、方位角、距离、精度数据、以及地点名称。在几乎所有情况下,在标记地理标签时所使用的地理位置数据将从全球定位***(GPS)中得出,并且基于呈现地球上沿着赤道从西经180°到东经180°,并且沿着本初子午线从北纬90°到南纬90°的各个位置的纬度/经度坐标***。
用户可以启用定位服务,这允许他选择性地向他的推文添加位置信息。该特征是默认关闭的,并且他将需要选择性加入来使用该特征。一旦通过网络设置或者移动设备启用了定位服务,将能够附加发布推文的位置的具体坐标(纬度和经度)。
在其它实施例中,有关位置的社交消息是标记有地理标签的消息。是在线社交网络服务。用户在使用该网站之前进行注册,在这之后他们可以创建个人简档、将其它用户添加为朋友、交换消息、并且当朋友更新他们的简档时接收到自动通知。
在其它实施例中,社交媒体是 是针对移动设备(例如,智能电话)的基于位置的社交网络网站。用户通过从应用程序位置附近的一系列地点中进行选择而使用移动网站、文本消息发送、或者特定于设备的应用程序而在地点处“登入”。位置是由移动设备中的GPS硬件或者由应用程序所提供的网络位置所确定的。每次登入都奖励用户积分并且有时奖励“徽章”。对一地点登入最频繁的用户成为“市长”,而经常登入的用户竞争“市长的职位”。
概括而言,有关位置的社交媒体消息是携带发送该消息的位置的指示的、来自社交媒体平台的消息。
在实施例的一些中,实体是兴趣点(POI),兴趣点进而是有人可以发现是有用的或感兴趣的具体的点位置。在实施例的一些中,兴趣点是诸如商店、购物中心、餐厅、银行、宾馆、营地、加油站、游乐园、或者旅游景点之类的商业场所。
在实施例的一些中,本地索引中的实体的(不完整的)条目也被认为是实体的位置。接着,访问包含有关位置的消息的社交媒体数据库。在的案例中,如果对编程者可用,则可以使用提供当前已发布的(公开的)推文的流的服务。如果服务不可用,则公共的选项是通过API来访问在实施例中的一些中,以实时的方式从数据库中获得社交媒体消息。接着获得实体的邻域内所有的有关位置的消息。接着,从所获得的消息中计算独特的术语。在实施例的一些中,通过从消息中移除停用词来计算独特的术语。
在计算中,停用词是通常较短、频繁出现、非特定的词语,其在对自然语言数据(文本)的处理之前或之后被过滤出。没有所有的工具都使用的确切的停用词的列表,并且这样的过滤器不是一直使用的。出于给定的目的,可以选择任何词语的分组作为停用词。对于一些搜索机器而言,这些是最常见的短功能词语,例如,the、is、at、which、和on。根据反映实体的邻域内的术语的重要性(或相关性)的分数来对剩余的术语进行排名。
在实施例的一些中,分数基于用户频率-反用户频率度量(UF-IUF),其将在用户的有关位置的社交媒体消息中提及术语的用户的数量除以在实体的邻域内发送有关位置的社交媒体消息的用户的总数量。例如,如果术语被相比于在实体的邻域内发送有关位置的社交媒体消息的用户的总数量而言相对多的用户提及,则该术语得到高分。如本领域技术人员将容易地理解的,如在上文中所使用的表达“基于”意指也可以应用在实施例中的该度量的变型是存在的。
在其它实施例中,分数基于术语频率-反文档频率度量(TF-IDF),其是反映词语对集合或语料库中的文档有多重要的数值统计。在信息检索和文本挖掘中,其常常作为加权因数来使用。TF-IDF分数值与在文档中出现词语的次数成比例地增加,但与语料库中的词语的频率相抵消,这帮助针对一些词语通常比其它的词语更加常见的这一事实进行控制。
对于本实施例而言,这意味着“文档”是社交媒体消息,而“集合”或“语料库”全都是实体的邻域内的社交媒体消息。因此,术语频率-反文档频率是术语在有关位置的社交媒体消息中出现的次数除以其中出现术语的实体的邻域内的有关位置的社交媒体消息的数量。换句话说,例如,当术语出现很多次但仅仅在很少的实体的邻域内的有关位置社交媒体消息中出现时,术语获得高分数。再一次,TF-IDF度量的很多变型是已知的,并且可以由本领域技术人员使用来实现实施例。
如果“术语”的分数超过阈值,则该“术语”被认为是对实体“独特的术语”。(当然,在同等原则下,可以在数学上重新定义分数的定义,以使得分数低于阈值的术语成为独特的术语。)
在实施例的一些中,通过多个实体来合计术语分数以对术语进行排名。由此,获得包括几个实体的整个区域的语言模型(=对整个区域独特的术语),这促使对某些实体独特的术语超过在多个实体中出现的更常见的术语。以经验为主地,已经发现获得实体的名称作为分数最高的术语。事实就是这样,因为有关位置的社交媒体消息是在POI位置周围选择的,并且这些消息中的大多数是由诸如之类的社交网络生成的登入社交媒体消息。
在实施例的一些中,通过利用对实体独特的一些属性(例如,URL、名称、搜索引擎的本地索引中其描述的一部分)而对有关位置的社交媒体消息进行过滤来获得对每个实体独特的术语。随后,在实施例的一些中,针对上文中的所促成的最高分数的术语来计算最频繁的一同出现的术语。最频繁的一同出现的术语充当元数据标签以利用其对实体进行标记。通过利用(额外的)搜索标签来使搜索引擎的本地索引中的实体的条目丰富,可以更好地发现所述实体。“标签”是被分配至一则消息的关键词或术语。这类元数据帮助描述项目,并且允许通过浏览或搜索而再一次发现该项目。
在实施例的一些中,一同出现的术语是针对来自有关位置的社交媒体消息和无关位置的社交媒体消息的独特的术语而独立地确定的。换句话说,对于实体的每个独特的术语,通过根据反映社交媒体消息(有关位置的和无关位置的)内的术语的重要性(或相关性、有意义性)的分数而对也在包含独特的术语的社交媒体消息内的术语(的全部或其中一些)进行排名,从而确定一个或多个一同出现的术语。在实施例的一些中,分数基于术语频率-反文档频率(TF-IDF)度量或用户频率-反用户频率(UF-IUF)度量,并且将具有比阈值更高的分数值的那些术语作为标签添加在实体的条目中。在实施例的一些中,不仅将一同出现的术语作为标签添加在实体的条目中,而且将已经针对实体而确定的独特的术语添加到本地索引中的实体的条目中。然而,一同出现的术语通常比独特的术语更加丰富(更加有意义)。
在实施例的一些中,从在一段时间内发布的社交媒体消息中确定一同出现的术语。在实施例的一些中,一段时间是三个月,在其它实施例中,一段时间是六个月,在其它实施例中,一段时间是一年,并且在其它实施例中,一段时间是两年。在实施例的一些中,本地索引中的实体与关于该实体的有关位置的社交媒体消息相关联。
在实施例的一些中,邻域包括具有100米到200米的半径的围绕着实体的圆形区域。在其它实施例中,邻域包括具有500米的半径的围绕着实体的圆形区域。在其它实施例中,邻域具有方形的形状或任何其它几何形状。
另一个方面指的是具有处理单元的计算设备;以及包括存储在其上的计算机可执行指令的计算机存储介质,其中当所述计算机可执行指令由处理单元执行时,使得处理单元执行利用一个或多个标签来使搜索引擎的本地索引中的实体的条目丰富的方法。该方法包括从实体的邻域中获得有关位置的社交媒体消息。接着,通过基于用户频率-反用户频率度量的分数而从所获得的消息中确定对实体独特的一个或多个术语,所述度量包括在实体的邻域内的、用户的有关位置的社交媒体消息中提及术语的用户的数量除以在实体的邻域内发送有关位置的社交媒体消息的用户的总数。接着,确定针对一个或多个独特的术语的一个或多个一同出现的术语;并且,使用一个或多个一同出现的术语来标记本地索引中的实体。
可以被认为是前端的第三方面是指包括存储于其上的计算机可执行指令的一个或多个计算机存储介质,其中,当所述计算机可执行指令由处理器执行时,使得所述处理器执行将来自搜索引擎的本地索引的搜索结果提供给用户的方法。所述方法包括从用户处接收有关位置的搜索查询。接着,例如通过从搜索查询中移除停用词来从搜索查询中提取(搜索)术语。将所提取的术语与本地索引中的实体的标签进行比较。接着,从本地索引中取回匹配的实体以及与该实体相关联的社交媒体消息。
在实施例的一些中,实体是兴趣点。
在实施例的一些中,与实体相关联的社交媒体消息是表征实体或者关于实体相关的社交媒体消息。
在实施例的一些中,将与匹配的实体相关联的多媒体项目返回给用户。
在实施例的一些中,以基于也在特定的社交媒体消息中所发现的实体的标签的数量的排名来显示与实体相关联的社交媒体消息。
在实施例的一些中,以基于社交媒体消息的新鲜度的排名来显示与实体相关联的社交媒体消息。较新鲜的社交媒体消息被置于顶部,而较旧的社交媒体消息被置于底部。
在实施例的一些中,多媒体项目是人们在实体中拍摄的图像或视频。
最后,另一个方面是指发现新的实体并将其加入搜索引擎的本地实体的方法。该方法包括获得已知的实体的邻域中的有关位置的社交媒体消息。接着,从所获得的消息中确定一个或多个独特的术语。从独特的术语中得出实体的名称。接着,在本地索引中搜索实体是否已经存在(已经是条目)。如果没有在本地索引中发现实体,则针对本地索引中的实体而添加新的条目。
在实施例的一些中,通过确定独特的词语而得出实体的名称,并且基于UF-IUF度量或TF-IDF度量对它们进行排名以使得实体的名称出现在排名的顶部。
尽管已经在上文中分离地解释了实施例的独立的特征,但是清楚的是,可以在一个实施例内对所述特征进行组合。
现在返回图1,其示出了针对搜索引擎的本地索引中的兴趣点的条目100的示例。该示例中的兴趣点是西雅图市的特定的Pizza餐厅。可以看到,条目100具有几个属性,例如,“名称”、“街道”、“城市”、以及“地理位置”等,但是因为缺少属性“邮编”、“州”、和“URL”,因此条目100是不完整的。属性“描述”(关键词)仅仅包括标签“披萨”和“食物”。如果某人想要搜索在西雅图市他可以吃意大利面的餐厅,尽管该餐厅在现实中实际上供应意大利面,但他将不会发现该特定的Pizza餐厅。因此,将利用额外的搜索标签来使该实体的条目丰富以改善搜索结果的质量,以使得未来用户针对她可以吃意大利面的地点进行搜索时会在搜索结果中发现该特定的餐厅。
图2示出了如何发现对区域内的兴趣点独特的术语。POI存储200包含许多兴趣点的地理位置,而社交媒体平台300提供有关位置的社交媒体消息。如果社交媒体平台300是则有关位置的社交媒体消息215是标记有地理标签的推文。在POI存储200已经传递了兴趣点的地理位置205之后,接着将在兴趣点的邻域内(例如,在500米的半径内,见地图220)所发送的所有有关位置的社交媒体消息(=POI候选消息225)考虑在内以建立语言模型230。为了该目的,从所有的POI候选消息225中移除所有停用词。接着,根据基于用户频率-反用户频率(UF-IUF)度量(或者术语频率-反文档频率(TF-IDF))的分数来对剩余的术语进行排名。为了确定术语的分数,将在兴趣点的邻域内的、用户的消息中提及术语的用户的数量除以在兴趣点的邻域内发布消息的用户的数量。其分数高于阈值的那些术语被认为是对POI独特的。如已经在上文中所提及的,当根据在上文中所描述的度量对独特的术语进行排名时,实体名称被排名在顶部。
图3示出了如何在下一阶段从独特的术语中得出POI元数据。在该阶段中,使用独特的术语(=基于UF-IUF(或TF-IDF)具有高分数的术语),并且针对这些独特的术语中的每个来确定在包含该独特的术语的社交媒体消息中频繁地使用了哪些其它术语。例如,如果存在许多诸如“我在PizzaHut吃了好吃的意大利面”之类的社交媒体消息,则术语“意大利面”和“PizzaHut”被认为是一同出现的术语。在该阶段中,分析了社交媒体消息的更宽泛的基础。不仅将有关位置的社交媒体消息310考虑在内,还将无关位置的社交媒体消息320考虑在内。从而,由于将更大的语料库用作基础,因此可以发现更多一同出现的术语。在330处,针对每个独特的术语,确定包含该独特的术语的所有有关位置的社交消息310和无关位置的社交消息320,并且将他们称为“有关POI的消息”。有关POI的消息还在时间上限于来自一段时间的社交媒体消息,例如,过去的六个星期。有关POI的消息中的一些或所有的术语(除了独特的术语之外)是按TF-IDF或UF-IUF(提及一同出现的术语的独特的用户的数量除以使用该独特的术语本身的独特的用户的总数量)度量来排名的,这意味着独特的和常见的一同出现的术语将排名较高。如果具有比阈值高的分数的那些术语还没有被存储在实体的条目100中的“描述”属性下,则将该术语作为POI元数据标签而添加在“描述”下。
图4a和图4b示出了实施例的前端,并且涉及当针对本地商业场所进行搜索时用户具有的增强的体验。以基于以下的排名来显示与实体相关联的社交媒体消息:(a)也在特定的社交媒体消息中发现的实体的POI元数据标签的数量、或者(b)社交媒体消息的新鲜度、或者(c)社交媒体消息的长度、或者(d)社交媒体消息的长度、或者(e)作者是否具有经验证的账号(作者权威)、或者(f)社交媒体消息已经被转发的次数、或者(g)对该社交媒体消息回复的数量。经排名的社交媒体消息与查询的结果一起被显示。与兴趣点相关的社交媒体消息示出了人们对该兴趣点的反馈,或者人们关于他们对该兴趣点的体验的总体看法。可以使用兴趣点的地理位置信息来获得人们在该兴趣点拍摄的相关的图像和视频。利用其它用户在兴趣点的体验来增加用户体验设定了用户访问该兴趣点的预期,并且当她比较多个兴趣点时,帮助她做出更好的决定。
图4a在显示器右半边中示出了相关的社交媒体消息,显示器右半边通常示出对搜索结果的补充材料,例如,推荐的查询。在图4b中,在页面的左半边中显示了示出搜索的结果的社交媒体消息。在即时回答(instantanswer)中显示了社交媒体消息。
可替代地或另外地,在本文中所描述的功能可以至少部分由一个或多个硬件逻辑组件执行。例如而非限制,可以使用的说明性类型的硬件逻辑组件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑器件(CPLD)、图形处理单元。
图5示出了可以被实现为任何形式的计算和/或电子设备的示例性的基于计算的设备500的各种组件,并且其中,可以实现使搜索引擎的本地索引中的条目丰富的方法的实施例。
基于计算的设备500还能够执行向搜索引擎的本地索引526添加新的实体的条目的方法,以及向在末端用户计算设备522处的末端用户提供包括相关的社交媒体消息的搜索结果的方法。基于计算的设备500包括一个或多个处理器502,其可以是微处理器、控制器、或用于处理计算机可执行指令以控制设备500的操作的任何其它合适的类型的处理器。在例如使用片上***架构的一些示例中,处理器502可以包括一个或多个固定的功能模块(也被称为加速器),其在硬件(而不是软件或固件)中实现下载方法的一部分。可以在基于计算的设备500处提供包括操作***504的平台软件或任何其它合适的平台软件。提供了可以获得社交媒体消息以用于对消息的内容进行处理和分析的数据存储510。基于计算的设备500、末端用户计算设备522、以及搜索引擎524经由网络508相互连接。
可以使用能够由基于计算的设备500访问的任何计算机存储介质来提供计算机可执行指令。计算机存储介质可以包括诸如存储器512之类的计算机存储介质和通信介质。诸如存储器512之类的计算机存储介质包括以任何用于存储信息(例如,计算机可读指令、数据结构、程序模块、或其它数据)的方法或技术实现的易失性的和非易失性的、可移动的和不可移动的介质。计算机存储介质包括但不限于RAM、ROM、EPROM、EEPROM、闪速存储器或其它存储器技术、CD-ROM、数字通用盘(DVD)、或其它光存储设备、盒式磁带、磁带、磁盘存储设备或其它磁存储设备、或者可以用于存储信息以供计算设备存取的任何其它介质。相反,通信介质可以实施计算机可读指令、数据结构、程序模块、经调制的数据信号(例如,载波、或其它传输机制)中的其它数据。如在本文中所定义的,计算机存储介质不包括通信介质。因此,计算机存储介质不被解释为传播信号本身。可以在计算机存储介质中呈现传播的信号,但是传播的信号本身不是计算机存储介质的示例。
基于计算的设备500还包括输入/输出控制器516,输入/输出控制器516被设置为将显示信息输出至显示设备518,显示设备518可以与基于计算的设备500分离或者集成至基于计算的设备500。显示信息可以提供图形用户界面。输入/输出控制器516还被设置为接收并处理来自一个或多个设备的输入,所述一个或多个设备例如用户输入设备520(例如,鼠标、键盘、相机、麦克风、或其它传感器)。显示器和键盘可以通过交换器连接。在一些示例中,用户输入设备520可以检测语音输入、用户手势、或其它用户动作,并且可以提供自然用户界面(NUI)。该用户输入可以用于控制下载方法、设置参数值、查看结果、以及出于其它目的。在实施例中,如果显示设备518是触摸感应显示设备,则其还可以充当用户输入设备520。输入/输出控制器516还可以将数据输出至除了显示设备之外的设备,例如,本地连接的打印设备。
输入/输出控制器516、显示设备518、以及可选地用户输入设备520可以包括NUI技术,该技术使得用户能够以自然的方式与基于计算的设备进行交互,以避免由输入设备(例如,鼠标、键盘、遥控器等)所施加的人为限制。可以提供的NUI技术的示例包括但不限于:依赖语音和/或话音识别、触摸和/或触摸笔识别(触摸感应显示器)、屏幕上的以及贴近屏幕的手势识别、空中手势、头部和眼部追踪、语音和话音、视觉、触摸、手势、和机器智能的那些技术。可以使用的NUI技术的其它示例包括:意图和目的理解***、使用深度相机(例如,立体相机***、红外相机***、rgb相机***、以及它们的组合)的运动手势检测***、使用加速度计/陀螺仪的运动手势检测、面部识别、3D显示、头部、眼部、和视线追踪、沉浸式增强现实和虚拟现实***、以及用于使用电场传感电极来感测脑部活动的技术(EEG和有关的方法)。
在本文中所使用的术语“计算机”或“基于计算的设备”是指具有处理能力以使其可以执行指令的任何设备。本领域技术人员将理解的是,这样的处理能力被包含在许多不同的设备中,并且因此,术语“计算机”和“基于计算的设备”每个都包括PC、服务器、移动电话(包括智能电话)、平板计算机、机顶盒、媒体播放机、游戏控制器、个人数字助理、以及许多其它设备。
在本文中所描述的方法可以由以在有形的存储介质上的机器可读的形式(例如,以包括当程序在计算机上运行时适用于执行在本文中所描述的方法中的任何一个的全部步骤的计算机程序代码单元的计算机程序的形式,并且其中,计算机程序可以在计算机存储介质上被实施)的软件来执行。有形的存储介质的示例包括计算机存储设备,其包括诸如盘、拇指驱动器、存储器等之类的计算机存储介质,并且不包括传播的信号。传播的信号可以被呈现在有形的存储介质中,但是传播的信号本身不是有形的存储介质的示例。软件可以适用于在并行处理器上执行或在串行处理器上执行,以使得可以以任何合适的顺序或者同时实行方法步骤。
这承认了软件可以是有价值的、能够分离地交易的商品。期望包含运行于或者控制“哑的”或者标准的硬件以实行期望的功能的软件。也期望包含“描述”或者限定硬件的配置的软件,例如HDL(硬件描述语言)软件,以用于设计硅芯片、或者用于配置通用可编程芯片,来实行期望的功能。
本领域技术人员将理解的是,用于存储程序指令的存储设备可以跨网络分布。例如,远程计算机可以存储被描述为软件的过程的示例。本地或终端计算机可以访问远程计算机并且下载软件的一部分或全部来运行程序。可替代地,本地计算机可以根据需要下载软件的片段,或者在本地终端处执行一些软件指令以及在远程计算机(计算机网络)处执行一些指令。本领域技术人员还将理解的是,通过利用对本领域技术人员已知的传统技术,可以由诸如DSP、可编程逻辑阵列等之类的专用电路来实行软件指令的全部或一部分。
对本领域技术人员显而易见的是,可以扩展或改变在本文中所给出的任何范围或设备值,而不失去所寻求的效果。
尽管已经用特定于结构特征和/或方法行为的语言描述了主题,但应当理解的是,在所附权利要求中所定义的主题非必须限于在上文中所描述的具体的特征或行为。相反,在上文中所描述的具体的特征和行为是作为实现权利要求和实施例的示例形式而公开的。
应当理解的是,在上文中所描述的好处和优点可以与一个实施例相关,或者可以与几个实施例相关。所述实施例不限于解决所述的问题那些实施例,或者具有所述的好处和优点中的任何一个或全部的那些实施例。还应当理解的是,所提到的“一个”项目指的是那些项目中的一个或多个。
可以以任何合适的顺序或者在合适的情况下同时地实行在本文中所描述的方法的步骤。额外地,可以从方法中的任何一个中删除个别模块而不脱离在本文中所描述的主题的精神和范围。在上文中所描述的示例中的任何一个的方面可以与所描述的其它示例中的任何一个的方面相结合以形成进一步的示例,而不失去所寻求的效果。
在本文中所使用的术语“包括”意指包括所标识的方法模块或元素,但是这样的模块或元素不包括排除性的列表,并且方法或装置可以包含额外的模块或元素。
应当理解的是,仅仅作为示例给出了上文中的描述,并且可以由本领域技术人员做出各种修改。以上的详细说明、示例、和数据提供了对示例性实施例的使用和结构的完整的描述。尽管已经结合某种程度上的特殊性,或者参考一个或多个个别的实施例在上文中描述了各种实施例,但是本领域技术人员可以对所公开的实施例做出各种改变而不脱离该说明书的精神或范围。

Claims (10)

1.一种对在一个或多个处理器上实现的搜索引擎进行修改、并且在所述搜索引擎的本地索引中具有实体的条目的方法,所述方法包括:
通过所述搜索引擎,从所述实体的邻域内获得有关位置的社交媒体消息;
通过所述搜索引擎,从所获得的消息中确定对所述实体独特的一个或多个术语;
通过所述搜索引擎,独立地确定针对所述一个或多个独特的术语的一个或多个一同出现的术语;
通过所述搜索引擎,将所述一个或多个一同出现的术语用作一个或多个标签来标记所述本地索引中的所述实体;
通过所述搜索引擎,从客户端设备中接收与所述本地索引相关联的查询;
响应于所述查询,通过所述搜索引擎而至少部分基于所述一个或多个标签来包括对所述实体的引用;以及
通过所述搜索引擎,将响应发送至所述客户端设备。
2.根据权利要求1所述的方法,其中,确定所述一个或多个独特的术语包括从消息中移除停用词,并且根据反映所述实体的所述邻域内的术语的重要性的分数来对剩余的术语进行排名。
3.根据权利要求2所述的方法,其中,所述分数是基于用户频率-反用户频率度量的,所述基于用户频率-反用户频率度量包括在所述实体的所述邻域内的、用户的有关位置的社交媒体消息中提及了所述术语的用户的数量除以在所述实体的所述邻域内发送了有关位置的社交媒体消息的用户的总数量。
4.根据权利要求3所述的方法,其中,所述分数是基于术语频率-反文档频率度量的,所述术语频率-反文档频率度量包括在所述实体的所述邻域内的有关位置的社交媒体消息中术语出现的次数除以其中出现所述术语的所述实体的所述邻域内的有关位置的社交媒体消息的数量。
5.根据权利要求1所述的方法,其中,从有关位置的社交媒体消息和无关位置的社交媒体消息中确定所述一同出现的术语。
6.根据权利要求5所述的方法,其中,独立地确定针对所述一个或多个独特的术语的一个或多个一同出现的术语包括,根据反映所述有关位置的社交媒体消息和所述无关位置的社交媒体消息内的术语的重要性的分数,对也在包含独特的术语的所述有关位置的社交媒体消息和所述无关位置的社交媒体消息内的术语进行排名。
7.根据权利要求6所述的方法,其中,所述分数是基于术语频率-反文档频率度量或者用户频率-反用户频率度量的。
8.一个或多个计算机存储介质,其包括存储在其上的计算机可执行指令,当所述计算机可执行指令由处理器执行时,使得所述处理器执行向用户提供来自搜索引擎的本地索引的搜索结果的方法,所述方法包括:
从用户处接收有关位置的搜索查询;
从所述搜索查询中提取术语;
将所提取的术语与所述本地索引中的实体的标签进行比较;
取回匹配的实体以及与所述实体相关联的社交媒体消息;以及
向所述用户发送搜索结果,所述搜索结果引用所述匹配的实体以及与所述实体相关联的所述社交媒体消息。
9.根据权利要求8所述的一个或多个计算机存储介质,其中,在所取回的匹配的实体间或者在所述匹配的实体旁边显示所述社交媒体消息。
10.根据权利要求8所述的一个或多个计算机存储介质,其中,按照基于也在特定的社交媒体消息中发现的所述匹配的实体的标签的数量的排名而显示与所述实体相关联的所述社交媒体消息。
CN201480071824.6A 2013-12-30 2014-12-05 从社交摘要中标记兴趣点 Active CN105874452B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/144,213 2013-12-30
US14/144,213 US10242114B2 (en) 2013-12-30 2013-12-30 Point of interest tagging from social feeds
PCT/US2014/068684 WO2015102805A1 (en) 2013-12-30 2014-12-05 Point of interest tagging from social feeds

Publications (2)

Publication Number Publication Date
CN105874452A true CN105874452A (zh) 2016-08-17
CN105874452B CN105874452B (zh) 2020-11-03

Family

ID=52293180

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480071824.6A Active CN105874452B (zh) 2013-12-30 2014-12-05 从社交摘要中标记兴趣点

Country Status (4)

Country Link
US (1) US10242114B2 (zh)
EP (1) EP3090359A1 (zh)
CN (1) CN105874452B (zh)
WO (1) WO2015102805A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110853488A (zh) * 2019-10-28 2020-02-28 广州码石信息科技有限公司 一种poi标签显示方法、装置和设备
CN111323040A (zh) * 2018-12-14 2020-06-23 上海博泰悦臻网络技术服务有限公司 地理位置信息的显示方法、***、介质、及车载终端

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1704387B1 (en) * 2003-12-19 2013-03-27 DeCarta Inc. Geocoding locations near a specified city
US10176260B2 (en) * 2014-02-12 2019-01-08 Regents Of The University Of Minnesota Measuring semantic incongruity within text data
US20150242924A1 (en) * 2014-02-26 2015-08-27 Verizon Patent And Licensing Inc. Systems and methods for using customer information to enable customer interaction
US20150339855A1 (en) * 2014-05-20 2015-11-26 International Business Machines Corporation Laser pointer selection for augmented reality devices
US9683862B2 (en) 2015-08-24 2017-06-20 International Business Machines Corporation Internationalization during navigation
US11741406B2 (en) 2018-01-31 2023-08-29 Microsoft Technology Licensing, Llc Location-based task suggestions
AU2022283365A1 (en) * 2021-05-26 2023-12-07 Ids Technology Llc Systems and methods for automatic generation of social media networks and interactions

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101294818A (zh) * 2008-04-24 2008-10-29 凯立德欣技术(深圳)有限公司 沿引导路径检索兴趣点的方法及使用了此方法的导航***
CN101398308A (zh) * 2008-10-15 2009-04-01 凯立德欣技术(深圳)有限公司 一种兴趣点检索方法、兴趣点检索装置及导航***
US20090319167A1 (en) * 2008-06-19 2009-12-24 Samsung Electronics Co., Ltd Method and apparatus to provide location information
CN102047249A (zh) * 2008-05-27 2011-05-04 高通股份有限公司 用于聚合和呈现与地理位置相关联的数据的方法和设备
CN102142003A (zh) * 2010-07-30 2011-08-03 华为软件技术有限公司 兴趣点信息提供方法及装置
CN102594905A (zh) * 2012-03-07 2012-07-18 南京邮电大学 一种基于场景的社交网络位置兴趣点推荐方法
US20130097162A1 (en) * 2011-07-08 2013-04-18 Kelly Corcoran Method and system for generating and presenting search results that are based on location-based information from social networks, media, the internet, and/or actual on-site location
US20130304818A1 (en) * 2009-12-01 2013-11-14 Topsy Labs, Inc. Systems and methods for discovery of related terms for social media content collection over social networks
CN103457975A (zh) * 2012-06-01 2013-12-18 腾讯科技(深圳)有限公司 获取地图兴趣点评价数据的方法和装置

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009528639A (ja) * 2006-02-28 2009-08-06 バズロジック, インコーポレイテッド ソーシャルメディアにおける会話を分析するためのソーシャル分析システムおよび方法
US8571580B2 (en) 2006-06-01 2013-10-29 Loopt Llc. Displaying the location of individuals on an interactive map display on a mobile communication device
US8775420B2 (en) 2007-10-31 2014-07-08 Yahoo! Inc. Text display of geo-referenced information based on relative distance to a user location
US8032508B2 (en) 2008-11-18 2011-10-04 Yahoo! Inc. System and method for URL based query for retrieving data related to a context
US20110113100A1 (en) 2009-03-21 2011-05-12 Mpanion, Inc. System for sharing favorites and enabling in-network local search based on network rankings
US20100280904A1 (en) 2009-05-01 2010-11-04 Sumit Pradeep Ahuja Social marketing and networking tool with user matching and content broadcasting / receiving capabilities
US20100306211A1 (en) 2009-05-26 2010-12-02 Nokia Corporation Method and apparatus for automatic geo-location search learning
US8626699B2 (en) * 2009-09-16 2014-01-07 Microsoft Corporation Construction of photo trip patterns based on geographical information
US20110072025A1 (en) 2009-09-18 2011-03-24 Yahoo!, Inc., a Delaware corporation Ranking entity relations using external corpus
JP2011095238A (ja) * 2009-09-30 2011-05-12 Aisin Aw Co Ltd ナビゲーション装置及びプログラム
WO2011047299A2 (en) 2009-10-15 2011-04-21 Binja Inc. Mobile local search platform
US20130297581A1 (en) 2009-12-01 2013-11-07 Topsy Labs, Inc. Systems and methods for customized filtering and analysis of social media content collected over social networks
US9110971B2 (en) * 2010-02-03 2015-08-18 Thomson Reuters Global Resources Method and system for ranking intellectual property documents using claim analysis
US8775570B2 (en) 2011-09-15 2014-07-08 Hewlett-Packard Development Company, L. P. Geographic recommendation online search system
EP2581703B1 (en) 2011-10-12 2017-05-17 Mapquest, Inc. Systems and methods for ranking points of interest
US20130110802A1 (en) * 2011-10-26 2013-05-02 Microsoft Corporation Context aware tagging interface
US9466071B2 (en) * 2011-11-16 2016-10-11 Yahoo! Inc. Social media user recommendation system and method
US20140188993A1 (en) * 2012-12-28 2014-07-03 Motorola Solutions, Inc. Method and apparatus for analysis of social media
US9866997B2 (en) * 2013-12-06 2018-01-09 Mapquest, Inc. Systems and methods for geo-location based message streams

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101294818A (zh) * 2008-04-24 2008-10-29 凯立德欣技术(深圳)有限公司 沿引导路径检索兴趣点的方法及使用了此方法的导航***
CN102047249A (zh) * 2008-05-27 2011-05-04 高通股份有限公司 用于聚合和呈现与地理位置相关联的数据的方法和设备
US20090319167A1 (en) * 2008-06-19 2009-12-24 Samsung Electronics Co., Ltd Method and apparatus to provide location information
CN101398308A (zh) * 2008-10-15 2009-04-01 凯立德欣技术(深圳)有限公司 一种兴趣点检索方法、兴趣点检索装置及导航***
US20130304818A1 (en) * 2009-12-01 2013-11-14 Topsy Labs, Inc. Systems and methods for discovery of related terms for social media content collection over social networks
CN102142003A (zh) * 2010-07-30 2011-08-03 华为软件技术有限公司 兴趣点信息提供方法及装置
US20130097162A1 (en) * 2011-07-08 2013-04-18 Kelly Corcoran Method and system for generating and presenting search results that are based on location-based information from social networks, media, the internet, and/or actual on-site location
CN102594905A (zh) * 2012-03-07 2012-07-18 南京邮电大学 一种基于场景的社交网络位置兴趣点推荐方法
CN103457975A (zh) * 2012-06-01 2013-12-18 腾讯科技(深圳)有限公司 获取地图兴趣点评价数据的方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111323040A (zh) * 2018-12-14 2020-06-23 上海博泰悦臻网络技术服务有限公司 地理位置信息的显示方法、***、介质、及车载终端
CN110853488A (zh) * 2019-10-28 2020-02-28 广州码石信息科技有限公司 一种poi标签显示方法、装置和设备

Also Published As

Publication number Publication date
WO2015102805A1 (en) 2015-07-09
CN105874452B (zh) 2020-11-03
US10242114B2 (en) 2019-03-26
US20150186530A1 (en) 2015-07-02
EP3090359A1 (en) 2016-11-09

Similar Documents

Publication Publication Date Title
CN105874452A (zh) 从社交摘要中标记兴趣点
JP6569313B2 (ja) 施設特性を更新する方法、施設をプロファイリングする方法、及びコンピュータ・システム
Bujari et al. Using gamification to discover cultural heritage locations from geo-tagged photos
Madden Professional augmented reality browsers for smartphones: programming for junaio, layar and wikitude
US20130275894A1 (en) Method and system for sharing object information
EP3288275B1 (en) Methods and systems of providing visual content editing functions
CN114615227A (zh) 基于机器学习分类的设备位置
Wilken Cultural economies of locative media
CN105247915A (zh) 上下文敏感相关联引擎平台
JP2015507290A (ja) 体験共有システムおよび方法
KR20150079739A (ko) 이벤트 리뷰들을 획득하는 방법 및 시스템
US11222361B2 (en) Location-based book identification
CN107710246A (zh) 用以促进描述位置的用户图像的提交的***和方法
JP6028493B2 (ja) サーバ装置、プログラム及び通信システム
Wall et al. Online maps and minorities: Geotagging Thailand’s Muslims
CN114707075B (zh) 一种冷启动推荐方法和设备
KR102151598B1 (ko) 키워드 속성을 기준으로 관련 있는 키워드를 제공하는 방법 및 시스템
US9386108B1 (en) Automated rare species and new species discovery alerts via crowdsourcing
JP7090779B2 (ja) 情報処理装置、情報処理方法及び情報処理システム
JP4828653B1 (ja) サーバ、辞書生成方法、辞書生成プログラム、及びそのプログラムを記録するコンピュータ読み取り可能な記録媒体
JP5775241B1 (ja) 情報処理システム、情報処理方法、および情報処理プログラム
KR20140124505A (ko) 가계정보 제공 방법
US11876941B1 (en) Clickable augmented reality content manager, system, and network
KR101760478B1 (ko) 인문학 정보를 자동으로 구성하는 방법
KR20160089880A (ko) 사용자의 포스팅을 기반으로 유명 장소에 대한 챠트를 생성하는 컴퓨터 프로그램 및 서버

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant