CN102160079B - 用于内容项目的关联内容的选择 - Google Patents
用于内容项目的关联内容的选择 Download PDFInfo
- Publication number
- CN102160079B CN102160079B CN200980136773.XA CN200980136773A CN102160079B CN 102160079 B CN102160079 B CN 102160079B CN 200980136773 A CN200980136773 A CN 200980136773A CN 102160079 B CN102160079 B CN 102160079B
- Authority
- CN
- China
- Prior art keywords
- term
- content
- grapheme
- node
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Transfer Between Computers (AREA)
Abstract
内容设备可以基于用于关联内容的文本表征数据和用户选择内容项目来选择用于用户选择内容项目的关联内容,诸如广告。使用已扩展术语集合之间的语义图和相似性值来扩展表征用户选择内容项目的术语集合,并计算描述关联内容的术语集合。然后,基于相似性值来选择特定关联内容项目。基于语义图的术语集合扩展可以允许在提供适合于资源受限情形的处理的同时改进在选择适当关联内容方面的准确度。特别地,可以保持低的通信资源、存储器资源、以及计算资源使用。
Description
技术领域
本发明涉及用于另一内容项目的关联内容项目的选择,并且特别地但非排他性地涉及适合于用户所选内容项目的广告的选择。
背景技术
近年来,文本文档、多媒体、以及娱乐内容的可用性和提供已经大量增加。例如,可用电视和无线电频道的数目已经相当可观地增长,且互联网的普及已提供了新的内容分发手段。而且,互联网已经为一般用户提供了网页、博客、在线文本文档等形式的文本文档的看起来无尽的来源。
此外,提供与用户消费的内容有关的附加关联内容变得使人感兴趣。此类关联内容可以例如是广告,诸如***电视节目中或添加到网页的广告。为了提供使单独用户特别感兴趣的关联内容,期望的是,此类内容具体地适于单独用户的偏好简档和用户当前正在访问的特定内容。特别地,已经提出广告具体地适于正在消费的内容和单独用户的内容消费偏好。例如,当用户访问网页时,期望的是,任何关联广告反映用户的偏好和特定网页的特性。
可以通过从内容库选择关联内容,使得其与所选内容相匹配来实现关联内容的此类目标和个性化。例如,当用户在设备上选择了诸如网页或音乐剪辑的特定内容项目时,设备可以访问本地或远程内容储存器以检索与内容项目相匹配的关联内容项目。
此类关联内容选择和提供正在变得越来越重要。例如,广告是从在线应用程序和服务产生收入的关键方法。日益增加的内容、搜索和其它网页应用以及网络服务甚至用户设备很可能由于从做广告收集的输入而得到大量补贴。基于用户上下文和偏好的广告的目标已经被证明增加/改进了用户对广告的响应。
例如,用于网页搜索站点的商务模型在很大程度上基于做广告。在这种情况下,使搜索查询与用于广告贮存库中的广告的关键字匹配,并选择匹配广告以将其呈现给用户。这种技术的扩展已被应用于网页中的广告***,其中,基于网页中的广告关键字的出现来选择广告。
然而,已经发现在许多情形下此类广告的选择是次优的。例如,在B.Ribeiro-Neto、M.Cristo、P.B.Golgher、E.SilvadeMoura在巴西的萨尔瓦多2005年8月15~19日ProceedingsSIGIR’05的“ImpedanceCouplinginContent-targetedAdvertising”中已经证明在网页与广告之间趋向于存在词汇失配。已经建议可以通过考虑补充信息来改进广告的选择,诸如具有到广告的超链接的网页的信息。提出的另一方法是首先基于从原始网页导出的术语(term)来执行网页搜索。从通过搜索提供的网页提取进一步的术语,并然后在选择广告时使用这些附加术语。然而,虽然此类方法可以改进广告与用户内容的匹配,但是其趋向于最适合于基于服务器的匹配,在基于服务器的匹配中,可以缓存许多网页以辅助匹配处理。事实上,该方法趋向于不太适合于资源受限设备,诸如移动电话或机顶盒。事实上,该方法将要求大量计算和储存资源和/或将趋向于是缓慢且不切实际的。例如,对于重复地执行搜索的移动电话而言,使用标准在线网页搜索工具将导致非常慢的处理。此外,对于便携式设备而言,用于检索和处理搜索结果的通信和资源要求趋向于过度。
此外,现有方法趋向于导致关联内容的次优选择,并且期望的是改进关联内容与单独用户和消费内容的匹配的准确度。
而且,在一些***中,可能期望连同从远程服务器接收到的内容一起提供本地地存储的关联内容。例如,内容服务提供商可能希望提供较便宜(或免费)的内容服务作为用户接受呈现的广告的回报。这些广告可以被本地地缓存在用户的设备上,并且设备从本地地缓存的那些广告中自主地选择适当的广告。此类方法可以提供很多优点,包括例如减少对远程服务器的负载和要求并允许用户具有能够与多个不同的在线应用和服务一起使用的单个简档。然而,其要求对用户设备本身执行关联内容匹配,从而要求一种适合于资源受限设备的方法。
因此,用于选择关联内容项目的改进方法将是有利的,并且特别地,允许改进灵活性、改进内容项目选择、减少资源使用、改进对资源受限设备的适用性、促进实现和/或改进性能的***将是有利的。
发明内容
因此,本发明寻求优选地单独或以任何组合方式减轻、缓解或消除上述缺点中的一个或多个。
根据本发明的一方面,提供了一种选择内容项目的方法,该方法包括:提供多个关联术语集合,所述多个关联术语集合中的每个关联术语集合包括表征内容项目组中的内容项目的术语集合;提供语义图集合,所述语义图集合中的每个语义图包括与术语相对应的节点和与由边缘连接的节点的术语之间的关系相对应的边缘;提供搜索术语集合,该搜索术语集合包括表征第一内容项目的术语;响应于所述语义图集合的第一语义图,扩展所述搜索术语集合以生成已扩展术语集合;确定已扩展术语集合与所述多个关联术语集合中的每一个之间的相似性度量;以及响应于所述相似性度量,从所述内容项目组中选择用于所述第一内容项目的关联内容项目。
在许多实施例中,本发明可以允许改进和/或促进对与第一内容项目相关联的内容项目的选择。特别地,在考虑比直接从第一内容项目可获得的术语集合更大的术语集合的情况下,通过匹配可以实现对关联内容项目与第一内容项目的改进的匹配。此外,术语集合的扩展可以适于特定内容项目和/或用户的偏好,由此改进关联内容项目的选择方面的准确度。
本发明对于资源受限设备或情形中的管理内容项目的选择而言可能是特别有利的。具体地,可以使用语义图来实现对降低术语扩展的资源的要求。特别地,对语义图的通信和储存资源要求趋向于是低的,由此改进用于分发和存储语义图数据的适用性。所述方法可以特别地适合于具有大量诸如移动电话或其它便携式设备的低资源设备的***。
此外,在许多实施例中,本发明可以允许改进对用户偏好的适应性,因为语义图能够容易地适于单独用户,由此提供个性化术语扩展,导致改进所选关联内容项目的个性化。
根据本发明的另一方面,提供了一种内容设备,该内容设备包括:关联术语处理器,所述关联术语处理器用于提供多个关联术语集合,所述多个关联术语集合中的每个关联术语集合包括表征内容项目组中的内容项目的术语集合;接收机,所述接收机用于从远程服务器接收语义图集合,该语义图集合中的每个语义图包括与术语相对应的节点和与由边缘连接的节点的术语之间的关系相对应的边缘;搜索术语处理器,所述搜索术语处理器用于提供搜索术语集合,该搜索术语集合包括表征第一内容项目的术语;扩展处理器,所述扩展处理器用于响应于语义图集合的第一语义图来扩展搜索术语集合以生成已扩展术语集合;相似性处理器,所述相似性处理器用于确定已扩展术语集合与所述多个关联术语集合中的每一个之间的相似性度量;以及选择处理器,所述选择处理器用于响应于相似性度量来从所述内容项目组中选择内容项目。
根据本发明的另一方面,提供了一种包括如上文所定义的内容设备的通信***。
本发明的这些及其它方面、特征和优点根据在下文中描述的(一个或多个)实施例将是显而易见的,并将参考下文中描述的(一个或多个)实施例对其进行阐明。
附图说明
将仅以示例的方式参考附图来描述本发明的实施例,在附图中
图1是图示根据本发明的一些实施例的通信***的元件的示例;
图2是图示语义图的示例;
图3是图示根据本发明的一些实施例的内容设备;
图4是图示根据本发明的一些实施例的选择关联内容的方法的示例;
图5是图示根据本发明的一些实施例的生成语义图的方法的示例;以及
图6是图示根据本发明的一些实施例的扩展术语集合的方法的示例。
具体实施方式
以下说明集中于可应用于选择用于诸如文本文档、网页、以及音乐剪辑的内容项目的广告的本发明的实施例。然而,将理解,本发明不限于此应用,而是可以应用于许多其它类型的内容项目。
图1图示了用于向能够消费内容的内容设备101分发内容的通信***。在特定示例中,内容设备101是能够向用户呈现内容的移动蜂窝式设备,包括向用户呈现视频剪辑、音乐剪辑、文本文档和网页。
在该示例中,由耦合到通信网络的内容服务器103来提供内容,所述通信网络在本特定示例中是互联网105。互联网105经由基站109耦合到支持内容设备101的蜂窝式***107。蜂窝式通信***107可以例如是全球移动通信***或通用移动电信***。
在该***中,内容设备101能够访问内容服务器103以检索内容项目。内容项目可以例如是音乐剪辑、视频剪辑、文本文档、网页、电子邮件、短消息服务消息等。在该***中,内容项目具有使用文本数据来表征内容项目的关联表征数据。例如,内容项目可以具有包括表征内容的各种关键字的关联元数据。在一些示例中,内容项目本身可以包括可以被直接用作表征数据的文本数据。例如,网页的文本可以被提取并用作表征数据。
将理解,虽然图1为了简单和清楚起见仅图示了单个内容服务器103,但是该***可以包括很多内容服务器,从该内容服务器,可以向内容设备101提供内容项目。例如,在网页冲浪期间,可以从不同的服务器提供单独的网页。
在该示例中,内容设备101还可以从广告服务器111接收内容项目。在该示例中,广告服务器111被耦合到蜂窝式通信***107并由独立于内容服务器103的任何运营商的蜂窝式网络运营商来操作。由广告服务器111提供的内容项目并不意图由内容设备101的用户来单独地选择,而是意图与来自内容服务器103的用户选择内容项目自动地相关联。因此,意图在没有任何特定用户选择的情况下由内容设备101来自动地呈现广告。在该示例中,由内容设备101来选择关联内容项目,使得它们与用户选择的内容项目相匹配,并且具体地,使得它们与内容设备101当前正在呈现的内容项目相匹配。
在该特定示例中,关联内容项目是广告,但是将理解,在其它实施例中,关联内容项目可以是其它类型的内容项目,诸如提供与正在呈现的内容项目有关的附加背景信息的内容项目(例如可以呈现用于当前正在呈现的歌曲的演唱者的唱片分类目录)。
在该示例中,广告与基于文本的表征数据相关联。表征数据可以例如是表征内容项目的基于文本的元数据。元数据可以由广告服务器111通过应用于基于文本的内容的关键字提取处理来生成,所述基于文本的内容诸如广告本身中的超链接页面。这可以提供内容设备101在使广告和用户选择的内容匹配时能够使用的附加信息。在线广告常常超链接至使得用户能够获得更多信息或进行购买的网页,并且此网页因此将通常包括对表征广告有用的文本。
因此,在图1的***中,内容设备101可以自动地选择由蜂窝式网络运营商提供的广告,以使从完全独立于蜂窝式网络运营商的内容源提供的用户选择内容和蜂窝式***本身相匹配。
此外,该***通过使用能够容易地发射到并存储在单独的资源受限内容设备上的补充域特定数据来改进用户选择内容项目和广告的匹配。以一个或多个语义图的形式来提供此数据,所述语义图具有作为术语(诸如关键字)的节点和具有表示由边缘链接的节点之间的关联强度的值的边缘(节点之间的链路)。
在图1的***中,内容设备101从内容服务器103检索所选内容项目,并且此外接收用于所选内容项目的基于文本的表征数据。另外,内容设备101从广告服务器111接收广告以及描述广告的基于文本的表征数据。基于文本的表征数据包括描述内容的术语集合,诸如关键字集合。另外,广告服务器111提供关于不同主题的多个语义图。
然后,内容设备101继续使用语义图来扩展用于所选内容项目的术语集合。这得到已扩展术语集合,其通常包括提供与所选内容项目有关的有用信息的附加术语。然后,内容设备101使用已扩展术语集合来找到可以连同所选内容项目一起呈现给用户的一个或多个匹配广告。例如,当用户选择了特定网页时,还可以呈现由蜂窝式网络运营商提供的一个或多个广告。这些广告被自动地选择为特别地与用户当前正在浏览的网页有关。
语义图是具有与术语(每个术语包括一个或多个字)相对应的节点的连接网络形式的数据结构。在图2中示出了此类图的两个(简化)示例(一个对应于乐队“黑眼豆豆(BlackEyedPeas)”的主题且另一个对应于外出就餐的主题)。由广告服务器111来提供用于多个主题中的每一个的语义图。如稍后将描述的,可以例如通过处理文本文档的适当训练集合(离线或在线)来逐渐地构建每个语义图。利用这些主体内的术语的共现来构建术语的连接网络。图节点组成文本术语的表示,并且图边缘表达图中的术语之间的关系(在共现的意义上)。
在特定示例中,为语义图的每个节点存储的属性是:术语的词元(串值)、训练文档中的术语频率(反映术语在每个文档中出现的频率的数值)、训练集合中的术语的文档频率(反映呈现术语的训练集合的文本文档的数目的数值)、以及术语类型(例如,术语是名词、命名实体(即人、地点、机构等)或形容词)。
图的每个边缘连接两个节点/术语并且指示这些术语在训练集合中以适当的文本关系共现(例如取决于术语的类型、它们是在相同句子中还是相同文档中出现)。边缘可以具有反映认为链接或关联术语的密切程度的边缘值。例如,边缘值可以指示术语的共现的次数(例如在句子中或在文档中)。
作为示例,对于给定内容项目而言,内容设备可以具体地使用以下步骤来选择适当的广告:
●主题分类:可以将内容项目分类为与特定主题有关,并且可以选择与此主题相对应的语义图。
●基于图的扩展:使用所选语义图来扩展具体地可以与用于内容项目的表征数据的术语相对应的搜索术语集合。具体地,可以从语义图中选择附加术语并将其添加到搜索术语集合以生成已扩展术语集合。
●相似性计算:生成用于广告的术语集合与已扩展术语集合之间的相似性的计算。
●广告选择:根据相似性值来选择一个或多个广告。具体地,可以选择具有最高相似性值的(一个或多个)广告。
因此,通过执行表征用户选择内容项目的术语集合的扩展,使用语义图来改进用户选择内容项目与广告之间的匹配的准确度。这允许已扩展术语集合提供所选内容项目的更准确和多样的表征。例如,如果用于用户选择内容项目的原始搜索术语包括用于特定团队运动和该运动的特定运动员的术语,则该扩展可能导致添加识别运动员的当前团队的术语,即使其未被包括在原始术语集合中。
而且,语义图提供表示用于特定主题或域的术语配置的简洁表示(即,术语及其之间的关联)。因此,可以利用相对低的资源使用来传输和处理图,并且因此该方法对于资源受限设备和资源受限通信***而言是非常有利的。此外,语义图非常适合于被动态地更新以反映单独用户的特定偏好和特性。此更新可以例如基于用户的内容消费并具体地基于由用户选择的内容的特性。因此,最后,语义图不仅可以表示主题的语义表示,而且可以表示用于该主题的用户的特定偏好。
该方法的基本益处是语义图简洁得足以跨越诸如蜂窝式通信***的受限资源网络进行发射,同时包含足够的信息来显著地改进自动选择的广告的相关性。
图3图示了内容设备101的元件的示例,并且图4图示了选择关联内容项目(诸如广告)的方法的示例。该方法可以由内容设备101来执行并将参考图3来进行描述。
内容设备101包括能够通过蜂窝式通信***107的空中接口与基站107通信的收发信机301。收发信机301具体地能够与内容服务器103和广告服务器111通信。收发信机301被耦合到能够从内容服务器103检索诸如网页的内容项目的内容呈现处理器303。此外,内容呈现处理器303能够经由适当的用户界面(未示出)向用户呈现所接收到的内容项目。
此外,内容设备101包括能够存储从广告服务器111下载的广告集合的关联内容储存器305。内容设备101还包括关联内容下载控制器307,关联内容下载控制器307被耦合到收发信机301和关联内容储存器305并被布置为访问广告服务器111以下载广告集合。
另外,关联内容下载控制器307以用于每个下载广告的术语集合的形式下载表征数据。每个广告术语集合包括表征广告的一个或多个术语集合。在一些实施例中,关联内容下载控制器307还可以下载用于尚未被下载到内容设备101的广告的术语集合,从而允许内容设备101选择从广告服务器111可获得、但尚未被下载到内容设备101本身的广告。如果选择了此类广告,则内容设备101可以继续从广告服务器111对其进行检索。
关联内容下载控制器307被耦合到关联术语处理器309,其中,存储了用于广告的术语集合。因此,关联内容下载控制器307和关联术语处理器309执行步骤401,在步骤401中,广告术语集合被存储在内容设备处。
此外,内容设备101包括语义图处理器311,语义图处理器311被耦合到收发信机301并能够从远程服务器接收语义图集合,所述远程服务器在本特定示例中是提供广告的同一服务器,即广告服务器111。所接收到的语义图中的每个包括与术语相对应的节点和与由边缘连接的节点的术语之间的关系相对应的边缘。
因此,收发信机301和语义图处理器311执行存储语义图集合的步骤403。将理解,语义图集合通常包含多个语义图,但是在一些实施例中其可以仅包括单个语义图。
此外,内容设备101包括搜索术语处理器313,搜索术语处理器313被耦合到内容呈现处理器303。当选择、检索、接收、和/或由内容呈现处理器303呈现新内容项目时,搜索术语处理器313可以从内容呈现处理器303接收指示应当针对内容项目选择一个或多个适当广告的命令。在这种情况下,搜索术语处理器309继续执行步骤405,在步骤405中,生成用于内容项目的搜索术语集合。搜索术语集合包括表征内容项目的术语,并且可以具体地通过简单地从表征内容项目的元数据提取所有关键字来生成。在内容项目是文本文档(诸如网页)的其它示例中,搜索术语处理器313可以例如通过本领域技术人员将已知的自然语言处理从实际文本提取关键字。
搜索术语处理器313被耦合到扩展处理器315,扩展处理器315进一步被耦合到语义图处理器311。扩展处理器315接收来自搜索术语处理器313的搜索术语集合和来自语义图处理器311的语义图集合。然后,扩展处理器317继续执行步骤407,在步骤407中,通过基于至少一个语义图来扩展搜索术语而生成已扩展术语集合。
将理解,如果语义图集合包括不止一个图,则可以选择可用语义图中的一个(或者可能是多个)。例如,可以确定用于当前内容项目的主题,并且可以选择相应的语义图。
因此,利用来自用户的语义图集合的相关术语来扩展表征内容项目的元数据。具体地,给定当前内容的主题,可以添加表示高度相关术语的新术语。此外,如果已经针对特定用户定制了语义图,则该扩展还可以具体地添加鉴于用户的特定个人兴趣和偏好而相关的术语。
扩展处理器315被耦合到被馈送已扩展术语集合的相似性处理器317。此外,相似性处理器317被耦合到关联术语处理器309,关联术语处理器309提供用于可用广告的存储术语集合。然后,相似性处理器317继续执行步骤409,在步骤409中,确定已扩展术语集合与每个广告术语集合之间的相似性度量。因此,相似性处理器317生成指示已扩展术语集合和用于存储广告的每个术语集合相匹配的良好程度的相似性值。
相似性处理器317被耦合到选择处理器319,选择处理器319继续执行步骤411,在步骤411中,响应于相似性度量来选择存储广告中的广告。作为简单示例,选择处理器319可以简单地选择具有最高相似性值的广告。
在一些实施例中,选择处理器319还可以被布置成响应于用户偏好简档来选择(一个或多个)广告。
将理解,在不同的实施例中可以不同地处理所选广告。在特定示例中,选择处理器319被耦合到关联内容储存器305和内容呈现处理器303,并且被布置成从关联内容储存器305提取所选(一个或多个)广告并将该(一个或多个)广告提供给内容呈现处理器303,内容呈现处理器303然后继续连同所选内容项目一起将其呈现给用户。
因此,如前所述,提供了一种用于针对用户选择内容项目来选择适当关联内容项目的非常有利的方法。该方法特别地非常适合于资源受限设备和通信***并改进了广告选择的准确度。
在下文中,将更详细地描述各种方面、考虑和特征。
在特定***中,由广告服务器111来生成用于多个主题的初始语义图并将其传送到内容设备101。在图5中图示了广告服务器111用来生成语义图的方法。
该方法在步骤501开始,在步骤501中,提供训练内容项目集合。训练内容项目可以具体地是已知与特定主题相关联的文本文档集合,对于所述特定主题而言,生成了语义图。该训练内容项目集合可以例如是手动地收集的文本文档(诸如网页)。作为另一示例,训练内容项目集合可以例如被生成为使用特定搜索准则找到且与特定主题相关的网页。
步骤501后面是步骤503,在步骤503中生成术语集合。具体地,广告服务器111可以从文本文档提取相关词语。作为特定示例,如技术人员将已知的,可以使用解析和自然语言处理来处理包括网页文档的训练集合。结果可以是文本段集合(网页文档可以根据其结构由不止一个文本段组成),其中,每个文本段由指示例如词语类型(名词、副词、命名实体等)的句子和关联信息的集合组成。然后,广告服务器111可以提取这些文本段中的术语(以及具体地词语)。因此,在步骤503中,生成包括从训练内容项目提取的术语的术语集合。
将理解,在一些实施例中,训练内容项目不一定是文本文档。例如,训练内容项目可以是具有基于关联文本的元数据的视频剪辑,并且在步骤503中生成的术语集合可以对应于从元数据提取的术语。
步骤503后面是步骤505,在步骤505中,广告服务器111继续生成用于语义图的节点。节点中的每个将对应于在步骤503中生成的术语集合中的术语。在本示例中,在步骤505中为术语集合中的每个术语生成节点。这可能导致在本示例中稍后将被删除的大语义图。然而,将理解,在一些实施例中,可以在步骤505中从术语的子集仅生成节点,例如通过在同一步骤中将节点生成和稍后描述的删除整合(即,步骤505还可以包括如稍后将描述的删除语义图的步骤509)。
在该特定示例中,广告服务器111生成用于每个名词、命名实体、和伴随名词的形容词的节点。此外,生成节点值,其包括:术语词元(串值)、训练文档中的术语频率(数值)、训练集合中的术语的文档频率(数值)、和术语类型(例如,术语是名词、命名实体还是形容词)。对于已为其创建节点的术语而言,更新节点值(具体地,可以修改术语频率和文档频率)。
步骤505后面是步骤507,在步骤507中,为语义图生成边缘。基于训练集合中的术语的共现来生成边缘。此外,对于连接两个节点的每个已生成边缘而言,计算边缘值。该边缘值指示与两个节点相对应的两个术语之间的关联的强度。具体地,将边缘值计算为指示用于两个节点的术语的共现频率。
特别地,创建以下的边缘:
●两个名词之间或名词与命名实体之间的句子中的所有共现。
●名词和相邻形容词之间的所有共现。
●训练文档中的两个命名实体之间的所有共现。
此外,将边缘值确定为存储这些共现中的每一个的数目的合成值。
虽然在一些实施例中,可以直接使用得到的图,但图5的示例性方法进一步包括步骤509,在步骤509中进一步删除图。在许多情形下,这可以得到改进的广告选择。事实上,对于大语义图而言,可能得到更加不精确的结果,因为具有许多术语和连接的大图通常将表示“语言学”噪声的基本程度。此外,可以通过减小语义图的尺寸来基本上降低通信资源要求、以及对内容设备101的存储器和处理资源要求。
因此,在本示例中,步骤507后面是步骤509,在步骤509中,连同关联边缘一起从图去除在步骤505中生成的许多节点。
具体地,如果用于节点的术语的已确定术语频率值低于给定阈值,或者如果用于节点的术语的文档频率值低于给定阈值,则广告服务器101可以去除节点。
具体地,可以基于对图中的这些值的统计来确定用于术语频率值和文档频率值两者的下阈值(例如,可以去除具有低于平均术语频率值的术语频率值的所有节点,并且可以去除具有低于平均文档频率的50%的文档频率值的所有节点)。
另外或替代地,广告处理器111可以去除与存在于比给定数目多的语义图中的术语相对应的节点。
这种方法可以允许通过识别存在于多个语义图中的术语来进行跨主题删除。此类术语将趋向于是具有不太具体的主题相关性并因此不大可能会帮助在广告之间进行选择的一般术语。其例外情况可以是针对在一个主题(例如高术语频率)中普遍但在其它主题(例如低术语频率)中无意义的术语而言,并且可以对删除进行修改以将其考虑在内。
另外或替代地,广告处理器111可以响应于第一术语属于未包括的术语子集的检测来去除与来自第一语义图的第一术语相对应的节点。
具体地,可以预定义未包括命名实体集合(例如“单位”),并且广告服务器111可以去除用于属于此未包括命名实体集合的术语的任何节点和关联边缘。
替代地或另外,广告服务器111可以通过去除一个或多个边缘来删除语义图。具体地,如果用于由边缘连接的节点的术语的共现值低于阈值,则可以去除边缘。
例如,可以基于来自图的共现统计来导出用于两个术语之间的共现的下阈值。如果两个术语之间的共现频率低于该阈值(例如平均共现值),则术语之间的边缘未被包括在已删除图中。此删除准则在减小图尺寸方面是非常有效的,因为趋向于常常存在常常是根据情况的且不指示术语之间的强关系的单个共现。
图6图示可以如何执行图4的步骤407、即可以如何执行术语集合扩展的特定示例。在本示例中,内容设备101存储多个语义图,每个语义图与特定主题有关。因此,当执行步骤407时,内容设备101最初选择将被用于术语集合扩展的语义图。
具体地,内容设备101可以首先确定用于搜索术语集合,即用于表征用户选择内容项目的术语集合的主题。例如,可以将搜索术语集合的术语与已知主题的关键字相比较,并且可以选择已经找到最匹配关键字的主题。然后,内容设备101能够继续选择为此主题存储的语义图。
在图6的示例中,选择一个语义图作为与搜索术语集合最密切相关的语义图。具体地,内容设备可以执行子步骤601,在子步骤601中,确定每个语义图与搜索术语激活之间的术语相似性。此术语相似性反映语义图的术语与搜索术语集合的术语之间的相关性。
作为简单示例,可以简单地将相似性值确定为也作为语义图中的节点存在的搜索术语集合的术语的数目。
作为更准确且复杂的示例,可以将包含术语ti{i=1...N}的图g和搜索术语c的相似性值确定为:
其中:
●count(t∈g)是存在于语义图g中的术语(节点)的总数;
●count(t)是语义图集合中的术语的总数;
●tf(ti)是用于语义图g的术语ti的术语频率;
●deg(ti)是语义图g中的术语ti的程度(用于相应节点的边缘的数目);
●max(tf)是存在于语义图g中的最大术语频率(此值与搜索术语集合无关);以及
●max(deg)是语义图g中的任何节点的最大程度(此值与搜索术语集合无关)。
子步骤601后面是子步骤603,在子步骤603中,内容设备101继续选择语义图以用于扩展。可以简单地将语义图选择为具有最高计算相似性值的语义图。
将理解,对于主题特定语义图而言,这种方法等同于确定用于搜索术语集合的主题并选择与此主题相关联的语义图。
然后,内容设备111继续扩展搜索术语集合以通过包括与搜索术语集合的术语相对应的节点的一些相邻节点的术语来生成已扩展术语集合。
具体地,子步骤603后面是子步骤605,在子步骤605中,选择具有与搜索术语集合的术语相对应的术语的所选语义图的节点的子集。
可以具体地将在步骤605中选择的节点选择为被认为与对于此主题而言特别相关或重要的术语相对应的节点。可以例如在节点值和/或边缘的值中反映此重要性或相关性。
例如,内容设备可以选择术语频率和文档频率高于给定阈值的节点。作为另一示例,可以将内容设备布置成选择固定尺寸的节点子集。例如,可以选择具有最高术语频率的五十个节点。
作为另一示例,仅选择这样的节点,即对于该节点而言,一个边缘具有指示节点的术语与语义图的另一术语之间的共现程度的值,其高于给定阈值。
替代地或另外,可以响应于指示节点术语与多少术语共现的共现程度来选择节点。例如,可以确定节点程度(与连接到节点的边缘的数目相对应),并且内容设备101可以继续仅包括这样的节点,即对于该节点而言,此值高于给定阈值。很多边缘趋向于指示对于给定主题而言非常重要的节点术语,并且因此这种方法可以允许将节点的子集选择为对应于对于特定主题而言重要的术语。
子步骤605后面是子步骤607,在子步骤607中,为在子步骤605中确定的节点的子集选择相邻节点集合。可以认为相邻节点是由语义图的边缘连接到节点子集中的节点的节点。
将理解,在一些实施例中,相邻节点集合可以包括与在子步骤605中确定的节点子集中的节点相邻的所有节点。然而,这可能导致包括对于主题而言可能不是非常重要的许多术语,并且在本特定示例中,响应于用于相邻节点的节点值和边缘值中的至少一个来执行要包括相邻节点集合中的节点选择。
具体地,仅当用于节点的术语频率值、文档频率值和共现值中的至少一个满足准则时,才包括节点。该准则可以要求该值在阈值之上,从而导致仅当术语在语义图中具有足够重要性时才包括节点。
替代地或另外,仅当相邻节点足够密切地与原始搜索术语的术语相关时才可以包括相邻节点。该选择可以具体地要求在步骤605中确定的子集的节点的相邻节点的边缘具有超过阈值的值。因此,仅当术语之间的共现值高于给定值时才可以包括相邻节点。
子步骤607后面是子步骤609,在子步骤609中,向原始搜索术语集合的术语添加相邻节点的一个或多个术语以生成已扩展术语集合。将理解,在一些实施例中,与相邻节点相对应的所有术语将被包括在已扩展术语集合中。然而,在其它实施例中,将仅包括一些相邻术语。
作为特定示例,内容设备101可以首先确定在两个节点之间的第一语义图中的边缘连接,所述两个节点与存在于已扩展术语集合中的术语相对应。因此,在步骤609中,内容设备首先确定对于被连接到已扩展术语集合的另一节点的已扩展术语集合的每个节点而言(即对于包含在步骤605中确定的节点的子集和在步骤607中确定的相邻节点的一组节点而言)存在多少边缘。
具体地,可以基于已扩展术语集合的术语相互共现的频率来将已扩展术语集合分类。
然后,内容设备101可以继续根据这些边缘连接来选择被包括在最后扩展术语集合中的相邻节点的术语。例如,可以仅包括固定数目的扩展术语,并且其可以选自相邻节点的术语作为与搜索术语集合的其它术语和其它相邻节点的术语的具有最高数目的共现的术语。此类方法可以导致更一致的扩展和对于特定内容项目而言特别重要的术语选择。
具体地计算在步骤409中计算的相似性度量以反映已扩展术语集合的术语与表征单独广告的术语集合的术语之间的相关程度。
该计算可以例如基于余弦相似性,诸如:
其中,termsC和termsExp分别表示扩展术语集合和搜索术语集合,并且termsAd表示表征单独广告的术语集合。术语集合被表示为包含单独术语作为分量的向量。乘法算子指示与∑ti相对应的运算,其中,ti在术语相同的情况下具有值1且在不相同的情况下具有值零,并且|terms|指示在术语集合中术语的数目。
然后,可以将用于内容C和广告Ad的相似性值计算为:
sim(C,Ad)=Min(cos(termsC,termsAd)+cos(termsExp,termsAd),1.0)
然后,内容设备101可以选择广告,对于该广告而言,计算了最高相似性值。
在一些实施例中,内容设备可以被布置成响应于由用户选择的内容项目的特性来修改语义图中的一个或多个。例如,当用户选择了特定内容项目时,可以使用于此内容项目的表征数据(例如从文本内容项目提取的关联元数据或文本)与语义图的术语相关联并用来更新该图。修改可以例如向语义图添加或去除节点和/或可以例如修改图的节点值或边缘值。
因此,在该***中,最初在服务的初始化时从广告服务器111下载用于多个主题的通用语义图。因此,最初将由广告服务器111构造的默认语义图集合传送到预订服务的新内容设备。然而,基于例如从消费内容提取的元数据,内容设备可以更新图结构,使得随着时间的推移,每个内容设备101将具有更好地反映用户的个人兴趣和偏好的单独图集合。
在该***中,每当用户消费新内容时,就更新在内容设备101中存储的语义图。具体地,更新处理可以类似于在由广告服务器111进行的默认图构造期间采用的处理。因此,每当在所选内容项目中检测到语义图的术语时,就可以增加术语频率或文档频率。同样地,还可以检测两个术语之间的共现,并且其用来增加用于连接与这两个术语相对应的两个节点的边缘的边缘值。此外,以固定的间隔,可以针对图来计算新的统计并用来删除图。例如,术语频率可以随时间而变,并且可以导致术语频率落在给定阈值以下,从而相应的节点被去除。而且,如果检测到新术语,则可以将其添加到语义图。
为了增加适应的初始速度,应用于节点值或边缘值的修改值可以随着时间而降低,使得其最初基本上更强。例如,当更新术语频率、文档频率或共现值时,可以使用临时衰减因数。用d来表示修改的值,可以例如将该修改给定为:
其中,t是内容消费的时间且t0是零时间点(例如接收到默认语义图的时间)。α是可以被设置为得到期望更新速度的设计常数。
将理解,语义图的修改和用户适应可以得到基本上改进的术语集合扩展和因此的广告选择。特别地,语义图的个性化可以提供用于选择使当前选择内容项目以及用户的一般偏好相匹配的广告的非常高效且复杂性低的手段。
在一些实施例中,还可以使用已修改语义图来选择由内容设备评估的总的可用广告的子集。特别地,在该示例中,内容设备101可以从已被存储在内容设备101本身上的一组广告中选择要呈现的广告。然而,此外,可以响应于已更新语义图来选择内容项目组。特别地,可以基于已修改图中的一个或多个来选择从广告服务器111下载的广告。因此,可以使用已修改图来执行用于从广告服务器111可获得的广告的第一级过滤。
将理解,以上描述出于清楚的目的已参考不同的功能单元和处理器描述了本发明的实施例。然而,将显而易见的是,在不违背本发明的情况下可以使用不同功能单元或处理器之间的功能的任何适当分布或功能。例如,可以由相同的处理器或控制器来执行被图示为由单独处理器或控制器执行的功能。因此,对特定功能单元的参考仅应当被视为对用于提供所描述的功能的适当手段的参考,而不是指示严格的逻辑或物理结构或组织。
可以以包括硬件、软件、固件或其任何组合的任何适当形式来实现本发明。可以可选地将本发明至少部分地实现为在一个或多个数据处理器和/或数字信号处理器上运行的计算机软件。可以以任何适当方式在物理上、功能上和逻辑上实现本发明的实施例的元件和组件。事实上,可以在单个单元中、在多个单元中或作为其它功能单元的一部分来实现所述功能。同样地,可以在单个单元中实现本发明,或者可以在物理上和功能上将其分配在不同的单元和处理器之间。
虽然已经结合一些实施例描述了本发明,但其并不意图局限于本文所阐述的特定形式。相反,仅仅由权利要求来限制本发明的范围。另外,虽然可能看起来结合特定实施例描述了特征,但本领域的技术人员将认识到根据本发明可以将所描述的实施例的各种特征组合。在权利要求中,术语包括不排除其它元件或步骤的存在。
此外,虽然被单独地列出,但是可以由例如单个单元或处理器来实现多个装置、元件或方法步骤。另外,虽然单独特征可以被包括在不同权利要求中,但这些可以被有利地组合,并且在不同权利要求中的包括并不暗示特征的组合是不可行和/或有利的。而且,权利要求的一个种类中的特征的包括并不暗示局限于此类别,而是指示该特征根据情况同样地适用于其它权利要求类别。此外,权利要求中的特征的顺序并不暗示必须起作用的特征的任何特定顺序,并且特别地,方法权利要求中的单独步骤的顺序并不暗示必须按照此顺序来执行步骤。相反,可以按照任何适当的顺序来执行这些步骤。
Claims (10)
1.一种选择内容项目的方法,所述方法包括:
提供多个关联术语集合,所述多个关联术语集合中的每个关联术语集合包括表征内容项目组中的内容项目的术语集合;
提供语义图集合,所述语义图集合中的每个语义图包括与术语相对应的节点和与由边缘连接的节点的术语之间的关系相对应的边缘;
提供搜索术语集合,所述搜索术语集合包括表征用户选择的内容项目的术语;
响应于所述语义图集合的第一语义图,扩展所述搜索术语集合,以生成已扩展术语集合;
确定所述已扩展术语集合与所述多个关联术语集合中的每一个关联术语集合之间的相似性度量;以及
响应于所述相似性度量,从所述内容项目组中选择用于所述用户选择的内容项目的关联内容项目。
2.根据权利要求1所述的方法,其中,扩展所述搜索术语集合的步骤包括:
选择具有与所述搜索术语集合中术语相对应的术语的所述第一语义图的节点的子集;
选择用于所述节点子集中节点的相邻节点的集合;以及
将所述相邻节点的至少一些术语包括在所述已扩展术语集合中。
3.根据权利要求2所述的方法,其中,选择所述节点的子集的步骤包括:响应于所述搜索术语集合中的术语的共现程度,进一步选择所述节点的子集。
4.根据权利要求2所述的方法,其中,选择所述节点的子集的步骤包括:响应于节点值和边缘值中的至少一个,进一步选择所述节点的子集。
5.根据权利要求2所述的方法,其中,选择所述相邻节点的集合的步骤包括:响应于用于相邻节点的节点值和边缘值中的至少一个,选择所述相邻节点的集合。
6.根据权利要求2所述的方法,进一步包括:确定在属于包括所述相邻节点的子集的组的节点和与所述搜索术语集合中的术语相对应的节点之间的所述第一语义图中的边缘连接;以及
响应于所述边缘连接,选择要被包括在所述已扩展术语集合中的所述相邻节点的术语。
7.根据权利要求1所述的方法,进一步包括:
确定所述语义图集合中的每个语义图与所述搜索术语集合之间的术语相似性,用于语义图的所述术语相似性反映所述语义图的术语与所述搜索术语集合的术语之间的相关性;以及
响应于所述术语相似性,选择所述第一语义图。
8.根据权利要求1所述的方法,其中,所述语义图集合中的每个语义图与主题相关联,并且所述方法进一步包括:
确定与所述搜索术语集合相关联的搜索主题;以及
响应于所述搜索主题,选择所述第一语义图。
9.根据权利要求1所述的方法,其中,所述用户选择的内容项目是文本内容项目,并且所述方法进一步包括:生成所述搜索术语集合,以包括所述文本内容项目的文本术语。
10.一种内容设备,包括:
关联术语处理器,所述关联术语处理器用于提供多个关联术语集合,所述多个关联术语集合中的每个关联术语集合包括表征内容项目组中的内容项目的术语集合;
接收机,所述接收机用于从远程服务器接收语义图集合,所述语义图集合中的每个语义图包括与术语相对应的节点和与由边缘连接的节点的术语之间关系相对应的边缘;
搜索术语处理器,所述搜索术语处理器用于提供搜索术语集合,所述搜索术语集合包括表征用户选择的内容项目的术语;
扩展处理器,所述扩展处理器用于响应于所述语义图集合的第一语义图来扩展所述搜索术语集合,以生成已扩展术语集合;
相似性处理器,所述相似性处理器用于确定所述已扩展术语集合与所述多个关联术语集合中的每一个关联术语集合之间的相似性度量;以及
选择处理器,所述选择处理器用于响应于所述相似性度量来从所述内容项目组中选择内容项目。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB0817170A GB2463669A (en) | 2008-09-19 | 2008-09-19 | Using a semantic graph to expand characterising terms of a content item and achieve targeted selection of associated content items |
GB08/171,70.4 | 2008-09-19 | ||
PCT/US2009/054722 WO2010033346A2 (en) | 2008-09-19 | 2009-08-24 | Selection of associated content for content items |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102160079A CN102160079A (zh) | 2011-08-17 |
CN102160079B true CN102160079B (zh) | 2016-05-04 |
Family
ID=39951865
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200980136773.XA Active CN102160079B (zh) | 2008-09-19 | 2009-08-24 | 用于内容项目的关联内容的选择 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8332409B2 (zh) |
CN (1) | CN102160079B (zh) |
GB (1) | GB2463669A (zh) |
WO (1) | WO2010033346A2 (zh) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7958155B2 (en) * | 2007-04-17 | 2011-06-07 | Semandex Networks, Inc. | Systems and methods for the management of information to enable the rapid dissemination of actionable information |
US8271433B2 (en) | 2009-12-30 | 2012-09-18 | Nokia Corporation | Method and apparatus for providing automatic controlled value expansion of information |
US8326861B1 (en) * | 2010-06-23 | 2012-12-04 | Google Inc. | Personalized term importance evaluation in queries |
WO2012001232A2 (en) * | 2010-06-30 | 2012-01-05 | Nokia Corporation | Method and apparatus for in-application purchasing |
US8751487B2 (en) * | 2011-02-28 | 2014-06-10 | International Business Machines Corporation | Generating a semantic graph relating information assets using feedback re-enforced search and navigation |
US9646110B2 (en) | 2011-02-28 | 2017-05-09 | International Business Machines Corporation | Managing information assets using feedback re-enforced search and navigation |
US8775431B2 (en) * | 2011-04-25 | 2014-07-08 | Disney Enterprises, Inc. | Systems and methods for hot topic identification and metadata |
US8620964B2 (en) | 2011-11-21 | 2013-12-31 | Motorola Mobility Llc | Ontology construction |
US9390174B2 (en) | 2012-08-08 | 2016-07-12 | Google Inc. | Search result ranking and presentation |
WO2014066828A1 (en) * | 2012-10-25 | 2014-05-01 | Michael Sharp | Sponsored ad-embedded multimedia files and methods of playback |
US9278255B2 (en) | 2012-12-09 | 2016-03-08 | Arris Enterprises, Inc. | System and method for activity recognition |
US10212986B2 (en) | 2012-12-09 | 2019-02-26 | Arris Enterprises Llc | System, apparel, and method for identifying performance of workout routines |
US8935305B2 (en) | 2012-12-20 | 2015-01-13 | General Instrument Corporation | Sequential semantic representations for media curation |
US8914416B2 (en) * | 2013-01-31 | 2014-12-16 | Hewlett-Packard Development Company, L.P. | Semantics graphs for enterprise communication networks |
US10713261B2 (en) | 2013-03-13 | 2020-07-14 | Google Llc | Generating insightful connections between graph entities |
US9235653B2 (en) * | 2013-06-26 | 2016-01-12 | Google Inc. | Discovering entity actions for an entity graph |
US20150278853A1 (en) * | 2014-04-01 | 2015-10-01 | DoubleVerify, Inc. | System And Method For Identifying Hidden Content |
US10601749B1 (en) | 2014-07-11 | 2020-03-24 | Twitter, Inc. | Trends in a messaging platform |
US10592539B1 (en) | 2014-07-11 | 2020-03-17 | Twitter, Inc. | Trends in a messaging platform |
US10146875B2 (en) | 2014-12-19 | 2018-12-04 | International Business Machines Corporation | Information propagation via weighted semantic and social graphs |
US10198471B2 (en) * | 2015-05-31 | 2019-02-05 | Microsoft Technology Licensing, Llc | Joining semantically-related data using big table corpora |
US9946924B2 (en) * | 2015-06-10 | 2018-04-17 | Accenture Global Services Limited | System and method for automating information abstraction process for documents |
CN106354728A (zh) * | 2015-07-16 | 2017-01-25 | 富士通株式会社 | 利用语义图生成对象之间的关联强度的方法和设备 |
US9436760B1 (en) * | 2016-02-05 | 2016-09-06 | Quid, Inc. | Measuring accuracy of semantic graphs with exogenous datasets |
US10078632B2 (en) * | 2016-03-12 | 2018-09-18 | International Business Machines Corporation | Collecting training data using anomaly detection |
US9558265B1 (en) * | 2016-05-12 | 2017-01-31 | Quid, Inc. | Facilitating targeted analysis via graph generation based on an influencing parameter |
US10939187B1 (en) * | 2016-08-11 | 2021-03-02 | Amazon Technologies, Inc. | Traversing a semantic graph to process requests for video |
US9715495B1 (en) * | 2016-12-15 | 2017-07-25 | Quid, Inc. | Topic-influenced document relationship graphs |
US20180012266A1 (en) * | 2017-03-01 | 2018-01-11 | Kunal Joshi | Computer implemented methods and systems for comprehensively identifying declined services from service write up records |
CN108921918B (zh) * | 2018-07-24 | 2023-05-30 | Oppo广东移动通信有限公司 | 视频创建方法及相关装置 |
US11263277B1 (en) * | 2018-11-01 | 2022-03-01 | Intuit Inc. | Modifying computerized searches through the generation and use of semantic graph data models |
US11366967B2 (en) * | 2019-07-24 | 2022-06-21 | International Business Machines Corporation | Learning roadmaps from unstructured text |
US20220156299A1 (en) * | 2020-11-13 | 2022-05-19 | International Business Machines Corporation | Discovering objects in an ontology database |
US20220309100A1 (en) * | 2021-03-26 | 2022-09-29 | EMC IP Holding Company LLC | Automatic Discovery of Related Data Records |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1752966A (zh) * | 2004-09-24 | 2006-03-29 | 北京亿维讯科技有限公司 | 使用本体论和用户查询处理技术解决问题的方法 |
CN1882943A (zh) * | 2003-10-09 | 2006-12-20 | 雅虎公司 | 使用超单元的搜索处理的***和方法 |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040243529A1 (en) * | 1996-03-25 | 2004-12-02 | Stoneman Martin L. | Machine computational-processing systems for simulated-humanoid autonomous decision systems |
US6460034B1 (en) * | 1997-05-21 | 2002-10-01 | Oracle Corporation | Document knowledge base research and retrieval system |
US6038560A (en) * | 1997-05-21 | 2000-03-14 | Oracle Corporation | Concept knowledge base search and retrieval system |
US5940821A (en) * | 1997-05-21 | 1999-08-17 | Oracle Corporation | Information presentation in a knowledge base search and retrieval system |
US5953718A (en) * | 1997-11-12 | 1999-09-14 | Oracle Corporation | Research mode for a knowledge base search and retrieval system |
US6993527B1 (en) * | 1998-12-21 | 2006-01-31 | Adobe Systems Incorporated | Describing documents and expressing document structure |
WO2000046701A1 (en) * | 1999-02-08 | 2000-08-10 | Huntsman Ici Chemicals Llc | Method for retrieving semantically distant analogies |
US6311194B1 (en) * | 2000-03-15 | 2001-10-30 | Taalee, Inc. | System and method for creating a semantic web and its applications in browsing, searching, profiling, personalization and advertising |
US7216179B2 (en) * | 2000-08-16 | 2007-05-08 | Semandex Networks Inc. | High-performance addressing and routing of data packets with semantically descriptive labels in a computer network |
US6895406B2 (en) * | 2000-08-25 | 2005-05-17 | Seaseer R&D, Llc | Dynamic personalization method of creating personalized user profiles for searching a database of information |
US7146349B2 (en) * | 2000-11-06 | 2006-12-05 | International Business Machines Corporation | Network for describing multimedia information |
US6678694B1 (en) * | 2000-11-08 | 2004-01-13 | Frank Meik | Indexed, extensible, interactive document retrieval system |
US6678677B2 (en) * | 2000-12-19 | 2004-01-13 | Xerox Corporation | Apparatus and method for information retrieval using self-appending semantic lattice |
EP1402408A1 (en) * | 2001-07-04 | 2004-03-31 | Cogisum Intermedia AG | Category based, extensible and interactive system for document retrieval |
EP1527414A2 (en) * | 2002-02-01 | 2005-05-04 | John R. C. Fairweather | A system and method for managing knowledge |
US7085771B2 (en) * | 2002-05-17 | 2006-08-01 | Verity, Inc | System and method for automatically discovering a hierarchy of concepts from a corpus of documents |
US7249117B2 (en) * | 2002-05-22 | 2007-07-24 | Estes Timothy W | Knowledge discovery agent system and method |
KR20040032260A (ko) * | 2002-10-08 | 2004-04-17 | 전자부품연구원 | 메타데이터를 이용한 광고 디스플레이 장치 및 그 서비스방법 |
GB0225143D0 (en) * | 2002-10-29 | 2002-12-11 | British Telecomm | Conflict detection in rule sets |
US20090012928A1 (en) * | 2002-11-06 | 2009-01-08 | Lussier Yves A | System And Method For Generating An Amalgamated Database |
CA2505514A1 (en) * | 2002-11-06 | 2004-05-27 | Mount Sinai School Of Medicine | Treatment of amyotrophic lateral sclerosis with nimesulide |
CA2536265C (en) * | 2003-08-21 | 2012-11-13 | Idilia Inc. | System and method for processing a query |
WO2005020094A1 (en) * | 2003-08-21 | 2005-03-03 | Idilia Inc. | System and method for associating documents with contextual advertisements |
US7454430B1 (en) * | 2004-06-18 | 2008-11-18 | Glenbrook Networks | System and method for facts extraction and domain knowledge repository creation from unstructured and semi-structured documents |
US7685118B2 (en) * | 2004-08-12 | 2010-03-23 | Iwint International Holdings Inc. | Method using ontology and user query processing to solve inventor problems and user problems |
US20070011155A1 (en) * | 2004-09-29 | 2007-01-11 | Sarkar Pte. Ltd. | System for communication and collaboration |
US20060074980A1 (en) * | 2004-09-29 | 2006-04-06 | Sarkar Pte. Ltd. | System for semantically disambiguating text information |
US7739104B2 (en) * | 2005-05-27 | 2010-06-15 | Hakia, Inc. | System and method for natural language processing and using ontological searches |
US20070156622A1 (en) * | 2006-01-05 | 2007-07-05 | Akkiraju Rama K | Method and system to compose software applications by combining planning with semantic reasoning |
US20080020584A1 (en) * | 2006-03-24 | 2008-01-24 | Shin Hirotsu | Method of manufacturing semiconductor device and plasma processing apparatus |
US20080027798A1 (en) * | 2006-07-25 | 2008-01-31 | Shivkumar Ramamurthi | Serving advertisements based on keywords related to a webpage determined using external metadata |
KR101105173B1 (ko) * | 2006-10-03 | 2012-01-12 | 큐피에스 테크. 리미티드 라이어빌리티 컴퍼니 | 카테고리화를 통해 호스트 투 게스트 콘텐츠를 자동으로 매칭하기 위한 메커니즘 |
US7603348B2 (en) * | 2007-01-26 | 2009-10-13 | Yahoo! Inc. | System for classifying a search query |
US20080243826A1 (en) * | 2007-03-30 | 2008-10-02 | Yahoo! Inc. | System and method for determining semantically related terms |
CA2684397A1 (en) * | 2007-04-25 | 2008-11-06 | Counsyl, Inc. | Methods and systems of automatic ontology population |
US20090037399A1 (en) * | 2007-07-31 | 2009-02-05 | Yahoo! Inc. | System and Method for Determining Semantically Related Terms |
US8086620B2 (en) * | 2007-09-12 | 2011-12-27 | Ebay Inc. | Inference of query relationships |
-
2008
- 2008-09-19 GB GB0817170A patent/GB2463669A/en not_active Withdrawn
-
2009
- 2009-08-24 WO PCT/US2009/054722 patent/WO2010033346A2/en active Application Filing
- 2009-08-24 US US13/060,288 patent/US8332409B2/en not_active Expired - Fee Related
- 2009-08-24 CN CN200980136773.XA patent/CN102160079B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1882943A (zh) * | 2003-10-09 | 2006-12-20 | 雅虎公司 | 使用超单元的搜索处理的***和方法 |
CN1752966A (zh) * | 2004-09-24 | 2006-03-29 | 北京亿维讯科技有限公司 | 使用本体论和用户查询处理技术解决问题的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102160079A (zh) | 2011-08-17 |
US20110179084A1 (en) | 2011-07-21 |
GB2463669A (en) | 2010-03-24 |
WO2010033346A3 (en) | 2010-05-20 |
WO2010033346A2 (en) | 2010-03-25 |
US8332409B2 (en) | 2012-12-11 |
GB0817170D0 (en) | 2008-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102160079B (zh) | 用于内容项目的关联内容的选择 | |
US9652785B2 (en) | System and method for matching advertisements to multimedia content elements | |
US9087049B2 (en) | System and method for context translation of natural language | |
US9235557B2 (en) | System and method thereof for dynamically associating a link to an information resource with a multimedia content displayed in a web-page | |
US9563826B2 (en) | Techniques for rendering advertisements with rich media | |
CN107784059B (zh) | 用于搜索和选择图像的方法和***以及机器可读媒体 | |
US7912868B2 (en) | Advertisement placement method and system using semantic analysis | |
US20130138674A1 (en) | System and method for recommending application by using keyword | |
US11113722B2 (en) | Providing content related to sentiment of product feature | |
CN105453122A (zh) | 上下文移动应用广告 | |
KR20130055577A (ko) | 사용자 활동에 기초한 검색 광고 선택 | |
AU2018250372B2 (en) | Method to construct content based on a content repository | |
CN101273348A (zh) | 结构化数据的导航 | |
CN102722501A (zh) | 搜索引擎及其实现方法 | |
CN104077707B (zh) | 一种推广呈现方式的优化方法和装置 | |
WO2017136295A1 (en) | Adaptive seeded user labeling for identifying targeted content | |
TWI417751B (zh) | Information providing device, information providing method, information application program, and information recording medium | |
JP2009043125A (ja) | ユーザ分類装置、広告配信装置、ユーザ分類方法、広告配信方法およびプログラム | |
US8538946B1 (en) | Creating model or list to identify queries | |
RU2683482C2 (ru) | Метод отображения релевантной контекстно-зависимой информации | |
JP4743766B2 (ja) | 印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラム | |
US10387914B2 (en) | Method for identification of multimedia content elements and adding advertising content respective thereof | |
US20150052155A1 (en) | Method and system for ranking multimedia content elements | |
CN108319622B (zh) | 一种媒体内容推荐方法及装置 | |
US11954168B2 (en) | System and method thereof for dynamically associating a link to an information resource with a multimedia content displayed in a web-page |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C41 | Transfer of patent application or patent right or utility model | ||
C56 | Change in the name or address of the patentee | ||
CP01 | Change in the name or title of a patent holder |
Address after: Illinois State Patentee after: MOTOROLA MOBILITY LLC Address before: Illinois State Patentee before: MOTOROLA MOBILITY, Inc. |
|
TR01 | Transfer of patent right |
Effective date of registration: 20160531 Address after: California, USA Patentee after: Google Technology Holdings LLC Address before: Illinois State Patentee before: MOTOROLA MOBILITY LLC |