CN101821764A - 自动操纵web文档集合 - Google Patents

自动操纵web文档集合 Download PDF

Info

Publication number
CN101821764A
CN101821764A CN200880111437A CN200880111437A CN101821764A CN 101821764 A CN101821764 A CN 101821764A CN 200880111437 A CN200880111437 A CN 200880111437A CN 200880111437 A CN200880111437 A CN 200880111437A CN 101821764 A CN101821764 A CN 101821764A
Authority
CN
China
Prior art keywords
label
webpage
automatically
content
web
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200880111437A
Other languages
English (en)
Other versions
CN101821764B (zh
Inventor
D·C·史蒂文森
O·达布罗斯基
D·特多西
K·伯奇克
P·赛文尼
C·科斯塔凯
E·格兰特
E·奇格曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN101821764A publication Critical patent/CN101821764A/zh
Application granted granted Critical
Publication of CN101821764B publication Critical patent/CN101821764B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Hardware Design (AREA)
  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明的实施例提供一种方法和***,用于自动地操纵诸如网页等web文档的集合以及嵌入经由网页呈现广告内容的结构。该操纵自动地嵌入标签,该标签使得能够跟踪和记录与web文档相关联的使用信息。可以在无需用户干预的情况下自动地修改数百或数千网页,从而使得能够对每一页面执行全面报告和跟踪。分析网页并智能地定位***点。可以验证改变来确保嵌入内容没有得到不合需要的效果。这些标签可以接收根据用户和页面的级别来定制的参数。标签、***信息、以及其他配置信息可以存储在中央储存库中以使得后续加标签更容易。

Description

自动操纵web文档集合
概述
本发明由所附权利要求书来限定,但一般而言,本发明的各实施例包括自动操纵(instrument)文档集合(特别是网页)的***和方法。以下更详细地解释“操纵”,但一般而言,其指的是经由***自定义可执行代码、内容、或广告来修改文档或特定的相关文档集合(如作为电子商务购买过程的一部分的网页集合或网站布局的若干实验变化之一),以使最终用户相对该文档所采取的动作可出于记录、分析、记账、以及其他商务目的而被传输的过程。本发明的实施例可自动操纵任何数量的页面,甚至数百或数千页面。
本发明的其他说明性方面包括:便于智能确认代码***点;评估加标签(***代码)的影响;基于用户输入或配置(包括诸如提供简档id、页面别名/绰号、事件、电子商务变量等技术)来确定标签的参数;使用中央标签储存库(例如142)来维护操纵的完整性(这允许简单地撤消改变);操纵/标记A/B测试和应用于指定文档集合的多变量测试的能力;以及到页面中的、最小化对该页面的负面影响(外观可能改变但功能不变)的内容广告块的***。这些方面的部分列表不应被解释为其他方面不存在的指示。
若干附图的简述
以下将参考附图详细描述本发明的各实施例,附图构成本发明的一部分并通过引用结合于此,并且在附图中:
图1A描绘适合于实施本发明的实施例的说明性操作环境;
图1B-1E描绘根据本发明的一实施例的要嵌入在网页集合中的说明性程序代码;
图2描绘根据本发明的一实施例的“在开头之前***”规则的说明性实现;
图3描绘根据本发明的一实施例的“在开头之后***”规则的说明性实现;
图4描绘根据本发明的一实施例的“在结尾之前***”规则的说明性实现;
图5描绘根据本发明的一实施例的“在结尾之后***”规则的说明性实现;
图6描绘根据本发明的一实施例的源于将词法分析器应用于程序代码的说明性结果;
图7A和图7B描绘根据本发明的实施例的说明性标记方案;
图8A-8M描绘根据本发明的一实施例的用户界面的说明性屏幕截图;
图9描绘根据本发明的一实施例的用于嵌入自定义内容的说明性方法;以及
图10描绘根据本发明的一实施例的、根据安装跟踪脚本的另一实施例的第二方法。
详细描述
如以上简要提到的,本发明的一实施例的各新颖方面之一是将web分析标签自动地***文档(网页,其可包括文本文件、动态可修改文件等)的能力,从而简化将这些标签***到要操纵的每一页面的用户的体验。在一个实施例中,标签采取操纵网页的定界HTML的形式和/或脚本(例如Java脚本等);即允许跟踪与网页相关联的网页使用信息。一些技术人员使用各种术语来捕捉操纵这一概念。例如,“web分析”有时指一些web分析提供者所进行的“网站操纵”。一个说明性web分析提供者是Omniture有限公司(NASDAQ:OMTR,参见omniture.com)。存在许多诸如Omniture的那些的监视服务。执行监视服务不是本发明解决的全部问题。相反,本发明的一方面是关于用监视能力来配备网站或网页集合。直到安装了安全***,否则不能监视家庭安全。尽管许多供应商提供监视服务,但我们的考虑之一类似于安装安全***本身;但以自动化的方式。
对网站的操纵包括将web分析相关脚本***到网页中。这一技术在此将被不同地称为“加标签”,因为***到网页中的是由HTML标签定界的代码部分。加标签不限于***web分析,并且还可包括嵌入内容广告。
因此,本发明的一个方面提供用于操纵网页集合以使用户甚至不必编辑网页的源代码的高效且自动化的方式。通常,网页组成网站,但并不总是如此。因此,在讨论“操纵”或“正在操纵”网页时,意味着指的是用监视网页的使用信息的能力来配备网页。说明性网页使用信息包括关于包含访问事件(人们124与网页交互的方式)等网站访问者124的行为的信息,并可包括关于在网页上点击的对象的信息、关于所查看的文档的信息、所访问的网页、关于从网页下载的下载信息、关于网页上激活的控件的信息、关于用户在网页上交互的项的信息、关于通过网页方式呈现的媒体对象的信息、以及其他信息。这允许网站所有者查看详细示出其网站的使用的各方面的报告和其他展示。
在内容提供者的上下文中实现本发明的各实施例也可适用于商业提供者,因为在页面中嵌入他们的广告并跟踪它们的有效性是合乎需要的。
现在转向图1,提供了适用于实施本发明的实施例的说明性操作环境并由标号110概括参考。如说明性地所示出,各设备彼此直接耦合或通过网络112间接耦合。web服务器114主存包括各个网页的网站116。并非所有网页都被示出。网页中的一部分由标号118来参考。如将在以下更详细地解释的,这些网页中的一些的源代码将被修改以便除其他方面外能跟踪使用信息。
这些修改由具有参考标号120的云来表示。即,云120参考添加到网页118的允许实现诸如跟踪使用信息和提供广告内容等各功能方面的程序代码(加标签结构)。程序代码/标签120的说明性示例在图1B-1E中找到。在某些实施例中,操纵代码120便于网页使用跟踪。在其他实施例中,操纵代码120便于呈现广告内容。
简要地转向图1B-1E,仅呈现标签或可嵌入的自定义内容的示例。句法和格式无疑可以改变。图1B的框160示出web分析标签的第一示例。图1C的框162示出另一示例。图1D示出更抽象的句法,其示出源指示164、类型指示166、用户标识符168、跟踪参考170、以及在该情况下与标识符168相关联的类型指示符172。这些不是仅有的类型的标签,而只是示例。图1E描绘提供要嵌入的对象的视觉信息的说明性广告相关标签。
同样如以下将更详细地解释的,可以增强web服务器114以包括通知客户机122,在一个实施例中,通知客户机122在运行中修改web内容,以便在请求网页时实时地修改该网页以包括在将其呈现给查看者124时呈现的代码120。为简明起见,即使情况实际上是并非所有网页都将被修改,也通过参考标号118来参考网页118。即,在某些情况下,只修改网页中的一部分。
为帮助说明本发明的实施例,假定要操纵网站116。即,网页118将接收嵌入的内容120。本发明的大部分围绕***或嵌入便于监视网页的程序代码120。网站可包括几百或甚至数千页面/文档。本发明的一实施例允许一个自动化的过程检查整个网页集合,智能地确定***代码120而不影响网页在网站上的外观的***点,选择适当的标签,以及将其***到所确定的***点中。
为此,在一个实施例中,用户利用具有运行网络浏览器128的能力的客户机126。我们将客户机126称为用户126,因为它是用户用来操纵网站以及区分本发明的这样的用户与作为网站访问者的网站查看者124的说明性设备。网络浏览器128可以是因特网浏览器,如Firefox、Safari、Opera、Mozilla、Internet Explorer等。在一个实施例中,客户机侧应用程序130通过浏览器128在计算设备126上呈现用户界面132。在一个实施例中,用户界面132包括各种屏幕画面和控件,它们有标号134概括参考。
在一个实施例中,客户机应用程序130是基于web的客户机应用程序。例如,客户机应用程序130可以采取ActiveX控件或类似控件的形式。在其他实施例中,它是补充本地软件应用程序的独立可执行码或插件/内插附件,诸如用来创建或管理网站的web创作工具。在一个实施例中,客户机应用程序130与在服务器138上运行的服务器侧应用程序136协作,将服务器138称为操纵服务器来帮助使对它的参考更容易。当然,它可以采取各种计算设备的形式,如计算机、膝上型计算机等。操纵服务器138可以是执行将在此处描述的各种功能的任何计算设备。在某些实施例中,服务器138包括使客户机应用程序130可被实时访问或下载并安装的存储器。该存储器不必与服务器138相关联,而可处于可由用户126访问的另一位置。
在一个实施例中,客户机应用程序130与服务器侧应用程序136一起工作来操纵网站116。在其他实施例中,客户机应用程序130可直接与web服务器114一起工作来操纵网站116。在又一些实施例中,如果客户机应用程序130可以访问一网页集合,则它可自主地操纵该网页集合。交互的各可变级别可以是情况的函数,如网站116被首次操纵与对它的操纵正在更新相比,还是只有网页118的一部分被修改。在其他实施例中,操纵服务器138提供对存储可被添加到网页118的标签或关于标签的信息的标签储存库140的访问。如上所述,术语“标签”指的是嵌入在网页中的由HTML标签定界的一部分代码。通常,标签采取脚本的形式。说明性标签120在图1B-1E中示出,图1B-1E是说明性的,因为标签可以采取各种形式。这些标签不必存储在储存库140中(其可以是第三方储存库)。
为帮助解释本发明的各方面,参考标号142指的是标签储存库140中的特定标签。因此,在某些情况下,程序代码120与标签142相同。虽然使用术语“特定标签”,但这样做只意味着它指的是被***到一个或多个网页118中的代码部分。即,标签142将针对不同的网页而变得非常不同。但对它分配了参考标号将帮助解释本发明的实施例的不同方面。参考标号142还将用于不同地指示“web分析”或“脚本”,如上所述,它们是本领域中用来描述添加到网页中的允许跟踪各种使用信息或呈现内容的代码部分的其他术语。
不只是嵌入web分析,本发明还可嵌入展示广告内容的代码。在一个实施例中,内容提供者114提供广告和其他内容146。参考标号148指示可嵌入在网页118中的内容标签或实际内容。在某些情况下,内容标签148可主存在标签储存库142中。说明性内容标签在图1E中示出。虽然出于参考目的被示意性地示出,但储存库140可驻留在操纵服务器138内或作为操纵服务器138的一部分。类似地,广告和其他内容146可以构成标号144所参考的同一硬件(内容提供者)的一部分。
在操纵了网站之后,监视服务150可以监视与网页118相关联的使用信息。如上所述,说明性网页使用信息包括关于对网页的访问的信息、在网页上点击的对象、在网站中查看的文档、从网页下载的下载、在网页上激活的控件、用户在网页上交互的项、通过网页呈现的对象等等。可被下载的下载的示例有很多;少数几个包括:PDF文件(表单、产品手册)、游戏或其他应用程序的安装程序、铃声、诸如MP3和WMA歌曲等音乐文件、屏幕保护应用程序、背景“壁纸”图像、整个软件应用程序、以及可被下载的任何其他事物。
很明显,上述列表只是web分析程序可以提供的信息的简要概观。现在更详细地讨论各组件的特定方面。
如上所述,客户机应用程序130可以提供变化的功能级别。在一个实施例中,其将标签***到通常是网页的文档中。在某些实施例中,这些网页存储在本地,即存储在客户机设备126或耦合到客户机设备126的诸如网络寻址存储设备(未示出)等存储设备上。在一个实施例中,这些本地网页可由应用程序130修改,并随后上传到web服务器114。在其他实施例中,应用程序130直接与网页118交互,从而在web服务器114上修改它们。在并未示出的又一些实施例中,应用程序130可以同样独自工作或与服务器侧应用程序136合作来修改位于又一远程目录的影子文件或测试文件。在又一说明性实施例中,要加标签的内容可以驻留在存储器(如web服务器114的存储器)内,并且可以在进行中修改网页118。并且如上所述,并非所有网页118都必需是操纵对象。各个选项也是可用的,如操纵整个网站、所选目录、所选文件、单个文件、若干页面上的循环HTML元素、一个页面上的单个HTML元素等等。
客户机应用程序130可以用作各种目的。例如,第一说明性目的包括标签***。标签代码120(或只称为“标签”)被嵌入在要被修改的网页118中。在一个实施例中,加标签根据预定义的标签规则集合来发生,在某些实施例中,这些标签规则驻留在操纵服务器138上,并且在其他实施例中它们驻留在储存库140或web服务器114上(只要在使用规则时客户机应用程序130知道它的位置)。这些规则集合由标号152来说明性地参考,并且在标签储存库140中说明性地示出。在一个实施例中,要被***的标签120包括由用脚本语言编写的程序代码组成的脚本。一种说明性脚本语言是JavaScript。
在一个实施例中,标签代码120将***在注释或标记之间,以简化诸如检测和替换等操作。这不是本发明所有实施例的要求。在某些实施例中,可能不包括标记。但在其它实施例中,包括标记以便使确定页面是否已***纵或检查页面错误的任务更容易。使用标签检测的过程来检测网页是否已被加了标签。加标签可能已经手动地、通过另一工具、或通过诸如此处描述的方法等方法而完成了。这一方面的目标是灵活的并且尝试检测标签,即使它不完全与预期的标签按字符等同。
标签检测的过程包括删除已加入到网页118的标签120。
标签替换允许用其他标签替换标签120。关于为什么这一点是合乎需要的存在着各个不同原因。页面可能已经用加标签规则152的先前版本加了标签,并且需要根据加标签规则的新版本来更新标签。或者,用户126可以决定应当不同地操纵给定页面。随后同样,用户126可能想要改变组成嵌入代码120的参数中的某一些的值。在某些实施例中,可以执行作为删除之后进行***的替换操作。
标签中性化指的是消除与特定标签相关联的功能的过程。已被手动地添加的标签可能难以提取和删除。因此,标签中性化允许禁用这些标签。在一个实施例中,将要被中性化的这些标签注释出来。
页面验证允许验证页面在加标签操作之前和之后在词法上都是有效的。即,本发明的这一方面允许验证嵌入的内容120以其所应当的方式操作。在某些实施例中,该过程允许验证JavaScript或其他代码未被加标签操作损坏。
可以结合本发明的各实施例使用许多不同类型的网页118。例如,可以操纵有效的HTML文档或不带致命HTML错误的文档。在某些实施例中,还可以使用诸如ASP、ASP.net、JSP、以及PHP等动态页面。可保证增加的检查级别或可能没有标签***的错误的说明性示例包括各种情况,其中:文档的内容不匹配META数据中的代码页;该文档不是有效的UTF8文档;该文档不是有效的UTF16文档;该文档包含无效字符(如“0”字符);该文档包含超过一个<HTML>标签;该文档包含超过一个</HTML>标签;</HTML>标签位于<HTML>标签之前;该文档不包含</HTML>标签;该文档不包含与</HTML>标签相对应的<HTML>标签;该文档包括超过一个<HEAD>标签;该文档包括超过一个</HEAD>标签;该文档不包括</HEAD>标签;</HEAD>标签位于<HEAD>标签之前;该文档不包括<BODY>标签;该文档包括超过一个<BODY>标签;该文档包括超过一个</BODY>标签;</BODY>标签位于<BODY>标签之前;</BODY>标签出现在<BODY/>标签之后;<BODY>标签出现在<HTML>标签之前;<BODY>标签出现在<HEAD>标签之前;注释未关闭;</HTML>标签出现在</BODY>标签之前;<BODY>标签出现在</HEAD>标签之前;</BODY>未找到;找到关闭标记而没有打开标记;在打开标记之后找到打开标记;找到双重id;和/或该文档是用不可识别的字符集编写的。
加标签规则152定义在选择使用该规则的情况下应当应用于页面的文本检测、***、或替换、修改、中性化等操作。在某些实施例中,加标签规则152可以驻留在标签储存库140中。可以开发包括用于不同产品的、供顾客126用来操纵网站的规则集合的标签库。在这样的实施例中,用于不同产品(例如,诸如监视服务提供者所提供的那些产品)和用于同一产品的不同版本的标签规则库在一个实施例中可以存储并分发到中央位置。如上所述,说明性位置包括标签储存库140、操纵服务器138、或甚至web服务器114。这些规则152可以通过用户界面132来载入并呈现给顾客。它们还可合并顾客选择。这一方面提供灵活性并与盲目地在诸如只在<\BODY>标签之前等固定位置***代码的任何现有技术相区别,如在伴随本申请的信息公开语句中引用的Perl脚本。因此,作为顾客选择的结果,不同的检测/替换/***规则集合可应用于网站116的各页面。该规则集合152与网页内容一起向客户机应用程序130提供输入数据。
在某些实施例中,***规则包括***点、***位置、要***的串、以及可用来在***后容易地检测页面中的标签的规则标识符。关于***点,本发明的实施例假定操纵代码120的***点可以由标签名称(例如<BODY>)或与该标签相关联的属性“id”的值来标识。或者,第一或最后标签可以用网页118中存在的名称来标识。此外,可以用在客户机应用程序130中运行并访问要***纵的网页118的文档对象模型(DOM)的自引导代码来动态地处理更复杂的***场景。文档对象模型(DOM)是用于HTML和XML文档的API。其提供文档的结构表示,从而允许修改其内容和视觉呈现。实际上,它将网页连接到脚本或编程语言。
关于***位置,在某些实施例中,***规则152将允许用户126在指定标签之前、内部、或之后***文本。在其他实施例中,可以选择默认规则以便用户除启动本发明之外无需与它进行交互。在其他实施例中,可以作出用户可从中进行选择的建议。例如,可展示给用户的四个说明性选择包括“在开头之前***(InsertBeforeStart)”、“在开头之后***(InsertAfterStart)”、“在结尾之前***(InsertBeforeEnd)”、以及“在结尾之后***(InsertAfterEnd)”。我们将提供每一个的示例。
“在开头之前***”。参考图2描述“在框图之前***”规则。如图所示,初始代码段210服从该规则,其可采取产生结果214的说明性形式212。如在代码部分214可以看到,标签216在HTML源代码的正文开头之前***,正文由参考标号218来参考。
将参考图3来描述“在开头之后***”规则。转向图3,初始代码部分310服从可采取参考标号312所示出的产生结果314的说明性形式的规则。如可看到的,标签316在正文标签318以及第一<div>标签320之后***。
“在结尾之前***”规则的说明性实现将参考图4来描述。现转向图4,初始代码部分410服从具有被示为产生结果414的说明性格式的规则412。作为说明,结果414指示标签416在HTML源代码的正文部分的结尾出现,如相关HTML<BODY>以及</BODY>标签所描绘的,后者由标号418表示。
“在结尾之后***”的说明性实现将参考图5来描述,其中初始代码部分510服从规则512,规则512包括被示为产生结果514的说明性格式。如在结果514中可看到的,标签516***在结尾正文标签518之后。
一般而言,在标签***的情况下,***点由标签的名称以及可任选地由“id”属性的值来定义。因此,在某些实施例中,每一标签的全部其他非“id”属性以及HTML标签和<script>标签内的文字内容可被丢弃。
词法分析器可用来产生一系列令牌。词法分析器接收HTML文本作为输入并将提供与打开标签、关闭标签、属性名、注释等的检测相对应的一系列令牌。词法分析器可形成客户机应用程序130或服务器侧应用程序136的一部分。参考图6,将初始代码部分610应用于词法分析器612的成果在框614中示出。验证页面在句法上正确,指所有打开标签被关闭是不必要的。相反,本发明的实施例将等待具有给定名称的标签。在找到该标签时,将该标签连同关于其打开和关闭标签的位置以及“id”属性(如果存在)的信息***到队列中。在该解析的最后,作出是否存在满足指定规则的***点的判定。在一个实施例中,如果未找到标签,则***失败。否则,就知道了在文档中的、要将标签***到的确切位置。该确切位置可以作为参数之一传递给“***”函数。
“***”函数的另一参数是可用来编写所***代码120的标记的“***规则id”的参数。这一功能可用于自动地更新自定义脚本的较旧版本,允许用户选择一个操纵提供者来代替另一个,或便于A/B测试,A/B测试是用来描述便于对网站拓扑结构和交互进行实验和变化的一个方面的术语;例如,向一些顾客展示第一组选项(“A”)而向另一些顾客展示第二组选项(“B”),以及使用操纵来评估这两种选项的比较效果。打开标记的说明性格式如下:
“<!--[_{产物}_{规则id}_{版本}_-->.”
关闭标记的说明性格式如下:
“<!--[_{产物}_{规则id}_{版本}_-->.”
这些仅是示例。可以包括其他项,如标识符的时间戳,并可移除其他项,如在下表中的那些项。
Figure GPA00001094896400101
表1
在图7B中示出标记的更一般形式。但在以上示例中,“产物”是标识作为操纵(如谷歌分析)主题的产物的固定部分。“规则id”标识规则标识符,如配置数据库所提供的整数。在一个实施例中,这可以从标签储存库140中检索。“版本”标识适用于操纵的规则152的标签储存库140中的版本。一个说明性示例在图7A中提供。并且图7B示出更高层示例,其中开头标记(beginning marker)710标记嵌入代码712(或120)的开头并且结尾标记(ending marker)714标记结尾。所***的标签120的检测和删除可以使用HTML解析器并寻找包含具有指定产物和版本的标记(如710和714)的一个或多个注释标签来实现。如上所述,这提供一种简易方式来检测当前嵌入的标签。
当然,以上仅是如何表示所输入标签的一个示例。存在着表示标签的各种不同方式,但在某些实施例中,相比较而言更相关的方式是标签以某种方式表示以便可以搜索这些记号来容易地找到嵌入的标签。
关于标签检测,注意,web分析操纵脚本可与其他分析产物并存。在某些实施例中,这些不能两次***到同一页面。在这样的实施例中,在将新标签***到页面之前,验证这样的标签未存在于页面中是富有成效的。预先存在的操纵可能是手动地***的,由网站内容的所有者***,或由另一工具自动地***,或甚至由客户机应用程序130本身***。像以上描述的那样***的标签相对易于标识,因为他们由先前提到的标记所包围。这些标记(例如,710和714)定义这些标签的边界。因此,这些类型的标签可以使用搜索这些标记的方法来找到。
但在其中不提供标记或等效物的情况下,仍然可以检查网页的源代码来查看要输入的一代码部分所专用的“代码签名”是否可被搜索到。例如,特定web分析产物具有代码签名。在检测的上下文中,完美地定义代码段的确切边界并非特别重要。说明性代码段如下:
“Script language=JavaScript”SRC=http://x.msn.com/scripts/acascript.js.
一个目标是正确地标识正确的代码段。为便于合乎需要的灵活性级别,可以通过正则表达式来指定代码签名。在这样的场合下,检测功能将通过将正则表达式应用于页面的内容来实现。该功能将返回布尔结果“被加标签或未被加标签”,如果需要则连同关于标签代码在页面中的位置的信息一起返回。
在网页的上下文中,正则表达式不总是有效。所搜索的模式可以出现在页面中的许多不同位置。例如,文本<BODY>或</BODY>可能出现在实际正文标签之前的脚本标签中所包含的串中。这在下表中示出:
Figure GPA00001094896400121
表2
其还可以出现在HTML注释中,如在下表所示。
Figure GPA00001094896400122
表3
为帮助避免错误,可以执行一些对应步骤。在寻找正则表达式匹配之前,可以预处理页面来移除所有引起虚假匹配的部分。从实现的观点来看,具有不同参数的类似预处理方案可用来实现任何加标签操作,包括检测、替换、***等。给定要加标签的页面,预处理器将返回页面的只包含应用特定加标签操作所需的标签和属性的最小集合的剥离版本。在一个实施例中,该剥离版本将只在内部使用来精确地检测标签的存在或标识正确的***点以及避免可能的假匹配。***、检测、替换的实际操作将在原始页面上完成。
在检测的情况下,为找到预先存在的操纵代码,在一个实施例中,预处理步骤将丢弃所有注释以及HTML标签内部的所有文字内容。为使该过程更容易,可以使用页面正规化。正规化相对照来进行匹配的串是容易的,这将使正则表达式更简单。在预处理期间,诸如空间、制表符、以及新行等空白可被转换成单个空间。因此,各表达式之间具有多种空间的行可被简化,以使他们只由单个空间来分开。
关于标签替换或删除,如上所述,在提供标记的情况下,可使用HTML解析器来寻找其内容与标记的文本相匹配的注释。在找到匹配时,包括在两个标记注释(如710和714)之间的所有标记可以从页面中移除。标记标签的替换可以通过从网页中删除所有已有标记标签并随后可能在不同的位置或使用不同的参数来重新***新标签来实现。
对于未标记的标签,可以采用替换过程。一般而言,单个产物(诸如例如谷歌分析)的加标签在网页的不同部分生成多个改变。将需要检测这些改变,并且将定义正则表达式集合来指定要寻找的可能代码段。因此,在一个实施例中,可以检查普及的分析程序的列表以寻找对提供者的实现是唯一的代码或在其他提供者的实现中找到的代码,并且该列表可用作指示标签120的存在的短语或项的良好指示符。
例如,考虑图1C的说明性标签162。可以看到,存在短语“URCHIN.JS”。该短语连同需要搜索的许多其他短语一起可担当在网页集合中进行搜索的查询的基础。因为实际上比较难以移除与该代码段相关联的所有代码,如162的代码,所以在一个实施例中,这样的代码被中性化。例如,可以注释出对已知产物的函数的所有调用。因为存在本质上损坏网页的可能,所以本发明的一个实施例向用户提供在发布他的页面之前测试该页面以确保它实际上未被损坏的能力。因此,在一个实施例中,跟踪对特定网页作出的所有改变。在出错的情况下,这些改变随后可以被取消并且可以恢复原始页面。
类似地,在一个实施例中,提供HTML验证过程。这样的过程可以在加标签存在之前和之后验证HTML文档的有效性。这可以用于测试目的,以及用来验证至少从HTML句法的观点来看加标签未损坏页面。这一功能可以使用上述HTML处理器/解析器来实现。
为解释要执行的预处理步骤的变型,本发明可以采用页面和文档编码。这一点的信息在microsoft.com/globaldev/getwr/steps/wrg_codepage.mspx(其通过引用结合于此以解释编码)提供,并且还在该文档的IDS字段内提供。在这样的实施例中,可检测代码页。这可以通过在该文档的开头检测unicode(统一代码)BOM(字节序标记)(参见例如unicode.org/unicode/faq/utf_bom.html,其通过引用结合于此以解释检测BOM),寻找网页中<META charset=”...”/>的存在,和/或向用户询问正确的代码页来实现。在检测之后,该页面可被转换成标准化格式,如UnicodeUTF16。HTML解析器在标准化版本上运行以帮助便于***/检测/修改标签。如果需要,则所得的(UTF16)文档可被转换回原始代码页。
现在转向图8A-8M,提供了用户界面132的更多细节。在一个实施例中,是通过浏览器128在客户机设备126上将被呈现的屏幕画面。如果客户机应用程序130是本地应用程序,则将提供类似屏幕画面但不必通过网络浏览器128来呈现,尽管即使应用程序是本地独立的应用程序它们也可以通过网络浏览器来呈现。屏幕画面8A描绘用户126在准备操纵所需网站时将看到的说明性欢迎屏幕画面,该所需网站出于该示例的目的是网站116,带有的页面118是能被或将***纵的页面集合。如通过项810可看到的,该过程允许自动操纵。
在一个实施例中,如在图8B中所示,可以呈现另一屏幕画面以允许用户选择选项来自动地将跟踪脚本***到可能所有网页118。如在图8B中由参考标号812所示,如果需要,则自动加标签将***跟踪脚本到每一网页中。现转向图8C,屏幕画面814提供用户界面来接收使得能够标识网页118的位置信息。其仅仅说明性地示出可以使用其中提供服务器和安全凭证的FTP范例。但情况也可能是:可由按钮818来浏览文件夹816以接收使得能够标识要操纵的网页118的位置信息。这样的文件夹不必物理上与客户机应用程序130或浏览器128驻留在同一硬件中。相反,其可以通过网络驱动器来到达。
图8D指示本发明准备好开始将跟踪脚本***到网站116的每一页面。提供设置按钮820以允许对操纵进行更多的自定义,诸如先前描述的那些和更多。在图8E,可以看到,本发明大约33%完成,已处理了3个文件,如参考标号822所示。
图8F描绘示出所有9个文件824被处理并被成功嵌入标签的屏幕截图,这由参考标号826反映。如注释828所示,跟踪脚本120现在已***,使得网站116准备好收集访问者或用户信息。
说明性跟踪脚本安装报告可以在图8G中看到,这由标号830来参考。该报告示出每一页面以及可任选地通过某种方式,如“基本操纵”来指示是否***了脚本。图8H描绘示出本发明的允许自定义设置和要***的跟踪脚本的能力的屏幕画面832。在此,允许用户选择特定文件夹和文件来嵌入自定义内容。所示说明性自定义内容是分析跟踪脚本。
图8I指示正在搜索被指示的目录中的文件。如参考标号834所示,示出已经分析了4,215个文件。
现在转向图8J,该用户界面的屏幕画面840示出选项(诸如刷新跟踪脚本的集合的能力842等)如何对用户可用。同样示出的是各个特征,如下载跟踪、页面重命名、以及事件跟踪844,并且它们可由本发明的实施例使用。用户可以点击一个链接846来用跟踪脚本刷新他的整个网站。遵循这样的链接将允许根据可能在规则数据库152中定义的新规则集合来刷新嵌入在所有页面中的所有脚本。
还可以跟踪与下载文件相关联的各方面。转向图8K,屏幕画面848示出当在网站116上下载时可以选择具有特定扩展名或文件类型的文件来跟踪。此外,通过遵循链接850,用户免于添加具有自定义扩展名的附加文件。以此方式,本发明的实施例允许对下载进行跟踪。
本发明的另一说明性特征在图8L中示出。在此,可以作出“每页面别名”选择。这允许使用易于操作的别名或绰号来重新命名可能具有长文件名的文件。所示出的说明性页面名称包括分别由参考标号854和856示出的“索引”和“我的页面”。如在图8M中所示,重命名这些页面。注意,在图8M中,项858现在与作为所需名称改变的别名“购买”相关联,如在图8L中由标号858A所示。类似地,图8M中的项860被从命名为“结账”,如在图8L中参考项860A所看到的。
为了扼要重述本发明的实施例,提供了可被包括的嵌入服务的可扩展集合。本发明便于修改网页集合以使内容广告可以显示在最高数量的位置中。同样,在小配件/窗口小部件市场中,一些人用诸如web 2.0项等可嵌入内容制造出商业模型。本发明的一实施例使得能够容易且自动地嵌入这些项。在社区类上下文中,如果社区内容分布在第三方web内容(例如,Flickr图像、Soapbox视频、LiveEarth地图等)中,则其产生更多访问者。
还提供对HTML内容的分析以确定可包括什么嵌入服务。本发明的实施例使得能够对每一目标内容进行与所请求的嵌入服务的兼容性分析。
标签自定义也成为可能。每一标签120可包含可自定义的参数。本发明的实施例展示帮助内容发布者144或126使嵌入服务适应它们的需求的用户界面。
还提供了将标签120***到HTML文件中的正确位置。本发明可以检测在目标内容118中要***标签120的正确位置。或者,对于特定类型的内容148和/或142,本发明的实施例可以向用户126展示一种在视觉上选择位置的方式。例如,在其中要嵌入广告内容相关代码148的实施例中,本发明的实施例可以接收确认或指示代码148/120的***点的用户输入。因为这一类型的***通常将改变页面的布局,所以一实施例包括呈现经修改的页面将看起来如何的预览的选项。用户可以审阅***广告后的页面布局。
可以对每一嵌入服务存储用户配置信息和web目的地或其他位置信息。这使更新更容易。可能存储在标签储存库140中的说明性配置信息包括所选嵌入服务、用户参数、目标内容、页面专用信息等。
还可以提供附加特征。说明性的其他特征包括订阅所建议的嵌入服务(利用各服务中常见的用户标识符,如电子邮件、分析等);同步(验证在web内容中实现的当前标签与用户在自定义中需要的标签相匹配);刷新(用用户所需的配置来自动更新web内容);以及移除(从网站移除“嵌入标签”中的一些或全部)。这些特征在本质上是说明性的,并且不构成穷尽性列表,因为还有包含其他列表的情况。
如上所述,本发明的实施例可采取各种实现。说明性实现包括在线工具、web内容构建工具插件、web服务器增强、内容编辑平台扩展、和/或软件开发工具包(SDK)的形式。
现在转向图9,提供了根据本发明的一实施例的说明性过程。作为预处理或先驱函数,接收要配备操纵和/或嵌入内容标签的网站的位置信息。该***可能已经知道网站的URL、文件夹位置、IP地址等,或其可以从用户接收该数据。在步骤912,分析第一网页的源代码。如上所述,分析网页的源代码实际上可包括各个子步骤,包括分析网页的副本或该网页的剥离版本。在步骤914,自动地作出要嵌入的适当的标签的判定。在某些实施例中,适当的标签是要输入的默认标签。在其他实施例中,考虑用户提供的信息来确定要嵌入的适当的标签。在又一些实施例中,在该阶段确定广告内容代码部分。在步骤916,确定适当的嵌入位置。该过程已在上文描述。确定了标签并且知道了***点,则在步骤918,将一个或多个标签自动地嵌入到网页中。该过程可继续进行与要操纵的页面一样多的次数。因此,在步骤920,做出关于是否存在要操纵的附加页面的判定。如果是,则处理回复到步骤912。如果否,则在一个实施例中,该过程可以结束。
在步骤922,可发生允许验证嵌入内容未造成对网页的不合需要的更改的验证步骤。如果所添加的内容是分析脚本,则网页的外观不应改变。可以对网页在***之前和之后的外观进行某种方式的比较。这可按各种方式来发生。在一个实施例中,可以比较在***之前以及***之后的网页大小或其他尺寸。如果任何变化超过某一阈值,则可以作出发生了不合需要的改变的假定。如果添加了广告内容,则假定该广告的大小是已知的,那么可以进行另一大小比较。例如,如果添加的内容是60像素高,则可以检查网页的高度来查看其是否增加了60像素。在又一实施例中,可以向用户呈现改变的预览以接收是否存在任何可察觉的改变的指示。向用户展示该选项是有价值的。还可以进行功能检查。至少从查看者124的观点来看,附加分析代码或广告内容不应更改网页的功能。可以自动地测试诸如链接和媒体呈现等事物,以及整个页面的呈现。
先前还解释了验证的各方面(参见描述文档编码的一节)。在某些实施例中,本发明不显式地检查来确定所***的代码120是否损坏美观或已有功能本身。在这些实施例中,对DOM执行检查来分析已有DOM在添加并随后移除该脚本的操作之后是否保持相同。调回文档对象模型(DOM)提供文档的结构表示。所执行的检查确保在***之前已处于页面中的内容作为***的结果未被损坏。例如:如果对页面中按钮的点击改变图像在同一页面上的源,则自动地添加跟踪脚本120将不损坏该已有功能。同样,添加跟踪脚本120不改变该页面的布局。一般而言,不对页面的呈现、交互、以及数据/应用程序功能发生改变。但添加广告脚本将改变页面的布局。即使这样,本发明的实施例确保页面上在***之前已有的功能不被损坏。
可以对操纵功能进行改变。“呈现”指的是页面的视觉布局和外观。“交互”指的是编码到页面中的像JavaScript mouseover事件、表单控件等行为(存在多个选项)。“数据/应用程序”指的是页面所进行的实际工作,例如处理电子商务交易、从数据库中检索用户的账户余额并将其向他们示出等等。
测试错误或开发排除规则的一种方式包括将标签***页面集合(可能有数千或数百万)并随后移除它们。可以在页面上进行按字节及DOM比较。如果比较之一未能返回相等的结果,则认为加标签至少对于该页面是失败的。可以保存失败的标签页面并分析其内容来标识页面中的什么错误损坏该次加标签。如果知道替换方案,则可以创建标签修理。如果不存在替换方案,则添加该页面错误作为排除规则之一。
一种替换方式是在进行中对所浏览的随机页面加标签。对所有这样的页面加标签。稍后,撤消它们的标签。如上所述,进行比较并采取动作。
现在转向图10,提供了用于实施本发明的实施例的另一方法并由标号1000概括参考。在该实施例中,在步骤1010,向用户呈现接收描述要经由跟踪脚本来操纵的所需网站的描述性信息的用户界面。在一个实施例中,这样的用户界面可以采取图8A-8M的一个或多个屏幕画面的形式。在步骤1012,将跟踪脚本自动地安装到网站的网页集合中。如上所述,可以在无需用户干预的情况下自动地确定位置并且选择并嵌入脚本。在步骤1014,呈现用于接收要跟踪的事件的用户界面。这些步骤不必以任何特定次序出现。在某些实施例中,在接收到与脚本相关联的不同参数之前将脚本嵌入在网页中是有用的。在其他实施例中,这些步骤可被合并或甚至是逆序,以便甚至在安装跟踪脚本之前向用户呈现用户界面来接收要跟踪的事件的指示。并且在接收到要跟踪的事件的这些指示之后,则安装跟踪脚本。用于接收要跟踪的事件等的指示的用户界面的示例可以在屏幕画面8H、8J、8K、8L、以及8M中找到。
在步骤1016,所输入的跟踪脚本可以基于事件跟踪指示来自动地更新。因此,在该实施例中,用户可以进行附加改变,这在同样无需用户干预的情况下自动更新的更新脚本中反映。
在步骤1018,可以测试安装跟踪脚本的影响。在一个实施例中,该过程类似于图9的922的过程。
在不背离本发明的精神和范围的情况下,所描绘的各组件以及未示出的组件的许多不同的安排都是可能的。已带着说明性而非限制性的意图描述了本发明的各实施例。不背离其范围的各替换实施例对本领域的技术人员将是显而易见的。技术人员可以开发实现上述改进的各替换手段而不背离本发明的范围。
可以理解,特定的特征和子组合是有用的,并且可以使用而无需参考其他特征和子组合并且被认为是在权利要求书的范围之内的。并非需要以所描述的特定次序来执行在各附图中所列出的所有步骤。

Claims (22)

1.一种用于自动地配置一个或多个网页来跟踪网页使用信息(“使用信息”)的方法,所述方法包括:
分析所述一个或多个网页来确定具有支持***便于跟踪所述使用信息的标签结构120的结构的网页集合118;以及
对于所述网页集合118中的每一网页:
(1)基于所述分析,自动地标识用于***所述标签结构120的***点,以及
(2)自动地在所述***点嵌入所述标签结构120,其中能够跟踪关于所述网页的使用信息。
2.如权利要求1所述的方法,其特征在于,所述分析便于从要嵌入在被分析的网页中的多个可能的标签结构中自动地标识标签结构,以使不同的网页可以接收不同的标签结构。
3.如权利要求1所述的方法,其特征在于,对所述一个或多个网页分析包括对一个或多个文档进行分析以确定它们是否包括不可恢复的HTML错误,并且如果是,则执行以下中的一个或多个:
呈现所述不可恢复错误的指示;
放弃加标签;以及
执行默认操作。
4.如权利要求1所述的方法,其特征在于,所述标签结构包括由打开标签标记和关闭标签标记定界的代码部分。
5.如权利要求1所述的方法,其特征在于,所述标签结构可以基于用户输入或配置来接收参数。
6.如权利要求5所述的方法,其特征在于,所述脚本便于实验与变化的网站拓扑结构的用户交互,并且其中所述实验包括以下中的一个或多个:
A/B测试;以及
多变量测试。
7.如权利要求1所述的方法,其特征在于,自动地嵌入所述标签结构包括嵌入服从可访问规则的集合的标签结构。
8.如权利要求1所述的方法,其特征在于,还包括提供验证,所述验证是所嵌入的标签结构相对于所述网页在嵌入所述标签结构之前的功能而言未对所述网页造成不合需要的更改。
9.如权利要求1所述的方法,其特征在于,还包括:
呈现用户界面132,所述用户界面132允许通过向该用户界面132提供数据来修改所述标签结构,从而不需要用户126编辑网页的源代码;以及
随着通过所述用户界面132接收输入来自动地修改所述标签结构。
10.如权利要求1所述的方法,其特征在于,还包括收集用户配置信息并将其存储在储存库140中以供将来重新收集。
11.如权利要求1所述的方法,其特征在于,还包括:
存储描述对所述网页进行的改变的改变信息;以及
便于进行撤消过程,该过程通过利用所述改变信息对任何的改变实行逆转。
12.如权利要求1所述的方法,其特征在于,还包括检查所述网页以寻找当前存在的标签,以及更新或删除这些标签,其中所述标签包括与通过如权利要求1所述的方法所嵌入的那些标签所不同的标签。
13.一个或多个其上包含用于执行一种自动地操纵一个或多个网页的方法的计算机可执行指令的计算机可读介质,所述方法包括:
自动地确定要被修改来接收定制内容的网页集合118;
对于所述网页集合中的每一网页,
(1)自动地分析所述网页来从应被嵌入到所述网页中的多个标签结构142或148中确定适当的标签结构120,
(2)自动地解析所述网页来确定所述网页中将不影响所述网页的功能的***点,以及
(3)自动地在所述***点处嵌入所述适当的标签结构142或148,从而使得能够将所述定制内容120嵌入到所述网页。
14.如权利要求13所述的介质,其特征在于,所述计算机可执行指令构成以下中的一个或多个:
基于web的应用程序;以及
独立的非基于web的应用程序的附加。
15.如权利要求13所述的介质,其特征在于,所述标签结构便于以下中的一个或多个:
跟踪与所述网页相关联的访问事件;
呈现广告内容146;
进行A/B测试;以及
进行应用于跨越指定文档集合的多变量测试。
16.如权利要求13所述的介质,其特征在于,自动地嵌入所述适当的标签结构包括引用储存库140或146,其中存储了与要在其中嵌入所述标签结构的网页相关联的配置信息或规则152。
17.如权利要求13所述的介质,其特征在于,还包括验证所嵌入的标签结构未造成对所述网页的不合需要的更改。
18.一种用于将内容标签自动地嵌入到网页以便在作出查看所述网页的请求时实时地修改所述网页的内容的***,所述***包括:
主存包括网页集合118的网站的服务器114,所述网页集合的内容要被修改以接收嵌入在所述网页中的内容120;
存储储存库140或146,该存储储存库被耦合到所述服务器114并存储分别将标签信息142或148与所述网页集合中的每一网页相关联的配置信息;以及
提供对计算机可执行指令集合130或136的访问的存储器138,所述计算机可执行指令集合提供在相应***点处将所述嵌入内容120自动地***到所述网页而没有不合需要地更改所述网页的外观或功能的能力。
19.如权利要求18所述的***,其特征在于,所述嵌入内容包括以下一个或多个
广告内容148;
web分析142,允许收集关于所述网站的访问事件的信息;
媒体148,诸如视频、图像、音频、地图、来自专门网站的动画片、以及幻灯片等;
编程内容148,诸如包括例如小应用程序、flash对象、嵌入程序、以及即时消息收发服务等;
网站小配件148,诸如访客留言簿、调查、以及新闻简报等;以及
Web 2.0项148,诸如标签云、RSS馈源、以及wiki等。
20.如权利要求18所述的***,其特征在于,还包括与所述服务器和所述存储储存库140或146进行通信的通知组件122,其伴随着请求查看特定网页来引用所述存储储存库140或146以检索与所述特定网页相关联的标签信息142或148,并实时地在***点自动地***所述标签信息,以使所述特定网页在嵌入了所述标签信息的情况下呈现给请求者124。
21.如权利要求18所述的***,其特征在于,所述存储储存库存储以下一个或多个:
可用于嵌入的服务;
用于每一嵌入服务的标签;
关于文件中位置的包括所需和可任选参数的标签信息;
可被包括在所述嵌入内容中的参数的类型;
具体的格式化要求;
用于确认网页的规则;
用于确定***点的规则;
用于嵌入内容的规则;
用于所述嵌入内容的参数选项;以及
用于所述网页中的一个或多个的标签配置信息。
22.如权利要求18所述的***,其特征在于,至少部分地通过接收来自用户的输入来确定所述相应***点中的一个或多个。
CN200880111437.5A 2007-10-12 2008-09-23 自动操纵web文档集合 Active CN101821764B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/871,831 US8996682B2 (en) 2007-10-12 2007-10-12 Automatically instrumenting a set of web documents
US11/871,831 2007-10-12
PCT/US2008/077315 WO2009051939A2 (en) 2007-10-12 2008-09-23 Automatically instrumenting a set of web documents

Publications (2)

Publication Number Publication Date
CN101821764A true CN101821764A (zh) 2010-09-01
CN101821764B CN101821764B (zh) 2015-07-22

Family

ID=40535285

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880111437.5A Active CN101821764B (zh) 2007-10-12 2008-09-23 自动操纵web文档集合

Country Status (7)

Country Link
US (1) US8996682B2 (zh)
EP (1) EP2201520A4 (zh)
JP (1) JP5851690B2 (zh)
CN (1) CN101821764B (zh)
BR (1) BRPI0816987A2 (zh)
TW (1) TWI454941B (zh)
WO (1) WO2009051939A2 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102201006A (zh) * 2011-06-10 2011-09-28 互动在线(北京)科技有限公司 批量更新词条页面内容块的装置和方法
CN102591881A (zh) * 2011-01-17 2012-07-18 腾讯科技(深圳)有限公司 生成标签的方法和装置
CN102609188A (zh) * 2011-01-13 2012-07-25 微软公司 基于***点的用户界面交互行为
CN103532831A (zh) * 2013-10-22 2014-01-22 北京网秦天下科技有限公司 跟踪电子消息的方法、移动设备和服务器
CN103577660A (zh) * 2012-07-19 2014-02-12 腾讯科技(深圳)有限公司 灰度实验***和方法
CN104272291A (zh) * 2012-03-07 2015-01-07 谷歌公司 唯一地识别脚本文件
CN110381118A (zh) * 2019-06-19 2019-10-25 平安普惠企业管理有限公司 页面数据传输的控制方法和相关设备

Families Citing this family (89)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8321537B1 (en) * 2006-12-27 2012-11-27 Google Inc. Methods and system for sharing gadgets between users
US8914774B1 (en) 2007-11-15 2014-12-16 Appcelerator, Inc. System and method for tagging code to determine where the code runs
US8954989B1 (en) 2007-11-19 2015-02-10 Appcelerator, Inc. Flexible, event-driven JavaScript server architecture
US8260845B1 (en) 2007-11-21 2012-09-04 Appcelerator, Inc. System and method for auto-generating JavaScript proxies and meta-proxies
US8719451B1 (en) 2007-11-23 2014-05-06 Appcelerator, Inc. System and method for on-the-fly, post-processing document object model manipulation
US8566807B1 (en) 2007-11-23 2013-10-22 Appcelerator, Inc. System and method for accessibility of document object model and JavaScript by other platforms
US8806431B1 (en) 2007-12-03 2014-08-12 Appecelerator, Inc. Aspect oriented programming
US8819539B1 (en) 2007-12-03 2014-08-26 Appcelerator, Inc. On-the-fly rewriting of uniform resource locators in a web-page
US8849985B1 (en) * 2007-12-03 2014-09-30 Appcelerator, Inc. On-the-fly instrumentation of Web applications, Web-pages or Web-sites
US8756579B1 (en) 2007-12-03 2014-06-17 Appcelerator, Inc. Client-side and server-side unified validation
US8938491B1 (en) 2007-12-04 2015-01-20 Appcelerator, Inc. System and method for secure binding of client calls and server functions
US8527860B1 (en) 2007-12-04 2013-09-03 Appcelerator, Inc. System and method for exposing the dynamic web server-side
US8335982B1 (en) 2007-12-05 2012-12-18 Appcelerator, Inc. System and method for binding a document object model through JavaScript callbacks
US8285813B1 (en) 2007-12-05 2012-10-09 Appcelerator, Inc. System and method for emulating different user agents on a server
US8639743B1 (en) 2007-12-05 2014-01-28 Appcelerator, Inc. System and method for on-the-fly rewriting of JavaScript
US10129346B1 (en) * 2008-03-25 2018-11-13 Egain Corporation Analyzing navigation with a webpage
US8005907B2 (en) * 2008-05-15 2011-08-23 Interational Business Machines Corporation Selectively marking email as partially reviewed
US8291079B1 (en) 2008-06-04 2012-10-16 Appcelerator, Inc. System and method for developing, deploying, managing and monitoring a web application in a single environment
US8880678B1 (en) 2008-06-05 2014-11-04 Appcelerator, Inc. System and method for managing and monitoring a web application using multiple cloud providers
US20100058333A1 (en) * 2008-06-11 2010-03-04 Harold Lee Peterson Method, system and computer-readable medium for personalized gadget configuration
US8769397B2 (en) * 2008-06-26 2014-07-01 Google Inc. Embedding macros in web pages with advertisements
US7596620B1 (en) 2008-11-04 2009-09-29 Aptana, Inc. System and method for developing, deploying, managing and monitoring a web application in a single environment
US8365062B2 (en) * 2008-11-02 2013-01-29 Observepoint, Inc. Auditing a website with page scanning and rendering techniques
US8589790B2 (en) * 2008-11-02 2013-11-19 Observepoint Llc Rule-based validation of websites
US8132095B2 (en) * 2008-11-02 2012-03-06 Observepoint Llc Auditing a website with page scanning and rendering techniques
US8863093B1 (en) * 2009-03-06 2014-10-14 Coverity, Inc. Load-time instrumentation of virtual machine program code
TWI393019B (zh) * 2009-05-14 2013-04-11 Acer Inc Webpage sharing platform
US20100306285A1 (en) * 2009-05-28 2010-12-02 Arcsight, Inc. Specifying a Parser Using a Properties File
US8713536B2 (en) * 2009-06-11 2014-04-29 Webtrends, Inc. Method and system for constructing a customized web analytics application
TWI479438B (zh) * 2009-06-12 2015-04-01 Alibaba Group Holding Ltd A visual processing method, apparatus and system for user access to web page behavior
US8234370B2 (en) * 2009-06-30 2012-07-31 International Business Machines Corporation Determining web analytics information
US9430566B2 (en) * 2009-07-11 2016-08-30 International Business Machines Corporation Control of web content tagging
US9208249B2 (en) * 2009-09-30 2015-12-08 Microsoft Technology Licensing, Llc Profiler for page rendering
US9268547B2 (en) * 2010-01-11 2016-02-23 Ensighten, Inc. Conditional logic for delivering computer-executable program instructions and content
US8996986B2 (en) 2010-01-11 2015-03-31 Ensighten, Inc. Enhanced delivery of content and program instructions
FR2957167A1 (fr) * 2010-03-08 2011-09-09 Alcatel Lucent Dispositif de gestion dynamique des pages de sites internet dont les frequentation et audience doivent etre analysees
US8407319B1 (en) 2010-03-24 2013-03-26 Google Inc. Event-driven module loading
US8453049B1 (en) * 2010-05-19 2013-05-28 Google Inc. Delayed code parsing for reduced startup latency
EP2390829A1 (en) * 2010-05-25 2011-11-30 Perferencement Method of identifying remote users of websites
US20110320424A1 (en) * 2010-06-29 2011-12-29 Intuit Inc. Assessing and adapting component parameters
US9536249B2 (en) * 2010-09-29 2017-01-03 Excalibur Ip, Llc Measuring inline ad performance for third-party ad serving
US9077681B2 (en) * 2010-10-05 2015-07-07 Microsoft Technology Licensing, Llc Page loading optimization using page-maintained cache
US8856230B2 (en) * 2010-12-14 2014-10-07 Microsoft Corporation In browser real time collaboration lists and forms
BR122014032918A2 (pt) 2010-12-30 2019-08-20 Ensighten, Inc. Gerenciamento de privacidade online
US9003552B2 (en) 2010-12-30 2015-04-07 Ensighten, Inc. Online privacy management
US8380753B2 (en) * 2011-01-18 2013-02-19 Apple Inc. Reconstruction of lists in a document
US8935660B2 (en) 2011-03-31 2015-01-13 Accenture Global Services Limited Expression editor system
US9274919B2 (en) * 2011-04-29 2016-03-01 Dynatrace Software Gmbh Transaction tracing mechanism of distributed heterogenous transactions having instrumented byte code with constant memory consumption and independent of instrumented method call depth
US8943476B2 (en) * 2011-06-14 2015-01-27 Google Inc. System and method to in-line script dependencies
US9165308B2 (en) 2011-09-20 2015-10-20 TagMan Inc. System and method for loading of web page assets
US20130139073A1 (en) * 2011-11-09 2013-05-30 Revionics Inc. System and method for changing functionalities of websites using widgets
SE536726C2 (sv) * 2012-02-03 2014-06-24 Innometrics Ab En metod för att spåra en användares interaktion med en webbsida
AU2012370492B2 (en) 2012-02-21 2016-03-24 Ensighten, Inc. Graphical overlay related to data mining and analytics
CN102662737B (zh) * 2012-03-14 2014-06-11 优视科技有限公司 扩展程序的调用方法及装置
EP2648106B1 (en) * 2012-04-05 2019-04-03 CoreMedia AG Method and web content management system for A/B testing or multivariate testing of websites on computers being connected to a web content management system
WO2014014430A2 (en) * 2012-07-18 2014-01-23 Google, Inc. Systems and methods of serving parameter-dependent content to a resource
US9317490B2 (en) 2012-09-19 2016-04-19 TagMan Inc. Systems and methods for 3-tier tag container architecture
CA2890866A1 (en) * 2012-09-28 2014-04-03 Deluxe Corporation System and method of automatic generation and insertion of analytic tracking codes
US11397970B2 (en) 2013-01-24 2022-07-26 Roy Peleg Visual designation of a zone in rendered code
US20140215323A1 (en) * 2013-01-26 2014-07-31 Apollo Group, Inc. Element detection and inline modification
US20140215050A1 (en) * 2013-01-29 2014-07-31 Array Networks, Inc. Method and system for web analytics using a proxy
US20140237346A1 (en) * 2013-02-20 2014-08-21 Adobe Systems Inc. Method and apparatus for importing hyper text markup language (html) web projects into a web content management system
US20140379496A1 (en) * 2013-02-22 2014-12-25 Trueffect, Inc. Data management process utilizing a first-party technique
US9535913B2 (en) * 2013-03-08 2017-01-03 Konica Minolta Laboratory U.S.A., Inc. Method and system for file conversion
CN104102576A (zh) * 2013-04-12 2014-10-15 阿里巴巴集团控股有限公司 一种多版本测试方法和装置
US20150134776A1 (en) * 2013-07-19 2015-05-14 Empire Technology Development Llc Injected analytics service for web distributed interfaces
US20150106928A1 (en) * 2013-10-15 2015-04-16 Joerg Steinmann Screening of email templates in campaign management
US20150235244A1 (en) * 2014-02-18 2015-08-20 Jason Anderson Survey method and system
US9720893B2 (en) * 2014-03-25 2017-08-01 Pearson Education, Inc. Automated content injection
US9401949B1 (en) * 2014-11-21 2016-07-26 Instart Logic, Inc. Client web content cache purge
US9553918B1 (en) 2014-11-26 2017-01-24 Ensighten, Inc. Stateful and stateless cookie operations servers
US9219787B1 (en) 2014-11-26 2015-12-22 Ensighten, Inc. Stateless cookie operations server
US10599748B2 (en) * 2015-03-10 2020-03-24 Asymmetrica Labs Inc. Systems and methods for asymmetrical formatting of word spaces according to the uncertainty between words
US11379776B2 (en) * 2015-07-27 2022-07-05 Innovian Corporation System and method for validating data
US10977597B2 (en) * 2015-07-27 2021-04-13 Innovian Corporation System and method for validating data
US11580001B2 (en) * 2015-11-11 2023-02-14 Box, Inc. Dynamic generation of instrumentation locators from a document object model
US10462239B1 (en) * 2016-07-29 2019-10-29 Microsoft Technology Licensing, Llc Flexible units for experimentation
US11025634B2 (en) 2016-08-08 2021-06-01 International Business Machines Corporation Enhancement of privacy/security of images
US10970465B2 (en) * 2016-08-24 2021-04-06 Micro Focus Llc Web page manipulation
US10536506B2 (en) * 2017-05-05 2020-01-14 Servicenow, Inc. Webpage analytics and control
JP6694860B2 (ja) * 2017-10-20 2020-05-20 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP7009160B2 (ja) * 2017-10-27 2022-01-25 エヌ・ティ・ティ・コミュニケーションズ株式会社 サイト改善装置、サイト改善方法およびサイト改善プログラム
US10929606B2 (en) * 2017-12-29 2021-02-23 Samsung Electronics Co., Ltd. Method for follow-up expression for intelligent assistance
US10671798B2 (en) * 2018-02-01 2020-06-02 Google Llc Digital component backdrop rendering
US11089084B2 (en) * 2018-07-24 2021-08-10 Machine Cover, Inc. Website failure analysis
TWI709094B (zh) * 2019-08-26 2020-11-01 國立交通大學 社群資訊處理方法與系統
US20210117503A1 (en) * 2019-10-18 2021-04-22 Coupang Corp. Computer-implemented systems and methods for manipulating an electronic document
US11341205B1 (en) * 2020-05-20 2022-05-24 Pager Technologies, Inc. Generating interactive screenshot based on a static screenshot
US20230376689A1 (en) * 2022-05-17 2023-11-23 Fastcase, Inc. Devices, systems, and methods for displaying and linking legal content

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5999912A (en) 1996-05-01 1999-12-07 Wodarz; Dennis Dynamic advertising scheduling, display, and tracking
US6266681B1 (en) 1997-04-08 2001-07-24 Network Commerce Inc. Method and system for inserting code to conditionally incorporate a user interface component in an HTML document
US5991740A (en) * 1997-06-10 1999-11-23 Messer; Stephen Dale Data processing system for integrated tracking and management of commerce related activities on a public access network
US6061700A (en) * 1997-08-08 2000-05-09 International Business Machines Corporation Apparatus and method for formatting a web page
US6687877B1 (en) * 1999-02-17 2004-02-03 Siemens Corp. Research Inc. Web-based call center system with web document annotation
US6366298B1 (en) * 1999-06-03 2002-04-02 Netzero, Inc. Monitoring of individual internet usage
AUPQ479999A0 (en) * 1999-12-22 2000-02-03 Canon Kabushiki Kaisha Structures to represent poorly formed html documents
US20030191817A1 (en) * 2000-02-02 2003-10-09 Justin Fidler Method and system for dynamic language display in network-based applications
US8397223B2 (en) * 2000-03-17 2013-03-12 Gutenberg Printing Llc Web application generator
AU2001253610A1 (en) 2000-04-18 2001-10-30 Icplanet Acquisition Corporation Method, system, and computer program product for propagating remotely configurable posters of host site content
US7117436B1 (en) * 2000-08-31 2006-10-03 Oracle Corporation Generating a Web page by replacing identifiers in a preconstructed Web page
KR20020018912A (ko) 2000-09-04 2002-03-09 서성호 인터넷 마케팅을 위한 접속 사용자의 데이터 수집방법
US6973483B2 (en) 2000-09-30 2005-12-06 Microsoft Corporation System and method for using dynamic web components to automatically customize web pages
US7600014B2 (en) * 2000-11-16 2009-10-06 Symantec Corporation Method and system for monitoring the performance of a distributed application
US9047609B2 (en) * 2000-11-29 2015-06-02 Noatak Software Llc Method and system for dynamically incorporating advertising content into multimedia environments
JP2004530959A (ja) * 2000-12-18 2004-10-07 カルゴ、インコーポレイテッド コンテンツのモバイル装置への配信システム及び配信方法
US7003565B2 (en) * 2001-04-03 2006-02-21 International Business Machines Corporation Clickstream data collection technique
US7047318B1 (en) 2001-04-20 2006-05-16 Softface, Inc. Method and apparatus for creating and deploying web sites with dynamic content
US20030018752A1 (en) * 2001-07-18 2003-01-23 David Lowy System and method for embedding a message in a uniform resource locator
US6877007B1 (en) * 2001-10-16 2005-04-05 Anna M. Hentzel Method and apparatus for tracking a user's interaction with a resource supplied by a server computer
US7185085B2 (en) * 2002-02-27 2007-02-27 Webtrends, Inc. On-line web traffic sampling
US20040205119A1 (en) * 2002-03-26 2004-10-14 Streble Mary C. Method and apparatus for capturing web page content development data
US7107309B1 (en) * 2002-07-03 2006-09-12 Sprint Spectrum L.P. Method and system for providing interstitial notice
US7716322B2 (en) 2002-09-23 2010-05-11 Alcatel-Lucent Usa Inc. Automatic exploration and testing of dynamic Web sites
US20040130634A1 (en) * 2003-01-06 2004-07-08 Delaney Beth M.P. Electronic image history attribute
US7703004B2 (en) * 2003-06-20 2010-04-20 Palo Alto Research Center Incorporated Systems and methods for automatically converting web pages to structured shared web-writable pages
KR20030060849A (ko) 2003-06-25 2003-07-16 주식회사 제이앤제이 인터랙티브 인터넷 사용자의 웹 사이트에서의 Traffic path를분석하는 시스템과 그 방법
US20050049960A1 (en) 2003-08-25 2005-03-03 Yeager Wayne B. Methods and apparatus for tracking online auction visitors
TW200515199A (en) * 2003-10-20 2005-05-01 Inventec Appliances Corp Method using DHTML to automatically generate HTML tags
US20050165615A1 (en) 2003-12-31 2005-07-28 Nelson Minar Embedding advertisements in syndicated content
US7720432B1 (en) * 2004-06-16 2010-05-18 Colby Steven M Content customization in asymmetric communication systems
JP4208081B2 (ja) 2004-12-27 2009-01-14 インターナショナル・ビジネス・マシーンズ・コーポレーション 複数のウェブサイトにパーソナライズされた価値を追加するためのシステム、ウェブサーバ、方法およびプログラム
US7559028B2 (en) * 2005-01-24 2009-07-07 Oracle International Corporation Method and apparatus for user function variable processing system and prompt
US7975000B2 (en) * 2005-01-27 2011-07-05 Fmr Llc A/B testing of a webpage
US20060294199A1 (en) 2005-06-24 2006-12-28 The Zeppo Network, Inc. Systems and Methods for Providing A Foundational Web Platform
US20070011248A1 (en) 2005-07-08 2007-01-11 Nokia Corporation Web publishing arrangement
US7882203B2 (en) 2005-09-08 2011-02-01 Microsoft Corporation Remote authoring for dynamic web pages
TW200729047A (en) * 2006-01-27 2007-08-01 zhi-quan Yan Link method between objects and specific web pages
US20070180147A1 (en) 2006-02-01 2007-08-02 Connect It, Llc System for insertion of advertising content in user-requested internet web pages
CN100422997C (zh) * 2006-02-21 2008-10-01 西安迪戈科技有限责任公司 网页加入可搜索的深标签及浏览器插件和脚本结合的方法
US20100042424A1 (en) * 2006-04-04 2010-02-18 Bhavin Turakhia Method and apparatus for inserting and removing advertisements
US7739594B2 (en) * 2006-05-22 2010-06-15 Google Inc. Encoding and displaying default landing page content
US8533221B2 (en) * 2007-08-30 2013-09-10 5Th Tier Limited Provision of targeted content

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609188A (zh) * 2011-01-13 2012-07-25 微软公司 基于***点的用户界面交互行为
CN102609188B (zh) * 2011-01-13 2015-07-08 微软公司 基于***点的用户界面交互行为
CN102591881A (zh) * 2011-01-17 2012-07-18 腾讯科技(深圳)有限公司 生成标签的方法和装置
CN102201006A (zh) * 2011-06-10 2011-09-28 互动在线(北京)科技有限公司 批量更新词条页面内容块的装置和方法
CN104272291A (zh) * 2012-03-07 2015-01-07 谷歌公司 唯一地识别脚本文件
CN104272291B (zh) * 2012-03-07 2017-06-23 谷歌公司 唯一地识别脚本文件
CN103577660A (zh) * 2012-07-19 2014-02-12 腾讯科技(深圳)有限公司 灰度实验***和方法
CN103577660B (zh) * 2012-07-19 2017-05-31 腾讯科技(深圳)有限公司 灰度实验***和方法
CN103532831A (zh) * 2013-10-22 2014-01-22 北京网秦天下科技有限公司 跟踪电子消息的方法、移动设备和服务器
CN110381118A (zh) * 2019-06-19 2019-10-25 平安普惠企业管理有限公司 页面数据传输的控制方法和相关设备

Also Published As

Publication number Publication date
WO2009051939A2 (en) 2009-04-23
TW200917057A (en) 2009-04-16
WO2009051939A3 (en) 2009-06-04
US8996682B2 (en) 2015-03-31
JP5851690B2 (ja) 2016-02-03
JP2011505605A (ja) 2011-02-24
TWI454941B (zh) 2014-10-01
EP2201520A2 (en) 2010-06-30
CN101821764B (zh) 2015-07-22
US20090100154A1 (en) 2009-04-16
BRPI0816987A2 (pt) 2015-03-24
EP2201520A4 (en) 2012-07-25

Similar Documents

Publication Publication Date Title
CN101821764B (zh) 自动操纵web文档集合
US9665256B2 (en) Identifying selected dynamic content regions
Zhou et al. API deprecation: a retrospective analysis and detection method for code examples on the web
US8065667B2 (en) Injecting content into third party documents for document processing
US20140074622A1 (en) Systems and methods for rule based inclusion of pixel retargeting in campaign management
US20150213514A1 (en) Systems and methods for providing modular configurable creative units for delivery via intext advertising
US20020188890A1 (en) System and method for testing an application
JP2011505605A5 (zh)
CN102317936A (zh) 识别评论以连同文档一起示出
CN101171571A (zh) 分析和组织软件应用程序中的物件的设备
CN101473322A (zh) 搜索预警
AU2009238294A1 (en) Data transformation based on a technical design document
CN103678487A (zh) 一种网页快照的生成方法和装置
CN102200996B (zh) 对动态报告进行解析和索引
US9081865B2 (en) Identifying selected elements in dynamic content
US10282398B1 (en) Editing tool for domain-specific objects with reference variables corresponding to preceding pages
US8515960B2 (en) Aggregating content from multiple content contributors
Arya et al. Information correspondence between types of documentation for APIs
JP2009075777A (ja) 文書処理システム及び方法
Lingam et al. Supporting end-users in the creation of dependable web clips
JP2013037580A (ja) 情報処理装置
Kaczmarek et al. Harvesting deep web data through produser involvement
AU729807B3 (en) Method and system for utilising database information
WO2020109779A1 (en) Testing of web-based processes
KR20140058049A (ko) 모바일 환경에서의 광고 데이터베이스 관리 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150729

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150729

Address after: Washington State

Patentee after: Micro soft technique license Co., Ltd

Address before: Washington State

Patentee before: Microsoft Corp.