CN104303180A - 对结构数据基于场景的洞察 - Google Patents

对结构数据基于场景的洞察 Download PDF

Info

Publication number
CN104303180A
CN104303180A CN201380025501.9A CN201380025501A CN104303180A CN 104303180 A CN104303180 A CN 104303180A CN 201380025501 A CN201380025501 A CN 201380025501A CN 104303180 A CN104303180 A CN 104303180A
Authority
CN
China
Prior art keywords
inquiry
data
user
data source
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201380025501.9A
Other languages
English (en)
Inventor
C·林斯伯格
Q·张
M·乌里茨基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN104303180A publication Critical patent/CN104303180A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24522Translation of natural language queries to structured queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/02User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • H04L51/046Interoperability with other network applications or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

查询有限数据源集。一种方法包括接收来自用户的查询。该方法还包括从有限数据源集中确定可被一起用于满足该查询的两个或更多个数据源的集合。该方法还包括将来自用户的查询的至少一部分翻译为针对该两个或更多个数据源的语义合适的查询。该方法还包括从该两个或更多个数据源接收这些语义合适查询的结果。该方法还包括聚集这些结果,并将聚集呈现给用户。

Description

对结构数据基于场景的洞察
背景
背景和相关技术
计算机和计算***已经影响了现代生活的几乎每个方面。计算机通常涉及工作、休闲、保健、运输、娱乐、家政管理等。
现代计算***具有生成并存储大量数据的能力。例如,数据可通过耦合到传感器、web服务,或其它数据源的数据收集机制来收集。可对原始数据进行操作以创建甚至更多数据。大容量存储器是非常便宜的,因此这数据可被保存长的时间段,无需破坏数据来收回存储空间。因此,大量数据可被生成并聚集。
因为大量数据可用,找到特定数据好比常说的大海捞针。困难可仅在搜索通过大量数据的时候发生。这可因用户不能制定出有效的搜索查询而变得严重。具体地,各种索引和搜索引擎可组织数据并使数据可搜索,但是这些工具仅仅像执行搜索的用户通过构建合适的查询而允许这些工具成为的那样高效。此外,用户可能希望找到单个数据存储无法完整提供的数据。
在此要求保护的主题不限于解决任何缺点或仅在诸如上述环境中操作的各个实施例。相反,提供该背景仅用以示出在其中可实践在此描述的部分实施例的一个示例性技术领域。
简要概述
在此所示的一个实施例涉及一种可在分布式计算环境中实施的方法。该方法包括用于查询有限数据源集的动作。该方法包括接收来自用户的查询。该方法还包括从有限数据源集中确定可被一起用于满足该查询的两个或更多个数据源的集合。该方法还包括将来自用户的查询的至少一部分翻译为对该两个或更多个数据源的语义合适查询。该方法还包括从该两个或更多个数据源接收这些语义合适查询的结果。该方法还包括聚集这些结果,并将聚集呈现给用户。
提供本概述是为了以简化的形式介绍将在以下具体实施方式中进一步描述的概念选择。本概述不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。
将在以下的描述中阐述另外的特征和优点,并且部分特征和优点可从该描述中显而易见,或者可从本文教导的实践中获知。本发明的特征和优点可以通过在所附权利要求中特别指出的手段和组合来实现并获取。本发明的特征将从以下描述和所附权利要求书中变得完全显而易见,或者可通过如下所述对本发明的实践而获知。
附图简述
为了描述可获得本主题的上述和其它优点和特征的方式,将通过参考附图中示出的本主题的具体实施例来呈现以上简要描述的本主题的更具体描述。应该理解,这些附图仅描绘了各典型实施例,因此其不应被认为是对范围的限制,各实施例将通过使用附图用附加特征和细节来描述并解释,在附图中:
图1示出了配置用于将查询接收进来,将查询翻译成语义合适查询的引擎;
图2示出了包括配置用于处理自然语言查询的专用功能的电子表格界面;
图3示出了配置用于连接到服务的聊天客户端,该服务可接收聊天形式的自然语言查询,并将这些查询翻译为对于底层数据存储的语义合适查询;
图4示出了配置用于允许管理员添加、编辑、和删除自然语言查询的管理控制板;
图5示出了管理控制板的示出了管理员能够如何将语义合适查询与自然语言的查询相关联的附加细节;
图6示出了查询有限的数据源集的方法。
详细描述
在此描述的一些实施例允许用户在通过数据平台展示的数据的顶上构建自然语言查询,所述数据平台具有它可从其中提供数据的一组数据提供者。一个这样的数据平台是以从华盛顿州雷蒙德市的微软公司获得的WindowsMarketplace(视窗云平台市场)。然而,各实施例可与包含结构化数据的其它存储一起使用。自然语言查询可被用作***的输入来形成对两个或更多个数据集提供者的语义合适查询,这两个或更多个数据集提供者可接着被使用这些语义合适查询来查询。来自两个或更多个提供者的结果可被聚集并作为单个统一结果提供给用户。
现参考图1,示出了一个示例。一些实施例包括位于中央位置中的(例如云104中的)、主存了查询模式集106的引擎102,该查询模式集耦合到底层数据存储108-1、108-2到108-n中的结构化数据。由用户100提供的查询110被映射到来自查询模式106的最接近的结构化模式,且引擎102接着针对结构化数据存储108-1、108-2到108-n中的两个或更多个执行查询112-1、112-2和112-m中的两个或更多个查询(其中在每个情况下,m和n均分别指示某个查询数和某个其他数据存储数,使得在仅仅三个明确示出时,省略号和变量m和n表示其它查询数和数据存储数可被实现)。针对不同数据存储的查询可一起使用。例如查询可被链接。来自一个或多个早先查询的输出(例如结果114-1、114-2或114-m中的一个或多个)可被用于后续查询(例如112-1到112-m中的一个或多个)。用户查询110和所选择的查询模式查询(查询112-1到112-m中的两个或更多个)的结果是特定值,该特定值随后被当做结果116返回给用户100。该值是对用户100通过该模式提出的问题的回答。
下面示出了一示例:自然语言查询“Crime rate in Seattle(西雅图的犯罪率)”映射到模式“Crime rate in{City}({城市}中的犯罪率)”,这接着被翻译成针对适合每个给定数据存储库的结构化数据存储库的查询集(诸如OData查询、SQL查询或以另一个查询语言的查询)。这些查询导致表示西雅图的犯罪率的特定值。随后将这一值返回给用户。
一些实施例可在电子表格应用(诸如从华盛顿州雷蒙德市的微软公司获得的)中使用查找或类似功能来实现。这样的示例在图2中示出。图2示出了电子表格应用的用户界面202。电子表格界面202的B列包括如下构建的专用查找(Lookup)命令:=DLOOKUP(“Crime rate in”&A5)。DLOOKUP命令可具有用于连接到引擎102和相关联的查询模式集106(见图1)的功能。用户可向单元格A5键入城市名,DLOOKUP将返回那个城市的犯罪率。该命令由引擎102翻译成可针对不同数据存储(诸如数据存储108-1到108-n)运行的语义合适查询。结果可接着被返回并在单元格B5显示。图2还在第8行示出了股票报价示例。在此示例中,单元格B5可具有如下构建的专用查找命令:=DLOOKUP(“Stock quote for”&A8)
替换地或附加地,各实施例可被实现为可在诸如Communicator(微软通信器)的即时消息收发客户端中使用的机器人(bot)。例如,用户可能能够使用即时消息收发客户端来连接到信息服务。现参考图3,示出了一个示例。图3示出了用于消息收发客户端的用户界面302。用户可提出自然语言查询,就像用户正在与另一个人类用户聊天一样。例如,图3示出了各种自然语言查询,包括“Last high temperature in Seattle(西雅图的最近高温)”、“Lastmarket price for MSFT(MSFT的最近市场价格)”、“Stock quote for MSFT(MSFT的股票报价)”、和“Crime rate in Seattle(西雅图的犯罪率)”。消息收发客户端可连接到服务,该服务具有对引擎102和查询模式集106的访问权。可使用查询模式集106来将那些自然语言查询翻译成针对信息服务可用的数据存储库(诸如存储库108-1到108-n)的语义合适查询(诸如查询112-1到112-m)。这些查询可接着被用于通过响应114-1到114-m获取数据,并构建对用户的自然语言问题的回答,并通过响应116传达到用户,如在来自图3的用户界面302所示的DataMarket Bot(数据市场机器人)的响应中示出的。
替换地或附加的,各实施例可被实现为使用语音的服务,诸如电话或其它应用。例如,用户可向电话或其它计算设备说自然语言问题。那个问题可被翻译成对信息服务可用的不同数据存储库的语义合适查询。这些查询可接着被用于获得数据并构建对用户的自然语言问题的回答。
可实现其中部分或全部模式可从底层结构化数据的方案中被推断的各实施例。继续上面的示例,如果数据展示了多个列,其中这些列被标注为“暴力犯罪”、“抢劫”、“国内犯罪”等,用户可输入的模式可以按“{Column_Name}in{City}({城市}中的{列名})”的形式来结构化,且{Column_Name}({列名})可以是这些列名之一。这通过依赖它所操作的结构化数据而使得引擎更智能。虽然前面的示例示出了列名的使用,各实施例不仅限于列名。相反,替换的或附加的实施例可包括正在应用的其它类型的语义。
模式还可以包含针对短语的某些常用变体的枚举类型,枚举类型是具有固定常数集合的类型。例如,模式可包括“crime rate{for|in}{City}({城市}{的/中的}犯罪率)”,其中for(的)和in(中的)是枚举类型的元素并表示搜寻相同信息的各问题中的常见变体。
该用户还可提供关于他们正在寻找或提供的数据类型的信息。例如,用户可***提示。例如,用户可提示他们正在请求应该是数字的答案(或者他们正在发送应该是数字的信息)且他们正在寻求文本作为结果。以此,以及在给定底层数据的结构的情况下,***将取上下文中有意义的值。
各实施例可附加地或替换地包括允许用户选择数据并提供关于数据类型的信息的功能。例如,用户可选择工作簿、文档中的表格、文本框中被逗号分开的元素中的一个或多个。用户可接着指出数据的类型。例如,用户可选择城市列表并向***提供这些是城市的指示。附加地或替换地,***还可通过看所选区域的列标题或甚至通过检查文档的进一步上下文来确定类型。这个结构化输入可被用来对引擎102理解的各查询模式106中的一个或多个模式进行匹配,并向用户100提供哪些模式可被应用的智能选项。具体地,通过***知晓用户有什么信息可用于作出查询,***可在用户界面内显示它可获得的、将适合用户可用作输入的数据元素的一般查询模式。用户可随后从他们可获得的信息中选择合适的查询并填充可变元素。
下面示出了另一示例。用户有一组城市,例如,西雅图、旧金山、拉斯维加斯等。用户在用户界面中选择这些城市并寻找体验,其中她/他可告诉***这些是城市。在***告诉用户有3个模式让他可使用这个数据来扩充他的工作之后:(1)城市中的犯罪率,(2)城市中当前的温度,(3)城市中平均收入。用户为他们的那组城市选择这些选项之一,且该选择被添加到用户的查询。***通过知晓用户可获得什么数据点可提示用户他们可能运行什么查询。一旦用户已经选择了自然语言查询,***可将查询翻译为语义合适查询112-1到112-m来从数据存储108-1到108-n获得结果114-1到114-m,其可被合并以向用户100提供结果116。
各实施例可包括用于允许管理员构建诸如图1所示的查询模式106的查询模式的功能。图4示出了管理员控制板用户界面400,其允许管理员管理查询模式。使用管理员控制板400,管理员可添加、编辑,或删除查询模式。具体地,管理员可确定什么语义合适查询映射到什么自然语言查询。图5示出了用户界面500,它示出了允许管理员添加新自然语言模式的界面。管理员可将自然语言模式输入模式界面502。管理员可接着在查询字段504中输入多个语义合适查询。注意在图5所示出的示例中,输入到查询字段504中的各查询模式以允许并行查询被执行的方式链接。然而,在其它实施例中,管理员可指示查询要被链接。具体地,当定义已链接查询时,管理员可指示来自先前查询的输出可被用作后续查询的输入。因此,语义合适查询可被链接以构建更丰富且更有意义的查询。
以下讨论现涉及可以执行的多种方法以及方法动作。虽然用特定次序讨论或用以特定次序发生的流程图示出了各个方法动作,但除非明确规定或因为一动作依赖于另一动作在执行该动作之前完成而需要特定次序,否则不需要特定次序。
现在参考图6,示出了方法600。方法600可在分布式计算环境中实施,并包括用于查询有限数据源集的动作。该方法包括接收来自用户的查询(动作602)。例如,图1示出了云104中的接收来自用户100的查询110的引擎102。在一些实施例中,方法600可实施,其中从用户接收的查询是自然语言查询。
方法600还包括从有限数据源集中确定可被一起用于满足该查询的两个或更多个数据源的集合(动作604)。例如,引擎102可从数据存储108-1到108-n的集合中确定两个或更多个结构化数据存储。这些两个或更多个结构化数据存储可具有可满足用户查询的信息。
在一些实施例中,方法600可被实施,其中确定两个或更多个数据源的集合包括标识可被一起使用的数据源。例如,标识可被一起使用的数据源可包括基于许可(包括,例如访问特定数据存储中的数据的成本)、使用条款、数据源的数据结构、输入和输出兼容性,或数据集目的中的至少一个来标识可被一起使用的数据源。例如,许可限制或要求可要求支付特定费用以访问特定数据源或特定数据源被一起使用或不被一起使用。类似地,用户需求条款可对***具有类似限制。在另一个示例中,数据在各种不同存储库中被组织的方式可能使得那个数据更适合和其它存储库一起使用。因此,那些存储库可被一起使用。例如,一些数据存储可能更适合语言翻译查询,而其它数据存储更合适报告体育分数、天气预报,或财经信息。
在替换的或附加的实施例中,确定两个或更多个数据源的集合可包括基于先前的选择数据源的用户交互来标识数据源。例如,先前用户搜索可被用来确定合适的数据源。先前的用户交互可指示用户搜索的数据存储或信息的类型。因此,***可开发与另一个数据存储或另一类数据存储相比对一个数据存储或一类数据存储的偏好。
方法600还包括将来自用户的查询的至少一部分翻译为针对该两个或更多个数据源的语义合适查询(动作606)。例如,查询110可使用查询模式106被翻译成语义合适查询。这些语义合适查询可被用来查询数据存储108-1到108-n中的两个或更多个。
如下面将详述的,查询数据存储可并行、串行或以其它合适方式完成。例如,现在示出串行查询场景,用户100可提交查询110。查询110可被匹配到来自模式集106的模式,其中所匹配的模式是语义合适数据存储108-1的模式。语义合适数据存储108-1的查询112-1可被生成并针对数据存储108-1运行,从而得到结果114-1。该结果114-1可被用于生成第二查询112-1,该第二查询针对不同的数据存储108-2运行,从而得到结果114-2。这可能是返回给用户的结果116,或者附加的查询可以所描述的串行方式针对数据存储108-1到108-n的集合中的不同数据存储执行,直到找到合适结果。
在并行示例中,查询110可被翻译成两个或更多个查询,诸如为要分别针对数据存储108-1和108-2运行的语义合适查询的查询112-1和112-2。这些两个查询112-1和112-2可并行运行且它们的结果被聚集以产生返回给用户100的结果116。
方法600还包括从该两个或更多个数据源接收这些语义合适查询的结果(动作608)。例如,如图1所示,结果114-1和114-2可分别作为对数据存储108-1和108-2的查询结果112-1和112-2来接收。
方法600还包括聚集结果(动作610)。例如,如图1所示,结果114-1和114-2可被聚集成结果116。方法600还包括将聚集呈现给用户。例如,结果116可被返回给用户。
如上所示,方法600可被实施,其中语义合适查询串行运行且其中聚集包括将来自一个数据源的结果用于对另一个数据源的查询。例如,上面示出了各实施例,其中查询112-2使用结果114-1形成,使得聚集通过使用一个结果来构建后一个查询来发生。
替换地或附加地,方法600可被实施,其中语义合适查询并行运行,且并行结果被聚集。例如,查询112-1和112-2可相互独立运行,但一旦两个结果被接收,则结果114-1和114-2可被聚集。
方法600可被实施,其中聚集查询包括聚集一个或多个经高速缓存的查询。例如,查询112-1到112-m中的一个或多个可以在某一时间运行(独立地运行或在履行前一次用户查询110时运行),而对应结果114-1到114-m被高速缓存在引擎102。当后续查询110被运行时,经高速缓存的结果可被使用来满足查询110。
在此示出的***可以是可扩展的,因为当***能够访问固定数据存储集时,附加的第三方数据存储可被添加到***可访问的数据存储集。具体地,各种第三方能够订阅数据平台服务以使得它们的数据可通过数据平台服务获得。通常,数据平台服务可通过以下来获得财务报酬:向内容提供者收取主存特定数据存储的费用,或通过向用户收取从数据存储访问数据的费用,同时可能将收到的费用的部分传回数据存储中的数据的提供者。因此,对于数据平台服务提供者和数据提供者,一起合作工作以增加数据平台上可用的数据存储的数量是有益的。
方法600的各实施例可被实施,其中用户查询基于指示用户可询问的查询的类型的至少一个***提示。例如,在上面所示示例中,***的各实施例可标识用户可获得的数据的类型。例如,用户可获得城市列表。***可标识用户可获得数据集中的城市列表。***接着可提供关于用户可能希望询问什么查询(诸如“给定城市的犯罪率是多少”或“给定城市的温度是多少”)的提示。
此外,各种方法可由包括一个或多个处理器和诸如计算机存储器等计算机可读介质的计算机***来实施。具体而言,计算机存储器可存储计算机可执行指令,这些指令在由一个或多个处理器执行时使得诸如各实施例中所述的各个动作等各种功能被执行。
本发明的各实施例可以包括或利用包含计算机硬件的专用或通用计算机,这将在下文中更详细地讨论。本发明范围内的各实施例还包括用于承载或存储计算机可执行指令和/或数据结构的物理和其他计算机可读介质。这样的计算机可读介质可以是可由通用或专用计算机***访问的任何可用介质。存储计算机可执行指令的计算机可读介质是物理存储介质。承载计算机可执行指令的计算机可读介质是传输介质。由此,作为示例而非限制,本发明的各实施例可包括至少两种显著不同的计算机可读介质:物理计算机可读存储介质和传输计算机可读介质。
物理计算机存储介质包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储(如CD、DVD等)、磁盘存储或其他磁存储设备、或可用于存储计算机可执行指令或数据结构形式的所需程序代码装置且可由通用或专用计算机访问的任何其他介质。
“网络”被定义为使得电子数据能够在计算机***和/或模块和/或其它电子设备之间传输的一个或多个数据链路。当信息通过网络或另一个通信连接(硬连线、无线、或者硬连线或无线的组合)传输或提供给计算机时,该计算机将该连接适当地视为传输介质。传输介质可包括可用于携带计算机可执行指令或数据结构形式的所需程序代码装置且可由通用或专用计算机访问的网络和/或数据链路。以上介质的组合也被包括在计算机可读介质的范围内。
此外,在到达各种计算机***组件时,以计算机可执行的指令或数据结构的形式存在的程序代码装置可以自动地从传输计算机可读介质传输到物理计算机可读存储介质(或者反之亦然)。例如,通过网络或数据链路接收到的计算机可执行指令或数据结构可被缓存在网络接口模块(例如,“NIC”)内的RAM中,然后最终被传送到计算机***RAM和/或计算机***处的较不易失性的计算机可读物理存储介质。因此,计算机可读物理存储介质可被包括在同样(或甚至主要)利用传输介质的计算机***组件中。
计算机可执行指令包括,例如使通用计算机、专用计算机、或专用处理设备执行某一功能或某组功能的指令和数据。计算机可执行指令可以是例如二进制代码、诸如汇编语言之类的中间格式指令、或甚至源代码。尽管用结构特征和/或方法动作专用的语言描述了本主题,但可以理解,所附权利要求书中定义的主题不必限于上述特征或动作。更具体而言,上述特征和动作是作为实现权利要求的示例形式而公开的。
作为替代或除此之外,本文所描述的功能可至少部分地由一个或多个硬件逻辑组件来执行。例如,但非限制,可被使用的硬件逻辑组件的说明性类型包括现场可编程门阵列(FPGA)、程序专用的集成电路(ASIC)、程序专用的标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑器件(CPLD)等。
本领域的技术人员将理解,本发明可以在具有许多类型的计算机***配置的网络计算环境中实践,这些计算机***配置包括个人计算机、台式计算机、膝上型计算机、消息处理器、手持式设备、多处理器***、基于微处理器的或可编程消费电子设备、网络PC、小型计算机、大型计算机、移动电话、PDA、寻呼机、路由器、交换机等等。本发明也可在其中通过网络链接(或者通过硬连线数据链路、无线数据链路,或者通过硬连线和无线数据链路的组合)的本地和远程计算机***两者都执行任务的分布式***环境中实施。在分布式***环境中,程序模块可以位于本地和远程存储器存储设备二者中。
本发明可具体化为其他具体形式而不背离其精神或特征。所描述的实施例在所有方面都应被认为仅是说明性而非限制性的。因此,本发明的范围由所附权利要求书而非前述描述指示。落入权利要求书的等效方案的含义和范围内的所有改变应被权利要求书的范围所涵盖。

Claims (10)

1.一种在分布式计算环境中查询有限数据源集的方法,所述方法包括:
从用户接收查询;
从所述有限数据源集中确定可被一起用于满足所述查询的两个或更多个数据源的集合;
将来自所述用户的所述查询的至少一部分翻译为针对所述两个或更多个数据源的语义合适查询;
从所述两个或更多个数据源接收所述语义合适查询的结果;
聚集所述结果;
并将所述聚集呈现给所述用户。
2.如权利要求1所述的方法,其特征在于,从所述用户接收的所述查询是自然语言查询。
3.如权利要求1所述的方法,其特征在于,语义合适查询串行运行,且其中聚集包括将来自一个数据源的结果用于针对另一数据源的查询。
4.如权利要求1所述的方法,其特征在于,语义合适查询并行运行,且并行结果被聚集。
5.如权利要求1所述的方法,其特征在于,还包括扩展性地向所述有限数据源集添加第三方数据源。
6.如权利要求1所述的方法,其特征在于,确定两个或更多个数据源的集合包括标识能够被一起使用的数据源。
7.如权利要求6所述的方法,其特征在于,标识能够被一起使用的数据源包括基于许可、使用条款、数据结构、输入和输出兼容性,或数据集目的中的至少一个来标识能够被一起使用的数据源。
8.如权利要求1所述的方法,其特征在于,确定两个或更多个数据源的集合包括基于先前的选择数据源的用户交互来标识数据源。
9.如权利要求1所述的方法,其特征在于,所述用户查询基于指示所述用户能询问的查询的类型的至少一个***提示。
10.如权利要求1所述的方法,其特征在于,聚集查询包括聚集一个或多个经高速缓存的查询。
CN201380025501.9A 2012-05-15 2013-05-07 对结构数据基于场景的洞察 Pending CN104303180A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/471,707 US20130311447A1 (en) 2012-05-15 2012-05-15 Scenario based insights into structure data
US13/471,707 2012-05-15
PCT/US2013/039793 WO2013173113A1 (en) 2012-05-15 2013-05-07 Scenario based insights into structure data

Publications (1)

Publication Number Publication Date
CN104303180A true CN104303180A (zh) 2015-01-21

Family

ID=48468796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380025501.9A Pending CN104303180A (zh) 2012-05-15 2013-05-07 对结构数据基于场景的洞察

Country Status (4)

Country Link
US (3) US20130311447A1 (zh)
EP (1) EP2850543A1 (zh)
CN (1) CN104303180A (zh)
WO (1) WO2013173113A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109992650A (zh) * 2018-01-02 2019-07-09 国际商业机器公司 用于在运行中提供个性化洞察的认知对话代理

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130311447A1 (en) 2012-05-15 2013-11-21 Microsoft Corporation Scenario based insights into structure data
US9805053B1 (en) 2013-02-25 2017-10-31 EMC IP Holding Company LLC Pluggable storage system for parallel query engines
US9984083B1 (en) 2013-02-25 2018-05-29 EMC IP Holding Company LLC Pluggable storage system for parallel query engines across non-native file systems
BR102015004521B1 (pt) * 2015-02-27 2023-09-26 Samsung Eletrônica da Amazônia Ltda. Método para comunicação entre usuários e dispositivos inteligentes
US9703848B2 (en) 2015-11-13 2017-07-11 International Business Machines Corporation Caching linked queries for optimized compliance management
US11516153B2 (en) * 2016-01-25 2022-11-29 Expensify, Inc. Computer system providing a chat engine
US20170345079A1 (en) * 2016-05-31 2017-11-30 Accenture Global Solutions Limited Network of smart appliances
US10732796B2 (en) 2017-03-29 2020-08-04 Microsoft Technology Licensing, Llc Control of displayed activity information using navigational mnemonics
US10885586B2 (en) * 2017-07-24 2021-01-05 Jpmorgan Chase Bank, N.A. Methods for automatically generating structured pricing models from unstructured multi-channel communications and devices thereof
US10824483B2 (en) * 2018-11-20 2020-11-03 R Software Inc. Application programming interface scoring, ranking and selection
US10943172B1 (en) * 2020-11-05 2021-03-09 Birdview Films, LLC Real-time predictive knowledge pattern machine
US11188833B1 (en) * 2020-11-05 2021-11-30 Birdview Films. Llc Real-time predictive knowledge pattern machine
US11693874B2 (en) * 2020-11-25 2023-07-04 Sap Se Framework to facilitate data access
US11995075B2 (en) 2021-10-27 2024-05-28 Bank Of America Corporation System and method for efficient transliteration of machine interpretable languages

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002017101A1 (en) * 2000-08-22 2002-02-28 Active Buddy,Inc. Method and system for interactively responding to instant messaging requests
CN1647076A (zh) * 2002-03-28 2005-07-27 莱恩生物科学有限公司 查询关系数据库的方法和设备
US20070168323A1 (en) * 2006-01-03 2007-07-19 Microsoft Corporation Query aggregation
CN101401062A (zh) * 2006-02-16 2009-04-01 移动容量网络公司 确定相关来源、查询及合并多个内容来源的结果的方法和***
CN101908040A (zh) * 2010-07-01 2010-12-08 千乡万才科技(中国)有限公司 一种数据报表***
US20110047171A1 (en) * 2009-08-24 2011-02-24 Microsoft Corporation Answering web queries using structured data sources
US20120110001A1 (en) * 2010-11-01 2012-05-03 Brian Fletcher Young Systems And Methods For Fast Remote Data Access From A Spreadsheet

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5913214A (en) 1996-05-30 1999-06-15 Massachusetts Inst Technology Data extraction from world wide web pages
US7007275B1 (en) 1999-10-21 2006-02-28 Unisys Corporation Method and apparatus for automatic execution of concatenated methods across multiple heterogeneous data sources
AU2001270069A1 (en) * 2000-06-23 2002-01-08 The Johns-Hopkins University Architecture for distributed database information access
CA2442869A1 (en) * 2001-03-30 2002-10-10 Goldman, Sachs & Co. Method and system for processing queries requiring coordinated access to distributed databases
US7526425B2 (en) 2001-08-14 2009-04-28 Evri Inc. Method and system for extending keyword searching to syntactically and semantically annotated data
CA2372092C (en) 2002-02-15 2010-04-06 Cognos Incorporated A queuing model for a plurality of servers
US20050102065A1 (en) 2003-11-10 2005-05-12 Conversive, Inc. Method and system for programming virtual robots using a template
US7124142B2 (en) 2003-11-10 2006-10-17 Conversive, Inc. Method and system for responding to requests relating to complex data maintained in a structured form
US7711742B2 (en) * 2003-12-11 2010-05-04 International Business Machines Corporation Intelligent data query builder
US20050278231A1 (en) * 2004-06-15 2005-12-15 Teeter Tobias A Method of recovery of electronic shopping cart information for reinitiation of the check-out process
US7720674B2 (en) 2004-06-29 2010-05-18 Sap Ag Systems and methods for processing natural language queries
US8065316B1 (en) * 2004-09-30 2011-11-22 Google Inc. Systems and methods for providing search query refinements
US7461059B2 (en) * 2005-02-23 2008-12-02 Microsoft Corporation Dynamically updated search results based upon continuously-evolving search query that is based at least in part upon phrase suggestion, search engine uses previous result sets performing additional search tasks
US8386469B2 (en) * 2006-02-16 2013-02-26 Mobile Content Networks, Inc. Method and system for determining relevant sources, querying and merging results from multiple content sources
JP2007249785A (ja) 2006-03-17 2007-09-27 Fujitsu Ltd コンパイルプログラム、仮想データベースリモートアクセス用プログラムの製造方法、及び仮想データベースのリモートアクセス方法
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US20080167907A1 (en) * 2007-01-05 2008-07-10 Carl De Marcken Cache poller for providing travel planning information
US8176440B2 (en) * 2007-03-30 2012-05-08 Silicon Laboratories, Inc. System and method of presenting search results
US8239751B1 (en) * 2007-05-16 2012-08-07 Google Inc. Data from web documents in a spreadsheet
US20080294612A1 (en) * 2007-05-22 2008-11-27 It-Workplace Method For Generating A Representation Of A Query
WO2008154032A1 (en) * 2007-06-11 2008-12-18 Nextdb.Net Secure hosted databases
US8103654B2 (en) * 2007-06-26 2012-01-24 Mikhail Gilula System and method for querying heterogeneous data sources
US8005643B2 (en) 2007-06-26 2011-08-23 Endeca Technologies, Inc. System and method for measuring the quality of document sets
WO2009017158A1 (ja) * 2007-08-01 2009-02-05 Nec Corporation 変換プログラム探索システムおよび変換プログラム探索方法
US20090112835A1 (en) 2007-10-24 2009-04-30 Marvin Elder Natural language database querying
US8538985B2 (en) * 2008-03-11 2013-09-17 International Business Machines Corporation Efficient processing of queries in federated database systems
US8000993B2 (en) * 2008-04-14 2011-08-16 Tra, Inc. Using consumer purchase behavior for television targeting
WO2010139277A1 (en) * 2009-06-03 2010-12-09 Google Inc. Autocompletion for partially entered query
CN101925045B (zh) * 2009-06-17 2015-07-22 中兴通讯股份有限公司 一种提供用户业务数据的方法及***
US8818926B2 (en) 2009-09-29 2014-08-26 Richard Scot Wallace Method for personalizing chat bots
US8631004B2 (en) * 2009-12-28 2014-01-14 Yahoo! Inc. Search suggestion clustering and presentation
EP2365447A1 (en) 2010-03-11 2011-09-14 British Telecommunications Data integration system
US8260789B2 (en) * 2010-04-01 2012-09-04 Microsoft Corporation System and method for authority value obtained by defining ranking functions related to weight and confidence value
US8910890B2 (en) * 2010-11-24 2014-12-16 Honda Motor Co., Ltd. Seeding device
JP5353932B2 (ja) * 2011-03-25 2013-11-27 ブラザー工業株式会社 情報処理プログラム、情報処理装置、および情報処理方法
US9881063B2 (en) * 2011-06-14 2018-01-30 International Business Machines Corporation Systems and methods for using graphical representations to manage query results
US8458189B1 (en) * 2011-11-28 2013-06-04 Sap Ag Automatic tagging between structured/unstructured data
US8935277B2 (en) * 2012-03-30 2015-01-13 Sap Se Context-aware question answering system
US20130311447A1 (en) 2012-05-15 2013-11-21 Microsoft Corporation Scenario based insights into structure data

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002017101A1 (en) * 2000-08-22 2002-02-28 Active Buddy,Inc. Method and system for interactively responding to instant messaging requests
CN1647076A (zh) * 2002-03-28 2005-07-27 莱恩生物科学有限公司 查询关系数据库的方法和设备
US20070168323A1 (en) * 2006-01-03 2007-07-19 Microsoft Corporation Query aggregation
CN101401062A (zh) * 2006-02-16 2009-04-01 移动容量网络公司 确定相关来源、查询及合并多个内容来源的结果的方法和***
US20110047171A1 (en) * 2009-08-24 2011-02-24 Microsoft Corporation Answering web queries using structured data sources
CN101908040A (zh) * 2010-07-01 2010-12-08 千乡万才科技(中国)有限公司 一种数据报表***
US20120110001A1 (en) * 2010-11-01 2012-05-03 Brian Fletcher Young Systems And Methods For Fast Remote Data Access From A Spreadsheet

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
马扶广: "基于LDAP的异构数据源集成技术的分析与设计", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109992650A (zh) * 2018-01-02 2019-07-09 国际商业机器公司 用于在运行中提供个性化洞察的认知对话代理
CN109992650B (zh) * 2018-01-02 2023-07-14 国际商业机器公司 用于从问答***中的数据来补充洞察的方法和装置

Also Published As

Publication number Publication date
US20170220574A1 (en) 2017-08-03
US20150120711A1 (en) 2015-04-30
US10853361B2 (en) 2020-12-01
WO2013173113A1 (en) 2013-11-21
US20130311447A1 (en) 2013-11-21
EP2850543A1 (en) 2015-03-25

Similar Documents

Publication Publication Date Title
CN104303180A (zh) 对结构数据基于场景的洞察
Liu et al. Keywords‐Driven and Popularity‐Aware Paper Recommendation Based on Undirected Paper Citation Graph
Chen et al. Business intelligence and analytics: From big data to big impact
Chen et al. Big data: related technologies, challenges and future prospects
Hogan The semantic web: two decades on
Ma et al. Big graph search: challenges and techniques
CN102541631B (zh) 以多线程不同驱动源执行计划处理查询的方法和***
CN103477319A (zh) 移动设备上的文件搜索
Amanoul et al. Orchestrating Distributed Computing and Web Technology with Semantic Web and Big Data
Burton et al. The data-literature interlinking service: Towards a common infrastructure for sharing data-article links
Sharma et al. Big data analysis in cloud and machine learning
Amghar et al. Storing, preprocessing and analyzing tweets: finding the suitable noSQL system
Blümel et al. The quest for research information
Billot et al. Introduction to big data and its applications in insurance
de Faria Cordeiro et al. An approach for managing and semantically enriching the publication of Linked Open Governmental Data
Zhang et al. Personalized manufacturing service recommendation using semantics-based collaborative filtering
Atta The effect of usability and information quality on decision support information system (DSS)
US20170004134A1 (en) Asynchronous search query
Abrahams Tourism information systems integration and utilization within the semantic web
Akoka et al. Research on Big Data: Characterizing the Field and Its Dimensions
Fan Architecture model of intelligent marketing system based on big data
CN107633870A (zh) 数据提取方法及装置、存储介质、电子设备
Telang et al. Information Integration across Heterogeneous Domains: Current Scenario, Challenges and the InfoMosaic Approach
Liu et al. An Abstract Description Method of Map‐Reduce‐Merge Using Haskell
Ahmed et al. A hybrid p2p search engine for social learning

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150409

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150409

Address after: Washington State

Applicant after: Micro soft technique license Co., Ltd

Address before: Washington State

Applicant before: Microsoft Corp.

WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150121