CN106462569B - 结构化的自然语言表示 - Google Patents

结构化的自然语言表示 Download PDF

Info

Publication number
CN106462569B
CN106462569B CN201580031725.XA CN201580031725A CN106462569B CN 106462569 B CN106462569 B CN 106462569B CN 201580031725 A CN201580031725 A CN 201580031725A CN 106462569 B CN106462569 B CN 106462569B
Authority
CN
China
Prior art keywords
natural language
structured natural
input
data fields
structured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580031725.XA
Other languages
English (en)
Other versions
CN106462569A (zh
Inventor
雅克-奥利弗·古萨尔德
理查德·J·博福特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Nuance Communications Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nuance Communications Inc filed Critical Nuance Communications Inc
Publication of CN106462569A publication Critical patent/CN106462569A/zh
Application granted granted Critical
Publication of CN106462569B publication Critical patent/CN106462569B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)

Abstract

根据公开内容的方面,一种计算设备可识别与自动化的对话应用相关联的提示。自动化的对话应用的应用预期可以被识别。应用预期可包括用于对提示的自然语言响应的结构化的自然语言表示。计算设备可接收响应于提示的自然语言输入,并利用自然语言输入的至少一部分来填充结构化的自然语言表示的一个或多个数据字段,以及可使用结构化的自然语言表示的一个或多个数据字段来响应应用预期。

Description

结构化的自然语言表示
相关申请的交叉引用
本申请要求于2014年6月13日提交的且题为“STRUCTURED NATURAL LANGUAGEREPRESENTATIONS”的美国专利申请序列号14/304,289的优先权益,该申请的公开内容通过引用将其整个地并入本文并构成本文的部分。
技术领域
本公开内容涉及自然语言理解。特别地,本公开内容涉及利用结构化的自然语言表示来响应于自动化对话应用的应用预期的计算机***。
背景
自动化的对话***被用于基于自然语言输入(例如,用户说出的话语)来运用数据。这样的***通常以至少三种方式来表示数据:自然语言表示,表示自然语言(或说出的话语)的意思;数据储存表示,以编程形式表示相应的数据;以及编程语言的表示,表示用于由底层应用利用并运用的数据。这些表示通常彼此以隔离的形式进行设计,从而在它们之间存在逻辑差距。连结这些差距的一种方式是扁平化(flatten)自然语言表示(例如,通过将其映射出成键-值对关联)。例如,这种方式通过语音可扩展标记语言(VXML)标准进行采用。然而,这种扁平方式将重构信息结构的负担放在了底层应用上导致了不佳的表示。
概述
下面呈现了简化的概述,以便提高对本公开内容的某些方面的基本理解。该概述并非本公开内容的穷尽的综述。并非旨在识别本公开内容的关键或必要元素,也并非旨在划定本公开内容的范围。下面的概述仅仅以作为后面的描述部分的前奏的简化的形式来呈现本公开内容的某些概念。
根据一个或多个实施方式,一种计算设备可以识别与自动化对话应用相关联的提示。自动化对话应用的应用预期可以被识别。应用预期可以包括用于对提示的自然语言响应的结构化的自然语言表示。计算设备可以接收响应于提示的自然语言输入,用自然语言输入的至少一部分填充结构化的自然语言表示的一个或多个数据字段,以及可以利用该结构化的自然语言表示的一个或多个数据字段来响应于应用预期。
在某些实施方式中,关于自然语言输入的该结构化的自然语言表示可包括标量结构化的自然语言表示。在这样的实施方式中,结构化的自然语言表示的一个或多个数据字段可包括被配置用于文本字符串的至少一个数据字段,以及填充结构化的自然语言表示的一个或多个数据字段可包括将自然语言输入的至少一部分转换成输入文本字符串,并且利用输入文本字符串填充被配置用于文本字符串的至少一个数据字段。附加地或可选地,结构化的自然语言表示的一个或多个数据字段可包括被配置用于数值的至少一个数据字段,以及填充结构化的自然语言表示的一个或多个数据字段可包括将自然语言输入的至少一部分转换成输入数值,并且利用输入数值来填充被配置用于数值的至少一个数据字段。
在某些实施方式中,用于自然语言输入的结构化的自然语言表示可以包括列表式结构化的自然语言表示。该列表式结构化的自然语言表示可包括共同类型的多个结构化的自然语言表示。在这样的实施方式中,自然语言输入的至少一部分可包括相应于共同类型的自然语言输入的第一部分和相应于共同类型的自然语言输入的第二部分。填充结构化的自然语言表示的一个或多个数据字段可包括利用自然语言输入的第一部分来填充共同类型的多个结构化的自然语言表示的第一结构化的自然语言表示的一个或多个字段,以及利用自然语言输入的第二部分来填充共同类型的多个结构化的自然语言表示的第二结构化的自然语言表示的一个或多个字段。
在某些实施方式中,第一结构化的自然语言表示的一个或多个字段可被配置用于文本字符串,以及第二结构化的自然语言表示的一个或多个字段也可被配置用于文本字符串。在这样的实施方式中,填充第一结构化的自然语言表示的一个或多个字段可包括将自然语言输入的第一部分转换成第一输入文本字符串,并利用第一输入文本字符串来填充第一结构化的自然语言表示的一个或多个字段,以及填充第二结构化的自然语言表示的一个或多个字段可包括将自然语言输入的第二部分转换成第二输入文本字符串,并利用第二输入文本字符串来填充第二结构化的自然语言表示的一个或多个字段。附加地或可选地,第一结构化的自然语言表示的一个或多个字段可被配置用于数值,且第二结构化的自然语言表示的一个或多个字段可被配置用于数值。在这样的实施方式中,填充第一结构化的自然语言表示的一个或多个字段可包括将自然语言输入的第一部分转换成第一输入数值,并利用第一输入数值来填充第一结构化的自然语言表示的一个或多个字段,以及填充第二结构化的自然语言表示的一个或多个字段可包括将自然语言输入的第二部分转换成第二输入数值,并利用第二输入数值来填充第二结构化的自然语言表示的一个或多个字段。
在某些实施方式中,用于自然语言输入的结构化的自然语言表示可包括层次结构化的自然语言表示。层次结构化的自然语言表示可包括多个不同的结构化的自然语言表示和一个或多个属性。一个或多个属性可使多个不同的结构化的自然语言表示相互关联。
在某些实施方式中,一个或多个属性中的至少一个属性可以指示多个不同的结构化的自然语言表示中的第一不同的结构化的自然语言表示是多个不同的结构化的自然语言表示中的第二不同的结构化的自然语言表示的子类型。在这样的实施方式中,用于自然语言输入的结构化的自然语言表示可包括多个不同的结构化的自然语言表示中的第二不同的结构化的自然语言表示,以及填充结构化的自然语言表示的一个或多个数据字段可包括填充多个不同的结构化的自然语言表示中的第一不同的结构化的自然语言表示的一个或多个数据字段。在某些实施方式中,多个不同的结构化的自然语言表示中的第一不同的结构化的自然语言表示的一个或多个数据字段可被配置用于文本字符串,以及填充多个不同的结构化的自然语言表示中的第一不同的结构化的自然语言表示的一个或多个数据字段可包括将自然语言输入的至少一部分转换成输入文本字符串,并且利用输入文本字符串来填充多个不同的结构化的自然语言表示中的第一不同的结构化的自然语言表示的一个或多个数据字段。附加地或可选地,多个不同的结构化的自然语言表示中的第一不同的结构化的自然语言表示的一个或多个数据字段可被配置用于数值,并且填充多个不同的结构化的自然语言表示中的第一不同的结构化的自然语言表示的一个或多个数据字段可包括将自然语言输入的至少一部分转换成输入数值,并利用输入数值来填充多个不同的结构化的自然语言表示中的第一不同的结构化的自然语言表示的一个或多个数据字段。
在某些实施方式中,一个或多个属性中的至少一个属性可指示多个不同的结构化的自然语言表示中的第一不同的结构化的自然语言表示包括多个不同的结构化的自然语言表示中的第二不同的结构化的自然语言表示。在这样的实施方式中,用于自然语言输入的结构化的自然语言表示可包括多个不同的结构化的自然语言表示中的第一不同的结构化的自然语言表示,并且填充结构化的自然语言表示的一个或多个数据字段可包括填充多个不同的结构化的自然语言表示中的第二不同的结构化的自然语言表示的一个或多个数据字段。在某些实施方式中,多个不同的结构化的自然语言表示中的第二不同的结构化的自然语言表示的一个或多个数据字段可被配置用于文本字符串,以及填充多个不同的结构化的自然语言表示中的第二不同的结构化的自然语言表示的一个或多个数据字段可包括将自然语言输入的至少一部分转换成输入文本字符串,并且利用输入文本字符串来填充多个不同的结构化的自然语言表示中的第二不同的结构化的自然语言表示的一个或多个数据字段。附加地或可选地,多个不同的结构化的自然语言表示中的第二不同的结构化的自然语言表示的一个或多个数据字段可被配置用于数值,且填充多个不同的结构化的自然语言表示中的第二不同的结构化的自然语言表示的一个或多个数据字段可包括将自然语言输入的至少一部分转换成输入数值,并利用输入数值来填充多个不同的结构化的自然语言表示中的第二不同的结构化的自然语言表示的一个或多个数据字段。
在某些实施方式中,响应应用预期可包括将储存在结构化的自然语言表示的一个或多个数据字段中的数据传递到自动化的对话应用。附加地或可选地,响应应用预期可包括更改由自动化的对话应用使用的数据库表以反映储存在结构化的自然语言表示的一个或多个数据字段中的数据。
其他的细节和特征将在以下的章节中进行描述。
附图简述
本公开内容指出了所附权利要求中的特定内容。在整体上查阅包括随附提供的附图的本公开内容的基础上,本公开内容的特征将会变得更加明显。
在所附的附图的图中,本文中的某些特征是以示例的方式进行示出的,而非限制性的方式,其中相似的参考数字指的是相似的元素,且其中:
图1描绘的是示例性的计算设备,该示例性的计算设备用于根据一个或多个示例性的实施方式使用结构化的自然语言表示响应自动化的对话应用的应用预期;
图2描绘的是示例性的方法,该示例性的方法用于根据一个或多个示例性的实施方式使用结构化的自然语言表示响应自动化的对话应用的应用预期;
图3描绘的是示例性的方法,该示例性的方法用于根据一个或多个示例性的实施方式使用列表式结构化的自然语言表示响应自动化的对话应用的应用预期;
图4描绘的是示例性的方法,该示例性的方法用于根据一个或多个示例性的实施方式使用具有子类型属性的层次结构化的自然语言表示响应自动化的对话应用的应用预期;
图5描绘的是示例性的方法,该示例性的方法用于根据一个或多个示例性的实施方式使用具有要素属性的层次结构化的自然语言表示响应自动化的对话应用的应用预期。
详细描述
各个示例性实施方式的以下描述中,对附图进行了参考,附图构成本文的一部分,且其中通过示例的方式示出了可以实践本公开内容的方面的各个实施方式。要理解的是,其他的实施方式可以被利用,且可以进行结构上和功能上的修改,而这并不偏离本公开内容的范围。
注意,在以下描述中讨论了元素之间的各种连接。注意,这些连接是通用的,且除非另外特别指明,可以是直接的或间接的、无线的或有线的,且说明书并非旨在限于这点。
图1描绘的是示例性的计算设备,该示例性的计算设备用于根据一个或多个示例性的实施方式使用结构化的自然语言表示响应自动化的对话应用的应用预期。参照图1,计算设备100可以是能够执行本文描述的功能的任何类型的计算设备(或其组合)。例如,计算设备100可以是服务器、刀片服务器、台式电脑、笔记本电脑、平板电脑、智能手机、移动设备等等。计算设备100可以包括处理器102和存储器104。数据总线106可以将处理器102和存储器104互连,且可以支持在处理器102和存储器104之间的通信。存储器104可以包括包含可执行指令的一个或多个程序模块,当可执行指令被处理器102执行时,引起(或配置)计算设备100执行本文描述的一个或多个功能。例如,存储器104可以包括NLU模块108和自动化的对话应用模块110。
NLU模块108可以包括与分解和/或解析自然语言输入(如,计算设备100的用户说出的话语)并将表示自然语言输入的数据(或其部分)传达给自动化的对话应用模块110有关联的可执行指令。自动化的对话应用模块110可以包括与产生提示(如,音频提示)、处理对提示的响应(如,从NLU模块108接收的表示响应的数据)和/或基于响应来运用数据(如,底层应用数据)的一个或多个支持的自动化的对话应用相关联的指令。在某些实施方式中,存储器104可以还包括相关的数据库112。相关的数据库112可以包括储存与自动化的对话应用模块110(或与其相关联的一个或多个应用)相关联的信息的一个或多个数据结构(如,表)。
自动化的对话应用模块110可以识别与支持的自动化的对话应用相关联的提示。提示可以与包含用于对提示的自然语言响应的结构化的自然语言表示的应用预期114相关联。自动化的对话应用模块110可以识别预期114并可以将预期114传达给NLU模块108。NLU模块108可以接收响应于自动化的对话应用的提示的自然语言输入(如,计算设备100的用户说出的话语),并可利用自然语言输入(或其部分)来填充结构化的自然语言表示的一个或多个数据字段。NLU模块108可以利用结构化的自然语言表示的被填充的数据字段中的数据以产生响应于应用预期114的输入116,其可以例如通过(如,经由函数调用、方法调用等的返回值)将储存在结构化的自然语言的数据字段的数据传递到与自动化的对话应用模块110相关联的支持的自动化对话应用而被传达到自动化对话应用模块110。在某些实施方式中,自动化对话应用模块110可以基于输入116(如,通过执行表交互118)来更改储存在相关的数据库112中的数据结构。附加地或可选地,NLU模块108可以更改储存在相关的数据库112中的数据结构以反映结构化的自然语言表示的被填充的数据字段中的数据(如,代替产生和/或传达输入116)。
图2描绘的是示例性的方法,该示例性的方法用于根据一个或多个示例性的实施方式使用结构化的自然语言表示响应自动化的对话应用的应用预期。参照图2,在步骤202,与自动化的对话应用相关联的提示可以被识别。例如,自动化的对话应用模块110可以支持自动化的对话应用(如,旅游计划应用),且自动化的对话应用模块110可以识别与支持的自动化的对话应用相关联的提示(如,“你想旅游去哪里?”或“你想什么时候离开?”)。在步骤204,自动化的对话应用的应用预期可以被识别。例如,自动化的对话应用模块110可以识别支持的自动化的对话应用的应用预期114(如,目的地或出发_时间)。应用预期114可以包括响应于提示的自然语言输入的结构化的自然语言表示(如,包含被预先考虑到的响应于提示而接收到的一个或多个自然语言输入响应的表示的预定义的结构)。例如,应用预期114可包括响应于被识别出的提示的一个或多个自然语言输入的结构化的自然语言表示(如,目的地{城市、航班、位置}或出发_时间(日,时间))。在某些实施方式中,自然语言输入的结构化的自然语言表示可包括标量结构化的自然语言表示。例如,自然语言输入的结构化的自然语言表示可包括被配置用于文本字符串的一个或多个数据字段和/或被配置用于数值(如,整数值、浮点数值等)的一个或多个数据字段。
在步骤206,自然语言输入(如,表示计算设备100的用户说出的一个或多个话语的数据)可以被接收。例如,NLU模块108可以接收响应于提示的自然语言输入(如,表示包含“城市纽约”、“Kennedy”、“今天”、“明天”、“星期一”、“五月十日”、“十点”、“晚上十点”、“中午”等的一个或多个说出的话语的数据)。在步骤208,NLU模块108可以利用自然语言输入的至少一部分来填充结构化的自然语言表示的一个或多个数据字段。例如,如以上指示的,结构化的自然语言表示可以包括被配置用于文本字符串和/或数值的数据字段,且NLU模块108可以将自然语言输入的一部分(如,表示包含“城市纽约”、“Kennedy”、“今天”、“明天”、“星期一”、“五月十日”、“十点”、“晚上十点”、“中午”等的一个或多个说出的话语的数据))转换成用于数据字段(如,“城市纽约,NY”、“JFK”、“05-01-2014”、“05-02-2014”、“05-05-2014”、“05-10-2014”、“10:00”、“22:00”、“12:00”,等等)的输入值,且可以利用输入值来填充数据字段。在步骤210,NLU模块108可以使用结构化自然语言表示的数据字段来响应于应用预期114。例如,NLU模块108可从数据字段(如,“城市纽约,NY”、“JFK”、“05-01-2014”、“05-02-2014”、“05-05-2014”、“05-10-2014”、“10:00”、“22:00”、“12:00”,等等)中提取信息,并产生可被传达到自动化的对话应用模块110的输入116。附加地或可选地,NLU模块108可以从数据字段(如,“城市纽约,NY”、“JFK”、“05-01-2014”、“05-02-2014”、“05-05-2014”、“05-10-2014”、“10:00”、“22:00”、“12:00”,等等)中提取信息,并使用(或基于)从数据字段中提取的信息来执行表交互120。
图3描绘的是示例性的方法,该示例性的方法用于根据一个或多个示例性的实施方式使用列表式结构化的自然语言表示响应自动化的对话应用的应用预期。参照图3,在步骤302,与自动化的对话应用相关联的提示可以被识别。例如,自动化的对话应用模块110可以支持自动化的对话应用(如,电影数据库应用),且自动化的对话应用模块110可以识别与支持的自动化的对话应用相关联的提示(如,“你正在努力识别谁在电影中主演?”)。在步骤304,自动化的对话应用的应用预期可以被识别。例如,自动化的对话应用模块110可以识别支持的自动化的对话应用的应用预期114(如,演员)。应用预期114可以包括响应于提示的自然语言输入的结构化的自然语言表示(如,包含被预先考虑到的响应于提示而接收到的一个或多个自然语言输入响应的表示的预定义的结构)。
在某些实施方式中,结构化的自然语言表示可包括包含共同类型的多个结构化的自然语言表示的列表式结构化的自然语言表示(如,演员{演员-1,演员-2,……,演员-N}),列表式结构化的自然语言表示中的每一个可包括配置用于文本字符串的一个或多个数据字段(如,名字、姓,等等)和/或被配置用于数值的一个或多个数据字段(如,整数值、浮点数值等)。在步骤306,自然语言输入(如,表示计算设备100的用户说出的一个或多个话语的数据)可以被接收。例如,NLU模块108可以接收响应于提示的自然语言输入(如,表示包含“Meryl”、“Streep”、“and”、“Tom”、“Hanks”等的一个或多个说出的话语的数据)。自然语言输入可包括一个或多个部分,其中每个部分相应于共同类型。例如,自然语言输入可包括相应于共同类型(如,演员)的第一部分(如,表示包含“Meryl”和“Streep”的一个或多个说出的话语的数据)和相应于共同类型(如,演员)的第二部分(如,表示包含“Tom”和“Hanks”的一个或多个说出的话语的数据)。
在步骤308,NLU模块108可以利用自然语言输入的第一部分来填充列表式结构化的自然语言表示的第一结构化的自然语言表示的一个或多个数据字段(如,名字和姓),例如,通过将自然语言输入的第一部分(如,表示包含“Meryl”和“Streep”的一个或多个说出的话语的数据)转换成输入值(如,“Meryl”和“Streep”)并利用输入值来填充列表式结构化的自然语言表示的第一结构化的自然语言表示的数据字段(如,名字和姓)。在步骤310,NLU模块108可以利用自然语言输入的第二部分来填充列表式结构化的自然语言表示的第二结构化的自然语言表示的一个或多个数据字段(如,名字和姓),例如,通过将自然语言输入的第二部分(如,表示包含“Tom”和“Hanks”的一个或多个说出的话语的数据)转换成输入值(如,“Tom”和“Hanks”)并利用输入值来填充列表式结构化的自然语言表示的第二结构化的自然语言表示的数据字段(如,名字和姓)。
在步骤312,NLU模块108可使用列表式结构化的自然语言表示的数据字段响应应用预期114。例如,NLU模块108可从列表式结构化的自然语言表示的第一结构化的自然语言表示的数据字段(如,“Meryl”和/或“Streep”)和/或从列表式结构化的自然语言表示的第二结构化的自然语言表示的数据字段(如,“Tom”和/或“Hanks”)提取信息并产生可以被传达到自动化的对话应用模块110的输入116。附加地或可选地,NLU模块108可从列表式结构化的自然语言表示的第一结构化的自然语言表示的数据字段(如,“Meryl”和/或“Streep”)和/或从列表式结构化的自然语言表示的第二结构化的自然语言表示的数据字段(如,“Tom”和/或“Hanks”)提取信息并使用(或基于)从数据字段提取的信息来执行表交互120。
图4描绘的是示例性的方法,该示例性的方法用于根据一个或多个示例性的实施方式使用具有子类型属性的层次结构化的自然语言表示响应自动化的对话应用的应用预期。参照图4,在步骤402,与自动化的对话应用相关联的提示可以被识别。例如,自动化的对话应用模块110可以支持自动化的对话应用(如,电影数据库应用),且自动化的对话应用模块110可以识别与支持的自动化的对话应用相关联的提示(如,“谁是你最喜欢的电影明星?”)。在步骤404,自动化的对话应用的应用预期可以被识别。例如,自动化的对话应用模块110可以识别支持的自动化的对话应用的应用预期114(如,演员)。应用预期114可以包括响应于提示的自然语言输入的结构化的自然语言表示(如,包含被预先考虑到的响应于提示而接收到的一个或多个自然语言输入响应的表示的预定义的结构)。
在某些实施方式中,结构化的自然语言表示可包括层次结构化的自然语言表示,该层次结构化的自然语言表示包含多个不同的结构化的自然语言表示和使多个不同的结构化的自然语言表示相互关联的一个或多个属性。例如,结构化的自然语言表示可以包括包含多个不同的结构化的自然语言表示(如,演员和人员)和指示结构化的自然语言表示的第一个(如,演员)是结构化的自然语言表示(如,人员)的子类型的一个或多个属性(如,“是-A”)的层次结构化的自然语言表示(如,演员{是-A人员})。结构化的自然语言表示中的一个或多个可包括被配置用于文本字符串的一个或多个数据字段(如,名字和姓)和/或被配置用于数值的一个或多个数据字段(如,整数值、浮点数值等)。在步骤406,自然语言输入(如,表示计算设备100的用户说出的一个或多个话语的数据)可以被接收。例如,NLU模块108可以接收响应于提示的自然语言输入(如,表示包含“Meryl Streep”等的一个或多个说出的话语的数据)。在步骤408,NLU模块108可以(如,基于层次结构化的自然语言表示)识别子类型的结构化的自然语言表示(如,人员)。
在步骤410,NLU模块108可以利用自然语言输入(或其部分)来填充层次结构化的自然语言表示(如,演员{是-A人员})的子类型的结构化的自然语言表示(如,人员)的一个或多个数据字段(如,名字和姓),例如,通过将自然语言输入(如,表示包含“Meryl Streep”的一个或多个说出的话语的数据)转换成输入值(如,“Meryl”和“Streep”)并利用输入值来填充层次结构化的自然语言表示(如,演员{是-A人员})的子类型的结构化的自然语言表示(如,人员)的数据字段(如,名字和姓)。在步骤412,NLU模块108可使用层次结构化的自然语言表示的数据字段(如,子类型的结构化的自然语言表示的被填充的数据字段)响应应用预期114。例如,NLU模块108可从层次结构化的自然语言表示的子类型的结构化的自然语言表示的数据字段(如,“Meryl”和/或“Streep”)提取信息并产生可以被传达到自动化的对话应用模块110的输入116。附加地或可选地,NLU模块108可从层次结构化的自然语言表示的子类型的结构化的自然语言表示的数据字段(如,“Meryl”和/或“Streep”)提取信息并使用(或基于)从数据字段提取的信息来执行表交互120。
图5描绘的是示例性的方法,该示例性的方法用于根据一个或多个示例性的实施方式使用具有要素属性的层次结构化的自然语言表示响应自动化的对话应用的应用预期。参照图5,在步骤502,与自动化的对话应用相关联的提示可以被识别。例如,自动化的对话应用模块110可以支持自动化的对话应用(如,联系人管理应用),且自动化的对话应用模块110可以识别与支持的自动化的对话应用相关联的提示(如,“你想呼叫谁?”)。在步骤504,自动化的对话应用的应用预期可以被识别。例如,自动化的对话应用模块110可以识别支持的自动化的对话应用的应用预期114(如,联系人)。应用预期114可以包括响应于提示的自然语言输入的结构化的自然语言表示(如,包含被预先考虑到的响应于提示而接收到的一个或多个自然语言输入响应的表示的预定义的结构)。
在某些实施方式中,结构化的自然语言表示可包括层次结构化的自然语言表示,该层次结构化的自然语言表示包含多个不同的结构化的自然语言表示和使多个不同的结构化的自然语言表示相互关联的一个或多个属性。例如,结构化的自然语言表示可以包括包含多个不同的结构化的自然语言表示(如,联系人、名字和关系)和指示结构化的自然语言表示的第一个(如,联系人)包含一个或多个要素结构化的自然语言表示(如,名字和关系)的一个或多个属性(如,“具有-A”)的层次结构化的自然语言表示(如,联系人{具有-A名字,关系})。结构化的自然语言表示中的一个或多个可包括被配置用于文本字符串的一个或多个数据字段(如,名字、姓、昵称、关系类型,等等)和/或被配置用于数值的一个或多个数据字段(如,整数值、浮点数值等)。在步骤506,自然语言输入(如,表示计算设备100的用户说出的一个或多个话语的数据)可以被接收。例如,NLU模块108可以接收响应于提示的自然语言输入(如,表示包含“我的兄弟”等的一个或多个说出的话语的数据)。在步骤508,NLU模块108可以(如,基于层次结构化的自然语言表示)识别要素结构化的自然语言表示(如,关系)。
在步骤510,NLU模块108可以利用自然语言输入(或其部分)来填充层次结构化的自然语言表示(如,联系人)的要素结构化的自然语言表示(如,关系)的一个或多个数据字段(如,关系类型),例如,通过将自然语言输入(如,表示包含“我的兄弟”的一个或多个说出的话语的数据)转换成输入值(如,“兄弟”)并利用输入值来填充层次结构化的自然语言表示(如,联系人)的要素结构化的自然语言表示(如,关系)的数据字段(如,关系类型)。在步骤512,NLU模块108可使用层次结构化的自然语言表示的数据字段(如,要素结构化的自然语言表示的被填充的数据字段)响应应用预期114。例如,NLU模块108可从层次结构化的自然语言表示的要素结构化的自然语言表示的数据字段(如,“兄弟”)提取信息并产生可以被传达到自动化的对话应用模块110的输入116。附加地或可选地,NLU模块108可从层次结构化的自然语言表示的要素结构化的自然语言表示的数据字段(如,“兄弟”)提取信息并使用(或基于)从数据字段提取的信息来执行表交互120。
本公开内容的一个或多个方面可实现于由一个或多个计算机或其他设备运行的计算机可使用的数据或计算机可执行的指令中,诸如在一个或多个程序模块中,以执行本文所述的操作。一般,程序模块可包括当被计算机或其他数据处理设备中的一个或多个处理器运行时执行特定的任务或实施抽象数据类型的例行程序、程序、对象、部件、数据结构等等。计算机可执行指令可被储存在诸如硬盘、光盘、可移动存储介质、固态存储器、RAM等的计算机可读介质上。程序模块的功能可以根据需要在不同的实施方式中进行组合或分散。此外,功能可以整个地或部分地实施于固件或硬件等价物中,如集成电路、专用集成电路(ASIC)、现场可编程门阵列(FPGA)等。特定的数据结构可以用来更有效地实施公开内容的一个或多个方面,且这些数据结构是考虑在本文所述的计算机可执行指令和计算机可使用的数据的范围内的。
本文所述的各个方面可以被实施为方法、装置或被实施为存储计算机可执行指令的一个或多个计算机可读介质。因而,这些方面可以采用以下形式:完全硬件的实施方式、完全软件的实施方式、完全固件的实施方式、或将软件、硬件和固件方面以任意组合而相结合的方式。此外,本文所述的表示数据或事件的各个信号可以以通过诸如金属线、光纤或无线传输介质(如,空气或空间)的传导信号的介质行进的光或电磁波的形式在源和目的地之间进行传输。一般而言,一个或多个计算机可读介质可以包括一个或多个非暂时性计算机可读介质。
如本文所述,各种方法和动作可以在一个或多个计算服务器和一个或多个网络中进行操作。功能可以依任意方式进行分布,或可以位于单个计算设备(如,服务器、客户端计算机等)中。
公开内容的各个方面以其示例性的实施方式进行了描述。落入在所附的权利要求的范围和精神内的许多其他的实施方式、修改和变化对于本领域的技术人员根据本公开内容的查阅将是容易想到的。例如,在示例性的附图中描绘的步骤中的一个或多个步骤可以按并非是所列举的顺序来执行,且一个或多个所描绘的步骤根据本公开内容的方面可以是可选的。

Claims (18)

1.一种计算机辅助方法,包括:
通过计算设备的至少一个处理器,识别与自动化的对话应用相关联的提示;
通过所述至少一个处理器,识别所述自动化的对话应用的应用预期,所述应用预期包括对所述提示的自然语言响应的结构化的自然语言表示,其中,用于自然语言输入的所述结构化的自然语言表示包括列表式结构化的自然语言表示,所述列表式结构化的自然语言表示包括共同类型的多个结构化的自然语言表示;
接收响应于所述提示的自然语言输入;
通过所述至少一个处理器,利用所述自然语言输入的第一部分来填充所述共同类型的所述多个结构化的自然语言表示的第一结构化的自然语言表示的一个或多个数据字段,和利用自然语言输入的第二部分来填充所述共同类型的所述多个结构化的自然语言表示的第二结构化的自然语言表示的一个或多个数据字段;以及
通过所述至少一个处理器,使用所述结构化的自然语言表示的所述一个或多个数据字段来响应所述应用预期。
2.如权利要求1所述的计算机辅助方法,其中,用于所述自然语言输入的所述结构化的自然语言表示包括标量结构化的自然语言表示,其中,所述结构化的自然语言表示的所述一个或多个数据字段包括被配置用于文本字符串的至少一个数据字段,以及其中,填充所述结构化的自然语言表示的所述一个或多个数据字段包括将所述自然语言输入的至少一部分转换成输入文本字符串,并且利用所述输入文本字符串填充被配置用于所述文本字符串的所述至少一个数据字段。
3.如权利要求1所述的计算机辅助方法,其中,用于所述自然语言输入的所述结构化的自然语言表示包括标量结构化的自然语言表示,其中,所述结构化的自然语言表示的所述一个或多个数据字段包括被配置用于数值的至少一个数据字段,以及其中,填充所述结构化的自然语言表示的所述一个或多个数据字段包括将所述自然语言输入的至少一部分转换成输入数值,并且利用所述输入数值来填充被配置用于所述数值的所述至少一个数据字段。
4.如权利要求1所述的计算机辅助方法,其中,所述第一结构化的自然语言表示的所述一个或多个数据字段被配置用于文本字符串,其中所述第二结构化的自然语言表示的所述一个或多个数据字段被配置用于文本字符串,其中,填充所述第一结构化的自然语言表示的一个或多个数据字段包括将所述自然语言输入的第一部分转换成第一输入文本字符串,并利用所述第一输入文本字符串来填充所述第一结构化的自然语言表示的所述一个或多个数据字段,以及其中,填充所述第二结构化的自然语言表示的一个或多个数据字段包括将所述自然语言输入的第二部分转换成第二输入文本字符串,并利用所述第二输入文本字符串来填充所述第二结构化的自然语言表示的所述一个或多个数据字段。
5.如权利要求1所述的计算机辅助方法,其中,所述第一结构化的自然语言表示的所述一个或多个数据字段被配置用于数值,其中所述第二结构化的自然语言表示的所述一个或多个数据字段被配置用于数值,其中,填充所述第一结构化的自然语言表示的一个或多个数据字段包括将所述自然语言输入的第一部分转换成第一输入数值,并利用所述第一输入数值来填充所述第一结构化的自然语言表示的所述一个或多个数据字段,以及其中,填充所述第二结构化的自然语言表示的一个或多个数据字段包括将所述自然语言输入的第二部分转换成第二输入数值,并利用所述第二输入数值来填充所述第二结构化的自然语言表示的所述一个或多个数据字段。
6.如权利要求1所述的计算机辅助方法,其中,用于所述自然语言输入的结构化的自然语言表示包括层次结构化的自然语言表示,所述层次结构化的自然语言表示包括多个不同的结构化的自然语言表示和一个或多个属性,所述一个或多个属性使所述多个不同的结构化的自然语言表示相互关联。
7.如权利要求6所述的计算机辅助方法,其中,所述一个或多个属性中的至少一个属性指示所述多个不同的结构化的自然语言表示中的第一不同的结构化的自然语言表示是所述多个不同的结构化的自然语言表示中的第二不同的结构化的自然语言表示的子类型。
8.如权利要求7所述的计算机辅助方法,其中,用于所述自然语言输入的所述结构化的自然语言表示包括所述多个不同的结构化的自然语言表示中的所述第二不同的结构化的自然语言表示,以及其中,填充所述结构化的自然语言表示的一个或多个数据字段包括填充所述多个不同的结构化的自然语言表示中的所述第一不同的结构化的自然语言表示的一个或多个数据字段。
9.如权利要求8所述的计算机辅助方法,其中,所述多个不同的结构化的自然语言表示中的所述第一不同的结构化的自然语言表示的一个或多个数据字段被配置用于文本字符串,以及其中,填充所述多个不同的结构化的自然语言表示中的所述第一不同的结构化的自然语言表示的一个或多个数据字段包括将所述自然语言输入的至少一部分转换成输入文本字符串,并且利用所述输入文本字符串来填充所述多个不同的结构化的自然语言表示中的所述第一不同的结构化的自然语言表示的所述一个或多个数据字段。
10.如权利要求8所述的计算机辅助方法,其中,所述多个不同的结构化的自然语言表示中的所述第一不同的结构化的自然语言表示的所述一个或多个数据字段被配置用于数值,并且其中,填充所述多个不同的结构化的自然语言表示中的所述第一不同的结构化的自然语言表示的所述一个或多个数据字段包括将所述自然语言输入的至少一部分转换成输入数值,并利用所述输入数值来填充所述多个不同的结构化的自然语言表示中的所述第一不同的结构化的自然语言表示的所述一个或多个数据字段。
11.如权利要求6所述的计算机辅助方法,其中,所述一个或多个属性中的至少一个属性指示所述多个不同的结构化的自然语言表示中的第一不同的结构化的自然语言表示包括所述多个不同的结构化的自然语言表示中的第二不同的结构化的自然语言表示。
12.如权利要求11所述的计算机辅助方法,其中,用于所述自然语言输入的结构化的自然语言表示包括所述多个不同的结构化的自然语言表示中的所述第一不同的结构化的自然语言表示,并且其中,填充所述结构化的自然语言表示的一个或多个数据字段包括填充所述多个不同的结构化的自然语言表示中的所述第二不同的结构化的自然语言表示的一个或多个数据字段。
13.如权利要求12所述的计算机辅助方法,其中,所述多个不同的结构化的自然语言表示中的所述第二不同的结构化的自然语言表示的一个或多个数据字段被配置用于文本字符串,以及其中,填充所述多个不同的结构化的自然语言表示中的所述第二不同的结构化的自然语言表示的一个或多个数据字段包括将所述自然语言输入的至少一部分转换成输入文本字符串,并且利用所述输入文本字符串来填充所述多个不同的结构化的自然语言表示中的所述第二不同的结构化的自然语言表示的所述一个或多个数据字段。
14.如权利要求12所述的计算机辅助方法,其中,所述多个不同的结构化的自然语言表示中的所述第二不同的结构化的自然语言表示的所述一个或多个数据字段被配置用于数值,以及其中,填充所述多个不同的结构化的自然语言表示中的所述第二不同的结构化的自然语言表示的一个或多个数据字段包括将所述自然语言输入的至少一部分转换成输入数值,并利用所述输入数值来填充所述多个不同的结构化的自然语言表示中的所述第二不同的结构化的自然语言表示的所述一个或多个数据字段。
15.如权利要求1所述的计算机辅助方法,其中,响应所述应用预期包括将储存在所述结构化的自然语言表示的所述一个或多个数据字段中的数据传递到所述自动化的对话应用。
16.如权利要求1所述的计算机辅助方法,其中,响应所述应用预期包括更改由所述自动化的对话应用使用的数据库表以反映储存在所述结构化的自然语言表示的所述一个或多个数据字段中的数据。
17.一种计算装置,包括:
至少一个处理器;以及
存储器,所述存储器储存当被所述至少一个处理器运行时引起所述计算装置执行以下操作的指令:
识别与自动化的对话应用相关联的提示;
识别所述自动化的对话应用的应用预期,所述应用预期包括对所述提示的自然语言响应的结构化的自然语言表示,其中,用于自然语言输入的所述结构化的自然语言表示包括列表式结构化的自然语言表示,所述列表式结构化的自然语言表示包括共同类型的多个结构化的自然语言表示;
接收响应于所述提示的自然语言输入;
利用所述自然语言输入的第一部分来填充所述共同类型的所述多个结构化的自然语言表示的第一结构化的自然语言表示的一个或多个数据字段,和利用自然语言输入的第二部分来填充所述共同类型的所述多个结构化的自然语言表示的第二结构化的自然语言表示的一个或多个数据字段;以及
使用所述结构化的自然语言表示的所述一个或多个数据字段来响应所述应用预期。
18.一个或多个非暂时性计算机可读介质,所述一个或多个非暂时性计算机可读介质具有在其上储存的指令,所述指令当由一个或多个计算机运行时引起所述一个或多个计算机执行以下操作:
识别与自动化的对话应用相关联的提示;
识别所述自动化的对话应用的应用预期,所述应用预期包括对所述提示的自然语言响应的结构化的自然语言表示,其中,用于自然语言输入的所述结构化的自然语言表示包括列表式结构化的自然语言表示,所述列表式结构化的自然语言表示包括共同类型的多个结构化的自然语言表示;
接收响应于所述提示的自然语言输入;
利用所述自然语言输入的第一部分来填充所述共同类型的所述多个结构化的自然语言表示的第一结构化的自然语言表示的一个或多个数据字段,和利用自然语言输入的第二部分来填充所述共同类型的所述多个结构化的自然语言表示的第二结构化的自然语言表示的一个或多个数据字段;以及
使用所述结构化的自然语言表示的所述一个或多个数据字段来响应所述应用预期。
CN201580031725.XA 2014-06-13 2015-06-12 结构化的自然语言表示 Active CN106462569B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/304,289 US9606985B2 (en) 2014-06-13 2014-06-13 Structured natural language representations
US14/304,289 2014-06-13
PCT/US2015/035516 WO2015191975A2 (en) 2014-06-13 2015-06-12 Structured natural language representations

Publications (2)

Publication Number Publication Date
CN106462569A CN106462569A (zh) 2017-02-22
CN106462569B true CN106462569B (zh) 2020-05-26

Family

ID=54548237

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580031725.XA Active CN106462569B (zh) 2014-06-13 2015-06-12 结构化的自然语言表示

Country Status (4)

Country Link
US (2) US9606985B2 (zh)
EP (1) EP3155535A2 (zh)
CN (1) CN106462569B (zh)
WO (1) WO2015191975A2 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10372804B2 (en) 2016-05-17 2019-08-06 Bruce HASSEL Interactive audio validation/assistance system and methodologies
KR102388539B1 (ko) * 2017-04-30 2022-04-20 삼성전자주식회사 사용자 발화를 처리하는 전자 장치
CN108363757A (zh) * 2018-02-01 2018-08-03 广东梦森信息科技有限公司 基于OpenCyc的自然语言识别算法与***
US20190303111A1 (en) * 2018-04-02 2019-10-03 Morgan Warstler Methods, systems, apparatuses and devices for facilitating creating computer applications based on a natural language
US11314486B2 (en) * 2018-04-02 2022-04-26 Morgan Warstler Methods, systems, apparatuses, and devices of facilitating creating a computer application based on a natural language
US10997359B2 (en) 2018-04-27 2021-05-04 International Business Machines Corporation Real-time cognitive modifying a mark-up language document
CN112771530A (zh) * 2018-09-27 2021-05-07 谷歌有限责任公司 交互式web文档的自动导航
CN109815486A (zh) * 2018-12-25 2019-05-28 出门问问信息科技有限公司 自然语言生成方法、装置、设备及可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739852A (zh) * 2008-11-13 2010-06-16 许罗迈 基于语音识别的实现自动口译训练的方法和装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6061515A (en) * 1994-07-18 2000-05-09 International Business Machines Corporation System and method for providing a high level language for mapping and accessing objects in data stores
US6714939B2 (en) 2001-01-08 2004-03-30 Softface, Inc. Creation of structured data from plain text
US7660400B2 (en) 2003-12-19 2010-02-09 At&T Intellectual Property Ii, L.P. Method and apparatus for automatically building conversational systems
US7853453B2 (en) * 2005-06-30 2010-12-14 Microsoft Corporation Analyzing dialog between a user and an interactive application
US20090055163A1 (en) * 2007-08-20 2009-02-26 Sandeep Jindal Dynamic Mixed-Initiative Dialog Generation in Speech Recognition
US20090112604A1 (en) * 2007-10-24 2009-04-30 Scholz Karl W Automatically Generating Interactive Learning Applications
US9501764B2 (en) * 2012-10-05 2016-11-22 Oracle International Corporation Method and system for communicating within a messaging architecture using a structured data object
US9509642B2 (en) * 2012-10-05 2016-11-29 Oracle International Corporation Messaging architecture configured to use an execution-enabled element to initiate an operation in an application
US9325645B2 (en) * 2012-10-05 2016-04-26 Oracle International Coporation Method and system for communicating within a messaging architecture using dynamic form generation
US8941874B2 (en) 2012-11-07 2015-01-27 Xerox Corporation Method and apparatus for automatically entering data in a print order based upon a prose attribute entry

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739852A (zh) * 2008-11-13 2010-06-16 许罗迈 基于语音识别的实现自动口译训练的方法和装置

Also Published As

Publication number Publication date
EP3155535A2 (en) 2017-04-19
US20170154621A1 (en) 2017-06-01
CN106462569A (zh) 2017-02-22
US10388278B2 (en) 2019-08-20
US20150364132A1 (en) 2015-12-17
WO2015191975A3 (en) 2016-03-17
WO2015191975A2 (en) 2015-12-17
US9606985B2 (en) 2017-03-28

Similar Documents

Publication Publication Date Title
CN106462569B (zh) 结构化的自然语言表示
CA2980907C (en) Transactional conversation-based computing system
US10936288B2 (en) Voice-enabled user interface framework
US10860289B2 (en) Flexible voice-based information retrieval system for virtual assistant
CN109545205B (zh) 基于上下文的虚拟助理实现
US11551676B2 (en) Techniques for dialog processing using contextual data
US20190012149A1 (en) Proactive resource allocation plan generator for improving product releases
US11501065B2 (en) Semantic parser including a coarse semantic parser and a fine semantic parser
JP2019212289A (ja) 情報を生成するための方法及び装置
US20190005228A1 (en) Trusted and untrusted code execution in a workflow
US11990124B2 (en) Language model prediction of API call invocations and verbal responses
US11586677B2 (en) Resolving user expression having dependent intents
US20220019592A1 (en) Data annotation method and apparatus, electronic device and storage medium
WO2022159160A1 (en) Ai-based cloud configurator using user utterences
US10942954B2 (en) Dataset adaptation for high-performance in specific natural language processing tasks
US20140188881A1 (en) System and Method To Label Unlabeled Data
US11314812B2 (en) Dynamic workflow with knowledge graphs
US20180218305A1 (en) Method, system and computer program product for facilitating task automation at a service desk
KR20240091051A (ko) 문서들로부터의 임베딩된 데이터의 추출을 위한 딥 러닝 기술들
US10891437B2 (en) Script modification
US9338248B2 (en) Parameter driven value conversion framework in client/server architectures
US20240248896A1 (en) Schema-aware encoding of natural language
US20210081799A1 (en) Compressing neural networks for natural language understanding
KR20240113524A (ko) Api 콜 호출 및 구두 응답의 언어 모델 예측
KR20240096829A (ko) 해시 임베딩들을 사용하는 언어 검출을 위한 와이드 및 딥 네트워크

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20231020

Address after: Washington State

Patentee after: MICROSOFT TECHNOLOGY LICENSING, LLC

Address before: Massachusetts

Patentee before: Nuance Communications, Inc.