CN108959299B - 对象描述 - Google Patents
对象描述 Download PDFInfo
- Publication number
- CN108959299B CN108959299B CN201710359555.9A CN201710359555A CN108959299B CN 108959299 B CN108959299 B CN 108959299B CN 201710359555 A CN201710359555 A CN 201710359555A CN 108959299 B CN108959299 B CN 108959299B
- Authority
- CN
- China
- Prior art keywords
- description
- candidate
- attribute
- user
- attributes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims abstract description 42
- 238000012549 training Methods 0.000 claims description 30
- 238000012545 processing Methods 0.000 claims description 17
- 230000004044 response Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 abstract description 3
- 230000000875 corresponding effect Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000006855 networking Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0603—Catalogue ordering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本公开的实施例涉及用于描述对象的方法、设备和计算机程序产品。一旦获取待描述对象的一个或多个属性的值,该方法可以基于该一个或多个属性的值来生成针对该对象的描述。所生成的描述可以包括该一个或多个属性中的部分属性的值。此外,该方法可以以可编辑方式向用户呈现所生成的描述。
Description
背景技术
在诸如电子商务、社交网站、事件(例如,体育比赛)直播等诸多应用中,通常需要针对特定对象的一组属性来生成针对该特定对象的描述。例如,在电子商务应用中,通常在例如web页面上呈现针对产品的描述以便于客户能够更好地理解该产品的特性。通常,产品描述的质量可能影响到该产品的销量。又如,在社交网站的应用中,期望基于关于某个人物的信息来自动生成针对该人物的简档。在诸如体育比赛直播的应用中,期望基于一场体育比赛的数据统计能够自动产生对这场体育比赛的新闻报道。
传统的自然语言生成***能够根据结构化的数据(例如,由产品属性的名称和值构成的数据集合)来自动生成自然语言表达。然而,对象描述与通常的自然语言表达不同,因为友好的对象描述需要在保持准确性地同时体现对象的属性之间的相对重要程度。
发明内容
发明人认识到,生成针对对象的描述通常具有两大挑战:确定哪些属性应当被包括在描述中,以及确定这些属性在描述中要被如何排列和表达。据此,本公开的实现提出了用于描述对象的方法、设备和计算机程序产品。根据在此描述的实现,该方法可以从训练数据中学习用于描述对象的模板,并且获取关于哪些属性应当被包括在描述中并且这些属性在描述中要被如何排列和表达的信息。一旦获取待描述对象的一个或多个属性的值,该方法可以基于该一个或多个属性的值、所学习到的模板和所获取的信息来生成针对该对象的描述。所生成的描述可以包括该一个或多个属性中的较为重要的属性的值。此外,该方法可以以可编辑方式向用户呈现所生成的描述。
提供发明内容部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实现中将被进一步描述。发明内容部分无意标识所要求保护的主题的关键特征或主要特征,也无意限制所要求保护的主题的范围。
附图说明
图1示出了能够在其中实施本公开的实现的***100的框图;
图2示出了根据本公开的实现的由平行数据构成的训练数据的示例;
图3A示出了根据本公开的实现的所呈现的选择的候选描述的示意图;
图3B示出了根据本公开的实现的用于呈现的所选择的候选描述的示例用户界面的示意图;
图3C示出了根据本公开的实现的所呈现的元素及其备选元素的示意图;
图4示出了根据本公开的实现的描述生成子***的框图;
图5A示出了根据本公开的实现的用于描述对象的模板的示例;
图5B示出了根据本公开的实现的针对对象的候选描述的示例;
图6示出了根据本公开的实现的用于描述对象的方法的流程图;
图7示出了根据本公开的实现的用于生成针对对象的描述的方法的流程图;以及
图8示出了其中可以实施本公开的一个或多个实现的示例计算***/服务器的框图。
在附图中,相同或相似的参考符号被用于指示相同或相似的元素。
具体实施方式
现在将参照若干示例实现来论述本公开。应当理解,论述了这些实现仅是为了使得本领域普通技术人员能够更好地理解且因此实现本公开,而不是暗示对本主题的范围的任何限制。
如本文中所使用的,术语“包括”及其变体要被解读为意味着“包括但不限于”的开放式术语。术语“基于”要被解读为“至少部分地基于”。术语“一个实现”和“一种实现”要被解读为“至少一个实现”。术语“另一个实现”要被解读为“至少一个其他实现”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。除非另外地明确指出,术语的定义贯穿说明书是一致的。
如本文中所使用的,术语“对象”可以指代任何要被描述的目标,包括但不限于实体、事件、人物等等。术语“属性”可以指代待描述目标的一个或多个特性。例如,对象可以包括网上商店中待售的商品,诸如计算机、手机、书籍、食品等。
以计算机为例,计算机的属性可以包括例如品牌名称、所采用的处理器型号、存储器类型和容量、屏幕尺寸、硬盘大小等等。对象也可以包括诸如体育赛事、会议、重大活动等事件。以体育赛事为例,体育赛事的属性可以包括例如比赛项目、参与比赛的选手或者队伍的名称、比赛时间、比赛地点、比赛结果等。对象也可以包括社交网站中要针对其生成简档的人物,其属性可以包括例如性别、年龄、职业、爱好与特长等等。对象还可以包括例如公司、天气等等。
为了便于说明,在以下描述中将以计算机作为待描述的对象的示例。然而,应当理解,这仅仅出于示例的目的而不暗示对于本公开的范围的任何限制。
如以上所描述的,例如在电子商务应用中,通常需要针对产品的一组属性来生成针对该产品的描述,以便于客户能够更好地理解该产品的特性。产品描述的质量(例如,准确性、友好性和/或满足客户的意图的程度等等)可能影响到该产品的销量。例如,友好的产品描述需要在保持准确性地同时体现产品属性之间的相对重要程度。因此,生成针对产品的描述通常具有两大挑战:确定哪些属性应当被包括在描述中,以及确定这些属性在描述中要被如何排列和表达。
为了解决上述问题以及其他潜在问题中的一个或者多个,根据本公开的示例实现,提出了一种用于描述对象的方案。该方案能够从由平行数据构成的训练数据中获取信息以确定哪些属性应当被包括在描述中以及确定这些属性在描述中要被如何排列和表达。该方案能够通过模板的应用来保证所生成的描述在语法上的正确性,并且通过考虑模板对于对象的属性的值的偏好来保证所生成的描述在语义上的正确性。此外,该方案需要较少的人工干预,能够显著提高生成对象描述的性能,因此能够被广泛应用于诸如电子商务、社交网络、新闻赛事简报、智能语音助理、天气播报、体检报告生成、财务报告生成等领域。
下面将详细描述本公开的若干示例实现。
图1示出了能够在其中实施本公开的实现的***100的框图。***100可以用于向用户提供针对对象的描述。如图1所示,***100总体上可以分为属性获取模块110、描述生成子***120和描述呈现模块130。要理解的是,仅出于示例性的目的描述***100的结构和功能而不是暗示对于本公开的范围的任何限制。本公开可以被体现在不同的结构和/或功能中。另外,***100中所包括的这些模块中的部分或者全部可由软件、硬件、固件和/或其组合来实现。
属性获取模块110可以被配置为获取待描述对象的属性列表101。在一些实现中,属性获取模块110可以获取由用户输入的待描述对象的一个或多个属性的值(例如,属性列表101)。例如,属性列表101可以包括待描述对象的一个或多个属性的名称及其相应的值。以计算机作为待描述对象的示例,如图1中的属性列表101所示,其属性例如可以包括处理器品牌、硬件平台、颜色、系列、用户评论、处理器型号、存储器类型、操作***、处理器数目、硬盘大小、图形处理器型号等。以体育赛事作为待描述对象的示例,其属性例如可以包括比赛项目、参与比赛的选手或者队伍的名称、比赛时间、比赛地点、比赛结果等。以社交网站中要针对其生成简档的人物作为待描述对象的示例,其属性例如可以包括性别、年龄、职业、爱好与特长等等。
在一些实现中,属性获取模块110也可以通过其他方式来获取待描述对象的一个或多个属性的值。例如,属性获取模块110可以获取来自其他***的输入,或者可以通过例如爬取网页等方式来自动地获取待描述对象的一个或多个属性的值。
描述生成子***120可以基于由属性获取模块110获取的待描述对象的属性列表101来生成针对该对象的描述103。在一些实现中,描述生成子***120可以从由平行数据构成的训练数据102中获取信息,以确定一个或多个属性中的哪些属性要被包括在描述中并且确定这些属性在描述中要被如何排列和表达。然后,描述生成子***120可以基于属性列表101和从训练数据102所获取的信息来生成针对该对象的描述103。
在此使用的术语“平行数据”可以指代描述同一对象的不同类型的数据。例如,在一些实现中,由平行数据构成的训练数据102可以包括针对该对象的历史描述以及与历史描述相对应的属性列表。在诸如电子商务应用的场景下,训练数据102可以包括针对例如计算机这一产品的历史描述和与该历史描述相对应的计算机的属性列表(例如包括以下属性的值:处理器品牌、硬件平台、颜色、系列、用户评论、处理器型号、存储器类型、操作***、处理器数目、硬盘大小、图形处理器型号等)。在诸如网球比赛直播应用的场景中,训练数据102可以包括针对例如网球比赛的历史描述和与该历史描述相对应的网球比赛的属性列表(例如包括以下属性的值:参与比赛的选手名称、比赛时间、比赛地点、比赛结果等)。图2示出了根据本公开的实现的训练数据102的示例,其中以计算机作为待描述对象的示例。如图2所述,训练数据102可以包括描述210和属性列表220。描述210可以是针对计算机这一对象的历史描述,并且属性列表220可以包括与描述210相对应的计算机的属性的名称和相应的值。
在一些实现中,描述生成子***120可以基于由平行数据构成的训练数据102来确定用于描述该对象的一个或多个模板。例如,一个或多个模板中的每个模板可以包括用于填充一个或多个属性中的至少部分属性的值的字段。在下文中将结合图4和图5A来对用于描述对象的一个或多个模板进行进一步的详细描述。
在一些实现中,描述生成子***120可以基于所确定的一个或多个模板来获取关于哪些属性要被包括在描述中并且这些属性在描述中要被如何排列和表达的信息。备选地,在一些实现中,例如关于哪些属性要被包括在描述中并且这些属性在描述中要被如何排列和表达的信息可以至少部分由用户指定。
然后,描述生成子***120可以基于所确定的一个或多个模板以及所获取的关于哪些属性要被包括在描述中并且这些属性在描述中要被如何排列和表达的信息来生成针对该对象的一个或多个候选描述(例如,如图1所示的候选描述1031、1032、1033……)。
在一些实现中,描述生成子***120还可以确定与所生成的一个或多个候选描述相关联的得分,其中较高的得分可以表明该候选描述具有较高的质量(例如,友好性、多样性和/或与参考描述的相似性等等),而较低的得分可以表明该候选描述具有较低的质量。然后,描述生成子***120可以基于得分来对一个或多个候选描述进行排序。
以下还将结合图5对生成子***120进行进一步的详细描述。
描述呈现模块130可以被配置为向用户呈现所生成的描述。在一些实现中,如图1中的用户界面104所示,描述呈现模块130可以向用户呈现所生成的一个或多个候选描述(例如,如图1所示的候选描述1031、1032……),以供用户从中选择所期望的描述。该一个或多个候选描述中的每个候选描述例如可以仅涉及对象的一个或多个属性中的至少部分属性。
特别地,在一些实现中,描述呈现模块130可以向用户呈现经排序的一个或多个候选描述,其中具有较高得分的候选描述(例如,候选描述1031)被呈现在较前的位置处,而具有较低得分的候选描述(例如,候选描述1032)被呈现在较后的位置处。备选地,在一些实现中,描述呈现模块130也可以仅向用户呈现一个或多个候选描述中的具有最高得分的描述(例如,仅呈现候选描述1031)。
在一些实现中,例如在向用户呈现一个或多个候选描述的情况下,一旦用户对其中的某个描述(例如,候选描述1031)做出选择,描述呈现模块130可以向用户进一步呈现所选择的描述。例如,该描述可以由一个或多个元素组成。在此所述的“元素”可以包括但不限于词语、句子、表格、图片和/或构成该描述的任何部分。例如,在一些实现中,描述呈现模块130可以向用户单独地呈现所选择的描述中的每个元素。
图3A示出了根据本公开的实现的所呈现的选择的候选描述1031的示意图。如图3A所示,描述呈现模块130可以向用户单独地呈现候选描述1031中的每个元素(诸如元素310、320和330)。此外,描述呈现模块130还可以呈现针对每个元素的备选提示(诸如备选提示311、321和331)。例如,备选提示311、321和331可以分别指示元素310、320和330分别存在一个或多个备选元素。这些备选元素例如来自一个或多个候选描述中除了所选择的候选描述1031之外的其他候选描述(例如,候选描述1032、1033等)。
特别地,在一些实现中,描述呈现模块130可以以可编辑方式来向用户呈现所选择的候选描述(例如,候选描述1031)。例如,描述呈现模块130可以允许用户对如图3A所示的候选描述1031中的每个元素进行直接编辑,诸如***或删除字符、调整字符顺序等操作。
在一些实现中,例如当用户对候选描述1031进行编辑时,描述呈现模块130可以基于用户对候选描述1031进行的编辑而相应地更新其他候选描述(例如,候选描述1032、1033等)。例如,当用户对候选描述1031中的某个元素进行编辑时,描述呈现模块130可以对其他候选描述中与该元素相关联的元素进行更新。
此外,在一些实现中,例如,当用户对候选描述1031中的某个元素进行编辑时,与候选描述1031相关联的模板也可以被更新。特别地,在一些实现中,例如,当用户对候选描述1031中的某个元素进行多次编辑并且编辑的次数超过预定阈值时,与候选描述1031相关联的模板可以被更新。通过对模板的更新,用户对候选描述1031的编辑能够至少部分地被体现在后续的描述生成中。
以上仅描述了用于呈现候选描述的可编辑方式的若干示例。应当理解,本公开的实现也可以被体现在其他示例中,并且本公开的范围在此方面不受限制。
图3B示出了根据本公开的实现的用于呈现的所选择的候选描述1031的示例用户界面104的示意图。具体地,图3B中的用户界面104示出了候选描述1031的一个具体示例,以及与该具体示例相对应的属性列表301。例如,属性列表301可以是如图1所示的属性列表101的一部分,属性列表301可以仅包括候选描述1031所涉及的属性。特别地,候选描述1031中的元素310可以包括填充的属性值302(也即,“8GB”),例如属性值302对应于属性列表301中的属性项303(也即,名称为“存储器容量”的属性项)。在一些实现中,当描述呈现模块130呈现如图3B所示的用户界面104时,属性值302可以被示为可选择(例如,利用下划线来显示)。例如,当用户选择(诸如点击或用于选择的其他操作)属性值302时,与属性值302相对应的属性列表301中的属性项303可以被突出显示(例如,被高亮显示)。这有助于帮助用户检查所生成的描述(例如,与属性项303相关联的描述)的质量。
此外,例如,当用户选择(诸如点击)如图3A和/或3B所示的元素310、320和330中的元素310时,描述程序模块130可以进一步呈现元素310及其备选元素。
图3C示出了根据本公开的实现的所呈现的元素310及其备选元素的示意图。如图3C所示,元素310可以具有n个备选元素3101、3102……310n。这n个备选元素例如来自一个或多个候选描述中除了所选择的候选描述1031之外的其他候选描述(例如,候选描述1032、1033等)。例如,当用户对当前元素310不满意时,用户可以选择n个备选元素之一以替换当前元素310。在一些实现中,这n个备选元素可以按照与每个备选元素相关联的质量(例如,如以下将进一步描述的,包括较少未识别的属性字段的句子可以被认为具有较高的质量)被排序。
备选地或者附加地,在一些实现中,***100还可以包括用户反馈模块(图1中未示出)。例如,用户反馈模块可以用于从用户接收诸如待描述对象的一个或多个属性的值、用户对于该对象的描述的意图或者偏好(例如,哪些属性要被包括在描述中和/或这些属性在描述中要被如何排列和表达)、用户对于所生成的描述和/或该描述包括的至少一个元素进行编辑的信息、和/或用户对于所生成的描述和/或该描述包括的至少一个元素的评价等的信息。例如,用户反馈模块可以将从用户接收到的信息应用于上述属性获取模块110、描述生成子***120和描述呈现模块130中的至少一项,以促进针对对象的描述的生成。例如,如以上所描述的,当用户对所生成的描述进行编辑时,描述呈现模块130可以基于从用户反馈模块接收到的信息来更新包括所编辑的描述在内的一个或多个候选描述,描述生成子***120可以基于从用户反馈模块接收到的信息来相应地更新与所编辑的描述相关联的模板等等。
图4示出了根据本公开的实现的描述生成子***120的框图。如图4所示,描述生成子***120可以包括模板确定模块410、信息确定模块420、候选描述生成模块430和候选描述排序模块440。要理解的是,仅出于示例性的目的描述描述生成子***120的结构和功能而不是暗示对于本公开的范围的任何限制。本公开可以被体现在不同的结构和/或功能中。另外,描述生成子***120中所包括的这些模块中的部分或者全部可由软件、硬件、固件和/或其组合来实现。
总体上,生成针对对象的描述的过程可以分为学习阶段和生成阶段。在一些实现中,学习阶段可以预先被离线地完成,以提高处理的性能。
在学***行数据构成。例如,训练数据102可以包括针对该对象的历史描述以及与历史描述相对应的属性列表。训练数据102的示例例如如图2所示,其中训练数据102可以包括描述210和属性列表220。描述210可以是针对计算机这一对象的历史描述,并且属性列表220可以包括与描述210相对应的计算机的属性的名称和相应的值。
为了从给定的平行数据中提取用于描述对象的模板,模板确定模块410可以首先将历史描述(例如,描述210)和与其对应的属性(例如,属性列表220)进行匹配。具体地,例如,模板确定模块410可以针对属性列表220中的每个属性,从描述210中查找与该属性的值相匹配的位置,并且将该位置作为用于填充该属性的值的字段。例如,图5A示出了根据本公开的实现的用于描述对象的模板510的示例,其中以计算机作为待描述对象)。如图5A所示,“[存储器容量]”可以表示用于填充名称为“存储器容量”的属性的值的字段,“[处理器]”可以表示用于填充名称为“处理器”的属性的值的字段,而“[操作***]”可以表示用于填充名称为“操作***”的属性的字段。在一些实现中,用于匹配的属性名称可以仅包括例如在属性列表220中的那些属性名称,这样可以保证所提取的模板的准确性。在另一些实现中,用于匹配的属性名称可以被扩展为包括类似对象(例如,平板计算机、台式计算机、移动电话等)的属性列表中的属性名称,以识别更多用于填充属性的值的字段。这可以显著地提高模板提取的性能。以此方式,模板确定模块410能够获得许多候选模板。
附加地,在获得许多候选模板之后,模块确定模块410还可以从中挑选具有较好质量的模块来作为最终输出的模板。在一些实现中,模板确定模块410可以将许多候选模板中的每个候选模板划分成句子。例如,某些句子可能包括未识别的属性字段(诸如,未识别的属性名称或者值)。如图5A所示,例如,“D520”为未识别的属性字段,其由大写字母或者数字组成。在一些实现中,模板确定模块410可以丢弃包括超过阈值数目(例如,阈值数目为1)的未识别的属性字段的句子,以获得具有较好质量的模板。以此方式,模板确定模块410能够输出具有较好质量的一个或者多个模板。通过模板的应用,本公开的实现能够保证所生成的描述在语法上的正确性。
信息确定模块420可以基于来自模板确定模块410的一个或多个模板,确定关于哪些属性要被包括在描述中并且这些属性在描述中要被如何排列和表达的信息(在本文中,也称为“第一信息”)。
在一些实现中,利用所确定的一个或多个模板,信息确定模块420可以从中学习对象的一个或多个属性中的每个属性的重要程度,以确定一个或多个属性中的哪些属性要被包括在描述中。在一些实现中,属性的重要程序可以被量化为该属性的先验概率,其被定义如下:
其中,ai表示一个或多个模板中所涉及的第i个属性,并且Mention(ai)表示属性ai在一个或多个模板中出现的次数。
在一些实现中,利用所确定的一个或多个模板,信息确定模块420可以从中学习要在描述中出现的这些属性之间的依赖关系,以确这些在描述中出现的顺序。例如,在针对计算机的描述中,通常属性“CPU”在第一个句子被提及,并且属性“硬盘转速”通常出现在属性“硬盘大小”之后。在一些实现中,该依赖关系可以被量化为属性的条件概率,其被定义如下:
其中,Co-occurrence(ai,aj)表示属性ai和aj在一个或多个模板中的相邻句子中出现的次数。
由此,经过学习阶段,用于描述对象的一个或多个模板以及关于哪些属性要被包括在描述中并且这些属性在描述中要被如何排列和表达的第一信息能够被获得,这由如图4所示的训练结果401来表示。
在生成阶段,候选描述生成模块430可以基于输入数据402和训练结果401来生成针对对象的一个或多个候选描述。在一些实现中,输入数据402可以包括待描述对象的属性列表。例如,输入数据402可以包括如图1所示的属性列表101,其由用户输入或通过其他方式获取并且可以包括待描述对象的一个或多个属性的名称及其相应的值。表1示出了输入数据402的示例。
属性名称 | 属性值 |
处理器品牌 | 英特尔 |
硬件平台 | 个人计算机 |
颜色 | 灰色 |
处理器型号 | 3.3GHz英特尔Core i7 |
存储器类型 | DDR4SDRAM |
操作*** | Windows 10 |
硬盘大小 | 2TB HDD 7200转/分钟 |
图形处理器 | GTX980 |
…… | …… |
表1
在一些实现中,候选描述生成模块430可以基于训练结果401中的第一信息将一个或多个属性中的至少部分属性的值应用于训练结果401中的一个或多个模板,以生成针对对象的一个或多个候选描述。图5B示出了根据本公开的实现的针对对象的候选描述520的示例,其中候选描述520基于如表1所示的输入数据402以及如图5A所示的模板510来被生成。
备选地或者附加地,在一些实现中,可以应用基于属性的依赖关系的束搜索(beamsearch)技术或者基于属性的重要程度而对属性进行预先排序来生成针对对象的一个或多个候选描述,以提高处理的效率。
候选描述排序模块440可以对所生成的一个或多个候选描述进行排序。在一些实现中,候选描述排序模块440可以确定与一个或多个候选描述中的每个候选描述相关联的得分,然后基于该得分对一个或多个候选描述进行排序。
在一些实现中,候选描述排序模块440可以基于以下至少一项来确定与每个候选描述相关联的得分:关于与该候选描述相关联的属性的信息(在本文中,也被称为“第二信息”);关于该候选描述所包括的元素的信息(在本文中,也被称为“第三信息”);以及关于与该候选描述相关联的模板的信息(在本文中,也被称为“第四信息”)。例如,第二信息可以包括该候选描述所涉及的属性的数目以及该候选描述所涉及的属性的先验概率(如公式(1)所示)之和等。第三信息可以包括该候选描述所包括的元素的数目(例如,词语的数目、句子的数目等等)以及与该候选描述相关联的结构化得分(以下将进一步详细描述)等。第四信息可以包括与该候选描述相关联的模板对于属性的值的偏好(以下将进一步详细描述)以及在该模板中所包括的未识别的属性字段的数目等。
在一些实现中,第三信息可以包括与该候选描述相关联的结构化得分。假设候选描述被表示为d,其可以由n个句子组成,并且n个句子被表示为(s1,s2,…,sn)。候选描述d中的第i个句子si可以涉及|si|个属性,并且这些属性可以被表示为其中ai,j表示元素si所涉及的第j个属性。假设句子si仅依赖于其之前的句子si-1,则在一些实现中,如上所述的与候选描述d相关联的结构化得分可以被定义如下:
其中P(si,si-1)表示句子si与句子si-1之间的关系,其可以以多种不同方式来被量化。在一些实现中,P(si,si-1)可以等于候选描述所涉及的属性的依赖关系的量化值之和,也即∑j,k{P(ai,j|ai-1,k)},其中P(ai,j|ai-1,k)可以按照公式(2)来确定。在一些实现中,P(si,si-1)可以等于候选描述所涉及的属性的依赖关系的量化值中的最大值或者最小值,也即maxj,k{P(ai,j|ai-1,k)}或者minj,k{P(ai,j|ai-1,k)}。应当理解,P(si,si-1)也可以以除以上示例方式之外的其他方式来被量化,并且本公开的范围在此方面不受限制。
在一些实现中,第四信息可以包括与该候选描述相关联的模板对于属性的值的偏好。例如,针对如图5A所示的模板510,该模板中的上下文与属性“存储器容量”的值高度相关。在生成描述时,该模板可能更适合于其存储器容量为8GB或者16GB而非1GB的计算机。也即,该模板可以具有对某个属性的值的偏好。在一些实现中,模板t对于属性a的值va的偏好可以被定义如下:
其中,V(t)表示在确定模板t时从与模板t对应的历史描述中提取的所有属性的值,P(vi)表示属性值vi在V(t)中出现的概率。针对字符串类型的属性,Dist(va,vi)可以表示属性值va和vi之间的编辑距离(指代在两个字符串之间从一个字符串转化成另一字符串所需的编辑操作的最少次数)。针对数值类型的属性,Dist(va,vi)可以被定义为其中和分别表示在训练数据中属性a的值的上限和下限,并且|va-vi|表示va与vi的差值的绝对值。应当理解,Dist(va,vi)也可以以除以上示例方式之外的其他方式来被量化,并且本公开的范围在此方面不受限制。通过考虑模板对于对象的属性的值的偏好,本公开的实现能够保证所生成的描述在语义上的正确性。
如上所述,候选描述排序模块440可以基于第二信息、第三信息和/或第四信息中的一项或多项来确定与候选描述d相关联的得分。用于确定得分的这些因素(也即,第二信息、第三信息和/或第四信息中的一项或多项)的值可以被表示为(f1,f2,…,fm),其中m表示用于确定得分的因素的个数。在一些实施例中,例如如公式(3)所示,基于P(si,si-1)的不同量化方式而被计算的不同结构化得分可以作为不同的因素。因此,与候选描述d相关联的得分可以被定义为:
其中,wi表示与第i个因素相对应的权重。为了确定wi,例如在一些实现中,候选描述排序模块440可以利用针对对象的参考描述作为训练数据,应用神经网络技术来确定与每个因素相对应的权重,以确定与候选描述d相关联的得分。在此所述的“参考描述”指代预先确定的一组具有较好质量的描述。在一些实现中,参考描述可以选自针对对象的历史描述(例如,如图2所示的描述210)。在另一些实现中,参考描述也可以是与针对对象的历史描述不同的其他描述。
在一些实现中,候选描述排序模块440可以基于候选描述d与参考描述之间的相似性来计算与候选描述d相关联的得分,其中较高得分表示候选描述d具有与参考描述较高的相似性并由此指示候选描述d具有较好的质量,而较低得分表示候选描述d具有与参考描述较低的相似性并由此指示候选描述d具有较差的质量。以此方式,候选描述排序模块440能够应用Learning to Rank(LTR)算法来对一个或多个候选描述进行排序。
如图4所示,候选描述排序模块440可以向如图1所示的描述呈现模块130输出输出数据403,以用于向用户呈现。在一些实现中,输出数据403可以包括经排序的一个或多个候选描述,以供用户选择。备选地,在另一些实现中,输出数据403也可以仅包括一个或多个候选描述中的具有最高得分的描述。
图6示出了根据本公开的实现的用于描述对象的方法600的流程图。该方法600例如可以由如图1所示的***100来执行。为描述方便,下面结合如图1所示的***100对方法600进行描述。应当理解的是,方法600还可以包括未示出的附加步骤和/或可以省略所示出的步骤,本公开的范围在此方面不受限制。
在框610处,***100(例如,属性获取模块110)获取待描述对象的一个或多个属性的值。
在框620处,***100(例如,描述生成子***120)基于该一个或多个属性的值来生成针对该对象的描述,该描述包含一个或多个属性中的至少一个属性的值。图7示出了根据本公开的实现的用于生成针对对象的描述的方法700的流程图。该方法700例如可以作为如图6所示的框620的一种示例实现。该方法700例如可以由如图1或图4所示的描述生成子***120来执行。应当理解的是,方法700还可以包括未示出的附加步骤和/或可以省略所示出的步骤,本公开的范围在此方面不受限制。
在框710处,描述生成子***120基于用于描述对象的至少一个模板,确定与该至少一个属性有关的第一信息。在一些实现中,至少一个模板基于与对象有关的训练数据来确定。在一些实现中,该训练数据可以包括针对该对象的历史描述以及与该历史描述相对应的对象的属性的值,并且所生成的至少一个模板包括用于填充一个或多个属性中的至少部分属性的值的字段。
在一些实现中,描述生成子***120可以通过确定一个或多个属性中的每个属性的重要程度来确定要在描述中出现的至少一个属性。描述生成子***120还可以通过确定至少一个属性之间的依赖关系来确定至少一个属性在描述中出现的顺序。
在框720处,描述生成子***120至少基于至少一个模板和第一信息来生成针对对象的至少一个候选描述。
返回到图6,方法600进行至框630,其中***100(例如,描述呈现模块130)以可编辑方式向用户呈现针对对象的描述。
在一些实现中,例如描述呈现模块130可以向用户呈现至少一个候选描述。然后,响应于用户对至少一个候选描述中的描述的选择,描述呈现模块130可以向用户呈现所选择的描述。
在一些实现中,例如描述生成子***120还可以基于至少一个候选描述与针对对象的参考描述之间的相似性来确定与至少一个候选描述相关联的得分,并且基于该得分来对所生成的至少一个候选描述进行排序。在此情况下,描述呈现模块130可以向用户呈现经排序的至少一个候选描述。
在一些实现中,描述生成子***120可以基于以下至少一项来确定与至少一个候选描述相关联的得分:关于与至少一个候选描述相关联的、对象的属性的第二信息;关于至少一个候选描述所包括的元素的第三信息;以及关于与至少一个候选描述相关联的模板的第四信息。在一些实现中,第四信息可以包括该模板对于属性的值的偏好。
在一些实现中,响应于用户对至少一个候选描述中的描述的描述的编辑,例如描述呈现子***130可以更新至少一个候选描述。
在一些实现中,所呈现的描述可以包括一个或多个元素。在此情况下,方法600还可以包括响应于用户对一个或多个元素中的至少一个元素的编辑,更新与该描述相关联的模板。此外,方法600还可以包括响应于接收到用户对一个或多个元素中的至少一个元素不满意的指示,向该用户呈现该至少一个元素的至少一个备选元素。在一些实现中,该至少一个备选元素来自至少一个候选描述中除用户选择的描述之外的另一描述。
从以上描述可以看出,根据本公开的实现的用于描述对象的方案能够从由平行数据构成的训练数据中获取信息以确定哪些属性应当被包括在描述中以及确定这些属性在描述中要被如何排列和表达。该方案能够通过模板的应用来保证所生成的描述在语法上的正确性,并且通过考虑模板对于对象的属性的值的偏好来保证所生成的描述在语义上的正确性。此外,该方案需要较少的人工干预,能够显著提高生成对象描述的性能。
图8示出了其中可以实施本公开的一个或多个实现的示例计算***/服务器800的框图。例如,在一些实现中,如图1所示的***100和/或如图4所示的描述生成子***120可以由计算***/服务器800实现。图8示出的计算***/服务器800仅是示例,其不应当构成对本文所描述的实现的使用的功能和范围的限制。
如图8所示,计算***/服务器800是通用计算设备的形式。计算***/服务器800的组件可以包括但不限于一个或多个处理器或处理单元800,存储器820,一个或多个输入设备830,一个或多个输出设备840,存储装置850,和一个或多个通信单元860。处理单元800可以是实际或虚拟处理器并且能够根据存储器820中存储的持续来执行各种处理。在多处理***中,多处理单元执行计算机可执行指令,以增加处理能力。
计算***/服务器800通常包括多个计算机介质。这样的介质可以是计算***/服务器800可访问的任何可以获得的介质,包括但不限于易失性和非易失性介质、可拆卸和不可拆卸介质。存储器820可以是易失性存储器(例如寄存器、高速缓存、随机访问存储器(RAM))、非非易失性存储器(例如,只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、闪存)或它们的某种组合。存储装置850可以是可拆卸或不可拆卸,并且可以包括机器可读介质,诸如闪存驱动、磁盘或者任何其他介质,其可以能够用于存储信息并且可以在计算***/服务器800内被访问。
计算***/服务器800可以进一步包括另外的可拆卸/不可拆卸、易失性/非易失性计算机***存储介质。尽管未在图8中示出,可以提供用于从可拆卸、非易失性磁盘(例如“软盘”)进行读取或写入的磁盘驱动和用于从可拆卸、非易失性光盘进行读取或写入的光盘驱动。在这些情况中,每个驱动可以由一个或多个数据介质接口被连接至总线。
存储器820可以包括至少一个程序产品,其具有(例如至少一个)程序模块集合,这些程序模块被配置为执行本文所描述的各种实现的功能。例如,当***100和/或描述生成子***120中的一个或多个模块被实现为软件模块时,其可以被存储在存储器820中。当这些模块由处理单元800访问和运行时,可以实现在此描述的功能和/或方法,例如方法600和/或700。
输入单元830可以是一个或多个各种输入设备。例如,输入单元839可以包括用户设备、诸如鼠标、键盘、追踪球等。通信单元860实现在通信介质上向另外的计算实体进行通信。附加地,计算***/服务器800的组件的功能可以以单个计算集群或多个计算机器来实现,这些计算机器能够通过通信连接来通信。因此,计算***/服务器800可以使用与一个或多个其他服务器、网络个人计算机(PC)或者另一个一般网络节点的逻辑连接来在联网环境中进行操作。例如但不限于,通信介质包括有线或无线联网技术。
计算***/服务器800还可以根据需要与一个或多个外部设备(未示出)进行通信,外部设备诸如存储设备、显示设备等等,与一个或多个使得用户与计算***/服务器800交互的设备进行通信,或者与使得计算***/服务器800与一个或多个其他计算设备通信的任何设备(例如,网卡、调制解调器等)进行通信。这样的通信可以经由输入/输出(I/O)接口(未示出)来执行。
本文中所描述的功能可以至少部分地由一个或多个硬件逻辑组件来执行。例如但不限于,可以使用的硬件逻辑组件的示意性类型包括现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑器件(CPLD)等。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开内容的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
此外,虽然采用特定次序描绘了各操作,但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行,或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实现的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地,在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
以下列出了本公开的一些示例实现。
在第一方面中,提供了一种计算机实现的设备。该设备包括处理单元和存储器。存储器被耦合到处理单元并且存储用于由该处理单元执行的指令。该指令当由处理单元执行时,使得该设备执行动作,该动作包括:获取待描述对象的一个或多个属性的值;基于一个或多个属性的值来生成针对对象的描述,该描述包含一个或多个属性中的至少一个属性的值;以及以可编辑方式向用户呈现针对该对象的描述。
在一些实现中,生成针对对象的描述包括:基于用于描述该对象的至少一个模板,确定与至少一个属性有关的第一信息,该至少一个模板基于与对象有关的训练数据来确定;以及至少基于至少一个模板和第一信息,生成针对对象的至少一个候选描述。
在一些实现中,确定第一信息包括:通过确定一个或多个属性中的每个属性的重要程度来确定要在描述中出现的至少一个属性;以及通过确定至少一个属性之间的依赖关系来确定至少一个属性在描述中出现的顺序。
在一些实现中,向用户呈现针对对象的描述包括:向用户呈现至少一个候选描述;以及响应于用户对至少一个候选描述中的描述的编辑,更新所述至少一个候选描述。
在一些实现中,描述包括一个或多个元素,并且动作还包括:响应于用户对一个或多个元素中的至少一个元素的编辑,更新与该描述相关联的模板。
在一些实现中,向所述用户呈现至少一个候选描述包括:基于至少一个候选描述与针对对象的参考描述之间的相似性来确定与至少一个候选描述相关联的得分;基于该得分来对至少一个候选描述进行排序;以及向用户呈现经排序的至少一个候选描述。
在一些实现中,确定与至少一个候选描述相关联的得分包括:基于以下至少一项来确定该得分:关于与至少一个候选描述相关联的、对象的属性的第二信息;关于至少一个候选描述所包括的元素的第三信息;以及关于与至少一个候选描述相关联的模板的第四信息。
在一些实现中,第四信息包括模板对于属性的值的偏好。
在一些实现中,动作还包括:响应于接收到用户对至少一个元素不满意的指示,向该用户呈现该至少一个元素的至少一个备选元素。
在一些实现中,该至少一个备选元素来自至少一个候选描述中除该描述之外的另一描述。
在第二方面中,提供了一种计算机实现的方法。该方法包括:获取待描述对象的一个或多个属性的值;基于一个或多个属性的值来生成针对对象的描述,该描述包含一个或多个属性中的至少一个属性的值;以及以可编辑方式向用户呈现针对该对象的描述。
在一些实现中,生成针对对象的描述包括:基于用于描述该对象的至少一个模板,确定与至少一个属性有关的第一信息,该至少一个模板基于与对象有关的训练数据来确定;以及至少基于至少一个模板和第一信息,生成针对对象的至少一个候选描述。
在一些实现中,确定第一信息包括:通过确定一个或多个属性中的每个属性的重要程度来确定要在描述中出现的至少一个属性;以及通过确定至少一个属性之间的依赖关系来确定至少一个属性在描述中出现的顺序。
在一些实现中,向用户呈现针对对象的描述包括:向用户呈现至少一个候选描述;以及响应于用户对至少一个候选描述中的描述的编辑,更新至少一个候选描述。
在一些实现中,描述包括一个或多个元素,并且该方法还包括:响应于用户对一个或多个元素中的至少一个元素的编辑,更新与该描述相关联的模板。
在一些实现中,向所述用户呈现至少一个候选描述包括:基于至少一个候选描述与针对对象的参考描述之间的相似性来确定与至少一个候选描述相关联的得分;基于该得分来对至少一个候选描述进行排序;以及向用户呈现经排序的至少一个候选描述。
在一些实现中,确定与至少一个候选描述相关联的得分包括:基于以下至少一项来确定该得分:关于与至少一个候选描述相关联的、对象的属性的第二信息;关于至少一个候选描述所包括的元素的第三信息;以及关于与至少一个候选描述相关联的模板的第四信息。
在一些实现中,第四信息包括模板对于属性的值的偏好。
在一些实现中,该方法还包括:响应于接收到用户对至少一个元素不满意的指示,向该用户呈现该至少一个元素的至少一个备选元素。
在一些实现中,该至少一个备选元素来自至少一个候选描述中除该描述之外的另一描述。
在第三方面中,提供了一种计算机程序产品,该计算机程序产品被有形地存储在非瞬态计算机存储介质中并且包括机器可执行指令,该机器可执行指令在由设备执行时使该设备执行根据第二方面所述的方法的动作。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。
Claims (18)
1.一种计算机实现的设备,包括:
处理单元;
存储器,所述存储器被耦合到所述处理单元并且存储用于由所述处理单元执行的指令,所述指令当由所述处理单元执行时,使得所述设备执行动作,所述动作包括:
获取待描述对象的一个或多个属性的值;
基于所述一个或多个属性的值来生成针对所述对象的描述,所述描述包含所述一个或多个属性中的至少一个属性的值,
其中生成针对所述对象的描述包括:
基于用于描述所述对象的至少一个模板,确定与所述至少一个属性有关的第一信息,所述至少一个模板基于与所述对象有关的训练数据来确定,其中所述第一信息描述要被包括在所述描述中的所述至少一个属性以及与所述描述中的所述至少一个属性相关联的顺序;以及
至少基于所述至少一个模板和所述第一信息,生成针对所述对象的至少一个候选描述;以及
以可编辑方式向用户呈现针对所述对象的所述描述。
2.根据权利要求1所述的设备,其中确定所述第一信息包括:
通过确定所述一个或多个属性中的每个属性的重要程度来确定要在所述描述中出现的所述至少一个属性;以及
通过确定所述至少一个属性之间的依赖关系来确定所述至少一个属性在所述描述中出现的顺序。
3.根据权利要求1所述的设备,其中向所述用户呈现针对所述对象的所述描述包括:
向所述用户呈现所述至少一个候选描述;以及
响应于用户对所述至少一个候选描述中的所述描述的编辑,更新所述至少一个候选描述。
4.根据权利要求3所述的设备,其中所述描述包括一个或多个元素,所述动作还包括:
响应于所述用户对所述一个或多个元素中的至少一个元素的编辑,更新与所述描述相关联的模板。
5.根据权利要求4所述的设备,其中向所述用户呈现所述至少一个候选描述包括:
基于所述至少一个候选描述与针对所述对象的参考描述之间的相似性来确定与所述至少一个候选描述相关联的得分;
基于所述得分来对所述至少一个候选描述进行排序;以及
向所述用户呈现经排序的所述至少一个候选描述。
6.根据权利要求5所述的设备,其中确定与所述至少一个候选描述相关联的得分包括:
基于以下至少一项来确定所述得分:
关于与所述至少一个候选描述相关联的、所述对象的属性的第二信息;
关于所述至少一个候选描述所包括的元素的第三信息;以及
关于与所述至少一个候选描述相关联的模板的第四信息。
7.根据权利要求6所述的设备,其中所述第四信息包括所述模板对于所述属性的值的偏好。
8.根据权利要求4所述的设备,所述动作还包括:
响应于接收到所述用户对所述至少一个元素不满意的指示,向所述用户呈现所述至少一个元素的至少一个备选元素。
9.根据权利要求8所述的设备,其中所述至少一个备选元素来自所述至少一个候选描述中除所述描述之外的另一描述。
10.一种计算机实现的方法,包括:
获取待描述对象的一个或多个属性的值;
基于所述一个或多个属性的值来生成针对所述对象的描述,所述描述包含所述一个或多个属性中的至少一个属性的值,
其中生成针对所述对象的描述包括:
基于用于描述所述对象的至少一个模板,确定与所述至少一个属性有关的第一信息,所述至少一个模板基于与所述对象有关的训练数据来确定,其中所述第一信息描述要被包括在所述描述中的所述至少一个属性以及与所述描述中的所述至少一个属性相关联的顺序;以及
至少基于所述至少一个模板和所述第一信息,生成针对所述对象的至少一个候选描述;以及
以可编辑方式向用户呈现针对所述对象的所述描述。
11.根据权利要求10所述的方法,其中确定所述第一信息包括:
通过确定所述一个或多个属性中的每个属性的重要程度来确定要在所述描述中出现的所述至少一个属性;以及
通过确定所述至少一个属性之间的依赖关系来确定所述至少一个属性在所述描述中出现的顺序。
12.根据权利要求10所述的方法,其中向所述用户呈现针对所述对象的所述描述包括:
向所述用户呈现所述至少一个候选描述;以及
响应于用户对所述至少一个候选描述中的所述描述的编辑,更新所述至少一个候选描述。
13.根据权利要求12所述的方法,其中所述描述包括一个或多个元素,所述方法还包括:
响应于所述用户对所述一个或多个元素中的至少一个元素的编辑,更新与所述描述相关联的模板。
14.根据权利要求13所述的方法,其中向所述用户呈现所述至少一个候选描述包括:
基于所述至少一个候选描述与针对所述对象的参考描述之间的相似性来确定与所述至少一个候选描述相关联的得分;
基于所述得分来对所述至少一个候选描述进行排序;以及
向所述用户呈现经排序的所述至少一个候选描述。
15.根据权利要求14所述的方法,其中确定与所述至少一个候选描述相关联的得分包括:
基于以下至少一项来确定所述得分:
关于与所述至少一个候选描述相关联的、所述对象的属性的第二信息;
关于所述至少一个候选描述所包括的元素的第三信息;以及
关于与所述至少一个候选描述相关联的模板的第四信息。
16.根据权利要求15所述的方法,其中所述第四信息包括所述模板对于所述属性的值的偏好。
17.根据权利要求13所述的方法,所述方法还包括:
响应于接收到所述用户对所述至少一个元素不满意的指示,向所述用户呈现所述至少一个元素的至少一个备选元素。
18.一种计算机存储介质,存储有机器可执行指令,所述机器可执行指令在由设备执行时使所述设备执行动作,所述动作包括:
获取待描述对象的一个或多个属性的值;
基于所述一个或多个属性的值来生成针对所述对象的描述,所述描述包含所述一个或多个属性中的至少一个属性的值,
其中生成针对所述对象的描述包括:
基于用于描述所述对象的至少一个模板,确定与所述至少一个属性有关的第一信息,所述至少一个模板基于与所述对象有关的训练数据来确定,其中所述第一信息描述要被包括在所述描述中的所述至少一个属性以及与所述描述中的所述至少一个属性相关联的顺序;以及
至少基于所述至少一个模板和所述第一信息,生成针对所述对象的至少一个候选描述;以及
以可编辑方式向用户呈现针对所述对象的所述描述。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710359555.9A CN108959299B (zh) | 2017-05-19 | 2017-05-19 | 对象描述 |
PCT/US2018/028779 WO2018212931A1 (en) | 2017-05-19 | 2018-04-23 | Object description |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710359555.9A CN108959299B (zh) | 2017-05-19 | 2017-05-19 | 对象描述 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108959299A CN108959299A (zh) | 2018-12-07 |
CN108959299B true CN108959299B (zh) | 2022-02-25 |
Family
ID=62167941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710359555.9A Active CN108959299B (zh) | 2017-05-19 | 2017-05-19 | 对象描述 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108959299B (zh) |
WO (1) | WO2018212931A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110162754B (zh) * | 2019-04-11 | 2024-05-10 | 平安科技(深圳)有限公司 | 一种岗位描述文档的生成方法及设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102073486A (zh) * | 2009-11-24 | 2011-05-25 | 新奥特(北京)视频技术有限公司 | 一种对象的快速编辑方法和装置 |
CN103514209A (zh) * | 2012-06-27 | 2014-01-15 | 百度在线网络技术(北京)有限公司 | 基于对象信息库生成待推广对象的推广信息的方法与设备 |
CN105612511A (zh) * | 2013-06-13 | 2016-05-25 | 微软技术许可有限责任公司 | 标识并结构化相关数据 |
CN105794154A (zh) * | 2013-09-19 | 2016-07-20 | 西斯摩斯公司 | 用于分析传输社交通信数据的***和方法 |
CN106066849A (zh) * | 2016-05-30 | 2016-11-02 | 车智互联(北京)科技有限公司 | 一种模板页面编辑***及方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9965474B2 (en) * | 2014-10-02 | 2018-05-08 | Google Llc | Dynamic summary generator |
RU2015116133A (ru) * | 2015-04-29 | 2016-11-20 | Общество с ограниченной ответственностью "1С" | Способ автоматизированного генерирования интерфейса приложения |
-
2017
- 2017-05-19 CN CN201710359555.9A patent/CN108959299B/zh active Active
-
2018
- 2018-04-23 WO PCT/US2018/028779 patent/WO2018212931A1/en active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102073486A (zh) * | 2009-11-24 | 2011-05-25 | 新奥特(北京)视频技术有限公司 | 一种对象的快速编辑方法和装置 |
CN103514209A (zh) * | 2012-06-27 | 2014-01-15 | 百度在线网络技术(北京)有限公司 | 基于对象信息库生成待推广对象的推广信息的方法与设备 |
CN105612511A (zh) * | 2013-06-13 | 2016-05-25 | 微软技术许可有限责任公司 | 标识并结构化相关数据 |
CN105794154A (zh) * | 2013-09-19 | 2016-07-20 | 西斯摩斯公司 | 用于分析传输社交通信数据的***和方法 |
CN106066849A (zh) * | 2016-05-30 | 2016-11-02 | 车智互联(北京)科技有限公司 | 一种模板页面编辑***及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108959299A (zh) | 2018-12-07 |
WO2018212931A1 (en) | 2018-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10061769B2 (en) | Machine translation method for performing translation between languages | |
US11475210B2 (en) | Language model for abstractive summarization | |
US11544474B2 (en) | Generation of text from structured data | |
CN111444320B (zh) | 文本检索方法、装置、计算机设备和存储介质 | |
US10726208B2 (en) | Consumer insights analysis using word embeddings | |
CN107704512B (zh) | 基于社交数据的金融产品推荐方法、电子装置及介质 | |
CN109376222B (zh) | 问答匹配度计算方法、问答自动匹配方法及装置 | |
WO2020077824A1 (zh) | 异常问题的定位方法、装置、设备及存储介质 | |
US20150161529A1 (en) | Identifying Related Events for Event Ticket Network Systems | |
US10810374B2 (en) | Matching a query to a set of sentences using a multidimensional relevancy determination | |
US10089366B2 (en) | Topical analytics for online articles | |
US9898464B2 (en) | Information extraction supporting apparatus and method | |
US10558759B1 (en) | Consumer insights analysis using word embeddings | |
US11860955B2 (en) | Method and system for providing alternative result for an online search previously with no result | |
CN111462751B (zh) | 解码语音数据的方法、装置、计算机设备和存储介质 | |
US20130204835A1 (en) | Method of extracting named entity | |
US10289624B2 (en) | Topic and term search analytics | |
CN108959299B (zh) | 对象描述 | |
CN112632275B (zh) | 基于个人文本信息的人群聚类数据处理方法、装置及设备 | |
US10496693B2 (en) | Unified classification and ranking strategy | |
CN114329206A (zh) | 标题生成方法和装置、电子设备、计算机可读介质 | |
WO2022015404A1 (en) | Sample assessment | |
US20230004570A1 (en) | Systems and methods for generating document score adjustments | |
CN112925913A (zh) | 用于匹配数据的方法、装置、设备和计算机可读存储介质 | |
CN113536778A (zh) | 标题的生成方法、装置和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |