CN113221572A - 一种信息处理方法、装置、设备及介质 - Google Patents

一种信息处理方法、装置、设备及介质 Download PDF

Info

Publication number
CN113221572A
CN113221572A CN202110601192.1A CN202110601192A CN113221572A CN 113221572 A CN113221572 A CN 113221572A CN 202110601192 A CN202110601192 A CN 202110601192A CN 113221572 A CN113221572 A CN 113221572A
Authority
CN
China
Prior art keywords
entity
collection
information
target
entities
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110601192.1A
Other languages
English (en)
Other versions
CN113221572B (zh
Inventor
李林萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN202110601192.1A priority Critical patent/CN113221572B/zh
Publication of CN113221572A publication Critical patent/CN113221572A/zh
Priority to PCT/CN2022/085439 priority patent/WO2022252806A1/zh
Priority to US18/548,456 priority patent/US20240169000A1/en
Application granted granted Critical
Publication of CN113221572B publication Critical patent/CN113221572B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本公开实施例涉及一种信息处理方法、装置、设备及介质,其中该方法包括:获取目标合集对应的多个构成要素,确定满足所述多个构成要素的第一类实体;基于所述第一类实体的多媒体信息生成所述目标合集的合集内容;根据所述目标合集的特征信息确定第二类实体;在所述第一类实体和所述第二类实体中,确定与所述合集内容关联的目标实体。采用上述技术方案,加强了实体与合集之间的联系,缩短用户消费合集的路径,能够更好的满足用户对实体相关内容的探索发现需求,提高了合集和实体展示的多样性和丰富性,进而提高了用户的内容浏览效果。

Description

一种信息处理方法、装置、设备及介质
技术领域
本公开涉及信息处理技术领域,尤其涉及一种信息处理方法、装置、设备及介质。
背景技术
随着互联网技术的快速发展,人们可以从互联网中方便、快捷地了解各类知识。
在一些内容消费场景下,可以展示实体或者将具有相同特征的多个实体组成合集展示给用户,以供用户了解实体或实体间的联系。然而,在展示实体或合集时用户通常需要多次跳转才能充分了解实体与合集之间的联系,无法直观地建立实体与合集之间的联系。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种信息处理方法、装置、设备及介质。
本公开实施例提供了一种信息处理方法,所述方法包括:
获取目标合集对应的多个构成要素,确定满足所述多个构成要素的第一类实体;
基于所述第一类实体的多媒体信息生成所述目标合集的合集内容;
根据所述目标合集的特征信息确定第二类实体;
在所述第一类实体和所述第二类实体中,确定与所述合集内容关联的目标实体。
本公开实施例还提供了一种信息处理方法,所述方法包括:
获取目标实体的百科内容信息,其中,所述百科内容信息包括所述目标实体关联的至少一个合集的合集信息;
根据所述百科内容信息的展示场景,展示所述目标实体关联的所述至少一个合集的合集信息。
本公开实施例还提供了一种信息处理装置,所述装置包括:
第一类实体模块,用于获取目标合集对应的多个构成要素,确定满足所述多个构成要素的第一类实体;
合集内容模块,用于基于所述第一类实体的多媒体信息生成所述目标合集的合集内容;
第二类实体模块,用于根据所述目标合集的特征信息确定第二类实体;
关联模块,用于在所述第一类实体和所述第二类实体中,确定与所述合集内容关联的目标实体。
本公开实施例还提供了一种信息处理装置,所述装置包括:
实体内容模块,用于获取目标实体的百科内容信息,其中,所述百科内容信息包括所述目标实体关联的至少一个合集的合集信息;
展示模块,用于根据所述百科内容信息的展示场景,展示所述目标实体关联的所述至少一个合集的合集信息。
本公开实施例还提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现如本公开实施例提供的信息处理方法。
本公开实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行如本公开实施例提供的信息处理方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:本公开实施例提供的信息处理方案,获取目标合集对应的多个构成要素,确定满足所述多个构成要素的第一类实体;基于所述第一类实体的多媒体信息生成所述目标合集的合集内容;根据所述目标合集的特征信息确定第二类实体;在所述第一类实体和所述第二类实体中,确定与所述合集内容关联的目标实体。采用上述技术方案,基于合集的构成要素可以确定第一类实体、合集的合集内容以及第二类实体,进行在第一类实体和第二实体中可以确定与合集内容关联的实体,使得客户端展示实体时可以展示关联的合集,能够帮助用户更加高效直观地建立实体与合集之间的联系,缩短用户消费合集的路径,能够更好的满足用户对实体相关内容的探索发现需求,提高了合集和实体展示的多样性和丰富性,进而提高了用户的内容浏览效果。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本公开实施例提供的一种信息处理方法的流程示意图;
图2为本公开实施例提供的一种构成要素确定的示意图;
图3为本公开实施例提供的另一种构成要素确定的示意图;
图4为本公开实施例提供的第一类实体的匹配示意图;
图5为本公开实施例提供的实体关联的示意图;
图6为本公开实施例提供的一种信息处理的示意图;
图7为本公开实施例提供的另一种信息处理方法的流程示意图;
图8为本公开实施例提供的一种合集展示的示意图;
图9为本公开实施例提供的另一种合集展示的示意图;
图10为本公开实施例提供的再一种合集展示的示意图;
图11为本公开实施例提供的又一种合集展示的示意图;
图12为本公开实施例提供的一种信息处理装置的结构示意图;
图13为本公开实施例提供的另一种信息处理装置的结构示意图;
图14为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
目前,用户每天会对百科内容产生大量消费需求,不同属性的词条之间的联系以及词条与包括多个词条的合集之间的联系较弱,用户需要多次跳转才能充分了解。为了解决上述问题,本公开实施例提供了一种信息处理方法,下面结合具体的实施例对该方法进行介绍。
图1为本公开实施例提供的一种信息处理方法的流程示意图,该方法可以由信息处理装置执行,其中该装置可以采用软件和/或硬件实现,一般可集成在电子设备中。如图1所示,该方法应用于客户端或服务器,包括:
步骤101、获取目标合集对应的多个构成要素,确定满足多个构成要素的第一类实体。
其中,构成要素可以为构成合集的要素信息,具体可以为构成合集标题的不同属性维度下的关键词,属性维度可以为合集标题所涉及的分类方向。示例性的,假设合集标题的属性维度可以包括身高、年龄、性别和职业,身高的关键词为“170以上”、年龄的关键词为“90后”、性别的关键词为“女”,职业的关键词为“艺人”,上述不同属性维度下的关键词“170以上”、“90后”、“女”和“艺人”即为构成要素。合集是满足所有构成要素的多个实体的集合,实体可以为人物、动物、事件、自然现象等。
构成要素可以由用户输入或基于预设规则得到,预设规则可以根据实际情况设定。在一个示例中,构成要素可以根据热点内容或用户的交互内容来确定,当根据热点内容确定时,可以从热点内容中可以提取多个关键词,选取其中几个关键词作为构成要素,例如假设热点内容为金马奖,通过从金马奖相关的图文和视频中可以提取女主角、男主角、90后和28届等关键词作为构成要素。当根据用户的交互内容来确定构成要素时,交互内容可以包括搜索信息和评论信息等内容,可以从交互内容中提取多个关键词,选取其中几个关键词作为构成要素,例如假设用户的搜索信息为“金马奖的90后获奖者”,可以从该搜索信息中提取金马奖、90后和获奖者作为构成要素。当然,上述构成要素的确定方式仅为示例,而非唯一限定。
本公开实施例中,确定满足多个构成要素的第一类实体,包括:将多个构成要素与实体数据库中多个实体的属性信息进行匹配,根据第一匹配结果确定第一类实体。
其中,实体数据库可以为预先建立的包括多个实体的数据库,实体的属性信息是指用于表征实体在不同属性维度下的特征信息,例如人物实体的属性信息可以包括人物分别在身高、年龄、性别和职业等属性维度下的特征信息。第一类实体中可以包括一个或多个实体,具体数量不限。
具体的,服务器获取目标合集的多个构成要素之后,可以将多个构成要素分别与实体数据库中的多个实体的属性信息进行匹配,也即将多个构成要素与属性信息中对应属性维度下的信息进行匹配,如果一个属性信息包括构成要素则确定匹配成功,之后可以确定匹配成功的多个属性信息所对应的实体,第一匹配结果中包括匹配成功的实体。之后可以将匹配成功的实体确定为第一类实体。
可选的,根据第一匹配结果确定第一类实体,包括:将匹配成功的实体按照交互数据进行排序,将排序在前的第一预设数量的匹配成功的实体确定为第一类实体。交互数据是指用户与介绍实体相关的多媒体内容的交互操作数据,例如交互数据可以包括浏览量、点击量和评论量等。
确定第一匹配结果之后,可以将匹配成功的实体按照交互数据进行排序,将排序在前的第一预设数量的匹配成功的实体确定为第一类实体。第一预设数量可以根据实际情况确定,例如预设数量可以为100,将排序前100个匹配成功的实体确定为第一类实体。
示例性的,假设构成要素为“身高”、“≤170”、“艺人”,可以匹配到身高小于等于170的多个艺的实体,可以将全部匹配到的艺人作为第一类实体,也可以将浏览量排序在前100的艺人作为第一类实体。
示例性的,图2为本公开实施例提供的一种构成要素确定的示意图,图3为本公开实施例提供的另一种构成要素确定的示意图,如图2所示,图中模版内容包括的是该模版下的不同属性维度,如图3所示,对于模版“艺人”包括的属性维度如图3中展示的职业、国籍、性别出生地、出生日期、去世日期、身高和民族等。示例性的,用户可以在图2中选择模版“艺人”,之后在图3中的属性维度职业、性别、身高下分别输入“明星”、“男”和“170以下”,则可以确定构成要素包括“明星”、“男”和“170以下”,图3中展示的标题“身高170以下的男明星”可以在确定构成要素之后生成并展示。
图2和图3可以为客户端中提供的内容候选工具中的页面,客户端通过图2和图3中的页面获取用户输入的不同属性维度下的关键词,之后将该关键词发送至服务器,服务器将不同属性维度下的关键词确定为合集的构成要素。
示例性的,图4为本公开实施例提供的第一类实体的匹配示意图,如图3和图4所示,在图3中确定构成要素之后,可以将构成要素分别与实体数据库中的多个实体的属性信息匹配,确定匹配成功的实体,图3中展示了匹配成功的明星,包括100个,可以作为第一类实体。可选的,本实施例还可以在图3匹配成功的实体中取浏览量排序前100作为第一类实体,在图3的基础上,图4中展示了在图3的100个匹配成功的明星中选择的23个明星,构成第一类实体。并且图3和图4中均支持人工对已添加的实体进行删除和添加新的实体。
步骤102、基于第一类实体的多媒体信息生成目标合集的合集内容。
实体的多媒体信息是指实体对应的多种类型的信息,例如百科、图片、文本和视频等,具体不限。目标合集的合集内容可以包括目标合集中各实体的介绍信息,各实体的介绍信息可以与上述合集的构成要素相匹配。
本公开实施例中,在确定满足多个构成要素的第一类实体之后,针对第一类实体中的每个实体,可以根据该实体的标识和多个构成要素所在属性维度,在第一类实体的多媒体信息中进行查找,将该实体在多个构成要素所在属性维度下的多媒体信息确定为该实体的介绍信息。
步骤103、根据目标合集的特征信息确定第二类实体。
其中,第二类实体是与目标合集的特征相关的大范围的实体,与上述第一类实体不同。通过确定第二类实体可以对目标合集相关的实体进行大范围的扩充,保证了基础实体的数量,以增强后续相关实体确定的准确性。
目标合集的特征信息是指基于目标合集的合集内容提取的关键性的代表信息,能够表征目标合集的特性。
本公开实施例中,根据目标合集的特征信息确定第二类实体,包括:提取目标合集的合集内容中的多个关键词作为特征信息,其中,合集内容包括目标合集中各实体的介绍信息;将多个关键词与实体数据库中多个实体的属性信息进行匹配,根据第二匹配结果确定第二类实体;其中,第二类实体的属性信息与至少一个关键词相匹配。
具体的,针对目标合集的合集内容可以提取多个关键词作为特征信息,具体提取方式不限,例如可以目标合集中各实体的介绍信息进行切词,将数量最多的词确定为关键词。之后可以将多个关键词与实体数据库中多个实体的属性信息进行匹配,将与至少一个关键词匹配度大于设定阈值的实体确定为匹配成功的实体,将匹配成功的实体确定为第二类实体。第二类实体的属性信息与至少一个关键词相匹配。示例性的,假设目标合集的特征信息为“百花奖”和“女艺人”,可以将与“百花奖”匹配成功的实体以及与“女艺人”匹配成功的实体确定为第二类实体。
步骤104、在第一类实体和第二类实体中,确定与合集内容关联的目标实体。
其中,确定与合集内容关联的目标实体具体可以为确定与目标合集的合集内容在含义上具有部分相同点或相似点的实体,确定该目标实体之后,可以在展示目标实体的同时可以展示关联的合集,加强了实体与合集之间的联系,缩短用户消费合集的路径。
本公开实施例中,在第一类实体和第二类实体中,确定与合集内容关联的目标实体,可以包括:对第一类实体和第二类实体进行去重,得到候选实体集合;基于候选实体集合中各第一候选实体的属性信息,对第一候选实体进行分类,得到多类候选实体子集合;根据各候选实体子集合的类别特征,分别从候选实体子集合中选择预设数量的第二候选实体,将第二候选实体确定为目标实体。
具体的,在上述步骤中分别确定第一类实体和第二类实体之后,可以对第一类实体和第二类实体进行去重处理,删除重复的实体,得到候选实体集合,候选实体集合中可以包括多个第一候选实体。之后可以根据候选实体集合中各第一候选实体的属性信息对多个第一候选实体进行分类,得到多类候选实体子集合。上述对第一候选实体的分类方式不限,例如可以采用聚类算法进行分类。分别根据各候选实体子集合的类别特征提取预设数量的第二候选实体,第二候选实体即为目标实体。类别特征是指各候选实体子集合的集合特征,也即各候选实体子集合中每个第一候选实体均具有的特征,不同候选实体子集合的预设数量可以基于类别特征设置,例如针对类别特征分别为人物和事件,预设数量可以不同。可选的,服务器确定第一类实体和第二类实体之后,也可以直接将第一类实体和第二类实体确定为与目标合集的合集内容关联的目标实体。
上述方案中,在得到第一类实体和第二类实体之后,通过对第一类实体和第二类实体的去重和分类等处理,可以从其中提取部分实体作为与目标合集的合集内容关联的实体,这种细化的处理提升了合集关联实体确定的准确性。
示例性的,假设第一类实体和第二类实体总共包括120个实体,去重之后,得到100个实体为第一候选实体,构成候选实体集合;针对候选实体集合进行分类之后,可以得到10个候选实体子集合,每个候选实体子集合中包括10个第一候选实体;针对各候选实体子集合,分别提取部分第一候选实体,提取出的第一候选实体称为第二候选实体,第二候选实体的数量可以小于100,也可以等于100;最后将第二候选实体确定为与目标合集内容关联的目标实体。
图5为本公开实施例提供的实体关联的示意图,如图5所示,以百科合集为例,图中展示了百科合集“2020年电视剧小花们”关联的目标实体,图中包括了23个明星。
示例性的,图6为本公开实施例提供的一种信息处理的示意图,如图6所示,图中表征了确定与一个百科合集的合集内容关联的词条的过程,具体过程可以包括:创建/编辑合集。添加合集基本信息,也即获取百科合集的多个构成要素。添加词条,此时的词条为确定满足多个构成要素的第一类词条。判断是否需要内容候选,若是,则进入基本信息属性筛选并添加,也即采用半自动化方式添加词条,将多个构成要素与实体数据库中多个实体的属性信息进行匹配,确定第一类词条,之后关联词条。若不需要内容候选,则人工添加第一类词条,并关联词条。上述关联词条的具体过程,可以根据百科合集的特征信息确定第二类词条,并根据第一类词条和第二类词条以及预设规则,确定百科合集的合集内容关联的目标词条,预设规则可以包括:第一类词条自动作为目标词条;第一类词条变更关联目标词条随之变更;目标词条变更,第一类词条不变;当对第一类词条进行二次编辑时,目标词条对增量数据进行变更;对第一类词条和第二词条进行去重、分类和提取。最后提交,确定与一个百科合集的合集内容关联的目标词条并提交以备后用。在用户发起浏览词条行为后,判断词条是否有对应百科合集,若是则在展示词条内容时进行百科合集展示。
本公开实施例提供的信息处理方案,基于合集的构成要素可以确定第一类实体、合集的合集内容以及第二类实体,进而在第一类实体和第二实体中可以确定与合集内容关联的实体,使得客户端展示实体时可以展示关联的合集,加强了实体与合集之间的联系,缩短用户消费合集的路径,能够更好的满足用户对实体相关内容的探索发现需求,提高了合集和实体展示的多样性和丰富性,进而提高了用户的内容浏览效果。
图7为本公开实施例提供的另一种信息处理方法的流程示意图,该方法可以由信息处理装置执行,其中该装置可以采用软件和/或硬件实现,一般可集成在电子设备中。如图7所示,该方法应用于客户端,包括:
步骤201、获取目标实体的百科内容信息,其中,百科内容信息包括目标实体关联的至少一个合集的合集信息。
其中,百科内容信息可以为对目标实体的百科相关信息的统称,百科内容信息中可以包括目标实体的实体内容,以及目标实体关联的至少一个合集的合集信息,确定目标实体与合集的关联关系的方式如上一实施例中所述,在此不进行说明。合集信息可以包括合集的标题信息以及合集中各实体的属性信息,各实体的属性信息与合集的标题信息相匹配。
各实体的属性信息是指与实体内容相关的各种信息,各实体的属性信息可以包括实体名称以及与合集的标题信息中核心词匹配的特征文本。合集的标题信息可以为根据合集的构成要素确定的信息。合集的标题信息中核心词是指对合集的标题信息分词得到的词语。与核心词匹配的特征文本可以理解为是每个实体与合集的标题信息相关联的具体文本,特征文本可以包括一个或多个,例如合集的标题信息为“90后170cm的女明星”包括年龄和身高两个特征文本。由于实体的属性信息与合集的标题信息相匹配,增强了实体与合集标题的关联性,能够辅助用户了解合集内容以及各实体的特点。
本公开实施例中,当检测到用户的预设触发操作时,可以获取与触发操作对应的目标实体的百科内容信息,预设触发操作不限,例如预设触发操作可以为对目标实体的点击触发操作、对搜索词的搜索触发操作等。
步骤202、根据百科内容信息的展示场景,展示目标实体关联的至少一个合集的合集信息。
其中,展示场景可以包括百科详情页面下进行合集展示的场景、针对搜索词进行合集展示的场景以及在推荐流页面进行合集展示的场景。基于不同展示场景的特性和目的,在不同展示场景下,可以设置不同的合集展示方式和内容,以实现不同的展示效果,满足用户在不同场景下对合集的消费需求。
可选的,根据百科内容信息的展示场景,展示目标实体关联的至少一个合集的合集信息,包括:当展示场景为百科详情展示场景,在百科详情页面的合集展示区域以卡片形式展示至少一个合集的合集信息;其中,合集信息包括合集的标题信息以及合集中第一预设数量的实体的属性信息。
百科详情场景是指针对百科知识的展示场景,百科详情页面是指用于展示百科信息的页面。当展示场景为百科详情展示场景时,可以在百科详情页面展示目标实体的实体内容的同时,在百科详情页面的合集展示区域中以卡片形式展示至少一个合集的标题信息以及合集中第一预设数量的实体的属性信息。合集展示区域是指百科详情页面中设置的用于展示合集的区域,在合集展示区域中可以设置多个卡片,每个卡片对应一个合集。第一预设数量可以根据实际情况设置,例如第一预设数量可以为合集中全部实体的数量之和,也可以为部分实体的数量。当第一预设数量大于或等于二时,也即合集中展示的实体的数量为至少两个时,各实体的排列方式不限,可以为竖向排列或横向排序,并且可以支持滑动查看当前界面没有显示的实体。各卡片可以沿预设方向进行滑动,预设方向根据实际情况确定,例如预设方向可以为横向或纵向。
示例性的,图8为本公开实施例提供的一种合集展示的示意图;如图8所示,图中展示了实体“明星甲”的百科详情页,该百科详情页中展示了该实体的内容以及与该实体关联的相关合集的合集信息,实体的内容包括图中“明星甲”的图片、个人信息、简介、参演作品、相关人物、人物经历和相关合集,其中参演作品可以包括图中的参演电影、参演电视剧和相声作品等。相关合集是指与该词条关联的百科合集,数量可以为多个,图中示例性的展示了一个百科合集的卡片,图中该百科合集中示例性的展示了两个实体,卡片中包括合集标题为“盘点那些名校毕业的优质演员”,卡片中还展示了两个实体分别为“明星甲”和“明星乙”的属性信息,该合集包括24个实体,通过点击“查看更多”或在该卡片上滑动可以查看更多实体,并且每个实体中包括与合集标题匹配的特征文本,例如图中的“学校A”、“学校B”。
可选的,根据百科内容信息的展示场景,展示目标实体关联的至少一个合集的合集信息,包括:当展示场景为搜索结果展示场景或推荐信息展示场景,在搜索结果页面或推荐信息页面以卡片形式展示至少一个合集的标题信息。
搜索结果展示场景是指当用户输入的搜索词中包括某个实体,在展示该实体时展示与实体关联的合集信息的场景,搜索结果页面是指展示与搜索词关联的实体以及合集的页面。推荐信息展示场景是指在对全部合集进行分发时,将合集分发至推荐流中的展示场景,推荐信息页面是指用于展示推荐信息以及合集的页面。
具体的,当展示场景为搜索结果展示场景时,可以在搜索结果页面将展示搜索结果的同时,搜索结果中包括目标实体,在搜索结果页面以卡片形式展示与目标实体关联的至少一个合集的标题信息。搜索结果页面可以设置多个卡片,每个卡片可以展示一个合集的标题信息。
示例性的,图9为本公开实施例提供的另一种合集展示的示意图,图9中展示了一个搜索结果页面,搜索词为“明星丙”,搜索结果页面中展示了“明星丙”的一个实体,以及与该实体关联的相关合集,相关合集中示例性的展示了三个合集的标题信息,包括图中的“那些名校毕业的优质歌手”、“获得金曲奖的优秀歌手”、“选秀节目歌手”,每个合集的标题信息展示在一个卡片中。
当展示场景为推荐信息展示场景时,可以在推荐信息页面将展示推荐信息的同时,推荐信息中包括目标实体的相关信息,在推荐信息页面以卡片形式展示与目标实体关联的至少一个合集的标题信息,以使用户在推荐场景下可以快速浏览到相关的合集信息。推荐信息页面中可以设置多个卡片,每个卡片可以展示一个合集的标题信息。可选的,在推荐信息页面展示与目标实体关联的至少一个合集的标题信息的同时,还可以展示合集中至少一个实体的属性信息。
示例性的,图10为本公开实施例提供的再一种合集展示的示意图,图中展示了一个推荐信息页面,该推荐信息页面中的第一个推荐信息为目标实体“明星丁”的相关信息,之后示例性展示了三个与“明星丁”关联的合集的卡片,每个卡片中展示一个合集的信息,第一个卡片和第二个卡片中仅展示了合集的标题信息,第三个卡片中展示了合集的标题信息以及两个实体的属性信息。
上述方案中,根据不同展示场景的特性和目的,可以在展示实体关联的合集时以不同形式和内容进行展示,以实现不同的展示效果,满足用户在不同场景下对合集的消费需求,能够更好的满足用户对合集的探索发现需求。
本公开实施例提供的信息处理方案,获取目标实体的百科内容信息,其中,百科内容信息包括目标实体关联的至少一个合集的合集信息;根据百科内容信息的展示场景,展示目标实体关联的至少一个合集的合集信息。采用上述技术方案,展示一个实体时可以展示与该实体关联的合集,加强了实体与合集之间的联系,缩短用户消费合集的路径,能够更好的满足用户对实体相关内容的探索发现需求,提高了合集和实体展示的多样性和丰富性,进而提高了用户的内容浏览效果。
在一些实施例中,信息处理方法还可以包括:接收对至少一个合集中的目标合集的触发操作;在合集详情页面的第一展示区域展示目标合集的标题信息以及目标合集中各实体的属性信息。
其中,触发操作是指用展示目标合集的任意一种操作,具体不限,例如可以为对目标合集的点击操作。合集详情页是指用于展示合集的全部相关信息的页面。具体的,当检测到用户对至少一个合集中目标合集的预设信息的触发操作,则可以在合集详情页的第一展示区域展示目标合集的全部合集信息,全部合集信息包括目标合集的标题信息以及目标合集中各实体的属性信息。上述预设信息可以根据实际情况进行设置,例如预设信息可以为目标合集的合集标题或合集图片等,具体不限。
示例性的,图11为本公开实施例提供的又一种合集展示的示意图,图中展示了一个合集详情页面,该合集详情页中展示了合集标题为“盘点那些名校毕业的优质演艺生”的百科合集,图中还展示了该百科合集的简介信息“明星大腕里真的有学霸?来,我们扒一扒明星里的超级真学霸,顺便撩一眼世界明校风采”。并且,该百科合集中包括了24个词条,图中示例性的展示了5个词条,每个词条包括一个明星的相关信息,各词条对应的属性信息为图中的毕业院校,例如对于第一个词条,展示了明星甲的图片、简介“中国内地男演员”以及与合集标题匹配的属性信息“学校A”。
由于实体的属性信息中各实体均具有合集标题的匹配信息,使得实体与合集标题的关联性增强,有助于用户阅读。
在一些实施例中,当合集包括多个,信息处理方法还可以包括:在合集详情页的第二展示区域展示多个合集中除目标合集之外的其他合集的标题信息和/或该其他集合中第二预设数量的实体的属性信息。
其中,第二展示区域是合集详情页中设置的与上述第一展示区域不同的一个区域。当合集的数量为多个时,可以在合集详情页的第二展示区域展示多个合集中除了上述目标合集之外的其他合集的合集信息,具体可以展示其他合集的标题信息和/或该其他集合中第二预设数量的实体的属性信息,第二预设数量可以根据实际情况确定,例如第二预设数量可以为实体数量的全部,也可以为部分,具体不限。
上述方案中,在基于触发操作展示一个合集的详情时,还可以展示关联的其他合集的信息,使用户可以直观地了解不同合集之间的关联性,帮助用户更加高效地建立各合集之间的联系,进而可以吸引用户的点击,提高了合集的体验效果。
图12为本公开实施例提供的一种信息处理装置的结构示意图,该装置可由软件和/或硬件实现,一般可集成在电子设备中。如图12所示,该装置包括:
第一类实体模块301,用于获取目标合集对应的多个构成要素,确定满足所述多个构成要素的第一类实体;
合集内容模块302,用于基于所述第一类实体的多媒体信息生成所述目标合集的合集内容;
第二类实体模块303,用于根据所述目标合集的特征信息确定第二类实体;
关联模块304,用于在所述第一类实体和所述第二类实体中,确定与所述合集内容关联的目标实体。
可选的,所述第一类实体模块301具体用于:
将所述多个构成要素与实体数据库中多个实体的属性信息进行匹配,根据第一匹配结果确定第一类实体。
可选的,所述第一类实体模块301具体用于:
将匹配成功的实体按照交互数据进行排序,将排序在前的第一预设数量的所述匹配成功的实体确定为所述第一类实体。
可选的,所述第二类实体模块303具体用于:
提取所述目标合集的合集内容中的多个关键词作为特征信息,其中,所述合集内容包括所述目标合集中各实体的介绍信息;
将所述多个关键词与实体数据库中多个实体的属性信息进行匹配,根据第二匹配结果确定第二类实体;其中,所述第二类实体的属性信息与至少一个所述关键词相匹配。
可选的,所述关联模块304具体用于:
对所述第一类实体和第二类实体进行去重,得到候选实体集合;
基于所述候选实体集合中各第一候选实体的属性信息,对所述第一候选实体进行分类,得到多类候选实体子集合;
根据各所述候选实体子集合的类别特征,分别从所述候选实体子集合中选择预设数量的第二候选实体,将所述第二候选实体确定为所述目标实体。
本公开实施例所提供的信息处理装置可执行本公开任意实施例所提供的信息处理方法,具备执行方法相应的功能模块和有益效果。
图13为本公开实施例提供的另一种信息处理装置的结构示意图,该装置可由软件和/或硬件实现,一般可集成在电子设备中。如图13所示,该装置包括:
实体内容模块401,用于获取目标实体的百科内容信息,其中,所述百科内容信息包括所述目标实体关联的至少一个合集的合集信息;
展示模块402,用于根据所述百科内容信息的展示场景,展示所述目标实体关联的所述至少一个合集的合集信息。
可选的,所述合集信息包括合集的标题信息以及所述合集中各实体的属性信息,所述各实体的属性信息与所述合集的标题信息相匹配。
可选的,所述展示模块402具体用于:
当所述展示场景为百科详情展示场景,在百科详情页面的合集展示区域以卡片形式展示所述至少一个合集的合集信息;其中,所述合集信息包括合集的标题信息以及所述合集中第一预设数量的实体的属性信息。
可选的,所述展示模块402具体用于:
当所述展示场景为搜索结果展示场景或推荐信息展示场景,在搜索结果页面或推荐信息页面以卡片形式展示所述至少一个合集的标题信息。
可选的,所述装置还包括合集详情模块,用于:
接收对所述至少一个合集中的目标合集的触发操作;
在合集详情页面的第一展示区域展示所述目标合集的标题信息以及所述目标合集中各实体的属性信息。
可选的,当所述合集包括多个,所述集详情模块具体用于:
在所述合集详情页的第二展示区域展示所述多个合集中除所述目标合集之外的其他合集的标题信息和/或该其他集合中第二预设数量的实体的属性信息。
本公开实施例所提供的信息处理装置可执行本公开任意实施例所提供的信息处理方法,具备执行方法相应的功能模块和有益效果。
本公开实施例提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本公开任意实施例所提供的信息处理方法。
图14为本公开实施例提供的一种电子设备的结构示意图。下面具体参考图14,其示出了适于用来实现本公开实施例中的电子设备500的结构示意图。本公开实施例中的电子设备500可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图14示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图14所示,电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图14示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本公开实施例的信息处理方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取目标合集对应的多个构成要素,确定满足所述多个构成要素的第一类实体;基于所述第一类实体的多媒体信息生成所述目标合集的合集内容;根据所述目标合集的特征信息确定第二类实体;在所述第一类实体和所述第二类实体中,确定与所述合集内容关联的目标实体。
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取目标实体的百科内容信息,其中,所述百科内容信息包括所述目标实体关联的至少一个合集的合集信息;根据所述百科内容信息的展示场景,展示所述目标实体关联的所述至少一个合集的合集信息。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,本公开提供了一种信息处理方法,包括:
获取目标合集对应的多个构成要素,确定满足所述多个构成要素的第一类实体;
基于所述第一类实体的多媒体信息生成所述目标合集的合集内容;
根据所述目标合集的特征信息确定第二类实体;
在所述第一类实体和所述第二类实体中,确定与所述合集内容关联的目标实体。
根据本公开的一个或多个实施例,本公开提供的信息处理方法中,确定满足所述多个构成要素的第一类实体,包括:
将所述多个构成要素与实体数据库中多个实体的属性信息进行匹配,根据第一匹配结果确定第一类实体。
根据本公开的一个或多个实施例,本公开提供的信息处理方法中,根据第一匹配结果确定第一类实体,包括:
将匹配成功的实体按照交互数据进行排序,将排序在前的第一预设数量的所述匹配成功的实体确定为所述第一类实体。
根据本公开的一个或多个实施例,本公开提供的信息处理方法中,根据所述目标合集的特征信息确定第二类实体,包括:
提取所述目标合集的合集内容中的多个关键词作为特征信息,其中,所述合集内容包括所述目标合集中各实体的介绍信息;
将所述多个关键词与实体数据库中多个实体的属性信息进行匹配,根据第二匹配结果确定第二类实体;其中,所述第二类实体的属性信息与至少一个所述关键词相匹配。
根据本公开的一个或多个实施例,本公开提供的信息处理方法中,在所述第一类实体和所述第二类实体中,确定与所述合集内容关联的目标实体,包括:
对所述第一类实体和第二类实体进行去重,得到候选实体集合;
基于所述候选实体集合中各第一候选实体的属性信息,对所述第一候选实体进行分类,得到多类候选实体子集合;
根据各所述候选实体子集合的类别特征,分别从所述候选实体子集合中选择预设数量的第二候选实体,将所述第二候选实体确定为所述目标实体。
根据本公开的一个或多个实施例,本公开提供了一种信息处理方法,包括:
获取目标实体的百科内容信息,其中,所述百科内容信息包括所述目标实体关联的至少一个合集的合集信息;
根据所述百科内容信息的展示场景,展示所述目标实体关联的所述至少一个合集的合集信息。
根据本公开的一个或多个实施例,本公开提供的信息处理方法中,所述合集信息包括合集的标题信息以及所述合集中各实体的属性信息,所述各实体的属性信息与所述合集的标题信息相匹配。
根据本公开的一个或多个实施例,本公开提供的信息处理方法中,根据所述百科内容信息的展示场景,展示所述目标实体关联的至少一个合集的合集信息,包括:
当所述展示场景为百科详情展示场景,在百科详情页面的合集展示区域以卡片形式展示所述至少一个合集的合集信息;其中,所述合集信息包括合集的标题信息以及所述合集中第一预设数量的实体的属性信息。
根据本公开的一个或多个实施例,本公开提供的信息处理方法中,根据所述百科内容信息的展示场景,展示所述目标实体关联的至少一个合集的合集信息,包括:
当所述展示场景为搜索结果展示场景或推荐信息展示场景,在搜索结果页面或推荐信息页面以卡片形式展示所述至少一个合集的标题信息。
根据本公开的一个或多个实施例,本公开提供的信息处理方法中,还包括:
接收对所述至少一个合集中的目标合集的触发操作;
在合集详情页面的第一展示区域展示所述目标合集的标题信息以及所述目标合集中各实体的属性信息。
根据本公开的一个或多个实施例,本公开提供的信息处理方法中,当所述合集包括多个,所述方法还包括:
在所述合集详情页的第二展示区域展示所述多个合集中除所述目标合集之外的其他合集的标题信息和/或该其他集合中第二预设数量的实体的属性信息。
根据本公开的一个或多个实施例,本公开提供了一种信息处理装置,包括:
第一类实体模块,用于获取目标合集对应的多个构成要素,确定满足所述多个构成要素的第一类实体;
合集内容模块,用于基于所述第一类实体的多媒体信息生成所述目标合集的合集内容;
第二类实体模块,用于根据所述目标合集的特征信息确定第二类实体;
关联模块,用于在所述第一类实体和所述第二类实体中,确定与所述合集内容关联的目标实体。
根据本公开的一个或多个实施例,本公开提供的信息处理装置中,所述第一类实体模块具体用于:
将所述多个构成要素与实体数据库中多个实体的属性信息进行匹配,根据第一匹配结果确定第一类实体。
根据本公开的一个或多个实施例,本公开提供的信息处理装置中,所述第一类实体模块具体用于:
将匹配成功的实体按照交互数据进行排序,将排序在前的第一预设数量的所述匹配成功的实体确定为所述第一类实体。
根据本公开的一个或多个实施例,本公开提供的信息处理装置中,所述第二类实体模块具体用于:
提取所述目标合集的合集内容中的多个关键词作为特征信息,其中,所述合集内容包括所述目标合集中各实体的介绍信息;
将所述多个关键词与实体数据库中多个实体的属性信息进行匹配,根据第二匹配结果确定第二类实体;其中,所述第二类实体的属性信息与至少一个所述关键词相匹配。
根据本公开的一个或多个实施例,本公开提供的信息处理装置中,所述关联模块具体用于:
对所述第一类实体和第二类实体进行去重,得到候选实体集合;
基于所述候选实体集合中各第一候选实体的属性信息,对所述第一候选实体进行分类,得到多类候选实体子集合;
根据各所述候选实体子集合的类别特征,分别从所述候选实体子集合中选择预设数量的第二候选实体,将所述第二候选实体确定为所述目标实体。
根据本公开的一个或多个实施例,本公开提供了一种信息处理装置,包括:
实体内容模块,用于获取目标实体的百科内容信息,其中,所述百科内容信息包括所述目标实体关联的至少一个合集的合集信息;
展示模块,用于根据所述百科内容信息的展示场景,展示所述目标实体关联的所述至少一个合集的合集信息。
根据本公开的一个或多个实施例,本公开提供的信息处理装置中,所述合集信息包括合集的标题信息以及所述合集中各实体的属性信息,所述各实体的属性信息与所述合集的标题信息相匹配。
根据本公开的一个或多个实施例,本公开提供的信息处理装置中,所述展示模块具体用于:
当所述展示场景为百科详情展示场景,在百科详情页面的合集展示区域以卡片形式展示所述至少一个合集的合集信息;其中,所述合集信息包括合集的标题信息以及所述合集中第一预设数量的实体的属性信息。
根据本公开的一个或多个实施例,本公开提供的信息处理装置中,所述展示模块具体用于:
当所述展示场景为搜索结果展示场景或推荐信息展示场景,在搜索结果页面或推荐信息页面以卡片形式展示所述至少一个合集的标题信息。
根据本公开的一个或多个实施例,本公开提供的信息处理装置中,所述装置还包括合集详情模块,用于:
接收对所述至少一个合集中的目标合集的触发操作;
在合集详情页面的第一展示区域展示所述目标合集的标题信息以及所述目标合集中各实体的属性信息。
根据本公开的一个或多个实施例,本公开提供的信息处理装置中,当所述合集包括多个,所述集详情模块具体用于:
在所述合集详情页的第二展示区域展示所述多个合集中除所述目标合集之外的其他合集的标题信息和/或该其他集合中第二预设数量的实体的属性信息。
根据本公开的一个或多个实施例,本公开提供了一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现如本公开提供的任一所述的信息处理方法。
根据本公开的一个或多个实施例,本公开提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行如本公开提供的任一所述的信息处理方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (15)

1.一种信息处理方法,其特征在于,包括:
获取目标合集对应的多个构成要素,确定满足所述多个构成要素的第一类实体;
基于所述第一类实体的多媒体信息生成所述目标合集的合集内容;
根据所述目标合集的特征信息确定第二类实体;
在所述第一类实体和所述第二类实体中,确定与所述合集内容关联的目标实体。
2.根据权利要求1所述的方法,其特征在于,确定满足所述多个构成要素的第一类实体,包括:
将所述多个构成要素与实体数据库中多个实体的属性信息进行匹配,根据第一匹配结果确定第一类实体。
3.根据权利要求2所述的方法,其特征在于,根据第一匹配结果确定第一类实体,包括:
将匹配成功的实体按照交互数据进行排序,将排序在前的第一预设数量的所述匹配成功的实体确定为所述第一类实体。
4.根据权利要求1所述的方法,其特征在于,根据所述目标合集的特征信息确定第二类实体,包括:
提取所述目标合集的合集内容中的多个关键词作为特征信息,其中,所述合集内容包括所述目标合集中各实体的介绍信息;
将所述多个关键词与实体数据库中多个实体的属性信息进行匹配,根据第二匹配结果确定第二类实体;其中,所述第二类实体的属性信息与至少一个所述关键词相匹配。
5.根据权利要求1所述的方法,其特征在于,在所述第一类实体和所述第二类实体中,确定与所述合集内容关联的目标实体,包括:
对所述第一类实体和第二类实体进行去重,得到候选实体集合;
基于所述候选实体集合中各第一候选实体的属性信息,对所述第一候选实体进行分类,得到多类候选实体子集合;
根据各所述候选实体子集合的类别特征,分别从所述候选实体子集合中选择预设数量的第二候选实体,将所述第二候选实体确定为所述目标实体。
6.一种信息处理方法,其特征在于,包括:
获取目标实体的百科内容信息,其中,所述百科内容信息包括所述目标实体关联的至少一个合集的合集信息;
根据所述百科内容信息的展示场景,展示所述目标实体关联的所述至少一个合集的合集信息。
7.根据权利要求6所述的方法,其特征在于,所述合集信息包括合集的标题信息以及所述合集中各实体的属性信息,所述各实体的属性信息与所述合集的标题信息相匹配。
8.根据权利要求7所述的方法,其特征在于,根据所述百科内容信息的展示场景,展示所述目标实体关联的至少一个合集的合集信息,包括:
当所述展示场景为百科详情展示场景,在百科详情页面的合集展示区域以卡片形式展示所述至少一个合集的合集信息;其中,所述合集信息包括合集的标题信息以及所述合集中第一预设数量的实体的属性信息。
9.根据权利要求7所述的方法,其特征在于,根据所述百科内容信息的展示场景,展示所述目标实体关联的至少一个合集的合集信息,包括:
当所述展示场景为搜索结果展示场景或推荐信息展示场景,在搜索结果页面或推荐信息页面以卡片形式展示所述至少一个合集的标题信息。
10.根据权利要求8或9所述的方法,其特征在于,还包括:
接收对所述至少一个合集中的目标合集的触发操作;
在合集详情页面的第一展示区域展示所述目标合集的标题信息以及所述目标合集中各实体的属性信息。
11.根据权利要求10所述的方法,其特征在于,当所述合集包括多个,所述方法还包括:
在所述合集详情页的第二展示区域展示所述多个合集中除所述目标合集之外的其他合集的标题信息和/或该其他集合中第二预设数量的实体的属性信息。
12.一种信息处理装置,其特征在于,包括:
第一类实体模块,用于获取目标合集对应的多个构成要素,确定满足所述多个构成要素的第一类实体;
合集内容模块,用于基于所述第一类实体的多媒体信息生成所述目标合集的合集内容;
第二类实体模块,用于根据所述目标合集的特征信息确定第二类实体;
关联模块,用于在所述第一类实体和所述第二类实体中,确定与所述合集内容关联的目标实体。
13.一种信息处理装置,其特征在于,包括:
实体内容模块,用于获取目标实体的百科内容信息,其中,所述百科内容信息包括所述目标实体关联的至少一个合集的合集信息;
展示模块,用于根据所述百科内容信息的展示场景,展示所述目标实体关联的所述至少一个合集的合集信息。
14.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-11中任一所述的信息处理方法。
15.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-11中任一所述的信息处理方法。
CN202110601192.1A 2021-05-31 2021-05-31 一种信息处理方法、装置、设备及介质 Active CN113221572B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202110601192.1A CN113221572B (zh) 2021-05-31 2021-05-31 一种信息处理方法、装置、设备及介质
PCT/CN2022/085439 WO2022252806A1 (zh) 2021-05-31 2022-04-07 信息处理方法、装置、设备及介质
US18/548,456 US20240169000A1 (en) 2021-05-31 2022-04-07 Information processing method and apparatus, device, and medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110601192.1A CN113221572B (zh) 2021-05-31 2021-05-31 一种信息处理方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN113221572A true CN113221572A (zh) 2021-08-06
CN113221572B CN113221572B (zh) 2024-05-07

Family

ID=77081675

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110601192.1A Active CN113221572B (zh) 2021-05-31 2021-05-31 一种信息处理方法、装置、设备及介质

Country Status (3)

Country Link
US (1) US20240169000A1 (zh)
CN (1) CN113221572B (zh)
WO (1) WO2022252806A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022252806A1 (zh) * 2021-05-31 2022-12-08 北京字节跳动网络技术有限公司 信息处理方法、装置、设备及介质

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130006952A1 (en) * 2011-06-29 2013-01-03 Microsoft Corporation Organizing search history into collections
CN103914543A (zh) * 2014-04-03 2014-07-09 北京百度网讯科技有限公司 搜索结果的展现方法和装置
CN105677931A (zh) * 2016-04-07 2016-06-15 北京百度网讯科技有限公司 信息搜索方法和装置
CN106951526A (zh) * 2017-03-21 2017-07-14 北京邮电大学 一种实体集扩展方法及装置
CN107346336A (zh) * 2017-06-29 2017-11-14 北京百度网讯科技有限公司 基于人工智能的信息处理方法和装置
CN109635120A (zh) * 2018-10-30 2019-04-16 百度在线网络技术(北京)有限公司 知识图谱的构建方法、装置和存储介质
US20190197166A1 (en) * 2017-12-27 2019-06-27 Beijing Baidu Netcom Science And Technology Co., Ltd. Method, terminal device and storage medium for mining entity description tag
CN110555627A (zh) * 2019-09-10 2019-12-10 拉扎斯网络科技(上海)有限公司 实体展示方法、装置、存储介质和电子设备
CN110674394A (zh) * 2019-08-20 2020-01-10 腾讯科技(深圳)有限公司 一种基于知识图谱的信息推荐方法、装置及存储介质
CN112084268A (zh) * 2020-09-04 2020-12-15 北京字节跳动网络技术有限公司 一种搜索结果展示的方法、装置及计算机存储介质
CN112084405A (zh) * 2020-09-04 2020-12-15 北京字节跳动网络技术有限公司 一种搜索方法、装置及计算机存储介质
US10896222B1 (en) * 2017-06-28 2021-01-19 Amazon Technologies, Inc. Subject-specific data set for named entity resolution
CN112257444A (zh) * 2020-10-12 2021-01-22 四川传承数据设计有限公司 金融信息负面实体发现方法、装置、电子设备及存储介质
US20210042366A1 (en) * 2017-06-19 2021-02-11 Equifax Inc. Machine-learning system for servicing queries for digital content
CN112559718A (zh) * 2020-12-24 2021-03-26 北京百度网讯科技有限公司 对话处理的方法、装置、电子设备和存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9110977B1 (en) * 2011-02-03 2015-08-18 Linguastat, Inc. Autonomous real time publishing
CN107784029B (zh) * 2016-08-31 2022-02-08 阿里巴巴集团控股有限公司 生成提示关键词、建立索引关系的方法、服务器和客户端
CN107105031A (zh) * 2017-04-20 2017-08-29 北京京东尚科信息技术有限公司 信息推送方法和装置
CN107193974B (zh) * 2017-05-25 2020-11-10 北京百度网讯科技有限公司 基于人工智能的地域性信息确定方法和装置
CN112182426A (zh) * 2019-07-05 2021-01-05 阿里巴巴集团控股有限公司 用户界面信息展示方法、装置及电子设备
CN110716991B (zh) * 2019-10-11 2020-10-27 掌阅科技股份有限公司 基于电子书的实体关联信息的展示方法及电子设备
CN112052297B (zh) * 2020-09-07 2024-03-22 抖音视界有限公司 信息生成方法、装置、电子设备和计算机可读介质
CN113221572B (zh) * 2021-05-31 2024-05-07 抖音视界有限公司 一种信息处理方法、装置、设备及介质

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130006952A1 (en) * 2011-06-29 2013-01-03 Microsoft Corporation Organizing search history into collections
CN103914543A (zh) * 2014-04-03 2014-07-09 北京百度网讯科技有限公司 搜索结果的展现方法和装置
CN105677931A (zh) * 2016-04-07 2016-06-15 北京百度网讯科技有限公司 信息搜索方法和装置
CN106951526A (zh) * 2017-03-21 2017-07-14 北京邮电大学 一种实体集扩展方法及装置
US20210042366A1 (en) * 2017-06-19 2021-02-11 Equifax Inc. Machine-learning system for servicing queries for digital content
US10896222B1 (en) * 2017-06-28 2021-01-19 Amazon Technologies, Inc. Subject-specific data set for named entity resolution
CN107346336A (zh) * 2017-06-29 2017-11-14 北京百度网讯科技有限公司 基于人工智能的信息处理方法和装置
US20190197166A1 (en) * 2017-12-27 2019-06-27 Beijing Baidu Netcom Science And Technology Co., Ltd. Method, terminal device and storage medium for mining entity description tag
CN109635120A (zh) * 2018-10-30 2019-04-16 百度在线网络技术(北京)有限公司 知识图谱的构建方法、装置和存储介质
CN110674394A (zh) * 2019-08-20 2020-01-10 腾讯科技(深圳)有限公司 一种基于知识图谱的信息推荐方法、装置及存储介质
CN110555627A (zh) * 2019-09-10 2019-12-10 拉扎斯网络科技(上海)有限公司 实体展示方法、装置、存储介质和电子设备
CN112084268A (zh) * 2020-09-04 2020-12-15 北京字节跳动网络技术有限公司 一种搜索结果展示的方法、装置及计算机存储介质
CN112084405A (zh) * 2020-09-04 2020-12-15 北京字节跳动网络技术有限公司 一种搜索方法、装置及计算机存储介质
CN112257444A (zh) * 2020-10-12 2021-01-22 四川传承数据设计有限公司 金融信息负面实体发现方法、装置、电子设备及存储介质
CN112559718A (zh) * 2020-12-24 2021-03-26 北京百度网讯科技有限公司 对话处理的方法、装置、电子设备和存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022252806A1 (zh) * 2021-05-31 2022-12-08 北京字节跳动网络技术有限公司 信息处理方法、装置、设备及介质

Also Published As

Publication number Publication date
CN113221572B (zh) 2024-05-07
US20240169000A1 (en) 2024-05-23
WO2022252806A1 (zh) 2022-12-08

Similar Documents

Publication Publication Date Title
WO2018072071A1 (zh) 知识图谱构建***及方法
CN113486252A (zh) 搜索结果展示方法、装置、设备和介质
CN112989076A (zh) 多媒体内容搜索方法、装置、设备及介质
CN113204691B (zh) 一种信息展示方法、装置、设备及介质
CN115982376B (zh) 基于文本、多模数据和知识训练模型的方法和装置
WO2023279843A1 (zh) 内容搜索方法、装置、设备和存储介质
WO2023016349A1 (zh) 一种文本输入方法、装置、电子设备和存储介质
CN112948540A (zh) 信息查询方法、装置、电子设备以及计算机可读介质
CN114564666A (zh) 百科信息展示方法、装置、设备和介质
WO2024099171A1 (zh) 视频生成方法和装置
CN111897950A (zh) 用于生成信息的方法和装置
CN114065057A (zh) 搜索结果确定方法、展示方法、装置、设备和介质
CN115080816A (zh) 摘要信息生成与搜索结果展示方法、装置、设备和介质
CN111339452A (zh) 搜索结果展现的方法、终端、服务器和***
CN108984688B (zh) 母婴知识话题推荐方法及装置
CN113011169B (zh) 一种会议纪要的处理方法、装置、设备及介质
CN114357325A (zh) 内容搜索方法、装置、设备及介质
CN114298007A (zh) 一种文本相似度确定方法、装置、设备及介质
CN113407775B (zh) 视频搜索方法、装置及电子设备
CN111259225A (zh) 新媒体信息展示方法、装置、电子设备及计算机可读介质
CN113221572B (zh) 一种信息处理方法、装置、设备及介质
CN111382262B (zh) 用于输出信息的方法和装置
CN111767259A (zh) 内容分享的方法、装置、可读介质和电子设备
CN114995691A (zh) 一种文档处理方法、装置、设备和介质
CN109472028B (zh) 用于生成信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant after: Tiktok vision (Beijing) Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant before: BEIJING BYTEDANCE NETWORK TECHNOLOGY Co.,Ltd.

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant after: Douyin Vision Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant before: Tiktok vision (Beijing) Co.,Ltd.

GR01 Patent grant
GR01 Patent grant