CN113806500A - 信息处理方法、装置和计算机设备 - Google Patents

信息处理方法、装置和计算机设备 Download PDF

Info

Publication number
CN113806500A
CN113806500A CN202110180461.1A CN202110180461A CN113806500A CN 113806500 A CN113806500 A CN 113806500A CN 202110180461 A CN202110180461 A CN 202110180461A CN 113806500 A CN113806500 A CN 113806500A
Authority
CN
China
Prior art keywords
target
candidate
abstract
keyword
semantic model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110180461.1A
Other languages
English (en)
Other versions
CN113806500B (zh
Inventor
孔改捧
王骏
张宇
杨舟
梁杰
张清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jingdong Technology Holding Co Ltd
Original Assignee
Jingdong Technology Holding Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jingdong Technology Holding Co Ltd filed Critical Jingdong Technology Holding Co Ltd
Priority to CN202110180461.1A priority Critical patent/CN113806500B/zh
Publication of CN113806500A publication Critical patent/CN113806500A/zh
Application granted granted Critical
Publication of CN113806500B publication Critical patent/CN113806500B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Human Computer Interaction (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Machine Translation (AREA)

Abstract

本申请提出一种信息处理方法、装置和计算机设备,其中,方法包括:获取目标问题,以及对目标问题作答所得到的实际答案,查询目标问题对应的候选标签,其中,候选标签用于表示目标问题的关键点,将候选标签和实际答案输入经过训练的语义模型,以采用语义模型对实际答案进行关键词抽取得到与候选标签语义匹配的目标关键词,根据目标关键词,生成测评报告并展示。本申请中基于候选标签,对目标问题作答所得到的实际答案抽取关键词信息,实现了基于问题和答案的分析自动生成测评报告,提高了信息获取的效率,进而,基于测评报告提高了沟通效率。

Description

信息处理方法、装置和计算机设备
技术领域
本申请涉及人工智能技术领域,尤其涉及一种信息处理方法、装置和计算机设备。
背景技术
招聘流程中,HR面试沟通是必不可少的一环,尤其是在招聘季或校招季时,HR每天要和十几个候选人沟通,而在有限的时间内,HR和候选人的沟通可能只存在于表层,无法深入了解和沟通,沟通的效率较低。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的第一个目的在于提出一种信息处理方法,以实现提高沟通效率。
本申请的第二个目的在于提出一种信息处理装置。
本申请的第三个目的在于提出一种计算机设备。
本申请的第四个目的在于提出一种非临时性计算机可读存储介质。
本申请的第五个目的在于提出一种计算机程序产品。
为达上述目的,本申请第一方面实施例提出了一种信息处理方法,包括:
获取目标问题,以及对所述目标问题作答所得到的实际答案;
查询所述目标问题对应的候选标签,其中,所述候选标签用于表示所述目标问题的关键点;
将所述候选标签和所述实际答案输入经过训练的语义模型,以采用所述语义模型对所述实际答案进行关键词抽取得到与所述候选标签语义匹配的目标关键词;
根据所述目标关键词,生成测评报告并展示。
为达上述目的,本申请第二方面实施例提出了一种信息处理装置,包括:
获取模块,用于获取目标问题,以及对所述目标问题作答所得到的实际答案;
查询模块,用于查询所述目标问题对应的候选标签,其中,所述候选标签用于表示所述目标问题的关键点;
处理模块,用于将所述候选标签和所述实际答案输入经过训练的语义模型,以采用所述语义模型对所述实际答案进行关键词抽取得到与所述候选标签语义匹配的目标关键词;
生成模块,用于根据所述目标关键词,生成测评报告并展示。
为了实现上述目的,本申请第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如第一方面所述的方法。
为了实现上述目的,本申请第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的方法。
为了实现上述目的,本申请第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行如第一方面所述的方法。
本申请实施例所提供的技术方案可以包含如下的有益效果:
获取目标问题,以及对目标问题作答所得到的实际答案,查询目标问题对应的候选标签,其中,候选标签用于表示目标问题的关键点,将候选标签和实际答案输入经过训练的语义模型,以采用语义模型对实际答案进行关键词抽取得到与候选标签语义匹配的目标关键词,根据目标关键词,生成测评报告并展示。本申请中基于候选标签,对目标问题作答所得到的实际答案抽取关键词信息,实现了基于问题和答案的分析自动生成测评报告,提高了信息获取的效率,进而,基于测评报告提高了沟通效率。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例所提供的一种信息处理方法的流程示意图;
图2为本申请实施例提供的另一种信息处理方法的流程示意图;
图3为本申请实施例提供的另一种信息处理方法的流程示意图;
图4为本申请实施例提供的另一种信息处理方法的流程示意图;
图5为本申请实施例提供的一种信息处理装置的结构示意图;
图6为本申请实施方式的示例性计算机设备的框图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的信息处理方法、装置和计算机设备。
图1为本申请实施例所提供的一种信息处理方法的流程示意图。
如图1所示,该方法包括以下步骤:
步骤101,获取目标问题,以及对目标问题作答所得到的实际答案。
其中,目标问题和业务场景相关,不同的业务场景目标问题不同。目标问题,可以理解为对应的业务场景中的常见问题,高频问题等,本实施例中不进行限定。
例如,在面试场景中,目标问题,即为人力资源(Human Resource,HR)常提问的面试问题。例如,HR的目标问题为“职业规划是什么”,获取到的不同候选人的实际答案例如为“一年熟悉所有基本业务”或“2年内考到职业代理证”。
步骤102,查询目标问题对应的候选标签,其中,候选标签用于表示目标问题的关键点。
其中,目标问题对应的候选标签,是人为设定的针对目标问题的期望标签,用于表示目标问题的关键点,用于后续对实际答案进行目标关键词确定。其中,每一个目标问题对应的候选标签可以为一个或多个。
例如,HR的目标问题为“职业规划是什么”,对应的候选标签为“一年”或“三年”或“五年”或“技术”或“管理”,本实施例中不一一列举。
步骤103,将候选标签和实际答案输入经过训练的语义模型,以采用语义模型对实际答案进行关键词抽取得到与候选标签语义匹配的目标关键词。
其中,目标关键词包含了实际答案的关键信息,指示了实际答案和候选标签的语义相关度高于阈值。
本实施例中,采用语义模型对输入的候选标签和实际答案采用自然语言处理技术进行内容理解和分析,以获取输出的从实际答案中进行关键词抽取得到的与候选标签语义匹配的目标关键词,
步骤104,根据目标关键词,生成测评报告并展示。
本实施例中,测评报告展示了提供实际答案的人员的更多的信息,基于测评报告进行进一步的沟通,可提高沟通的效率。
例如,当招聘季或者校招季来临时,通过候选人针对目标为在线做答,生成测评报告,帮助HR了解候选人,节省沟通时间,让HR在有限时间内做更深入和更有意义的沟通,提高了沟通的效率和深度。
本实施例的信息处理方法中,获取目标问题,以及对目标问题作答所得到的实际答案,查询目标问题对应的候选标签,其中,候选标签用于表示目标问题的关键点,将候选标签和实际答案输入经过训练的语义模型,以采用语义模型对实际答案进行关键词抽取得到与候选标签语义匹配的目标关键词,根据目标关键词,生成测评报告并展示。本申请中基于候选标签,对目标问题作答所得到的实际答案抽取关键词信息,实现了基于问题和答案的分析自动生成测评报告,提高了信息获取的效率,进而,基于测评报告提高了沟通效率。
基于上一实施例,本实施例提供了另一种信息处理方法,为提高关键词抽取的准确度,语义模型中包含用于进行关键词抽取的关键词抽取网络,图2为本申请实施例提供的另一种信息处理方法的流程示意图。
如图2所示,上述步骤103包括以下步骤:
步骤201,将候选标签和实际答案输入经过训练的关键词抽取网络,以得到关键词抽取网络输出的目标关键词。
其中,关键词抽取网络,用于对实际答案进行切词得到多个候选词,分别对候选标签和多个候选词进行特征提取,得到候选标签的语义向量和多个候选词的语义向量,进而从多个候选词中,确定目标关键词,其中,目标关键词的语义向量与至少一个候选标签的语义向量之间的相似度大于相似度阈值。
作为一种可能的实现方式,根据余弦相似度,计算候选标签的语义向量和多个候选词的语义向量之间的余弦值,余弦值的大小指示了相似度大小,从而,将余弦值大于相似度阈值时对应的候选词,作为目标关键词。
本实施例中,将实际答案切分为多个候选词,根据候选标签,从实际答案对应的多个候选词中确定出和候选标签语义相似度大于相似度阈值的目标关键词,筛除了和目标问题不相关的候选词,提高了目标关键词确定的准确性,从而提高了基于目标问题,生成的测评报告的准确性。
基于上述实施例,本实施例提供了另一种信息处理方法,为了提高生成的测评报告中包含的信息量,测评报告中不仅包含目标关键词,还包含实际答案的摘要,即语义模型还包括摘要生成网络,用于对输入的实际答案提取出代表语义的核心语句,图3为本申请实施例提供的另一种信息处理方法的流程示意图,如图3所示,该方法包含以下步骤:
步骤301,获取目标问题,以及对目标问题作答所得到的实际答案。
步骤302,查询目标问题对应的候选标签,其中,候选标签用于表示目标问题的关键点。
步骤303,将候选标签和实际答案输入经过训练的关键词抽取网络,以得到关键词抽取网络输出的目标关键词。
步骤301-步骤303,可参照上述实施例中的解释说明,原理相同,此处不再赘述。
步骤304,将实际答案输入摘要生成网络,以得到实际答案的摘要。
本实施例中,为了提高后续测评报告中包含的信息量,以及可读性,在测评报告中包含实际答案的目标关键信息的情况下,测评包含中还包含实际答案的摘要,其中,实际答案的摘要即为根据用户的实际答案,生成的包含实际答案的关键信息的一句话。
作为本申请实施例的一种可能的实现方式,采用摘要生成网络执行文本排序算法,从实际答案中抽取出作为摘要的句子。
例如,实际答案为:我准备用2年的时间专心学习技术搞研发,在接下来的1年中学习相关的管理经验,希望能做项目经理。
从实际答案中抽取出作为摘要的句子,例如为:从技术研发逐步过渡至项目管理。
步骤305,根据目标关键词和实际答案的摘要,生成测评报告并展示。
本实施例中,通过目标关键词和实际答案的摘要,生成测评报告并展示,实现了测评报告的自动化生成,并增加了测评报告中包含的信息的数量和可读性,实现了基于测评报告获取更多信息,以便于后续进行更深入和有针对性的沟通,提高了后续沟通的效率。
基于上述实施例,本实施例还提供了一种实现方式,图4为本申请实施例提供的另一种信息处理方法的流程示意图,如图4所示,步骤305之后包含以下步骤:
步骤401,响应于用户操作,得到对测评报告中的目标关键词标注的参考关键词,以及参考摘要。
其中,标注的参考关键词和参考摘要,更准确的指示了实际***含的关键信息。
本实施例中,基于语义模型生成的测评报告中的目标关键词和摘要并不一定具有较高的准确度,从而,在生成测评报告并进行展示后,响应于用户操作,得到根据实际答案,标注的对测评报告中的目标关键词标注的参考关键词,以及参考摘要,作为对当前生成的测评报告的准确度的反馈。
步骤402,根据参考关键词和参考摘要,生成训练样本。
步骤403,采用训练样本对语义模型进行训练。
本实施例中,将获取到的参考关键词和参考摘要,生成训练样本,再采用该训练样本对语义模型进行训练,以使得语义模型不断的进行优化,以提高语义模型确定的目标关键词和摘要的准确度。
作为一种可能的实现方式,根据参考关键词和语义模型输出的目标关键词之间的差异,以及根据参考摘要和语义模型输出的摘要之间的差异,确定损失函数的取值,根据损失函数的取值,调整语义模型的模型参数,以使损失函数的取值最小化,从而以提高语义模型确定的目标关键词和摘要的准确度。
本实施例中的信息处理方法中,在生成测评报告并进行展示后,响应于用户操作,得到根据实际答案,确定的对测评报告中的目标关键词标注的参考关键词,以及参考摘要,作为对当前生成的测评报告的准确度的反馈,并基于标注的参考关键词和参考摘要,作为训练样本对语义模型进行训练,以使得语义模型不断的进行优化,以提高语义模型确定的目标关键词和摘要的准确度。
为了实现上述实施例,本申请还提出一种信息处理装置。
图5为本申请实施例提供的一种信息处理装置的结构示意图。
如图5所示,该装置包括:获取模块51、查询模块52、处理模块53和生成模块54。
获取模块51,用于获取目标问题,以及对目标问题作答所得到的实际答案。
查询模块52,用于查询目标问题对应的候选标签,其中,候选标签用于表示目标问题的关键点。
处理模块53,用于将候选标签和实际答案输入经过训练的语义模型,以采用语义模型对实际答案进行关键词抽取得到与候选标签语义匹配的目标关键词。
生成模块54,用于根据目标关键词,生成测评报告并展示。
进一步地,在本申请实施例的一种可能的实现方式中,语义模型包括关键词抽取网络;处理模块53,具体用于:
将所述候选标签和所述实际答案输入经过训练的所述关键词抽取网络,以得到所述关键词抽取网络输出的所述目标关键词;
其中,所述关键词抽取网络,用于对所述实际答案进行切词得到多个候选词;分别对所述候选标签和多个所述候选词进行特征提取,得到所述候选标签的语义向量和多个所述候选词的语义向量;从所述多个候选词中,确定所述目标关键词,其中,所述目标关键词的语义向量与至少一个所述候选标签的语义向量之间的相似度大于相似度阈值。
在本申请实施例的一种可能的实现方式中,语义模型还包括摘要生成网络;处理模块53,还用于将所述实际答案输入所述摘要生成网络,以得到所述实际答案的摘要;其中,所述测评报告中包含所述实际答案的摘要。
在本申请实施例的一种可能的实现方式中,处理模块53,具体还用于:
采用所述摘要生成网络执行文本排序算法,从所述实际答案中抽取出作为所述摘要的句子。
在本申请实施例的一种可能的实现方式中,该装置,还包括:
响应模块,用于响应于用户操作,得到对所述测评报告中的目标关键词标注的参考关键词,以及所述参考摘要;
上述生成模块54,用于根据所述参考关键词和所述参考摘要,生成训练样本;
训练模块,用于采用所述训练样本对所述语义模型进行训练。
在本申请实施例的一种可能的实现方式中,训练模块,具体用于:
根据所述参考关键词和所述语义模型输出的目标关键词之间的差异,以及根据所述参考摘要和所述语义模型输出的摘要之间的差异,确定损失函数的取值;
根据所述损失函数的取值,调整所述语义模型的模型参数,以使所述损失函数的取值最小化。
需要说明的是,前述对方法实施例的解释说明也适用于该实施例的装置,此处不再赘述。
本实施例的信息处理装置中,获取目标问题,以及对目标问题作答所得到的实际答案,查询目标问题对应的候选标签,其中,候选标签用于表示目标问题的关键点,将候选标签和实际答案输入经过训练的语义模型,以采用语义模型对实际答案进行关键词抽取得到与候选标签语义匹配的目标关键词,根据目标关键词,生成测评报告并展示。本申请中基于候选标签,对目标问题作答所得到的实际答案抽取关键词信息,实现了基于问题和答案的分析自动生成测评报告,提高了信息获取的效率,进而,基于测评报告提高了沟通效率。
为了实现上述实施例,本申请实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如前述方法实施例所述的方法。
为了实现上述实施例,本申请实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如前述方法实施例所述的方法。
为了实现上述实施例,本申请实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,实现如前述方法实施例所述的方法。
图6为本申请实施方式的示例性计算机设备的框图。图6显示的计算机设备12仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,***存储器28,连接不同***组件(包括***存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及***组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
计算机设备12典型地包括多种计算机***可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
处理单元16通过运行存储在***存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (15)

1.一种信息处理方法,其特征在于,包括以下步骤:
获取目标问题,以及对所述目标问题作答所得到的实际答案;
查询所述目标问题对应的候选标签,其中,所述候选标签用于表示所述目标问题的关键点;
将所述候选标签和所述实际答案输入经过训练的语义模型,以采用所述语义模型对所述实际答案进行关键词抽取得到与所述候选标签语义匹配的目标关键词;
根据所述目标关键词,生成测评报告并展示。
2.根据权利要求1所述的信息处理方法,其特征在于,所述语义模型包括关键词抽取网络;所述采用所述语义模型对所述实际答案进行关键词抽取得到与所述候选标签语义匹配的目标关键词,包括:
将所述候选标签和所述实际答案输入经过训练的所述关键词抽取网络,以得到所述关键词抽取网络输出的所述目标关键词;
其中,所述关键词抽取网络,用于对所述实际答案进行切词得到多个候选词;分别对所述候选标签和多个所述候选词进行特征提取,得到所述候选标签的语义向量和多个所述候选词的语义向量;从所述多个候选词中,确定所述目标关键词,其中,所述目标关键词的语义向量与至少一个所述候选标签的语义向量之间的相似度大于相似度阈值。
3.根据权利要求2所述的信息处理方法,其特征在于,所述语义模型还包括摘要生成网络;所述方法还包括:
将所述实际答案输入所述摘要生成网络,以得到所述实际答案的摘要;
其中,所述测评报告中包含所述实际答案的摘要。
4.根据权利要求3所述的信息处理方法,其特征在于,所述将所述实际答案输入所述摘要生成网络,以得到所述实际答案的摘要,包括:
采用所述摘要生成网络执行文本排序算法,从所述实际答案中抽取出作为所述摘要的句子。
5.根据权利要求3所述的信息处理方法,其特征在于,所述根据所述目标关键词,生成测评报告并展示之后,还包括:
响应于用户操作,得到对所述测评报告中的目标关键词标注的参考关键词,以及所述参考摘要;
根据所述参考关键词和所述参考摘要,生成训练样本;
采用所述训练样本对所述语义模型进行训练。
6.根据权利要求5所述的信息处理方法,其特征在于,所述采用所述训练样本对所述语义模型进行训练,包括:
根据所述参考关键词和所述语义模型输出的目标关键词之间的差异,以及根据所述参考摘要和所述语义模型输出的摘要之间的差异,确定损失函数的取值;
根据所述损失函数的取值,调整所述语义模型的模型参数,以使所述损失函数的取值最小化。
7.一种信息处理装置,其特征在于,包括:
获取模块,用于获取目标问题,以及对所述目标问题作答所得到的实际答案;
查询模块,用于查询所述目标问题对应的候选标签,其中,所述候选标签用于表示所述目标问题的关键点;
处理模块,用于将所述候选标签和所述实际答案输入经过训练的语义模型,以采用所述语义模型对所述实际答案进行关键词抽取得到与所述候选标签语义匹配的目标关键词;
生成模块,用于根据所述目标关键词,生成测评报告并展示。
8.根据权利要求7所述的信息处理装置,其特征在于,所述语义模型包括关键词抽取网络;所述处理模块,具体用于:
将所述候选标签和所述实际答案输入经过训练的所述关键词抽取网络,以得到所述关键词抽取网络输出的所述目标关键词;
其中,所述关键词抽取网络,用于对所述实际答案进行切词得到多个候选词;分别对所述候选标签和多个所述候选词进行特征提取,得到所述候选标签的语义向量和多个所述候选词的语义向量;从所述多个候选词中,确定所述目标关键词,其中,所述目标关键词的语义向量与至少一个所述候选标签的语义向量之间的相似度大于相似度阈值。
9.根据权利要求8所述的信息处理装置,其特征在于,所述语义模型还包括摘要生成网络;
所述处理模块,还用于将所述实际答案输入所述摘要生成网络,以得到所述实际答案的摘要;其中,所述测评报告中包含所述实际答案的摘要。
10.根据权利要求9所述的信息处理装置,其特征在于,所述处理模块,具体还用于:
采用所述摘要生成网络执行文本排序算法,从所述实际答案中抽取出作为所述摘要的句子。
11.根据权利要求9所述的信息处理装置,其特征在于,所述装置,还包括:
响应模块,用于响应于用户操作,得到对所述测评报告中的目标关键词标注的参考关键词,以及所述参考摘要;
所述生成模块,用于根据所述参考关键词和所述参考摘要,生成训练样本;
训练模块,用于采用所述训练样本对所述语义模型进行训练。
12.根据权利要求11所述的信息处理装置,其特征在于,所述训练模块,具体用于:
根据所述参考关键词和所述语义模型输出的目标关键词之间的差异,以及根据所述参考摘要和所述语义模型输出的摘要之间的差异,确定损失函数的取值;
根据所述损失函数的取值,调整所述语义模型的模型参数,以使所述损失函数的取值最小化。
13.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-6中任一所述的方法。
14.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的方法。
15.一种计算机程序产品,其特征在于,当所述计算机程序产品中的指令由处理器执行时,执行如权利要求1-6中任一所述的方法。
CN202110180461.1A 2021-02-09 2021-02-09 信息处理方法、装置和计算机设备 Active CN113806500B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110180461.1A CN113806500B (zh) 2021-02-09 2021-02-09 信息处理方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110180461.1A CN113806500B (zh) 2021-02-09 2021-02-09 信息处理方法、装置和计算机设备

Publications (2)

Publication Number Publication Date
CN113806500A true CN113806500A (zh) 2021-12-17
CN113806500B CN113806500B (zh) 2024-05-28

Family

ID=78892796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110180461.1A Active CN113806500B (zh) 2021-02-09 2021-02-09 信息处理方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN113806500B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114970470A (zh) * 2022-07-27 2022-08-30 中关村科学城城市大脑股份有限公司 文案信息处理方法、装置、电子设备和计算机可读介质
CN117708391A (zh) * 2024-02-05 2024-03-15 天开林源(天津)科技有限责任公司 一种数据处理方法、装置、设备及存储介质
CN117875908A (zh) * 2024-03-08 2024-04-12 蒲惠智造科技股份有限公司 一种基于企业管理软件saas的工单处理方法和***

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060277165A1 (en) * 2005-06-03 2006-12-07 Fuji Xerox Co., Ltd. Question answering system, data search method, and computer program
KR101662450B1 (ko) * 2015-05-29 2016-10-05 포항공과대학교 산학협력단 다중 소스 하이브리드 질의응답 방법 및 시스템
CN107491655A (zh) * 2017-08-31 2017-12-19 康安健康管理咨询(常熟)有限公司 基于机器学习的肝脏疾病信息智能咨询方法及***
US20170364586A1 (en) * 2016-06-20 2017-12-21 International Business Machines Corporation Contextual Content Graph for Automatic, Unsupervised Summarization of Content
CN108681574A (zh) * 2018-05-07 2018-10-19 中国科学院合肥物质科学研究院 一种基于文本摘要的非事实类问答答案选择方法及***
CN109522486A (zh) * 2018-11-30 2019-03-26 北京字节跳动网络技术有限公司 用于匹配信息的方法和装置
CN109978339A (zh) * 2019-02-27 2019-07-05 平安科技(深圳)有限公司 Ai面试模型训练方法、装置、计算机设备及存储介质
CN110569356A (zh) * 2019-08-14 2019-12-13 中国平安人寿保险股份有限公司 基于智能面试交互***的面试方法、装置和计算机设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060277165A1 (en) * 2005-06-03 2006-12-07 Fuji Xerox Co., Ltd. Question answering system, data search method, and computer program
KR101662450B1 (ko) * 2015-05-29 2016-10-05 포항공과대학교 산학협력단 다중 소스 하이브리드 질의응답 방법 및 시스템
US20170364586A1 (en) * 2016-06-20 2017-12-21 International Business Machines Corporation Contextual Content Graph for Automatic, Unsupervised Summarization of Content
CN107491655A (zh) * 2017-08-31 2017-12-19 康安健康管理咨询(常熟)有限公司 基于机器学习的肝脏疾病信息智能咨询方法及***
CN108681574A (zh) * 2018-05-07 2018-10-19 中国科学院合肥物质科学研究院 一种基于文本摘要的非事实类问答答案选择方法及***
CN109522486A (zh) * 2018-11-30 2019-03-26 北京字节跳动网络技术有限公司 用于匹配信息的方法和装置
CN109978339A (zh) * 2019-02-27 2019-07-05 平安科技(深圳)有限公司 Ai面试模型训练方法、装置、计算机设备及存储介质
CN110569356A (zh) * 2019-08-14 2019-12-13 中国平安人寿保险股份有限公司 基于智能面试交互***的面试方法、装置和计算机设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114970470A (zh) * 2022-07-27 2022-08-30 中关村科学城城市大脑股份有限公司 文案信息处理方法、装置、电子设备和计算机可读介质
CN117708391A (zh) * 2024-02-05 2024-03-15 天开林源(天津)科技有限责任公司 一种数据处理方法、装置、设备及存储介质
CN117708391B (zh) * 2024-02-05 2024-05-17 天开林源(天津)科技有限责任公司 一种数据处理方法、装置、设备及存储介质
CN117875908A (zh) * 2024-03-08 2024-04-12 蒲惠智造科技股份有限公司 一种基于企业管理软件saas的工单处理方法和***

Also Published As

Publication number Publication date
CN113806500B (zh) 2024-05-28

Similar Documents

Publication Publication Date Title
CN113806500B (zh) 信息处理方法、装置和计算机设备
CN111767366B (zh) 问答资源挖掘方法、装置、计算机设备及存储介质
CN110543592B (zh) 信息搜索方法、装置以及计算机设备
CN108090043B (zh) 基于人工智能的纠错举报处理方法、装置及可读介质
US11461613B2 (en) Method and apparatus for multi-document question answering
CN109616101B (zh) 声学模型训练方法、装置、计算机设备和可读存储介质
CN111241230A (zh) 一种基于文本挖掘识别串标风险的方法及***
CN111930792A (zh) 数据资源的标注方法、装置、存储介质及电子设备
CN107844531B (zh) 答案输出方法、装置和计算机设备
CN110020163B (zh) 基于人机交互的搜索方法、装置、计算机设备和存储介质
CN109190099B (zh) 句模提取方法及装置
CN111144079A (zh) 一种智能获取学习资源的方法、装置、打印机和存储介质
WO2023236253A1 (zh) 文档检索方法、装置及电子设备
CN111143517B (zh) 人选标签预测方法、装置、设备和存储介质
CN111738009B (zh) 实体词标签生成方法、装置、计算机设备和可读存储介质
CN112699671B (zh) 一种语言标注方法、装置、计算机设备和存储介质
CN113807096A (zh) 文本数据的处理方法、装置、计算机设备和存储介质
CN115964484A (zh) 基于多标签分类模型实现的法律多意图识别方法和装置
CN109299294B (zh) 应用中的资源搜索方法、装置、计算机设备和存储介质
CN110276001B (zh) 盘点页识别方法、装置、计算设备和介质
CN113901793A (zh) 结合rpa和ai的事件抽取方法及装置
CN113836296A (zh) 一种佛学问答摘要的生成方法、装置、设备及存储介质
CN108595620B (zh) 转义识别方法、装置、计算机设备及存储介质
CN117672027B (zh) 一种vr教学方法、装置、设备及介质
EP4297039A1 (en) Data processing method, device and storage medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant