CN114358891A - 问题推送方法、装置、设备以及存储介质 - Google Patents
问题推送方法、装置、设备以及存储介质 Download PDFInfo
- Publication number
- CN114358891A CN114358891A CN202210260835.5A CN202210260835A CN114358891A CN 114358891 A CN114358891 A CN 114358891A CN 202210260835 A CN202210260835 A CN 202210260835A CN 114358891 A CN114358891 A CN 114358891A
- Authority
- CN
- China
- Prior art keywords
- target
- explicit
- feature
- question
- implicit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0605—Supply or demand aggregation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了一种问题推送方法、装置、设备以及存储介质,涉及计算机技术领域,尤其涉及人工智能、智能搜索等技术领域。具体实现方案为:响应于接收到目标问题文本,确定目标问题文本的第一隐式特征和多个候选对象中每个候选对象的第二隐式特征;确定目标问题文本的第一显式特征和每个候选对象的第二显式特征;根据目标问题文本的第一隐式特征和第一显式特征,以及每个候选对象的第二隐式特征和第二显式特征,确定多个候选对象中的多个目标对象;以及向多个目标对象推送目标问题文本。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及人工智能、智能搜索等技术领域。
背景技术
付费咨询是提问者支付一定费用,获得问题答案的一种交易行为。在传统咨询行业,仅有部分专业领域存在付费咨询服务,由服务提供者进行定价,咨询发起者进行购买。但随着互联网时代到来,付费咨询可以通过问答平台实现,可咨询的问题类型也更为广泛。提问者可以通过问答平台提出问题,问答平台可以针对该问题找到能解决问题的答主,并撮合双方达成咨询交易。
发明内容
本公开提供了一种问题推送方法、装置、设备、存储介质以及程序产品。
根据本公开的一方面,提供了一种问题推送方法,包括:响应于接收到目标问题文本,确定所述目标问题文本的第一隐式特征和多个候选对象中每个候选对象的第二隐式特征;确定所述目标问题文本的第一显式特征和所述每个候选对象的第二显式特征;根据所述目标问题文本的第一隐式特征和第一显式特征,以及所述每个候选对象的第二隐式特征和第二显式特征,确定所述多个候选对象中的多个目标对象;以及向所述多个目标对象推送所述目标问题文本。
根据本公开的另一方面,提供了一种问题推送装置,包括:隐式特征确定模块,用于响应于接收到目标问题文本,确定所述目标问题文本的第一隐式特征和多个候选对象中每个候选对象的第二隐式特征;显式特征确定模块,用于确定所述目标问题文本的第一显式特征和所述每个候选对象的第二显式特征;目标对象确定模块,用于根据所述目标问题文本的第一隐式特征和第一显式特征,以及所述每个候选对象的第二隐式特征和第二显式特征,确定所述多个候选对象中的多个目标对象;以及推送模块,用于向所述多个目标对象推送所述目标问题文本。
本公开的另一个方面提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开实施例所示的方法。
根据本公开实施例的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开实施例所示的方法。
根据本公开实施例的另一方面,提供了一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现本公开实施例所示方法的步骤。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
根据本公开的实施例,根据目标问题文本的第一隐式特征和第一显式特征,以及每个候选对象的第二隐式特征和第二显式特征,来确定目标对象,可以提高问题和对象之间的匹配度,从而提高答题质量。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开实施例的问题推送方法、装置、电子设备和存储介质的应用场景示意图;
图2示意性示出了根据本公开的实施例的问题推送方法的流程图;
图3示意性示出了根据本公开的实施例的确定目标对象的方法的流程图;
图4示意性示出了根据本公开的实施例的向多个目标对象推送目标问题文本的方法的流程图;
图5示意性示出了根据本公开另一实施例的问题推送的示意图;
图6示意性示出了根据本公开实施例的问题推送装置的框图;以及
图7示意性示出了可以用来实施本公开的实施例的示例电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
以下将结合图1对本公开提供的问题推送方法和装置的应用场景进行描述。
图1是根据本公开实施例的问题推送方法、装置、电子设备和存储介质的应用场景示意图。需要注意的是,图1所示仅为可以应用本公开实施例的应用场景的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、***、环境或场景。
如图1所示,该应用场景100包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如问答类应用、购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所访问的问答平台提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
服务器105可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务(Virtual Private Server,或简称VPS)中,存在的管理难度大,业务扩展性弱的缺陷。服务器也105可以为分布式***的服务器,或者是结合了区块链的服务器。
根据本公开的实施例,提问者可以通过终端设备101向服务器105发送待解答问题的问题文本。服务器105在接到问题文本后,可以确定与该问题文本匹配的至少一个答题者(也称答主)。然后将该问题文本推送给该答主所对应的终端设备,例如本实施例中的终端设备102和103。然后由该答主针对该问题文本给出相应的回答,并将回答内容通过对应的终端设备发送至服务器105。服务器105接收到回答内容后,可以将回答内容发送至终端设备101,以供提问者浏览。
在实际应用的过程中,提问者提出的问题可能被分配给与该问题不匹配的答主进行回答,从而导致回答的质量较低。
基于此,根据本公开的实施例,可以分别确定问题文本的隐式特征和显式特征以及答主的隐式特征和显式特征,然后根据问题文本的隐式特征和显式特征与答主的隐式特征和显式特征之间的匹配关系,对答主进行筛选,从而可以提高问题和答主之间的匹配度,提高回答的质量。
需要说明的是,本公开实施例所提供的问题推送方法一般可以由服务器105执行。相应地,本公开实施例所提供的问题推送装置一般可以设置于服务器105中。本公开实施例所提供的问题推送方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的问题推送装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
以下将结合图2对本公开提供的问题推送方法进行描述。
图2示意性示出了根据本公开的实施例的问题推送方法的流程图。
如图2所示,该问题推送方法200包括在操作S210,响应于接收到目标问题文本,确定目标问题文本的第一隐式特征和多个候选对象中每个候选对象的第二隐式特征。
根据本公开的实施例,目标问题文本例如可以包括待解答问题的文本信息。该待解答问题例如可以由用户通过终端设备上传。候选对象例如可以为答主。
根据本公开的实施例,例如可以对目标问题文本进行隐式特征提取,得到目标问题文本的隐式特征,即第一隐式特征。相应地,例如可以对每个候选对象的相关信息进行隐式特征提取,得到每个候选对象的隐式特征,即第二隐式特征。其中,相关信息例如可以包括与候选对象关联的历史问题的文本信息。
然后,在操作S220,确定目标问题文本的第一显式特征和每个候选对象的第二显式特征。
根据本公开的实施例,例如可以对目标问题文本进行显式特征提取,得到目标问题文本的显式特征,即第一显式特征。相应地,例如可以对每个候选对象的相关信息进行显式特征提取,得到每个候选对象的显式特征,即第二显式特征。
在操作S230,根据目标问题文本的第一隐式特征和第一显式特征,以及每个候选对象的第二隐式特征和第二显式特征,确定多个候选对象中的多个目标对象。
根据本公开的实施例,例如可以根据问题文本的隐式特征和显式特征与答主的隐式特征和显式特征之间的匹配关系,来对多个候选对象进行筛选,得到多个目标对象。
在操作S240,向多个目标对象推送目标问题文本。
根据本公开的实施例,可以向多个目标对象推送目标问题文本,以便由该多个目标对象中的至少一个对目标问题文本进行回答。
根据本公开的实施例,根据目标问题文本的第一隐式特征和第一显式特征,以及每个候选对象的第二隐式特征和第二显式特征,来确定目标对象,可以提高问题和对象之间的匹配度,从而提高答题质量。
根据本公开的实施例,例如可以通过预定网络模型来确定目标问题文本和候选对象的隐式特征。
基于此,可以将目标问题文本输入预定网络模型,得到目标问题文本的隐式特征,即第一隐式特征。
另外,针对每个候选对象,可以获取与候选对象关联的至少一个历史问题。然后将至少一个历史问题的问题文本输入预定网络模型,得到候选对象的第二隐式特征。其中,与候选对象关联的历史问题例如可以为候选对象回答过的问题。
根据本公开的实施例,预定网络模型例如可以包括itemCF模型、item2vec模型和MatchNet模型中的至少一个。
例如,可以将用与候选对象关联的历史问题分别输入item CF、item2vec和matchnet三个网络模型,得到三个隐式向量表征v1、v2和v3。目标问题也分别输入到itemCF、item2vec和matchnet三个网络模型,得到三个隐式向量表征v1’、v2’和v3’。然后分别计算v1和v1’之间的相似度s1、v2和v2’之间的相似度s2,以及算v3和v3’之间的相似度。接着,根据s1、s2和s3确定候选对象是否为目标对象。示例性地,本实施例中,如果s1、 s2和s3均大于相似度阈值,则确定候选对象为目标对象。其中,相似度阈值可以根据实际需要设置。
根据本公开的实施例,第一显式特征例如可以包括以下至少一个:目标问题文本的问题类型、目标问题文本的问题标签(tag)、目标问题文本中包含的地点实体,即第一地点实体,以及目标问题文本中包含的兴趣实体,即第一兴趣实体。示例性地,问题类型例如可以包括娱乐休闲类、游戏类、旅游类、教育培训类、金融财经类、医疗健康类、科技类、家电数码类、文化历史类、情感心理类、汽车类、生活类、职业类、三农类、生产制造类等等。问题标签例如可以包括健康、法律、电子产品、美食、互联网等等。地点实体例如可以包括xx省、xx市、xx区等等。兴趣实体例如可以包括地标建筑实体、学校实体、公司实体、机构实体等。
例如,目标问题的文本可以为“北京前门附近哪里的包子好吃”,则该目标问题的问题类型可以包括生活类,问题标签可以包括美食和包子,地点实体可以包括北京市,兴趣实体可以包括前门。
根据本公开的实施例,可以预设有问题分类模型,用于确定问题文本的问题类型。基于此,可以将目标问题文本输入问题分类模型,得到目标问题文本的问题类型。
根据本公开的实施例,例如可以通过对经过预训练的语义理解模型进行微调(fine tune),得到问题分类模型。其中,微调是指利用预训练过的模型作用于目标数据集,并使模型参数适应目标数据集的过程。例如,可以获取经过预训练的语义理解模型和已分类语料。然后利用已分类语料,对语义理解模型进行训练,得到问题分类模型。其中,已分类语料例如可以包括例如问题文本等各种文本。针对每个已分类语料配置有对应的分类标签。示例性地,本实施例中,对语义理解模型进行训练例如可以包括:将已分类语料输入语义理解模型中,得到针对该已分类语料的分类结果,根据该分类结果以及与该已分类语料对应的分类标签,确定损失值。接着根据该损失值对该语义理解模型的参数进行调整。
根据本公开的实施例,相对于从头开始训练,微调可以节省计算资源和计算时间,提高效率和准确率。
根据本公开的另一实施例,可以预先设置多个问题分类模型。例如,本实施例中,可以预设两个问题分类模型:第一问题分类模型和第二问题分类模型,其中,第一问题分类模型用于确定输入文本的一级分类,第二问题分类模型用于确定输入文本的二级分类。基于此,可以分别将目标问题文本输入第一问题分类模型和第二问题分类模型,得到目标问题文本的一级分类和二级分类,作为目标问题文本的问题类型。
根据本公开的实施例,可以预先训练多标签分类模型,用于确定文本的标签。基于此,可以将目标问题文本输入多标签分类模型,得到问题标签。其中,多标签分类模型的输入可以为文本,输出可以为该文本归属每个标签的权值。示例性地,可以确定权值大于预定权值的标签,作为问题标签。其中预定权值可以根据需要设置,例如预定权值可以设置为0.5。
其中,多标签分类模型例如可以根据以下操作训练的:获取已标注标签。然后根据已标注标签和与已标注标签对应的样本问题文本,训练多标签分类模型。
根据本公开的实施例,用户可以为问答平台中的问题标注相应的标签。可以将这些标注记录进行汇总,得到标签词表。基于此,可以获取该标签词表中的已标注标签。然后,可以获取该已标注标签所标注的问题文本,作为样本问题文本。
根据本公开的实施例,在训练多标签分类模型的过程中,可以将样本问题文本输入多标签分类模型,得到输出结果。然后根据输出结果和该样本问题所对应的已标注标签,计算损失值,根据该损失值调整多标签分类模型的参数,直到损失值收敛。
根据本公开的实施例,可以获取行政区划词典。其中,行政区划词典包含多个行政区划名称。然后根据行政区划词典,确定目标问题文本中的地点实体,即第一地点实体。
根据本公开的实施例,可以对目标问题文本进行命名实体识别,得到目标问题文本中的第一兴趣实体。
根据本公开的实施例,例如可以利用命名实体模型来对目标问题文本进行命名实体识别,得到目标问题文本中包含的地标建筑实体(如故宫等)、学校公司实体(如xx公司、北京大学等)、机构实体(如xx办事处、xx中心等)等,作为即第一兴趣实体。
根据本公开的实施例,候选对象的第二显式特征例如可以包括以下至少一个:候选对象的领域类型、对象标签,以及候选对象的相关信息中包含的兴趣实体和地点实体,即第二兴趣实体和第二地点实体。示例性地,领域类型例如可以包括娱乐休闲类、游戏类、旅游类、教育培训类、金融财经类、医疗健康类、科技类、家电数码类、文化历史类、情感心理类、汽车类、生活类、职业类、三农类、生产制造类等等。领域类型可以与问题类型采用相同的划分方式,也可以采用不同的划分方式。对象标签例如可以包括健康、法律、电子产品、美食、互联网等等。对象标签可以与问题标签采用相同的划分方式,也可以采用不同的划分方式。
根据本公开的实施例,针对每个候选对象,可以获取候选对象关联的多个历史问题。根据候选对象针对多个历史问题的回答质量信息,确定多个历史问题中的至少一个代表问题。然后根据至少一个代表问题的问题文本,确定候选对象的领域类型和对象标签。其中,候选对象关联的历史问题例如可以包括候选对象回答过的问题。历史问题的回答质量信息例如可以包括候选对象针对历史问题所做回答的质量评价。
根据本公开的实施例,例如可以确定与候选对象对应的多个历史问题中回答质量评价较高的一个或多个问题,作为该候选对象的代表问题。
根据本公开的实施例,例如可以分别将与候选对象对应的每个代表问题的问题文本输入问题分类模型,得到对应的至少一个类型,作为该候选对象的领域类型。
根据本公开的实施例,例如可以分别将与候选对象对应的每个代表问题的问题文本输入多标签分类模型,得到对应的至少一个标签,作为该候选对象的对象标签。
根据本公开的实施例,可以获取候选对象的历史操作信息。对历史操作信息进行命名实体识别,得到历史操作信息中的第二兴趣实体。
根据本公开的实施例,例如可以利用命名实体模型来对历史操作信息进行命名实体识别,得到历史操作信息中包含的地标建筑实体、学校公司实体、机构实体等,作为即第二兴趣实体。
根据本公开的实施例,历史操作信息例如可以包括候选对象授权的历史浏览信息、历史搜索信息和关注信息等。
根据本公开的实施例,可以获取候选对象授权的到访地信息。然后根据到访地信息,确定第二地点实体。
需要说明的是,本公开的技术方案中,所涉及的历史操作信息、到访地信息等数据的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
图3示意性示出了根据本公开的实施例的确定目标对象的方法的流程图。
如图3所示,该确定目标对象的方法330包括在操作S331,确定每个候选对象的第二隐式特征与第一隐式特征是否匹配以及确定每个候选对象的第二显式特征与第一显式特征是否匹配。
在操作S332,确定多个候选对象中第二隐式特征与第一隐式特征匹配的候选对象为第一召回对象,得到第一召回对象集。
在操作S333,确定多个候选对象中第二显式特征与第一显式特征匹配的候选对象为第二召回对象,得到第二召回对象集。
在操作S334,合并第一召回对象集和第二召回对象集,得到多个目标对象。
根据本公开的实施例,可以通过计算第二隐式特征与第一隐式特征之间的相似度,来确定第二隐式特征与第一隐式特征是否匹配。若第二隐式特征与第一隐式特征之间的相似度大于第一相似度阈值,则确定第二隐式特征与第一隐式特征匹配。否则,确定第二隐式特征与第一隐式特征不匹配。其中,第一相似度阈值可以根据实际需要确定。
类似地,可以通过计算第二显式特征与第一显式特征之间的相似度,来确定第二显式特征与第一显式特征是否匹配。若第二显式特征与第一显式特征之间的相似度大于第二相似度阈值,则确定第二显式特征与第一显式特征匹配。否则,确定第二显式特征与第一显式特征不匹配。其中,第二相似度阈值可以根据实际需要确定。
根据本公开的实施例,例如可以第一召回对象集和第二召回对象集中的召回对象进行合并和去重,得到多个目标对象。
根据本公开的另一实施例,还可以获取每个目标对象的实时特征。然后根据实时特征,对多个目标对象进行筛选,以去除不符合要求的目标对象。其中,实时特征例如可以包括在线时长、在线状态、答题意愿、接单量、权威度等等。
图4示意性示出了根据本公开的实施例的向多个目标对象推送目标问题文本的方法的流程图。
如图4所示,该向多个目标对象推送目标问题文本的方法440包括在操作S441,确定多个目标对象与目标问题文本的匹配度。
在操作S442,根据匹配度,对多个目标对象进行排序,得到排序结果。
在操作S443,根据排序结果,依次向每个目标对象推送目标问题文本,直到接收到来自多个目标对象中的任意目标对象的确认指令。
根据本公开的实施例,可以获取多个目标对象中每个目标对象的对象特征、目标问题文本的问题特征以及针对每个目标对象与目标问题文本的交叉特征。然后利用排序学习模型,根据每个目标对象的对象特征、目标问题文本的问题特征以及针对每个目标对象与目标问题文本的交叉特征,确定匹配度。
根据本公开的实施例,排序学习模型的输入为目标对象的对象特征、目标问题文本的问题特征以及针对每个目标对象与目标问题文本的交叉特征,排序学习模型的输出为目标对象与目标问题文本之间的匹配度。
其中,对象特征可以包括目标对象的第二显式特征和第二隐式特征,问题特征可以包括目标问题文本的第一显式特征和第一隐式特征,交叉特征可以包括目标对象的第二显式特征与第一显式特征的匹配关系以及目标对象的第二隐式特征与第一隐式特征的匹配关系。
根据本公开的实施例,可以根据目标对象与目标问题文本之间的匹配度对目标对象进行排序,得到排序结果。示例性地,本实施例中,与目标问题之间匹配度越高的目标对象排名越靠前。
根据本公开的实施例,例如可以根据排序结果,为每个目标对象设置推送时刻。其中,排序靠前的目标对象所对应的推送时刻越靠前。然后在每个推送时刻,向与该推送时刻对应的候选对象推送目标问题文本。
根据本公开的实施例,目标对象在获取到推送的目标问题文本之后,可以通过对应的终端设备向服务器发送确认指令,以确认接受对目标问题进行回答的任务。服务器响应于接收到来自目标候选对象的确认指令,可以确定目标问题文本由候选对象回答,并且不再将目标问题文本发送给后续的目标对象。
下面参考图5,结合具体实施例对上文所示的问题推送方法做进一步说明。本领域技术人员可以理解,以下示例实施例仅用于理解本公开,本公开并不局限于此。
图5示意性示出了根据本公开另一实施例的问题推送的示意图。
在图5中示出了,根据本公开的实施例,目标问题文本例如可以为非结构化的文本信息。为了便于后续匹配答主以及挖掘提问用户潜在诉求,可以对目标问题文本进行结构化处理,并且提取抽象特征。
基于此,可以利用已分类语料,对语义理解模型进行微调(fine tune),得到第一问题分类模型和第二问题分类模型,第一问题分类模型用于确定一级分类,第二问题分类模型用于确定二级分类。本实施例中,可以利用第一问题分类模型确定目标问题文本的一级分类,利用第二问题分类模型确定目标问题文本的二级分类。可以基于问答平台沉淀的标签词表中的已标注标签和与已标注标签对应的样本问题文本,训练多标签分类模型。本实施例中,可以利用多标签分类模型确定目标问题文本的问题标签。
可以构建全国行政区划词典,根据全国行政区划词典从目标问题文本中抽取出地点实体,以识别出目标问题文本涉及的地理位置。
利用命名实体模型,识别出目标问题文本中涉及到的地标建筑实体、学校公司实体、机构实体等兴趣实体。
另一方面,答主作为提供回答服务的一方,需要对答主能力进行充分刻画,才能为后续匹配提供可用特征。示例性地,本实施例中,存在两种类型的答主,一种是正式入驻问答平台的答主,即站内答主。此类答主在入驻时会提供一定的能力信息,比如自己擅长领域类型、标签等。站内答主经常使用平台来进行答题,可以快速回复提问用户。另一种是潜在答主,此类答主非正式入驻问答平台的答主,但是有一定的生产意愿,具备回答某些问题的能力,但是在线状态未知,因此可能响应速度较慢。对以上两种类型的答主,都需要收集答主信息,刻画其能力和兴趣。
本实施例中,可以从答主库中获取答主。对于站内答主,可以根据其回答过的历史问题以及对应的回答质量,计算出答主的类型、标签等显式特征。其中,答主类型可以用于表示答主擅长的领域类型。例如,对于每个站内答主,可以将回答质量高于质量阈值的历史问题分别输入第一问题分类模型和第二问题分类模型,得到一级分类和二级分类,作为答主的类型。可以将回答质量高于质量阈值的历史问题分别输入将多标签分类模型,得到答主的标签。其中,质量阈值可以根据实际需要确定。
对于站内答主和潜在答主,可以利用命名实体识别模型对用户授权的浏览信息、搜索信息、贴吧关注信息等进行识别,以便确定相应的兴趣实体。
另外,对于站内答主和潜在答主,还可以根据其在网络中的生产内容信息,例如博客文章等,确定相应的权威度以及权威画像信息。
对于站内答主和潜在答主,还可以获取其授权的到访地信息,根据全国行政区划词典识别到访地信息,以确定对应的地点实体。
由于目标问题和答主分属不同语义空间,在进行问答交易时,需要将目标问题和答主进行匹配。仅根据在上述步骤中获取的一级分类、二级分类、标签、地点实体、兴趣实体等显式特征来将目标问题和答主映射到同空间,具有一定的局限性。因此,本实施例中,可以利用隐式特征模型,将目标问题和答主的基本特征输入模型中,确定答主和目标问题在同空间下的隐式特征。示例性地,本实施例中,隐式特征可以包括隐式向量。
根据本公开的实施例,可以采用item CF、item2vec、matchnet网络模型确定答主与目标问题的隐式向量,得到不同网络下的隐式向量,从而将目标问题和答主映射到同一空间。
然后,可以进行答主倒排。例如,可以利用答主的显式特征建立答主倒排索引。示例性地,本实施例中,答主特征例如可以包括答主的类型、标签、地点实体、兴趣实体等,因此可以根据答主的类型、标签、地点实体、兴趣实体等建立答主倒排索引。
接着,可以进行答主召回。例如可以利用目标问题的显式特征,检索答主对应的显式倒排索引,产生对应于显式召回通路的答主召回集合。针对问题和答主的隐式向量表征,利用向量检索***,确定对应于隐式召回通路的答主召回集合。其中,向量检索***例如可以包括ANN(Approximate Nearest Neighbor,近似近邻)***。
再接着,可以进行召回融合。例如,可以将显式和隐式召回通路对应的答主召回集合进行融合,去除其中重复的答主,并且根据答主的在线时间和答题意愿等进行筛选。示例性地,本实施例中,可以筛掉在线时长小于在线时长阈值和答题意愿为不愿答题的答主。其中,在线时长阈值可以根据实际需要设置。
根据本公开的实施例,可以利用答主的特征集合、问题的特征集合、答主和问题的交叉特征集合,训练gbrank模型。
其中,答主的特征集合例如可以包括答主的基本特征、隐式特征和实时特征。其中,答主的基本特征例如可以包括答主的类型、标签、地点实体、兴趣实体等。根据本公开的另一些实施例,答主的基本特征还可以包括答主的年龄、职业、性别等。答主的实时特征例如可以包括答主的在线时长、在线状态、接单量、权威度等实时特征。问题的特征集合例如可以包括问题的类型、标签、地点实体、兴趣实体等。答主和问题的交叉特征集合例如可以包括答主的类型与问题的类型是否匹配、答主所对应的地点实体与问题所对应的地点实体是否匹配、答主所对应的兴趣实体与问题所对应的兴趣实体是否匹配等。本实施例中,可以根据该gbrank模型,对召回融合后的答主进行排序,得到答主的排序列表。
根据本公开的实施例,目标问题只能被唯一一个答主抢到并回答,因此需要尽量保证抢到该订单的答主是解决该问题质量最优的答主。同时为了良好的用户体验,还需要考虑针对目标问题的接单时间,因此要尽快确定对应的答主。答主列表的排序先后表征了答主解决问题质量的优劣。如果只选择最优的答主派发问题,答主不在线或者答主正在完成其他订单,可能会响应不及时。如果不加以区分的将订单派发给所有答主,会造成排序靠后的答主也有可能抢到该问题,可能会损失回答质量。因此在调度时,可以根据答主排序先后设置不同的推送时刻,答主的排序越靠前,则越早接收到推送。
根据本公开的实施例,在答主接收到推送后,可以选择接单。在答主接单之后,会与提问用户进行交流,以解答用户的提问。
根据本公开的另一实施例,在回答结束后,还可以对回答进行评价,得到评价信息。例如,可以根据回答的质量,设置3档,0档表示未解决,1档表示基本解决问题,2档表示解决问题并且提供信息增益。根据评价信息,可以进行人工标注,得到人工标注数据。然后可以利用人工标注数据训练得到回答满足模型。对答主回答过的每个问题,可以使用训练好的回答满足模型确定是否该问题的回答是否满足,将判定结果作为语料放入到答主理解权威度模型中,从而使答主权威度模型更加准确。
图6示意性示出了根据本公开实施例的问题推送装置的框图。
如图6所示,该问题推送装置600包括隐式特征确定模块610、显式特征确定模块620、目标对象确定模块630和推送模块640。
隐式特征确定模块610,用于响应于接收到目标问题文本,确定目标问题文本的第一隐式特征和多个候选对象 中每个候选对象的第二隐式特征。
显式特征确定模块620,用于确定目标问题文本的第一显式特征和每个候选对象的第二显式特征。
目标对象确定模块630,用于根据目标问题文本的第一隐式特征和第一显式特征,以及每个候选对象的第二隐式特征和第二显式特征,确定多个候选对象中的多个目标对象。
推送模块640,用于向多个目标对象推送目标问题文本。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图7示意性示出了可以用来实施本公开的实施例的示例电子设备700的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图7所示,设备700包括计算单元701,其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序,来执行各种适当的动作和处理。在RAM 703中,还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
设备700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如问题推送方法。例如,在一些实施例中,问题推送方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时,可以执行上文描述的问题推送方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行问题推送方法。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (17)
1.一种问题推送方法,包括:
响应于接收到目标问题文本,确定所述目标问题文本的第一隐式特征和多个候选对象中每个候选对象的第二隐式特征;
确定所述目标问题文本的第一显式特征和所述每个候选对象的第二显式特征;
根据所述目标问题文本的第一隐式特征和第一显式特征,以及所述每个候选对象的第二隐式特征和第二显式特征,确定所述多个候选对象中的多个目标对象;以及
向所述多个目标对象推送所述目标问题文本。
2.根据权利要求1所述的方法,其中,所述确定多个候选对象中的多个目标对象包括:
确定所述每个候选对象的第二隐式特征与所述第一隐式特征是否匹配以及确定所述每个候选对象的第二显式特征与所述第一显式特征是否匹配;
确定所述多个候选对象中第二隐式特征与所述第一隐式特征匹配的候选对象为第一召回对象,得到第一召回对象集;
确定所述多个候选对象中第二显式特征与所述第一显式特征匹配的候选对象为第二召回对象,得到第二召回对象集;以及
合并所述第一召回对象集和第二召回对象集,得到所述多个目标对象。
3.根据权利要求1所述的方法,其中,所述向所述多个目标对象推送所述目标问题文本包括:
确定所述多个目标对象与所述目标问题文本的匹配度;
根据所述匹配度,对所述多个目标对象进行排序,得到排序结果;以及
根据所述排序结果,依次向所述每个目标对象推送所述目标问题文本,直到接收到来自所述多个目标对象中的任意目标对象的确认指令。
4.根据权利要求3所述的方法,其中,所述确定所述多个目标对象与所述目标问题文本的匹配度包括:
获取所述多个目标对象中每个目标对象的对象特征、所述目标问题文本的问题特征以及针对所述每个目标对象与所述目标问题文本的交叉特征,
其中,所述对象特征包括所述目标对象的第二显式特征和第二隐式特征,所述问题特征包括所述目标问题文本的第一显式特征和第一隐式特征,所述交叉特征包括所述目标对象的第二显式特征与所述第一显式特征的匹配关系以及所述目标对象的第二隐式特征与所述第一隐式特征的匹配关系;以及
利用排序学习模型,根据所述每个目标对象的对象特征、所述目标问题文本的问题特征以及针对所述每个目标对象与所述目标问题文本的交叉特征,确定所述匹配度。
5.根据权利要求1所述的方法,其中,所述确定所述目标问题文本的第一隐式特征和多个候选对象中每个候选对象的第二隐式特征包括:
将所述目标问题文本输入预定网络模型,得到所述目标问题文本的第一隐式特征;以及
针对所述每个候选对象,
获取与所述候选对象关联的至少一个历史问题;
将所述至少一个历史问题的问题文本输入所述预定网络模型,得到所述候选对象的第二隐式特征。
6.根据权利要求5所述的方法,其中,所述预定网络模型包括itemCF模型、item2vec模型和MatchNet模型中的至少一个。
7.根据权利要求1所述的方法,其中,所述第一显式特征包括问题类型;所述确定所述目标问题文本的第一显式特征包括:
将所述目标问题文本输入问题分类模型,得到所述目标问题文本的问题类型,
其中,所述问题分类模型是根据以下操作得到的:
获取经过预训练的语义理解模型和已分类语料;以及
利用所述已分类语料,对所述语义理解模型进行训练,得到所述问题分类模型。
8.根据权利要求1所述的方法,其中,所述第一显式特征包括问题标签;所述确定所述目标问题文本的第一显式特征包括:
将所述目标问题文本输入多标签分类模型,得到所述问题标签,
其中,所述多标签分类模型是根据以下操作训练的:
获取已标注标签;以及
根据所述已标注标签和与所述已标注标签对应的样本问题文本,训练所述多标签分类模型。
9.根据权利要求1所述的方法,其中,所述第一显式特征包括第一地点实体;所述确定所述目标问题文本的第一显式特征包括:
获取行政区划词典;以及
根据所述行政区划词典,确定所述目标问题文本中的第一地点实体。
10.根据权利要求1所述的方法,其中,所述第一显式特征包括第一兴趣实体;所述确定所述目标问题文本的第一显式特征包括:
对所述目标问题文本进行命名实体识别,得到所述目标问题文本中的第一兴趣实体。
11.根据权利要求1所述的方法,其中,所述第二显式特征包括领域类型和对象标签;所述确定所述每个候选对象的第二显式特征包括:
针对所述每个候选对象,
获取所述候选对象关联的多个历史问题;
根据所述候选对象针对所述多个历史问题的回答质量信息,确定所述多个历史问题中的至少一个代表问题;以及
根据所述至少一个代表问题的问题文本,确定所述候选对象的领域类型和对象标签。
12.根据权利要求1所述的方法,其中,所述第二显式特征包括第二兴趣实体;所述确定所述每个候选对象的第二显式特征包括:
获取所述候选对象的历史操作信息;以及
对所述历史操作信息进行命名实体识别,得到所述历史操作信息中的第二兴趣实体。
13.根据权利要求1所述的方法,其中,所述第二显式特征包括第二地点实体;所述确定所述每个候选对象的第二显式特征包括:
获取所述候选对象的到访地信息;以及
根据所述到访地信息,确定所述第二地点实体。
14.一种问题推送装置,包括:
隐式特征确定模块,用于响应于接收到目标问题文本,确定所述目标问题文本的第一隐式特征和多个候选对象中每个候选对象的第二隐式特征;
显式特征确定模块,用于确定所述目标问题文本的第一显式特征和所述每个候选对象的第二显式特征;
目标对象确定模块,用于根据所述目标问题文本的第一隐式特征和第一显式特征,以及所述每个候选对象的第二隐式特征和第二显式特征,确定所述多个候选对象中的多个目标对象;以及
推送模块,用于向所述多个目标对象推送所述目标问题文本。
15.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-13中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-13中任一项所述的方法。
17.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1-13中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210260835.5A CN114358891A (zh) | 2022-03-17 | 2022-03-17 | 问题推送方法、装置、设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210260835.5A CN114358891A (zh) | 2022-03-17 | 2022-03-17 | 问题推送方法、装置、设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114358891A true CN114358891A (zh) | 2022-04-15 |
Family
ID=81094826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210260835.5A Pending CN114358891A (zh) | 2022-03-17 | 2022-03-17 | 问题推送方法、装置、设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114358891A (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113254782A (zh) * | 2021-06-15 | 2021-08-13 | 济南大学 | 问答社区专家推荐方法及*** |
-
2022
- 2022-03-17 CN CN202210260835.5A patent/CN114358891A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113254782A (zh) * | 2021-06-15 | 2021-08-13 | 济南大学 | 问答社区专家推荐方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107220352B (zh) | 基于人工智能构建评论图谱的方法和装置 | |
CN109522483B (zh) | 用于推送信息的方法和装置 | |
CN107908740B (zh) | 信息输出方法和装置 | |
CN105893465B (zh) | 自动问答方法和装置 | |
CN109492772B (zh) | 生成信息的方法和装置 | |
CN110597962B (zh) | 搜索结果展示方法、装置、介质及电子设备 | |
CN110727761B (zh) | 对象信息获取方法、装置及电子设备 | |
CN108268450B (zh) | 用于生成信息的方法和装置 | |
CN107832338B (zh) | 一种识别核心产品词的方法和*** | |
CN114090755B (zh) | 基于知识图谱的回复语句确定方法、装置及电子设备 | |
CN109522399B (zh) | 用于生成信息的方法和装置 | |
CN112163081A (zh) | 标签确定方法、装置、介质及电子设备 | |
CN110798567A (zh) | 短信分类显示方法及装置、存储介质、电子设备 | |
CN112926308A (zh) | 匹配正文的方法、装置、设备、存储介质以及程序产品 | |
CN111782793A (zh) | 智能客服处理方法和***及设备 | |
CN113392920A (zh) | 生成作弊预测模型的方法、装置、设备、介质及程序产品 | |
CN110555747A (zh) | 确定目标用户的方法和装置 | |
US20220327147A1 (en) | Method for updating information of point of interest, electronic device and storage medium | |
CN116662495A (zh) | 问答处理方法、训练问答处理模型的方法及装置 | |
CN116775815B (zh) | 对话数据的处理方法、装置、电子设备及存储介质 | |
CN110705308A (zh) | 语音信息的领域识别方法、装置、存储介质及电子设备 | |
CN114358891A (zh) | 问题推送方法、装置、设备以及存储介质 | |
CN113806541A (zh) | 情感分类的方法和情感分类模型的训练方法、装置 | |
CN113010664A (zh) | 一种数据处理方法、装置及计算机设备 | |
CN113505293A (zh) | 信息推送方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |