CN110659354B - 问答***的建立方法、装置、存储介质及电子设备 - Google Patents

问答***的建立方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN110659354B
CN110659354B CN201810712179.1A CN201810712179A CN110659354B CN 110659354 B CN110659354 B CN 110659354B CN 201810712179 A CN201810712179 A CN 201810712179A CN 110659354 B CN110659354 B CN 110659354B
Authority
CN
China
Prior art keywords
question
answer
data
extraction template
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810712179.1A
Other languages
English (en)
Other versions
CN110659354A (zh
Inventor
张强
韩长东
王晓军
秦川
曾汉洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN201810712179.1A priority Critical patent/CN110659354B/zh
Priority to TW108110061A priority patent/TW202001623A/zh
Priority to PCT/US2019/039767 priority patent/WO2020006381A1/en
Priority to US16/456,341 priority patent/US11250080B2/en
Publication of CN110659354A publication Critical patent/CN110659354A/zh
Application granted granted Critical
Publication of CN110659354B publication Critical patent/CN110659354B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供了一种问答***的建立方法、装置、存储介质及电子设备,其中,方法包括:根据抽取模板以及目标数据源,确定问答对数据;根据所述问答对数据对应的异常信息,调整所述抽取模板以更新所述问答对数据;根据更新后的所述问答对数据,确定问答索引以建立问答***。通过本申请实施例提供的问答***的建立方案,可以直接根据确定的抽取模板以及目标数据源建立所需的问答***,可以提高建立问答***的效率。

Description

问答***的建立方法、装置、存储介质及电子设备
技术领域
本申请实施例涉及数据处理技术领域,尤其涉及一种问答***的建立方法、 装置、存储介质及电子设备。
背景技术
问答***,是一种信息检索***的高级形式,它能够准确地回答用户 提出的问题,使用户能够快速、准确地获取所需的信息,是人工智能领域 中具有广泛的发展前景的研究内容。
但是,现有的问答***,大多是通过人工建立的,例如,通过人工运 行爬虫程序、运行建立索引的程序等,这导致搜索引擎建立过程中效率较 低,还容易出现由于人的失误出现的错误等,进而导致建立问答***耗时 较长、效率较低。
发明内容
本申请实施例的目的在于提供一种问答***的建立方法、装置、存储介 质及电子设备,以提高问答***建立的效率。
根据本发明实施例的一个方面,提供了一种问答***的建立方法,其包 括:
根据抽取模板以及目标数据源,确定问答对数据;
根据所述问答对数据对应的异常信息,调整所述抽取模板以更新所述问 答对数据;
根据更新后的所述问答对数据,确定问答索引以建立问答***。
根据本发明实施例的第二个方面,提供了一种问答***的建立装置,其 包括:
第一程序单元,用于根据抽取模板以及目标数据源,确定问答对数据;
第二程序单元,用于根据所述问答对数据对应的异常信息,调整所述抽 取模板以更新所述问答对数据;
第三程序单元,用于根据更新后的所述问答对数据,确定问答索引以建 立问答***。
根据本发明实施例的第三个方面,提供了一种存储介质,其上存储有计 算机可执行指令,所述计算机可执行指令在被处理器处理时执行如下步骤:
根据抽取模板以及目标数据源,确定问答对数据;
根据所述问答对数据对应的异常信息,调整所述抽取模板以更新所述问 答对数据;
根据更新后的所述问答对数据,确定问答索引以建立问答***。
根据本发明实施例的第四个方面,提供了一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或 多个处理器实现如上所述的方法。
本申请实施例提供的一种问答***的建立的方案,根据抽取模板以及目 标数据源,确定问答对数据;根据所述问答对数据对应的异常信息,调整所 述抽取模板以更新所述问答对数据;根据更新后的所述问答对数据,确定问 答索引以建立问答***。通过本申请实施例提供的问答***的建立方案,可 以直接根据确定的抽取模板以及目标数据源建立所需的问答***,可以提高 建立问答***的效率。
附图说明
图1为本申请实施例一提供的一种问答***的建立方法流程示意图;
图2为本申请实施例提供的一种面向用户的管理界面的示意图;
图3为本申请实施例中提供的一种确定问答索引的示意图;
图4为本申请实施例二提供的一种抽取网页中数据的方法流程图;
图5为本申请实施例三提供的一种调整抽取模板以及更新问答对数据的 方法流程图;
图6为本申请实施例四提供的一种问答***的建立装置的结构示意图;
图7为本申请实施例四提供的另一种问答***的建立装置的结构示意图;
图8为本申请实施例五提供的一种问答***的建立装置的结构示意图;
图9为本申请执行上述方法的一些电子设备的硬件结构示意图。
具体实施方式
以下将配合附图及实施例来详细说明本申请的实施方式,藉此对本申请 如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并 据以实施。
下述实施例中,以目标数据源为目标网页组为例,对问答***的建立进 行举例说明,在本申请的其他实现方式中,目标数据源也可以为其他数据源, 例如可以直接为文本文档、多媒体文件等。其中,文本文件例如为电子书籍 等,多媒体文件例如为视频文件等,本申请对此不进行限定。
图1为本申请实施例一提供的一种问答***的建立方法流程示意图,本 实施例中,使用的文件存储平台可以为分布式存储平台Smdb;使用的文件存 储***可以为分布式文件***Pangu,使用的索引引擎可以为搜索引擎HA3, 使用的计算平台可以为流式计算平台Sm stream。当然,本实施例的其他实现 方式中,也可以使用其他文件***或搜索引擎等,本实施例不对此进行限定。
如图1所示,问答***的建立方法包括:
S11、根据抽取模板以及目标数据源,确定问答对数据。
目标数据源中的各种数据即建立问答***时所使用的基础数据,抽取模 板为从目标数据源中抽取数据时使用的模板,从目标数据源中抽取得到的数 据即可直接作为问答对数据。
本实施例中,所述目标数据源以及抽取模板可以通过需求数据确定。具 体地,在后台服务器上配置一输入接口,用来接收用户输入的需求数据。
在本申请的一具体实现方式中,服务器可以向用户提供一管理界面,用 户可以通过管理界面创建项目,然后在该项目下输入具体的创建需求数据, 创建需求数据中可以包括目标网页组、抽取模板。本实施例中,以目标数据 源为目标网页组为例子进行说明。
服务器向用户提供的管理页面可以如图2所示,通过服务器提供的管理 界面,可以实现项目管理、种子管理、模板管理、失败反馈、问答服务等功 能。其中,项目管理用于管理用户创建的项目;种子管理用于管理用户输入 的目标网页组;模板管理用于管理用户输入的抽取模板;失败反馈用于反馈 建立搜索引擎的过程中存在异常的问答对数据对应的网页(失败反馈的具体 内容见下述实施例);问答服务用于基于创建的问答***向用户提供问答服 务。
用户可以通过上述管理页面输入目标网页组,在输入目标网页组时,输 入的内容可以为一网站主页的网址(例如URL),目标网页组中包括的网页可 以为在输入的主页的基础上点击预设次数得到的网页。例如,输入主页的网 址后,目标网页组可以为在主页的基础上点击三次的过程中得到的三个网页。 当然,本申请的其他实现方式中,输入的目标网页组还可以为一组网页的地 址,本实施例对目标网页组的输入方式不进行限定。
本实施例中,抽取模板具体可以为XPath模板,XPath为XML路径语言, 其可以用于确定XML文档中的节点,进而可以读取选中节点的数据。在具体 使用时,XPath模板中可以包括多组数据,每组数据中包括两个节点数据,两 个节点数据分别用于指示问题所在的节点和答案所在的节点。
具体地,在确定目标网页组后,可以通过爬虫爬取目标网页组中多个网 页的网页数据,在爬取目标网页组中的网页后,可以根据抽取模板抽取网页 中的问答对数据,确定的问答对数据可以存储在服务器的存储***中。
具体地,当抽取模板具体为XPath模板时,可以根据XPath模板对网页 中的节点进行定位,然后抽取定位的网页中节点处的数据,并将其作为问答 对数据输出。
根据抽取模板抽取数据的方法详见下述实施例二,在此不再赘述。
S12、根据所述问答对数据对应的异常信息,调整所述抽取模板以更新所 述问答对数据。
本实施例中,若抽取模板不适用于目标网页组中的部分网页,则与这部 分网页对应的问答对数据会存在异常,若存在异常,则可以返回存在异常的 问答对数据对应的异常信息。
具体地,可以先确定所述问答对数据中存在异常的所述问答对数据,然 后根据存在异常的所述问答对数据确定异常信息,接着根据异常信息调整所 述抽取模板,以更新所述问答对数据。
通过根据异常信息调整抽取模板,然后重新抽取目标数据源中的数据, 来更新问答对数据,可以保证确定的问答对数据的准确性以及完整性。
具体地,可以采用增量或者全量机制更新所述问答对数据。例如,在重 新抽取时,可以直接抽取存在异常的问答对数据对应的网页,即采用增量机 制更新所述问答对数据;但是,为了减少抽取成功的网页中遗漏的数据,也 可以重新抽取目标网页组中全部的网页,即采用全量机制更新所述问答对数 据。具体确定问答对数据的方法见下述实施例,本实施例对此不再赘述。
此外,重新抽取后,可以将确定的问答对数据作为新增数据,以更新得 到的问答对数据。
步骤S12的具体实现方法详见下述实施例三,本实施例在此不再赘述。
S13、根据更新后的所述问答对数据,确定问答索引以建立问答***。
本实施例中,可以多次执行步骤S12,直至确定问答对数据中存在异常的 问答对数据达到预设条件时,再执行步骤S13。
本实施例中,预设条件用于表征问答对数据是否可以用于确定问答索引, 其可以为存在异常的问答对数据的数量、占总问答对的比例等,当确定问答 对数据达到预设条件时,可以确定抽取过程中异常的情况较少,或者可以确 定问答对数据的准确性较高,此时,可以根据问答对数据确定问答索引。
同时,由于目标网页组中的数据可能随着网络的使用不断变化,当初步 完成问答对数据的抽取后(例如上述确定的目标网页组中的多个网页抽取完 成、抽取时间达到一定时间、抽取到的数据量达到一定阈值等),同样可以 根据已经确定的问答对数据确定问答索引,基于确定的问答索引,可以完成 问答***的建立,进而可以向外提供问答服务。
具体地,本实施例中,如图3所示,确定问答索引时,数据加工的方式 包括定期全量和流式增量两种,则可以通过定期全量和流式增量的方式,将 问答对数据增加至问答索引引擎中,从而确定问答索引。
具体地,在定期全量方式中,向索引引擎中增加的数据是存储在数据库 pangu的中的数据,通过定期读取数据库pangu中的数据,经过bulid插件进 行处理,输出索引格式的数据至HA3索引引擎中,以通过定期全量的方式将 存储的问答对数据增加至问答索引中。
本实施例中,以定期全量的方式将问答对数据增加至问答索引时,读取 数据库pangu中问答对数据的时间可以为预设的时间,例如每一天执行一次, 也可以是用户手动操作的,本实施例在此不再赘述。
具体地,在流式增量的方式中,向索引引擎中增加的数据为消息*** swift得到的信息,例如,当上述的目标网页组中的网页存在更新或增加时, 根据抽取模板抽取修改或增加的网页中的数据后,即可向索引引擎发送增量 消息。消息***swift得到该信号后,即可通过bulid插件将增量消息对应 的问答对数据进行处理,进而输出索引格式的数据至HA3索引引擎中,从而 通过流式增量的方式将增加的问答对数据增加至问答索引中。
本实施例中,通过HA3索引引擎完成问答索引后,可以根据确定的问答 索引提供问答服务或搜索服务。用户可以通过图2中界面上的“问答服务” 来输入问题,在用户输入问题后,问答服务的service可以对用户输入的问 题进行文本分析,然后根据分析结果在索引引擎中确定与问题匹配的答案, 接着将答案反馈给用户。
具体地,在用户输入问题后,图3中的问答服务的service可以对用户 的问题进行文本分析,例如对问题进行分词等,然后可以根据文本分析结果 在索引服务中通过问答索引确定对应的答案,进而可以通过图3中的ranker 插件对答案进行粗排,并将答案召回至问答服务service,从而可以将答案返 回给用户,以向用户提供问答服务。
本实施例中,建立的问答***可以为垂直问答***,也可以为其他问答 ***,本实施例对此不进行限定。
本申请实施例提供的一种问答***的建立的方案,根据抽取模板以及目 标数据源,确定问答对数据;根据所述问答对数据对应的异常信息,调整所 述抽取模板以更新所述问答对数据;根据更新后的所述问答对数据,确定问 答索引以建立问答***。通过本申请实施例提供的问答***的建立方案,可 以直接根据确定的抽取模板以及目标数据源建立所需的问答***,可以提高 建立问答***的效率。
实施例二
图4为本申请实施例二提供的一种抽取网页中数据的方法流程图,本实 施例中,如图4所示,其包括:
S41、过滤掉所述多个网页中与所述网页黑名单匹配的网页。
本实施例中,网页黑名单包含在创建需求数据中,是由用户提供的数据, 其用于表征用户不需要或不予考虑的问答对对应的网页,网页黑名单可以是 一组网页的url,也可以为用于表征网页的网页特征向量,本实施例对此不进 行限定。
具体地,通过爬虫爬取到网页的html文件后,可以将其暂时存放至缓冲 区,作为待抽取的网页html,缓冲区中可以包括处理队列,每个网页即可对 应处理队列中的一个处理任务,从而根据处理队列中处理任务的顺序抽取多 个网页的数据。
而当每个网页对应处理队列中的一个处理任务时,可以根据处理任务的 顺序依次处理每个网页,对某一网页进行处理时,可以通过其与网页黑名单 是否匹配确定该网页是否属于网页黑名单中,若属于则将该网页过滤,若不 属于则可以继续执行步骤S42。
另外,由于在实际使用时,网站内的内容会随着人们在网络上的活动而 发生变化,因此,本实施例中,在爬取网页时,可以定时(例如每小时、每 十分钟等)爬取提供的目标网页组中的网页,确定目标网页组中已有的网页 是否存在更新,以及确定目标网页组中是否存在新增的网页,从而可以补充 目标网页组中更新或新增的网页,以保证目标网页组的数据的完整性。
同时,爬取网页的步骤与过滤网页的步骤之间并无时序关系,两者仅通 过缓冲区域建立联系。当然,爬取到的网页数据可以直接放至缓冲区中,作 为待抽取的网页。
S42、根据所述抽取模板抽取过滤后的所述目标网页组中网页的数据,确 定问答对数据。
例如,当抽取模板为XPath抽取模板时,XPath抽取模板用于限定问答对 数据在网页数据中所在的节点,然后可以确定的节点对应的数据,从而得到 该网页对应的问答对数据。例如,当目标网页组中包括评论的标题和标题下 方的回答时,标题和标题下的第一个回答可以作为一个问答对,其中标题可 以作为问答对的问题,第一个回答可以作为问答对的答案。
另外,本实施例中,抽取每个网页的数据后,得到问答对数据中可能包 括一组或多组问答对,本实施例对此同样不进行限定。
当然,本实施例的其他实现方式中,抽取模板也可以为其他格式的抽取 模板,本实施例对此不进行限定。
图5为本申请实施例三提供的一种调整抽取模板以及更新问答对数据的 方法流程图,如图5所示,其包括:
S51、根据抽取模板抽取网页中的数据,确定问答对数据。
具体抽取网页中数据的方法详见上述实施例,在此不再赘述。
若抽取成功,则直接输出确定的问答对数据。本实施例中,可以存储输 出的问答对数据,存储时可以通过上述实施例中的分布式文件***Pangu进 行存储,当然,在实际使用时,其也可以为其他存储器或直接通过其他文件 ***进行管理,本实施例对此不进行限定。
若存在异常,则执行下述步骤S52。
在具体使用时,例如,若在抽取网页中的数据时,部分网页可能与其他 网页的节点分布存在差异,导致抽取该网页时,确定的问答对数据的结果为 空或抽取数据时存在其他异常情况。
具体的,在确定是否存在异常时,可以通过上述流式计算平台Sm stream 对抽取到的问答对数据进行分析,若确定的问答对数据与预设的属性条件不 匹配,则确定对该网页抽取数据来确定问答对数据的过程失败,预设的属性 条件包括所述问答对数据所占存储空间的大小阈值,和/或所述问答对数据中 问题与答案的数量差值。
例如,抽取某一网页确定的问答对数据所占的存储空间极小,表示该问 答对数据的内容为空,即不符合预设的属性条件中问答对数据所占存储空间 的大小的条件;或者所述预设的属性条件包括:根据同一网页确定的问答对 数据中,具有相同数量的问题与答案,则,抽取某一网页后,确定的问答对 数据中问题和答案的个数不相同,即不符合预设的属性条件中问答对数据中 问题与答案的个数的条件;反之,若确定的问答对数据与预设的属性条件匹 配,则确定对该网页抽取问答对的过程成功。
S52、反馈问答对数据对应的异常信息。
具体地,本实施例中,进行失败反馈时,可以将存在异常的问答对数据 对应的网页作为异常信息进行反馈。还可以通过图2中的“失败反馈”对应 的显示界面显示反馈的异常信息。当然,本申请的其他实现方式中,异常信 息还可以包括其他内容,本实施例对此不进行限定。
同时,还可以将存在异常的问答对数据对应的网页同样通过分布式文件 ***Pangu进行存储。
S53、根据异常信息调整所述抽取模板。
具体地,异常信息中可以包括在存在异常的问答对数据的来源,即网页 的信息(例如网页的URL),在调整抽取模板时,可以根据存在异常的网页的 节点分布调整抽取模板,使得抽取模板更加完善。
需要说明的是,可以在多次执行上述步骤S51、S52,确定多个存在异常 的问答对数据对应的网页后,再执行本步骤;也可以每次确定通过上述步骤 S51、S52确定一个存在异常的问答对数据对应的网页后,执行本步骤。
具体地,当抽取模板为XPath抽取模板时,调整抽取模板具体可以为调 整、删除或增加XPath抽取模板中代表问题或答案的节点。
S54、根据所述调整后的抽取模板重新抽取目标网页组中网页的数据,以 更新问答对数据。
重新抽取目标网页组中网页的数据时,可以仅重新抽取存在异常的网页 中的数据;也可以重新抽取存在异常的网页中的数据,以及重新抽取目标网 页组中所有的网页的数据。
具体地,抽取前述存在异常的问答对数据对应的网页取时,可以通过分 布式文件***Pangu,将存储的存在异常的问答对数据对应的网页重新输入缓 存区,在缓存区的处理队列中生成与存在异常的问答对数据对应的网页对应 的处理任务,进而实现重新抽取前述存在异常的问答对数据对应的网页。
当然,在调整抽取模板之后,为保证确定的问答对数据的准确性,还可 以将抽取成功的网页同样重新抽取,同样的,可以通过分布式文件***Pangu 将抽取成功的网页重新输入至缓存区,并生成对应的处理任务。
本实施例中,根据调整后的抽取模板确定的问答对数据,可以作为增量 添加至已经确定的问答对数据中,同时可以将存在异常的问答对数据删除, 以更新问答对数据。
另外需要说明的是,本实施例中前述步骤S52、S53、S54可以在抽取数 据的过程中执行一次或多次,并在重新抽取时抽取前述存在异常的网页中的 数据,直至存在异常的问答对数据对应的网页的数量较小或不存在(即保证 确定问答对数据中存在异常的问答对数据达到预设条件),然后再重新抽取 目标网页组中全部的网页中的数据;或者,可以在目标网页组的全部网页抽 取完成后再执行上述步骤S53来调整抽取模板,然后执行上述步骤S54,本实 施例对此不进行限定。
图6为本申请实施例四提供一种问答***的建立装置结构示意图,如图6 所示,其包括:第一程序单元61、第二程序单元62、第三程序单元63。
第一程序单元61,用于根据抽取模板以及目标数据源,确定问答对数据; 第二程序单元62,用于根据所述问答对数据对应的异常信息,调整所述抽取 模板以更新所述问答对数据;第三程序单元63,用于根据更新后的所述问答 对数据,确定问答索引以建立问答***。
具体地,本实施例中,如图7所示,问答***的建立装置还包括:第四 程序单元64,用于根据预设的属性条件,确定异常的所述问答对数据。
具体地,本实施例中,如图7所示,所述第二程序单元62包括:第一子 程序单元621、第二子程序单元622。第一子程序单元621,用于根据所述问 答对数据的异常信息,调整所述抽取模板;第二子程序单元622,用于根据所 述目标数据源以及调整后的所述抽取模板,更新所述问答对数据。
具体地,本实施例中,所述第三程序单元63具体用于:根据更新后的所 述问答对数据,通过增量和定期全量的方式确定所述问答索引,以建立问答 ***。
图8为本申请实施例五提供的一种问答***的建立装置的结构示意图, 本实施例提供的为一种实际使用场景中的问答***的建立装置结构示意图, 如图8所示,其包括:需求管理模块81、数据抽取模块82、索引确定模块83。
本实施例中,需求管理模块81用于根据需求数据确定目标数据源以及抽 取模板。当然,在本申请的其他实现方式中,也可以不包括需求管理模块, 并可以通过其他方式确定目标数据源以及抽取模板,例如接收其他处理器或 服务器提供的消息,并确定目标数据源以及抽取模板等。
具体地,需求管理模块81可以为用户提供建立问答***时的需求管理, 例如项目管理、网页管理、模板管理等,需求管理模块81向用户提供的管理 界面可以如上述图2所示。
具体地,本实施例中,需求管理模块81可以包括项目创建单元811、种 子管理单元812,其中,需求管理模块81可以与抓取平台84以及收录平台 85之间进行数据交互,其中,抓取平台85包括抓取提交单元,收录平台84 包括数据打点单元,其中,项目创建单元811用于确定用户创建问答***的 项目,以在用户创建的项目下建立问答***;种子管理单元812用于向用户 提供目标数据源的管理功能(例如,通过图2中的种子管理向用户提供目标数据源的管理功能);抓取提交单元用于抓取目标网络组的多个网页并提交 至数据打点单元;数据打点单元用于为抓取的网页增加与项目对应的标签, 使得收录平台收录网页以进行数据的抽取。
此外,本申请实施例中,用户可能通过需求管理模块81建立一个或多个 项目,若建立的项目包括多个,则需要将目标网页组以及抽取模板等需求数 据建立对应关系。例如上述的数据打点单元,即用于在爬取目标网页组中的 网页后,可以通过数据打点单元为抓取的网页增加与项目对应的标签,从而 建立网页与项目之间的联系。另外,若同一目标网页组属于多个项目,则可 以向该目标网页组添加多个项目对应的标签。
建立其他需求数据与项目之间的联系与上述相似,在此不再赘述。
本实施例中,数据抽取模块82用于根据抽取模板以及目标数据源,确定 问答对数据;以及用于根据所述问答对数据对应的异常信息,调整所述抽取 模板以更新所述问答对数据。本实施例中,数据抽取模块82可以复用为上述 实施例中的第一程序单元或者第二程序单元,当然,本实施例的其他实现方 式中,上述实施例中的第一程序单元或者第二程序单元也可以分开,通过不 同的模块实现,本实施例对此不进行限定。
数据抽取模块82可以基于流式计算平台sm stream来抽取网页中的数据, 数据抽取模块82包括模板标注单元821、模板加载单元822、QA(question and answer)抽取单元823、数据dump单元824,模板标注单元821用于根据抽 取模板对网页内容进行标注,例如标注网页中的哪个节点的数据为问答对数 据,模板加载单元822用于加载标注完成后的标注模板,QA抽取单元823用 于根据加载的标注模板抽取网页中的数据,确定问答对数据,数据dump单元 824用于下载抽取后确定的问答对数据。
具体地,前述抓取的网页可以存储在分布式存储平台Smdb中,数据抽取 模块82中的QA抽取单元843从分布式存储平台Smdb获得抓取的网页,同时 根据模板加载单元821加载的模板来抽取网页中的数据,确定问答对数据, 若QA抽取单元823抽取成功,则通过数据dump单元824下载抽取对应的数 据,若QA抽取单元821抽取后确定的问答对数据存在异常,则可以根据存在 异常的问答对数据对应的网页调整抽取模板,并重新通过模板加载单元822 进行加载,从而可以根据调整后的抽取模板抽取数据,具体地实现方式参见 上述实施例,在此不再赘述。
本实施例中,索引确定模块83用于根据更新后的所述问答对数据确定问 答索引,根据所述问答索引确定问答***。
具体地,索引确定模块83包括定期全量单元831、流式增量单元832、 HA3召回粗排单元833、在线精排召回定制单元834,其中,定期全量单元831 用于通过定期全量的方式将问答对数据增加至问答索引,流式增量单元832 用于通过增量的方式将问答对数据增加至问答索引,HA3召回粗排单元833用 于对用户输入的问题对应的召回结果进行粗排,在线精排召回定制单元834 用于对粗排结果进行精排。
具体地,数据抽取模块82确定的问答对数据可以存储在分布式文件*** Pangu中,索引确定模块83的定期全量单元831可以定期从分布式文件*** Pangu中之中获取全量的问答对数据,以通过定期全量的方式将问答对数据增 加至问答索引;同时,数据抽取模块82抽取到问答对数据后,也可以通过增 量消息的方式将数据发送至流式增量单元832,以通过流式增量的方式将问答 对数据增加至问答索引。具体地,为了便于搜索,问答索引可以是倒排索引。
根据所述问答索引确定问答***,来向用户提供问答服务。用户输入问 题后,即可通过索引确定需要召回的答案对应的数据,从而可以通过HA3召 回粗排单元833对召回结果进行粗排,然后通过在线精排召回定制单元834 对粗排结果进行精排,再向用户发送问题对应的召回结果,以向用户提供问 题对应的答案。
本申请另一实施例还提供一种存储介质,其上存储有计算机可执行指令, 所述计算机可执行指令在被处理器处理时执行如下步骤:
根据抽取模板以及目标数据源,确定问答对数据;
根据所述问答对数据对应的异常信息,调整所述抽取模板以更新所述问 答对数据;
根据更新后的所述问答对数据,确定问答索引以建立问答***。
本申请另一实施例还提供一种电子设备,包括:一个或多个处理器;存 储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个 处理器执行,使得所述一个或多个处理器实现如上所述的方法。
图9为本申请执行上述方法的一些电子设备的硬件结构示意图。根据图9 所示,该设备包括:
一个或多个处理器91以及存储器92,图9中以一个处理器91为例。
执行问答***的建立方法的设备还可以包括:输入装置93和输出装置94。
处理器91、存储器92、输入装置93和输出装置94可以通过总线或者其 他方式连接,图9中以通过总线连接为例。
存储器92作为一种非易失性计算机可读存储介质,可用于存储非易失性 软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的问答 ***的建立方法对应的程序指令/模块。处理器91通过运行存储在存储器92 中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以 及数据处理,即实现上述方法实施例中问答***的建立方法。
存储器92可以包括存储程序区和存储数据区,其中,存储程序区可存储 操作***、至少一个功能所需要的应用程序;存储数据区可存储根据问答系 统的建立时所创建的数据等。此外,存储器92可以包括高速随机存取存储器 92,还可以包括非易失性存储器92,例如至少一个磁盘存储器92件、闪存器 件、或其他非易失性固态存储器92件。在一些实施例中,存储器92可选包 括相对于处理器91远程设置的存储器92,这些远程存储器92可以通过网络 连接至客户端。上述网络的实例包括但不限于互联网、企业内部网、局域网、 移动通信网及其组合。
输入装置93可接收输入的数字或字符信息,以及产生与客户端的用户设 置以及功能控制有关的键信号输入。输入装置93可包括按压模组等设备。
所述一个或者多个模块存储在所述存储器92中,当被所述一个或者多个 处理器91执行时,执行上述任意方法实施例中的问答***的建立方法。
上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功能 模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请实施 例所提供的方法。
本申请实施例的电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话 音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手 机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和 处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备 等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包 括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便 携式车载导航设备。
(7)服务器:提供计算服务的设备,服务器的构成包括处理器91、硬盘、 内存、***总线等,服务器和通用的计算机架构类似,但是由于需要提供高 可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管 理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明 的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或 者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络 模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例 方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以 理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实 施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬 件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部 分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可 读存储介质中,所述计算机可读记录介质包括用于以计算机(例如计算机) 可读的形式存储或传送信息的任何机制。例如,机器可读介质包括只读存储 器(ROM)、随机存取存储器(RAM)、磁盘存储介质、光存储介质、闪速存 储介质、电、光、声或其他形式的传播信号(例如,载波、红外信号、数字 信号等)等,该计算机软件产品包括若干指令用以使得一台计算机设备(可 以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的 某些部分所述的方法。
本领域的技术人员应明白,本申请实施例的实施例可提供为方法、装置 (设备)、或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、 完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实 施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储 介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程 序产品的形式。
本申请实施例是参照根据本申请实施例的方法、装置(设备)和计算机程 序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程 图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和 /或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌 入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过 计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程 图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装 置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设 备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器 中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或 多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上, 使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的 处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图 一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应说明的是:以上实施例仅用以说明本申请实施例的技术方案,而 非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普 通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修 改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使 相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (7)

1.一种问答***的建立方法,其特征在于,包括:
根据抽取模板以及目标数据源,确定问答对数据,包括:过滤掉所述目标数据源的目标网页组中与网页黑名单匹配的网页;根据所述抽取模板以及过滤后的所述目标网页组,确定问答对数据;或者,根据XPath抽取模板以及目标数据源,确定问答对数据;
根据所述问答对数据对应的异常信息,调整所述抽取模板以更新所述问答对数据,包括:根据存在异常的网页的节点分布,调整所述抽取模板;根据调整后的所述抽取模板重新抽取目标网页的数据,以更新所述问答对数据;
根据更新后的所述问答对数据,确定问答索引以建立问答***,包括:根据更新后的所述问答对数据,通过增量和定期全量的方式确定所述问答索引,以建立问答***。
2.根据权利要求1所述的方法,其特征在于,所述目标网页组中包括一个或多个网页。
3.根据权利要求2所述的方法,其特征在于,所述根据所述问答对数据对应的异常信息,调整所述抽取模板以更新所述问答对数据之前,所述方法还包括:
根据预设的属性条件,确定异常的所述问答对数据,以生成异常信息,其中,所述预设的属性条件包括:同一网页确定的问答对数据中,问题与答案具有相同的数量;和/或,所述问答对数据所占存储空间的大小阈值。
4.一种问答***的建立装置,其特征在于,包括:
第一程序单元,用于根据抽取模板以及目标数据源,确定问答对数据,包括:过滤掉所述目标数据源的目标网页组中与网页黑名单匹配的网页;根据所述抽取模板以及过滤后的所述目标网页组,确定问答对数据;或者,根据XPath抽取模板以及目标数据源,确定问答对数据;
第二程序单元,用于根据所述问答对数据对应的异常信息,调整所述抽取模板以更新所述问答对数据,包括:第一子程序单元,用于根据存在异常的网页的节点分布,调整所述抽取模板;第二子程序单元,用于根据调整后的所述抽取模板重新抽取目标网页的数据,以更新所述问答对数据;
第三程序单元,用于根据更新后的所述问答对数据,确定问答索引以建立问答***,包括:根据更新后的所述问答对数据,通过增量和定期全量的方式确定所述问答索引,以建立问答***。
5.根据权利要求4所述的装置,其特征在于,还包括:第四程序单元,用于根据预设的属性条件,确定异常的所述问答对数据,其中,所述预设的属性条件包括:同一网页确定的问答对数据中,问题与答案具有相同的数量;和/或,所述问答对数据所占存储空间的大小阈值。
6.一种存储介质,其特征在于,其上存储有计算机可执行指令,所述计算机可执行指令在被处理器处理时执行如下步骤:
根据抽取模板以及目标数据源,确定问答对数据,包括:过滤掉所述目标数据源的目标网页组中与网页黑名单匹配的网页;根据所述抽取模板以及过滤后的所述目标网页组,确定问答对数据;或者,根据XPath抽取模板以及目标数据源,确定问答对数据;
根据所述问答对数据对应的异常信息,调整所述抽取模板以更新所述问答对数据,包括:根据存在异常的网页的节点分布,调整所述抽取模板;根据调整后的所述抽取模板重新抽取目标网页的数据,以更新所述问答对数据;
根据更新后的所述问答对数据,确定问答索引以建立问答***,包括:根据更新后的所述问答对数据,通过增量和定期全量的方式确定所述问答索引,以建立问答***。
7.一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-3中任一所述的方法。
CN201810712179.1A 2018-06-29 2018-06-29 问答***的建立方法、装置、存储介质及电子设备 Active CN110659354B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201810712179.1A CN110659354B (zh) 2018-06-29 2018-06-29 问答***的建立方法、装置、存储介质及电子设备
TW108110061A TW202001623A (zh) 2018-06-29 2019-03-22 問答系統的建立方法、裝置、儲存媒體及電子設備
PCT/US2019/039767 WO2020006381A1 (en) 2018-06-29 2019-06-28 Method, apparatus, storage medium and electronic device for establishing question and answer system
US16/456,341 US11250080B2 (en) 2018-06-29 2019-06-28 Method, apparatus, storage medium and electronic device for establishing question and answer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810712179.1A CN110659354B (zh) 2018-06-29 2018-06-29 问答***的建立方法、装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN110659354A CN110659354A (zh) 2020-01-07
CN110659354B true CN110659354B (zh) 2023-07-14

Family

ID=68987587

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810712179.1A Active CN110659354B (zh) 2018-06-29 2018-06-29 问答***的建立方法、装置、存储介质及电子设备

Country Status (4)

Country Link
US (1) US11250080B2 (zh)
CN (1) CN110659354B (zh)
TW (1) TW202001623A (zh)
WO (1) WO2020006381A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767284B (zh) * 2020-06-23 2023-11-21 Oppo(重庆)智能科技有限公司 数据处理方法、装置、存储介质和服务器
US20230214588A1 (en) * 2022-01-06 2023-07-06 Coretech LT, UAB Automatized parsing template customizer
TWI802459B (zh) * 2022-07-01 2023-05-11 中華電信股份有限公司 基於資料增強推薦問答的系統及方法

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6009420A (en) 1992-10-05 1999-12-28 Expert Systems Publishing Co. Computer-implemented decision management system with dynamically generated questions and answer choices
US5519608A (en) 1993-06-24 1996-05-21 Xerox Corporation Method for extracting from a text corpus answers to questions stated in natural language by using linguistic analysis and hypothesis generation
US6315572B1 (en) 1995-03-22 2001-11-13 William M. Bancroft Method and system for computerized authoring, learning, and evaluation
US6028601A (en) 1997-04-01 2000-02-22 Apple Computer, Inc. FAQ link creation between user's questions and answers
US8812319B2 (en) * 2001-01-31 2014-08-19 Ibiometrics, Inc. Dynamic pass phrase security system (DPSS)
US6584470B2 (en) 2001-03-01 2003-06-24 Intelliseek, Inc. Multi-layered semiotic mechanism for answering natural language questions using document retrieval combined with information extraction
JP2003030224A (ja) 2001-07-17 2003-01-31 Fujitsu Ltd 文書クラスタ作成装置、文書検索システムおよびfaq作成システム
JP4004825B2 (ja) * 2002-03-14 2007-11-07 株式会社東芝 情報抽出共有装置
US7805382B2 (en) 2005-04-11 2010-09-28 Mkt10, Inc. Match-based employment system and method
JP4654745B2 (ja) 2005-04-13 2011-03-23 富士ゼロックス株式会社 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
US8412514B1 (en) 2005-10-27 2013-04-02 At&T Intellectual Property Ii, L.P. Method and apparatus for compiling and querying a QA database
US20080031447A1 (en) * 2006-08-04 2008-02-07 Frank Geshwind Systems and methods for aggregation of access to network products and services
CA2557344A1 (en) * 2006-08-28 2008-02-28 Consumer Contact Ulc Data collection system and method
US9063975B2 (en) 2013-03-15 2015-06-23 International Business Machines Corporation Results of question and answer systems
US20090094053A1 (en) * 2007-10-09 2009-04-09 Edward Jung Diagnosis through graphical representation of patient characteristics
US8332394B2 (en) 2008-05-23 2012-12-11 International Business Machines Corporation System and method for providing question and answers with deferred type evaluation
US8387122B2 (en) * 2008-05-16 2013-02-26 University Of Washington Access control by testing for shared knowledge
WO2010105216A2 (en) 2009-03-13 2010-09-16 Invention Machine Corporation System and method for automatic semantic labeling of natural language texts
US20110125734A1 (en) 2009-11-23 2011-05-26 International Business Machines Corporation Questions and answers generation
US20110125726A1 (en) 2009-11-25 2011-05-26 Microsoft Corporation Smart algorithm for reading from crawl queue
US9110882B2 (en) * 2010-05-14 2015-08-18 Amazon Technologies, Inc. Extracting structured knowledge from unstructured text
US8739150B2 (en) 2010-05-28 2014-05-27 Smartshift Gmbh Systems and methods for dynamically replacing code objects via conditional pattern templates
US9002773B2 (en) 2010-09-24 2015-04-07 International Business Machines Corporation Decision-support application and system for problem solving using a question-answering system
KR101173561B1 (ko) 2010-10-25 2012-08-13 한국전자통신연구원 질문 형태 및 도메인 인식 장치 및 그 방법
US9092802B1 (en) * 2011-08-15 2015-07-28 Ramakrishna Akella Statistical machine learning and business process models systems and methods
US8856936B2 (en) * 2011-10-14 2014-10-07 Albeado Inc. Pervasive, domain and situational-aware, adaptive, automated, and coordinated analysis and control of enterprise-wide computers, networks, and applications for mitigation of business and operational risks and enhancement of cyber security
US9606970B2 (en) * 2012-01-05 2017-03-28 Data Record Science Web browser device for structured data extraction and sharing via a social network
GB2499643A (en) * 2012-02-24 2013-08-28 Canon Kk Extracting a meta data fragment from a metadata component associated with multimedia data
US20130311875A1 (en) * 2012-04-23 2013-11-21 Derek Edwin Pappas Web browser embedded button for structured data extraction and sharing via a social network
CN103227838B (zh) * 2013-05-10 2015-09-30 中国工商银行股份有限公司 一种多重负载均衡处理装置与方法
CN104216913B (zh) * 2013-06-04 2019-01-04 Sap欧洲公司 问题回答方法、***和计算机可读介质
US9244894B1 (en) * 2013-09-16 2016-01-26 Arria Data2Text Limited Method and apparatus for interactive reports
US10424016B2 (en) * 2013-12-19 2019-09-24 International Business Machines Corporation Modeling asset transfer flow relationships discovered in unstructured data
US20150186528A1 (en) * 2013-12-26 2015-07-02 Iac Search & Media, Inc. Request type detection for answer mode selection in an online system of a question and answer search engine
US9495457B2 (en) * 2013-12-26 2016-11-15 Iac Search & Media, Inc. Batch crawl and fast crawl clusters for question and answer search engine
US20150186527A1 (en) 2013-12-26 2015-07-02 Iac Search & Media, Inc. Question type detection for indexing in an offline system of question and answer search engine
CN104050256B (zh) * 2014-06-13 2017-05-24 西安蒜泥电子科技有限责任公司 基于主动学习的问答方法及采用该方法的问答***
US9582757B1 (en) * 2014-07-25 2017-02-28 Amazon Technologies, Inc. Scalable curation system
US9619513B2 (en) * 2014-07-29 2017-04-11 International Business Machines Corporation Changed answer notification in a question and answer system
US11017312B2 (en) * 2014-12-17 2021-05-25 International Business Machines Corporation Expanding training questions through contextualizing feature search
CN104850539B (zh) * 2015-05-28 2017-08-25 宁波薄言信息技术有限公司 一种自然语言理解方法及基于该方法的旅游问答***
US10170014B2 (en) * 2015-07-28 2019-01-01 International Business Machines Corporation Domain-specific question-answer pair generation
US10169717B2 (en) * 2015-08-13 2019-01-01 International Business Machines Corporation System and method for defining and using different levels of ground truth
JP6649582B2 (ja) * 2016-02-23 2020-02-19 富士通株式会社 検索制御プログラム、検索制御装置及び検索制御方法
US9910848B2 (en) * 2016-07-07 2018-03-06 International Business Machines Corporation Generating semantic variants of natural language expressions using type-specific templates
US10108600B2 (en) * 2016-09-16 2018-10-23 Entigenlogic Llc System and method of attribute, entity, and action organization of a data corpora
US10298757B2 (en) * 2017-02-23 2019-05-21 Accenture Global Solutions Limited Integrated service centre support
US10510336B2 (en) * 2017-06-12 2019-12-17 International Business Machines Corporation Method, apparatus, and system for conflict detection and resolution for competing intent classifiers in modular conversation system
US10009375B1 (en) * 2017-12-01 2018-06-26 KnowBe4, Inc. Systems and methods for artificial model building techniques
CN108090177B (zh) * 2017-12-15 2020-05-05 上海智臻智能网络科技股份有限公司 多轮问答***的生成方法、设备、介质及多轮问答***

Also Published As

Publication number Publication date
US20200004795A1 (en) 2020-01-02
CN110659354A (zh) 2020-01-07
TW202001623A (zh) 2020-01-01
WO2020006381A1 (en) 2020-01-02
US11250080B2 (en) 2022-02-15

Similar Documents

Publication Publication Date Title
US8997041B2 (en) Method of managing script, server performing the same and storage media storing the same
CN110659354B (zh) 问答***的建立方法、装置、存储介质及电子设备
US20150046424A1 (en) Methods and systems for searching software applications
CN111729305A (zh) 地图场景预加载方法、模型训练方法、设备及存储介质
CN103645951A (zh) 一种跨平台的移动数据管理***及其方法
JP2018514846A (ja) ウェブページのアクセス方法、装置、デバイス及びプログラム
CN108536745B (zh) 基于Shell的数据表提取方法、终端、设备及存储介质
CN111737443B (zh) 答案文本的处理方法和装置、关键文本的确定方法
CN103440243A (zh) 一种教学资源推荐方法及其装置
CN111444181A (zh) 知识图谱更新方法、装置及电子设备
CN104598570A (zh) 资源的抓取方法及装置
CN111553138B (zh) 用于规范内容结构文档的辅助写作方法及装置
US20190245925A1 (en) Information processing device, information processing method, program, and storage medium
WO2023071956A1 (zh) 模型训练方法、装置及电子设备
CN103106217B (zh) 一种留言信息的处理方法和设备
CN114741077A (zh) 基于字段粒度的页面效果预览方法、装置、设备及介质
CN114580533A (zh) 特征提取模型的训练方法、装置、设备、介质及程序产品
CN107861994B (zh) 日志整理方法及装置
Sharma Blazor Quick Start Guide: Build web applications using Blazor, EF Core, and SQL Server
US11288063B2 (en) Method and apparatus for assisting in open source usage
CN113190236B (zh) Hql脚本校验方法及装置
CN115952348A (zh) 一种兴趣推送方法、装置、设备及计算机可读存储介质
CN117725959A (zh) 数据更新方法、装置、电子设备及计算机存储介质
CN104794227A (zh) 一种信息匹配方法及装置
Baker Living in a digital world: Demystifying technology

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200526

Address after: 310051 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 510627 Guangdong city of Guangzhou province Whampoa Tianhe District Road No. 163 Xiping Yun Lu Yun Ping square B radio tower 13 layer self unit 01

Applicant before: UC MOBILE (CHINA) Co.,Ltd.

GR01 Patent grant
GR01 Patent grant