CN113177116A - 信息展示方法及装置、电子设备、存储介质及程序产品 - Google Patents

信息展示方法及装置、电子设备、存储介质及程序产品 Download PDF

Info

Publication number
CN113177116A
CN113177116A CN202110469452.4A CN202110469452A CN113177116A CN 113177116 A CN113177116 A CN 113177116A CN 202110469452 A CN202110469452 A CN 202110469452A CN 113177116 A CN113177116 A CN 113177116A
Authority
CN
China
Prior art keywords
information
service
information set
service information
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110469452.4A
Other languages
English (en)
Other versions
CN113177116B (zh
Inventor
张珂欣
吴欢
王坤
樊苗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110469452.4A priority Critical patent/CN113177116B/zh
Publication of CN113177116A publication Critical patent/CN113177116A/zh
Application granted granted Critical
Publication of CN113177116B publication Critical patent/CN113177116B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种信息展示方法及装置、电子设备、存储介质及程序产品。该信息展示方法及装置可用于金融领域或其他领域。信息展示方法包括:生成原始信息库,原始信息库包括业务信息,业务信息具有优先级标签;获取语音信息,基于语音信息生成文本信息;对文本信息进行处理,获取至少一个关键词;基于预设的扩展规则对至少一个关键词进行扩展,生成扩展信息集合,扩展信息集合包括与扩展规则相对应的权重信息;判断扩展信息集合与原始信息库的匹配结果,基于匹配结果获取与扩展信息集合对应的业务信息集合;基于权重信息和优先级标签对业务信息集合中的业务信息进行排序,生成排序结果,选取排序结果中的至少一部分进行展示。

Description

信息展示方法及装置、电子设备、存储介质及程序产品
技术领域
本公开涉及信息处理技术领域,更具体地,涉及一种信息展示方法及装置、电子设备、计算机可读存储介质及计算机程序产品。
背景技术
随着经济的发展,信息数据量变的非常繁杂。在提供信息检索服务的过程中,对于不同的用户所涉及的业务范围和知识体系不同,要在海量的信息中快速确定用户的业务范围和知识体系较为困难。此外,在确定用户的业务范围后,针对用户所要解决的问题的不同,需要提供全面的解决方案。相关技术中主要通过人工实现信息的检索以及针对用户的问题进行解答,至少存在效率低、耗时长以及解决方案不准确等问题。
发明内容
有鉴于此,本公开提供了一种信息展示方法及装置、电子设备、计算机可读存储介质及计算机程序产品。
本公开的一个方面提供了一种信息展示方法,其中,包括:生成原始信息库,所述原始信息库包括业务信息,所述业务信息具有优先级标签;获取语音信息,基于所述语音信息生成文本信息;对所述文本信息进行处理,获取至少一个关键词;基于预设的扩展规则对所述至少一个关键词进行扩展,生成扩展信息集合,所述扩展信息集合包括与所述扩展规则相对应的权重信息;判断所述扩展信息集合与所述原始信息库的匹配结果,基于所述匹配结果获取与所述扩展信息集合对应的业务信息集合;基于所述权重信息和所述优先级标签对所述业务信息集合中的所述业务信息进行排序,生成排序结果,选取所述排序结果中的至少一部分进行展示。
根据本公开的实施例,所述扩展规则包括同义扩展规则、近义扩展规则、下位扩展规则、上位扩展规则中的至少一种。
根据本公开的实施例,所述基于预设的扩展规则对所述至少一个关键词进行扩展,生成扩展信息集合包括:基于同义扩展规则生成同义扩展信息集合;基于近义扩展规则生成近义扩展信息集合;基于下位扩展规则生成下位扩展信息集合;基于上位扩展规则生成上位扩展信息集合。
根据本公开的实施例,所述同义扩展信息集合包括同义权重信息W1,所述近义扩展信息集合包括近义权重信息W2,所述下位扩展信息集合包括下位权重信息W3,所述上位扩展信息集合包括上位权重信息W4;其中,W1>W2>W3>W4。
根据本公开的实施例,所述判断所述扩展信息集合与所述原始信息库的匹配结果,基于所述匹配结果获取与所述扩展信息集合对应的业务信息集合包括:若所述扩展信息集合与所述原始信息库的至少一部分业务信息匹配,则获取与所述扩展信息集合对应的业务信息集合;若所述扩展信息集合与所述原始信息库的业务信息不匹配,则生成展示内容,所述展示内容与所述业务信息相关联。
根据本公开的实施例,所述业务信息为多层结构,每一层包括至少一个所述业务信息,其中每一层的每一个所述业务信息具有不同的优先级。
根据本公开的实施例,所述的信息展示方法还包括:获取所述文本信息中的问答对,基于所述问答对生成补充业务信息;将所述补充业务信息更新至所述原始信息库。
根据本公开的实施例,所述的信息展示方法还包括:将所述补充业务信息更新至所述原始信息库之前,对所述补充业务信息进行修改或审核。
根据本公开的实施例,所述对所述文本信息进行处理,获取至少一个关键词包括:对所述文本信息进行预处理,所述预处理包括文本筛选、文本过滤和文本删除中的至少一种;对预处理后的所述文本信息进行分类,基于分类的结果获取所述至少一个关键词。
根据本公开的实施例,所述基于所述权重信息和所述优先级标签对所述业务信息集合中的所述业务信息进行排序,生成排序结果包括:计算所述业务信息集合中的所述业务信息的分值,根据所述分值对所述业务信息进行降序排序;其中,所述分值计算公式为:
Rank=W×P
W表示扩展信息集合所对应的权重信息;P表示扩展信息集合所对应的业务信息集合中的业务信息的优先级。
本公开的另一方面提供了一种信息展示装置,包括:第一模块,配置为生成原始信息库,所述原始信息库包括业务信息,所述业务信息具有优先级标签;第二模块,配置为获取语音信息,基于所述语音信息生成文本信息;第三模块,配置为对所述文本信息进行处理,获取至少一个关键词;第四模块,配置为基于预设的扩展规则对所述至少一个关键词进行扩展,生成扩展信息集合,所述扩展信息集合包括与所述扩展规则相对应的权重信息;第五模块,配置为判断所述扩展信息集合与所述原始信息库的匹配结果,基于所述匹配结果获取与所述扩展信息集合对应的业务信息集合;第六模块,配置为基于所述权重信息和所述优先级标签对所述业务信息集合中的所述业务信息进行排序,生成排序结果,选取所述排序结果中的至少一部分进行展示。
在本公开的实施例中,信息展示装置的第三模块包括第三模块子模块,配置为对文本信息进行预处理,预处理包括文本筛选、文本过滤和文本删除中的至少一种;对预处理后的文本信息进行分类;基于分类的结果获取至少一个关键词。
在本公开的实施例中,扩展规则包括同义扩展规则、近义扩展规则、下位扩展规则、上位扩展规则中的至少一种。信息展示装置的第四模块包括第四模块子模块,配置为基于同义扩展规则生成同义扩展信息集合;基于近义扩展规则生成近义扩展信息集合;基于下位扩展规则生成下位扩展信息集合;基于上位扩展规则生成上位扩展信息集合。
在本公开的实施例中,信息展示装置的第五模块包括第五模块子模块,配置为在扩展信息集合与原始信息库的至少一部分业务信息匹配时,获取与所述扩展信息集合对应的业务信息集合,在扩展信息集合与原始信息库的业务信息不匹配时,则生成与业务信息相关联的展示内容。
本公开的另一方面提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储可执行指令,所述可执行指令在被所述处理器执行时,实现根据上文所述的信息展示方法。
本公开的另一方面提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时,实现根据上文所述的信息展示方法。
本公开的另一方面提供了一种计算机程序产品,其中,所述产品存储有计算机程序,所述计算机程序在被执行时能够实现根据上文所述的信息展示方法。
根据本公开的实施例,本公开采用对获取的关键词进行扩展,生成扩展信息集合,基于扩展信息集合获取原始信息库中的业务信息集合,并基于权重信息和优先级标签对业务信息集合中的业务信息进行排序并展示。通过该方案,能够从繁杂的原始信息库中获取特定的业务信息,并通过排序确定业务信息与用户需求之间相关度,有效提高信息展示的准确度,提高效率。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的信息展示方法和装置的应用场景;
图2示意性示出了根据本公开实施例的信息展示方法的流程图;
图3示意性示出了根据本公开实施例的信息展示方法在操作S230的流程图;
图4示意性示出了根据本公开实施例的更新原始信息库的流程图;
图5示意性示出了根据本公开实施例的原始信息库中的业务信息结构图;
图6示意性示出了根据本公开实施例的信息展示装置的框图;
图7示意性示出了根据本公开实施例的信息展示装置的信息更新模块的框图;
图8示意性示出了根据本公开实施例的电子设备的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。
本公开的实施例提供了一种信息展示方法以及信息展示装置。该方法可以包括如下操作:首先,生成原始信息库,原始信息库包括业务信息,业务信息具有优先级标签。然后,获取语音信息,基于语音信息生成文本信息。再然后,对文本信息进行处理,获取至少一个关键词。接下来,基于预设的扩展规则对至少一个关键词进行扩展,生成扩展信息集合,扩展信息集合包括与扩展规则相对应的权重信息。然后,判断扩展信息集合与原始信息库的匹配结果,基于匹配结果获取与扩展信息集合对应的业务信息集合。最后,基于权重信息和优先级标签对业务信息集合中的业务信息进行排序,生成排序结果,选取排序结果中的至少一部分进行展示。
图1示意性示出了根据本公开实施例的信息展示方法的示例性***架构100。需要注意的是,图1所示仅为可以应用本公开实施例的***架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、***、环境或场景。需要说明的是,本公开实施例提供的信息展示方法和信息展示装置可用于金融领域,也可用于金融领域之外的其他多种领域,例如信息处理技术领域,本公开实施例提供的信息展示方法和信息展示装置对应用领域不做限定。
如图1所示,根据该实施例的***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的信息展示方法一般可以由服务器105执行。相应地,本公开实施例所提供的信息展示装置一般可以设置于服务器105中。本公开实施例所提供的信息展示方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的信息展示装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2示意性示出了根据本公开实施例的信息展示方法的流程图。
如图2所示,本公开的信息展示方法200可以包括操作S210至操作S260。
在操作S210,生成原始信息库,原始信息库包括业务信息,业务信息具有优先级标签。
原始信息库可以从相关的数据库中进行调取,也可以是根据现有的数据生成。
例如,原始信息库从相关的数据库调取,相关的数据库可以是相关的客户端应用数据库、服务机构构建的数据库、教育机构构件的数据库等等。从数据库调取数据可以是调取部分数据库,也可以是调取全部数据库,调取数据的过程中可以设定调取规则等,以调取满足需求的数据或信息。
例如,原始信息库可以根据不同的技术领域获取的数据或信息进行构建。根据银行数据领域构建银行类原始信息库,根据医学领域构建医学类原始信息库,根据化学领域构建化学类原始信息库,根据计算机领域构建计算机类原始信息库等等。
原始信息库中包括有业务信息,业务信息为多层结构,每一层包括至少一个业务信息,其中每一层的每一个业务信息具有不同的优先级。
例如,业务信息的多层结构可以是多个类别,其中,类别分为大类、位于大类条目下的小类、位于小类条目下的子类等等。子类的条目下可以继续设置更详细的分类,也可以是具体的信息内容。大类、小类、子类等至少包括一个,例如大类至少包括一个大类,小类至少包括一个小类,子类至少包括一个子类。
业务信息具有优先级标签,用于确定不同的业务信息的优先级。例如,原始信息库中具有多个大类,每一个大类对应一个优先级标签,并且,每一个大类的优先级标签上的优先级不同,用于确定不同的类别的优先级。根据优先级标签的优先级的高低,确定业务信息的调用顺序。同理,对于小类、子类等条目均设置有优先级标签,位于同一类别或者同一子类别的业务信息具有不同的优先级。
根据本公开的实施例,设置优先级标签,用于确定业务信息的优先级顺序,可以确定业务信息的优先程度,便于根据优先级对业务数据进行筛选。
在本公开的实施例中,可以结合银行业务对原始信息库进行描述。例如,业务信息可以包括如下大类:查询、挂失、转账缴费、投资理财、企业服务、***服务及其他。大类中的查询又可划分为余额查询、明细查询、开户行查询、金融信息查询等小类。小类中的明细查询又可以分为根据交易日查询、根据交易数额查询等子类等等。以此类推,最终直至实现查询的目的。
此外,业务信息还可以包括标签,例如,属性标签、优先级标签等。属性标签可以包括知识场景、知识标题、产品标签、渠道标签的一种或多种。可以根据属性标签确定业务信息,实现信息的快速检索。优先级标签是位于同一层级的业务信息的优先级顺序,例如,大类中的查询分为余额查询、明细查询、开户行查询、金融信息查询等小类。余额查询的咨询次数最多,则在查询的小类中,余额查询的优先级标签上的优先级最高,以及优先级标签上的优先级高低,对查询对应的小类进行排序。同理,对业务信息的的不同层确定不同的优先级。
在操作S220,获取语音信息,基于语音信息生成文本信息。
获取语音信息,例如可以是获取用户的语音信息,也可以是同时获取用户与服务人员对话的语音信息。
基于获取的语音信息,通过第三方API或者内置的语音处理装置等将语音信息转化为文本信息。
在操作S230,对文本信息进行处理,获取至少一个关键词。
获取关键词采用关键词提取模型对文本信息进行关键词提取,提取的关键词例如可以是一个、也可以是多个。
在本公开的实施例中,关键词提取模型包括TF-IDF模型、LDA模型。其中,TF-IDF模型是基于统计特征的关键词提取方法。在该模型中,一个词的TF是指这个词在文档中出现的频率,而IDF是根据语料库得出的,表示这个词在整个语料库中出现的频率。在TF-IDF的模型中,如果某个词在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词具有很好的类别区分能力,将此词作为关键词提取出来。LDA模型可以用来识别语料库中隐藏的主题信息。在LDA模型中,采用了词袋的方法,每一篇文档可以代表一些主题所构成的一个概率分布,而每一个主题可以代表很多单词所构成的一个概率分布。对于每一篇文档,首先从主题分布中随机抽取一个主题,再从主题所对应的单词分布中随机抽取一个单词,直至遍历所有单词。最终得到文档的单词和主题的概率分布,根据概率分布提取出关键词。
在本公开的实施例中,通过关键词提取模型提取关键词后,可以根据关键词对该文本信息进行分类,以使该文本信息与原始信息库的业务信息相对应。
在操作S240,基于预设的扩展规则对至少一个关键词进行扩展,生成扩展信息集合,扩展信息集合包括与扩展规则相对应的权重信息。
预设的扩展规则可以包括同义扩展规则、近义扩展规则、下位扩展规则、上位扩展规则中的至少一种。其中,同义扩展规则表示根据关键词的内容获取关键词所对应的同义词。近义扩展规则表示根据关键词的内容获取关键词所对应的近义词。下位扩展规则表示根据关键词的内容获取关键词所对应的下位词汇,具体地表示获取的下位词汇的范围比关键词的范围小,下位词汇被关键词所包含,下位词汇表示的意义比关键词的意义更具体。上位扩展规则表示根据关键词的内容获取关键词所对应的上位词汇,具体地表示获取的上位词汇的范围比关键词的范围大,上位词汇包含关键词,上位词汇表示的意义比关键词的意义更加宽泛。
基于预设的扩展规则对关键词进行扩展,生成扩展信息集合。例如可以选择扩展规则中的一种规则对关键词进行扩展,也可以选择扩展规则中的多种对关键词进行扩展,并生成扩展信息集合。扩展信息集合中可以包括单个信息,也可以包括多个信息。
在本公开的实施例中,基于预设的扩展规则生成扩展信息集合包括基于同义扩展规则生成同义扩展信息集合;基于近义扩展规则生成近义扩展信息集合;基于下位扩展规则生成下位扩展信息集合;基于上位扩展规则生成上位扩展信息集合。
根据本公开的实施例,生成的扩展信息集合包括同义扩展信息集合、近义扩展信息集合、下位扩展信息集合以及上位扩展信息集合中的至少一种。
在本公开的实施例中,扩展信息集合包括与扩展规则相对应的权重信息。具体地,同义扩展信息集合包括同义权重信息W1,近义扩展信息集合包括近义权重信息W2,下位扩展信息集合包括下位权重信息W3,上位扩展信息集合包括上位权重信息W4;其中,W1>W2>W3>W4。
不同的扩展信息集合包括的权重信息表示扩展信息集合的重要程度。例如,权重信息越大,则表明与该权重信息对应扩展信息集合越重要或更加相关,在进行信息调用时,优先调用权重信息大的扩展信息集合。
在操作S250,判断扩展信息集合与原始信息库的匹配结果,基于匹配结果获取与扩展信息集合对应的业务信息集合。
例如,将扩展信息集合中信息与原始信息库中的业务信息进行比对,判断扩展信息集合与原始信息库的匹配结果。
在本公开的实施例中,若扩展信息集合与原始信息库的至少一部分业务信息匹配,则获取与扩展信息集合对应的业务信息集合。若扩展信息集合与原始信息库的业务信息不匹配,则生成展示内容,展示内容与业务信息相关联。
将扩展信息集合中的信息与原始信息库中的业务信息进行比对。若比对发现扩展信息集合中的信息与原始信息库中的业务信息匹配,例如可以是部分匹配,也可以是全部匹配,则获取与扩展信息集合对应的业务信息集合。
例如,通过对关键词进行扩展,生成的扩展信息集合中包括查询、余额查询等,通过比对得出原始信息库中的同样具有查询、余额查询等业务信息,则获取原始信息库中的查询、余额查询等业务信息集合。
若比对发现扩展信息集合中的信息与原始信息库中的业务信息不匹配,即没有完全相同的信息,则生成与原始信息库中的业务信息相关联的展示内容。
例如,展示内容是与原始信息库中的业务信息相关联的,服务人员可以基于展示的内容,向用户提出与该展示内容相关的问题,以将用户引导至与原始信息库中的业务信息相关联的知识领域,并为用户提供解答。
在操作S260,基于权重信息和优先级标签对业务信息集合中的业务信息进行排序,生成排序结果,选取排序结果中的至少一部分进行展示。
例如,扩展信息集合具有不同的权重信息,因此,对于不同的扩展规则所得出的扩展信息集合的权重信息也不同。同时在原始信息库中所获取的与扩展信息集合对应的业务信息具有优先级标签,通过获取扩展信息集合的权重信息以及优先级,可以实现对获取的业务信息进行排序,生成排序结果,并对排序结果进行筛选、展示等。
在本公开的实施例中,对获取的业务信息进行排序可以通过计算原始信息库中业务信息集合的业务信息的分值,根据分值对业务信息进行降序排序。分值计算公式为:Rank=W×P,其中,W表示扩展信息集合所对应的权重信息,权重越大,则W值越大;P表示扩展信息集合所对应的业务信息集合中的业务信息的优先级,优先级越高,则P值越大。
例如,获得扩展信息集合的权重信息后,基于扩展信息集合对原始信息库包括的业务信息进行检索,获取与扩展信息集合对应的原始信息集合,并获取业务信息的优先级。根据上述公式可以计算出业务信息集合中的业务信息所对应的分值。根据计算分值的大小对业务信息排序,进行降序排列,选择排序靠前的内容(即得分较高的内容),进行展示。例如,选择排名前50的内容进行展示等。
根据本公开的实施例,本公开的信息展示方法采用对获取的关键词进行扩展,生成扩展信息集合,基于扩展信息集合获取原始信息库中的业务信息集合,并基于权重信息和优先级标签对业务信息集合中的业务信息进行排序并展示。通过该方案,能够从繁杂的原始信息库中获取特定的业务信息,并通过排序确定业务信息与用户需求之间相关度,有效提高信息展示的准确度,提高效率。
图3示意性示出了根据本公开实施例的信息展示方法在操作S230的流程图。
根据本公开的实施例,对文本信息进行处理,获取至少一个关键词包括操作S231至操作S233。
在操作S231中,对文本信息进行预处理。预处理包括文本筛选、文本过滤和文本删除中的至少一种。
根据语音信息生成的文本信息具有许多干扰词汇,例如分词、停用词、量词等。需要对这些干扰词汇进行预处理,从而减少关键词提取过程中的误差。预处理可以包括文本筛选、文本过滤和文本删除中的一种。例如对文本信息进行过滤、删除或筛选等,从而减少文本信息中的干扰项。
在操作S232中,对预处理后的文本信息进行分类。
例如,文本信息所包含的业务不同,在进行了操作S231之后,可以根据文本信息中的内容进行分类,包括大类、大类下的小类等等。
在操作S233中,基于分类的结果获取所述至少一个关键词。
在对文本信息进行了分类之后,根据关键词提取模型对文本信息进行提取。关键词可以是一个或者多个。
图4示意性示出了根据本公开实施例的更新原始信息库的流程图。
在本公开的实施例中,信息展示方法还包括对原始信息库进行更新。如图4所示,更新原始信息库的流程400包括操作S410至操作S430。
在操作S410中,获取文本信息中的问答对,基于问答对生成补充业务信息。
在本公开的实施例中,在操作S220中获取的语音信息为用户以及服务人员双方的语音信息。因此,生成的文本信息中包含有用户与服务人员之间的问答对。获取文本信息中的问答对,对每个问答对进行关键词提取,获取问答对的主题信息。关键词提取可以采用上文所述的关键词提取模型。
根据本公开的实施例,在获取问答对的关键词等补充业务信息后,进行文档相似度计算,寻找到与关键词相同或相近的业务信息。文档相似度计算可以采用欧式距离法、余弦相似度、点互信息等方式。具体地,欧式距离法通过计算两个点之间的距离来衡量词语的相似性,距离越短表示词语越相似。余弦相似度则是将词语转化为坐标系中的向量,然后计算向量之间的夹角,夹角越小表示词语越相似。点互信息是基于统计模型的方法,即如果两个词的相关性越大,则在统计结果中这两个词共同出现的概率就越高,此外还可以包括互信息熵等相似度计算方法。
在操作S420中,对补充业务信息进行修改或审核。
根据提取的问答对的关键词等信息确定原始信息库中与补充业务信息相同或相近的业务信息,将补充业务信息作为预更新内容发送至审核单元进行审核或修改。审核或修改可以采用人工的方式,也可以采用神经网络算法等进行过审核或修改。
在本公开的可选实施方式中,当获取的问答对中包含未解决的问题,例如服务人员未解决用户的问题,则也可以将问答对所对应的补充业务信息发送至审核单元,审核单元可以对该问答对所涉及的问题进行解答并完成审核。
在操作S430中,将补充业务信息更新至原始信息库。将审核单元中审核后的补充业务信息更新至原始信息库中与补充业务信息相对于的业务信息中,从而完善原始信息库的内容。
图5示意性示出了根据本公开实施例的原始信息库中的业务信息结构图。
如图5所示,原始信息库500包括多个业务信息,业务信息包括位于第一层的第一业务大类510、第二业务大类520以及第三业务大类530,位于第二层的第一业务小类511、第二业务小类512、第三业务小类521、第四业务小类522、第五业务小类531、第六业务小类532,位于第三层的业务条目,例如包括位于第一业务小类511下的业务条目5111、5112、5113以及5114,其他的业务小类下也可以具有至少一个或多个业务条目,在此不再赘述。
在本公开的实施例中,位于第一层的每一个业务信息具有优先级标签,并且,每一个业务信息的业务标签的优先级不同,例如第一业务大类510具有第一优先级,第二业务大类520具有第二优先级,第三业务大类530具有第三优先级。同理,第二层的业务小类也具有不同的优先级,以此类推。
根据本公开的实施例,通过将业务信息设置为多层结构,可以更好的对业务信息进行检索。此外,设置不同的优先级可以实现对业务信息中不同内容进行区分,便于数据筛选。
图6示意性示出了根据本公开实施例的信息展示装置的框图。
如图6所示,信息展示装置600包括第一模块610、第二模块620、第三模块630、第四模块640、第五模块650以及第六模块660。
第一模块610配置为生成原始信息库,原始信息库包括业务信息,业务信息具有优先级标签。
第二模块620配置为获取语音信息,基于语音信息生成文本信息。
第三模块630配置为对文本信息进行处理,获取至少一个关键词。
第四模块640配置为基于预设的扩展规则对至少一个关键词进行扩展,生成扩展信息集合,扩展信息集合包括与扩展规则相对应的权重信息。
第五模块650配置为判断扩展信息集合与原始信息库的匹配结果,基于匹配结果获取与扩展信息集合对应的业务信息集合。
第六模块660配置为基于权重信息和优先级标签对业务信息集合中的业务信息进行排序,生成排序结果,选取排序结果中的至少一部分进行展示。
在本公开的实施例中,信息展示装置的第三模块630包括第三模块子模块,配置为对文本信息进行预处理,预处理包括文本筛选、文本过滤和文本删除中的至少一种;对预处理后的文本信息进行分类;基于分类的结果获取至少一个关键词。
在本公开的实施例中,扩展规则包括同义扩展规则、近义扩展规则、下位扩展规则、上位扩展规则中的至少一种。信息展示装置的第四模块640包括第四模块子模块,配置为基于同义扩展规则生成同义扩展信息集合;基于近义扩展规则生成近义扩展信息集合;基于下位扩展规则生成下位扩展信息集合;基于上位扩展规则生成上位扩展信息集合。
在本公开的实施例中,信息展示装置的第五模块650包括第五模块子模块,配置为在扩展信息集合与原始信息库的至少一部分业务信息匹配时,获取与所述扩展信息集合对应的业务信息集合,在扩展信息集合与原始信息库的业务信息不匹配时,则生成与业务信息相关联的展示内容。
在本公开的实施例中,信息展示装置还可以包括信息更新模块。图7示意性示出了根据本公开实施例的信息展示装置的信息更新模块的框图。
如图7所示,信息更新模块700包括信息获取模块710、信息生成模块720、审核模块730以及更新模块740。
其中,信息获取模块710配置为获取文本信息中的问答对。
信息生成模块720配置为基于问答对生成补充业务信息。
审核模块730配置为对补充业务信息进行修改或审核。
更新模块740配置为将审核或修改后的补充业务信息更新至原始信息库。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,第一模块610、第二模块620、第三模块630、第四模块640、第五模块650以及第六模块660中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,第一模块610、第二模块620、第三模块630、第四模块640、第五模块650以及第六模块660中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第一模块610、第二模块620、第三模块630、第四模块640、第五模块650以及第六模块660中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图8示意性示出了根据本公开实施例的适于实现上文描述的方法的电子设备的框图。图8示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图8所示,根据本公开实施例的电子设备800包括处理器801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。处理器801例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器801还可以包括用于缓存用途的板载存储器。处理器801可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 803中,存储有电子设备800操作所需的各种程序和数据。处理器801、ROM802以及RAM 803通过总线804彼此相连。处理器801通过执行ROM 802和/或RAM 803中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 802和RAM 803以外的一个或多个存储器中。处理器801也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备800还可以包括输入/输出(I/O)接口805,输入/输出(I/O)接口805也连接至总线804。电子设备800还可以包括连接至I/O接口805的以下部件中的一项或多项:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/***中所包含的;也可以是单独存在,而未装配入该设备/装置/***中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 802和/或RAM 803和/或ROM 802和RAM 803以外的一个或多个存储器。
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行本公开实施例所提供的方法的程序代码,当计算机程序产品在电子设备上运行时,该程序代码用于使电子设备实现本公开实施例所提供的信息展示方法。
在该计算机程序被处理器801执行时,执行本公开实施例的***/装置中限定的上述功能。根据本公开的实施例,上文描述的***、装置、模块、单元等可以通过计算机程序模块来实现。
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分809被下载和安装,和/或从可拆卸介质811被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java,C++,python,“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (14)

1.一种信息展示方法,其中,包括:
生成原始信息库,所述原始信息库包括业务信息,所述业务信息具有优先级标签;
获取语音信息,基于所述语音信息生成文本信息;
对所述文本信息进行处理,获取至少一个关键词;
基于预设的扩展规则对所述至少一个关键词进行扩展,生成扩展信息集合,所述扩展信息集合包括与所述扩展规则相对应的权重信息;
判断所述扩展信息集合与所述原始信息库的匹配结果,基于所述匹配结果获取与所述扩展信息集合对应的业务信息集合;
基于所述权重信息和所述优先级标签对所述业务信息集合中的所述业务信息进行排序,生成排序结果,选取所述排序结果中的至少一部分进行展示。
2.根据权利要求1所述的信息展示方法,其中,所述扩展规则包括同义扩展规则、近义扩展规则、下位扩展规则、上位扩展规则中的至少一种。
3.根据权利要求2所述的信息展示方法,其中,所述基于预设的扩展规则对所述至少一个关键词进行扩展,生成扩展信息集合包括:
基于同义扩展规则生成同义扩展信息集合;
基于近义扩展规则生成近义扩展信息集合;
基于下位扩展规则生成下位扩展信息集合;
基于上位扩展规则生成上位扩展信息集合。
4.根据权利要求3所述的信息展示方法,其中,
所述同义扩展信息集合包括同义权重信息W1,所述近义扩展信息集合包括近义权重信息W2,所述下位扩展信息集合包括下位权重信息W3,所述上位扩展信息集合包括上位权重信息W4;
其中,W1>W2>W3>W4。
5.根据权利要求1所述的信息展示方法,其中,所述判断所述扩展信息集合与所述原始信息库的匹配结果,基于所述匹配结果获取与所述扩展信息集合对应的业务信息集合包括:
若所述扩展信息集合与所述原始信息库的至少一部分业务信息匹配,则获取与所述扩展信息集合对应的业务信息集合;
若所述扩展信息集合与所述原始信息库的业务信息不匹配,则生成展示内容,所述展示内容与所述业务信息相关联。
6.根据权利要求1所述的信息展示方法,其中,所述业务信息为多层结构,每一层包括至少一个所述业务信息,其中每一层的每一个所述业务信息具有不同的优先级。
7.根据权利要求1所述的信息展示方法,还包括:
获取所述文本信息中的问答对,基于所述问答对生成补充业务信息;
将所述补充业务信息更新至所述原始信息库。
8.根据权利要求7所述的信息展示方法,还包括:
将所述补充业务信息更新至所述原始信息库之前,对所述补充业务信息进行修改或审核。
9.根据权利要求1所述的信息展示方法,其中,
所述对所述文本信息进行处理,获取至少一个关键词包括:
对所述文本信息进行预处理,所述预处理包括文本筛选、文本过滤和文本删除中的至少一种;
对预处理后的所述文本信息进行分类;
基于分类的结果获取所述至少一个关键词。
10.根据权利要求1所述的信息展示方法,其中,所述基于所述权重信息和所述优先级标签对所述业务信息集合中的所述业务信息进行排序,生成排序结果包括:
计算所述业务信息集合中的所述业务信息的分值,根据所述分值对所述业务信息进行降序排序;
其中,所述分值计算公式为:
Rank=W×P
W表示扩展信息集合所对应的权重信息;P表示扩展信息集合所对应的业务信息集合中的业务信息的优先级。
11.一种信息展示装置,包括:
第一模块,配置为生成原始信息库,所述原始信息库包括业务信息,所述业务信息具有优先级标签;
第二模块,配置为获取语音信息,基于所述语音信息生成文本信息;
第三模块,配置为对所述文本信息进行处理,获取至少一个关键词;
第四模块,配置为基于预设的扩展规则对所述至少一个关键词进行扩展,生成扩展信息集合,所述扩展信息集合包括与所述扩展规则相对应的权重信息;
第五模块,配置为判断所述扩展信息集合与所述原始信息库的匹配结果,基于所述匹配结果获取与所述扩展信息集合对应的业务信息集合;
第六模块,配置为基于所述权重信息和所述优先级标签对所述业务信息集合中的所述业务信息进行排序,生成排序结果,选取所述排序结果中的至少一部分进行展示。
12.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储可执行指令,所述可执行指令在被所述处理器执行时,实现根据权利要求1至10中任一项所述的信息展示方法。
13.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时,实现根据权利要求1至10中任一项所述的信息展示方法。
14.一种计算机程序产品,其中,所述产品存储有计算机程序,所述计算机程序在被执行时能够实现根据权利要求1至10中任一项所述的信息展示方法。
CN202110469452.4A 2021-04-28 2021-04-28 信息展示方法及装置、电子设备、存储介质及程序产品 Active CN113177116B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110469452.4A CN113177116B (zh) 2021-04-28 2021-04-28 信息展示方法及装置、电子设备、存储介质及程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110469452.4A CN113177116B (zh) 2021-04-28 2021-04-28 信息展示方法及装置、电子设备、存储介质及程序产品

Publications (2)

Publication Number Publication Date
CN113177116A true CN113177116A (zh) 2021-07-27
CN113177116B CN113177116B (zh) 2024-03-29

Family

ID=76925689

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110469452.4A Active CN113177116B (zh) 2021-04-28 2021-04-28 信息展示方法及装置、电子设备、存储介质及程序产品

Country Status (1)

Country Link
CN (1) CN113177116B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180165724A1 (en) * 2016-12-13 2018-06-14 International Business Machines Corporation Method and system for contextual business intelligence report generation and display
CN110020303A (zh) * 2017-11-24 2019-07-16 腾讯科技(深圳)有限公司 确定备选展示内容的方法、装置及存储介质
CN111737399A (zh) * 2020-05-28 2020-10-02 北京百度网讯科技有限公司 扩展问答集的方法、装置、电子设备和可读存储介质
CN111949347A (zh) * 2020-07-06 2020-11-17 北京奇保信安科技有限公司 弹窗信息展示方法、装置及电子设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180165724A1 (en) * 2016-12-13 2018-06-14 International Business Machines Corporation Method and system for contextual business intelligence report generation and display
CN110020303A (zh) * 2017-11-24 2019-07-16 腾讯科技(深圳)有限公司 确定备选展示内容的方法、装置及存储介质
CN111737399A (zh) * 2020-05-28 2020-10-02 北京百度网讯科技有限公司 扩展问答集的方法、装置、电子设备和可读存储介质
CN111949347A (zh) * 2020-07-06 2020-11-17 北京奇保信安科技有限公司 弹窗信息展示方法、装置及电子设备

Also Published As

Publication number Publication date
CN113177116B (zh) 2024-03-29

Similar Documents

Publication Publication Date Title
US11989220B2 (en) System for determining and optimizing for relevance in match-making systems
CN108153901B (zh) 基于知识图谱的信息推送方法和装置
US9449271B2 (en) Classifying resources using a deep network
US9514405B2 (en) Scoring concept terms using a deep network
CN107992514B (zh) 结构化信息卡的搜索和检索
US9934293B2 (en) Generating search results
US20090077047A1 (en) Method and apparatus for identifying and classifying query intent
US11238050B2 (en) Method and apparatus for determining response for user input data, and medium
CN107958014B (zh) 搜索引擎
US11775504B2 (en) Computer estimations based on statistical tree structures
US12008047B2 (en) Providing an object-based response to a natural language query
EP3961426A2 (en) Method and apparatus for recommending document, electronic device and medium
US11593385B2 (en) Contextual interestingness ranking of documents for due diligence in the banking industry with entity grouping
CN111737607B (zh) 数据处理方法、装置、电子设备以及存储介质
CN111126073B (zh) 语义检索方法和装置
CN112182239A (zh) 信息检索方法和装置
CN116048463A (zh) 基于标签管理的需求项内容智能推荐方法及装置
CN113095078A (zh) 关联资产确定方法、装置和电子设备
CN111368036B (zh) 用于搜索信息的方法和装置
CN113177116B (zh) 信息展示方法及装置、电子设备、存储介质及程序产品
CN117435616A (zh) 生产问题记录的推荐方法、装置、电子设备和介质
CN115689721A (zh) 信贷制度信息处理方法、装置、设备和介质
CN115687096A (zh) 待测试项目的分配方法、装置、设备、介质和程序产品
CN117149651A (zh) 测试方法、装置、设备及存储介质
CN115438151A (zh) 标准条款的确定方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant