CN117112916A - 一种基于车联网的金融信息查询方法、装置及存储介质 - Google Patents

一种基于车联网的金融信息查询方法、装置及存储介质 Download PDF

Info

Publication number
CN117112916A
CN117112916A CN202311386976.2A CN202311386976A CN117112916A CN 117112916 A CN117112916 A CN 117112916A CN 202311386976 A CN202311386976 A CN 202311386976A CN 117112916 A CN117112916 A CN 117112916A
Authority
CN
China
Prior art keywords
association
financial
word
candidate
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311386976.2A
Other languages
English (en)
Inventor
张钰琨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Blue Flame Technology Chengdu Co ltd
Original Assignee
Blue Flame Technology Chengdu Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Blue Flame Technology Chengdu Co ltd filed Critical Blue Flame Technology Chengdu Co ltd
Priority to CN202311386976.2A priority Critical patent/CN117112916A/zh
Publication of CN117112916A publication Critical patent/CN117112916A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于车联网的金融信息查询方法、装置及存储介质,本发明通过接收用户驾驶车辆过程中,利用车联网发送的金融查询信息,并提取出金融查询信息中的关键词作为查询标签,从而来基于查询标签进行金融信息的查询;最后,再将查询结果返回至车辆进行可视化展示;如此,使得用户在行车过程中,可根据需求,并利用车联网来获取到想要的金融资讯信息,实现了金融信息的自主多样化的查询,增加了金融信息的获取方式,丰富了车联网在商务、金融等方面的应用,提升了车主和乘客的用车体验。

Description

一种基于车联网的金融信息查询方法、装置及存储介质
技术领域
本发明属于信息查询技术领域,具体涉及一种基于车联网的金融信息查询方法、装置及存储介质。
背景技术
随着科技水平的提高,人们越来越享受科技给生活带来的便利,同时,汽车也成为人们出行的必备代步工具,且随着人们花在汽车上的时间越来越多,汽车服务的智能化,便捷化也变得越来越重要,尤其是商务人士,该类人群越来越希望,能有一套智能的***能根据用户的指令,智能化地查询和推荐用户需求的资讯信息。
当前,在车联网领域,提供的服务比较单一,主要是导航服务和广播资讯服务,金融信息的获取方式更多的是通过收音机电台播报的财经快评等金融资讯获得,获取和查询方式单一,且获得的金融咨询信息有限,不能很好的依据用户的需求进行自主查询多样的金融信息(如工商信息、金融产品、金融舆情等);因此,如何提供一种能够基于车联网,并根据用户需求来自主推荐金融信息的信息查询方法,已成为一个亟待解决的问题。
发明内容
本发明的目的是提供一种基于车联网的金融信息查询方法、装置及存储介质,用以解决现有技术中车联网提供的金融信息获取服务比较单一,仅能根据收音机电台播报的财经快评等金融资讯获得金融信息,从而导致的金融咨询信息获取有限,以及无法依据用户的需求进行自主查询金融信息的问题。
为了实现上述目的,本发明采用以下技术方案:
第一方面,提供了一种基于车联网的金融信息查询方法,包括:
获取车辆通过车联网发送的金融查询信息,并对所述金融查询信息进行分词处理,以在分词处理后,得到候选词语列表;
基于所述候选词语列表,构建出词语关联图,其中,所述词语关联图中包含有多个节点,每个节点代表所述候选词语列表中的一个候选词语,且当任意两个节点对应的候选词语之间的语义相似度大于预设阈值时,该任意两个节点之间采用关联边进行连接;
根据所述词语关联图,计算出每个候选词语在所述金融查询信息中的语义贡献度;
利用各个候选词语的语义贡献度,从所述候选词语列表中选取出符合预设条件的候选词语,以将选取出的候选词语作为关键词;
将所述关键词作为查询标签,并基于所述查询标签进行金融信息查询,得到查询结果;
通过所述车联网,将所述查询结果发送至所述车辆,以使所述车辆通过车载多媒体将所述查询结果进行可视化展示。
基于上述公开的内容,本发明先获取用户通过车辆的车联网发送的金融查询信息,然后,对金融查询信息进行分词处理,从而来得到多个候选词语;接着,本发明基于各个候选词语之间的语义相似度,来构建出词语关联图,以基于该词语关联图来计算出每个候选词语在用户发送的金融查询信息中的语义贡献度;而后,则可依据各个候选词语的语义贡献度,来确定出最能够代表金融查询信息的关键词;最后,将关键词作为查询标签,并基于该标签进行信息查询,即可得到查询结果;而在得到查询结果后,即可将该结果返回至车辆,从而在车辆的多媒体上展示该查询结果,以供用户查看。
通过上述设计,本发明通过接收用户驾驶车辆过程中,利用车联网发送的金融查询信息,并提取出金融查询信息中的关键词作为查询标签,从而来基于查询标签进行金融信息的查询;最后,再将查询结果返回至车辆进行可视化展示;如此,使得用户在行车过程中,可根据需求,并利用车联网来获取到想要的金融资讯信息,实现了金融信息的自主多样化的查询,增加了金融信息的获取方式,丰富了车联网在商务、金融等方面的应用,提升了车主和乘客的用车体验。
在一个可能的设计中,任意两个节点对应的候选词语之间的语义相似度,采用如下方法计算得到;
获取所述任意两个节点对应候选词语的词语编码,以得到至少一个第一编码和至少一个第二编码,其中,任一第一编码和任一第二编码的长度相同,且所述任一第一编码和所述任一第二编码中相同位置处的字符所属的词语分类类型相同;
根据所述至少一个第一编码和所述至少一个第二编码,计算出所述任意两个节点对应候选词语之间的语义距离;
基于所述任意两个节点对应候选词语之间的语义距离,计算出所述任意两个节点对应候选词语之间的语义相似度。
在一个可能的设计中,根据所述至少一个第一编码和所述至少一个第二编码,计算出所述任意两个节点对应候选词语之间的语义距离,包括:
采用如下公式(1),计算出所述至少一个第一编码中的每个第一编码,与所述至少一个第二编码中的各个第二编码之间的语义距离;
(1)
上述公式(1)中,表示所述至少一个第一编码中的第/>个第一编码,/>表示所述至少一个第二编码中的第/>个第二编码,/>表示/>与/>之间的语义距离,/>表示中的最后一位字符,/>表示/>中的最后一位字符,/>表示同类标志字符,,/>表示/>中第/>个字符所属词语分类类型的权重,/>,/>表示的长度,/>表示初始语义距离,/>,/>表示第一编码的总数,/>表示第二编码的总数;
从每个第一编码与各个第二编码之间的语义距离中,选取出最小的语义距离,作为所述任意两个节点对应候选词语之间的语义距离;
相应的,基于所述任意两个节点对应候选词语之间的语义距离,计算出所述任意两个节点对应候选词语之间的语义相似度,则包括:
基于所述任意两个节点对应候选词语之间的语义距离,并采用如下公式(2),计算出所述任意两个节点对应候选词语之间的语义相似度;
(2)
上述公式(2)中,表示所述任意两个节点对应候选词语之间的语义相似度,/>表示所述任意两个节点对应候选词语之间的语义距离,/>表示所述任意两个节点对应的两候选词语,/>表示语义参数。
在一个可能的设计中,根据所述词语关联图,计算出每个候选词语在所述金融查询信息中的语义贡献度,包括:
基于所述词语关联图,计算出所述词语关联图中每个节点对应的候选词语,相对于所述金融查询信息的关联度;
利用各个节点对应候选词语相对于所述金融查询信息的关联度,组成关联度集合,并将所述关联度集合中的关联度划分为若干个初始区间;
统计出每个初始区间包含的关联度的个数,并基于每个初始区间包含的关联度个数和所述词语关联图中的节点总数,计算出每个初始区间的关联密度;
利用每个初始区间的关联密度,组成初始区间关联密度集合,并对所述初始区间关联密度集合进行寻优处理,以在寻优处理后,得到最优区间关联密度集合;
基于所述最优区间关联密度集合,确定出每个节点对应候选词语在所述金融查询信息中的语义贡献度。
在一个可能的设计中,基于所述词语关联图,计算出所述词语关联图中每个节点对应的候选词语,相对于所述金融查询信息的关联度,包括:
采用如下公式(3),计算出所述词语关联图中每个节点对应的候选词语,相对于所述金融查询信息的关联度;
(3)
上述公式(3)中,表示所述词语关联图中第r个节点对应的候选词语,相对于所述金融查询信息的关联度,/>表示所述词语关联图中第m个节点至第n个节点之间的最短路径,/>表示路径函数,其中,当第m个节点至第n个节点之间的最短路径经过第r个节点时,/>,当第m个节点至第n个节点之间的最短路径未经过第r个节点时,,且/>,/>表示节点总数;
相应的,基于每个初始区间包含的关联度个数和所述词语关联图中的节点总数,计算出每个初始区间的关联密度,则包括:
对于任一初始区间,将所述任一初始区间包含的关联度个数与节点总数之间的比值,作为所述任一初始区间的关联密度。
在一个可能的设计中,对所述初始区间关联密度集合进行寻优处理,以在寻优处理后,得到最优区间关联密度集合,包括:
初始化寻优次数t为1,并将所述初始区间关联密度集合作为第t次寻优时的区间关联密度集合;
从第t次寻优时的区间关联密度集合中,选取出最大的关联密度,并判断最大的关联密度是否大于或等于关联密度阈值,或判断t是否大于最大寻优次数;
若否,将t自加1,并确定出第t次寻优时的区间划分数,其中,/>,且/>表示第t-1次寻优时的区间划分数,/>表示区间数增长数;
基于第t次寻优时的区间划分数,将所述关联度集合中的关联度划分为/>个区间;
计算出每个区间的关联密度,以利用每个区间的关联密度组成第t次寻优时的区间关联密度集合,并重新从第t次寻优时的区间关联密度集合中,选取出最大的关联密度,直至最大的关联密度小于关联密度阈值,或t大于最大寻优次数时,得到所述最优区间关联密度集合。
在一个可能的设计中所述候选词语列表中的每个候选词语关联有对应的词语长度、词语位置和词语词性,其中,利用各个候选词语的语义贡献度,从所述候选词语列表中选取出符合预设条件的候选词语,包括:
计算出所述候选词语列表中各个候选词语的TF-IDF频率;
对于所述候选词语列表中的任一候选词语,依据所述任一候选词语的语义贡献度和TF-IDF频率,并按照如下公式(4),计算出所述任一候选词语的重要度;
(4)
上述公式(4)中,表示所述任一候选词语的重要度,/>表示语义贡献度权重,/>表示所述任一候选词语的语义贡献度,/>表示统计特征权重,/>表示位置x的权重,/>表示所述任一候选词语是否在位置x处出现,/>表示词语长度权重,/>表示所述任一候选词语的词语长度,/>表示词性权重,/>表示所述任一候选词语的词语词性,/>表示TF-IDF权重,/>表示所述任一候选词语的TF-IDF频率,其中,当所述任一候选词语在位置x处出现时,/>为1,当所述任一候选词语未在位置x处出现时,为0,且位置1和2,依次表示金融查询信息的段首和段尾;
基于各个候选词语的重要度,从各个候选词语中,选取出重要度大于重要度阈值的候选词语,作为所述关键词。
在一个可能的设计中,将所述关键词作为查询标签,并基于所述查询标签进行金融信息查询,得到查询结果,包括:
获取金融标签数据库,其中,所述金融标签数据库中存储有若干金融标签,且每个金融标签关联有金融信息内容;
对于所述金融标签数据库中的第a个金融标签,计算出所述查询标签中每个关键词与第a个金融标签中各个标签关键词的重合度、文字匹配度以及共有文字匹配度;
基于所述查询标签中每个关键词与第a个金融标签中各个标签关键词的重合度、文字匹配度以及共有文字匹配度,计算出每个关键词与各个标签关键词的相似度;
根据每个关键词与各个标签关键词的相似度,确定出所述第a个金融标签与所述查询标签的相似度;
将a自加1,并重新计算出所述查询标签中每个关键词与第a个金融标签中各个标签关键词的重合度、文字匹配度以及共有文字匹配度,直至a等于A时,得到所述查询标签与各个金融标签的相似度,其中,a的初始值为1,且A为金融标签的总数;
将所述查询标签与各个金融标签的相似度中,最大的相似度对应的金融标签所关联的金融信息内容,作为所述查询结果。
第二方面,提供了一种基于车联网的金融信息查询装置,包括:
信息获取单元,用于获取车辆通过车联网发送的金融查询信息,并对所述金融查询信息进行分词处理,以在分词处理后,得到候选词语列表;
关联图构建单元,用于基于所述候选词语列表,构建出词语关联图,其中,所述词语关联图中包含有多个节点,每个节点代表候选词语列表中的一个候选词语,且当任意两个节点对应的候选词语之间的语义相似度大于预设阈值时,该任意两个节点之间采用关联边进行连接;
语义贡献度计算单元,用于根据所述词语关联图,计算出每个候选词语在所述金融查询信息中的语义贡献度;
关键词提取单元,用于利用各个候选词语的语义贡献度,从所述候选词语列表中选取出符合预设条件的候选词语,以将选取出的候选词语作为关键词;
信息查询单元,用于将所述关键词作为查询标签,并基于所述查询标签进行金融信息查询,得到查询结果;
发送单元,用于通过所述车联网,将所述查询结果发送至所述车辆,以使所述车辆通过车载多媒体将所述查询结果进行可视化展示。
第三方面,提供了另一种基于车联网的金融信息查询装置,以装置为电子设备为例,包括依次通信相连的存储器、处理器和收发器,其中,所述存储器用于存储计算机程序,所述收发器用于收发消息,所述处理器用于读取所述计算机程序,执行如第一方面或第一方面中任意一种可能设计的所述基于车联网的金融信息查询方法。
第四方面,提供了一种存储介质,存储介质上存储有指令,当所述指令在计算机上运行时,执行如第一方面或第一方面中任意一种可能设计的所述基于车联网的金融信息查询方法。
第五方面,提供了一种包含指令的计算机程序产品,当指令在计算机上运行时,使计算机执行如第一方面或第一方面中任意一种可能设计的所述基于车联网的金融信息查询方法。
有益效果:
(1)本发明通过接收用户驾驶车辆过程中,利用车联网发送的金融查询信息,并提取出金融查询信息中的关键词作为查询标签,从而来基于查询标签进行金融信息的查询;最后,再将查询结果返回至车辆进行可视化展示;如此,使得用户在行车过程中,可根据需求,并利用车联网来获取到想要的金融资讯信息,实现了金融信息的自主多样化的查询,增加了金融信息的获取方式,丰富了车联网在商务、金融等方面的应用,提升了车主和乘客的用车体验。
附图说明
图1为本发明实施例提供的基于车联网的金融信息查询方法的步骤流程示意图;
图2为本发明实施例提供的基于车联网的金融信息查询装置的结构示意图;
图3为本发明实施例提供的电子设备的结构示意图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将结合附图和实施例或现有技术的描述对本发明作简单地介绍,显而易见地,下面关于附图结构的描述仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在此需要说明的是,对于这些实施例方式的说明用于帮助理解本发明,但并不构成对本发明的限定。
应当理解,尽管本文可能使用术语第一、第二等等来描述各种单元,但是这些单元不应当受到这些术语的限制。这些术语仅用于区分一个单元和另一个单元。例如可以将第一单元称作第二单元,并且类似地可以将第二单元称作第一单元,同时不脱离本发明的示例实施例的范围。
应当理解,对于本文中可能出现的术语“和/或”,其仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,单独存在B,同时存在A和B三种情况;对于本文中可能出现的术语“/和”,其是描述另一种关联对象关系,表示可以存在两种关系,例如,A/和B,可以表示:单独存在A,单独存在A和B两种情况;另外,对于本文中可能出现的字符“/”,一般表示前后关联对象是一种“或”关系。
实施例:
参见图1所示,本实施例所提供的基于车联网的金融信息查询方法,能够获取用户通过车辆的车联网发送的金融查询信息,并基于语义贡献度,来提取出最能够代表金融查询信息的关键词;而后,本发明则可利用关键词来进行金融信息的查询,从而得到用户需要的金融资讯信息;如此,本方法实现了金融信息的自主多样化的查询,增加了金融获取方式以及金融资讯的多样性,丰富了车联网在商务、金融等方面的应用;在具体应用时,举例本方法可以但不限于在车联网服务器侧运行,可以理解的,前述执行主体并不构成对本申请实施例的限定,相应的,本方法的运行步骤可以但不限于如下述步骤S1~S6所示。
S1. 获取车辆通过车联网发送的金融查询信息,并对所述金融查询信息进行分词处理,以在分词处理后,得到候选词语列表;在本实施例中,举例金融查询信息可以但不限于由用户通过车辆的多媒体(如车载车机)来输入金融查询信息,或用户通过车辆的多媒体的语音识别功能,来进行金融查询信息的语音输入;而车辆的多媒体在接收到语音信息后,则可进行语音转文字处理,从而得到金融查询信息;而后,车辆的多媒体则可通过车联网,将该金融查询信息发送至车联网服务器,以便车联网服务器基于该金融查询信息进行金融资讯的查询。
在本实施例中,举例车联网服务器在接收到车辆发送的金融查询信息后,会先对金融查询信息进行分词处理,从而来得到多个候选词语,以组成候选词语列表;其中,举例在进行分词时还可进行词性标注处理,以得到每个候选词语的词语词性;同时,还可记录每个候选词语在金融查询信息中的位置以及词语长度,以便后续作为关键词提取的参考因素;如此,即可使候选词语列表中的每个候选词语都关联有对应的词语长度、词语位置和词语词性;另外,举例可以但不限于采用前向最大匹配算法进行分词,以及使用基于NLP的词性标注技术来完成各个候选词语的词性标注;当然,前述分词算法以及词性标注技术都为常用技术,其原理不再赘述。
在得到候选词语列表后,则需要从候选词语列表中提取出最能够表征金融查询信息的词语,从而来作为关键词,以便后续基于关键词进行金融信息的查找;在本实施例中,举例在进行关键词提取前,还可去除候选词语列表中的停用词等干扰词语,从而提高后续关键词提取的准确性;可选的,本实施例是根据候选词语的语义相似度,来构建出词语关联图,然后,再基于词语关联图,计算出各个候选词语在金融查询信息中的语义贡献度;最后,则可基于语义贡献度,来进行关键词的提取;更进一步的,词语关联图的构建过程可以但不限于如下述步骤S2所示。
S2. 基于所述候选词语列表,构建出词语关联图,其中,所述词语关联图中包含有多个节点,每个节点代表所述候选词语列表中的一个候选词语,且当任意两个节点对应的候选词语之间的语义相似度大于预设阈值时,该任意两个节点之间采用关联边进行连接;在本实施例中,相当于是将每个候选词语都作为一个节点,然后,计算候选词语列表中两两候选词语的语义相似度,接着,即可基于语义相似度,来判断是否可连接两个候选词语,如此,经过前述设计,即可将语义相似度大于预设阈值的两个节点,来用关联边进行连接,从而形成词语关联图;可选的,举例预设阈值可以但不限于设置为0.66。
更进一步的,下述公开任意两个节点对应的候选词语之间的语义相似度的计算方法,可以但不限于如下述步骤S21~S23所示。
S21. 获取所述任意两个节点对应候选词语的词语编码,以得到至少一个第一编码和至少一个第二编码,其中,任一第一编码和任一第二编码的长度相同,且所述任一第一编码和所述任一第二编码中相同位置处的字符所属的词语分类类型相同;在具体应用时,可以但不限于通过《同义词词林》来确定出该任意两个节点对应候选词语的词语编码;其中,《同义词词林》中的每个词有若干个编码,每个编码长度为6,也就是由6个字符组成,其中,前5个字符表示的词语分类类型,依次为大类、中类、小类、词群和原子词群,而最后一个字符则为标志字符,主要通过不同的字符来表征不同的含义,且标志字符表征的含义包括同义、同类和独立词语(即词典中既没有同义词,也没有相关词)。
在得到任意两个节点对应候选词语的词语编码后,即可基于得到的词语编码,来计算二者的语义相似度,其中,计算过程如下述步骤 S22和步骤S23所示。
S22. 根据所述至少一个第一编码和所述至少一个第二编码,计算出所述任意两个节点对应候选词语之间的语义距离;在本实施例中,可以但不限于先计算出每个第一编码与各个第二编码之间的语义距离;然后,再从每个第一编码与各个第二编码之间的语义距离中,选取出最小的语义距离,来作为所述任意两个节点对应候选词语之间的语义距离。
可选的,举例可以但不限于采用如下公式(1),计算出所述至少一个第一编码中的每个第一编码,与所述至少一个第二编码中的各个第二编码之间的语义距离。
(1)
上述公式(1)中,表示所述至少一个第一编码中的第/>个第一编码,/>表示所述至少一个第二编码中的第/>个第二编码,/>表示/>与/>之间的语义距离,/>表示/>中的最后一位字符,/>表示/>中的最后一位字符,/>表示同类标志字符,/>表示/>中第/>个字符所属词语分类类型的权重,/>,/>表示/>的长度,/>表示初始语义距离,/>,/>表示第一编码的总数,/>表示第二编码的总数;如此,对于第/>个第一编码和第/>个第二编码,当二者编码相同,且最后一个编码不表示同类标志字符时,二者的语义距离则为0;当二者编码相同,且最后一个编码表示同类标志字符时,二者的语义距离则是各个字符所属词语分类类型的权重乘以初始语义距离,再求和;同理,当二者的编码在第k个字符开始不同时,则是第1个至第k-1个字符所属词语分类类型的权重乘以初始语义距离,再求和;当然,当k为1时,/>为0。
在本实施例中,为6,/>,且举例/>为10;当然,在本实施例中,由于前述就已说明,编码的最后一个字符为标志字符,因此,在公式(1)中,当/>和/>在第k个字符处开始不同时,二者的语义距离的计算,可不参考标志字符,也就是说,k的取值可以只到5(即只比较第一个至第五个字符)。
基于前述公式(1),计算出每个第一编码,与各个第二编码之间的语义距离后,则可从计算出的各个语义距离中,选取出最小的语义距离,来作为前述任意两个节点对应候选词语之间的语义距离;而后,则可进行该任意两个节点对应候选词语之间的语义相似度的计算;其中,计算过程可以但不限于如下述步骤S23所示。
S23. 基于所述任意两个节点对应候选词语之间的语义距离,计算出所述任意两个节点对应候选词语之间的语义相似度;在本实施例中,举例可以但不限于采用如下公式(2),计算出所述任意两个节点对应候选词语之间的语义相似度。
(2)
上述公式(2)中,表示所述任意两个节点对应候选词语之间的语义相似度,/>表示所述任意两个节点对应候选词语之间的语义距离,/>表示所述任意两个节点对应的两候选词语,/>表示语义参数;在本实施例中,举例语义参数可以但不限于取值为5,其作用是控制语义相似度的取值范围,且值越大,该语义相似度越不灵敏。
由此通过前述步骤S21~S23,即可计算出任意两个候选词语之间的语义相似度,而后,以前述相同原理,即可计算出候选词语列表中两两候选词语之间的语义相似度;接着,即可基于语义相似度,来进行各节点的连接,从而构建出词语关联图。
在构建出词语关联图后,则可基于该词语关联图,来计算出各个候选词语在金融查询信息中的语义贡献度;其中,计算过程如下述步骤S3所示。
S3. 根据所述词语关联图,计算出每个候选词语在所述金融查询信息中的语义贡献度;在具体实施时,可以但不限于通过词语关联图中各个节点对应候选词语相对于金融查询信息的关联度,来计算出各个候选词语的语义贡献度;可选的,其计算过程可以但不限于如下述步骤S31~S35所示。
S31. 基于所述词语关联图,计算出所述词语关联图中每个节点对应的候选词语,相对于所述金融查询信息的关联度;在本实施例中,可以但不限于采用如下公式(3),计算出所述词语关联图中每个节点对应的候选词语,相对于所述金融查询信息的关联度。
(3)
上述公式(3)中,表示所述词语关联图中第r个节点对应的候选词语,相对于所述金融查询信息的关联度,/>表示所述词语关联图中第m个节点至第n个节点之间的最短路径,/>表示路径函数,其中,当第m个节点至第n个节点之间的最短路径经过第r个节点时,/>,当第m个节点至第n个节点之间的最短路径未经过第r个节点时,,且/>,/>表示节点总数;在本实施例中,第m个节点至第n个节点之间的最短路径,则是指经过的关联边最少的路径。
如此,基于前述公式(3),即可计算出每个节点对应的候选词语,相对于所述金融查询信息的关联度;而后,则可基于各个节点的关联度,来进行节点划分,以得到每个节点所属关联度区间的关联密度;最后,则可基于各个区间的关联密度,来计算出各个节点对应候选词语的语义贡献度;其中,计算过程如下述步骤S32~S35所示。
S32. 利用各个节点对应候选词语相对于所述金融查询信息的关联度,组成关联度集合,并将所述关联度集合中的关联度划分为若干个初始区间;在本实施例中,相当于是将各个关联度划分为不同的区间,如存在5个节点,关联度分别为0.1、0.5、0.4、0.25、0.8,且划分为3个区间,如分为初始区间(0,0.1],初始区间(0.1,0.5],初始区间(0.5,0.8],那么,则是将前述5个节点分到三个区间内;当然,前述举例仅是示意,不限于此。
在完成关联度集合的初始区间划分后,则可进行每个初始区间关联密度的计算,其中,计算过程如下述步骤S33所示。
S33. 统计出每个初始区间包含的关联度的个数,并基于每个初始区间包含的关联度个数和所述词语关联图中的节点总数,计算出每个初始区间的关联密度;在本实施例中,由于每个初始区间的关联密度计算过程相同,下述以任一初始区间为例,来具体阐述;其中,对于任一初始区间,可以但不限于将所述任一初始区间包含的关联度个数与节点总数之间的比值,作为所述任一初始区间的关联密度;如在前述举例的基础上,对于区间(0,0.1],其所包含的关联度为1个,节点总数为5,那么区间(0,0.1]的关联密度则为1/5;当然,其余各个初始区间的关联密度的计算过程与前述举例相同,于此不再赘述。
在本实施例中,每个初始区间的关联密度,则代表着每个初始区间中各个节点对应候选词语的初始语义贡献度,即一个初始区间的关联密度越大,其所属的节点对应的候选词语的语义贡献度越大,越有可能为关键词;如此,本实施例则需要对区间进行寻优处理,从而来得到最优的寻优区间所对应关联密度;其中,寻优处理过程如下述步骤S34所示。
S34. 利用每个初始区间的关联密度,组成初始区间关联密度集合,并对所述初始区间关联密度集合进行寻优处理,以在寻优处理后,得到最优区间关联密度集合;在具体应用时,寻优处理过程可以但不限于如下述步骤S34a~S34e所示。
S34a. 初始化寻优次数t为1,并将所述初始区间关联密度集合作为第t次寻优时的区间关联密度集合。
S34b. 从第t次寻优时的区间关联密度集合中,选取出最大的关联密度,并判断最大的关联密度是否大于或等于关联密度阈值,或判断t是否大于最大寻优次数;在本实施例中,相当于是将初始区间关联密度集合,作为第一次寻优时的区间关联密度集合,然后从第一次寻优时的区间关联密度集合中,选取出最大的关联密度,来判断该最大的关联密度是否大于或等于关联密度阈值,或判断t是否大于最大寻优次数;若不满足前述任一条件,则进行迭代寻优,即将t自加1,然后重新进行关联度集合的区间划分,并重新计算划分的区间的关联密度;接着,则可组成第t次寻优时的关联密度集合,并返回至步骤S34b进行判断,如此,不断循环,直至满足前述任一条件时,即可结束寻优过程;可选的,迭代过程如下述步骤S34c~S34e所示。
S34e. 若否,将t自加1,并确定出第t次寻优时的区间划分数,其中,/>,且/>表示第t-1次寻优时的区间划分数,/>表示区间数增长数;在具体应用时,相当于在上一次的基础上,增加划分的区间数,如第一次寻优时,其区间数为5,那么第二次寻优时的区间划分数则为5c;同时,举例c可以但不限于2或5,关联密度阈值为0.8,最大寻优次数为6,当然,c、s、最大寻优次数以及关联密度阈值的取值可根据实际使用场景而具体设定,在此不限定于前述举例。
在得到第t次寻优时的区间划分数后,则可重新进行关联度集合的划分,如下述步骤S34d所示。
S34d. 基于第t次寻优时的区间划分数,将所述关联度集合中的关联度划分为个区间;在本实施例中,步骤S34d中的关联度集合的划分过程,与前述步骤S32相同,于此不再赘述;而在得到第t次寻优时的区间后,则可重新计算出每个区间的关联密度,然后利用计算出的关联密度组成第t次寻优时的区间关联密度集,而后,即可返回至步骤S34b,进行条件判断,其中,循环过程如下述步骤S34e所示。
S34e. 计算出每个区间的关联密度,以利用每个区间的关联密度组成第t次寻优时的区间关联密度集合,并重新从第t次寻优时的区间关联密度集合中,选取出最大的关联密度,直至最大的关联密度小于关联密度阈值,或t大于最大寻优次数时,得到所述最优区间关联密度集合;在具体实施时,第t次寻优时划分的区间的关联密度的计算过程,与初始区间的关联密度的计算过程相同,于此不再赘述。
同时,以一个实例来阐述前述寻优过程:
首先,将初始区间关联密度集合作为第一次寻优时的区间关联密度集合,然后判断第一次寻优时的区间关联密度集合中最大的关联密度,是否大于或等于关联密度阈值,或判断t是否大于6;若否,则基于第一次寻优时的区间划分数,计算出第二次寻优时的区间划分数;然后基于第二次寻优时的区间划分数,重新划分关联度集合,得到第二次寻优时的区间;接着,计算第二次寻优时的区间的关联密度,然后组成第二次寻优时的区间关联密度集合。
判断第二次寻优时的区间关联密度集合中最大的关联密度,是否大于或等于关联密度阈值,或判断t是否大于6(2<6),若否,则基于第二次寻优时的区间划分数,计算出第三次寻优时的区间划分数;然后基于第三次寻优时的区间划分数,重新划分关联度集合,得到第三次寻优时的区间;接着,计算第三次寻优时的区间的关联密度,并组成第三次寻优时的区间关联密度集合;而后,提取出最大的关联密度进行判断;如此,不断循环,若在第5次寻优时的区间关联密度集合中的最大关联密度,满足前述截止条件,那么,则将第5次寻优时的区间关联密度集合,作为最优区间关联密度集合;当然,前述循环过程仅是示意。
在得到最优区间关联密度集合后,即可确定出每个节点对应候选词语在所述金融查询信息中的语义贡献度;如下述步骤S35所示。
S35. 基于所述最优区间关联密度集合,确定出每个节点对应候选词语在所述金融查询信息中的语义贡献度;在本实施例中,假设最优区间密度集合对应的区间划分数为25,那么,对于最优区间关联密度集合中的任一最优区间,该任一最优区间内每个节点对应候选词语的语义贡献度,则为该任一最优区间的关联密度;由此,基于各个最优区间的关联密度,即可得到各自区间内每个节点的语义贡献度。
而在得到各个候选词语的语义贡献度后,则可进行关键词的提取,其中,关键词的提取过程可以但不限于如下述步骤S4所示。
S4. 利用各个候选词语的语义贡献度,从所述候选词语列表中选取出符合预设条件的候选词语,以将选取出的候选词语作为关键词;在本实施例中,是先利用各个候选词语的语义贡献度,来计算出每个候选词语的重要度,然后,基于重要度,来进行关键词的提取;其中,前述提取过程可以但不限于如下述步骤S41~S43所示。
S41. 计算出所述候选词语列表中各个候选词语的TF-IDF频率;在本实施例中,金融查询信息则作为文档,因此,可基于该文档来计算出每个候选词语的TF-IDF(词频-逆文档频率)值,同时,举例车联网服务器中还存储有若干文档语料库,用于在计算候选词语的逆向文档频率中使用;另外,TF-IDF频率是一种用于衡量一个词在文本中的重要性的技术,其为关键词提取过程中的常用技术,因此,TF-IDF频率计算过程在此不再赘述。
在得到每个候选词语的TF-IDF频率后,即可结合各个候选词语的语义贡献度,来计算出每个候选词语的重要度,其中,计算过程如下述步骤S42所示。
S42. 对于所述候选词语列表中的任一候选词语,依据所述任一候选词语的语义贡献度和TF-IDF频率,并按照如下公式(4),计算出所述任一候选词语的重要度。
(4)
上述公式(4)中,表示所述任一候选词语的重要度,/>表示语义贡献度权重,/>表示所述任一候选词语的语义贡献度,/>表示统计特征权重,/>表示位置x的权重,/>表示所述任一候选词语是否在位置x处出现,/>表示词语长度权重,/>表示所述任一候选词语的词语长度,/>表示词性权重,/>表示所述任一候选词语的词语词性,/>表示TF-IDF权重,/>表示所述任一候选词语的TF-IDF频率,其中,当所述任一候选词语在位置x处出现时,/>为1,当所述任一候选词语未在位置x处出现时,/>为0,且位置1和2,依次表示金融查询信息的段首和段尾。
在本实施例中,语义贡献度权重可以但不限于为0.6,统计特征权重为0.4,位置1的权重为0.5,位置2的权重0.3,词语长度权重为0.01,词性权重为0.5,TF-IDF权重为0.8;同时,不同词性对应的值不同,形容词为0.5,副形词为0.3,名形词为0.6,动词为0.3,当然,前述不同词性对应的值可预先预设,在此不一一列举。
由此通过前述公式(4),即可计算出该任一候选词语的重要度,而后,以相同原理,即可计算出其余各个候选词语的重要度。
在计算出每个候选词语的重要度后,则可根据重要度,来从各个候选词语中,选取出属于关键词的候选词语;其中,选取过程如下述步骤S43所示。
S43. 基于各个候选词语的重要度,从各个候选词语中,选取出重要度大于重要度阈值的候选词语,作为所述关键词;在本实施例中,重要度阈值可以但不限于为0.7;当然,可根据实际使用而具体设定,在此不限定于前述举例。
由此通过前述步骤S41~S43,即可从候选词语列表中,选取出最能够代表金融查询信息的关键词,而后,即可根据关键词,来进行金融信息的查询,其中,查询过程如下述步骤S5所示。
S5. 将所述关键词作为查询标签,并基于所述查询标签进行金融信息查询,得到查询结果;在本实施例中,举例车联网服务器中设置有金融标签数据库,因此,可通过计算查询标签与金融标签数据库中各个金融标签的相似度,来确定出与查询标签最匹配的金融标签;而后,则可将最匹配的金融标签对应的金融信息内容,作为查询结果;其中,前述查找过程可以但不限于如下述步骤S51~S56所示。
S51. 获取金融标签数据库,其中,所述金融标签数据库中存储有若干金融标签,且每个金融标签关联有金融信息内容;在具体实施时,金融标签数据库存储在车联网服务器中,且定期进行更新,同时,更新来源可以但不限于为各个金融网站、平台等等。
在得到金融标签数据库后,即可计算出查询标签与各个金融标签的相似度,以便后续基于相似度来进行金融内容的查找,其中,相似度计算过程如下述步骤S52~S55所示。
S52. 对于所述金融标签数据库中的第a个金融标签,计算出所述查询标签中每个关键词与第a个金融标签中各个标签关键词的重合度、文字匹配度以及共有文字匹配度;在本实施例中,以查询标签中的任一关键词,与第a个金融标签中的任一标签关键词为例,来具体阐述前述计算过程;其中,举例可以但不限于采用如下公式(5),来计算出任一关键词与任一标签关键词的重合度。
(5)
上述公式(5)中,表示任一关键词U,与任一标签关键词Q的重合度,/>表示任一关键词U,与任一标签关键词Q中相同字符的个数,表示任一关键词U,与任一标签关键词Q中不同字符的个数。
同时,举例可以但不限于采用如下公式(6),计算出任一关键词与任一标签关键词的文字匹配度。
(6)
上述公式(6)中,表示任一关键词U,与任一标签关键词Q的文字匹配度,表示匹配系数,/>表示表示任一关键词U中第/>个字符相对于任一标签关键词的隶属度,/>表示任一关键词U的总字符数,其中,若第/>个字符属于任一标签关键词Q,且第/>个字符不属于任一标签关键词Q时,/>等于/>;当第/>个字符属于任一标签关键词Q,且第个字符属于任一标签关键词Q时,/>等于1;当第/>个字符不属于任一标签关键词Q时,/>等于0;同时,/>的值可根据实际使用而预设,在此不作限定;在本实施例中,当/>为1时,只需判断其是否属于任一标签关键词,若是,则为1,反之则为0。
另外,举例任一关键词U,与任一标签关键词Q的共有文字匹配度,则采用如下方法计算得到:(1)筛选出任一关键词U,与任一标签关键词Q中的共有字符;(2)确定出共有字符中,在任一关键词U中最靠前的共有字符:(3)将最靠前的共有字符的字符位置,作为任一关键词U,与任一标签关键词Q的共有文字匹配度。
由此通过前述阐述,即可计算出每个关键词,与各个标签关键词的重合度、文字匹配度以及共有文字匹配度;而后,即可基于前述数据,来计算出每个关键词与各个标签关键词的相似度;其中,计算过程如下述步骤S53所示。
S53. 基于所述查询标签中每个关键词与第a个金融标签中各个标签关键词的重合度、文字匹配度以及共有文字匹配度,计算出每个关键词与各个标签关键词的相似度;在本实施例中,还是以任一关键词与任一标签关键词为例,来阐述二者的文字相似度。
在本实施例中,举例可以但不限于采用如下公式(7),计算出任一关键词与任一标签关键词的相似度。
(7)
上述公式(7)中,表示任一关键词与任一标签关键词的相似度,/>表示重合度权重,/>表示文字匹配度权重,/>表示共有文字匹配度权重,/>表示共有文字匹配度;另外,在本实施例中,还可将任一关键词的长度加入至公式(7)的分母中,也就是在原本公式(7)分母的基础上,再加上该任一关键词的长度以及长度权重的乘积。
由此通过前述公式(7),即可计算出每个关键词与各个标签关键词的相似度,最后,即可根据每个关键词与各个标签关键词的相似度,来得出第a个金融标签与所述查询标签的相似度,如下述步骤S54所示。
S54. 根据每个关键词与各个标签关键词的相似度,确定出所述第a个金融标签与所述查询标签的相似度;在本实施例中,可取相似度均值,来作为第a个金融标签与所述查询标签的相似度;而在得出第a个金融标签与所述查询标签的相似度后,以前述相同原理,即可计算出查询标签与其余各个金融标签的相似度,其中,循环过程如下述步骤S55所示。
S55. 将a自加1,并重新计算出所述查询标签中每个关键词与第a个金融标签中各个标签关键词的重合度、文字匹配度以及共有文字匹配度,直至a等于A时,得到所述查询标签与各个金融标签的相似度,其中,a的初始值为1,且A为金融标签的总数。
在基于前述步骤S51~S55,计算出查询标签与各个金融标签的相似度后,则可选取出相似度最大的金融标签,作为与查询标签最匹配的标签,而后,则可将其关联的金融信息内容,作为金融查询信息的查询结果;其中,查询过程如下述步骤S56所示。
S56. 将所述查询标签与各个金融标签的相似度中,最大的相似度对应的金融标签所关联的金融信息内容,作为所述查询结果。
由此通过前述步骤S51~S56,即可基于查询标签,来查询出与之最匹配的金融信息内容,而后,即可将该查找出的金融信息内容返回至车辆,以便用户查看;其中,查询结果反馈过程如下述步骤S6所示。
S6. 通过所述车联网,将所述查询结果发送至所述车辆,以使所述车辆通过车载多媒体将所述查询结果进行可视化展示;在本实施例中,查询结果可通过车载车机进行显示,也可通过车载车机进行语音播放,当然,展示形式不限定于前述举例,可根据实际使用场景而具体设定。
由此通过前述步骤S1~S6所详细描述的基于车联网的金融信息查询方法,本发明能够获取用户通过车辆的车联网发送的金融查询信息,并基于语义贡献度,来提取出最能够代表金融查询信息的关键词;而后,本发明则可利用关键词来进行金融信息的查询,从而得到用户需要的金融资讯信息;如此,本方法实现了金融信息的自主多样化的查询,增加了金融获取方式以及金融资讯的多样性,丰富了车联网在商务、金融等方面的应用。
如图2所示,本实施例第二方面提供了一种实现实施例第一方面中所述的基于车联网的金融信息查询方法的硬件装置,包括:
信息获取单元,用于获取车辆通过车联网发送的金融查询信息,并对所述金融查询信息进行分词处理,以在分词处理后,得到候选词语列表。
关联图构建单元,用于基于所述候选词语列表,构建出词语关联图,其中,所述词语关联图中包含有多个节点,每个节点代表候选词语列表中的一个候选词语,且当任意两个节点对应的候选词语之间的语义相似度大于预设阈值时,该任意两个节点之间采用关联边进行连接。
语义贡献度计算单元,用于根据所述词语关联图,计算出每个候选词语在所述金融查询信息中的语义贡献度。
关键词提取单元,用于利用各个候选词语的语义贡献度,从所述候选词语列表中选取出符合预设条件的候选词语,以将选取出的候选词语作为关键词。
信息查询单元,用于将所述关键词作为查询标签,并基于所述查询标签进行金融信息查询,得到查询结果。
发送单元,用于通过所述车联网,将所述查询结果发送至所述车辆,以使所述车辆通过车载多媒体将所述查询结果进行可视化展示。
本实施例提供的装置的工作过程、工作细节和技术效果,可以参见实施例第二方面,于此不再赘述。
如图3所示,本实施例第三方面提供了另一种基于车联网的金融信息查询装置,以装置为电子设备为例,包括:依次通信相连的存储器、处理器和收发器,其中,所述存储器用于存储计算机程序,所述收发器用于收发消息,所述处理器用于读取所述计算机程序,执行如实施例第一方面所述的基于车联网的金融信息查询方法。
具体举例的,所述存储器可以但不限于包括随机存取存储器(random accessmemory,RAM)、只读存储器(Read Only Memory ,ROM)、闪存(Flash Memory)、先进先出存储器(First Input First Output,FIFO)和/或先进后出存储器(First In Last Out,FILO)等等;具体地,处理器可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现,同时,处理器也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。
在一些实施例中,处理器可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制,例如,所述处理器可以不限于采用型号为STM32F105系列的微处理器、精简指令集计算机(reduced instruction setcomputer,RISC)微处理器、X86等架构处理器或集成嵌入式神经网络处理器(neural-network processing units,NPU)的处理器;所述收发器可以但不限于为无线保真(WIFI)无线收发器、蓝牙无线收发器、通用分组无线服务技术(General Packet Radio Service,GPRS)无线收发器、紫蜂协议(基于IEEE802.15.4标准的低功耗局域网协议,ZigBee)无线收发器、3G收发器、4G收发器和/或5G收发器等。此外,所述装置还可以但不限于包括有电源模块、显示屏和其它必要的部件。
本实施例提供的电子设备的工作过程、工作细节和技术效果,可以参见实施例第一方面,于此不再赘述。
本实施例第四方面提供了一种存储包含有实施例第一方面所述的基于车联网的金融信息查询方法的指令的存储介质,即所述存储介质上存储有指令,当所述指令在计算机上运行时,执行如实施例第一方面所述的基于车联网的金融信息查询方法。
其中,所述存储介质是指存储数据的载体,可以但不限于包括软盘、光盘、硬盘、闪存、优盘和/或记忆棒(Memory Stick)等,所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。
本实施例提供的存储介质的工作过程、工作细节和技术效果,可以参见实施例第一方面,于此不再赘述。
本实施例第五方面提供了一种包含指令的计算机程序产品,当所述指令在计算机上运行时,使所述计算机执行如实施例第一方面所述的基于车联网的金融信息查询方法,其中,所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于车联网的金融信息查询方法,其特征在于,包括:
获取车辆通过车联网发送的金融查询信息,并对所述金融查询信息进行分词处理,以在分词处理后,得到候选词语列表;
基于所述候选词语列表,构建出词语关联图,其中,所述词语关联图中包含有多个节点,每个节点代表所述候选词语列表中的一个候选词语,且当任意两个节点对应的候选词语之间的语义相似度大于预设阈值时,该任意两个节点之间采用关联边进行连接;
根据所述词语关联图,计算出每个候选词语在所述金融查询信息中的语义贡献度;
利用各个候选词语的语义贡献度,从所述候选词语列表中选取出符合预设条件的候选词语,以将选取出的候选词语作为关键词;
将所述关键词作为查询标签,并基于所述查询标签进行金融信息查询,得到查询结果;
通过所述车联网,将所述查询结果发送至所述车辆,以使所述车辆通过车载多媒体将所述查询结果进行可视化展示。
2.根据权利要求1所述的方法,其特征在于,任意两个节点对应的候选词语之间的语义相似度,采用如下方法计算得到;
获取所述任意两个节点对应候选词语的词语编码,以得到至少一个第一编码和至少一个第二编码,其中,任一第一编码和任一第二编码的长度相同,且所述任一第一编码和所述任一第二编码中相同位置处的字符所属的词语分类类型相同;
根据所述至少一个第一编码和所述至少一个第二编码,计算出所述任意两个节点对应候选词语之间的语义距离;
基于所述任意两个节点对应候选词语之间的语义距离,计算出所述任意两个节点对应候选词语之间的语义相似度。
3.根据权利要求2所述的方法,其特征在于,根据所述至少一个第一编码和所述至少一个第二编码,计算出所述任意两个节点对应候选词语之间的语义距离,包括:
采用如下公式(1),计算出所述至少一个第一编码中的每个第一编码,与所述至少一个第二编码中的各个第二编码之间的语义距离;
(1)
上述公式(1)中,表示所述至少一个第一编码中的第/>个第一编码,/>表示所述至少一个第二编码中的第/>个第二编码,/>表示/>与/>之间的语义距离,/>表示/>中的最后一位字符,/>表示/>中的最后一位字符,/>表示同类标志字符,/>,/>表示/>中第/>个字符所属词语分类类型的权重,/>,/>表示/>的长度,/>表示初始语义距离,/>,/>表示第一编码的总数,/>表示第二编码的总数;
从每个第一编码与各个第二编码之间的语义距离中,选取出最小的语义距离,作为所述任意两个节点对应候选词语之间的语义距离;
相应的,基于所述任意两个节点对应候选词语之间的语义距离,计算出所述任意两个节点对应候选词语之间的语义相似度,则包括:
基于所述任意两个节点对应候选词语之间的语义距离,并采用如下公式(2),计算出所述任意两个节点对应候选词语之间的语义相似度;
(2)
上述公式(2)中,表示所述任意两个节点对应候选词语之间的语义相似度,表示所述任意两个节点对应候选词语之间的语义距离,/>表示所述任意两个节点对应的两候选词语,/>表示语义参数。
4.根据权利要求1所述的方法,其特征在于,根据所述词语关联图,计算出每个候选词语在所述金融查询信息中的语义贡献度,包括:
基于所述词语关联图,计算出所述词语关联图中每个节点对应的候选词语,相对于所述金融查询信息的关联度;
利用各个节点对应候选词语相对于所述金融查询信息的关联度,组成关联度集合,并将所述关联度集合中的关联度划分为若干个初始区间;
统计出每个初始区间包含的关联度的个数,并基于每个初始区间包含的关联度个数和所述词语关联图中的节点总数,计算出每个初始区间的关联密度;
利用每个初始区间的关联密度,组成初始区间关联密度集合,并对所述初始区间关联密度集合进行寻优处理,以在寻优处理后,得到最优区间关联密度集合;
基于所述最优区间关联密度集合,确定出每个节点对应候选词语在所述金融查询信息中的语义贡献度。
5.根据权利要求4所述的方法,其特征在于,基于所述词语关联图,计算出所述词语关联图中每个节点对应的候选词语,相对于所述金融查询信息的关联度,包括:
采用如下公式(3),计算出所述词语关联图中每个节点对应的候选词语,相对于所述金融查询信息的关联度;
(3)
上述公式(3)中,表示所述词语关联图中第r个节点对应的候选词语,相对于所述金融查询信息的关联度,/>表示所述词语关联图中第m个节点至第n个节点之间的最短路径,/>表示路径函数,其中,当第m个节点至第n个节点之间的最短路径经过第r个节点时,/>,当第m个节点至第n个节点之间的最短路径未经过第r个节点时,,且/>,/>表示节点总数;
相应的,基于每个初始区间包含的关联度个数和所述词语关联图中的节点总数,计算出每个初始区间的关联密度,则包括:
对于任一初始区间,将所述任一初始区间包含的关联度个数与节点总数之间的比值,作为所述任一初始区间的关联密度。
6.根据权利要求4所述的方法,其特征在于,对所述初始区间关联密度集合进行寻优处理,以在寻优处理后,得到最优区间关联密度集合,包括:
初始化寻优次数t为1,并将所述初始区间关联密度集合作为第t次寻优时的区间关联密度集合;
从第t次寻优时的区间关联密度集合中,选取出最大的关联密度,并判断最大的关联密度是否大于或等于关联密度阈值,或判断t是否大于最大寻优次数;
若否,将t自加1,并确定出第t次寻优时的区间划分数,其中,/>,且/>表示第t-1次寻优时的区间划分数,/>表示区间数增长数;
基于第t次寻优时的区间划分数,将所述关联度集合中的关联度划分为/>个区间;
计算出每个区间的关联密度,以利用每个区间的关联密度组成第t次寻优时的区间关联密度集合,并重新从第t次寻优时的区间关联密度集合中,选取出最大的关联密度,直至最大的关联密度小于关联密度阈值,或t大于最大寻优次数时,得到所述最优区间关联密度集合。
7.根据权利要求1所述的方法,其特征在于,所述候选词语列表中的每个候选词语关联有对应的词语长度、词语位置和词语词性,其中,利用各个候选词语的语义贡献度,从所述候选词语列表中选取出符合预设条件的候选词语,包括:
计算出所述候选词语列表中各个候选词语的TF-IDF频率;
对于所述候选词语列表中的任一候选词语,依据所述任一候选词语的语义贡献度和TF-IDF频率,并按照如下公式(4),计算出所述任一候选词语的重要度;
(4)
上述公式(4)中,表示所述任一候选词语的重要度,/>表示语义贡献度权重,表示所述任一候选词语的语义贡献度,/>表示统计特征权重,/>表示位置x的权重,/>表示所述任一候选词语是否在位置x处出现,/>表示词语长度权重,/>表示所述任一候选词语的词语长度,/>表示词性权重,/>表示所述任一候选词语的词语词性,/>表示TF-IDF权重,/>表示所述任一候选词语的TF-IDF频率,其中,当所述任一候选词语在位置x处出现时,/>为1,当所述任一候选词语未在位置x处出现时,/>为0,且位置1和2,依次表示金融查询信息的段首和段尾;
基于各个候选词语的重要度,从各个候选词语中,选取出重要度大于重要度阈值的候选词语,作为所述关键词。
8.根据权利要求1所述的方法,其特征在于,将所述关键词作为查询标签,并基于所述查询标签进行金融信息查询,得到查询结果,包括:
获取金融标签数据库,其中,所述金融标签数据库中存储有若干金融标签,且每个金融标签关联有金融信息内容;
对于所述金融标签数据库中的第a个金融标签,计算出所述查询标签中每个关键词与第a个金融标签中各个标签关键词的重合度、文字匹配度以及共有文字匹配度;
基于所述查询标签中每个关键词与第a个金融标签中各个标签关键词的重合度、文字匹配度以及共有文字匹配度,计算出每个关键词与各个标签关键词的相似度;
根据每个关键词与各个标签关键词的相似度,确定出所述第a个金融标签与所述查询标签的相似度;
将a自加1,并重新计算出所述查询标签中每个关键词与第a个金融标签中各个标签关键词的重合度、文字匹配度以及共有文字匹配度,直至a等于A时,得到所述查询标签与各个金融标签的相似度,其中,a的初始值为1,且A为金融标签的总数;
将所述查询标签与各个金融标签的相似度中,最大的相似度对应的金融标签所关联的金融信息内容,作为所述查询结果。
9.一种基于车联网的金融信息查询装置,其特征在于,包括:
信息获取单元,用于获取车辆通过车联网发送的金融查询信息,并对所述金融查询信息进行分词处理,以在分词处理后,得到候选词语列表;
关联图构建单元,用于基于所述候选词语列表,构建出词语关联图,其中,所述词语关联图中包含有多个节点,每个节点代表候选词语列表中的一个候选词语,且当任意两个节点对应的候选词语之间的语义相似度大于预设阈值时,该任意两个节点之间采用关联边进行连接;
语义贡献度计算单元,用于根据所述词语关联图,计算出每个候选词语在所述金融查询信息中的语义贡献度;
关键词提取单元,用于利用各个候选词语的语义贡献度,从所述候选词语列表中选取出符合预设条件的候选词语,以将选取出的候选词语作为关键词;
信息查询单元,用于将所述关键词作为查询标签,并基于所述查询标签进行金融信息查询,得到查询结果;
发送单元,用于通过所述车联网,将所述查询结果发送至所述车辆,以使所述车辆通过车载多媒体将所述查询结果进行可视化展示。
10.一种存储介质,其特征在于,所述存储介质上存储有指令,当所述指令在计算机上运行时,执行如权利要求1~8任意一项所述的基于车联网的金融信息查询方法。
CN202311386976.2A 2023-10-25 2023-10-25 一种基于车联网的金融信息查询方法、装置及存储介质 Pending CN117112916A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311386976.2A CN117112916A (zh) 2023-10-25 2023-10-25 一种基于车联网的金融信息查询方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311386976.2A CN117112916A (zh) 2023-10-25 2023-10-25 一种基于车联网的金融信息查询方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN117112916A true CN117112916A (zh) 2023-11-24

Family

ID=88811465

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311386976.2A Pending CN117112916A (zh) 2023-10-25 2023-10-25 一种基于车联网的金融信息查询方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN117112916A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117727059A (zh) * 2024-02-18 2024-03-19 蓝色火焰科技成都有限公司 汽车金融***信息核验方法、装置、电子设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484368A (zh) * 2014-12-05 2015-04-01 深圳大学 一种基于MapReduce的大规模图数据关键词搜索算法
CN106610945A (zh) * 2016-08-12 2017-05-03 四川用联信息技术有限公司 一种改进的本体概念语义相似度计算方法
CN109145085A (zh) * 2018-07-18 2019-01-04 北京市农林科学院 语义相似度的计算方法及***
CN109977314A (zh) * 2019-03-28 2019-07-05 深圳市菲凡数据科技有限公司 基于车联网的金融信息查询方法、装置和存储介质
CN112256935A (zh) * 2020-10-26 2021-01-22 临沂大学 基于优化的复杂网络聚类方法
CN112818091A (zh) * 2019-11-15 2021-05-18 北京京东尚科信息技术有限公司 基于关键词提取的对象查询方法、装置、介质与设备
CN113987126A (zh) * 2021-07-08 2022-01-28 北京金山数字娱乐科技有限公司 基于知识图谱的检索方法及装置
CN114065758A (zh) * 2021-11-22 2022-02-18 杭州师范大学 一种基于超图随机游走的文档关键词抽取方法
CN114912449A (zh) * 2022-07-18 2022-08-16 山东大学 基于代码描述文本的技术特征关键词抽取方法与***

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484368A (zh) * 2014-12-05 2015-04-01 深圳大学 一种基于MapReduce的大规模图数据关键词搜索算法
CN106610945A (zh) * 2016-08-12 2017-05-03 四川用联信息技术有限公司 一种改进的本体概念语义相似度计算方法
CN109145085A (zh) * 2018-07-18 2019-01-04 北京市农林科学院 语义相似度的计算方法及***
CN109977314A (zh) * 2019-03-28 2019-07-05 深圳市菲凡数据科技有限公司 基于车联网的金融信息查询方法、装置和存储介质
CN112818091A (zh) * 2019-11-15 2021-05-18 北京京东尚科信息技术有限公司 基于关键词提取的对象查询方法、装置、介质与设备
CN112256935A (zh) * 2020-10-26 2021-01-22 临沂大学 基于优化的复杂网络聚类方法
CN113987126A (zh) * 2021-07-08 2022-01-28 北京金山数字娱乐科技有限公司 基于知识图谱的检索方法及装置
CN114065758A (zh) * 2021-11-22 2022-02-18 杭州师范大学 一种基于超图随机游走的文档关键词抽取方法
CN114912449A (zh) * 2022-07-18 2022-08-16 山东大学 基于代码描述文本的技术特征关键词抽取方法与***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王立霞 等: "基于语义的中文文本关键词提取算法", 《计算机工程》, vol. 38, no. 01, pages 1 - 4 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117727059A (zh) * 2024-02-18 2024-03-19 蓝色火焰科技成都有限公司 汽车金融***信息核验方法、装置、电子设备及存储介质
CN117727059B (zh) * 2024-02-18 2024-05-03 蓝色火焰科技成都有限公司 汽车金融***信息核验方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN110349568B (zh) 语音检索方法、装置、计算机设备及存储介质
US10997370B2 (en) Hybrid classifier for assigning natural language processing (NLP) inputs to domains in real-time
CN112766607B (zh) 出行路线的推荐方法、装置、电子设备及可读存储介质
CN114020862B (zh) 一种面向煤矿安全规程的检索式智能问答***及方法
CN112800170A (zh) 问题的匹配方法及装置、问题的回复方法及装置
CN110580335A (zh) 用户意图的确定方法及装置
EP1619620A1 (en) Adaptation of Exponential Models
CN110727862A (zh) 一种商品搜索的查询策略的生成方法及装置
CN117112916A (zh) 一种基于车联网的金融信息查询方法、装置及存储介质
CN113282711B (zh) 一种车联网文本匹配方法、装置、电子设备及存储介质
CN109948140B (zh) 一种词向量嵌入方法及装置
CN111813903B (zh) 一种问句匹配方法和计算设备
CN116186200B (zh) 模型训练方法、装置、电子设备和存储介质
CN111931516A (zh) 一种基于强化学习的文本情感分析方法及***
CN113806510B (zh) 一种法律条文检索方法、终端设备及计算机存储介质
CN112487813B (zh) 命名实体识别方法及***、电子设备及存储介质
CN111428487B (zh) 模型训练方法、歌词生成方法、装置、电子设备及介质
CN117076946A (zh) 一种短文本相似度确定方法、装置及终端
CN112182159A (zh) 一种基于语义表示的个性化检索式对话方法和***
US20230153522A1 (en) Image captioning
CN116090450A (zh) 一种文本处理方法及计算设备
CN114547308A (zh) 文本处理的方法、装置、电子设备及存储介质
CN112528646A (zh) 词向量生成方法、终端设备及计算机可读存储介质
CN110929513A (zh) 基于文本的标签体系构建方法及装置
CN111191004A (zh) 文本标签提取方法、装置及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination