CN110413886A - 一种兴趣点展示方法及装置 - Google Patents
一种兴趣点展示方法及装置 Download PDFInfo
- Publication number
- CN110413886A CN110413886A CN201910646303.3A CN201910646303A CN110413886A CN 110413886 A CN110413886 A CN 110413886A CN 201910646303 A CN201910646303 A CN 201910646303A CN 110413886 A CN110413886 A CN 110413886A
- Authority
- CN
- China
- Prior art keywords
- interest
- point
- noun
- distance
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种兴趣点展示方法及装置,包括:接收用户输入的搜索需求,并生成搜索需求文本信息,从所述搜索需求文本信息中,提取第一名词、第二名词及表征距离关系的关系词语,其中,在所述搜索需求文本信息的字符顺序中,第一名词靠前于第二名词;在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离,并搜索和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点,其中,所述第二兴趣点和第二名词相对应;输出所述第二兴趣点,所述第二兴趣点用于在用户交互界面进行展示。本发明通过分析兴趣点之间的关系从而支持模糊查询,实现了对现有导航软件及生活服务软件中检索需求信息的精度提升。
Description
技术领域
本发明涉及智能交通技术领域,尤其涉及一种兴趣点展示方法及装置。
背景技术
智能出行服务类应用一般根据用户提供的查询信息,通过在现存的电子地图上执行基于地图的路径计算为终端用户提供地理位置信息查询服务,通过集成的其他服务接口为终端用户提供指定地点附近的指定POI(Point of Interest,兴趣点)信息查询。
目前主流的智能出行服务类应用通过将用户提供的查询信息作为关键字进行地理位置信息的查询,但此种查询方式要求用户提供较为精确的查询信息,无法实现模糊地点查询、模糊问题查询、多目的地路径规划、模糊地点路径规划等一系列需要对自然语言隐含的交通推理关系进行分析的查询方式。
申请人发现,目前一些常用的导航软件多是依赖关键词检索的。即现有技术中的导航软件包括不同的图层(例如公交图层,建筑地理信息图层,然后不同图层中分别对应不同的对应关系表,对应关系表中包含兴趣点与若干个关键词之间存在对应关系,不同层之间的交叉显示只是显示图层的叠加,对应关系表之间无法进行交互查询),每一个兴趣点与若干个关键词之间存在对应关系,如果通过一个兴趣点查询另一个兴趣点,只能将一个兴趣点填充在另一个兴趣点对应的关键词中。这种方式对用户输入的语句要求高,语言泛化能力低,主要有以下原因:
自然语言中的词语会对关键词的选取产生干扰;自然语言词汇太多,即用户输入完整的话,或者很多词,会导致直接无法查询结果;提取的关键词是实体的关键词,推理关系无法被提取,使得查询结果答非所问。比如“南京路上的肯德基”,软件是查询肯德基店名,而无法理解“南京路上”的意义。
因此,目前缺乏一种能够对用户提出的自然语言查询信息中隐含的交通推理关系进行分析以提升信息查询操作精度的兴趣点查询方案。
发明内容
本发明提供了一种兴趣点查询方法及装置,支持模糊查询,基于知识图谱确定兴趣点之间的关系,实现了对现有导航软件及生活服务软件中检索需求信息的精度提升。
第一方面,本发明提供一种兴趣点展示方法,包括:
接收用户输入的搜索需求,并生成搜索需求文本信息,从所述搜索需求文本信息中,提取第一名词、第二名词及表征距离关系的关系词语,其中,在所述搜索需求文本信息的字符顺序中,所述第一名词靠前于第二名词;
在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离,并搜索和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点,其中,所述第二兴趣点和第二名词相对应;
输出所述第二兴趣点,所述第二兴趣点用于在用户交互界面进行展示。
第二方面,本发明提供一种兴趣点展示装置,包括处理器以及存储器,其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行如下步骤:
接收用户输入的搜索需求,并生成搜索需求文本信息,从所述搜索需求文本信息中,提取第一名词、第二名词及表征距离关系的关系词语,其中,在所述搜索需求文本信息的字符顺序中,所述第一名词靠前于第二名词;
在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离,并搜索和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点,其中,所述第二兴趣点和第二名词相对应;
输出所述第二兴趣点,所述第二兴趣点用于在用户交互界面进行展示。
第三方面,本发明提供一种兴趣点展示装置,包括:
词性分析单元,用于接收用户输入的搜索需求,并生成搜索需求文本信息,从所述搜索需求文本信息中,提取第一名词、第二名词及表征距离关系的关系词语,其中,在所述搜索需求文本信息的字符顺序中,所述第一名词靠前于第二名词;
搜索引擎单元,用于在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离,并搜索和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点,其中,所述第二兴趣点和第二名词相对应;
输出单元,用于输出所述第二兴趣点,所述第二兴趣点用于在用户交互界面进行展示。
第四方面,本发明提供一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一方面所述方法的步骤。
本发明提供的一种兴趣点展示方法及装置,具有以下有益效果:
通过对搜索需求文本信息的分析确定不同兴趣点之间的关系,从而支持模糊查询,基于知识图谱基于利用上述关系词语确定对应的检索距离,从而实现以第一兴趣点为起点以检索距离确定范围内检索第二兴趣点,实现了对现有导航软件及生活服务软件中检索需求信息的精度提升。
附图说明
图1为本发明实施例提供的兴趣点展示方法流程图;
图2为本发明实施例提供的兴趣点展示方法详细流程图;
图3a为本发明实施例提供的句式“离海信大厦最近的地铁”第一步查询流意图;
图3b为本发明实施例提供的句式“离海信大厦最近的地铁”第二步查询流意图;
图4为本发明实施例提供的句式“李沧商圈日料风味的店有哪些”查询流意图;
图5为本发明实施例提供的句式“宁夏路上的药店有哪些”查询流程示意图;
图6为本实施例通过地图标识输出“宁夏路上的药店有哪些”查询结果示意图;
图7为本发明实施例提供的句式“宁夏路与南京路路口附近的肯德基”查询流程示意图;
图8a为本实施例通过地图标识输出“宁夏路与南京路路口附近五百米的肯德基”查询结果示意图;
图8b为本实施例通过地图标识输出“宁夏路与南京路路口附近一公里的肯德基”查询结果示意图;
图9为本发明实施例提供的句式“骑行到海信新研发中心附近的饭店”查询流程示意图;
图10a为本发明实施例提供的句式“26路车会经过五四广场吗”查询流程示意图;
图10b为本发明实施例提供的句式“26路公交车在哪换乘226路车”查询流程示意图;
图11为本实施例通过地图标识输出“26路公交车在哪换乘226路车”查询结果示意图;
图12为本发明实施例交通知识图谱全图和交通知识图谱子图在涵盖关系上的示意图;
图13为本发明实施例提供的一种兴趣点展示装置结构示意图;
图14为本发明实施例提供的另一种兴趣点展示装置结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
知识图谱(Knowledge Graph)以结构化的形式描述客观世界中概念、实体及其关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。知识图谱中可以根据实体的特性进行实体间关系的推理。
知识图谱分为通用知识图谱与领域知识图谱两类,以交通指示图谱为例交通知识图谱属于领域知识图谱,是基于对路网、公交地铁线路网、兴趣点POI网三大类信息融合的图谱,即知识图谱中包含了路网、公交地铁线路网、兴趣点POI网三大类信息。在知识图谱中可以对不同的特征之间的逻辑关系进行逻辑运算。在地理信息***中,一个POI可以是一栋房子、一个商铺、一个邮筒、一个公交站等。
本发明实施例基于交通知识图谱,提供一种兴趣点展示方法,如图1所示,包括:
步骤101,接收用户输入的搜索需求,并生成搜索需求文本信息,从所述搜索需求文本信息中,提取第一名词、第二名词及表征距离关系的关系词语,其中,在所述搜索需求文本信息的字符顺序中,所述第一名词靠前于第二名词;
接收用户输入的搜索需求,可以直接接收用户输入的搜索需求文本信息,或者接收用户输入的语音信息,并将语音信号转换为搜索需求文本信息。
NLP是人工智能的一个子领域,是一门让计算机理解、分析以及生成自然语言的学科,目前具有分词、词编码、自动文摘和实体识别等功能,基于NLP可以理解自然语言,从而可以在用户输入自然语言的文本信息时,基于自然语言的文本信息推理出用户需求。
对搜索需求文本信息进行自然语言处理NLP推理用户需求时,可以采用基于规则来理解自然语言,即通过制定一些系列的规则来设计一个程序,然后通过这个程序来解决自然语言问题;或者也可以基于统计机器学习来理解自然语言,即用大量的数据通过机器学习算法来训练一个模型,然后通过这个模型来解决自然语言问题。
作为一种可选的实施方式,利用自然语言处理NLP方式从搜索需求文本信息中提取短语,对提取的短语进行分词,分词后删除停用词;
对删除停用词后的分词进行词性分析,选取名词及关系词语;
将生成时间较早的名词作为第一名词,将生成时间较晚的名词作为第二名词。
步骤102,在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离,并搜索和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点,其中,所述第二兴趣点和第二名词相对应。
上述关系词语可以为包含数字的距离词汇,例如“五百米内”或“一公里内”,也可以为不包含数值的模糊距离词汇,例如“附近”、“最近”等。
在所述关系词语为不包含数值的模糊距离词汇时,所述检索距离包括一组以预设步长变化的第一距离值和第二距离值,其中,所述第一距离值小于所述第二距离值;所述检索距离还可以包括比第一距离值更大的更多距离值。
所述在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离,并搜索和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点,包括:
在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的第一距离值,判断是否存在和第一兴趣点之间的距离不大于所述第一距离值的第二兴趣点,若是则输出所述第二兴趣点,若否,则判断是否存在和第一兴趣点之间的距离不大于所述第二距离值的第二兴趣点。
步骤103,输出所述第二兴趣点,所述第二兴趣点用于在用户交互界面进行展示。
本发明实施例提供的兴趣点展示方法及装置,基于兴趣点之间的关系词语确定检索距离,从而支持模糊查询,实现了对现有导航软件及生活服务软件中检索需求信息的精度提升。
为了能成功从搜索需求文本信息中提取第一名词及第二名词,接收到用户输入的搜索需求,并生成第一文本信息;确定所述第一文本信息中是否包含隐含名词信息;若是,则补充所述隐含名词信息并生成搜索需求文本信息。其中一种可能的情况为第一文本信息中缺少主语,则将自身补充为主语,以被提取为第一名词等。自身是指可以表征用户当前地理位置的名词。
本实施例中可以预先建立包含关系词语的句式模板及预先根据交通知识图谱中的兴趣点建立对应的词库。作为一种可选的实施方式,本实施例预先根据需求类型设计每个需求类型中常用的句式模板,在接收到用户输入的搜索文本需求信息时,通过短文本分类算法判断所述搜索需求文本信息所属的需求类型;根据提取的关系词语调用该需求类型下相匹配的句式模板,并从所述搜索需求文本信息中提取第一名词和第二名词;对提取的第一名词和第二名词与上述词库进行对比后,确定第一名词对应的第一兴趣点及第二名词对应的第二兴趣点。
针对每个需求类型可以设计大量的常用句式模板,从而满足该需求类型具体不同的需求,支持不同功能的需求,在进行短文本分类算法对短文本进行分类后,根据分类后句式间短文本的中的关系词语,可以检索到与当前用户需求相匹配的句式模板。
用户输入的搜索需求可以包含以下一种或几种:
地理位置推理搜索,即搜索需求中包含名词和表征关系的距离词。
常见的提问方式举例如下:“离我最近的便利店”,“离海信大厦最近的地铁”,“哪里有卖面包的”等,从而可以针对不同的提问方式设计对应的句式模板。
目的地推理的路径规划:
常见的提问方式举例如下:“骑行到海信新研发中心附近的饭店”。
在一些实施例中,在从搜索需求文本信息中提取第一名词、第二名词及表征距离关系的关系词语后,根据关系词语确定调用的句式模板,在知识图谱数据中根据上述词库确定对应第一名词的第一兴趣点,确定对应第二名词的第二兴趣点,确定关系词语对应的检索距离,该关系词语可以为包含数值的距离词汇,也可以为不包含数值的模糊距离词汇。
在根据第一名词/第二名词确定知识图谱中对应的第一兴趣点和第二兴趣点时,可以将第一名词/第二名词与上述词库进行对比,输出上述词库中对应的第一兴趣点和第二兴趣点。
进一步地,选取上述第一名词/第二名词后,还可以对上述第一名词/第二名词进行进一步分类,若选取的第一名词/第二名词的词性分析结果为类别词,则对应的第一兴趣点/第二兴趣点为词库中该类别的实体;若选取的名词部分的词性分析结果为专有名词,则对应的第一兴趣点和第二兴趣点为词库中该专有名词的实体。
具体地,可以针对不同的句式模板,在按照检索距离进行第二兴趣点检索时,根据句式模板中的关系词语定义与该句式模板所对应的检索方式,从而确定相匹配的句式模板后,调用该句式模板所对应的检索方式,基于交通知识图谱查询满足所述用户需求的结果并输出。
本实施例中,针对不同的句式模板,所定义不同检索方式中可以但不限于包括如下检索方式:
方式一
在知识图谱数据中确定对应第一名词的第一兴趣点A,确定关系词语对应的检索距离;
确定和第一兴趣点之间的距离不大于所述检索距离的所有兴趣点;
在所述所有兴趣点中筛选出和第二名词相对应的第二兴趣点B。
上述第一兴趣点为检索起点POI,第二兴趣点为检索目标POI,确定和第一兴趣点之间的距离不大于所述检索距离的所有兴趣点,可以以检索起点POI为圆心,圈出检索距离范围内的所有兴趣点,从所有兴趣点中查找检索目标POI。
例如“宁夏路与南京路路口附近五百米的肯德基”,第一兴趣点为“宁夏路与南京路路口”,对应的检索距离为五百米,则搜索以第一兴趣点为圆心,五百米范围内的所有兴趣点,从所有兴趣点中筛选出第二兴趣点“肯德基”。
方式二
在知识图谱数据中确定对应第一名词的第一兴趣点A,确定关系词语对应的检索距离,确定第二名词对应的所有候选兴趣点;
分别确定所述所有候选兴趣点和所述第一兴趣点之间的的距离;
将所述距离不大于所述检索距离的候选兴趣点作为和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点B。
例如“宁夏路与南京路路口附近五百米的肯德基”,第一兴趣点为“宁夏路与南京路路口”,对应的检索距离为五百米,则搜索当前地图范围上所有的“肯德基”,然后根据各肯德基与第一兴趣点的距离,筛选出与第一兴趣点在五百米范围内的肯德基。
如图2所示为本发明实施例提供的兴趣点展示方法详细流程图,该方法的执行设备中从软件模块上可以划分为客户端前端,客户端后端、客户端前端和客户端后端交互模块,客户端前端和客户端后端通过http协议的接口进行通信,主要包括:
步骤201,通过客户端的前端接收用户输入的搜索需求,并生成搜索需求文本信息;
步骤202,通过短文本分类算法判断所述搜索需求文本信息所属的需求类型后,从所述搜索需求文本信息中提取短语,所提取的短语包括第一名词、第二名词和关系词语,依据关系词语调用对应句式模板,通过客户端前端和后端交互模块传入客户端后端;
步骤203,客户端后端根据词库确定第一名词对应的第一兴趣点,第二名词对应的第二兴趣点,将第一兴趣点和第二兴趣点重新与该句式模板组合,从而确定需要查询的目标;
步骤204,根据关系词语确定检索距离,调用与句式模板对应的检索方式。
步骤205,按照对应的检索方式,搜索和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点;
步骤206,对查询的结果进行自然语言封装,将封装后的结果通过前后端交互模块返回到客户端前端;
步骤207,客户端前端通过应用界面反馈用户查询结果。
在应用界面上显示结果时,可以仅显示文字的结果,或者将文字的结果转换为语音输出,或者将文字的结果结合导航软件通过导航软件使用的地图显示。
下面结合具体的示例,给出采用本发明实施例提供的智能出行服务引擎方法如何满足不同需求类型的用户需求的具体实施方式。
在一些实施例中,在接收用户输入的搜索需求,并生成搜索需求文本信息,根据搜索需求文本信息和预设模型确定用户输入的搜索需求为地理位置推理搜索的需求类型时,根据关系词语调用该需求类型下相匹配的句式模板,从所述搜索需求文本信息中提取短语依据相匹配的句式模板指定的规则传入客户端后端进行推理及检索查询。
针对地理位置推理搜索的需求类型,可以根据常用的提问方式设计对应的句式模板,从而在接收到用户的搜索文本需求信息时,确定是否属于地理位置推理搜索的需求类型,并根据关系词语调用该类型相匹配的句式模板推理用户需求。
常见的提问方式举例如下:“离我最近的便利店”,“离海信大厦最近的地铁”,“哪里有卖面包的”等。从而可以针对不同的提问方式设计对应的句式模板“离*1最近的*2”、“哪里有*”,这些句式模板中对应的关系词语为不包含数值的模糊距离,分别“最近的”,上述*、*1、*2分别代表兴趣点。
以功能句式“哪里有卖面包的”的技术实现为例,查询到匹配的句式模板为“哪里有*”,则名词“卖面包的”这一短语被提取到后端,并补充第一名词“我”,生成搜索需求文本,并确定第一兴趣点为自身位置,后端对*这一元组进行分词、去停用词和词性分析,选取名词部分,并经过词库对过滤后的结果进行比对,得到第二兴趣点“面包店”。
以第一兴趣点为圆心进行范围查找,以一定步长逐步扩大搜索半径直至发现所检索的第二兴趣点(面包店)名称为止。
相较于现有的出行服务软件,本发明实施例提供的兴趣点展示方法可以提供更多带有限定条件的地理位置推理搜索服务,如限定区域查询、限定路段查询、限定路口查询。
限定区域示例1
具体可以支持基于经纬度的附近范围限定,以功能句式“海信大厦附近的公交站”的技术实现为例,通过短文本分类算法判定需求类型,并提取第一名词“海信大厦”和第二名词“公交站”,根据关系词语“附近的”查询到匹配的句式模板为“*1附近的*2”,将提取“海信大厦”和“公交站”加入到句式模板并传入到后端,以“海信大厦”的位置为圆心进行范围查找,以一定步长确定检索范围内的所有公交站,逐步扩大搜索半径直至发现所检索的公交站。
以功能句式“离海信大厦最近的地铁”的技术实现为例,通过短文本分类算法判定需求,并提取第一名词“海信大厦”和第二名词“地铁”,根据关系词语“最近的”查询到匹配的句式模板为“离*1最近的*2”,将提取的“海信大厦”和“地铁”传入到后端,后端调用与该句式模板对应的检索方式进行搜索查询,具体过程如下:
在知识图谱中先检索名称为“海信大厦”的第一兴趣点,获取该第一兴趣点的经纬度。
如图3a所示,基于知识图谱查询伪代码:实体.filter(“名称”,“海信大厦”),获取查询到的POI的经纬度信息,如‘36.00001,120.002’。
再以*1-海信大厦为圆心,检索其附近的POI,且限定其类型为“地铁”。
如图3b所示,基于知识图谱查询伪代码:实体.filter(“坐标”,范围(‘36.00001’,‘120.002’,‘1公里’)).filter(“类别”,“地铁”)。
具体可以以A为圆心进行范围查找,以一定步长逐步扩大搜索半径直至发现所检索的B为止。
限定区域示例2
具体可以支持基于商圈/行政区域的属性限定,以功能句式“李沧商圈日料风味的店有哪些”的技术实现为例,通过短文本分类算法判定需求类型,提取第一名词“李沧商圈”和第二名词“日料风味的店”,其距离关系词为隐含的关系词语“内”。查询到匹配的句式模板为“*1内*2”,将提取的“李沧商圈”和“日料风味的店”传入到后端,后端调用与该句式模板对应的检索方式进行搜索查询,具体过程如下:
对第一兴趣点“李沧商圈”所包含的/相连(即检索距离内的)的POI实体进行检索,查找出风味类型为日本料理的POI店,并反馈出该实体的坐标。
如图4所示,基于知识图谱查询伪代码:实体.filter(“区域”,“李沧商圈”).out(区域to建筑).filter(“风味类型”,“日本料理”)
其中out指实体间的连接关系,如图示箭头发出自实体的边对其来说是out,进入实体的边对其来说是in。
限定区域示例3
具体可以支持基于路、路口及范围的限定,以功能句式“宁夏路上的药店有哪些”的技术实现为例,通过短文本分类算法判定需求类型,提取第一名词“宁夏路”和第二名词“药店”,其表征距离关系的关系词语为“上”,“上”是一个模糊距离词,查询到匹配的句式模板为“*1上的*2”,将提取“宁夏路”和“药店”传入到后端,后端调用与该句式模板对应的检索方式进行搜索查询,具体过程如下:
后端根据提取“南京路”与“药店”,在知识图谱中搜索“南京路”这一实体,并找到与该实体检索距离内的相连的POI,选取类型为药店的实体,返回其相关属性给用户。
如图5所示,基于知识图谱查询伪代码:实体.filter(“路名”,“宁夏路”).out(“路to建筑).filter(“类别”,“药店”)。
查询得到对应的结果后可以通过导航软件地图,以地图标注的形式进行显示,如图6所示,在地图上标注查询到的宁夏路上各个药店的具***置。
以功能句式“宁夏路与南京路路口附近的肯德基”的技术实现为例,通过短文本分类算法判定需求类型,提取第一名词“宁夏路与南京路路口”和第二名词“肯德基”,距离关系词“附近的”,查询到匹配的句式模板为“*1附近的*2”,将提取“宁夏路与南京路路口”和“肯德基”传入到后端,后端调用与该句式模板对应的检索方式进行搜索查询,具体过程如下:
通过路名查找宁夏路这一实体,找到与该实体相连的路口(即宁夏路的所有路口),找到这些路口中同南京路相连的路口,并由该路口的经纬度为圆心根据距离关系词确定的检索距离进行范围查询,查找其附近名称属性中包含有“肯德基”字段的实体。
如图7所示,基于知识图谱查询伪代码:实体.filter(“路名”,“南京路”).out(“路to路口”).in(“路to路口”)..filter(“路名”,“宁夏路”).out(“路to路口”)获取其经纬度信息,如36.00001,120.002。
再进行第二次查询,实体.filter(“坐标”,范围(‘36.00001,120.002’,‘1公里’)).filter(“类别”,“饭店”)。
上述1公里是默认设置的一个范围,在设计句式模板时,还进一步限定搜索的范围,如功能句式“宁夏路与南京路路口附近五百米的肯德基”或者“宁夏路与南京路路口附近一公里的肯德基”,则在进行第二次查询直接使用句式中限定范围。如图8a为利用功能句式“宁夏路与南京路路口附近五百米的肯德基”对应的界面输出结果,如图8b为利用功能句式“宁夏路与南京路路口附近一公里的肯德基”对应的界面输出结果。
在一些实施例中,在接收用户输入的搜索需求,并生成搜索需求文本信息,根据搜索需求文本信息和预设模型确定用户输入的搜索需求为地理位置推理搜索的需求类型时,从搜索需求文本信息中提取第一名词、第二名词及关系词语,根据关系词语调用该需求类型下相匹配的句式模板<template>,将相匹配的句式模板指定的规则传入客户端后端进行推理及检索查询。
以功能句式“怎样坐公交车游览海大、五四广场、石老人海水浴场”的技术实现为例,接收用户输入的搜索需求,并生成第一文本信息“怎样坐公交车游览海大、五四广场、石老人海水浴场”;确定所述第一文本信息中包含隐含名词信息,即通过判定缺少主语判定包含隐含名词;补充所述隐含名词信息并生成搜索需求文本信息,确定匹配的句式模板为“我1*游览2*”,相匹配的句式模板传入客户端后端,后端通过分析确定第一兴趣点为自身位置,第二兴趣点为第二个*的内容推理出实体中国海洋大学,五四广场、石老人海水浴场多个目的地,根据第一个*的内容推理出交通工具为公交车,根据关系词语“游览”确定检索距离为包括一组以预设步长变化的距离值,在知识图谱数据中确定对应第一名词的第一兴趣点,不断变化步长判确定是否检索到所有的第二兴趣点。
从示例中可以看到本实施例不但支持“海大”这种具有地方特色的缩略词,且得益于上述的自然语言处理过程,能够有效强化人机交互的语义泛化与文本理解能力。以关键词检索为手段的软件,一不能理解“怎样坐公交游览”,二不能识别语音输入的“海大五四广场石老人海水浴场”。但基于知识图谱的后端,在分词后可以获得三个地名,并且每个地名均在知识图谱库中有相应的实体,则算法会认为这三个地点均是用户的查询需求。
后端的出行服务引擎的算法会将三个地点依次进行路径规划并串联起来,给出具体路径规划方案,从而满足出行需求。
在一些实施例中,在接收用户输入的搜索需求,并生成搜索需求文本信息,根据搜索需求文本信息和预设模型确定用户输入的搜索需求为目的地推理的路径规划的需求类型时,从搜索需求文本信息中提取第一名词、第二名词及关系词语,根据关系词语调用该需求类型下相匹配的句式模板<template>,调用相匹配的句式模板传入客户端后端进行推理及检索查询。
以功能句式“骑行到海信新研发中心附近的饭店”为例,所匹配的句式模板为“*到*附近的*”,经句式模板提取短语后,提取第一名词“海信新研发中心”,第二名词“饭店”,关系词语为“附近的”。因此,对于这种具有隐含推理关系的提问,引擎会先通过知识图谱获取“海信新研发中心”这一实体的经纬度作为检索起点A,再根据此经纬度为圆心搜索其附近类型为饭店的实体。对最后获得的实体选择其一(如依据排序算法、推荐算法选取某一权重高的)进行路径规划。具体过程如下:
先通过出行服务引擎NLP过程提取“海信新研发中心”,通过知识图谱检索该实体的坐标属性(经纬度)。
在获得海信新研发经纬度后,其附近的饭店推理查询方式如图9所示:
知识图谱查询伪代码:实体.filter(“坐标”,范围(‘36.00001,120.002’,‘0.5公里’)).filter(“类别”,“饭店”);
通过上述过程获得其附近的饭店,并依据“骑行”这一出行方式,以自身坐标为起点进行路径规划。
在一些搜索需求中还可能包括公共交通出行模糊推理;
常见的提问方式举例如下:“26路车会经过五四广场吗”,“3号线在哪儿换乘202路”。从而支持POI和公交/地铁线路的关系查询及公交/地铁线路间的换乘关系。
在一些实施例中,针对公共交通出行模糊推理,搜索需求文本信息中包括公共交通工具的第一名词/第二名词时,根据第一名词/第二名词确定的第一兴趣点/第二兴趣点为各站点的地理位置。从而支持描述公共交通站点、公共交通线路与兴趣点POI间关系的推理查询,或者支持不同公共交通工具的混合交叉线路换乘的推理查询。
如可查询公交的首末班次时间、站点位置等信息,更能查询关于公交地铁的模糊问题。常用的提问句式如“26路车会经过五四广场吗”,“3号线在哪儿换乘202路”,实际上26路车经过五四广场,虽然其没有“五四广场站”,但是有距离目标地点很近的“市政府站”,3号线的例子也是同理,该问句通过提取“3号线”和“202路”两类公交线路实体。前者为地铁线路,后者为公交线路。通过在知识图谱中获取3号线地铁与202路公交线路的站点信息,进行地理位置推理,查找同名、同地点或相邻地点的两线路换乘站点。
因此本实施例公共交通出行模糊推理中,支持描述公共交通站点、公共交通线路与兴趣点POI间关系的推理查询,或者支持不同公共交通工具的混合交叉线路换乘的推理查询。
上述两类推理查询的句式模板对应的检索方式中,以第一兴趣点A为起点,确定和第一兴趣点A之间的距离不大于所述检索距离的第二兴趣点B,A为公共交通工具的各站点的地理位置,B为兴趣点POI的实体或另一公共交通工具的各站点信息。
下面结合具体的示例对兴趣点展示方法进行说明。
在应用界面上,当用户输入“26路车会经过五四广场吗”,查询效果为“路过五四广场,请在市政府下车”。其具体的查询过程如下:
经NLP过程调用的句式模板提取出第一名词“26路车”和第二名词“五四广场”并传入后端。后端通过知识图谱检索“26路”这一“公交车”类型实体,获取该实体相连/所含的全部站点实体/信息。从中选取各个站点的经纬度信息作为第一兴趣点,以五四广场为第二兴趣点,根据关系词语“经过”确定检索方式,以其为圆心进行范围搜索,若站点范围内包含有第二兴趣点,则反馈给用户经过目标地点,且在这一站下车的信息。如图10a所示,具体过程如下:
知识图谱查询伪代码:实体.filter(“线路名”,“26路”).filter(“交通类型”,“公交车”),获取该线路公交车的全部站点1~n的坐标;
再进行第二组查询,实体.filter(“坐标”,范围(‘站点1坐标’,‘1公里’)).filter(“名称”,“五四广场”)……实体.filter(“坐标”,范围(‘站点n坐标’,‘1公里’)).filter(“名称”,“五四广场”)。
作为另一个示例,在应用界面上,用户输入26路公交车在哪换乘226路车的查询时,输出结果为26路车可换成226号线的站点名称与位置。其实现过程如下:
首先根据出行服务引擎NLP过程调用对应的句式模板提取第一名词“26路车”,第二名词“226路车”后传入后端,且由句式模板或者句子隐含关系确定为换乘。则后端将在知识图谱中检索出26路车的全部车站坐标作为第一兴趣点,并对各公交站点进行范围搜索,查找其附近有无226路车车站的第二兴趣点。换言之,若26路和226路车的站点位置接近,则认为该公交站可换乘该地铁线路。如图10b所示,具体过程如下:
知识图谱查询伪代码:实体.filter(“线路名”,“26路”).filter(“交通类型”,“公交车”),获取26路车的全部站点1~n的坐标。
再进行第二组查询,实体.filter(“坐标”,范围(‘站点1坐标’,‘1公里’)).filter(“类别”,“车站”).filter(“交通类型”,“公交车”)……实体.filter(“坐标”,范围(‘站点n坐标’,‘1公里’)).filter(“类别”,“车站”).filter(“交通类型”,“公交车”)。
如图11所示,可以在应用界面通过地图标注的形式,输出结果为26路车可换成226号线的站点名称与位置。
在一些实施例中,本发明实施例基于知识图谱进行兴趣点展示时,可以结合两种图数据库,具体结合交通知识图谱全图和交通知识图谱子图,如图12所示,为全图和子图在涵盖关系上的表示。
交通知识图谱子图,其“子”的含义是来源于实际意义的。比如商圈、公交线路,都是在一定程度上独立于路网、POI网的信息,具有小规模、精细化、场景化的特点。同时,这种小规模的子图存放节点数量少,查询时遍历的节点少,但用户访问频次高,属于常用信息或热点信息。
根据关系词语确定调用的句式模板时,判断通过句式模板提取出第一名词、第二名词及关系词语表达的句意是否属于子图查询范围,即判断是否属于关于商圈或公共交通的查询,若是,则会先进入到交通知识图谱子图中查询结果,若该结果在交通知识图谱子图中已经查询到,则直接反馈结果,否则再去交通知识图谱全图中查询满足所述用户需求的结果。
本实施例通过构建和先访问交通知识图谱子图的方式,可以有效加速用户查询速度。这种交通知识图谱子图划分是不同于只针对数据关联性的提取,更是基于实际意义和业务逻辑的,具有更高的可解释性。
这种可解释性在应用中体现在,热点信息本身具有其相关的一套连接关系与内在联系,对这种信息进行子图构建,可以达到查的人越多,查的结果越快的效果。在这个思想下反推也成立,即选取被频繁查找的热点信息以及内部关系紧密,但与其他类型数据耦合度低的数据进行子图构建。
本发明上述几个实施例提供的兴趣点展示方法利用知识融合构建领域图谱,并结合“语义搜索和推荐问答”“对话***”,其核心功能是针对用户的出行服务相关需求进行自然交互。交互内容包括各种限定条件(距离最近、多个地点、自身附近、指定地点附近、指定商圈/市区等)的信息查询、路径规划、实时路况。解决现有导航软件不支持多目的地查询、模糊目的地查询、模糊公共交通查询的技术问题,大幅简化出行服务的查询操作,现有导航软件对指定地点附近的指定POI信息查询时,需要说话(或输入)+手动点击至少三步的技术短板,一句话就可以获得结果。构建了知识图谱子图搜索加速引擎,通过基于分布式存储HBase的JanusGraph交通知识图谱全图与商圈&公共交通网OrientDB子图的融合,实现针对特定场景中(商圈&公共交通网,后续可针对业务快速扩展其他子图)的小规模、精细化、场景化的推理加速。
利用本发明实施例提供的兴趣点展示的方法,具有以下有益效果:
1)在应用层体现在使用了该智能出行服务引擎的应用,能够深度理解用户关于出行服务的查询语句中包含的隐含语义与推理关系,使机器从人思考说话的角度出发进行位置检索,从根源(用户的问句)提高检索精度,回答用户真正问的问题。
2)在技术层,通过设计子图加速引擎,独创性的融合了两大知识图谱平台。对于全图用以实现“全”,即路网、公交地铁线路网、POI网的全融合。对于具有针对特定场景的,具有小规模、精细化需求、或需求快速、频繁访问的信息构建子图。在业务逻辑上子图的规模小,遍历速度快,且存储部分全图推理计算结果,对于常用的搜索(如公交、地铁、商圈)通过子图获取服务。
3)实现了对交通领域知识图谱的应用,实现了对路网、公交地铁线路网、POI网以及实时路况信息等出行相关知识与大数据的融合与应用。解决了交通领域的大数据现阶段大多停留在收集存储阶段,缺少多源异构(如路网和公交信息、地铁信息)的交通大数据整合手段,更缺少在出行服务领域的大数据应用的问题。
4)解决现有导航软件对用户输入要求标准,模糊地点查询、模糊问题查询、公共交通查询、多目的地路径规划、模糊地点路径规划、实时路况查询的不支持痛点。解决附近范围查询操作不便的短板。
在一些搜索需求中还可能包括出行方式推理搜索,即搜索需求中包含交通出行方式或交通工具。
常见的提问方式举例如下:“去五四广场坐哪个公交车”,“从台东到李村坐公交要多长时间”,“从五四广场坐公交车去海信新研发中心怎么走”,从而可以针对不同的提问方式设计对应的句式模板。或
实时路况推理搜索,即搜索需求中包含表征路况的名词。
常见的提问方式举例如下:“南京路堵不堵”、“宁夏路现在堵车吗”、“金水路路况如何”等,从而可以针对不同的提问方式设计对应的句式模板。
在一些实施例中,本实施例提供的兴趣点展示方法用于满足出行方式推理搜索、实时路况搜索、目的地推理的路径规划需求类型。
将获得的搜索需求文本信息经短文本分类算法,确定为出行方式推理搜索的需求类型时,从搜索需求文本信息中提取第一名词、第二名词及关系词语,根据关系词语调用该需求类型下相匹配的句式模板<template>,将句式模板传入客户端后端进行推理及检索查询。
针对出行方式推理搜索的需求类型,可以根据常用的提问方式设计对应的句式模板,从而在接收到用户的搜索文本需求信息时,确定是否属于出行方式推理搜索的需求类型,从而根据关系词语调用该类型下相匹配的句式模板推理用户需求。
在实施中,上述搜索需求文本信息中,除了包含第一名词、第二名词和关系词语,还可以在句式模板中增加其他信息如查询时间/花费等需求、选择的出行工具等信息来满足用户的各种需求。
常见的提问方式举例如下:“去五四广场坐哪个公交车”,“从台东到李村坐公交要多长时间”,“从五四广场坐公交车去海信新研发中心怎么走”,从而可以针对不同的提问方式设计对应的句式模板“去*1坐哪个*2”“从*3到*4坐公交要多长时间”“从*5到*6怎么走”,这些句式模板中对应的关系词语为不包含数值的模糊距离词汇,可以按照以第一兴趣点为中心,逐步增大步长来进行检索的方式确定第二兴趣点,上述*1、*2、*3、*4、*5、*6分别代表兴趣点。
以功能句式“我*到附近的*需要*”的技术实现为例,关系词语为不包含数值的模糊距离词汇即“附近的”,句式模板示例如下:
<category>
<pattern>我*到最近的*需要*</pattern>
<template>379%path_planning%path_planning_around_total%0%0%我%<star index='2'/>%<star index='1'/>%<star index='3'/>
</template>
</category>
当用户的输入句式符合该句式模板时,句子的第1、2、3位*的内容会依据相匹配的句式模板指定的规则<star index='*'/>传入客户端后端,后端根据接入的*的内容根据词库确定兴趣点及其他信息,其物理意义分别为:
公交/步行/驾车等出行方式(第一个*);
目的地(第二个*);
查询时间/花费等需求(第三个*)。
该句式模板对应的检索方式中,第一兴趣点A为客户端当前自身的位置,第二兴趣点B为第二个*确定的实体。在查找到距离A最近的B后,由于句式模板中包括查询时间/花费等需求等查询,因此需要根据第三个*的内容,根据距离A最近的B的检索结果进行进一步查询,提供第三个*的查询内容。下面给出具体的过程:
推理检索计算第一步:确定第一兴趣点为自身位置,第二兴趣点为指定目的地,关系词汇确定的检索距离为最近的;
客户端会将自身定位经纬度坐标上传给后端。后端对代表目的地的第二名词进行分词、词性分析。若词性结果为类别词,则在知识图谱的词库中查找该类别的实体对应的兴趣点(比如:饭店、酒吧);若词性结果为店名类专有名词,则在知识图谱的词库中查找包含有该名称的实体对应的兴趣点(比如:肯德基、中石化)。在知识图谱中,每个建筑物或站台实体均有经纬度坐标。
经上述推理,可以确定A和B,之后后端将以A(自身经纬度)为圆心进行范围查找,以一定步长逐步扩大搜索半径直至发现所检索的B(推理出的目的地)名称为止,这也是选取最近指定地点的过程。
推理检索计算第二步:依据选定出行方式,即根据第一个*的内容,规划最优出行路径,默认提供三条推荐路径,分别为用时最短、路径最短、换乘最少。所推荐的路径可以通过导航地图进行标识呈现给用户。
推理检索计算第三步:依据用户的查询需求,即根据第三个*的内容,直接反馈结果,如花费、时间、路长等。
针对实时路况推理搜索的需求类型,也可以设计一些句式模板,例如“从*1到*2的路况怎么样”,根据*1和*2确定对应的兴趣点A和B,根据关系词语确定检索距离,从而实现查询A到B的路段路况。
针对目的地推理的路径规划,根据用户的搜索需求文本信息,提取第一名词、第二名词和关系词语,根据第一名词和第二名词分别确定兴趣点A和兴趣点B,根据关系词语确定检索距离,则可以提供A到B的路径规划,上述A或B可以直接包含在搜索需求文本信息中的,也可以是根据提取的名词及词库推理出的兴趣点,例如“卖面包的”可以推理出“面包店”等,从而以A的地理位置为圆心画圈,圈出检索距离定义范围内的B,上述关系词语可以为包含数值的距离词汇或不包含距离的模糊距离词汇,例如用户提问的是从A到B怎么走时,为固定距离,如果提问A到附近的B怎么走时,为模糊距离。
在一些实施例中,在城市大数据的支撑下,还能够获取各式各样的实体属性。实体属性包括路网属性/POI网属性/公共交通网属性,其中:
路网属性包括道路路名、车道数、允许通行车辆类型、是否为单行道、路宽路长、是否收费及收费原因、限速值、是否有占道停车场、危险路段提示标志、有无红绿灯、是否在施工,道路相连节点经纬度与车道数等。
POI网属性包括POI名称、地址、经纬度、电话、是否24小时营业、POI类别类型、所在行政区域、景区评级、酒店评级、食物类型等;
公共交通网属性包括公交车站点的名称、经纬度、上下行信息、首末班车信息,各路公交车的平均运行时长与平均里程数、站点信息、有无售票员、实时公交车位置及所在站点等;包括地铁站点与各地铁口的名称、经纬度、所在线路、各站点首末班车时刻等。其他交通属性包括:ofo、摩拜、hellobike等共享单车的停放位置、出租车的实时位置、天气信息、因天气原因导致的道路封闭/改变信息,因演唱会、体育赛事或其他文娱类事件导致的道路封闭/改变信息,因施工、修路、节日或重大事件导致的道路封闭/改变信息等。
本实施例可以设计一些句式模板,仅需要根据搜索需求文本信息提取第三名词,根据第三名词确定兴趣点C,其中C为根据为根据推理的用户需求确定的实体POI,基于路网属性/POI网属性/公共交通网属性检索C的属性信息。
以功能句式“1*的2*”,其中第一个*对应的兴趣点代表要查询的对象,第二个*对应的兴趣点代表要查询的具体属性,在检索时,根据第一个*的内容推理出要查询的对象C,基于路网属性/POI网属性/公共交通网属性检索C的具体属性,因此本发明实施例只需要一句话问询就能直接获得结果,支持实时路况的查询,常见的问句如“南京路的车道数”、“海信大厦的电话”“宁夏路限速多少”“肯德基是什么风味的餐厅”、“青岛市有几条公交”“南京路堵不堵”等。
基于相同的发明构思,本发明还提供了智能出行服务引擎装置,由于该装置即是本发明实施例中的方法中的装置,并且该装置解决问题的原理与该方法相似,因此该装置的实施可以参见方法的实施,重复之处不再赘述。
在一些实施例中,提供一种兴趣点展示装置,如图13所示,包括处理器131以及存储器132,其中,所述存储器132存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器131执行如下步骤:
接收用户输入的搜索需求,并生成搜索需求文本信息,从所述搜索需求文本信息中,提取第一名词、第二名词及表征距离关系的关系词语,其中,在所述搜索需求文本信息的字符顺序中,第一名词靠前于第二名词;
在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离,并搜索和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点,其中,所述第二兴趣点和第二名词相对应;
输出所述第二兴趣点,所述第二兴趣点用于在用户交互界面进行展示。
所述在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应检索距离,并搜索和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点,包括:
在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离;
确定和第一兴趣点之间的距离不大于所述检索距离的所有兴趣点;
在所述所有兴趣点中筛选出和第二名词相对应的第二兴趣点。
所述在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离,并搜索和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点,包括:
在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离,确定第二名词对应的所有兴趣点;
分别确定所述所有兴趣点和所述第一兴趣点之间的的距离;
将所述距离不大于所述检索距离的兴趣点作为和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点。
在所述关系词语为不包含数值的模糊距离词汇时,所述检索距离包括一组以预设步长变化的第一距离值和第二距离值,其中,所述第一距离值和所述第二距离值均不大于所述检索距离,所述第一距离值小于所述第二距离值;
所述在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离,并搜索和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点,包括:
在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的第一距离值,判断是否存在和第一兴趣点之间的距离不大于所述第一距离值的第二兴趣点,若是则输出所述第二兴趣点,若否,则判断是否存在和第一兴趣点之间的距离不大于所述第二距离值的第二兴趣点。
从用户的搜索需求文本信息中,提取第一名词、第二名词及表征距离关系的关系词语,包括:
利用自然语言处理NLP方式从搜索需求文本信息中提取短语,对提取的短语进行分词,分词后删除停用词;
对删除停用词后的分词进行词性分析,选取名词及关系词语;
将生成时间较早的名词作为第一名词,将生成时间较晚的名词作为第二名词。
在知识图谱数据中确定对应第一名词的第一兴趣点,包括:
将第一名词与知识图谱中兴趣点对应的词库中词语进行对比,确定所述第一名词在交通知识图谱中对应的兴趣点。
所述接收用户输入的搜索需求,并生成搜索需求文本信息,包括:
接收用户输入的搜索需求,并生成第一文本信息;
确定所述第一文本信息中是否包含隐含名词信息;
若是,则补充所述隐含名词信息并生成搜索需求文本信息。
本发明还提供另一种智能出行服务引擎装置,如图14所示,包括:
词性分析单元141,用于接收用户输入的搜索需求,并生成搜索需求文本信息,从所述搜索需求文本信息中,提取第一名词、第二名词及表征距离关系的关系词语,其中,在所述搜索需求文本信息的字符顺序中,第一名词靠前于第二名词;
搜索引擎单元142,用于在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离,并搜索和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点,其中,所述第二兴趣点和第二名词相对应;
输出单元143,用于输出所述第二兴趣点,所述第二兴趣点用于在用户交互界面进行展示。
搜索引擎单元142具体用于:
在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离;
确定和第一兴趣点之间的距离不大于所述检索距离的所有兴趣点;
在所述所有兴趣点中筛选出和第二名词相对应的第二兴趣点。
所述在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离,并搜索和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点,包括:
在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离,确定第二名词对应的所有兴趣点;
分别确定所述所有兴趣点和所述第一兴趣点之间的的距离;
将所述距离不大于所述检索距离的兴趣点作为和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点。
在所述关系词语为不包含数值的模糊距离词汇时,所述检索距离包括一组以预设步长变化的第一距离值和第二距离值,其中,所述第一距离值和所述第二距离值均不大于所述检索距离,所述第一距离值小于所述第二距离值;
搜索引擎单元142具体用于:
在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的第一距离值,判断是否存在和第一兴趣点之间的距离不大于所述第一距离值的第二兴趣点,若是则输出所述第二兴趣点,若否,则判断是否存在和第一兴趣点之间的距离不大于所述第二距离值的第二兴趣点。
词性分析单元141,从用户的搜索需求文本信息中,提取第一名词、第二名词及表征距离关系的关系词语,包括:
利用自然语言处理NLP方式从搜索需求文本信息中提取短语,对提取的短语进行分词,分词后删除停用词;
对删除停用词后的分词进行词性分析,选取名词及关系词语;
将生成时间较早的名词作为第一名词,将生成时间较晚的名词作为第二名词。
词性分析单元141在知识图谱数据中确定对应第一名词的第一兴趣点,包括:
将第一名词与知识图谱中兴趣点对应的词库中词语进行对比,确定所述第一名词在交通知识图谱中对应的兴趣点。
词性分析单元141接收用户输入的搜索需求,并生成搜索需求文本信息,包括:
接收用户输入的搜索需求,并生成第一文本信息;
确定所述第一文本信息中是否包含隐含名词信息;
若是,则补充所述隐含名词信息并生成搜索需求文本信息。
本发明实施例还提供一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例提供的智能出行服务引擎方法流程。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品,该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种兴趣点展示方法,其特征在于,包括:
接收用户输入的搜索需求,并生成搜索需求文本信息,从所述搜索需求文本信息中,提取第一名词、第二名词及表征距离关系的关系词语,其中,在所述搜索需求文本信息的字符顺序中,所述第一名词靠前于第二名词;
在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离,并搜索和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点,其中,所述第二兴趣点和第二名词相对应;
输出所述第二兴趣点,所述第二兴趣点用于在用户交互界面进行展示。
2.根据权利要求1所述的方法,其特征在于,所述在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应检索距离,并搜索和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点,包括:
在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离;
确定和第一兴趣点之间的距离不大于所述检索距离的所有兴趣点;
在所述所有兴趣点中筛选出和第二名词相对应的第二兴趣点。
3.根据权利要求1所述的方法,其特征在于,所述在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离,并搜索和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点,包括:
在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离,确定第二名词对应的所有候选兴趣点;
分别确定所述所有候选兴趣点和所述第一兴趣点之间的距离;
将所述距离不大于所述检索距离的候选兴趣点作为和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点。
4.根据权利要求1所述的方法,其特征在于,在所述关系词语为不包含数值的模糊距离词汇时,所述检索距离包括一组以预设步长变化的第一距离值和第二距离值,其中所述第一距离值小于所述第二距离值;
所述在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离,并搜索和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点,包括:
在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的第一距离值,判断是否存在和第一兴趣点之间的距离不大于所述第一距离值的第二兴趣点,若是则输出所述第二兴趣点,若否,则判断是否存在和第一兴趣点之间的距离不大于所述第二距离值的第二兴趣点。
5.根据权利要求1-4任意一项所述的方法,其特征在于,从用户的搜索需求文本信息中,提取第一名词、第二名词及表征距离关系的关系词语,包括:
利用自然语言处理NLP方式从搜索需求文本信息中提取短语,对提取的短语进行分词,分词后删除停用词;
对删除停用词后的分词进行词性分析,选取名词及关系词语;
将生成时间较早的名词作为第一名词,将生成时间较晚的名词作为第二名词。
6.根据权利要求1-4任意一项所述的方法,其特征在于,在知识图谱数据中确定对应第一名词的第一兴趣点,包括:
将第一名词与知识图谱中兴趣点对应的词库中词语进行对比,确定所述第一名词在交通知识图谱中对应的兴趣点。
7.根据权利要求1-4任意一项所述的方法,其特征在于,所述接收用户输入的搜索需求,并生成搜索需求文本信息,包括:
接收用户输入的搜索需求,并生成第一文本信息;
确定所述第一文本信息中是否包含隐含名词信息;
若是,则补充所述隐含名词信息并生成搜索需求文本信息。
8.一种兴趣点展示装置,其特征在于,包括处理器以及存储器,其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行如下步骤:
接收用户输入的搜索需求,并生成搜索需求文本信息,从所述搜索需求文本信息中,提取第一名词、第二名词及表征距离关系的关系词语,其中,在所述搜索需求文本信息的字符顺序中,所述第一名词靠前于第二名词;
在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离,并搜索和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点,其中,所述第二兴趣点和第二名词相对应;
输出所述第二兴趣点,所述第二兴趣点用于在用户交互界面进行展示。
9.一种兴趣点展示装置,其特征在于,包括:
词性分析单元,用于接收用户输入的搜索需求,并生成搜索需求文本信息,从所述搜索需求文本信息中,提取第一名词、第二名词及表征距离关系的关系词语,其中,在所述搜索需求文本信息的字符顺序中,所述第一名词靠前于第二名词;
搜索引擎单元,用于在知识图谱数据中确定对应第一名词的第一兴趣点,确定关系词语对应的检索距离,并搜索和第一兴趣点之间的距离不大于所述检索距离的第二兴趣点,其中,所述第二兴趣点和第二名词相对应;
输出单元,用于输出所述第二兴趣点。
10.如权利要求9所述的兴趣点展示装置,其特征在于,所述从用户的搜索需求文本信息中,提取第一名词、第二名词及表征距离关系的关系词语具体为:
利用自然语言处理NLP方式从搜索需求文本信息中提取短语,对提取的短语进行分词,分词后删除停用词;
对删除停用词后的分词进行词性分析,选取名词及关系词语;
将生成时间较早的名词作为第一名词,将生成时间较晚的名词作为第二名词。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910646303.3A CN110413886A (zh) | 2019-07-17 | 2019-07-17 | 一种兴趣点展示方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910646303.3A CN110413886A (zh) | 2019-07-17 | 2019-07-17 | 一种兴趣点展示方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110413886A true CN110413886A (zh) | 2019-11-05 |
Family
ID=68361747
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910646303.3A Pending CN110413886A (zh) | 2019-07-17 | 2019-07-17 | 一种兴趣点展示方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110413886A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110926493A (zh) * | 2019-12-10 | 2020-03-27 | 广州小鹏汽车科技有限公司 | 一种导航方法、装置、车辆及计算机可读存储介质 |
CN110941768A (zh) * | 2019-11-12 | 2020-03-31 | 支付宝(杭州)信息技术有限公司 | 服务推荐方法和装置 |
CN111045767A (zh) * | 2019-11-26 | 2020-04-21 | 北京金和网络股份有限公司 | 基于数据灵活配置在地图上显示地图标注的方法和*** |
CN111859175A (zh) * | 2020-03-06 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 一种推荐上车点的方法和*** |
CN112988994A (zh) * | 2021-03-04 | 2021-06-18 | 网易(杭州)网络有限公司 | 对话处理方法、装置及电子设备 |
CN113111648A (zh) * | 2021-04-06 | 2021-07-13 | 北京字跳网络技术有限公司 | 信息的处理方法、装置、终端和存储介质 |
CN113177058A (zh) * | 2021-05-11 | 2021-07-27 | 北京邮电大学 | 基于复合条件的地理位置信息检索方法及*** |
CN113626729A (zh) * | 2021-07-30 | 2021-11-09 | 高德软件有限公司 | 兴趣点信息的确定方法及设备 |
WO2023124005A1 (zh) * | 2021-12-28 | 2023-07-06 | 北京百度网讯科技有限公司 | 地图兴趣点查询方法、装置、设备、存储介质及程序产品 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104166645A (zh) * | 2013-05-15 | 2014-11-26 | 大陆汽车投资(上海)有限公司 | 兴趣点及路径信息的获取方法和车载电子设备 |
CN107203526A (zh) * | 2016-03-16 | 2017-09-26 | 高德信息技术有限公司 | 一种查询串语义需求分析方法及装置 |
CN107526812A (zh) * | 2017-08-24 | 2017-12-29 | 北京奇艺世纪科技有限公司 | 一种搜索方法、装置及电子设备 |
CN110008413A (zh) * | 2019-03-14 | 2019-07-12 | 海信集团有限公司 | 一种交通出行问题查询方法和装置 |
-
2019
- 2019-07-17 CN CN201910646303.3A patent/CN110413886A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104166645A (zh) * | 2013-05-15 | 2014-11-26 | 大陆汽车投资(上海)有限公司 | 兴趣点及路径信息的获取方法和车载电子设备 |
CN107203526A (zh) * | 2016-03-16 | 2017-09-26 | 高德信息技术有限公司 | 一种查询串语义需求分析方法及装置 |
CN107526812A (zh) * | 2017-08-24 | 2017-12-29 | 北京奇艺世纪科技有限公司 | 一种搜索方法、装置及电子设备 |
CN110008413A (zh) * | 2019-03-14 | 2019-07-12 | 海信集团有限公司 | 一种交通出行问题查询方法和装置 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110941768B (zh) * | 2019-11-12 | 2022-10-04 | 支付宝(杭州)信息技术有限公司 | 服务推荐方法和装置 |
CN110941768A (zh) * | 2019-11-12 | 2020-03-31 | 支付宝(杭州)信息技术有限公司 | 服务推荐方法和装置 |
CN111045767A (zh) * | 2019-11-26 | 2020-04-21 | 北京金和网络股份有限公司 | 基于数据灵活配置在地图上显示地图标注的方法和*** |
CN111045767B (zh) * | 2019-11-26 | 2024-01-26 | 北京金和网络股份有限公司 | 基于数据灵活配置在地图上显示地图标注的方法和*** |
CN110926493A (zh) * | 2019-12-10 | 2020-03-27 | 广州小鹏汽车科技有限公司 | 一种导航方法、装置、车辆及计算机可读存储介质 |
CN111859175A (zh) * | 2020-03-06 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 一种推荐上车点的方法和*** |
CN112988994A (zh) * | 2021-03-04 | 2021-06-18 | 网易(杭州)网络有限公司 | 对话处理方法、装置及电子设备 |
CN113111648A (zh) * | 2021-04-06 | 2021-07-13 | 北京字跳网络技术有限公司 | 信息的处理方法、装置、终端和存储介质 |
CN113177058A (zh) * | 2021-05-11 | 2021-07-27 | 北京邮电大学 | 基于复合条件的地理位置信息检索方法及*** |
CN113177058B (zh) * | 2021-05-11 | 2023-10-13 | 北京邮电大学 | 基于复合条件的地理位置信息检索方法及*** |
CN113626729A (zh) * | 2021-07-30 | 2021-11-09 | 高德软件有限公司 | 兴趣点信息的确定方法及设备 |
CN113626729B (zh) * | 2021-07-30 | 2024-04-16 | 高德软件有限公司 | 兴趣点信息的确定方法及设备 |
WO2023124005A1 (zh) * | 2021-12-28 | 2023-07-06 | 北京百度网讯科技有限公司 | 地图兴趣点查询方法、装置、设备、存储介质及程序产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110413886A (zh) | 一种兴趣点展示方法及装置 | |
CN110008413B (zh) | 一种交通出行问题查询方法和装置 | |
CN107391706B (zh) | 一种基于移动互联网的城市旅游问答*** | |
Timpf | Ontologies of Wayfinding: a traveler's perspective | |
Krueger et al. | Visual analysis of movement behavior using web data for context enrichment | |
CN105069047B (zh) | 一种地理信息的检索方法及装置 | |
US9677904B2 (en) | Generating travel time data | |
CN110442662B (zh) | 一种确定用户属性信息的方法以及信息推送方法 | |
CN106462624A (zh) | 基于图块的地理编码器 | |
Santiago et al. | GeOasis: A knowledge-based geo-referenced tourist assistant | |
CN104636457B (zh) | 一种位置搜索认知的方法及装置 | |
CN108090220B (zh) | 兴趣点搜索排序方法及*** | |
Colorni et al. | Decision support systems for environmental impact assessment of transport infrastructures | |
CN115114533A (zh) | 基于知识图谱的公共交通出行用户画像构建方法及*** | |
Xuan et al. | Research on correlation between spatial quality of urban streets and pedestrian walking characteristics in china based on street view big data | |
Chen et al. | Itinerary planning via deep reinforcement learning | |
CN108734352A (zh) | 一种乡村旅游用管理*** | |
da Costa Albuquerque et al. | A proactive application to monitor truck fleets | |
CN113688164A (zh) | 基于知识图谱关联分析的兴趣点查询方法及*** | |
CN109540160A (zh) | 一种基于语音交互的最佳路径分析方法及相关设备 | |
Santos et al. | Automatic classification of location contexts with decision trees | |
Chapleau et al. | Transit path calculation supported by special geographic information system-transit information system | |
Lüscher | Characterising urban space from topographic databases: cartographic pattern recognition based on semantic modelling | |
KR102616217B1 (ko) | 데이터 드리븐 기반 경로탐색 장치 및 방법 | |
Suvannadabha et al. | The Analytical Tools for Tourism Development through Social Media Data and Spatial Morphological Analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191105 |