CN112115379A - 基于知识图谱的水稻品种选择方法和装置 - Google Patents

基于知识图谱的水稻品种选择方法和装置 Download PDF

Info

Publication number
CN112115379A
CN112115379A CN202010986156.7A CN202010986156A CN112115379A CN 112115379 A CN112115379 A CN 112115379A CN 202010986156 A CN202010986156 A CN 202010986156A CN 112115379 A CN112115379 A CN 112115379A
Authority
CN
China
Prior art keywords
rice
rice variety
knowledge
variety
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010986156.7A
Other languages
English (en)
Inventor
于合龙
毕春光
郭宏亮
石磊
韩永奇
徐兴梅
李紫晴
刘晓彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin Agricultural University
Original Assignee
Jilin Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin Agricultural University filed Critical Jilin Agricultural University
Priority to CN202010986156.7A priority Critical patent/CN112115379A/zh
Publication of CN112115379A publication Critical patent/CN112115379A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/319Inverted lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Agronomy & Crop Science (AREA)
  • Animal Husbandry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mining & Mineral Resources (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供了一种基于知识图谱的水稻品种选择方法,通过搜索引擎查询方式与用户行为搜集与评价方式获取与水稻相关的数据,选用neo4j数据库作为非关系型数据库并通过半自动化方法建立水稻品种知识图谱;基于水稻品种知识图谱所开发的程序执行水稻品种选择,其中,所述水稻品种选择包括水稻品种推荐、水稻品种搜索与水稻品种问答操作。该方法适合于多场景、不同层次的用户进行水稻品种选择,使得水稻选种更具科学性和权威性,且具有精准性与易用性。进一步地,有利于基于知识图谱的水稻品种选择方法中实现知识推理和辅助决策,避免了知识的重复生产,提高了知识的利用效率。本公开还提供了一种基于知识图谱的水稻品种选择装置。

Description

基于知识图谱的水稻品种选择方法和装置
技术领域
本公开涉及计算机农业自动化技术领域,具体而言,涉及一种基于知识图谱的水稻品种选择方法和装置。
背景技术
大米是老百姓餐桌上重要且不可或缺的农产品。优质高产水稻的种植对满足消费者需求和增加水稻种植主体的收入均具有重要意义。品种选择是水稻种植的第一关也是最重要的一关。然而,水稻种植主体在选择水稻品种时仍然面临诸多难题:市场上的水稻品种良莠不齐、真假难辨;品种选择与当地土壤、气象、市场需求、劳动力以及机械化等情况紧密相关,选择品种时往往顾此失彼,难以定量评价;互联网上关于水稻品种的信息存在多源、异构、分散等问题,让水稻种植者无所适从;水稻新品种层出不穷,种植者往往道听途说,难以验证品种的好坏。综上,提出一套水稻品种选择的智能化、精确化方法,确保水稻品种选择的科学性和权威性势在必行。
发明内容
为了解决现有技术中的技术问题,本公开实施例提供了一种基于知识图谱的水稻品种选择方法和装置,通过搜索引擎查询方式与用户行为搜集与评价方式获取与水稻相关的数据,并通过半自动化方法建立水稻品种知识图谱;基于水稻品种知识图谱所开发的程序执行水稻品种选择。该方法适合于多场景、不同层次的用户进行水稻品种选择,使得水稻选种更具科学性和权威性,且具有精准性与易用性。进一步地,有利于基于知识图谱的水稻品种选择方法中实现知识推理和辅助决策,避免了知识的重复生产,提高了知识的利用效率。
第一方面,本公开实施例提供了一种基于知识图谱的水稻品种选择方法,包括以下步骤:通过搜索引擎查询方式与用户行为搜集与评价方式获取与水稻相关的数据,选用neo4j数据库作为非关系型数据库并通过半自动化方法建立水稻品种知识图谱;基于水稻品种知识图谱所开发的程序执行水稻品种选择,其中,所述水稻品种选择包括水稻品种推荐、水稻品种搜索与水稻品种问答操作。
在其中一个实施例中,所述通过搜索引擎查询方式与用户行为搜集与评价方式获取与水稻相关的数据包括:通过爬虫技术在百度百科、互动百科和国家水稻育种中心获取品种信息、县域土壤信息、气象信息;以及搜集水稻品种名称、种植面积、抗倒伏性、抗逆性、亩产、出米率、销售价格、口感、不同时期的长势图片与病虫害图片,并对所选品种的水稻的上述项情况做出定量或者定性评价。
在其中一个实施例中,所述选用neo4j数据库作为非关系型数据库并通过半自动化方法建立水稻品种知识图谱包括:
建立水稻选种的知识框架;
通过自然语言处理和机器学习方法自动抽取所述知识框架中的实体和关系;
将获取到的实体和关系数据生成CSV文档,通过load csv方法或admin import方法或apoc插件将实体和关系补充到所述知识框架中,形成完整的水稻品种知识图谱。
在其中一个实施例中,还包括:通过neo4j中apoc插件结合python库中Timer定时器对用户行为数据在水稻品种知识图谱中进行动态补全。
在其中一个实施例中,基于水稻品种知识图谱所开发的程序执行水稻品种选择包括:基于水稻品种知识图谱所开发的程序执行水稻品种推荐;
所述基于水稻品种知识图谱所开发的程序执行水稻品种推荐包括:
***根据IP地址或手机LBS服务自动获取用户所在地区,并采用cypher语句在知识图谱中查询到该地区的气象条件、土壤条件及适用于该地区的所有品种执行按地区推荐操作;和/或
***通过协同过滤算法基于不同用户在水稻收获后对所种植品种的各项表现的评价按评价推荐操作;和/或
基于已经构建的品种知识图谱,采用知识图谱查询与推理技术,权重方式考虑地区因素与评价等级因素按综合推荐操作。
在其中一个实施例中,还包括:采用基于用户的协同过滤算法;
所述通过搜索引擎查询方式与用户行为搜集与评价方式获取与水稻相关的数据,选用neo4j数据库作为非关系型数据库并通过半自动化方法建立水稻品种知识图谱包括:
利用水稻品种到用户的倒排表,获取对同一水稻品种有过喜爱偏好行为的用户;
根据预设第一公式求出用户与用户之间的相似度,
Figure BDA0002689290960000031
其中,N(u)表示用户u对感兴趣的水稻品种集合,N(v)表示用户v对感兴趣的水稻品种集合;
根据预设第二公式,计算用户对某一水稻品种的感兴趣程度,并将感兴趣程度做倒序处理,及将排名前几的水稻品种推荐给该用户;
Figure BDA0002689290960000032
其中,S(u,k)是和用户u兴趣最接近的K个用户的集合,N(i)是喜欢物品i的所有用户集合,wuv是用户u和用户v之间的相似度,rvi是隐反馈信息,代表用户v对水稻品种i的感兴趣程度,为简化计算设为1。
在其中一个实施例中,还包括:采用基于物品的协同过滤算法;
所述通过搜索引擎查询方式与用户行为搜集与评价方式获取与水稻相关的数据,选用neo4j数据库作为非关系型数据库并通过半自动化方法建立水稻品种知识图谱包括:
利用用户到水稻品种的倒排表,得到特性相似的水稻品种;
根据预设第三公式求出水稻品种与水稻品种之间的相似度,
Figure BDA0002689290960000041
其中,N(i)表示对水稻品种i感兴趣的用户集合,N(j)表示对水稻品种j感兴趣的用户集合的水稻品种集合;
根据预设第四公式,计算用户对某一水稻品种的感兴趣程度,并将感兴趣程度做倒序处理,及将排名前几的水稻品种推荐给该用户;
Figure BDA0002689290960000042
其中,S(j,k)是和水稻品种j最相近的K个品种的集合,N(u)是用户u喜欢的水稻品种集合,wij是水稻品种i和水稻品种j之间的相似度,rui是隐反馈信息,代表用户u对水稻品种i的感兴趣程度,为简化计算设为1。
在其中一个实施例中,基于水稻品种知识图谱所开发的程序执行水稻品种选择包括:基于水稻品种知识图谱所开发的程序执行水稻品种搜索;
所述基于水稻品种知识图谱所开发的程序执行水稻品种搜索包括:
根据预设搜索算法,以水稻品种名称作为关键词,采用在知识图谱中进行路径探寻的方式获取水稻品种本身信息及族系信息;
其中,所述族系信息包括:与获取水稻品种同一母本、父本或族系的品种信息。
在其中一个实施例中,基于水稻品种知识图谱所开发的程序执行水稻品种选择包括:基于水稻品种知识图谱所开发的程序执行水稻品种问答;
所述基于水稻品种知识图谱所开发的程序执行水稻品种问答包括:
***对所提出的提问使用jieba进行分词,并提取问句中的实体与关系生成所提出问题的三元组;
对所述三元组的中涉及的词建立同义词词典,将内部数据库中实体及关系与和实体及关系意思相近的词语做同义词替换,增加问答的准确率;
将所述问题三元组与知识图谱进行匹配,确定问题答案。
第二方面,本公开实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的方法的步骤。
第三方面,本公开实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的方法的步骤。
第四方面,本公开实施例提供了一种基于知识图谱的水稻品种选择装置,所述装置包括:获取与建立模块,用于通过搜索引擎查询方式与用户行为搜集与评价方式获取与水稻相关的数据,选用neo4j数据库作为非关系型数据库并通过半自动化方法建立水稻品种知识图谱;选择模块,用于基于水稻品种知识图谱所开发的程序执行水稻品种选择,其中,所述水稻品种选择包括水稻品种推荐、水稻品种搜索与水稻品种问答操作。
本发明提供的一种基于知识图谱的水稻品种选择方法和装置,通过搜索引擎查询方式与用户行为搜集与评价方式获取与水稻相关的数据,选用neo4j数据库作为非关系型数据库并通过半自动化方法建立水稻品种知识图谱;基于水稻品种知识图谱所开发的程序执行水稻品种选择,其中,所述水稻品种选择包括水稻品种推荐、水稻品种搜索与水稻品种问答操作。该方法适合于多场景、不同层次的用户进行水稻品种选择,使得水稻选种更具科学性和权威性,且具有精准性与易用性。进一步地,有利于基于知识图谱的水稻品种选择方法中实现知识推理和辅助决策,避免了知识的重复生产,提高了知识的利用效率。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面对实施例描述中所需要使用的附图作简单地介绍:
图1为本发明一个实施例中的一种基于知识图谱的水稻品种选择方法的步骤流程示意图;
图2为本发明一个实施例中的一种基于知识图谱的水稻品种选择方法的本体示意图;
图3为本发明一个实施例中的一种基于知识图谱的水稻品种选择方法的知识图谱可视化示意图;
图4为本发明一个实施例中的一种基于知识图谱的水稻品种选择装置的结构示意图。
具体实施方式
下面结合附图和实施例对本申请进行进一步的详细介绍。
在下述介绍中,术语“第一”、“第二”仅为用于描述的目的,而不能理解为指示或暗示相对重要性。下述介绍提供了本公开的多个实施例,不同实施例之间可以替换或者合并组合,因此本申请也可认为包含所记载的相同和/或不同实施例的所有可能组合。因而,如果一个实施例包含特征A、B、C,另一个实施例包含特征B、D,那么本申请也应视为包括含有A、B、C、D的一个或多个所有其他可能的组合的实施例,尽管该实施例可能并未在以下内容中有明确的文字记载。
为了使本发明的目的、技术方案及优点更加清楚明白,以下通过实施例,并结合附图,对本发明一种基于知识图谱的水稻品种选择方法和装置的具体实施方式进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
首先需要说明的是,知识图谱的概念由谷歌于2012年提出,以图形化的方式表示知识,还原知识存在的本来面目,对整合知识资源,提高知识利用效率具有重要意义。本公开提出一种基于知识图谱的水稻品种选择方法和装置,通过整合品种、土壤、气象等知识,建立起知识图谱,并在此基础上为水稻种植者提供个性推荐、精确搜索、智能问答、众包评价和可视输出等服务。
其次,需要说明的是,本公开所涉及的一种基于知识图谱的水稻品种选择方法和装置主要面向水稻育种专家和水稻种植主体。其中,育种专家的主要任务是:为选择某个品种的种植户提供种植过程中的技术服务,根据农户提供的评价数据为下一步改进育种提供依据,为进一步完善品种知识图谱提供权威数据,对知识图谱进行信息补全;水稻种植主体主要面向注册用户,对于非注册用户只提供简单的推荐和搜索功能,不提供后续的技术服务和自然语言问答功能。此外,需要说明的是,对于注册用户,要求其提供手机号码、所在地区等基本信息,每一次选择新的品种时,还要求提供前一年种植的品种的各项信息。
如图1所示,为一个实施例中的一种基于知识图谱的水稻品种选择方法的流程示意图,具体包括以下步骤:
步骤102,通过搜索引擎查询方式与用户行为搜集与评价方式获取与水稻相关的数据,选用neo4j数据库作为非关系型数据库并通过半自动化方法建立水稻品种知识图谱。
具体的,在一个实施例中,所述通过搜索引擎查询方式与用户行为搜集与评价方式获取与水稻相关的数据包括:通过爬虫技术在百度百科、互动百科和国家水稻育种中心获取品种信息、县域土壤信息、气象信息;以及搜集水稻品种名称、种植面积、抗倒伏性、抗逆性、亩产、出米率、销售价格、口感、不同时期的长势图片与病虫害图片,并对所选品种的水稻的上述项情况做出定量或者定性评价。此外,还需要说明的是,注册用户在进行水稻品种选择以及享受相关技术服务的同时会提供水稻品种评价、长势、病虫害图片,这些数据相当于以众包的方式获取知识。由此,提高了获取与水稻相关数据的多样性、精准性与实用性。
此外,在一个实施例中,还需要说明的是,所述选用neo4j数据库作为非关系型数据库并通过半自动化方法建立水稻品种知识图谱包括:建立水稻选种的知识框架,如图2所示形成水稻品种知识本体;通过自然语言处理和机器学习方法自动抽取所述知识框架中的实体和关系;将获取到的实体和关系数据生成CSV文档,通过load csv方法或admin import方法或apoc插件将实体和关系补充到所述知识框架中,如图3所示形成完整的水稻品种知识图谱,其中,需要说明的是,每一个新注册的用户都是水稻品种知识图谱中的一个实体,用户实体会随着注册用户的增多而动态增长,同时自动和其它实体建立联系。由此,提高了水稻品种知识图谱的精准性与可用性。此外,本公开涉及的一种基于知识图谱的水稻品种选择方法还包括:通过neo4j中apoc插件结合python库中Timer定时器对用户行为数据在水稻品种知识图谱中进行动态补全。具体的,注册用户在进行品种选择以及享受相关技术服务的同时会提供品种评价、长势、病虫害图片,这些数据可以用来进一步对知识图谱进行补全,完善的知识图谱能够促进知识共享,从而为用户提供更好的品种选择及技术服务,且提高了水稻品种知识图谱的精准性与实用性。
步骤104,基于水稻品种知识图谱所开发的程序执行水稻品种选择,其中,所述水稻品种选择包括水稻品种推荐、水稻品种搜索与水稻品种问答操作。其中,需要说明的是,基于水稻品种知识图谱所开发的程序在服务器端的表现形式为以neo4j图数据库存储的水稻品种知识图谱;在不同终端的表现形式具体为:通过台式机与服务器端进行可视化交互以及通过小程序与服务器端进行交互,其中的小程序包括但不限于微信小程序。由此,提高了基于水稻品种知识图谱所开发的程序的灵活性与易用性。
具体的,在一个实施例中,基于水稻品种知识图谱所开发的程序执行水稻品种选择包括:基于水稻品种知识图谱所开发的程序执行水稻品种推荐;所述基于水稻品种知识图谱所开发的程序执行水稻品种推荐包括:***根据IP地址或手机LBS服务自动获取用户所在地区,并采用cypher语句在知识图谱中查询到该地区的气象条件,例如:日照与积温、土壤条件,例如:土壤类型与水系,及适用于该地区的所有品种执行按地区推荐操作;或***通过协同过滤算法基于不同用户在水稻收获后对所种植品种的各项表现的评价按评价推荐操作;或基于已经构建的品种知识图谱,采用知识图谱查询与推理技术,权重方式考虑地区因素与评价等级因素按综合推荐操作。由此,提高了基于知识图谱的水稻品种选择的全面性。
此外,还需要说明的是协同过滤算法可采用基于用户的协同过滤算法,所述步骤102具体包括:
步骤1021,利用水稻品种到用户的倒排表,得到对同一水稻品种有过喜爱偏好行为的用户。
步骤1022,根据下述公式1求出用户与用户之间的相似度,
Figure BDA0002689290960000091
其中N(u)表示用户u对感兴趣的水稻品种集合,N(v)表示用户v对感兴趣的水稻品种集合。
步骤1023,根据下述公式2,计算用户对某一水稻品种的感兴趣程度,并将感兴趣程度做倒序处理,将排名前几的水稻品种推荐给该用户,
Figure BDA0002689290960000101
其中,S(u,k)是和用户u兴趣最接近的K个用户的集合,N(i)是喜欢物品i的所有用户集合,wuv是用户u和用户v之间的相似度,rvi是隐反馈信息,代表用户v对水稻品种i的感兴趣程度,为简化计算设为1。
或采用基于物品的协同过滤算法,所述步骤102具体包括:
步骤1021’,利用用户到水稻品种的倒排表,得到特性相似的水稻品种。
步骤1022’,根据下述公式3求出水稻品种与水稻品种之间的相似度,
Figure BDA0002689290960000102
其中,N(i)表示对水稻品种i感兴趣的用户集合,N(j)表示对水稻品种j感兴趣的用户集合的水稻品种集合。
步骤1023’,根据下述公式4,计算用户对某一水稻品种的感兴趣程度,并将感兴趣程度做倒序处理,将排名前几的水稻品种推荐给该用户,
Figure BDA0002689290960000103
其中,S(j,k)是和水稻品种j最相近的K个品种的集合,N(u)是用户u喜欢的水稻品种集合,wij是水稻品种i和水稻品种j之间的相似度,rui是隐反馈信息,代表用户u对水稻品种i的感兴趣程度,为简化计算设为1。
进一步地,在一个实施例中,基于水稻品种知识图谱所开发的程序执行水稻品种选择包括:基于水稻品种知识图谱所开发的程序执行水稻品种搜索;所述基于水稻品种知识图谱所开发的程序执行水稻品种搜索包括:根据预设搜索算法,以水稻品种名称作为关键词,采用在知识图谱中进行路径探寻的方式获取水稻品种本身信息及族系信息;其中,所述族系信息包括:与获取水稻品种同一母本、父本或族系的品种信息。由此,提高了基于知识图谱的水稻品种搜索的精准性与全面性。
更进一步地,在一个实施例中,基于水稻品种知识图谱所开发的程序执行水稻品种选择包括:基于水稻品种知识图谱所开发的程序执行水稻品种问答,其中,问答问题可能为:四平地区适合种植什么品种?龙稻18的表现力怎么样?2017年新审定的水稻品种有哪些?哪些品种的抗倒伏能力比较强?基于以上问题,基于水稻品种知识图谱所开发的程序以自然理解进行问答的方式为用户提供答案。即所述基于水稻品种知识图谱所开发的程序执行水稻品种问答包括:***对所提出的提问使用jieba进行分词,对所述三元组的中涉及的词建立同义词词典,将内部数据库中实体及关系与和实体及关系意思相近的词语做同义词替换,增加问答的准确率;将所述问题三元组与知识图谱进行匹配,确定问题答案。由此,提高了基于知识图谱的水稻品种搜索的智能性与易用性。
此外,还需要说明的是,本公开涉及的一种基于知识图谱的水稻品种选择方法还包括:对于用户选择的某一水稻品种,本公开所涉及的一种基于知识图谱的水稻品种选择方法会以该水稻品种所表示的实体为中心,以图谱的形式展示出所有与该水稻品种实体直接相连或间接相连的实体,便于用户更具体的了解该水稻品种的相关信息。同时,基于用户对该水稻品种的评价数据,以雷达图的形式对该水稻品种的综合表现力进行直观的展示,便于用户直观全面地了解该水稻品种的各方面特性。由此,提高了基于知识图谱的水稻品种选择的便捷性与易用性。
本发明提供的一种基于知识图谱的水稻品种选择方法,通过搜索引擎查询方式与用户行为搜集与评价方式获取与水稻相关的数据,选用neo4j数据库作为非关系型数据库并通过半自动化方法建立水稻品种知识图谱;基于水稻品种知识图谱所开发的程序执行水稻品种选择,其中,所述水稻品种选择包括水稻品种推荐、水稻品种搜索与水稻品种问答操作。该方法适合于多场景、不同层次的用户进行水稻品种选择,使得水稻选种更具科学性和权威性,且具有精准性与易用性。进一步地,有利于基于知识图谱的水稻品种选择方法中实现知识推理和辅助决策,避免了知识的重复生产,提高了知识的利用效率。
基于同一发明构思,还提供了一种基于知识图谱的水稻品种选择装置。由于此装置解决问题的原理与前述一种基于知识图谱的水稻品种选择方法相似,因此,该装置的实施可以按照前述方法的具体步骤实现,重复之处不再赘述。
如图4所示,为一个实施例中的一种基于知识图谱的水稻品种选择装置的结构示意图。该基于知识图谱的水稻品种选择装置10包括:获取与建立模块200和选择模块400。
其中,获取与建立模块200用于通过搜索引擎查询方式与用户行为搜集与评价方式获取与水稻相关的数据,选用neo4j数据库作为非关系型数据库并通过半自动化方法建立水稻品种知识图谱;选择模块400用于基于水稻品种知识图谱所开发的程序执行水稻品种选择,其中,所述水稻品种选择包括水稻品种推荐、水稻品种搜索与水稻品种问答操作。
本发明提供的一种基于知识图谱的水稻品种选择装置,通过获取与建立模块通过搜索引擎查询方式与用户行为搜集与评价方式获取与水稻相关的数据,选用neo4j数据库作为非关系型数据库并通过半自动化方法建立水稻品种知识图谱;最后通过选择模块基于水稻品种知识图谱所开发的程序执行水稻品种选择,其中,所述水稻品种选择包括水稻品种推荐、水稻品种搜索与水稻品种问答操作。该装置适合于多场景、不同层次的用户进行水稻品种选择,使得水稻选种更具科学性和权威性,且具有精准性与易用性。进一步地,有利于基于知识图谱的水稻品种选择方法中实现知识推理和辅助决策,避免了知识的重复生产,提高了知识的利用效率。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被图1中处理器执行。
本发明实施例还提供了一种包含指令的计算机程序产品。当该计算机程序产品在计算机上运行时,使得计算机执行上述图1的方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本公开中涉及的器件、装置、设备、***的方框图仅作为示例性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、***。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
另外,如在此使用的,在以“至少一个”开始的项的列举中使用的“或”指示分离的列举,例如“A、B或C的至少一个”的列举意味着A或B或C,或AB或AC或BC,或ABC(即A和B和C)。此外,措辞“示例的”不意味着描述的例子是优选的或者比其他例子更好。
为了示例和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (10)

1.一种基于知识图谱的水稻品种选择方法,其特征在于,所包括以下步骤:
通过搜索引擎查询方式与用户行为搜集与评价方式获取与水稻相关的数据,选用neo4j数据库作为非关系型数据库并通过半自动化方法建立水稻品种知识图谱;
基于水稻品种知识图谱所开发的程序执行水稻品种选择,其中,所述水稻品种选择包括水稻品种推荐、水稻品种搜索与水稻品种问答操作。
2.根据权利要求1所述的基于知识图谱的水稻品种选择方法,其特征在于,所述通过搜索引擎查询方式与用户行为搜集与评价方式获取与水稻相关的数据包括:通过爬虫技术在百度百科、互动百科和国家水稻育种中心获取品种信息、县域土壤信息、气象信息;以及搜集水稻品种名称、种植面积、抗倒伏性、抗逆性、亩产、出米率、销售价格、口感、不同时期的长势图片与病虫害图片,并对所选品种的水稻的上述项情况做出定量或者定性评价。
3.根据权利要求1所述的基于知识图谱的水稻品种选择方法,其特征在于,所述选用neo4j数据库作为非关系型数据库并通过半自动化方法建立水稻品种知识图谱包括:
建立水稻选种的知识框架;
通过自然语言处理和机器学习方法自动抽取所述知识框架中的实体和关系;
将获取到的实体和关系数据生成CSV文档,通过load csv方法或admin import方法或apoc插件将实体和关系补充到所述知识框架中,形成完整的水稻品种知识图谱。
4.根据权利要求3所述的基于知识图谱的水稻品种选择方法,其特征在于,还包括:通过neo4j中apoc插件结合python库中Timer定时器对用户行为数据在水稻品种知识图谱中进行动态补全。
5.根据权利要求1所述的基于知识图谱的水稻品种选择方法,其特征在于,基于水稻品种知识图谱所开发的程序执行水稻品种选择包括:基于水稻品种知识图谱所开发的程序执行水稻品种推荐;
所述基于水稻品种知识图谱所开发的程序执行水稻品种推荐包括:
***根据IP地址或手机LBS服务自动获取用户所在地区,并采用cypher语句在知识图谱中查询到该地区的气象条件、土壤条件及适用于该地区的所有品种执行按地区推荐操作;和/或
***通过协同过滤算法基于不同用户在水稻收获后对所种植品种的各项表现的评价按评价推荐操作;和/或
基于已经构建的品种知识图谱,采用知识图谱查询与推理技术,权重方式考虑地区因素与评价等级因素按综合推荐操作。
6.根据权利要求1所述的基于知识图谱的水稻品种选择方法,其特征在于,还包括:采用基于用户的协同过滤算法;
所述通过搜索引擎查询方式与用户行为搜集与评价方式获取与水稻相关的数据,选用neo4j数据库作为非关系型数据库并通过半自动化方法建立水稻品种知识图谱包括:
利用水稻品种到用户的倒排表,获取对同一水稻品种有过喜爱偏好行为的用户;
根据预设第一公式求出用户与用户之间的相似度,
Figure FDA0002689290950000021
其中,N(u)表示用户u对感兴趣的水稻品种集合,N(v)表示用户v对感兴趣的水稻品种集合;
根据预设第二公式,计算用户对某一水稻品种的感兴趣程度,并将感兴趣程度做倒序处理,及将排名前几的水稻品种推荐给该用户;
Figure FDA0002689290950000031
其中,S(u,k)是和用户u兴趣最接近的K个用户的集合,N(i)是喜欢物品i的所有用户集合,wuv是用户u和用户v之间的相似度,rvi是隐反馈信息,代表用户v对水稻品种i的感兴趣程度,为简化计算设为1。
7.根据权利要求1所述的基于知识图谱的水稻品种选择方法,其特征在于,还包括:采用基于物品的协同过滤算法;
所述通过搜索引擎查询方式与用户行为搜集与评价方式获取与水稻相关的数据,选用neo4j数据库作为非关系型数据库并通过半自动化方法建立水稻品种知识图谱包括:
利用用户到水稻品种的倒排表,得到特性相似的水稻品种;
根据预设第三公式求出水稻品种与水稻品种之间的相似度,
Figure FDA0002689290950000032
其中,N(i)表示对水稻品种i感兴趣的用户集合,N(j)表示对水稻品种j感兴趣的用户集合的水稻品种集合;
根据预设第四公式,计算用户对某一水稻品种的感兴趣程度,并将感兴趣程度做倒序处理,及将排名前几的水稻品种推荐给该用户;
Figure FDA0002689290950000033
其中,S(j,k)是和水稻品种j最相近的K个品种的集合,N(u)是用户u喜欢的水稻品种集合,wij是水稻品种i和水稻品种j之间的相似度,rui是隐反馈信息,代表用户u对水稻品种i的感兴趣程度,为简化计算设为1。
8.根据权利要求1所述的基于知识图谱的水稻品种选择方法,其特征在于,基于水稻品种知识图谱所开发的程序执行水稻品种选择包括:基于水稻品种知识图谱所开发的程序执行水稻品种搜索;
所述基于水稻品种知识图谱所开发的程序执行水稻品种搜索包括:
根据预设搜索算法,以水稻品种名称作为关键词,采用在知识图谱中进行路径探寻的方式获取水稻品种本身信息及族系信息;
其中,所述族系信息包括:与获取水稻品种同一母本、父本或族系的品种信息。
9.根据权利要求1所述的基于知识图谱的水稻品种选择方法,其特征在于,基于水稻品种知识图谱所开发的程序执行水稻品种选择包括:基于水稻品种知识图谱所开发的程序执行水稻品种问答;
所述基于水稻品种知识图谱所开发的程序执行水稻品种问答包括:
***对所提出的提问使用jieba进行分词,并提取问句中的实体与关系生成所提出问题的三元组;
对所述三元组的中涉及的词建立同义词词典,将内部数据库中实体及关系与和实体及关系意思相近的词语做同义词替换,增加问答的准确率;
将所述问题三元组与知识图谱进行匹配,确定问题答案。
10.一种基于知识图谱的水稻品种选择装置,其特征在于,所述装置包括:
获取与建立模块,用于通过搜索引擎查询方式与用户行为搜集与评价方式获取与水稻相关的数据,选用neo4j数据库作为非关系型数据库并通过半自动化方法建立水稻品种知识图谱;
选择模块,用于基于水稻品种知识图谱所开发的程序执行水稻品种选择,其中,所述水稻品种选择包括水稻品种推荐、水稻品种搜索与水稻品种问答操作。
CN202010986156.7A 2020-09-18 2020-09-18 基于知识图谱的水稻品种选择方法和装置 Pending CN112115379A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010986156.7A CN112115379A (zh) 2020-09-18 2020-09-18 基于知识图谱的水稻品种选择方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010986156.7A CN112115379A (zh) 2020-09-18 2020-09-18 基于知识图谱的水稻品种选择方法和装置

Publications (1)

Publication Number Publication Date
CN112115379A true CN112115379A (zh) 2020-12-22

Family

ID=73800736

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010986156.7A Pending CN112115379A (zh) 2020-09-18 2020-09-18 基于知识图谱的水稻品种选择方法和装置

Country Status (1)

Country Link
CN (1) CN112115379A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113342938A (zh) * 2021-06-21 2021-09-03 南京农业大学 一种结合知识图谱的玉米选种与精准播种决策方法
CN113434644A (zh) * 2021-05-25 2021-09-24 北京农业信息技术研究中心 一种农技知识服务方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106777051A (zh) * 2016-12-09 2017-05-31 重庆邮电大学 一种基于用户组的多反馈协同过滤推荐方法
CN108664564A (zh) * 2018-04-13 2018-10-16 东华大学 一种基于物品内容特征的改进协同过滤推荐方法
CN109862431A (zh) * 2019-01-23 2019-06-07 重庆第二师范学院 一种基于mcl-hcf算法的电视节目混合推荐方法
CN110188208A (zh) * 2019-06-04 2019-08-30 河海大学 一种基于知识图谱的信息资源查询推荐方法和***
CN111538847A (zh) * 2020-04-16 2020-08-14 北方民族大学 一种宁夏水稻知识图谱构建方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106777051A (zh) * 2016-12-09 2017-05-31 重庆邮电大学 一种基于用户组的多反馈协同过滤推荐方法
CN108664564A (zh) * 2018-04-13 2018-10-16 东华大学 一种基于物品内容特征的改进协同过滤推荐方法
CN109862431A (zh) * 2019-01-23 2019-06-07 重庆第二师范学院 一种基于mcl-hcf算法的电视节目混合推荐方法
CN110188208A (zh) * 2019-06-04 2019-08-30 河海大学 一种基于知识图谱的信息资源查询推荐方法和***
CN111538847A (zh) * 2020-04-16 2020-08-14 北方民族大学 一种宁夏水稻知识图谱构建方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113434644A (zh) * 2021-05-25 2021-09-24 北京农业信息技术研究中心 一种农技知识服务方法及***
CN113434644B (zh) * 2021-05-25 2023-09-12 北京农业信息技术研究中心 一种农技知识服务方法及***
CN113342938A (zh) * 2021-06-21 2021-09-03 南京农业大学 一种结合知识图谱的玉米选种与精准播种决策方法
CN113342938B (zh) * 2021-06-21 2024-03-08 南京农业大学 一种结合知识图谱的玉米选种与精准播种决策方法

Similar Documents

Publication Publication Date Title
Oikonomidis et al. Deep learning for crop yield prediction: a systematic literature review
US8583673B2 (en) Progressive filtering of search results
CN110807091B (zh) 一种酒店智能问答推荐与决策支持分析方法及***
US20120215795A1 (en) System and Method For Intelligent Job Hunt
Rodríguez et al. Using linguistic incomplete preference relations to cold start recommendations
Adetimehin et al. Utilization of agricultural information and knowledge for improved production by rice farmers in Ondo State, Nigeria
Wagner et al. Sampling from social networks with attributes
Connor et al. Sustainable rice production in the Mekong River Delta: Factors influencing farmers’ adoption of the integrated technology package “One Must Do, Five Reductions”(1M5R)
Tai et al. Effective e‐learning recommendation system based on self‐organizing maps and association mining
EP2577526A2 (en) Data isolating research tool
CN112115379A (zh) 基于知识图谱的水稻品种选择方法和装置
Aleixandre-Tudó et al. Bibliometric and social network analysis in scientific research on precision agriculture
Arnaud et al. Final report of the Task Group on GBIF data fitness for use in agrobiodiversity
CN113434644B (zh) 一种农技知识服务方法及***
Yang et al. Finding experts in community question answering based on topic-sensitive link analysis
CN108536763B (zh) 一种下拉提示方法和装置
Widayat et al. Recommendations for Choosing a Place to Stay in the Greater Malang Area Using SAW and TOPSIS
CN114860917B (zh) 农业知识问答方法、装置、电子设备和存储介质
CN108509610A (zh) 一种活动与同伴的检索方法及***
Mng’omba et al. Ethnoecological knowledge for identifying Elite phenotypes of the indigenous fruit tree, Uapaca kirkiana in the Miombo woodlands of Southern Africa
Salim et al. The adoption of Internet of Things in urban farming.
Simanjuntak et al. Weighted Hybrid Recommendation System for Toba Tourism Based on Google Review Data
CN112463977A (zh) 基于知识图谱的社区挖掘方法、***、计算机及存储介质
Opata et al. Revenue drivers of women labour in crop production in south east Nigeria
CN116186210A (zh) 面向农技知识问答的用户画像构建方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination