CN111178433A - 一种渔船作业方式识别方法、装置与*** - Google Patents

一种渔船作业方式识别方法、装置与*** Download PDF

Info

Publication number
CN111178433A
CN111178433A CN201911394714.4A CN201911394714A CN111178433A CN 111178433 A CN111178433 A CN 111178433A CN 201911394714 A CN201911394714 A CN 201911394714A CN 111178433 A CN111178433 A CN 111178433A
Authority
CN
China
Prior art keywords
data
fishing boat
operation mode
feature
navigational speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911394714.4A
Other languages
English (en)
Inventor
高冰涛
翟振刚
王磊
王殷洁
朱云亚
章栎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC 36 Research Institute
Original Assignee
CETC 36 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC 36 Research Institute filed Critical CETC 36 Research Institute
Priority to CN201911394714.4A priority Critical patent/CN111178433A/zh
Publication of CN111178433A publication Critical patent/CN111178433A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)

Abstract

本发明公开一种渔船作业方式识别方法、装置与***。本发明的方法包括:对收集到的多源异构数据进行融合整理,得到融合数据;基于所述融合数据构建特征空间,根据所述特征空间提取所述融合数据中每条渔船对应的特征向量,得到多个特征向量;利用所述多个特征向了特征向量对分类模型进行训练,得到能够识别每种渔船作业方式的分类模型;在渔船作业方式识别时,将采集到的渔船的作业数据输入所述分类模型,利用所述分类模型,识别出渔船的作业方式。

Description

一种渔船作业方式识别方法、装置与***
技术领域
本发明涉及一种渔船作业方式识别方法、装置与***。
背景技术
当前,我国海洋经济的发展,由于渔船作业方式的不规范和违规作业,导致我国近海海洋渔业资源衰退严重、海洋生态***遭受到严重破坏。渔船监管部门急需一种可以有效识别渔船作业方式的智能方法,对渔船作业行为进行规范和监督。而现有的方法主要是使用基于统计、基于规则和传统的人工监督的方法对渔船作业方式进行识别,存在以下问题:
1、数据来源单一,利用率低,识别准确率低。
通常使用单一的数据源进行分析,导致对其他数据源的数据利用率低,分析方向单一,识别率较低。
2、识别算法仅利用结构化的数据,没有充分利用非结构化数据进行分析。
目前识别算法仅仅利用渔船监管部门提供的结构化数据,没有充分利用开放开源的其他有价值数据,进行综合融合分析。
发明内容
本发明的目的在于提供了一种渔船作业方式识别方法、装置与***,对多来源、结构化和非结构化数据进行融合分析,有效提高对渔船作业方式识别准确率。
第一方面,本发明实施例提供了一种渔船作业方式识别方法,包括:
对收集到的多源异构数据进行融合整理,得到融合数据;
基于所述融合数据构建特征空间,根据所述特征空间提取所述融合数据中每条渔船对应的特征向量,得到多个特征向量;
利用所述多个特征向了特征向量对分类模型进行训练,得到能够识别每种渔船作业方式的分类模型;
在渔船作业方式识别时,将采集到的渔船的作业数据输入所述分类模型,利用所述分类模型,识别出渔船的作业方式。
第二方面,本发明实施例提供了一种渔船作业方式识别装置,包括:
预处理单元,用于对收集到的多源异构数据进行融合整理,得到融合数据;基于所述融合数据构建特征空间,根据所述特征空间提取所述融合数据中每条渔船对应的特征向量,得到多个特征向量;利用所述多个特征向了特征向量对分类模型进行训练,得到能够识别每种渔船作业方式的分类模型;
识别单元,用于在渔船作业方式识别时,将采集到的渔船的作业数据输入所述分类模型,利用所述分类模型,识别出渔船的作业方式。
第三方面,本发明实施例提供了一种渔船作业方式识别***,包括:存储器和处理器;存储器,存储计算机可执行指令;处理器,计算机可执行指令在被执行时使处理器执行渔船作业方式识别方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有一个或多个计算机程序,一个或多个计算机程序被执行时实现渔船作业方式识别方法。
本发明至少取得以下技术效果:
1、通过对多源异构数据进行融合,有效的整合多方面的数据信息,使得渔船作业方式识别分类结果更加准确;
2、通过使用大数据分析技术,对政府政策文件和***数据进行融合分析,为相关监管部门提供了全面、快速、准确的方法;
3、基于多源异构数据的渔船作业方式识别方法具有成本较低的特点,在保证识别准确率的前提下,能够节约资源。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍。应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定。对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例示出的渔船作业方式识别***的硬件配置的框图;
图2为本发明实施例示出的渔船作业方式识别方法的流程图;
图3为本发明实施例示出的仿真结果对比示意图;
图4为本发明实施例示出的渔船作业方式识别装置的结构框图;
图5为本发明实施例示出的渔船作业方式识别***的结构框图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
<实施例一>
图1是根据本发明实施例的渔船作业方式识别***100的硬件配置的框图。
如图1所示,渔船作业方式识别***100包括数据收集装置1000和渔船作业方式识别装置2000。
数据收集装置1000用于采集渔船作业数据,并将收集到的渔船作业数据提供至产品缺陷检测装置2000。
渔船作业方式识别装置2000可以是任意的电子设备,例如PC机、笔记本电脑、服务器等。
在本实施例中,参照图1所示,渔船作业方式识别装置2000可以包括处理器2100、存储器2200、接口装置2300、通信装置2400、显示装置2500、输入装置2600、扬声器2700、麦克风2800等等。
处理器2100可以是移动版处理器。存储器2200例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置2300例如包括USB接口、耳机接口等。通信装置2400例如能够进行有线或无线通信,通信装置2400可以包括短距离通信装置,例如是基于Hilink协议、WiFi(IEEE 802.11协议)、Mesh、蓝牙、ZigBee、Thread、Z-Wave、NFC、UWB、LiFi等短距离无线通信协议进行短距离无线通信的任意装置,通信装置2400也可以包括远程通信装置,例如是进行WLAN、GPRS、2G/3G/4G/5G远程通信的任意装置。显示装置2500例如是液晶显示屏、触摸显示屏等,显示装置2500用于显示数据收集装置1000采集的数据。输入装置2600例如可以包括触摸屏、键盘等。用户可以通过扬声器2700和麦克风2800输入/输出语音信息。
在该实施例中,渔船作业方式识别装置2000的存储器2200用于存储指令,该指令用于控制处理器2100进行操作以至少执行根据本发明任意实施例的渔船作业方式识别方法。技术人员可以根据本发明所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。
尽管在图1中示出了渔船作业方式识别装置2000的多个装置,但是,本发明可以仅涉及其中的部分装置,例如,渔船作业方式识别装置2000只涉及存储器2200和处理器2100。
在本实施例中,数据收集装置1000用于收集渔船作业数据提供至渔船作业方式识别装置2000,渔船作业方式识别装置2000则基于该渔船作业数据实施根据本发明任意实施例的渔船作业方式识别方法。
应当理解的是,尽管图1仅示出一个数据收集装置1000和一个渔船作业方式识别装置2000,但不意味着限制各自的数量,渔船作业方式识别***100中可以包含多个数据收集装置1000和/或渔船作业方式识别装置2000。
<实施例二>
随着大数据应用分析领域的发展,数据分析呈现出多来源、多结构、数量大的特点,多源异构数据融合技术作为一种大数据处理分析技术的发展趋势,已经越来越多的应用到各个领域当中。多源、异构数据融合技术可以将多来源、结构化和非结构化的数据进行融合挖掘分析,其比仅仅依靠单一数据源分析更全面、更准确。
本实施例还提供一种渔船作业方式识别方法。图2为本发明实施例示出的渔船作业方式识别方法的流程图,如图2所示,本实施例的方法包括:
S2100,对收集到的多源异构数据进行融合整理,得到融合数据。
S2200,基于所述融合数据构建特征空间,根据所述特征空间提取所述融合数据中每条渔船对应的特征向量,得到多个特征向量。
S2300,利用所述多个特征向了特征向量对分类模型进行训练,得到能够识别每种渔船作业方式的分类模型。
S2400,在渔船作业方式识别时,将采集到的渔船的作业数据输入所述分类模型,利用所述分类模型,识别出渔船的作业方式。
本实施例一方面通过对多源异构数据进行融合,有效的整合多方面的数据信息,使得渔船作业方式识别分类结果更加准确;另一方面通过使用大数据分析技术,对政府政策文件和***数据进行融合分析,为相关监管部门提供了全面、快速、准确的方法;并且本实施例基于多源异构数据的渔船作业方式识别方法具有成本较低的特点,在保证识别准确率的前提下,能够节约资源。
其中,本实施例可以通过下述方法收集多源异构数据:
预先根据每种数据源提供的数据格式设置数据采集工具,每种数据采集工具适用于采集一种数据格式的数据;根据数据源提供的数据格式调用相应的数据采集工具,利用所述数据数据采集工具将采集到的数据保存到预设的文件***中。其中,数据格式包括txt(文本)格式、csv(Comma-Separated Values,CSV,字符分隔值)格式、xls(表格)格式、数据库数据格式(例如MySQL数据库的数据格式)中的一种或多种。
对文本数据,例如txt、csv格式的数据文件,可以通过设计实现功能函数,将数据从文本文件中存储到文件***中,或者直接将文本数据存储到文件***中。对表格数据,例如xls、xlsx格式的数据文件,通过设计实现功能函数,将数据从Excel文件中存储到文件***中,或者直接将Excel文件存储到文件***中。对数据库数据,例如MySQL数据库中的数据,通过使用数据库访问接口将数据从数据库中读取,并存储到文件***中。
在一些实施例中,上述步骤S2100对收集到的多源异构数据进行融合整理,得到融合数据进一步包括:
清除所述多源异构数据中的重复数据,得到处理后的多源异构数据;清除所述处理后的多源异构数据中的噪音数据,得到无噪声的多源异构数据;对所述无噪声的多源异构数据进行格式转换处理,得到同一格式的融合数据。
一个示例中,对多源异构数据进行处理,包括对重复数据和噪音数据的清除、数据格式的转换等处理。
由于数据来源多样,可能存在重复数据,通过使用去重函数或者设计去重函数对重复数据进行去重。
通过使用基于规则的方法,对数据中的噪音数据进行清洗和减少,并在去噪的过程中避免造成有效信息的丢失。例如基于渔船作业航速不超过12节的规则,如果出现的数据显示渔船航速为50节,那么就认为这个数据是噪音数据,予以清除。
在数据收集和存储过程中可能存在数据格式杂乱,不利于后期数据处理,将杂乱的数据格式进行统一转换后存储到文件***。
在一些实施例中,特征向量包括下述特征向量中的一种或多种:
表示休渔期时间特征的特征向量,时间特征包括但不限于休渔期开始与结束的月日时特征;
表示渔船的作业航速在预设航速区间的占比特征的特征向量,预设航速区间包括但不限于航速区间(0,0.5)、航速区间(0.5,4.5)、航速区间(4.5,5.5)和航速区间(5.5,12)四个航速区间;
表示渔船的作业航速在预设航速区间的统计特征的特征向量,预设航速区间包括但不限于航速区间(0,0.5)、航速区间(0.5,4.5)、航速区间(4.5,5.5)三个航速区间,统计特征包括但不限于均值、中位数和标准差;
表示渔船的作业航速在预设航速区间的基于预设位置信息的统计特征的特征向量,预设航速区间包括但不限于航速区间(0,0.5)、航速区间(0.5,4.5)、航速区间(4.5,5.5)三个航速区间,基于预设位置信息的统计特征包括但不限于基于渔船位置经度信息的均值和中位数特征,和/或基于渔船位置纬度信息的均值和中位数特征;
表示渔船的作业航速在预设航速区间的基于航向的统计特征的特征向量,预设航速区间包括但不限于航速区间(0,0.5)、航速区间(0.5,4.5)、航速区间(4.5,5.5)三个航速区间,基于航向的统计特征包括但不限于渔船航向的标准差特征;
表示渔船的作业航速在预设航速区间的记录在所有航速区间的记录中的占比特征的特征向量,包括但不限于航速区间(0.5,4.5)的记录在所有航速区间的记录中的占比特征;
表示预设时间范围的作业渔船在预设航速区间的航速记录在所有航速记录中的占比特征的特征向量,预设时间范围包括但不限于时间范围0:00-5:00、5:00-7:00、5:00-8:00、6:00-11:00、6:00-17:00、12:00-14:00、12:00-17:00、18:00-23:00、18:00-5:00,预设航速区间包括但不限于航速区间(0.5,4.5)。
一个示例,表示休渔期时间特征的特征向量用f1-f6表示,其中,f1-f3分别表示国家政策规定的休渔期开始的月、日和时特征,f3-f6分别表示国家政策规定的休渔期结束的月、日和时等特征。
表示渔船的作业航速在预设航速区间的占比特征的特征向量可以用f7-f10表示,f7-f10表示航速在航速区间(0,0.5)、航速区间(0.5,4.5)、航速区间(4.5,5.5)和航速区间(5.5,12)的占比特征。
表示渔船的作业航速在预设航速区间的统计特征的特征向量用f11-f19表示。其中,f11-f13分别表示航速在航速区间(0,0.5)范围内的均值、中位数和标准差特征,f14-f16分别表示航速在航速区间(0.5,4.5)范围内的均值、中位数和标准差特征,f17-f19分别表示航速在航速区间(4.5,5.5)范围内的均值、中位数和标准差特征。
表示渔船的作业航速在预设航速区间的基于预设位置的统计特征的特征向量用f20-f31表示。其中,f20-f21分别表示经度在航速区间(0,0.5)范围内的均值和中位数特征,f22-f23分别表示经度在航速区间(0.5,4.5)范围内的均值和中位数特征,f24-f25分别表示经度在航速区间(4.5,5.5)范围内的均值和中位数特征,f26-f27分别表示纬度在航速区间(0,0.5)范围内的均值和中位数特征,f28-f29分别表示纬度在航速区间(0.5,4.5)范围内的均值和中位数特征,f30-f31分别表示纬度在航速区间(4.5,5.5)范围内的均值和中位数特征。
表示渔船的作业航速在预设航速区间的基于航向的统计特征的特征向量用f32-f34表示。f32-f34分别表示航向在航速区间(0,0.5)、(0.5,4.5)、(4.5,5.5)范围内的标准差特征。
表示渔船的作业航速在预设航速区间的记录在所有航速区间的记录中的占比特征的特征向量用f35-f58表示,f35-f58分别表示每小时航速在航速区间(0.5,4.5)范围的记录在所有记录中的占比特征。
表示预设时间范围的作业渔船在预设航速区间的航速记录在所有航速记录中的占比特征的特征向量可用f59-f67表示,f59-f67分别表示时间范围0:00-5:00、5:00-7:00、5:00-8:00、6:00-11:00、6:00-17:00、12:00-14:00、12:00-17:00、18:00-23:00、18:00-5:00时航速在航速区间(0.5,4.5)范围内的记录在所有记录中的占比特征。
可以根据融合数据包括的渔船作业方式的特征数量,构建特征空间的维数,特征空间的维数为所述渔船作业方式的特征数量。例如,以上述67种特征数量,可以形成一个维度为67的特征空间,每条渔船都可以在该特征空间中形成一个最大维度为67维的特征向量。
本实施例中的分类模型为决策树模型,例如为XGBOOST模型。在对模型进行训练时,输入样本数据和指定的特征维数,开始构建XGBOOST模型。
对根节点进行***得到两个子节点,在对节点进行***时,枚举所有未选择特征,计算所有特征***后的损失函数增量。
对比***前和***后的模型性能,如果特征***后能够提升模型性能则保留该特征,如果特征***后不能提升模型性能则不保留该特征。
在保留下来的可以通过***提升模型性能的特征中选择对模型性能提升最高的特征作为该节点进行***。其中,在每次进行节点***时,只考虑该节点***前后的情况,不考虑其他节点的情况。
按照上述方式继续进行***,遍历所有训练数据,形成决策树,得到训练好的分类模型。
如图3所示,利用本实施例提供的利用基于融合数据训练得到的分类网络对渔船作业方式的识别准确率要高于基于传统识别方式的准确率。
<实施例三>
本实施例还提供一种渔船作业方式识别装置。图4为本发明实施例示出的渔船作业方式识别装置的结构框图,如图4所示,本实施例的装置包括:
预处理单元4100,用于对收集到的多源异构数据进行融合整理,得到融合数据;基于所述融合数据构建特征空间,根据所述特征空间提取所述融合数据中每条渔船对应的特征向量,得到多个特征向量;利用所述多个特征向了特征向量对分类模型进行训练,得到能够识别每种渔船作业方式的分类模型;
识别单元4200,用于在渔船作业方式识别时,将采集到的渔船的作业数据输入所述分类模型,利用所述分类模型,识别出渔船的作业方式。
在一些实施例中,预处理单元4100包括:数据清洗模块和格式转换模块;
数据清洗模块,清除所述多源异构数据中的重复数据,得到处理后的多源异构数据;清除所述处理后的多源异构数据中的噪音数据,得到无噪声的多源异构数据;
格式转换模块,对所述无噪声的多源异构数据进行格式转换处理,得到同一格式的融合数据。
预处理单元4100还包括:数据收集模块,根据数据源提供的数据格式调用相应的数据采集工具,利用所述数据数据采集工具将采集到的数据保存到预设的文件***中,其中,预先根据每种数据源提供的数据格式设置数据采集工具,每种数据采集工具适用于采集一种数据格式的数据。
预处理单元4100还用于根据所述融合数据包括的渔船作业方式的特征数量,构建特征空间的维数,所述特征空间的维数为所述渔船作业方式的特征数量。
本发明装置实施例中各模块的具体实现方式可以参见本发明方法实施例中的相关内容,在此不再赘述。
<实施例六>
图5为本发明实施例示出的渔船作业方式识别***的结构框图,如图5所示,在硬件层面,该虚拟现实***包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器等。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机可执行指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成渔船作业方式识别装置。处理器,执行存储器所存放的程序实现如上文描述的渔船作业方式识别方法。
上述如本说明书图5所示实施例揭示的渔船作业方式识别装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上文描述的渔船作业方式识别方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述渔船作业方式识别方法的步骤。
本发明还提供了一种计算机可读存储介质。
该计算机可读存储介质存储一个或多个计算机程序,该一个或多个计算机程序包括指令,该指令当被处理器执行时,能够实现上文描述的渔船作业方式识别方法。
为了便于清楚描述本发明实施例的技术方案,在发明的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分,本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定。
以上所述,仅为本发明的具体实施方式,在本发明的上述教导下,本领域技术人员可以在上述实施例的基础上进行其他的改进或变形。本领域技术人员应该明白,上述的具体描述只是更好的解释本发明的目的,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种渔船作业方式识别方法,其特征在于,包括:
对收集到的多源异构数据进行融合整理,得到融合数据;
基于所述融合数据构建特征空间,根据所述特征空间提取所述融合数据中每条渔船对应的特征向量,得到多个特征向量;
利用所述多个特征向了特征向量对分类模型进行训练,得到能够识别每种渔船作业方式的分类模型;
在渔船作业方式识别时,将采集到的渔船的作业数据输入所述分类模型,利用所述分类模型,识别出渔船的作业方式。
2.根据权利要求1所述的方法,其特征在于,所述特征向量包括下述特征向量中的一种或多种:
表示休渔期时间特征的特征向量;
表示渔船的作业航速在预设航速区间的占比特征的特征向量;
表示渔船的作业航速在预设航速区间的统计特征的特征向量;
表示渔船的作业航速在预设航速区间的基于预设位置的统计特征的特征向量;
表示渔船的作业航速在预设航速区间的基于航向的统计特征的特征向量;
表示渔船的作业航速在预设航速区间的记录在所有航速区间的记录中的占比特征的特征向量;
表示预设时间范围的作业渔船在预设航速区间的航速记录在所有航速记录中的占比特征的特征向量。
3.根据权利要求1所述的方法,其特征在于,所述对收集的多源异构数据进行融合整理,得到融合数据,包括:
清除所述多源异构数据中的重复数据,得到处理后的多源异构数据;
清除所述处理后的多源异构数据中的噪音数据,得到无噪声的多源异构数据;
对所述无噪声的多源异构数据进行格式转换处理,得到同一格式的融合数据。
4.根据权利要求1所述的方法,其特征在于,所述多源异构数据的收集方法包括:
预先根据每种数据源提供的数据格式设置数据采集工具,每种数据采集工具适用于采集一种数据格式的数据;
根据数据源提供的数据格式调用相应的数据采集工具,利用所述数据数据采集工具将采集到的数据保存到预设的文件***中。
5.根据权利要求4所述的方法,其特征在于,所述数据格式包括txt格式、csv格式、xls格式、数据库数据格式中的一种或多种。
6.根据权利要求1所述的方法,其特征在于,所述基于所述融合数据构建特征空间,包括:
根据所述融合数据包括的渔船作业方式的特征数量,构建特征空间的维数,所述特征空间的维数为所述渔船作业方式的特征数量。
7.根据权利要求1所述的方法,其特征在于,所述分类模型为决策树模型。
8.一种渔船作业方式识别装置,包括:
预处理单元,用于对收集到的多源异构数据进行融合整理,得到融合数据;基于所述融合数据构建特征空间,根据所述特征空间提取所述融合数据中每条渔船对应的特征向量,得到多个特征向量;利用所述多个特征向了特征向量对分类模型进行训练,得到能够识别每种渔船作业方式的分类模型;
识别单元,用于在渔船作业方式识别时,将采集到的渔船的作业数据输入所述分类模型,利用所述分类模型,识别出渔船的作业方式。
9.一种渔船作业方式识别***,其特征在于,包括:存储器和处理器;
所述存储器,存储计算机可执行指令;
所述处理器,所述计算机可执行指令在被执行时使所述处理器执行如权利要求1-7任一项所述的渔船作业方式识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有一个或多个计算机程序,一个或多个计算机程序被执行时实现如权利要求1-7任一项所述的渔船作业方式识别方法。
CN201911394714.4A 2019-12-30 2019-12-30 一种渔船作业方式识别方法、装置与*** Pending CN111178433A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911394714.4A CN111178433A (zh) 2019-12-30 2019-12-30 一种渔船作业方式识别方法、装置与***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911394714.4A CN111178433A (zh) 2019-12-30 2019-12-30 一种渔船作业方式识别方法、装置与***

Publications (1)

Publication Number Publication Date
CN111178433A true CN111178433A (zh) 2020-05-19

Family

ID=70652203

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911394714.4A Pending CN111178433A (zh) 2019-12-30 2019-12-30 一种渔船作业方式识别方法、装置与***

Country Status (1)

Country Link
CN (1) CN111178433A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116150618A (zh) * 2023-02-02 2023-05-23 中国水产科学研究院东海水产研究所 一种基于深度学习神经网络的渔船作业类型识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109117864A (zh) * 2018-07-13 2019-01-01 华南理工大学 基于异构特征融合的冠心病风险预测方法、模型及***
CN109685086A (zh) * 2017-10-18 2019-04-26 中电科海洋信息技术研究院有限公司 海上船舶作业状态识别方法、装置、设备及存储介质
CN110033051A (zh) * 2019-04-18 2019-07-19 杭州电子科技大学 一种基于多步聚类的拖网渔船行为判别方法
CN110175633A (zh) * 2019-04-29 2019-08-27 杭州电子科技大学 一种基于北斗卫星传输数据的渔船轨迹异常检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109685086A (zh) * 2017-10-18 2019-04-26 中电科海洋信息技术研究院有限公司 海上船舶作业状态识别方法、装置、设备及存储介质
CN109117864A (zh) * 2018-07-13 2019-01-01 华南理工大学 基于异构特征融合的冠心病风险预测方法、模型及***
CN110033051A (zh) * 2019-04-18 2019-07-19 杭州电子科技大学 一种基于多步聚类的拖网渔船行为判别方法
CN110175633A (zh) * 2019-04-29 2019-08-27 杭州电子科技大学 一种基于北斗卫星传输数据的渔船轨迹异常检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郑巧玲: "基于神经网络和VMS的渔船捕捞类型辨别" *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116150618A (zh) * 2023-02-02 2023-05-23 中国水产科学研究院东海水产研究所 一种基于深度学习神经网络的渔船作业类型识别方法

Similar Documents

Publication Publication Date Title
TWI745589B (zh) 風險特徵篩選、描述報文產生方法、裝置以及電子設備
WO2020147488A1 (zh) 异常群体识别方法及装置
JP6229046B2 (ja) 地方なまりを区別する音声データ認識方法、装置及びサーバ
US9542256B2 (en) Analysis stack for an event flow
WO2020140620A1 (zh) 基于智能决策的文本分类方法、装置、服务器及存储介质
EP2791835A1 (en) Boolean logic in a state machine lattice
US11216512B2 (en) Accessible machine learning backends
CN106484915B (zh) 一种海量数据的清洗方法和***
TW201833851A (zh) 風控事件自動處理方法及裝置
CN108984279A (zh) 一种面向物联网传统sql开发人员的流式计算方法
CN109766271B (zh) 混合应用自动化测试方法、装置、电子设备及存储介质
TWI752486B (zh) 訓練方法、特徵提取方法、裝置及電子設備
CN108234452B (zh) 一种网络数据包多层协议识别的***和方法
CN111259212B (zh) 一种遥测数据判读方法、装置、设备及存储介质
CN112765150A (zh) 大数据异构融合提取方法及装置
CN111178433A (zh) 一种渔船作业方式识别方法、装置与***
WO2014109040A1 (ja) 制御方法、制御プログラム、および制御装置
WO2019096176A1 (zh) 数据处理学习方法、***以及电子设备
CN110489242A (zh) 分布式数据计算方法、装置、终端设备及存储介质
EP3200098A1 (en) Methods and apparatus for comparing different types of data
CN115567371B (zh) 一种异常检测方法、装置、设备及可读存储介质
CN115062126A (zh) 一种语句分析方法、装置、电子设备及可读存储介质
WO2022063274A1 (zh) 一种数据标注方法、***和电子设备
CN114598443A (zh) 恶意软件检测器训练方法、检测器、电子设备及存储介质
CN104156228A (zh) 一种客户端短信过滤嵌入式特征库及更新方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination