CN108416033A - 一种用于汽车研发的数据分析方法、装置及终端 - Google Patents
一种用于汽车研发的数据分析方法、装置及终端 Download PDFInfo
- Publication number
- CN108416033A CN108416033A CN201810200963.4A CN201810200963A CN108416033A CN 108416033 A CN108416033 A CN 108416033A CN 201810200963 A CN201810200963 A CN 201810200963A CN 108416033 A CN108416033 A CN 108416033A
- Authority
- CN
- China
- Prior art keywords
- data
- sorted
- classification
- development
- automobile
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000012827 research and development Methods 0.000 title claims abstract description 34
- 238000007405 data analysis Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012217 deletion Methods 0.000 claims description 8
- 230000037430 deletion Effects 0.000 claims description 8
- 238000003860 storage Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 4
- 235000013399 edible fruits Nutrition 0.000 claims description 3
- 238000011160 research Methods 0.000 abstract description 14
- 238000012545 processing Methods 0.000 abstract description 11
- 239000000047 product Substances 0.000 description 36
- 238000012857 repacking Methods 0.000 description 16
- 238000005516 engineering process Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000011161 development Methods 0.000 description 7
- 230000018109 developmental process Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 208000037656 Respiratory Sounds Diseases 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000005336 cracking Methods 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 206010011376 Crepitations Diseases 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 244000097202 Rathbunia alamosensis Species 0.000 description 1
- 235000009776 Rathbunia alamosensis Nutrition 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Manufacturing & Machinery (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种用于汽车研发的数据分析方法、装置及终端,所述方法包括:获取至少一个预存数据库中存储的至少两条待分类数据;按照预存的关键词匹配规则,对每一条所述待分类数据进行关键词匹配,确定每一条所述待分类数据所属零部件分类;确定每一所述零部件分类对应的数据分类结果,并输出。通过对从至少一个预存数据库中获取到的待分析数据,按照预存的关键词匹配规则进行关键词匹配,进而获得每一零部件分类对应的数据分析结果。智能化的实现对各个数据库中获得无序杂乱的数据源进行了分类整理,便于研发人员的数据获取,以指导汽车的设计开发,提高产品竞争力;同时,提高了数据处理的效率和准确性,降低了人员及时间成本。
Description
技术领域
本发明涉及数据分析领域,尤其涉及一种用于汽车研发的数据分析方法、装置及终端。
背景技术
随着互联网技术的快速发展、互联网与传统产业的加速融合、国家大数据战略的提出,数据作为新时代的商业资源,开始呈现爆发式增长的趋势,正快速推动着我国数字化进程的发展。与此同时,汽车产业在能源、交通、环境、多元化需求的压力下,面临产业转型升级的挑战。这两方面因素对传统汽车产业的冲击,将导致传统的以产品厂商为中心向以服务客户为中心的商业模式转化,能否贴合消费者的需求去打造面向未来的企业和商业模式,决定了未来十年企业的发展和行业地位。
虽然大数据挖掘技术在我国得到快速的发展,但在我国汽车行业上的应用还较少,目前汽车行业多以人工的方式进行数据的分析,主要存在以下几个问题:
1、缺乏实时获取完整、正确信息的手段
目前传统汽车行业多采用人工的方式浏览查阅汽车之家、易车网、新浪等主流汽车网站,收集互联网上行业动态、用户需求、用户吐槽等信息,时效性低且容易发生遗漏。
2、数据处理效率低
采用人工方式进行数据的处理分析,形成报表等输出物,花费时间较多,且多为重复工作,劳动价值较低。
3、企业无法及时从海量数据中提取有效信息。
由于人力、时间等因素的限制,通过人工的方式,企业只能从有限的数据中提取一定有价值的信息,无法及时处理互联网上海量的数据并提取有效信息。
4、无法快速响应市场变化
目前客户的个性化需求日益增多,研发设计人员没有一个实时获取用户需求的渠道;目前市场变化迅速,领导层缺乏进行科学决策的依据,以响应市场的变化;设计人员难以获取行业最新技术及相关资料来指导设计。
发明内容
本发明提供了一种用于汽车研发的数据分析方法、装置及终端,以解决现有技术中无法对互联网数据进行汽车产品研发分析的问题。
为解决上述技术问题,本发明实施例提供了一种用于汽车研发的数据分析方法,包括:
获取至少一个预存数据库中存储的至少两条待分类数据;
按照预存的关键词匹配规则,对每一条所述待分类数据进行关键词匹配,确定每一条所述待分类数据所属零部件分类;
确定每一所述零部件分类对应的数据分类结果,并输出。
优选地,每一所述关键词匹配规则中,包括:第一属性关键词和第二属性关键词,所述第一属性关键词和所述第二属性关键词之间的位置关系,以及所述第一属性关键词和所述第二属性关键词之间的间隔字符;
其中,所述第一属性关键词为汽车的零部件,所述第二属性关键词为表示所述零部件的性能好的第一类型词汇和/或表示所述零部件的性能差的第二类型词汇。
优选地,获取至少一个预存数据库中存储的至少两条待分类数据的步骤包括:
从至少一个预存数据库中提取出至少一条初始数据;
对所述初始数据依次进行无效数据删除和冗余数据删除,获得至少两条待分类数据。
优选地,对所述初始数据依次进行无效数据删除和冗余数据删除的步骤包括:
对所述初始数据中的正文内容为空的无效数据进行删除;
对所述初始数据中的统一资源定位符URL重复的冗余数据进行删除。
优选地,按照预存的关键词匹配规则,对每一条所述待分类数据进行关键词匹配,确定每一条所述待分类数据所属零部件分类的步骤之前,所述方法还包括:
按照预存的每一预存数据库对应的行业属性分类,将每一预存数据库对应的其中一部分待分类数据分别进行行业属性分类;
确定每一行业属性分类对应的待分类数据,并保存。
优选地,所述方法还包括:
获取用户输入的目标关键词;
确定与所述目标关键词对应的目标数据结果,对所述目标数据结果进行输出;
其中,所述目标数据结果中包括:与所述目标关键词对应的目标分类数据和/或与所述目标分类数据对应的问题解决信息。
根据本发明的另一方面,本发明实施例还提供了一种用于汽车研发的数据分析装置,包括:
第一获取模块,用于获取至少一个预存数据库中存储的至少两条待分类数据;
第一确定模块,用于按照预存的关键词匹配规则,对每一条所述待分类数据进行关键词匹配,确定每一条所述待分类数据所属零部件分类;
第二确定模块,用于确定每一所述零部件分类对应的数据分类结果,并输出。
优选地,每一所述关键词匹配规则中,包括:第一属性关键词和第二属性关键词,所述第一属性关键词和所述第二属性关键词之间的位置关系,以及所述第一属性关键词和所述第二属性关键词之间的间隔字符;
其中,所述第一属性关键词为汽车的零部件,所述第二属性关键词为表示所述零部件的性能好的第一类型词汇和/或表示所述零部件的性能差的第二类型词汇。
优选地,第一获取模块包括:
提取单元,用于从至少一个预存数据库中提取出至少一条初始数据;
删除单元,用于对所述初始数据依次进行无效数据删除和冗余数据删除,获得至少两条待分类数据。
优选地,删除单元包括:
第一删除子单元,用于对所述初始数据中的正文内容为空的无效数据进行删除;
第二删除子单元,用于对所述初始数据中的统一资源定位符URL重复的冗余数据进行删除。
优选地,所述装置还包括:
分类模块,用于按照预存的每一预存数据库对应的行业属性分类,将每一预存数据库对应的其中一部分待分类数据分别进行行业属性分类;
第三确定模块,用于确定每一行业属性分类对应的待分类数据,并保存。
优选地,所述装置还包括:
第二获取模块,用于获取用户输入的目标关键词;
第四确定模块,用于确定与所述目标关键词对应的目标数据结果,对所述目标数据结果进行输出;
其中,所述目标数据结果中包括:与所述目标关键词对应的目标分类数据和/或与所述目标分类数据对应的问题解决信息。
另一方面,本发明实施例还提供了一种终端,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述的用于汽车研发的数据分析方法的步骤。
另一方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的用于汽车研发的数据分析方法的步骤。
这样,本发明的实施例中,通过对从至少一个预存数据库中获取到的待分析数据,按照预存的关键词匹配规则进行关键词匹配,进而获得每一零部件分类对应的数据分析结果。智能化的实现对各个数据库中获得无序杂乱的数据源进行了分类整理,便于研发人员的数据获取,以指导汽车的设计开发,提高产品竞争力;同时,提高了数据处理的效率和准确性,降低了人员及时间成本。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1表示本发明实施例的用于汽车研发的数据分析方法的流程图之一;
图2表示本发明实施例的步骤101的流程图;
图3表示本发明实施例的步骤1012的流程图;
图4表示本发明实施例的用于汽车研发的数据分析方法的流程图之二;
图5表示本发明实施例的用于汽车研发的数据分析方法的流程图之三;
图6表示本发明实施例设计的汽车产品结构的结构示意图;
图7表示本发明实施例中通过条形图输出形式对汽车底盘的制动结构中的数据分类结果进行输出的示意图;
图8表示本发明实施例中将两家不同公司的产品进行比对分析的示意图;
图9为本发明实施例中从互联网上获取到的某一改装车系在特定时间段内的数据的示意图;
图10为本发明实施例中从互联网上获取到的某一改装车系在特定时间段内的使用改装元件的数据的示意图;
图11表示本发明实施例的用于汽车研发的数据分析装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1,本发明实施例提供了一种用于汽车研发的数据分析方法,应用于终端,包括:
步骤101,获取至少一个预存数据库中存储的至少两条待分类数据。
其中,在该步骤101中,至少一个预存数据库是指已经预先与本发明实施例中的终端之间建立通信连接的数据库。终端与该至少一个预存数据库之间建立通信协议,在一预定时间段进行数据获取(如每一周的特定时间获取一次)。这些预存数据库是指行业属性为汽车行业的相关网站的数据库,例如:人民网、中国汽车工业协会、全国汽车标准化技术委员会、汽车销量网等汽车行业动态类网站,爱卡汽车、汽车之家、易车网、车质网等主流汽车网站,越野E族、无敌改装网等改装类网站。
其中,参照图2,步骤101具体包括:
步骤1011,从至少一个预存数据库中提取出至少一条初始数据。
至少两条待分类数据可以是每一预存数据库中的全部数据。也可以是与用户输入的第一关键词相关的数据,该第一关键词可以是汽车上的某一特定零部件,也可以是汽车公司的某一车系,例如,为进行某一车系A的产品研发,需要对竞争对手B公司的车系为B2的产品进行数据收集,此时,终端侧通过向至少一个预存数据库中发送携带有获取B公司的B2车系的全部数据的数据请求,至少一个预存数据库在收到终端发送的该数据请求后,提取出该B公司的B2车系的全部数据,发送给终端,终端在收到至少一个预存数据库发送的数据后,形成为上述步骤1011中的至少一条初始数据。
在本发明实施例中,该步骤101还包括:
步骤1012,对所述初始数据依次进行无效数据删除和冗余数据删除,获得至少两条待分类数据。
由于至少一个预存数据库在向该终端发送的数据中,可能存在内容重复的数据或者无效数据,为了提高数据的有效性,在本发明实施例中,参照图3,该步骤1012具体包括:
步骤10121,对所述初始数据中的正文内容为空的无效数据进行删除;
步骤10122,对所述初始数据中的统一资源定位符URL重复的冗余数据进行删除。
其中,在步骤10121中,若初始数据的仅包括主题、作者、时间等字段,但正文内容为空,则认为该初始数据为无效数据。
在步骤10122中,对冗余数据的判断,是通过统一资源定位符URL进行比对的,若存在至少两条初始数据中的统一资源定位符URL相同,则认为存在冗余数据,将至少两条初始数据中的一条数据进行保留,将剩余的相同数据删除。
通过无效数据和冗余数据删除处理,能够保证保存在终端的数据库中的数据的有效性。
步骤102,按照预存的关键词匹配规则,对每一条所述待分类数据进行关键词匹配,确定每一条所述待分类数据所属零部件分类。
优选地,在本发明实施例中,每一所述关键词匹配规则中,包括:第一属性关键词和第二属性关键词,所述第一属性关键词和所述第二属性关键词之间的位置关系,以及所述第一属性关键词和所述第二属性关键词之间的间隔字符;
其中,所述第一属性关键词为汽车的零部件,所述第二属性关键词为表示所述零部件的性能好的第一类型词汇和/或表示所述零部件的性能差的第二类型词汇。
本发明实施例中,首先根据汽车的研发体系,设定了底盘、动力、电子电器、车身、内外饰、产品整体这六大本体,将上述6部分划分为一级结构,并细化扩展两级(对一级结构进行进一部分划分为二级结构,对二级结构进一步划分为三级结构),建立了汽车产品结构,最终形成一如下图6所示的汽车产品结构。
其中,在上述关键词匹配规则中,第一属性关键词即为上述的三级结构中的产品部件,该第一属性关键词可以为汽车产品结构的一级结构、二级结构和三级结构中的至少一个。
在上述关键词匹配规则中,第一属性关键词和第二属性关键词之间的间隔字符可以为第一属性关键词和第二属性关键词之间的间隔词(用near表示),或者为第一属性关键词和第二属性关键词之间的间隔段落(用prg表示),抑或为第一属性关键词和第二属性关键词之间的间隔句子(用aft表示)。
根据第一属性关键词和第二属性关键词的不同形式的组合,形成不同零部件结构对应的多个关键词匹配规则。例如:'A/NEAR X B',表示第一属性关键词A位于第二属性关键词B之前,且第一属性关键词A与第二属性关键词B之间的间隔词为10词。举例说明,某一关键词匹配规则为:'边梁/NEAR 10变形'+'边梁/NEAR 10破'+'边梁/NEAR 10破损'+'边梁/NEAR 10裂纹'+'边梁/NEAR 10裂'+'边梁/NEAR 10开裂',在该关键词匹规则中,边梁为第一属性关键词(边梁为三级结构),“破、变形、破损、裂纹、开裂”均为第二属性关键词,其均为表示该第一属性关键词(边梁)的性能差的第二类型词汇;且,第一属性关键词(边梁)位于第二属性关键词(破、变形、破损、裂纹、开裂)之前,“near 10”是指该第一属性关键词与第二属性关键词之间的间隔词为10个词。
在本发明实施例中,通过预先进行多次试验,结合不同的问题,形成一套完善的、基于汽车产品结构的关键词匹配规则。通过该套关键词匹配规则,能够对终端内存储的海量待分类数据进行自动的分词处理,使海量的待分类数据碎片化、结构化,形成可以结构化的数据。
步骤103,确定每一所述零部件分类对应的数据分类结果,并输出。
在通过对每一关键词匹配规则进行匹配后,确定每一零部件分类对应的数据分类结果,并将其保存在数据库中,便于研发人员使用。
其中,在步骤103中,对于确定好的数据分类结果,可以采用不同的输出形式进行输出。输出形式具体为:通过气泡图、条形图、饼图或折线图等形式输出,同时,通过百分比或者实际数量的方式进行展示。如7中,通过气泡图的形式对该数据分类结果进行输出,用户根据气泡的大小可以确定某一特定系列车型中,受到消费者关注度最高的具体产品部件。例如图7中,通过条形图的方式对终端中存储的汽车底盘的制动结构中的数据分类结果进行展示。
对于数据分类结果进行输出的步骤具体为:
获取用户所选取的输出形式;
按照该输出形式,对数据分类结果进行输出。
同时,在本发明实施例中,对于该数据分类结果的输出还可以按照时间维度、地域维度、数据来源等维度来对数据分类结果进行输出。例如,按照时间维度对数据分类结果进行输出的具体方式为:按照从至少一个预存数据库获取到该待分类数据的时间进行输出。通过采集到的时间信息,获取问题数量与时间的折线图,可通过趋势获知相应的改进措施是否有效;通过采集到地域信息,获取问题与地域间的关系图,用于指导具备地域特性问题的处理及备件方案的制定。研发人员可以根据不同时间段内的数据分类结果比对分析,对不同系列产品的相同部件进行对比分析(如图8所示,左侧为本公司产品,右侧为竞争公司产品),确定本公司产品短板,以及其它系列产品可借鉴参考的相关信息。在参考竞品,改进自身劣势的同时,发挥自身产品的优势,以提升产品竞争力。
在本发明实施例中,应当强调的是,本发明中终端的用户更侧重于汽车研发人员,研发人员通过终端中进行数据分类获得的结果,能够及时了解汽车行业的行业发展以及消费者对汽车产品的使用评价,进而针对数据结果进行产品优化,提高产品竞争力。
本发明上述实施例中,通过对从至少一个预存数据库中获取到的待分析数据,按照预存的关键词匹配规则进行关键词匹配,进而获得每一零部件分类对应的数据分析结果。智能化的实现对各个数据库中获得无序杂乱的数据源进行了分类整理,便于研发人员的数据获取,以指导汽车的设计开发,提高产品竞争力;同时,提高了数据处理的效率和准确性,降低了人员及时间成本。
优选地,参照图4,在本发明实施例中,该步骤102之前,所述方法还包括:
步骤104,按照预存的每一预存数据库对应的行业属性分类,将每一预存数据库对应的其中一部分待分类数据分别进行行业属性分类;
步骤105确定每一行业属性分类对应的待分类数据,并保存。
其中,在步骤104中,行业属性分类包括:行业动态类(包括行业政策、行业销售、最新技术、行业动态四小类)、问题发现类、定制改装类,每一预存数据库对应的行业属性分类是根据该数据库的使用属性来确定的,例如人民网、中国汽车工业协会、全国汽车标准化技术委员会、汽车销量网等网站的主要业务是对汽车行业的相关动态进行展示,即将该行业属性划分为行业动态类,而对于越野E族、无敌改装网等改装类网站的主要业务是涉及零部件改装,即将该类网站的行业属性划分为定制改装类。
汽车研发人员可以通过步骤105中按照行业属性分类保存的待分类数据进行初步查询与获取(可根据数据源的信息发布时间的先后顺序进行查看,并支持数据的下载、收藏、原文查看等),确定某一特定时间段内消费者的关注点,以及关注程度的高低。并可以结合该关注度的程度高低进行趋势预测,对产品进行优化,从而提高产品竞争力。
其中,在本发明实施例中,在某一目标关键词匹配规则中的第二属性关键词为该零部件的性能差的第二类型词汇时,本发明实施例的方法还包括:
从与终端预先建立通信连接的第一数据库中查找解决该零部件的性能差的问题解决信息,并将该目标关键词匹配规则与该问题解决信息进行存储。
其中,该第一数据库为期刊文献网站数据库,专利网站数据库。
优选地,参照图5,在本发明实施例中,所述方法还包括:
步骤106,获取用户输入的目标关键词;
步骤107,确定与所述目标关键词对应的目标数据结果,对所述目标数据结果进行输出;
其中,所述目标数据结果中包括:与所述目标关键词对应的目标分类数据和/或与所述目标分类数据对应的问题解决信息。
其中,在步骤106中,用户为汽车研发人员,汽车研发人员在进行产品研发前,可能需要进行产品调研,此时,用户在终端内输入目标关键词(该目标关键词可以是文字输入的,也可以是按照前述划分的产品结构进行依次选取形成的),终端根据该目标关键词从数据库中查找对应的目标数据结果。根据目标关键词匹配出的专业文献、前沿技术、标准法规、类似问题处理办法等供工程师参考和使用,按匹配关注度进行排序,推送最准确的解决方案。例如,用户输入的目标关键词为:边梁变形,则终端从存储的数据源中查找与该目标关键词匹配的、且经过分类的分类数据以及与每一条分类数据对应的问题解决信息,并按照匹配度的高低顺序进行排列展示输出,推送最准确的解决方案。
本发明的上述用于汽车研发的数据分析方法,可以应用在改装车系,根据改装车系的名称,时间,获得某车系的改装趋势,获知改装热度;并可根据改装原件的名称及品牌,进一步获得改装原件及相关品牌的热度,用于指导定制改装方案的制定及实施,甚至可作为改款及改进方向的依据。如图9为本发明实施例中应用在某xx车系改装趋势分析图,从该图中可以确定应用在2017年的6月至8月,互联网上涉及到该xx车系的改装趋势。图10为该xx车系在2017年6月至8月期间,设计到的具体改装元件。
本发明实施例的上述方法,能够实现对互联网数据全面、及时、有效地采集及结构化存储,并能根据需求的变化,配置采集的数据源、内容以及采集的周期等,保证了数据获取的高效、全面;实现从海量数据中快速处理提取对用户有价值的信息,并以图形化的方式展示,提高了数据处理的效率及准确性,降低了人员及时间成本。
根据汽车研发企业的需求,构建了产品三级结构,并针对不同部件归纳了可预见的质量问题600余项,建立了解决方案匹配规则,实现了问题的自动分类统计和进一步查询检索,帮助研发人员发现问题,解决问题,改进产品。
实时推送和统计行业最新动态、行业最新技术、销售数据及技术发展方向等信息,指导用户及时了解与解读最新的国家、地方关于汽车行业的行为准则及发展趋势,为设计人员、开发人员获得最新的行业技术及动态,指导汽车的设计开发。
提取互联网关于越野车的改装信息,获取用户改装的个性化需求,包括改装的热门车系、原件、品牌等,指导定制改装方案的制定及实施,甚至可作为改款及改进方向的依据。
实现了自身车型与竞争车型的问题对比,发现自身及竞品的优劣势,在参考竞品,改进自身劣势的同时,发挥自身产品的优势,以提升产品竞争力。
经过广泛收集、深入分析和整合多方面的数据资源,积累了用户行为和喜好倾向数据,数据挖掘清洗分析的舆情数据,汽车行业专业词库,逐步形成了适用于汽车行业的数据分析库。在以数据为王的时代,平台积累形成的数据分析库,将成为企业巨大的财富应用于研发相关的各个领域。
根据本发明的另一方面,本发明实施例还提供了一种用于汽车研发的数据分析装置,参照图11,包括:
第一获取模块201,用于获取至少一个预存数据库中存储的至少两条待分类数据;
第一确定模块202,用于按照预存的关键词匹配规则,对每一条所述待分类数据进行关键词匹配,确定每一条所述待分类数据所属零部件分类;
第二确定模块203,用于确定每一所述零部件分类对应的数据分类结果,并输出。
优选地,每一所述关键词匹配规则中,包括:第一属性关键词和第二属性关键词,所述第一属性关键词和所述第二属性关键词之间的位置关系,以及所述第一属性关键词和所述第二属性关键词之间的间隔字符;
其中,所述第一属性关键词为汽车的零部件,所述第二属性关键词为表示所述零部件的性能好的第一类型词汇和/或表示所述零部件的性能差的第二类型词汇。
优选地,第一获取模块包括:
提取单元,用于从至少一个预存数据库中提取出至少一条初始数据;
删除单元,用于对所述初始数据依次进行无效数据删除和冗余数据删除,获得至少两条待分类数据。
优选地,删除单元包括:
第一删除子单元,用于对所述初始数据中的正文内容为空的无效数据进行删除;
第二删除子单元,用于对所述初始数据中的统一资源定位符URL重复的冗余数据进行删除。
优选地,所述装置还包括:
分类模块,用于按照预存的每一预存数据库对应的行业属性分类,将每一预存数据库对应的其中一部分待分类数据分别进行行业属性分类;
第三确定模块,用于确定每一行业属性分类对应的待分类数据,并保存。
优选地,所述装置还包括:
第二获取模块,用于获取用户输入的目标关键词;
第四确定模块,用于确定与所述目标关键词对应的目标数据结果,对所述目标数据结果进行输出;
其中,所述目标数据结果中包括:与所述目标关键词对应的目标分类数据和/或与所述目标分类数据对应的问题解决信息。
本发明实施例提供的用于汽车研发的数据分析装置能够实现图1至图5的方法实施例中移动终端实现的各个过程,为避免重复,这里不再赘述。通过对从至少一个预存数据库中获取到的待分析数据,按照预存的关键词匹配规则进行关键词匹配,进而获得每一零部件分类对应的数据分析结果。智能化的实现对各个数据库中获得无序杂乱的数据源进行了分类整理,便于研发人员的数据获取,以指导汽车的设计开发,提高产品竞争力;同时,提高了数据处理的效率和准确性,降低了人员及时间成本。
另一方面,本发明实施例还提供了一种终端,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述的用于汽车研发的数据分析方法的步骤。
另一方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的用于汽车研发的数据分析方法的步骤。
以上所述的是本发明的优选实施方式,应当指出对于本技术领域的普通人员来说,在不脱离本发明所述的原理前提下还可以作出若干改进和润饰,这些改进和润饰也在本发明的保护范围内。
Claims (14)
1.一种用于汽车研发的数据分析方法,其特征在于,包括:
获取至少一个预存数据库中存储的至少两条待分类数据;
按照预存的关键词匹配规则,对每一条所述待分类数据进行关键词匹配,确定每一条所述待分类数据所属零部件分类;
确定每一所述零部件分类对应的数据分类结果,并输出。
2.根据权利要求1所述的用于汽车研发的数据分析方法,其特征在于,每一所述关键词匹配规则中,包括:第一属性关键词和第二属性关键词,所述第一属性关键词和所述第二属性关键词之间的位置关系,以及所述第一属性关键词和所述第二属性关键词之间的间隔字符;
其中,所述第一属性关键词为汽车的零部件,所述第二属性关键词为表示所述零部件的性能好的第一类型词汇和/或表示所述零部件的性能差的第二类型词汇。
3.根据权利要求1所述的用于汽车研发的数据分析方法,其特征在于,获取至少一个预存数据库中存储的至少两条待分类数据的步骤包括:
从至少一个预存数据库中提取出至少一条初始数据;
对所述初始数据依次进行无效数据删除和冗余数据删除,获得至少两条待分类数据。
4.根据权利要求3所述的用于汽车研发的数据分析方法,其特征在于,对所述初始数据依次进行无效数据删除和冗余数据删除的步骤包括:
对所述初始数据中的正文内容为空的无效数据进行删除;
对所述初始数据中的统一资源定位符URL重复的冗余数据进行删除。
5.根据权利要求1所述的用于汽车研发的数据分析方法,其特征在于,按照预存的关键词匹配规则,对每一条所述待分类数据进行关键词匹配,确定每一条所述待分类数据所属零部件分类的步骤之前,所述方法还包括:
按照预存的每一预存数据库对应的行业属性分类,将每一预存数据库对应的其中一部分待分类数据分别进行行业属性分类;
确定每一行业属性分类对应的待分类数据,并保存。
6.根据权利要求1所述的用于汽车研发的数据分析方法,其特征在于,所述方法还包括:
获取用户输入的目标关键词;
确定与所述目标关键词对应的目标数据结果,对所述目标数据结果进行输出;
其中,所述目标数据结果中包括:与所述目标关键词对应的目标分类数据和/或与所述目标分类数据对应的问题解决信息。
7.一种用于汽车研发的数据分析装置,其特征在于,包括:
第一获取模块,用于获取至少一个预存数据库中存储的至少两条待分类数据;
第一确定模块,用于按照预存的关键词匹配规则,对每一条所述待分类数据进行关键词匹配,确定每一条所述待分类数据所属零部件分类;
第二确定模块,用于确定每一所述零部件分类对应的数据分类结果,并输出。
8.根据权利要求7所述的用于汽车研发的数据分析装置,其特征在于,每一所述关键词匹配规则中,包括:第一属性关键词和第二属性关键词,所述第一属性关键词和所述第二属性关键词之间的位置关系,以及所述第一属性关键词和所述第二属性关键词之间的间隔字符;
其中,所述第一属性关键词为汽车的零部件,所述第二属性关键词为表示所述零部件的性能好的第一类型词汇和/或表示所述零部件的性能差的第二类型词汇。
9.根据权利要求7所述的用于汽车研发的数据分析装置,其特征在于,第一获取模块包括:
提取单元,用于从至少一个预存数据库中提取出至少一条初始数据;
删除单元,用于对所述初始数据依次进行无效数据删除和冗余数据删除,获得至少两条待分类数据。
10.根据权利要求9所述的用于汽车研发的数据分析装置,其特征在于,删除单元包括:
第一删除子单元,用于对所述初始数据中的正文内容为空的无效数据进行删除;
第二删除子单元,用于对所述初始数据中的统一资源定位符URL重复的冗余数据进行删除。
11.根据权利要求7所述的用于汽车研发的数据分析装置,其特征在于,所述装置还包括:
分类模块,用于按照预存的每一预存数据库对应的行业属性分类,将每一预存数据库对应的其中一部分待分类数据分别进行行业属性分类;
第三确定模块,用于确定每一行业属性分类对应的待分类数据,并保存。
12.根据权利要求7所述的用于汽车研发的数据分析装置,其特征在于,所述装置还包括:
第二获取模块,用于获取用户输入的目标关键词;
第四确定模块,用于确定与所述目标关键词对应的目标数据结果,对所述目标数据结果进行输出;
其中,所述目标数据结果中包括:与所述目标关键词对应的目标分类数据和/或与所述目标分类数据对应的问题解决信息。
13.一种终端,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的用于汽车研发的数据分析方法的步骤。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的用于汽车研发的数据分析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810200963.4A CN108416033A (zh) | 2018-03-12 | 2018-03-12 | 一种用于汽车研发的数据分析方法、装置及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810200963.4A CN108416033A (zh) | 2018-03-12 | 2018-03-12 | 一种用于汽车研发的数据分析方法、装置及终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108416033A true CN108416033A (zh) | 2018-08-17 |
Family
ID=63130947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810200963.4A Pending CN108416033A (zh) | 2018-03-12 | 2018-03-12 | 一种用于汽车研发的数据分析方法、装置及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108416033A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112328591A (zh) * | 2019-08-05 | 2021-02-05 | 安徽智数汽车科技有限公司 | 一种基于汽车研发的大数据应用***运行方法及存储介质 |
CN112712501A (zh) * | 2020-12-28 | 2021-04-27 | 江苏合泰飞梵科技有限公司 | 一种基于人工智能的后视镜组装生产方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010022378A1 (en) * | 2008-08-21 | 2010-02-25 | Satya Reddy | Interrelated item search |
CN103902652A (zh) * | 2014-02-27 | 2014-07-02 | 深圳市智搜信息技术有限公司 | 自动问答*** |
CN105404644A (zh) * | 2015-10-27 | 2016-03-16 | 北京红马传媒文化发展有限公司 | 一种舆情信息处理方法和*** |
CN107577724A (zh) * | 2017-08-22 | 2018-01-12 | 佛山市高研信息技术有限公司 | 一种大数据处理方法 |
CN108320255A (zh) * | 2017-01-16 | 2018-07-24 | 软通动力信息技术(集团)有限公司 | 一种信息处理方法及装置 |
-
2018
- 2018-03-12 CN CN201810200963.4A patent/CN108416033A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010022378A1 (en) * | 2008-08-21 | 2010-02-25 | Satya Reddy | Interrelated item search |
CN103902652A (zh) * | 2014-02-27 | 2014-07-02 | 深圳市智搜信息技术有限公司 | 自动问答*** |
CN105404644A (zh) * | 2015-10-27 | 2016-03-16 | 北京红马传媒文化发展有限公司 | 一种舆情信息处理方法和*** |
CN108320255A (zh) * | 2017-01-16 | 2018-07-24 | 软通动力信息技术(集团)有限公司 | 一种信息处理方法及装置 |
CN107577724A (zh) * | 2017-08-22 | 2018-01-12 | 佛山市高研信息技术有限公司 | 一种大数据处理方法 |
Non-Patent Citations (2)
Title |
---|
崔立真 等: "《大数据驱动创新方法工作平台》", 31 October 2017 * |
郭永菊: "《电子器件领域专利检索策略及应用》", 30 June 2015 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112328591A (zh) * | 2019-08-05 | 2021-02-05 | 安徽智数汽车科技有限公司 | 一种基于汽车研发的大数据应用***运行方法及存储介质 |
CN112712501A (zh) * | 2020-12-28 | 2021-04-27 | 江苏合泰飞梵科技有限公司 | 一种基于人工智能的后视镜组装生产方法 |
CN112712501B (zh) * | 2020-12-28 | 2021-10-26 | 江苏合泰飞梵科技有限公司 | 一种基于人工智能的后视镜组装生产方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102023989B (zh) | 一种信息检索方法及其*** | |
CN101246499B (zh) | 网络信息搜索方法及*** | |
CN111831802B (zh) | 一种基于lda主题模型的城市领域知识检测***及方法 | |
CN105426514A (zh) | 个性化的移动应用app推荐方法 | |
CN101477554A (zh) | 基于用户兴趣的个性化元搜索引擎及搜索结果处理方法 | |
CN101609459A (zh) | 一种情感特征词提取*** | |
CN103810168A (zh) | 检索应用的方法、装置及终端 | |
CN109101551B (zh) | 一种问答知识库的构建方法及装置 | |
CN101082936A (zh) | 数据查询***及方法 | |
CN103116635A (zh) | 面向领域的暗网资源采集方法和*** | |
CN101630315B (zh) | 一种快速检索方法及*** | |
CN107463711A (zh) | 一种数据的标签匹配方法及装置 | |
CN103544307A (zh) | 一种不依赖文档库的多搜索引擎自动化对比评测方法 | |
CN103020083B (zh) | 需求识别模板的自动挖掘方法、需求识别方法及对应装置 | |
CN108416033A (zh) | 一种用于汽车研发的数据分析方法、装置及终端 | |
CN112149422A (zh) | 一种基于自然语言的企业新闻动态监测方法 | |
CN110532265B (zh) | 基于产品使用手册构建问答***的方法、装置及计算设备 | |
CN101807183A (zh) | 关键词汇实时扩展方法、***及其计算机可擦写记录媒体 | |
CN103729374A (zh) | 一种信息搜索方法及搜索引擎 | |
TW201415275A (zh) | 取證系統、取證方法及取證程式 | |
CN103150307B (zh) | 从网络中查找与主题词相关的名称的方法和设备 | |
Cortez et al. | A flexible approach for extracting metadata from bibliographic citations | |
CN110209804B (zh) | 目标语料的确定方法和装置、存储介质及电子装置 | |
CN103823847A (zh) | 一种关键词的扩充方法及装置 | |
CN105975508A (zh) | 个性化元搜索引擎检索结果合成排序方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200508 Address after: 100130 Zhaofeng Town, Shunyi District, Beijing Zhaofeng industrial base Tongxin Road No. 1 Applicant after: BAIC GROUP ORV Co.,Ltd. Address before: 101300, 99, Shuanghe Avenue, Renhe Town, Beijing, Shunyi District Applicant before: BEIJING AUTOMOBILE RESEARCH GENERAL INSTITUTE Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180817 |
|
RJ01 | Rejection of invention patent application after publication |