CN109064191A - 车源数据解析方法、装置及电子设备 - Google Patents

车源数据解析方法、装置及电子设备 Download PDF

Info

Publication number
CN109064191A
CN109064191A CN201810776891.8A CN201810776891A CN109064191A CN 109064191 A CN109064191 A CN 109064191A CN 201810776891 A CN201810776891 A CN 201810776891A CN 109064191 A CN109064191 A CN 109064191A
Authority
CN
China
Prior art keywords
vehicle
information
vehicle system
system information
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810776891.8A
Other languages
English (en)
Inventor
孙如玉
张樊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou One Riding Light Dust Information Technology Co Ltd
Original Assignee
Hangzhou One Riding Light Dust Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou One Riding Light Dust Information Technology Co Ltd filed Critical Hangzhou One Riding Light Dust Information Technology Co Ltd
Priority to CN201810776891.8A priority Critical patent/CN109064191A/zh
Publication of CN109064191A publication Critical patent/CN109064191A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0611Request for offers or quotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • G06Q30/0627Directed, with specific intent or strategy using item specifications

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明实施例涉及数据解析技术领域,具体而言,涉及一种车源数据解析方法、装置及电子设备,应用于卖好车平台中的服务端,所述服务端预存有实时更新的词库,该方法包括:获得纯文本信息,对纯文本信息进行拆分以获得多行信息,提取出每行信息中的关键信息,在词库中查找是否存在品牌信息,若存在,记录该品牌信息并将该品牌信息从纯文本信息中删除,统计出品牌信息下的所有车系,在统计出的所有车系中查找是否存在车系信息,若存在,记录该车系信息并将该车系信息从纯文本信息中删除,在词库中查找是否存在与车系信息和目标指导价信息对应的车型,若存在,查找出车型的优惠价,将车型和优惠价进行显示。采用该方法能够获得准确的车源信息。

Description

车源数据解析方法、装置及电子设备
技术领域
本发明实施例涉及数据解析技术领域,具体而言,涉及一种车源数据解析方法、装置及电子设备。
背景技术
随着汽车或电动车的普及,越来越多的消费者和厂家倾向于在电子商务平台上进行车辆的买卖,由于汽车买卖数量较大,现有的平台大多难以获得准确的车源信息。
发明内容
有鉴于此,本发明提供了一种车源数据解析方法、装置及电子设备,能够获得准确的车源信息。
为实现上述目的,本发明实施例提供了一种车源数据解析方法,应用于卖好车平台中的服务端,所述服务端预存有实时更新的词库,所述方法包括:
获得纯文本信息,对所述纯文本信息进行拆分以获得多行信息;
提取出拆分获得的每行信息中的关键信息;其中,所述关键信息包括品牌信息、车系信息和目标指导价信息;
在所述词库中查找是否存在所述品牌信息,若存在,记录该品牌信息并将该品牌信息从所述纯文本信息中删除;
在所述词库中统计出所述品牌信息下的所有车系,在统计出的所有车系中查找是否存在所述车系信息,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除;
在所述词库中查找是否存在与所述车系信息和所述目标指导价信息对应的车型,若存在,查找出所述车型的优惠价,将所述车型和所述优惠价进行显示。
可选地,所述方法还包括:
从各行信息中提取出所述车型对应的其它关键信息,将所述其它关键信息、所述车型和所述优惠价进行绑定以获得车源信息,将所述车源信息进行显示;其中,所述其它关键词信息包括地域信息、外观颜色信息、联系方式和距离信息。
可选地,若所述词库中不存在所述品牌信息,所述方法还包括:
在所述词库中查找是否存在所述车系信息,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除;
在所述词库中查找是否存在与所述车系信息和所述目标指导价信息对应的车型,若存在,查找出所述车型的优惠价,将所述车型和所述优惠价进行显示。
可选地,在所述词库中统计出该品牌信息下的所有车系,在统计出的车系中查找是否存在所述车系信息,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除的步骤,包括:
若所述车系信息为字母和数字的组合,获取所述字母和数字的组合的同义词,在统计出的所有车系中查找是否存在同义词,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除;
若所述车系信息为纯数字,获取所述纯数字的同义词,在统计出的所有车系中查找是否存在同义词,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除。
本发明实施例还提供了一种车源数据解析装置,应用于卖好车平台中的服务端,所述服务端预存有实时更新的词库,所述装置包括:
信息获取模块,用于获得纯文本信息,对所述纯文本信息进行拆分以获得多行信息;
提取模块,用于提取出拆分获得的每行信息中的关键信息;其中,所述关键信息包括品牌信息、车系信息和目标指导价信息;
品牌匹配模块,用于在所述词库中查找是否存在所述品牌信息,若存在,记录该品牌信息并将该品牌信息从所述纯文本信息中删除;
车系匹配模块,用于在所述词库中统计出所述品牌信息下的所有车系,在统计出的所有车系中查找是否存在所述车系信息,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除;
车型匹配模块,用于在所述词库中查找是否存在与所述车系信息和所述目标指导价信息对应的车型,若存在,查找出所述车型的优惠价,将所述车型和所述优惠价进行显示。
可选地,所述装置还包括车源信息整合模块,用于从各行信息中提取出所述车型对应的其它关键信息,将所述其它关键信息、所述车型和所述优惠价进行绑定以获得车源信息,将所述车源信息进行显示;其中,所述其它关键词信息包括地域信息、外观颜色信息、联系方式和距离信息。
可选地,若所述词库中不存在所述品牌信息,所述车系匹配模块还用于在所述词库中查找是否存在所述车系信息,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除;所述车型匹配模块还用于在所述词库中查找是否存在与所述车系信息和所述目标指导价信息对应的车型,若存在,查找出所述车型的优惠价,将所述车型和所述优惠价进行显示。
可选地,车系匹配模块通过以下方式实现在所述词库中统计出该品牌信息下的所有车系,在统计出的车系中查找是否存在所述车系信息,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除:
若所述车系信息为字母和数字的组合,获取所述字母和数字的组合的同义词,在统计出的车系中查找是否存在同义词,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除;
若所述车系信息为纯数字,获取所述纯数字的同义词,在统计出的车系中查找是否存在同义词,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除。
本发明实施例还提供了一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的车源数据解析方法。
本发明实施例还提供了一种计算机可读存储介质,所述可读存储介质包括计算机程序,所述计算机程序运行时控制所述可读存储介质所在电子设备执行上述的车源数据解析方法。
本发明实施例提供的车源数据解析方法、装置及电子设备,通过对纯文本信息中关键信息的提取,并利用实时更细的词库对关键信息进行匹配,按照符合人们阅读习惯和语义的方式进行匹配、解读,能够获得较为准确的车源信息,为消费者和厂家提供准确的信息来源。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例所提供的一种电子设备10的方框示意图。
图2为本发明实施例所提供的一种车源数据解析方法的流程图。
图3为一实施方式中图2所示的步骤S24包括的子步骤的示意图。
图4为本发明实施例所提供的一种车源数据解析装置20的模块框图。
图标:10-电子设备;11-存储器;12-处理器;13-网络模块;20-车源数据解析装置;21-信息获取模块;22-提取模块;23-品牌匹配模块;24-车系匹配模块;25-车型匹配模块。
具体实施方式
随着汽车或电动车的普及,越来越多的消费者和厂家倾向于在电子商务平台上进行车辆的买卖,发明人经调查发现,由于汽车买卖数量较大,现有的平台大多难以获得准确的车源信息。
以上现有技术中的方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本发明实施例针对上述问题所提出的解决方案,都应该是发明人在本发明过程中对本发明做出的贡献。
基于上述研究,本发明实施例提供了一种车源数据解析方法、装置及电子设备,能够获得准确的车源信息。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
图1示出了本发明实施例所提供的一种电子设备10的方框示意图。本发明实施例中的电子设备10可以为具有数据存储、传输、处理功能的服务端,如图1所示,电子设备10包括:存储器11、处理器12、网络模块13和车源数据解析装置20。
存储器11、处理器12和网络模块13之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件互相之间可以通过一条或多条通讯总线或信号线实现电性连接。存储器11中存储有车源数据解析装置20,所述车源数据解析装置20包括至少一个可以软件或固件(firmware)的形式储存于所述存储器11中的软件功能模块,所述处理器12通过运行存储在存储器11内的软件程序以及模块,例如本发明实施例中的车源数据解析装置20,从而执行各种功能应用以及数据处理,即实现本发明实施例中的车源数据解析方法。
其中,所述存储器11可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器11用于存储程序,所述处理器12在接收到执行指令后,执行所述程序。
所述处理器12可能是一种集成电路芯片,具有数据的处理能力。上述的处理器12可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等。可以实现或者执行本发明实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
网络模块13用于通过网络建立电子设备10与其他通信终端设备之间的通信连接,实现网络信号及数据的收发操作。上述网络信号可包括无线信号或者有线信号。
可以理解,图1所示的结构仅为示意,电子设备10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
本发明实施例还提供一种计算机可读存储介质,所述可读存储介质包括计算机程序。所述计算机程序运行时控制所述可读存储介质所在电子设备10执行下面的车源数据解析方法。
该方法应用于卖好车平台的服务端,服务端预存有实时更新的词库,词库是对车源数据进行解析的前提,从汽车销售行业的最基本纬度来分,包括品牌、车系和车型,需要定期用程序进行同步更新以实现词库的最新化。进一步地,词库中还包括车系的同义词表,同义词表也需要维护,进而实现容错的功能。该方法基于该词库进行解析,能够得到较为准确和全面的车源信息。
图2示出了本发明实施例所提供的一种车源数据解析方法的流程图。所述方法有关的流程所定义的方法步骤应用于电子设备10,可以由所述处理器12实现。下面将对图2所示的具体流程进行详细阐述:
步骤S21,获得纯文本信息,对该纯文本信息进行拆分以获得多行信息。
其中,该纯文本信息为该方法的数据来源,纯文本信息可以来自于车商在各大平台和社交网络发布的车源与寻车信息。该纯文本信息的特点是没有固定格式,依照行业习惯带有品牌、车系、价格、优惠价、颜色、联系人、地域等关键信息,一段纯文本信息可能会有多条车源信息,每一条车源中可能有品牌、车系等信息缺失,一个品牌、车系信息可能会影响多条车源。
由于人们的输入和阅读习惯,会对表达不同意义的信息进行换行。因此需要先做行拆分,便于逐条解析出文本中的车源信息。
步骤S22,提取出拆分获得的每行信息中的关键信息。
其中,关键信息包括品牌信息、车系信息、目标指导价信息和其它关键信息,由于解析的首要目的是根据品牌信息、车系信息、目标指导价信息确定车型,因此首先对品牌信息、车系信息、目标指导价信息进行匹配查找分析。可以理解,可以对提取出的关键信息按照一定规则进行整理,为后面匹配出车型做准备。
步骤S23,在词库中查找是否存在品牌信息,若存在,记录该品牌信息并将该品牌信息从纯文本信息中删除。
在本实施例中,循环词库中的所有品牌去每行信息中进行包含匹配(不区分大小写),例如,词库中的所有品牌可以包括P1、P2和P3,假设关键信息中包括P1,则能够匹配到的品牌为P1,记录P1并将P1从纯文本信息中删除(过滤),如此设置能够避免重复匹配进而导致匹配错误的情况。
步骤S24,在词库中统计出该品牌信息下的所有车系,在统计出的所有车系中查找是否存在车系信息,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除。
若匹配到品牌P1,可以在词库中统计出品牌P1下的所有车系,在这些车系中查找是否存在关键信息中的车系信息,假设关键信息中包括Q1,品牌P1下的所有车系包括Q1、Q2、Q3和Q4,根据上述说明,可以匹配到车系Q1,记录Q1并将Q1从纯文本信息中删除。
进一步地,若步骤S23没有匹配到品牌,那么可以在词库中缓存出来的所有品牌下的所有车系中查找是否存在Q1,若存在,记录Q1并将Q1从纯文本信息中删除。
请结合参阅图3,本实施例中通过步骤S241、步骤S242、步骤S243和步骤S244列举了步骤S24的其中一种实现方式。
步骤S241,判断车系信息的类型。
步骤S242,若车系信息为字母和数字的组合,获取字母和数字的组合的同义词,在统计出的车系中查找是否存在同义词,若存在,记录该车系信息并将该车系信息从纯文本信息中删除。
步骤S243,若车系信息为纯数字,获取纯数字的同义词,在统计出的车系中查找是否存在同义词,若存在,记录该车系信息并将该车系信息从纯文本信息中删除。
步骤S244,若车系信息为别名,获取别名的同义词,在统计出的车系中查找是否存在同义词,若存在,记录该车系信息并将该车系信息从纯文本信息中删除。
通过以上步骤能够准确完整地匹配出车系信息,能够避免遗漏情况的发生。
步骤S25,在所述词库中查找是否存在与所述车系信息和所述目标指导价信息对应的车型,若存在,查找出所述车型的优惠价,将所述车型和所述优惠价进行显示。
例如,关键信息中的目标指导价信息为R1,在查找车型的时候需要判断是否满足两个条件:车系信息+目标指导价信息。因此,在词库中查找是否存在与Q1和R1对应的车型,若存在,该车型就是最后想要的结果。
在查找到该车型之后,继续查找该车型的优惠价,其中,判断该车型是否有优惠价分为两种情况。
情况1,获取关键信息中的优惠价M1,并利用词库对M1进行包含匹配,若能够匹配到,则选取匹配出来的优惠价的最后一个作为该车型的优惠价。
情况2,若没有匹配到优惠价,过滤掉目标指导价R1,用剩余的目标指导价的最后一个作为优惠价。
可选地,还可以从各行信息中提取出其它关键信息,例如地域信息、外观颜色信息、联系方式和距离信息等,可以将这些信息和车型进行绑定以获得车源信息,然后将车源信息进行显示。如此设置,能够获得较为准确的车源信息,且这种方式能够按照符合人们阅读习惯和语义的方式解读出来,得到与人工识别一样的预期结果。目前解析的准确率较高。
在上述基础上,如图4所示,本发明实施例提供了一种车源数据解析装置20,所述车源数据解析装置20包括:信息获取模块21、提取模块22、品牌匹配模块23、车系匹配模块24和车型匹配模块25。
信息获取模块21,用于获得纯文本信息,对所述纯文本信息进行拆分以获得多行信息。
由于信息获取模块21和图2中步骤S21的实现原理类似,因此在此不作更多说明。
提取模块22,用于提取出拆分获得的每行信息中的关键信息;其中,所述关键信息包括品牌信息、车系信息和目标指导价信息。
由于提取模块22和图2中步骤S22的实现原理类似,因此在此不作更多说明。
品牌匹配模块23,用于在所述词库中查找是否存在所述品牌信息,若存在,记录该品牌信息并将该品牌信息从所述纯文本信息中删除。
由于品牌匹配模块23和图2中步骤S23的实现原理类似,因此在此不作更多说明。
车系匹配模块24,用于在所述词库中统计出所述品牌信息下的所有车系,在统计出的所有车系中查找是否存在所述车系信息,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除。
由于车系匹配模块24和图2中步骤S24的实现原理类似,因此在此不作更多说明。
车型匹配模块25,用于在所述词库中查找是否存在与所述车系信息和所述目标指导价信息对应的车型,若存在,查找出所述车型的优惠价,将所述车型和所述优惠价进行显示。
由于车型匹配模块25和图2中步骤S25的实现原理类似,因此在此不作更多说明。
综上,本发明实施例所提供的车源数据解析方法、装置及电子设备,能够利用实时更细的词库对每行信息中的关键信息进行匹配,按照符合人们阅读习惯和语义的方式进行匹配、解读,能够获得较为准确的车源信息,为消费者和厂家提供准确的信息来源。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备10,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种车源数据解析方法,其特征在于,应用于卖好车平台中的服务端,所述服务端预存有实时更新的词库,所述方法包括:
获得纯文本信息,对所述纯文本信息进行拆分以获得多行信息;
提取出拆分获得的每行信息中的关键信息;其中,所述关键信息包括品牌信息、车系信息和目标指导价信息;
在所述词库中查找是否存在所述品牌信息,若存在,记录该品牌信息并将该品牌信息从所述纯文本信息中删除;
在所述词库中统计出所述品牌信息下的所有车系,在统计出的所有车系中查找是否存在所述车系信息,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除;
在所述词库中查找是否存在与所述车系信息和所述目标指导价信息对应的车型,若存在,查找出所述车型的优惠价,将所述车型和所述优惠价进行显示。
2.根据权利要求1所述的车源数据解析方法,其特征在于,所述方法还包括:
从各行信息中提取出所述车型对应的其它关键信息,将所述其它关键信息、所述车型和所述优惠价进行绑定以获得车源信息,将所述车源信息进行显示;其中,所述其它关键词信息包括地域信息、外观颜色信息、联系方式和距离信息。
3.根据权利要求1所述的车源数据解析方法,其特征在于,若所述词库中不存在所述品牌信息,所述方法还包括:
在所述词库中查找是否存在所述车系信息,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除;
在所述词库中查找是否存在与所述车系信息和所述目标指导价信息对应的车型,若存在,查找出所述车型的优惠价,将所述车型和所述优惠价进行显示。
4.根据权利要求1所述的车源数据解析方法,其特征在于,在所述词库中统计出该品牌信息下的所有车系,在统计出的车系中查找是否存在所述车系信息,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除的步骤,包括:
若所述车系信息为字母和数字的组合,获取所述字母和数字的组合的同义词,在统计出的所有车系中查找是否存在该同义词,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除;
若所述车系信息为纯数字,获取所述纯数字的同义词,在统计出的所有车系中查找是否存在该同义词,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除。
5.一种车源数据解析装置,其特征在于,应用于卖好车平台中的服务端,所述服务端预存有实时更新的词库,所述装置包括:
信息获取模块,用于获得纯文本信息,对所述纯文本信息进行拆分以获得多行信息;
提取模块,用于提取出拆分获得的每行信息中的关键信息;其中,所述关键信息包括品牌信息、车系信息和目标指导价信息;
品牌匹配模块,用于在所述词库中查找是否存在所述品牌信息,若存在,记录该品牌信息并将该品牌信息从所述纯文本信息中删除;
车系匹配模块,用于在所述词库中统计出所述品牌信息下的所有车系,在统计出的所有车系中查找是否存在所述车系信息,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除;
车型匹配模块,用于在所述词库中查找是否存在与所述车系信息和所述目标指导价信息对应的车型,若存在,查找出所述车型的优惠价,将所述车型和所述优惠价进行显示。
6.根据权利要求5所述的车源数据解析装置,其特征在于,所述装置还包括车源信息整合模块,用于从各行信息中提取出所述车型对应的其它关键信息,将所述其它关键信息、所述车型和所述优惠价进行绑定以获得车源信息,将所述车源信息进行显示;其中,所述其它关键词信息包括地域信息、外观颜色信息、联系方式和距离信息。
7.根据权利要求5所述的车源数据解析装置,其特征在于,若所述词库中不存在所述品牌信息,所述车系匹配模块还用于在所述词库中查找是否存在所述车系信息,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除;所述车型匹配模块还用于在所述词库中查找是否存在与所述车系信息和所述目标指导价信息对应的车型,若存在,查找出所述车型的优惠价,将所述车型和所述优惠价进行显示。
8.根据权利要求5所述的车源数据解析装置,其特征在于,车系匹配模块通过以下方式实现在所述词库中统计出该品牌信息下的所有车系,在统计出的车系中查找是否存在所述车系信息,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除:
若所述车系信息为字母和数字的组合,获取所述字母和数字的组合的同义词,在统计出的车系中查找是否存在同义词,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除;
若所述车系信息为纯数字,获取所述纯数字的同义词,在统计出的车系中查找是否存在同义词,若存在,记录该车系信息并将该车系信息从所述纯文本信息中删除。
9.一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1~4任一项所述的车源数据解析方法。
10.一种计算机可读存储介质,其特征在于,所述可读存储介质包括计算机程序,所述计算机程序运行时控制所述可读存储介质所在电子设备执行权利要求1~4任一项所述的车源数据解析方法。
CN201810776891.8A 2018-07-16 2018-07-16 车源数据解析方法、装置及电子设备 Pending CN109064191A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810776891.8A CN109064191A (zh) 2018-07-16 2018-07-16 车源数据解析方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810776891.8A CN109064191A (zh) 2018-07-16 2018-07-16 车源数据解析方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN109064191A true CN109064191A (zh) 2018-12-21

Family

ID=64816666

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810776891.8A Pending CN109064191A (zh) 2018-07-16 2018-07-16 车源数据解析方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN109064191A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111861680A (zh) * 2020-08-06 2020-10-30 南京三百云信息科技有限公司 基于配置的车型确定方法、装置以及电子终端
CN113947448A (zh) * 2020-07-16 2022-01-18 北京车行一六八信息技术有限公司 信息发布的处理方法、装置、***和计算机设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636399A (zh) * 2013-11-15 2015-05-20 北京齐尔布莱特科技有限公司 自动获取车源配置信息的方法和装置
CN106021276A (zh) * 2016-04-28 2016-10-12 泰华智慧产业集团股份有限公司 基于分布式全文检索***的卡口车辆搜索的方法及***
CN106815208A (zh) * 2015-12-01 2017-06-09 北京国双科技有限公司 法律裁判文书的解析方法及装置
CN107562780A (zh) * 2017-07-21 2018-01-09 杭州大搜车汽车服务有限公司 一种车辆匹配方法、电子设备及存储介质
CN108052500A (zh) * 2017-12-13 2018-05-18 北京数洋智慧科技有限公司 一种基于语义分析的文本关键信息提取方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636399A (zh) * 2013-11-15 2015-05-20 北京齐尔布莱特科技有限公司 自动获取车源配置信息的方法和装置
CN106815208A (zh) * 2015-12-01 2017-06-09 北京国双科技有限公司 法律裁判文书的解析方法及装置
CN106021276A (zh) * 2016-04-28 2016-10-12 泰华智慧产业集团股份有限公司 基于分布式全文检索***的卡口车辆搜索的方法及***
CN107562780A (zh) * 2017-07-21 2018-01-09 杭州大搜车汽车服务有限公司 一种车辆匹配方法、电子设备及存储介质
CN108052500A (zh) * 2017-12-13 2018-05-18 北京数洋智慧科技有限公司 一种基于语义分析的文本关键信息提取方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113947448A (zh) * 2020-07-16 2022-01-18 北京车行一六八信息技术有限公司 信息发布的处理方法、装置、***和计算机设备
CN111861680A (zh) * 2020-08-06 2020-10-30 南京三百云信息科技有限公司 基于配置的车型确定方法、装置以及电子终端
CN111861680B (zh) * 2020-08-06 2024-03-29 南京三百云信息科技有限公司 基于配置的车型确定方法、装置以及电子终端

Similar Documents

Publication Publication Date Title
CN109033387B (zh) 一种融合多源数据的物联网搜索***、方法及存储介质
US11531717B2 (en) Discovery of linkage points between data sources
CN109271512B (zh) 舆情评论信息的情感分析方法、装置及存储介质
CN108984675B (zh) 基于评价的数据查询方法和装置
US9449271B2 (en) Classifying resources using a deep network
US9454615B2 (en) System and methods for predicting user behaviors based on phrase connections
Chen et al. Big data: related technologies, challenges and future prospects
CN102253936B (zh) 记录用户访问商品信息的方法及搜索方法和服务器
US9946775B2 (en) System and methods thereof for detection of user demographic information
CN103324666A (zh) 一种基于微博数据的话题跟踪方法及装置
CN106991175B (zh) 一种客户信息挖掘方法、装置、设备以及存储介质
US20110208715A1 (en) Automatically mining intents of a group of queries
CN114549874A (zh) 多目标图文匹配模型的训练方法、图文检索方法及装置
CN111444304A (zh) 搜索排序的方法和装置
CN108664609A (zh) 一种数据共享的方法、网络设备及终端
CN111125491A (zh) 商品信息的搜索方法和装置、存储介质及电子装置
CN111538903B (zh) 搜索推荐词确定方法、装置、电子设备及计算机可读介质
CN110533456A (zh) 一种优惠券信息推送方法、***及服务器
CN110032616A (zh) 一种文档阅读情况的采集方法及装置
US20140236939A1 (en) Systems and methods for topical grouping of search results and organizing of search results
CN110109870A (zh) 一种基于Solr的海量数据快速检索***
CN109064191A (zh) 车源数据解析方法、装置及电子设备
CN113157871B (zh) 应用人工智能的新闻舆情文本处理方法、服务器及介质
US20140280150A1 (en) Multi-source contextual information item grouping for document analysis
CN109064342A (zh) 客户身份识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181221