CN115223730A - 一种解决商品基本信息标准化的方法和对应的装置 - Google Patents

一种解决商品基本信息标准化的方法和对应的装置 Download PDF

Info

Publication number
CN115223730A
CN115223730A CN202210804181.8A CN202210804181A CN115223730A CN 115223730 A CN115223730 A CN 115223730A CN 202210804181 A CN202210804181 A CN 202210804181A CN 115223730 A CN115223730 A CN 115223730A
Authority
CN
China
Prior art keywords
matched
data
commodity
standardization
solving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210804181.8A
Other languages
English (en)
Inventor
童兵
孙浩
吴海波
臧立峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Small Pharmaceutical Technology Co ltd
Original Assignee
Wuhan Small Pharmaceutical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Small Pharmaceutical Technology Co ltd filed Critical Wuhan Small Pharmaceutical Technology Co ltd
Priority to CN202210804181.8A priority Critical patent/CN115223730A/zh
Publication of CN115223730A publication Critical patent/CN115223730A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Primary Health Care (AREA)
  • Computational Linguistics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Toxicology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Public Health (AREA)
  • Medicinal Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种解决商品基本信息标准化的方法,包括下述步骤:步骤1,采集销售方输入到平台中的待匹配商品数据并将其存入中间数据库中;步骤2,将存于中间数据库中的待匹配数据分别调取并进行标准化匹配;步骤3,对于匹配成功的待匹配数据,则由标准数据库的商品信息覆盖该待匹配数据;对于匹配不成功的待匹配数据,则在所述标准数据库中新建该待匹配数据对应的标准数据。

Description

一种解决商品基本信息标准化的方法和对应的装置
技术领域
本发明涉及平台数据整理领域,特别是一种解决商品基本信息标准化的方法,还涉及对应的装置。
背景技术
药品信息的特点在于药品信息的数据量非常巨大,具体而言,仅药品种类而言,就存在约十几万种,而随着新药品的开发,药品种类的数量还将不断增加。另外,由于制造商、供应商、使用方式、批号、规格等不同又可以将每一种药品划分成几十种参考系,也就是说,每一种药品的药品信息可以包含几十种药品子信息。
平台售卖商品有四五十个商品属性,不同的商业提供的商品属性多样并且没有统一的标准,从而回导致平台售卖的商品信息具有很大的差异性。
故此本专利通过拉取商业某些商品基本信息,通过平台的匹配引擎和平台商品库的商品匹配,匹配成功后回写商品信息,保证商品属性的标准化,同时提高商业新增商品效率、减少平台运营人员和质管人员的工作。
医药商业在平台售卖商品只能手工维护,或者批量导入。但是依然存在药品信息不全以及与无法满足平台对医药商业的药品全部字段要求。
如何快速将医药商品信息标准化成为行业研发团队急需解决的问题。
发明内容
一种解决商品基本信息标准化的方法,包括下述步骤:
步骤1,采集销售方输入到平台中的待匹配商品数据并将其存入中间数据库中;
步骤2,将存于中间数据库中的待匹配数据分别调取并进行标准化匹配;
步骤3,对于匹配成功的待匹配数据,则由标准数据库的商品信息覆盖该待匹配数据;对于匹配不成功的待匹配数据,则在所述标准数据库中新建该待匹配数据对应的标准数据。
在本发明的一个优选实施例中,所述待匹配数据包含商品UPC编码、通用名称、规格、生产厂家和批准文号商品基本属性。
在本发明的一个优选实施例中,所述标准化匹配采用如下标准字段:UPC编码+批准文号、通用名称+规格、批准文号+生产厂家+规格、批准文号,一旦所述字段之一匹配成功则进入到步骤3。
在本发明的一个优选实施例中,所述商品包括医药商品。
在本发明的一个优选实施例中,在步骤2中还包括步骤2.1,对待匹配数据进行纠错。
在本发明的一个优选实施例中,所述步骤2.1包括:步骤2.1.1通过标准化检索式检索常见的非规范表达方式;
步骤2.1.2,将所检索到的非规范表达方式替换为规范的表达方式以便接下来的匹配工作。
在本发明的一个优选实施例中,所述非规范表达方式包括与标准数据库不一致的量纲。
在本发明的一个优选实施例中,标准化检索式为正则表达式。
本发明还涉及一种按照所述的解决商品基本信息标准化的方法进行的解决商品基本信息标准化的装置,包括采集销售方输入到平台中的待匹配商品数据的采集装置,将存于中间数据库中的待匹配数据分别调取并进行标准化匹配的匹配装置,对于匹配成功的待匹配数据,则由标准数据库的商品信息覆盖该待匹配数据的回填装置。
在本发明的一个优选实施例中,还包括中间数据库、标准化数据库和新建装置,该新建装置用于对于匹配不成功的待匹配数据,则在所述标准数据库中新建该待匹配数据对应的标准数据。
附图说明
图1为本发明的解决商品基本信息标准化的方法的架构流程图;
图2为示出了本发明的解决商品基本信息标准化的装置的组成和相互作用关系简示图;
图3为本发明的解决商品基本信息标准化的方法的流程图并分别示出参与的各个角色和起的作用。
图4为本发明的解决商品基本信息标准化的方法的纠错步骤;
图5和6为本发明的技术效果对比图。
具体实施方式
如图1所示,原始数据通过本发明的方法进行了加工处理,该原始数据一般来自销售方,其一般会含有图中使出的字段,UPC编码,通用名称,规格,生产厂家和/或者批准文号,
因此本发明的一种解决商品基本信息标准化的方法,会对其进行如下操作:
步骤1,采集销售方输入到平台中的待匹配商品数据并将其存入中间数据库中;
步骤2,将存于中间数据库中的待匹配数据分别调取并进行标准化匹配;
步骤3,对于匹配成功的待匹配数据,则由标准数据库的商品信息覆盖该待匹配数据;对于匹配不成功的待匹配数据,则在所述标准数据库中新建该待匹配数据对应的标准数据。
图1中在采集数据后还进行了规格纠错,下面将会详细描述该规格纠错步骤。在图1中,通过UPC编码和批准文号这两个字段首先进行匹配,如果匹配成功则直接进入到回写商品信息的步骤中,上面也指出了所述回写的过程。如果匹配不成功,则进入到通用名称和规格字段的匹配,成功了则直接进入到回写商品信息的步骤中,上面也指出了所述回写的过程。如果匹配不成功则选择标准文号、生产厂家和规格字段进行匹配,进行如上工作,直到批准文号字段匹配依然不成功,则进入新建的步骤。
因此可知道,所述待匹配数据包含商品UPC编码、通用名称、规格、生产厂家和批准文号商品基本属性。
所述标准化匹配采用如下标准字段:UPC编码+批准文号、通用名称+规格、批准文号+生产厂家+规格、批准文号,一旦所述字段之一匹配成功则进入到步骤3。
本发明中的所述商品包括医药商品,一般来自药品公司,通过平台进行售卖。
如图4所示,在步骤2中还包括步骤2.1,对待匹配数据进行纠错。
所述步骤2.1包括:步骤2.1.1通过标准化检索式检索常见的非规范表达方式;
步骤2.1.2,将所检索到的非规范表达方式替换为规范的表达方式以便接下来的匹配工作。
首先依据正则规则表达式建立检索式,将商业提报的商品原规格数据进行纠错处理。针对的规格示例如图4中的第二列所示,其中的数量和量纲及其表达方式是不规范的。
因此在本发明的一个优选实施例中,所述非规范表达方式包括与标准数据库不一致的量纲。
在本发明的一个优选实施例中,标准化检索式为正则表达式。
在图2和3中分别针对商业,尤其是医药公司,服务端,也成为平台,平台商品库,包括中间数据库和标准数据库,以及服务调度层。图中是粗了相应的动作逻辑和流程。在图2中用***数字按顺序标明了各个动作的顺序:动作1,拉取数据;动作2返回数据;动作3保存数据;动作4匹配任务执行;动作5拉取待匹配数据;动作6返回数据;动作7四层匹配;动作8返回数据;动作9更新商品数据;动作10结束。在图中没有图示出本发明的新建步骤,但该新建步骤是非常重要的,对于完善标准化数据库,增加平台的自动化,提高效率是非常重要的。
图3中给出了商品匹配流程,即第一层匹配:根据药品UPC编码+批准文号与平台商品库匹配
第二层匹配:根据通用名称+规格与平台商品库匹配
第三层匹配:根据批准文号+生产厂家+规格与平台商品库匹配
第四层匹配:根据批准文号与平台商品库匹配
本发明还涉及一种按照所述的解决商品基本信息标准化的方法进行的解决商品基本信息标准化的装置,包括采集销售方输入到平台中的待匹配商品数据的采集装置,将存于中间数据库中的待匹配数据分别调取并进行标准化匹配的匹配装置,对于匹配成功的待匹配数据,则由标准数据库的商品信息覆盖该待匹配数据的回填装置。
在本发明的一个优选实施例中,还包括中间数据库、标准化数据库和新建装置,该新建装置用于对于匹配不成功的待匹配数据,则在所述标准数据库中新建该待匹配数据对应的标准数据。
本发明的技术效果如图5和6所示,本发明采用4层匹配引擎与平台商品匹配,通过匹配商品标准库信息,拉取商品标准库中的信息回写商业商品数据,将商品信息标准化率从60%提升到95%。本发明采用4层匹配引擎与平台商品匹配,通过匹配商品标准库信息,拉取商品标准库中的信息回写商业商品数据,从而减少商业维护商品的工作,极大提升商业上品效率。(商业2万个商品,过去人工需要10*8=80小时,目前只需要1小时)。
上述各实施例仅是本发明的优选实施方式,在本技术领域内,凡是基于本发明技术方案上的变化和改进,不应排除在本发明的保护范围之外。

Claims (10)

1.一种解决商品基本信息标准化的方法,其特征在于,包括下述步骤:
步骤1,采集销售方输入到平台中的待匹配商品数据并将其存入中间数据库中;
步骤2,将存于中间数据库中的待匹配数据分别调取并进行标准化匹配;
步骤3,对于匹配成功的待匹配数据,则由标准数据库的商品信息覆盖该待匹配数据;对于匹配不成功的待匹配数据,则在所述标准数据库中新建该待匹配数据对应的标准数据。
2.根据权利要求1所述的解决商品基本信息标准化的方法,其特征在于,所述待匹配数据包含商品UPC编码、通用名称、规格、生产厂家和批准文号商品基本属性。
3.根据权利要求2所述的解决商品基本信息标准化的方法,其特征在于,所述标准化匹配采用如下标准字段:UPC编码+批准文号、通用名称+规格、批准文号+生产厂家+规格、批准文号,一旦所述字段之一匹配成功则进入到步骤3。
4.根据权利要求3所述的解决商品基本信息标准化的方法,其特征在于,所述商品包括医药商品。
5.根据权利要求4所述的解决商品基本信息标准化的方法,其特征在于,在步骤2中还包括步骤2.1,对待匹配数据进行纠错。
6.根据权利要求5所述的解决商品基本信息标准化的方法,其特征在于,所述步骤2.1包括:步骤2.1.1通过标准化检索式检索常见的非规范表达方式;
步骤2.1.2,将所检索到的非规范表达方式替换为规范的表达方式以便接下来的匹配工作。
7.根据权利要求6所述的解决商品基本信息标准化的方法,其特征在于,所述非规范表达方式包括与标准数据库不一致的量纲。
8.根据权利要求7所述的解决商品基本信息标准化的方法,其特征在于,标准化检索式为正则表达式。
9.一种按照权利要求1-8中任一项所述的解决商品基本信息标准化的方法进行的解决商品基本信息标准化的装置,其特征在于,包括采集销售方输入到平台中的待匹配商品数据的采集装置,将存于中间数据库中的待匹配数据分别调取并进行标准化匹配的匹配装置,对于匹配成功的待匹配数据,则由标准数据库的商品信息覆盖该待匹配数据的回填装置。
10.根据权利要求9所述的解决商品基本信息标准化的装置,其特征在于,还包括中间数据库、标准化数据库和新建装置,该新建装置用于对于匹配不成功的待匹配数据,则在所述标准数据库中新建该待匹配数据对应的标准数据。
CN202210804181.8A 2022-07-09 2022-07-09 一种解决商品基本信息标准化的方法和对应的装置 Pending CN115223730A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210804181.8A CN115223730A (zh) 2022-07-09 2022-07-09 一种解决商品基本信息标准化的方法和对应的装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210804181.8A CN115223730A (zh) 2022-07-09 2022-07-09 一种解决商品基本信息标准化的方法和对应的装置

Publications (1)

Publication Number Publication Date
CN115223730A true CN115223730A (zh) 2022-10-21

Family

ID=83609040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210804181.8A Pending CN115223730A (zh) 2022-07-09 2022-07-09 一种解决商品基本信息标准化的方法和对应的装置

Country Status (1)

Country Link
CN (1) CN115223730A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115545809A (zh) * 2022-12-02 2022-12-30 广州数说故事信息科技有限公司 电商商品的标品库构建方法、数据对齐方法、装置和设备
CN117056376A (zh) * 2023-08-30 2023-11-14 北京星汉博纳医药科技有限公司 一种信息处理方法、装置及设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115545809A (zh) * 2022-12-02 2022-12-30 广州数说故事信息科技有限公司 电商商品的标品库构建方法、数据对齐方法、装置和设备
CN117056376A (zh) * 2023-08-30 2023-11-14 北京星汉博纳医药科技有限公司 一种信息处理方法、装置及设备
CN117056376B (zh) * 2023-08-30 2024-07-19 浙江星汉博纳医药科技有限公司 一种信息处理方法、装置及设备

Similar Documents

Publication Publication Date Title
CN115223730A (zh) 一种解决商品基本信息标准化的方法和对应的装置
US10127209B2 (en) Transforming unstructured documents
US5125091A (en) Object oriented control of real-time processing
US20090164305A1 (en) System and method for managing product quality
US11061380B2 (en) Production management system and production management method
MXPA06014205A (es) Sistema computacional para disenar y manufacturar eficientemente dispositivos de multiples componentes.
CN102467699B (zh) 对缺陷管理建模及基于缺陷管理处理缺陷的方法
Realyvásquez-Vargas et al. Improving a manufacturing process using the 8ds method. A case study in a manufacturing company
CN112231133A (zh) 一种数据修复处理方法、装置及电子设备
CN112307036A (zh) 一种药品数据库录入药品信息记录的方法
US20130124457A1 (en) Apparatus, system and method of storing, tracking and disseminating documents related to food products
US20090276669A1 (en) Method for processing and redirecting misdirected advanced shipping notices (ASNs)
Hassan et al. Development of an order processing system using Google Sheets and Appsheet for a Malaysian automotive SME factory warehouse
US20070255705A1 (en) Method of evaluating document conformance
US20060085209A1 (en) Establishment of vehicle item categories
US20050075955A1 (en) Order fulfillment architecture having an electronic customs invoice system
CN115496440B (zh) 一种二手车库存量的确定方法及装置
US20060010172A1 (en) System and method for generating text
US7123975B2 (en) Manufacturing management system and method
US11170153B2 (en) Smart procedure parser
JP2001265580A (ja) レビュー支援システム及びそれに用いるレビュー支援方法
US20140136445A1 (en) Securities lending records processing
CN117332284B (zh) 线下医疗数据匹配算法及***
US20100011009A1 (en) System and method for monitoring document conformance
US20230342281A1 (en) Branching data monitoring watchpoints to enable continuous integration and continuous delivery of data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination