CN104008206A - 一种大规模Web服务图生成器 - Google Patents

一种大规模Web服务图生成器 Download PDF

Info

Publication number
CN104008206A
CN104008206A CN201410273206.1A CN201410273206A CN104008206A CN 104008206 A CN104008206 A CN 104008206A CN 201410273206 A CN201410273206 A CN 201410273206A CN 104008206 A CN104008206 A CN 104008206A
Authority
CN
China
Prior art keywords
parameter
web service
semantic
accumulation unit
matching device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410273206.1A
Other languages
English (en)
Inventor
覃事刚
熊国权
徐谦
胡俊达
叶义红
黎治福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZUNYI CHANGZHENG ELECTRICAL SWITCH DEVICES CO Ltd
Original Assignee
ZUNYI CHANGZHENG ELECTRICAL SWITCH DEVICES CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZUNYI CHANGZHENG ELECTRICAL SWITCH DEVICES CO Ltd filed Critical ZUNYI CHANGZHENG ELECTRICAL SWITCH DEVICES CO Ltd
Priority to CN201410273206.1A priority Critical patent/CN104008206A/zh
Publication of CN104008206A publication Critical patent/CN104008206A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种大规模Web服务图生成器,包括WSDL文档解析器、参数聚集器、参数匹配器、优化器、Web服务图存储器和语义中间转换器,WSDL文档解析器、参数聚集器、参数匹配器、优化器、Web服务图存储器依次相连,语义中间转换器与参数匹配器相连。本发明Web服务图生成器通过WSDL文档的解析、聚类,匹配,使构建大规模Web服务图变得容易,大规模Web服务图为服务发现、服务组合等方面研究提供丰富的数据基础和新的研究途径,在大规模Web服务图基础上挖掘有效的增值服务意义也非常重大。

Description

一种大规模Web服务图生成器
技术领域
本发明属于计算机应用领域,特别涉及一种大规模Web服务图生成器。
背景技术
现实世界的服务之间是存在一定的依赖关系的,只是它们之间的依赖关系不明显,是隐式的,有可能不被计算机直接识别。随着互联网上服务的急剧增长,如何发现服务间依赖关系是一个很有意义的研究课题。为了实现快速发现服务间依赖关系,构建大规模的Web服务图,本发明提出了一种大规模Web服务图生成器。
发明内容
本发明的目的是提供一种大规模Web服务图生成器,该大规模Web服务图生成器能在给定的服务集中快速挖掘出Web服务间依赖关系并构建Web服务图。
为实现上述目的,本发明的技术方案为:
一种大规模Web服务图生成器,包括WSDL文档解析器、参数聚集器、参数匹配器、优化器、Web服务图存储器和语义中间转换器,WSDL文档解析器、参数聚集器、参数匹配器、优化器、Web服务图存储器依次相连,语义中间转换器与参数匹配器相连。
其中,WSDL文档解析器主要是利用开源工具包WSDL4J进行解析。
其中,参数聚集器主要是对参数进行聚类,构建参数相同或相近的概念集合。包括输入参数聚集单元和输出参数聚集单元,输入参数聚集单元和输出参数聚集单元并行运行,均处理前面的WSDL文档解析器的输出,为参数匹配器提供输入,互不影响。
其中,参数匹配器以参数聚集器中输入参数聚集单元和输出参数聚集单元的输出为输入,通对参数相似度的匹配计算,判断Web服务间是否构成关联,在参数匹配时,需要使用语义中间转换器。
其中,优化器对初步生成的 Web服务图进行约简、合并,最终输出Web服务图到存储器;
其中,Web服务图存储器用于接收经过优化器处理好后的Web服务图并进行存储;
其中,语义中间转换器主要是运用语义词典Word-Net、中文分词方法和基于向量空间的相似度计算方法实现参数间的语义相似度计算,为参数匹配器提供数据。
本发明Web服务图生成器的有益效果:通过WSDL文档的解析、聚类,匹配,使构建大规模Web服务图变得容易,大规模Web服务图为服务发现、服务组合等方面研究提供丰富的数据基础和新的研究途径,在大规模Web服务图基础上挖掘有效的增值服务意义也非常重大。
附图说明
图1为本发明Web服务图生成器的工作原理框图。
具体实施方式
下面将结合附图和具体实施例对本发明做进一步详细说明:
如图1所示,一种开放式服务依赖图构造器,包括WSDL文档解析器、参数聚集器、参数匹配器、优化器、Web服务图存储器和语义中间转换器,WSDL文档解析器、参数聚集器、参数匹配器、优化器、Web服务图存储器依次相连,语义中间转换器与参数匹配器相连。
WSDL文档解析器主要是利用开源工具包WSDL4J进行解析。
参数聚集器主要是对参数进行聚类,构建参数相同或相近的概念集合。包括输入参数聚集单元和输出参数聚集单元,输入参数聚集单元和输出参数聚集单元并行运行,均处理前面的WSDL文档解析器的输出,为参数匹配器提供输入,互不影响。
参数匹配器以参数聚集器中输入参数聚集单元和输出参数聚集单元的输出为输入,通对参数相似度的匹配计算,判断Web服务间是否构成关联,在参数匹配时,需要使用语义中间转换器。
语义中间转换器主要是运用语义词典Word-Net、中文分词方法和基于向量空间的相似度计算方法实现参数间的语义相似度计算,为参数匹配器提供数据。
一种大规模Web服务图生成器工作原理是:首先WSDL文档解析对WSDL文档库中的WSDL文档进行解析出对应Web服务的文档内容,包括服务名、操作名、对应的参数等,参数聚集器中的输入参数聚集单元和输出参数聚集单元分别按解析出来的输入参数和输出参数对Web服务进行聚类,生成输入参数服务概念集合和输出参数服务概念集合,参数匹配器结合语义中间转换器,对输入参数服务概念集合和输出参数服务概念的参数进行匹配关联,如关联成功,则对应的服务之间添加一条边,直到所有的输入参数服务概念和输出参数服务概念都匹配完成后,初步生成Web服务图,优化器对初步生成的 Web服务图进行约简、合并,最终输出Web服务图到存储器。

Claims (2)

1.一种大规模Web服务图生成器,其特征在于:该生成器包括WSDL文档解析器、参数聚集器、参数匹配器、优化器、Web服务图存储器和语义中间转换器,所述WSDL文档解析器、参数聚集器、参数匹配器、优化器、Web服务图存储器依次相连,语义中间转换器与参数匹配器相连;
——所述WSDL文档解析器主要是利用开源工具包WSDL4J进行解析;
——所述参数聚集器主要是对参数进行聚类,构建参数相同或相近的概念集合;
——所述参数匹配器以参数聚集器中输入参数聚集单元和输出参数聚集单元的输出为输入,通对参数相似度的匹配计算,判断Web服务间是否构成关联,在参数匹配时,需要使用语义中间转换器;
——所述优化器对初步生成的 Web服务图进行约简、合并,最终输出Web服务图到存储器;
——所述Web服务图存储器用于接收经过优化器处理好后的Web服务图并进行存储;
——所述语义中间转换器主要是运用语义词典Word-Net、中文分词方法和基于向量空间的相似度计算方法实现参数间的语义相似度计算,为参数匹配器提供数据。
2.根据权利要求1所述大规模Web服务图生成器,其特征在于:所述参数聚集器包括输入参数聚集单元和输出参数聚集单元,输入参数聚集单元和输出参数聚集单元并行运行,均处理前面的WSDL文档解析器的输出,为参数匹配器提供输入。
CN201410273206.1A 2014-06-19 2014-06-19 一种大规模Web服务图生成器 Pending CN104008206A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410273206.1A CN104008206A (zh) 2014-06-19 2014-06-19 一种大规模Web服务图生成器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410273206.1A CN104008206A (zh) 2014-06-19 2014-06-19 一种大规模Web服务图生成器

Publications (1)

Publication Number Publication Date
CN104008206A true CN104008206A (zh) 2014-08-27

Family

ID=51368863

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410273206.1A Pending CN104008206A (zh) 2014-06-19 2014-06-19 一种大规模Web服务图生成器

Country Status (1)

Country Link
CN (1) CN104008206A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101567005A (zh) * 2009-05-07 2009-10-28 浙江大学 一种基于WordNet的语义服务注册与查询方法
CN101605141A (zh) * 2008-08-05 2009-12-16 天津大学 基于语义的Web服务关系网络***
US20100125504A1 (en) * 2008-11-17 2010-05-20 Riaz Ahmed Agha Product or service comparison notification system and method
CN102043863A (zh) * 2010-12-30 2011-05-04 浙江大学 一种Web服务聚类的方法
CN102622396A (zh) * 2011-11-30 2012-08-01 浙江大学 一种基于标签的web服务聚类方法
CN102799629A (zh) * 2012-06-26 2012-11-28 天津大学 Wsdl文件质量保证***及其实现方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101605141A (zh) * 2008-08-05 2009-12-16 天津大学 基于语义的Web服务关系网络***
US20100125504A1 (en) * 2008-11-17 2010-05-20 Riaz Ahmed Agha Product or service comparison notification system and method
CN101567005A (zh) * 2009-05-07 2009-10-28 浙江大学 一种基于WordNet的语义服务注册与查询方法
CN102043863A (zh) * 2010-12-30 2011-05-04 浙江大学 一种Web服务聚类的方法
CN102622396A (zh) * 2011-11-30 2012-08-01 浙江大学 一种基于标签的web服务聚类方法
CN102799629A (zh) * 2012-06-26 2012-11-28 天津大学 Wsdl文件质量保证***及其实现方法

Similar Documents

Publication Publication Date Title
CN104361031A (zh) 一种政务大数据预处理***及处理方法
CN105162855A (zh) 增量数据同步方法和装置
CN102073706B (zh) 分布式文件存储***和关系数据库的结合应用方法
CN103699739B (zh) 一种运载火箭飞行时序自动设计与生成***
CN103871402A (zh) 语言模型训练***、语音识别***及相应方法
CN104281698A (zh) 一种高效的大数据查询方法
CN106959948A (zh) 针对分布式特性对大数据进行预处理的***及其预处理方法
CN103646029A (zh) 一种针对博文的相似度计算方法
CN103034553A (zh) 一种报表设计器智能验证的算法、方法及装置
CN101609466A (zh) 海量数据查重的方法和***
CN104008206A (zh) 一种大规模Web服务图生成器
CN103617171A (zh) 一种海量历史数据快速查询***
CN103530399A (zh) 一种新闻情报处理***
CN111723297B (zh) 一种面向网格社情研判的双重语义相似度判别方法
Blaise Cruz et al. Localization of Fake News Detection via Multitask Transfer Learning
CN102521239A (zh) 一种基于owl的互联网问答信息匹配***及其匹配方法
CN102184320A (zh) 用于it***应用考评拓展平台的自动计算引擎
CN117349318A (zh) 面向大数据场景的智能化快递数据查询方法、装置及设备
CN202351853U (zh) 一种基于云计算的语音输入***
CN103646317A (zh) 一种应用于项目管理***的实时数据智能关联计算方法
Jeong et al. A method for generating and combining classifiers for large scale data
Zhang et al. The improved algorithm of semantic similarity based on the multi-dictionary
Teimoori Faal On Gosper-Karaji algebraic Identities
Xue et al. Application for Product Features Extraction and Sentiment Analysis from Online User Reviews
Skone Gathering and boosting centrifugal compression venting

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140827

RJ01 Rejection of invention patent application after publication