CN108491395B - 酒店房型聚合方法、装置、电子设备及存储介质 - Google Patents
酒店房型聚合方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN108491395B CN108491395B CN201810118214.7A CN201810118214A CN108491395B CN 108491395 B CN108491395 B CN 108491395B CN 201810118214 A CN201810118214 A CN 201810118214A CN 108491395 B CN108491395 B CN 108491395B
- Authority
- CN
- China
- Prior art keywords
- language
- room type
- type information
- word
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004220 aggregation Methods 0.000 title claims abstract description 66
- 230000002776 aggregation Effects 0.000 title claims abstract description 66
- 238000000034 method Methods 0.000 title claims abstract description 61
- 230000004931 aggregating effect Effects 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims description 15
- 230000001419 dependent effect Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 9
- 238000006116 polymerization reaction Methods 0.000 claims description 7
- 239000003795 chemical substances by application Substances 0.000 description 51
- 239000002775 capsule Substances 0.000 description 22
- 235000009355 Dianthus caryophyllus Nutrition 0.000 description 17
- 240000006497 Dianthus caryophyllus Species 0.000 description 17
- 238000010586 diagram Methods 0.000 description 3
- 239000011324 bead Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/12—Hotels or restaurants
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Machine Translation (AREA)
Abstract
本申请酒店房型聚合方法,属于计算机技术领域,解决现有技术中酒店房型信息不准确的问题。所述方法包括:对代理商输出的指定酒店的第一语言房型信息,通过预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果;将第一语言房型信息基于所述预设第一词库的翻译结果进行融合,得到所述第一语言房型信息对应的第二语言房型信息;对所述第一语言房型信息对应的第二语言房型信息进行聚合,确定所述指定酒店的第二语言房型信息。本申请通过将代理商提供的酒店房型信息先翻译,后聚合,有效提升了得到的房型信息的准确度。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种酒店房型聚合方法、装置、电子设备及存储介质。
背景技术
OTA(全称为Online Travel Agency,中文译为“在线旅行社”),如携程、去哪、艺龙、飞猪等,在布局海外酒店市场时,通常会接入很多酒店代理商,以获取丰富的酒店客房资源。在接入多个酒店代理商时,会出现同一家酒店由多个代理商提供酒店数据的情况,为了将同一家酒店相同房型的数据放在一起在客户端端展示,方便用户快速找到最合适产品,首先需要确定不同代理商提供的该酒店的房型的信息中,哪些是同一房型,就是房型聚合的过程。现有技术中仅是简单的将不同代理商提供的该酒店的房型的信息中,完全相同的房型信息聚合到一起,对于统一房型,由于不同代理商设置了不同房型信息的情况,无法进行准确聚合。
可见,现有技术中酒店房型聚合方法至少存在聚合得到的房型信息不准确的缺陷。
发明内容
本申请提供一种酒店房型聚合方法,至少解决现有技术中酒店房型聚合方法存在的聚合得到的酒店房型信息不准确的问题。
为了解决上述问题,第一方面,本申请实施例提供了一种酒店房型聚合方法包括:
对代理商输出的指定酒店的第一语言房型信息,通过预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果;
将第一语言房型信息基于所述预设第一词库的翻译结果进行融合,得到所述第一语言房型信息对应的第二语言房型信息;
对所述第一语言房型信息对应的第二语言房型信息进行聚合,确定所述指定酒店的第二语言房型信息。
第二方面,本申请实施例提供了一种酒店房型聚合装置,包括:
翻译模块,用于对代理商输出的指定酒店的第一语言房型信息,通过预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果;
单条第二语言房型信息确定模块,用于将所述翻译模块确定的第一语言房型信息基于所述预设第一词库的翻译结果进行融合,得到所述第一语言房型信息对应的第二语言房型信息;
多条第二语言房型信息聚合模块,用于对所述单条第二语言房型信息确定模块确定的所述第一语言房型信息对应的第二语言房型信息进行聚合,确定所述指定酒店的第二语言房型信息。
第三方面,本申请实施例还公开了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请实施例所述的酒店房型聚合方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时本申请实施例公开的酒店房型聚合方法的步骤。
本申请实施例公开的酒店房型聚合方法,通过对代理商输出的指定酒店的第一语言房型信息,通过预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果;将第一语言房型信息基于所述预设第一词库的翻译结果进行融合,得到所述第一语言房型信息对应的第二语言房型信息;对所述第一语言房型信息对应的第二语言房型信息进行聚合,确定所述指定酒店的第二语言房型信息,解决了现有技术中聚合得到的酒店房型信息不准确的问题。本申请公开的酒店房型聚合方法,通过首先将代理商提供的酒店房型信息翻译为在线旅行社平台统一语言,然后基于统一语言描述的房型信息对同一家酒店的房型信息进行聚合,有效提升了聚合得到的房型信息的准确度。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例一的酒店房型聚合方法流程图;
图2是本申请实施例二的酒店房型聚合方法流程图;
图3是本申请实施例二的酒店房型聚合方法中一个步骤的具体流程图;
图4是本申请实施例三的酒店房型聚合装置的结构示意图之一;
图5是本申请实施例三的酒店房型聚合装置的结构示意图之二;
图6是本申请实施例一和实施例二公开的酒店房型聚合方法应用平台示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例一
本实施例公开的一种酒店房型聚合方法,如图1所示,该方法包括:步骤110至步骤130。
步骤110,对代理商输出的指定酒店的第一语言房型信息,通过预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果。
对于在线旅行社平台上接入的酒店代理商,通过每个代理商提供的酒店数据获取接口,可以获取到该代理商代理的所有酒店产品的信息,其中包括酒店房型、各房型的价格及库存。在线旅行社平台为了能够把更准确的数据在客户端进行展示,需要把从不同代理商处获取的同一家酒店的房型信息进行聚合。通常,酒店代理商提供的数据获取接口返回的酒店产品信息是以英文、日文或少数民族语言等第一语言描述的,不同语言对同一酒店房型的描述不同,即便是用相同的语言对酒店房型进行表述,不同酒店代理商对,同一酒店的同一房型的描述,也不尽相同。优选的为了提升聚合后得到的酒店房型信息的准确度,本申请中,首先对各代理商输出的指定酒店的每个地第一语言房型信息翻译成在线旅行社平台上通用的第二语言描述的房型信息,即,将第一语言房型信息翻译成第二语言房型信息。
本申请具体实施时,首先预设一个第二词库和多个第一词库,每个词库具有不同的调用优先级。其中,所述第二词库中的词语为不翻译词,用于对各代理商输出的所述指定酒店的每个第一语言房型信息进行预处理,删除其中的不翻译词。然后,再基于各第一词库进行翻译。预设多个第一词库可以包括:专有名称词库、专有名称备用词库、通用房型词库和附属信息词库;所述预设第一词库按照优先级由高到低排序为:专有名称词库、专有名称备用词库、通用房型词库、附属信息词库。具体执行翻译的过程中,按照所述第一词库优先级由高到低的顺序,依次基于各个第一词库,对每个第一语言房型信息进行翻译,得到每个第一语言房型信息基于各所述第一词库的翻译结果。
步骤120,将第一语言房型信息基于所述预设第一词库的翻译结果进行融合,得到所述第一语言房型信息对应的第二语言房型信息。
在确定了所述指定酒店的不同酒店代理商输出的第一语言房型信息,基于每个所述预设第一词库的翻译结果之后,将所述第一语言房型信息基于每个所述预设第一词库的翻译结果,按照所述预设第一词库的优先级由高到低的顺序进行排列,以得到所述第一语言房型信息对应的第二语言房型信息。例如,将所述第一语言房型信息基于专有名称词库的翻译结果排在首位,将所述第一语言房型信息基于通用房型词库的翻译结果排在中间,将将所述第一语言房型信息基于附属信息词库的翻译结果排在最后,得到第一语言房型信息对应的第二语言房型信息。
步骤130,对所述第一语言房型信息对应的第二语言房型信息进行聚合,确定所述指定酒店的第二语言房型信息。
确定了所述指定酒店的所有所述第一语言房型信息对应的第二语言房型信息之后,基于所述第二语言房型信息对酒店房型进行聚合。例如,对所有第二语言房型信息基于文本进行聚合,相同的第二语言房型信息对应同一个房型,并绑定物理房型。
本申请实施例公开的酒店房型聚合方法,通过对代理商输出的指定酒店的第一语言房型信息,通过预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果;将第一语言房型信息基于所述预设第一词库的翻译结果进行融合,得到所述第一语言房型信息对应的第二语言房型信息;对所述第一语言房型信息对应的第二语言房型信息进行聚合,确定所述指定酒店的第二语言房型信息,解决了现有技术中聚合得到的酒店房型信息不准确的问题。本申请公开的酒店房型聚合方法,通过首先将代理商提供的酒店房型信息翻译为在线旅行社平台统一语言,然后基于统一语言描述的房型信息对同一家酒店的房型信息进行聚合,有效提升了聚合得到的房型信息的准确度。
实施例二
本实施例公开的一种酒店房型聚合方法,如图2所示,该方法包括:步骤210至步骤260。
本实施例中,以对多个代理商输出的多条房型信息进行聚合具体详细说明酒店房型聚合方法的技术方案。
步骤210,判断各代理商输出的指定酒店的每个第一语言房型信息中的词语是否全部包含在所述预设第一词库和所述预设第二词库中,若是,则执行步骤220,否则,跳转至步骤260。
所述根据预设第二词库,对各代理商输出的指定酒店的每个第一语言房型信息进行预处理之前,还包括:判断各代理商输出的指定酒店的每个第一语言房型信息中的词语是否全部包含在所述预设第一词库和所述预设第二词库中,若是,则根据预设第二词库,对各代理商输出的指定酒店的每个第一语言房型信息进行预处理,若否,确定所述指定酒店的房型聚合失败。
具体实施时,为了提升获取房型信息的准确度,首先根据预设第一词库和所述预设第二词库对获取的第一语言房型信息进行预判断,确定是否第一语言房型信息中的所有词语全部包括在预设第一词库和所述预设第二词库构成的词语集合中。只有当第一语言房型信息中的所有词语全部包括在预设第一词库和所述预设第二词库构成的词语集合中时,才执行后续的翻译和聚合步骤。如果,第一语言房型信息中有词语没有包括在预设第一词库和所述预设第二词库构成的词语集合中,则认为会降低词语翻译和聚合的准确度,不采用本申请公开的方法进行翻译和聚合,可以采用人工和处理的方法获取该第一语言房型信息的翻译结果。
本实施例中,以代理商输出的一条第一语言房型信息为:“CARNATIONContinental PanoramaView 4beds-CapsuleDormitory-share bathroom”举例说明酒店房型信息翻译和聚合的具体方案。
具体实施时,首先过滤第一语言房型信息中所有的除空格外的符号,并且以空格替换,连续多个空格只保留一个,处理后的第一语言房型信息为“CARNATION ContinentalPanorama View 4beds Capsule Dormitory share bathroom”。
然后,对于第一语言房型信息中的每个第一语言词语,分别与所述预设第一词库和所述预设第二词库中的词语进行比对,确定第一语言房型信息中所有第一语言词语是否全部包含在所述预设第一词库和所述预设第二词库中。本实施例中,假设CARNATION、Continental、Panorama View、4beds、CapsuleDormitory、share bathroom中的每个第一语言词语都包含在所述预设第一词库和所述预设第二词库构成的词语集合中。
步骤220,根据预设第二词库,对代理商输出的指定酒店的第一语言房型信息进行预处理。
其中,所述预设第二词库中的词语为不翻译词。
具体实施时,所述对代理商输出的指定酒店的第一语言房型信息,通过预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果的步骤之前,还包括:根据预设第二词库,对代理商输出的指定酒店的第一语言房型信息进行预处理。
所述根据预设第二词库,对代理商输出的指定酒店的第一语言房型信息进行预处理,包括:删除代理商输出的指定酒店的第一语言房型信息中的不翻译词。具体实施时,为了提高聚合效率,在进行房型信息翻译之前,首先根据预设第二词库,对待翻译的每个代理商的每条第一语言房型信息中不需要翻译的词语进行删除处理,剔除干扰信息,然后,对剩余的需要翻译的词语进行翻译,以提高酒店房型聚合的效率和准确度。假设“4beds”为不翻译词,在预设第二词库中,则根据预设第二词库,进一步对所述待处理的第一语言房型信息进行预处理,去掉“4beds”后,得到处理后的第一语言房型信息“CARNATION ContinentalPanorama View Capsule Dormitory share bathroom”。
步骤230,对各代理商输出的指定酒店的每个第一语言房型信息,分别通过预设第一词库进行翻译,确定所述第一语言房型信息基于每个所述预设第一词库的翻译结果。
具体实施时,所述预设第一词库匹配不同的优先级,所述通过预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果,包括:对代理商输出的指定酒店的第一语言房型信息,按照预设第一词库的优先级由高到低的顺序,依次通过所述预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果。进一步的,所述预设第一词库包括:专有名称词库、专有名称备用词库、通用房型词库和附属信息词库;所述预设第一词库按匹配的优先级由高到低的顺序排列为:专有名称词库、专有名称备用词库、通用房型词库、附属信息词库。
具体实施时,如图3所示,按照预设第一词库的优先级由高到低的顺序,依次通过所述预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果,包括:子步骤2301至子步骤2309。
首先,通过所述专有名词词库进行翻译,确定所述第一语言房型信息基于所述专有名词词库的翻译结果。
具体实施时,所述专有名称词库包括:第一语言专有房型词语、每个所述第一语言专有房型词语对应的第二语言房型词语和词语编号。其中,所述词语编号用于指示相应的所述第一语言专有房型词语对应的第二语言房型词语在所述第一语言房型信息与所有所述预设第一词库对应的翻译结果中的排序顺序。酒店专有房型词语是只有这个酒店才会有的词语,像一些高端连锁酒店,就有自己的专有房型词语,比如希尔顿酒店集团、万豪酒店等。所述专有名称词库如下表所示:
所述按照预设第一词库的优先级由高到低的顺序,依次通过所述预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果,包括:子步骤2301和子步骤2302。
子步骤2301,确定同时包含在所述当前第一语言房型信息和所述专有名称词库中的所有第一语言专有房型词语。
具体实施时,可以通过现有技术中的词语检索方法,确定所述当前第一语言房型信息中的每个单词或词组是否出现在专有名称词库中。当前第一语言房型信息中出现在所述专有名称词库中的单词或短语为第一语言专有房型词语。本实施例中,确定CARNATION和Cont i nenta l两个单词出现在专有名称词库中,即CARNATION和Cont i nenta l为第一语言专有房型词语。
子步骤2302,将确定的每个所述第一语言专有房型词语对应的所述第二语言房型词语,按照所述第一语言专有房型词语对应的词语编号由小到大的顺序排列后得到的第二语言房型词语序列,作为所述第一语言房型信息基于所述专有名称词库的翻译结果。
然后,确定当前第一语言房型信息中的每个第一语言专有房型词语分别对应的第二语言房型词语和词语编号,依此进行翻译。例如,第一语言专有房型词语“CARNAT ION”对应第二语言房型词语“康乃馨”和词语编号“4”,第一语言专有房型词语“Continental”对应第二语言房型词语“洲际”和词语编号“2”。然后,按照所述第一语言专有房型词语对应的词语编号由小到大的顺序排列后得到的第二语言房型词语序列。本实施例中,第一语言专有房型词语“Continental”对应词语编号“2”,第一语言专有房型词语“CARNATION”对应的词语编号“4”,即Continental的排序前于CARNATION,因此,得到的第二语言房型词语序列为“洲际康乃馨”。最后,将“洲际康乃馨”作为所述第一语言房型信息基于所述专有名称词库的翻译结果。
通过专有名称词库对剩余的所述第一语言房型信息进行翻译之后,剩余待翻译第一语言房型信息为:“Panorama View Capsule Dormitory share bathroom”。
然后,通过所述专有名词备用词库进行翻译,确定所述第一语言房型信息基于所述专有名词备用词库的翻译结果。具体实施时,所述专有名称备用词库包括:第一语言专有房型备用词语、每个所述第一语言专有房型备用词语对应的第二语言房型词语和词语编号。其中,所述词语编号用于指示相应的所述第一语言专有房型备用词语对应的第二语言房型词语在所述第一语言房型信息与所有所述预设第一词库对应的翻译结果中的排列顺序。所述专有名称备用词库如下表所示:
所述按照预设第一词库的优先级由高到低的顺序,依次通过所述预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果,包括:子步骤2303和子步骤2305。
子步骤2303,判断所述第一语言房型信息基于所述专有名称词库的翻译结果是否为空,若是,则执行子步骤2304,若否,确定所述第一语言房型信息基于所述专有名词备用词库的翻译结果为空,跳转至子步骤2306。
专有名称备用词库是专有名称词库的替补词库,只有在通过所述专有名称词库没有得到所述第一语言房型信息的翻译结果时,才通过所述专有名称备用词库进一步对所述第一语言房型信息进行翻译。本实施例中,所述第一语言房型信息基于所述专有名称词库的翻译结果不为空,因此,不再通过所述专有名称备用词库对所述第一语言房型信息进行翻译。
子步骤2304,确定同时包含在所述当前第一语言房型信息和所述专有名称备用词库中的所有第一语言房型专有房型备用词语。
当所述第一语言房型信息基于所述专有名称词库的翻译结果为空时,进一步通过所述专有名称备用词库对所述第一语言房型信息进行翻译。
子步骤2305,将确定的每个所述第一语言专有房型备用词语中对应词语编号最小的所述第一语言房型专有房型备用词语,所对应的第二语言房型词语,作为所述第一语言房型信息基于所述专有名称备用词库的翻译结果。
当通过所述专有名称备用词库对所述第一语言房型信息进行翻译时,如果第一语言房型信息有多个单词或者词组在所述专有名称备用词库,根据各单词或词组在专有名称备用词库中对应的词语编号,只翻词语编号最小的单词或者词组,并将该词语编号最小的单词或者词组对应的第二语言专有房型备用词语,作为所述第一语言房型信息基于所述专有名称备用词库的翻译结果。
再后,通过所述通用房型词库进行翻译,确定所述第一语言房型信息基于所述通用房型词库的翻译结果。具体实施时,所述通用房型词库用于存储一些个性化的第一语言的房型描述单词或短语,所述通用房型词库包括:第一语言通用房型词语、每个所述第一语言通用房型词语对应的第二语言房型词语和词语编号。其中,所述词语编号用于指示相应的所述第一语言通用房型词语对应的第二语言房型词语在所述第一语言房型信息基于所有所述预设第一词库的翻译结果中的排列顺序。所述通用房型词库如下表所示:
所述按照预设第一词库的优先级由高到低的顺序,依次通过所述预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果,包括:子步骤2306和子步骤2307。
子步骤2306,确定同时包含在所述当前第一语言房型信息和所述通用房型词库中的所有第一语言通用房型词语。
具体实施时,可以通过现有技术中的词语检索方法,确定所述当前第一语言房型信息中的每个单词或词组是否出现在通用房型词库中。当前第一语言房型信息中出现在所述通用房型词库中的单词或短语为第一语言通用房型词语。本实施例中,对于剩余的待翻译第一语言房型信息“Panorama View Capsule Dormitory share bathroom”,确定短语“Capsule Dormitory”出现在所述通用房型词库中,即“Capsule Dormitory”为第一语言通用房型词语。
子步骤2307,将确定的每个所述第一语言通用房型词语中对应词语编号最小的所述第一语言通用房型词语,所对应的所述第二语言房型词语,作为所述第一语言房型信息基于所述通用房型词库的翻译结果。
然后,确定当前第一语言房型信息中的每个第一语言通用房型词语分别对应的第二语言房型词语和词语编号,依此进行翻译。例如,第一语言通用房型词语“CapsuleDormitory”对应第二语言房型词语“胶囊房”和词语编号“21”。并将词语编号最小的所述第一语言通用房型词语对应的第二语言房型词语,作为所述第一语言房型信息与所述通用房型词库对应的翻译结果。本实施例中,所述剩余待翻译的第一语言房型信息中只有一个第一语言通用房型词语“Capsule Dormitory”,因此,将“Capsule Dormitory”对应的第二语言房型词语“胶囊房”作为所述第一语言房型信息基于所述通用名称词库的翻译结果。如果,所述剩余待翻译的第一语言房型信息中包括多个第一语言通用房型词语,则只翻译对应词语编号最小的第一语言通用房型词语。
通过通用房型词库对剩余的所述第一语言房型信息进行翻译之后,剩余待翻译第一语言房型信息为:“Panorama View share bathroom”。
最后,通过所述附属信息词库进行翻译,确定所述第一语言房型信息基于所述通用房型词库的翻译结果。具体实施时,所述附属信息词库包括一些房型的必须展示给用户的房型附属信息,比如公用浴室。很多中国客户是不习惯浴室共用的,因此,需要额外在房型中强调。所述附属信息词库包括:第一语言附属房型词语、每个所述第一语言附属房型词语对应的第二语言房型词语。附属信息词库中的第一语言附属房型词语没有排序优先级,也就是说所有第一语言附属房型词语都会被翻译。所述通用房型词库如下表所示:
所述按照预设第一词库的优先级由高到低的顺序,依次通过所述预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果,包括:子步骤2308和子步骤2309。
子步骤2308,确定同时包含在所述当前第一语言房型信息和所述附属信息词库中的所有第一语言附属房型词语。
具体实施时,可以通过现有技术中的词语检索方法,确定所述当前第一语言房型信息中的每个单词或词组是否出现在附属信息词库中。当前第一语言房型信息中出现在所述附属信息词库中的单词或短语为第一语言附属房型词语。本实施例中,对于剩余的待翻译第一语言房型信息“Panorama View share bathroom”,确定短语“Panorama View”和“share bathroom”出现在所述附属信息词库中,即“Panorama View”和“share bathroom”为第一语言附属房型词语。
子步骤2309,将确定的每个所述第一语言附属房型词语对应的所述第二语言房型词语依序排列,作为所述第一语言房型信息与所述附属信息词库对应的翻译结果。
然后,确定当前第一语言房型信息中的每个第一语言附属房型词语分别对应的第二语言房型词语,依此进行翻译。例如,第一语言附属房型词语“Panorama View”对应第二语言房型词语“全景”,第一语言附属房型词语“share bathroom”对应第二语言房型词语“公用浴室”。最后按照对应的第一语言附属房型词语在所述第一语言房型信息中出现的先后顺序,对所述第一语言附属房型词语对应的第二语言房型词语进行排序,将得到的第二语言房型词语序列,作为所述第一语言房型信息基于所述附属词库的翻译结果。本实施例中,所述第一语言房型信息基于所述附属词库的翻译结果为“全景公用浴室”。
步骤240,将每个第一语言房型信息基于各所述预设第一词库的翻译结果进行融合,得到所述第一语言房型信息对应的第二语言房型信息。
具体实施时,所述将第一语言房型信息基于各所述预设第一词库的翻译结果进行融合,包括:将所述第一语言房型信息基于所述预设第一词库的翻译结果,按照所述预设第一词库的优先级由高到低的顺序进行排列。
在确定了所述指定酒店的不同酒店代理商输出的第一语言房型信息,基于每个所述预设第一词库的翻译结果之后,将所述第一语言房型信息基于每个所述预设第一词库的翻译结果,按照所述预设第一词库的优先级由高到低的顺序进行排列,以得到所述第一语言房型信息对应的第二语言房型信息。例如,将所述第一语言房型信息基于专有名称词库的翻译结果排在首位,将所述第一语言房型信息基于通用房型词库的翻译结果排在中间,将将所述第一语言房型信息基于附属信息词库的翻译结果排在最后,得到第一语言房型信息对应的第二语言房型信息。
本实施例中,所述第一语言房型信息“CARNATION Continental Panorama ViewCapsule Dormitory share bathroom”基于各预设第一词库的翻译结果分别为:基于所述专有名称词库的翻译结果为“洲际康乃馨”;基于专有名称备用词库的翻译结果为空;基于所述通用名称词库的翻译结果为“胶囊房”;基于所述附属词库的翻译结果为“全景公用浴室”。进一步的,将所述第一语言房型信息基于每个所述预设第一词库的翻译结果,按照所述预设第一词库的优先级由高到低的顺序进行排列,如得到“洲际康乃馨胶囊房全景公用浴室”的词语序列,将所述词语序列作为所述第一语言房型信息“CARNATION ContinentalPanorama View Capsule Dormitory share bathroom”的第二语言房型信息。具体实施时,为了便于后续聚合处理,可以通过***连词符“-”房型附属信息和其他房型信息。
步骤250,对所有所述第一语言房型信息对应的第二语言房型信息进行聚合,确定所述指定酒店的第二语言房型信息。
确定了所述指定酒店的所有所述第一语言房型信息对应的第二语言房型信息之后,基于所述第二语言房型信息对酒店房型进行聚合。具体实施时,对所述第一语言房型信息对应第二语言房型信息进行聚合,确定所述指定酒店的第二语言房型信息,包括:对于所述第二语言房型信息,若确定所述指定酒店包括所述第二语言房型信息对应的物理房型,则将所述第二语言房型信息与所述物理房型进行绑定;若确定所述指定酒店不包括所述第二语言房型信息对应的物理房型,则根据所述第二语言房型信息创建物理房型,并将所述第二语言房型信息与创建的所述物理房型进行;确定所述指定酒店通过第二语言房型信息表示的物理房型。
或者,对所有第二语言房型信息基于文本进行聚类,相同的第二语言房型信息聚为一类,每个类别对应同一个房型,并绑定物理房型。
例如,首先判断在线旅行社平台的所述指定酒店下,是否存在“洲际康乃馨胶囊房-全景公用浴室”这个物理房型,若存在,则将所述指定酒店的“CARNATION ContinentalPanorama View Capsule Dormitory share bathroom”的具体房型信息绑定至物理房型“洲际康乃馨胶囊房-全景公用浴室”,便于后续统计价格、库存等信息。若在线旅行社平台的所述指定酒店下,不存在“洲际康乃馨胶囊房-全景公用浴室”这个物理房型,则首先创建物理房型“洲际康乃馨胶囊房-全景公用浴室”,并将“CARNATION Continental PanoramaView Capsule Dormitory share bathroom”的具体房型信息绑定至物理房型“洲际康乃馨胶囊房-全景公用浴室”,便于后续统计价格、库存等信息。
具体应用中,例如一个酒店M从来没经过翻译聚合处理,此酒店M下面肯定没有一个物理房型,当翻译一个代理商A的某个房型翻译成功叫“大床房”,就会创建一个物理房型“大床房”。接着此酒店M另一个代理商B也有一个房型翻译成功叫“大床房”,就会与上次创建的物理房型绑定关系。通过这种绑定关系,可以进一步确定酒店M的“大床房”的准确价格、库存等房型信息。
至此,完成应酒店的房型聚合。可以进一步将房型信息进行前端展示。
步骤260,确定所述指定酒店的房型聚合失败。
本申请公开的酒店的房型聚合方法,通过首先判断各代理商输出的指定酒店的每个第一语言房型信息中的词语是否全部包含在所述预设第一词库和所述预设第二词库中,若果是,则进一步通过预设第二词库对不翻译词进行删除处理;然后,对删除处理后得到的待翻译第一语言房型信息基于预设第一词库进行翻译,得到所述第一语言房型信息基于各预设第一词库的翻译结果;之后,通过对每个所述第一语言房型信息基于各预设第一词库的翻译结果进行融合,得到每个所述第一语言房型信息对应的第二语言房型信息;最后,通过对所述指定酒店的所有第二语言房型信息进行聚合,得到所述指定酒店的第二语言房型信息,解决了现有技术中获取酒店房型信息不准确的问题。
本申请通过首先判断各代理商输出的指定酒店的每个第一语言房型信息中的词语是否全部包含在所述预设第一词库和所述预设第二词库中,只有当个第一语言房型信息中的词语是否全部包含在所述预设第一词库和所述预设第二词库组成的词语集合中时,才进行翻译,可以提升翻译结果的准确度,进一步提升获取的酒店房型信息的准确度。通过设置第二词库对不翻译词进行初步过滤,在保证获取的酒店房型信息的准确度的情况下,减小数据处理量,提升数据获取效率。同时,对于一些不必要翻译的词语进行首先删除,可以减少翻译噪声,有利于提升翻译结果的准确度,进一步提升获取的酒店房型信息的准确度。
另外,本申请通过根据酒店房型的描述特点和人工运营人员的人工修正,确定了多个预设第一词库用于翻译,丰富的翻译词库,可以保证翻译结果的准确度。通过将酒店专有名词、高频大众形容词、低频小众形容词等分别设置在不同的第一预设词库中,并为每个第一词库匹配相应的优先级,具体翻译时,按照第一词库优先级由高到低的顺序依次通过所述第一词库进行翻译,酒店专有名词等词语优先翻译,可以进一步提升酒店房型聚合的准确度。同时,对于不同第一词库,通过按照词语优先级设置词语编号,并且仅选择预设数量的词语编号较小(即词语优先级较高)的词语的翻译结果,提取重要房型信息,减少干扰信息,可以进一步提升房型聚合的准确度。
实施例三
本实施例公开的一种酒店房型聚合装置,如图4所示,所述装置包括:
翻译模块400,用于对代理商输出的指定酒店的第一语言房型信息,通过预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果;
单条第二语言房型信息确定模块410,用于将所述翻译模块确定的第一语言房型信息基于所述预设第一词库的翻译结果进行融合,得到所述第一语言房型信息对应的第二语言房型信息;
多条第二语言房型信息聚合模块420,用于对所述单条第二语言房型信息确定模块确定的所述第一语言房型信息对应的第二语言房型信息进行聚合,确定所述指定酒店的第二语言房型信息。
本申请实施例公开的酒店房型聚合装置,通过对代理商输出的指定酒店的第一语言房型信息,通过预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果;将第一语言房型信息基于各所述预设第一词库的翻译结果进行融合,得到所述第一语言房型信息对应的第二语言房型信息;对所述第一语言房型信息对应第二语言房型信息进行聚合,确定所述指定酒店的第二语言房型信息,解决了现有技术中获取的酒店房型信息不准确的问题。本申请公开的酒店房型聚合装置,通过首先将代理商提供的酒店房型信息翻译为在线旅行社平台统一语言,然后基于统一语言描述的房型信息对同一家酒店的房型信息进行聚合,有效提升了聚合得到的房型信息的准确度。
可选的,所述预设第一词库匹配不同的优先级,所述翻译模块400进一步用于:
对代理商输出的指定酒店的每个第一语言房型信息,按照预设第一词库的优先级由高到低的顺序,依次通过所述预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果。
可选的,所述预设第一词库包括:专有名称词库、专有名称备用词库、通用房型词库和附属信息词库;所述预设第一词库按匹配的优先级由高到低的顺序排列为:专有名称词库、专有名称备用词库、通用房型词库、附属信息词库。
可选的,所述专有名称词库包括:第一语言专有房型词语、每个所述第一语言专有房型词语对应的第二语言房型词语和词语编号;如图5所示,所述翻译模块400进一步包括第一翻译单元4001,所述第一翻译单元4001进一步用于:
确定同时包含在所述当前第一语言房型信息和所述专有名称词库中的所有第一语言专有房型词语;
将确定的每个所述第一语言专有房型词语对应的所述第二语言房型词语,按照所述第一语言专有房型词语对应的词语编号由小到大的顺序排列后得到的第二语言房型词语序列,作为所述第一语言房型信息基于所述专有名称词库的翻译结果;
其中,所述词语编号用于指示相应的所述第一语言专有房型词语对应的第二语言房型词语在所述第一语言房型信息与所有所述预设第一词库对应的翻译结果中的排列顺序。
可选的,所述专有名称备用词库包括:第一语言专有房型备用词语、每个所述第一语言专有房型备用词语对应的第二语言房型词语和词语编号;如图5所示,所述翻译模块400进一步包括第二翻译单元4002,所述第二翻译单元4002进一步用于:
若所述第一语言房型信息基于所述专有名称词库的翻译结果为空,则执行以下步骤:
确定同时包含在所述当前第一语言房型信息和所述专有名称备用词库中的所有第一语言房型专有房型备用词语;
将确定的每个所述第一语言专有房型备用词语中对应词语编号最小的所述第一语言房型专有房型备用词语,所对应的第二语言房型词语,作为所述第一语言房型信息基于所述专有名称备用词库的翻译结果;
其中,所述词语编号用于指示相应的所述第一语言专有房型备用词语对应的第二语言房型词语在所述第一语言房型信息与所有所述预设第一词库对应的翻译结果中的排列顺序。
可选的,所述通用房型词库包括:第一语言通用房型词语、每个所述第一语言通用房型词语对应的第二语言房型词语和词语编号;如图5所示,所述翻译模块400进一步包括第三翻译单元4003,所述第三翻译单元4003进一步用于:
确定同时包含在所述当前第一语言房型信息和所述通用房型词库中的所有第一语言通用房型词语;
将确定的每个所述第一语言通用房型词语中对应词语编号最小的所述第一语言通用房型词语,所对应的所述第二语言房型词语,作为所述第一语言房型信息基于所述通用房型词库的翻译结果;
其中,所述词语编号用于指示相应的所述第一语言通用房型词语对应的第二语言房型词语在所述第一语言房型信息基于所有所述预设第一词库的翻译结果中的排列顺序。
可选的,所述附属信息词库包括:第一语言附属房型词语、每个所述第一语言附属房型词语对应的第二语言房型词语;如图5所示,所述翻译模块400进一步包括第四翻译单元4004,所述第四翻译单元4004进一步用于:
确定同时包含在所述当前第一语言房型信息和所述附属信息词库中的所有第一语言附属房型词语;
将确定的每个所述第一语言附属房型词语对应的所述第二语言房型词语依序排列,作为所述第一语言房型信息与所述附属信息词库对应的翻译结果。
可选的,所述单条第二语言房型信息确定模块410进一步用于:
将所述第一语言房型信息基于所述预设第一词库的翻译结果,按照所述预设第一词库的优先级由高到低的顺序进行排列。
可选的,所述多条第二语言房型信息聚合模块420进一步用于:
对于所述第二语言房型信息,若确定所述指定酒店包括所述第二语言房型信息对应的物理房型,则将所述第二语言房型信息与所述物理房型进行绑定;若确定所述指定酒店不包括所述第二语言房型信息对应的物理房型,则根据所述第二语言房型信息创建物理房型,并将所述第二语言房型信息与创建的所述物理房型进行;确定所述指定酒店通过第二语言房型信息表示的物理房型。
或者,对所有第二语言房型信息基于文本进行聚类,相同的第二语言房型信息聚为一类,每个类别对应同一个房型,并绑定物理房型。
可选的,如图5所示,所述装置还包括:
第一预处理模块430,用于根据预设第二词库,对代理商输出的指定酒店的第一语言房型信息进行预处理,其中,所述预设第二词库中的词语为不翻译词;
所述根据预设第二词库,对代理商输出的指定酒店的第一语言房型信息进行预处理,包括:删除代理商输出的指定酒店的第一语言房型信息中的不翻译词。
可选的,如图5所示,所述装置还包括:
第二预处理模块440,用于判断各代理商输出的指定酒店的每个第一语言房型信息中的词语是否全部包含在所述预设第一词库和所述预设第二词库中,若是,则根据预设第二词库,对各代理商输出的指定酒店的每个第一语言房型信息进行预处理,若否,确定所述指定酒店的房型聚合失败。
本申请通过首先判断各代理商输出的指定酒店的每个第一语言房型信息中的词语是否全部包含在所述预设第一词库和所述预设第二词库中,只有当个第一语言房型信息中的词语是否全部包含在所述预设第一词库和所述预设第二词库组成的词语集合中时,才进行翻译,可以提升翻译结果的准确度,进一步提升聚合得到的酒店房型信息的准确度。通过设置第二词库对不翻译词进行初步过滤,在保证获取的酒店房型信息的准确度的情况下,减小数据处理量,提升数据获取效率。同时,对于一些不必要翻译的词语进行首先删除,可以减少翻译噪声,有利于提升翻译结果的准确度,进一步提升聚合得到的酒店房型信息的准确度。
另外,本申请通过根据酒店房型的描述特点和人工运营人员的人工修正,确定了多个预设第一词库用于翻译,丰富的翻译词库,可以保证翻译结果的准确度。通过将酒店专有名词、高频大众形容词、低频小众形容词等分别设置在不同的第一预设词库中,并为每个第一词库匹配相应的优先级,具体翻译时,按照第一词库优先级由高到低的顺序依次通过所述第一词库进行翻译,酒店专有名词等词语优先翻译,可以进一步提升酒店房型聚合的准确度。同时,对于不同第一词库,通过按照词语优先级设置词语编号,并且仅选择预设数量的词语编号较小(即词语优先级较高)的词语的翻译结果,提取重要房型信息,减少干扰信息,可以进一步提升房型聚合的准确度。
图6是本申请实施例一和实施例二公开的酒店房型聚合方法一个具体应用平台架构示意图。如图6所示,所述平台包括翻译引擎610、房型聚合模块620、推送模块630和运营模块640。其中,翻译引擎610进一步包括:预设第一词库6101和预设第二词库6102,所述预设第一词库6101进一步包括:专有名称词库61011、专有名称备用词库61012、通用房型词库61013和附属信息词库61014。所述预设第一词库6101和预设第二词库6102的构成参见实施例一和实施例二,此处不再赘述。
所述翻译引擎610用于对从各个代理商处获取的数据进行预处理和翻译,并在翻译成功时,将翻译成功的第二语言房型信输出至房型聚合模块620进行房型聚合。所述房型聚合模块620按照预设逻辑对翻译得到的第二语言房型信息进行聚合,并将聚合结果输出至推送模块630,由所述推送模块630根据用户的查询需求和预设策略向所述平台的客户端进行房型信息推送。
所述翻译引擎610还用于在翻译失败后,将翻译失败的第一语言房型信息输出至运营模块640,由所述运营模块640对所述第一语言房型信息进行翻译,并将翻译优化信息反馈至所述翻译引擎610。通过由所述运营模块640对所述第一语言房型信息进行翻译,并将翻译优化信息反馈至所述翻译引擎610,可以提升翻译结果的准确度。
所述翻译引擎610的具体实施方法参见实施例一和实施例二中基于第一预设词库和第二预设词库对第一语言房型信息进行处理得到第二语言房型信息的方案,此处不再赘述。
相应的,本申请还公开了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例一和实施例二所述的酒店房型聚合方法。所述电子设备可以为PC机、移动终端、个人数字助理、平板电脑等。
本申请还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例一和实施例二所述的酒店房型聚合方法的步骤。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本申请提供的一种酒店房型聚合方法及装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
Claims (13)
1.一种酒店房型聚合方法,其特征在于,包括:
对代理商输出的指定酒店的第一语言房型信息,通过预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果;
将第一语言房型信息基于所述预设第一词库的翻译结果进行融合,得到所述第一语言房型信息对应的第二语言房型信息;
对所述第一语言房型信息对应的第二语言房型信息进行聚合,确定所述指定酒店的第二语言房型信息,所述指定酒店的第二语言房型信息中,相同的第二语言房型信息对应同一个房型。
2.根据权利要求1所述的方法,其特征在于,所述预设第一词库匹配不同的优先级,所述通过预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果的步骤,包括:
对代理商输出的指定酒店的第一语言房型信息,按照预设第一词库的优先级由高到低的顺序,依次通过所述预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果。
3.根据权利要求2所述的方法,其特征在于,所述预设第一词库包括:专有名称词库、专有名称备用词库、通用房型词库和附属信息词库;所述预设第一词库按匹配的优先级由高到低的顺序排列为:专有名称词库、专有名称备用词库、通用房型词库、附属信息词库。
4.根据权利要求3所述的方法,其特征在于,所述专有名称词库包括:第一语言专有房型词语、每个所述第一语言专有房型词语对应的第二语言房型词语和词语编号;所述按照预设第一词库的优先级由高到低的顺序,依次通过所述预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果的步骤,包括:
确定同时包含在当前第一语言房型信息和所述专有名称词库中的所有第一语言专有房型词语;
将确定的每个所述第一语言专有房型词语对应的所述第二语言房型词语,按照所述第一语言专有房型词语对应的词语编号由小到大的顺序排列后得到的第二语言房型词语序列,作为所述第一语言房型信息基于所述专有名称词库的翻译结果;
其中,所述词语编号用于指示相应的所述第一语言专有房型词语对应的第二语言房型词语在所述第一语言房型信息与所有所述预设第一词库对应的翻译结果中的排列顺序。
5.根据权利要求4所述的方法,其特征在于,所述专有名称备用词库包括:第一语言专有房型备用词语、每个所述第一语言专有房型备用词语对应的第二语言房型词语和词语编号;所述按照预设第一词库的优先级由高到低的顺序,依次通过所述预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果的步骤,包括:
若所述第一语言房型信息基于所述专有名称词库的翻译结果为空,则执行以下步骤:
确定同时包含在所述当前第一语言房型信息和所述专有名称备用词库中的所有第一语言房型专有房型备用词语;
将确定的每个所述第一语言专有房型备用词语中对应词语编号最小的所述第一语言房型专有房型备用词语,所对应的第二语言房型词语,作为所述第一语言房型信息基于所述专有名称备用词库的翻译结果;
其中,所述词语编号用于指示相应的所述第一语言专有房型备用词语对应的第二语言房型词语在所述第一语言房型信息与所有所述预设第一词库对应的翻译结果中的排列顺序。
6.根据权利要求3所述的方法,其特征在于,所述通用房型词库包括:第一语言通用房型词语、每个所述第一语言通用房型词语对应的第二语言房型词语和词语编号;所述按照预设第一词库的优先级由高到低的顺序,依次通过所述预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果的步骤,包括:
确定同时包含在当前第一语言房型信息和所述通用房型词库中的所有第一语言通用房型词语;
将确定的每个所述第一语言通用房型词语中对应词语编号最小的所述第一语言通用房型词语,所对应的所述第二语言房型词语,作为所述第一语言房型信息基于所述通用房型词库的翻译结果;
其中,所述词语编号用于指示相应的所述第一语言通用房型词语对应的第二语言房型词语在所述第一语言房型信息基于所有所述预设第一词库的翻译结果中的排列顺序。
7.根据权利要求3所述的方法,其特征在于,所述附属信息词库包括:第一语言附属房型词语、每个所述第一语言附属房型词语对应的第二语言房型词语;所述按照预设第一词库的优先级由高到低的顺序,依次通过所述预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果的步骤,包括:
确定同时包含在当前第一语言房型信息和所述附属信息词库中的所有第一语言附属房型词语;
将确定的每个所述第一语言附属房型词语对应的所述第二语言房型词语依序排列,作为所述第一语言房型信息与所述附属信息词库对应的翻译结果。
8.根据权利要求1至7任一项所述的方法,其特征在于,所述将第一语言房型信息基于所述预设第一词库的翻译结果进行融合的步骤,包括:
将所述第一语言房型信息基于所述预设第一词库的翻译结果,按照所述预设第一词库的优先级由高到低的顺序进行排列。
9.根据权利要求1至7任一项所述的方法,其特征在于,所述对代理商输出的指定酒店的第一语言房型信息,通过预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果的步骤之前,还包括:
根据预设第二词库,对代理商输出的指定酒店的第一语言房型信息进行预处理,其中,所述预设第二词库中的词语为不翻译词;
所述根据预设第二词库,对代理商输出的指定酒店的第一语言房型信息进行预处理,包括:删除代理商输出的指定酒店的第一语言房型信息中的不翻译词。
10.根据权利要求9所述的方法,其特征在于,所述根据预设第二词库,对各代理商输出的指定酒店的第一语言房型信息进行预处理的步骤之前,还包括:
判断各代理商输出的指定酒店的每个第一语言房型信息中的词语是否全部包含在所述预设第一词库和所述预设第二词库中,若是,则根据预设第二词库,对各代理商输出的指定酒店的每个第一语言房型信息进行预处理,若否,确定所述指定酒店的房型聚合失败。
11.一种酒店房型聚合装置,其特征在于,包括:
翻译模块,用于对代理商输出的指定酒店的第一语言房型信息,通过预设第一词库进行翻译,确定所述第一语言房型信息基于所述预设第一词库的翻译结果;
单条第二语言房型信息确定模块,用于将所述翻译模块确定的第一语言房型信息基于所述预设第一词库的翻译结果进行融合,得到所述第一语言房型信息对应的第二语言房型信息;
多条第二语言房型信息聚合模块,用于对所述单条第二语言房型信息确定模块确定的所述第一语言房型信息对应的第二语言房型信息进行聚合,确定所述指定酒店的第二语言房型信息,所述指定酒店的第二语言房型信息中,相同的第二语言房型信息对应同一个房型。
12.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至10任意一项所述的酒店房型聚合方法。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至10任意一项所述的酒店房型聚合方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810118214.7A CN108491395B (zh) | 2018-02-06 | 2018-02-06 | 酒店房型聚合方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810118214.7A CN108491395B (zh) | 2018-02-06 | 2018-02-06 | 酒店房型聚合方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108491395A CN108491395A (zh) | 2018-09-04 |
CN108491395B true CN108491395B (zh) | 2022-03-29 |
Family
ID=63344426
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810118214.7A Active CN108491395B (zh) | 2018-02-06 | 2018-02-06 | 酒店房型聚合方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108491395B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112906406A (zh) * | 2021-03-30 | 2021-06-04 | 携程旅游信息技术(上海)有限公司 | 酒店房型名称的翻译方法、***、设备和介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218761A (zh) * | 2011-08-24 | 2013-07-24 | 卡西欧计算机株式会社 | 信息处理装置以及信息处理方法 |
CN104751232A (zh) * | 2015-04-27 | 2015-07-01 | 携程计算机技术(上海)有限公司 | 酒店自动匹配方法 |
CN104778637A (zh) * | 2014-01-10 | 2015-07-15 | 携程计算机技术(上海)有限公司 | 酒店数据的处理***及方法 |
CN106886565A (zh) * | 2017-01-11 | 2017-06-23 | 北京众荟信息技术股份有限公司 | 一种基础房型自动聚合方法 |
CN106934498A (zh) * | 2017-03-14 | 2017-07-07 | 携程旅游网络技术(上海)有限公司 | Ota网站中酒店房型的推荐方法及*** |
CN107609665A (zh) * | 2017-10-16 | 2018-01-19 | 携程计算机技术(上海)有限公司 | Ota网站的酒店房间在线选取方法及*** |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140089020A1 (en) * | 2012-09-27 | 2014-03-27 | Suitest IP Group, Inc. | Systems and methods for optimizing markets for temporary living space |
-
2018
- 2018-02-06 CN CN201810118214.7A patent/CN108491395B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218761A (zh) * | 2011-08-24 | 2013-07-24 | 卡西欧计算机株式会社 | 信息处理装置以及信息处理方法 |
CN104778637A (zh) * | 2014-01-10 | 2015-07-15 | 携程计算机技术(上海)有限公司 | 酒店数据的处理***及方法 |
CN104751232A (zh) * | 2015-04-27 | 2015-07-01 | 携程计算机技术(上海)有限公司 | 酒店自动匹配方法 |
CN106886565A (zh) * | 2017-01-11 | 2017-06-23 | 北京众荟信息技术股份有限公司 | 一种基础房型自动聚合方法 |
CN106934498A (zh) * | 2017-03-14 | 2017-07-07 | 携程旅游网络技术(上海)有限公司 | Ota网站中酒店房型的推荐方法及*** |
CN107609665A (zh) * | 2017-10-16 | 2018-01-19 | 携程计算机技术(上海)有限公司 | Ota网站的酒店房间在线选取方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN108491395A (zh) | 2018-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8626486B2 (en) | Automatic spelling correction for machine translation | |
US7774193B2 (en) | Proofing of word collocation errors based on a comparison with collocations in a corpus | |
US5541838A (en) | Translation machine having capability of registering idioms | |
US9710572B2 (en) | Completing application interfaces | |
US20130197896A1 (en) | Resolving out-of-vocabulary words during machine translation | |
US11514034B2 (en) | Conversion of natural language query | |
CN110413738A (zh) | 一种信息处理方法、装置、服务器及存储介质 | |
CN108491395B (zh) | 酒店房型聚合方法、装置、电子设备及存储介质 | |
US20220058214A1 (en) | Document information extraction method, storage medium and terminal | |
CN113254588A (zh) | 一种数据搜索方法及*** | |
CN110427626B (zh) | 关键词的提取方法及装置 | |
WO2023103943A1 (zh) | 图片处理方法、装置及电子设备 | |
TWI376656B (en) | Foreign-language learning method utilizing an original language to review corresponding foreign languages and foreign-language learning database system thereof | |
CN107168950B (zh) | 一种基于双语语义映射的事件短语学习方法及装置 | |
US11914658B2 (en) | Multi-node word segmentation system and method for keyword search | |
CN114386407A (zh) | 文本的分词方法及装置 | |
CN112380879A (zh) | 一种智能翻译方法、装置、计算机设备和存储介质 | |
CN113743409A (zh) | 一种文本识别方法和装置 | |
CN112380445A (zh) | 数据查询方法、装置、设备和存储介质 | |
CN111178090A (zh) | 一种用于企业名称翻译的方法及*** | |
CN116257643B (zh) | 跨语言实体对齐方法、装置、设备及可读存储介质 | |
CN110297825B (zh) | 数据处理方法、装置、计算机设备以及存储介质 | |
US20240104300A1 (en) | Apparatus and method for generating word embedding library | |
CN109271392B (zh) | 快速判别和抽取关系型数据库实体及属性的方法及设备 | |
CN117993397A (zh) | 游戏翻译方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231009 Address after: 22-01, 18th Floor, Building 38 Haidian Street, Haidian District, Beijing, 100089 Patentee after: BEIJING KUXUN TECHNOLOGY Co.,Ltd. Patentee after: BEIJING SANKUAI ONLINE TECHNOLOGY Co.,Ltd. Address before: 100083 2106-030, 9 North Fourth Ring Road, Haidian District, Beijing. Patentee before: BEIJING SANKUAI ONLINE TECHNOLOGY Co.,Ltd. |