CN112651332A - 基于照片库的场景设施识别方法、***、设备及存储介质 - Google Patents
基于照片库的场景设施识别方法、***、设备及存储介质 Download PDFInfo
- Publication number
- CN112651332A CN112651332A CN202011553573.9A CN202011553573A CN112651332A CN 112651332 A CN112651332 A CN 112651332A CN 202011553573 A CN202011553573 A CN 202011553573A CN 112651332 A CN112651332 A CN 112651332A
- Authority
- CN
- China
- Prior art keywords
- scene
- photo
- facility
- target text
- library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000001514 detection method Methods 0.000 claims abstract description 17
- 238000013507 mapping Methods 0.000 claims abstract description 7
- 238000000605 extraction Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000013527 convolutional neural network Methods 0.000 claims description 4
- 238000005065 mining Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 3
- 238000012937 correction Methods 0.000 abstract description 8
- 238000012549 training Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000009182 swimming Effects 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000013145 classification model Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005111 flow chemistry technique Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/535—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/587—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Library & Information Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Multimedia (AREA)
Abstract
本发明提供了基于照片库的场景设施识别方法、***、设备及存储介质,该方法包括:提供一照片库,照片库中包含具有拍摄时定位信息的照片;遍历目标文本,在目标文本中抓取关于场景名称的第一关键词和关于场景设施类别的第二关键词;获得场景名称的定位信息;在照片库中根据定位信息获得备选照片集;对备选照片集中的照片基于图片识别进行设施检测获得场景设施类别标签;以及将目标文本中的第二关键词与具有相同的场景设施类别标签的照片建立映射关系。本发明能够确保酒店展示图片的真实性,防止酒店展示虚假照片,保证用户获知真实的图片,既降低了人工纠错的成本,也杜绝了用户被欺骗的风险,提高了用户进行酒店消费的体验。
Description
技术领域
本发明涉及图片识别领域,具体地说,涉及基于照片库的场景设施识别方法、***、设备及存储介质。
背景技术
在当前信息时代,人们在出行旅游之前,会在平台提前选择酒店,通过平台展示的文本、图片信息进行筛选,选择自己满意的酒店。同时,平台上的酒店越来越多,并且酒店频繁的更新自己的展示页面,力求吸引更多的住客。但这些图片杂乱无章,甚至和文本信息相冲突,但用户往往不能筛选出正确信息,这就造成了错误信息的接收,体验较差。有些不良酒店商家通过展示一些不属于本酒店的照片或是不属于本酒店设施的照片,来欺骗消费者。因此保证酒店信息的准确性成为了OTA平台一个重大的挑战。当前维护主要依赖于用户投诉与人工和酒店的沟通,不仅速度较慢,效率较低,并且易造成用户的观感差、用户流失等现象。
因此,本发明提供了一种基于照片库的场景设施识别方法、***、设备及存储介质。
发明内容
针对现有技术中的问题,本发明的目的在于提供基于照片库的场景设施识别方法、***、设备及存储介质,克服了现有技术的困难,能够确保酒店展示图片的真实性,防止酒店展示虚假照片,保证用户获知真实的图片,既降低了人工纠错的成本,也杜绝了用户被欺骗的风险,提高了用户进行酒店消费的体验。
本发明的实施例提供一种基于照片库的场景设施识别方法,包括以下步骤:
S110、提供一照片库,所述照片库中包含具有拍摄时定位信息的照片;
S120、遍历目标文本,在所述目标文本中抓取关于场景名称的第一关键词和关于场景设施类别的第二关键词;
S130、获得所述场景名称的定位信息;
S140、在所述照片库中根据所述定位信息获得备选照片集;
S150、对所述备选照片集中的照片基于图片识别进行设施检测获得场景设施类别标签;以及
S160、将所述目标文本中的第二关键词与具有相同的场景设施类别标签的照片建立映射关系。
优选地,在所述步骤S110中,所述照片库包括用户设备中储存的照片集和/或与所述用户的网络帐户相关联的云端照片库。
优选地,在所述步骤S120中,基于第一词典遍历所述目标文本获得所述第一关键词,所述第一词典中具有各种场景名称;
基于第二词典再次遍历所述目标文本获得所述第二关键词,所述第二词典中具有基于每个所述场景名称下的设施类别名称。
优选地,所述场景名称是酒店名称,所述设施类别名称是酒店设施的名称和/或客房设施的名称。
优选地,所述目标文本位于以下位置中的至少一个:
一旅游平台的酒店预定网页的文本中;
一酒店网页的文本中;
一办公楼租赁网页的文本中;
一房产销售网页的文本中。
优选地,所述步骤S150中,通过建立基于深度卷积神经网络的图像信息挖掘算法模型,对照片进行画面识别,输出基于各个预设场景设施类别标签的置信度,输出置信度大于预设阈值的场景设施类别标签。
优选地,所述步骤S150中,利用目标检测的方法提取图像信息,包含特征提取网络和特征金字塔网络,所述提取网络由全卷积网络构成,所述特征金字塔网络抽取特征提取网络的部分特征层做融合,并进行卷积计算,每一层有两个分支,分别输出目标的类别置信度和目标的位置。
优选地,所述步骤S160中,基于所述第二关键词建立相关的场景设施类别标签的照片子集,在所述目标文本中生成各个所述第二关键词分别连接到所述照片子集的超链接。
优选地,所述步骤S160中,基于每个所述第二关键词建立相关的场景设施类别标签的照片子集,将所述目标文本中所有所述第二关键词的照片子集组成备选照片合集,在所述目标文本的网页的页面的所有图片槽中,只允许选择所述备选照片合集中的图片。
本发明的实施例还提供一种基于照片库的场景设施识别***,用于实现上述的基于照片库的场景设施识别方法,所述基于照片库的场景设施识别***包括:
照片库模块,提供一照片库,所述照片库中包含具有拍摄时定位信息的照片;
文本遍历模块,遍历目标文本,在所述目标文本中抓取关于场景名称的第一关键词和关于场景设施类别的第二关键词;
场景定位模块,获得所述场景名称的定位信息;
备选照片模块,在所述照片库中根据所述定位信息获得备选照片集;
设施识别模块,对所述备选照片集中的照片基于图片识别进行设施检测获得场景设施类别标签;以及
关联建立模块,将所述目标文本中的第二关键词与具有相同的场景设施类别标签的照片建立映射关系。
本发明的实施例还提供一种基于照片库的场景设施识别设备,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行上述基于照片库的场景设施识别方法的步骤。
本发明的实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被执行时实现上述基于照片库的场景设施识别方法的步骤。
本发明的目的在于提供基于照片库的场景设施识别方法、***、设备及存储介质,能够确保酒店展示图片的真实性,防止酒店展示虚假照片,保证用户获知真实的图片,既降低了人工纠错的成本,也杜绝了用户被欺骗的风险,提高了用户进行酒店消费的体验。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。
图1是本发明的基于照片库的场景设施识别方法的流程图。
图2至4是实施本发明的基于照片库的场景设施识别方法的过程示意图。
图5是本发明的基于照片库的场景设施识别***的模块示意图。
图6是本发明的基于照片库的场景设施识别设备的结构示意图。
图7是本发明一实施例的计算机可读存储介质的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式。相反,提供这些实施方式使得本发明将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的结构,因而将省略对它们的重复描述。
图1是本发明的基于照片库的场景设施识别方法的流程图。如图1所示,本发明的实施例提供一种基于照片库的场景设施识别方法,包括以下步骤:
S110、提供一照片库,照片库中包含具有拍摄时定位信息的照片。
S120、遍历目标文本,在目标文本中抓取关于场景名称的第一关键词和关于场景设施类别的第二关键词。
S130、获得场景名称的定位信息。
S140、在照片库中根据定位信息获得备选照片集。
S150、对备选照片集中的照片基于图片识别进行设施检测获得场景设施类别标签。以及
S160、将目标文本中的第二关键词与具有相同的场景设施类别标签的照片建立映射关系。
优选地,在步骤S110中,照片库包括用户设备中储存的照片集和/或与用户的网络帐户相关联的云端照片库。
优选地,在步骤S120中,基于第一词典遍历目标文本获得第一关键词,第一词典中具有各种场景名称。
基于第二词典再次遍历目标文本获得第二关键词,第二词典中具有基于每个场景名称下的设施类别名称。
优选地,场景名称是酒店名称,设施类别名称是酒店设施的名称和/或客房设施的名称。
优选地,目标文本位于以下位置中的至少一个:
一旅游平台的酒店预定网页的文本中。
一酒店网页的文本中。
一办公楼租赁网页的文本中。
一房产销售网页的文本中。
优选地,步骤S150中,通过建立基于深度卷积神经网络的图像信息挖掘算法模型,对照片进行画面识别,输出基于各个预设场景设施类别标签的置信度,输出置信度大于预设阈值的场景设施类别标签。
优选地,步骤S150中,利用目标检测的方法提取图像信息,包含特征提取网络和特征金字塔网络,提取网络由全卷积网络构成,特征金字塔网络抽取特征提取网络的部分特征层做融合,并进行卷积计算,每一层有两个分支,分别输出目标的类别置信度和目标的位置。
优选地,步骤S160中,基于第二关键词建立相关的场景设施类别标签的照片子集,在目标文本中生成各个第二关键词分别连接到照片子集的超链接。
优选地,步骤S160中,基于每个第二关键词建立相关的场景设施类别标签的照片子集,将目标文本中所有第二关键词的照片子集组成备选照片合集,在目标文本的网页的页面的所有图片槽中,只允许选择备选照片合集中的图片。
本发明的基于照片库的场景设施识别方法能够确保酒店展示图片的真实性,防止酒店展示虚假照片,保证用户获知真实的图片,既降低了人工纠错的成本,也杜绝了用户被欺骗的风险,提高了用户进行酒店消费的体验。
如图2至4所示,举例说明本发明的基于照片库的场景设施识别方法的实施过程。如图2所示,预设一云端照片库,云端照片库中包含很多张具有拍摄时定位信息的照片,其中,第一部分是A酒店中拍摄的照片集21,第二部分是B酒店中拍摄的照片集22,第商量部分是C酒店中拍摄的照片集23。在手机1中遍历酒店预订平台中的目标文本“A酒店具有游泳池……房间设有三人沙发……”,第一词典中具有酒店的名称,基于第一词典遍历目标文本获得第一关键词“A酒店”,第二词典中具有酒店中酒店设施的名称和/或客房设施的名称,基于第二词典再次遍历目标文本获得两个第二关键词“游泳池”、“三人沙发”。
如图3所示,根据第一关键词“A酒店”获得A酒店的定位信息。根据A酒店的定位信息在照片库中获得备选照片集21。备选照片集21中的照片基于图片识别进行设施检测获得场景设施类别标签。每张照片可以获得至少一个场景设施类别标签,本实施例中,备选照片集21中获得多个场景设施类别标签:7张酒店大堂、4张酒店餐厅、81张酒店客房、3张游泳池的照片31、32、33,以及4张三人沙发的照片41、42、43、44等……不再赘述。
如图4所示,将目标文本中的第二关键词“游泳池”、“三人沙发”与具有相同的场景设施类别标签的照片建立映射关系。
在目标文本中第二关键词“游泳池”的下方产生一个第一照片展示区域,展示与“游泳池”相关联的照片31、32、33。在目标文本中第二关键词“三人沙发”的下方产生一个第二照片展示区域,展示与“三人沙发”相关联的照片41、42、43、44,从而保证用户看到的“游泳池”相关联的照片31、32、33以及“三人沙发”相关联的照片41、42、43、44等都是在A酒店内部实地拍摄的,而不会是其他酒店的类似照片,确保了用户获知酒店情况的准确性。
本发明基于现有的图像数据,建立算法模型,能够实现对现有及未来图片的设备检测,后续将图片检测信息与文本信息相匹配,对于无法匹配的信息进行纠错,可大幅度减少人工成本,保证线上信息的准确性,并提升用户体验。
本发明针对现在海量图片与海量文本信息的情况下,根据酒店房型进行匹配,建立算法模型,筛选出图文矛盾内容,保证准确性。
本发明中使用的图片质量排序方法,方案的具体实施流程包含以下步骤:S01:对OTA场景下酒店图片进行挖掘,主要为房型图片。
S02:建立基于深度学习的图像信息挖掘算法模型,对图片进行画面识别,判断是否含有所需检测物体。算法模型包括但不限于目标检测、图像分割等。
S03:对于预测概率高于阈值的样本,将其输入分类模型,使用分类模型对框内物体进行再次判断类别。
S04:人工干预和确认图片内容物,与文本信息进行对应,并进行纠错。
对于S01,在本案实施中,挖掘OTA下酒店图片,选取房型图片,对图片进行设备检测,检测内容包括但不限于窗户、沙发、浴缸等。
其中对于S02中算法模型的实现方法,实施流程图如附图2所示。具体的,包含以下步骤:
步骤一,数据集构建
对于S01中提到的关键词,收集关键词信息的OTA场景下图片,选取部分图片,根据是否包含关键词目标,做好样本标注,并保证每个检测类别定义明确且不少于500张。其中,对于一张图片,关键目标数量可为0-N,N为S01中目标物数量。
步骤二,数据预处理
对数据集中图片做预处理操作,对图像进行归一化操作,消除特征间单位和尺度差异的影响。
步骤三,网络搭建
在本发明中,根据目标特点,搭建对应的深度卷积神经网络。在本案实施中,利用目标检测的方法提取图像信息,包含特征提取网络和特征金字塔网络。其中特征提取主干网络由全卷积网络构成,为了提高网络精度,对模型进行缩放,通过平衡网络深度、宽度、分辨率和模型显存得到更好的性能表现,因此使用简单高效的复合系数来完成对深度、宽度和分辨率所有维度的统一缩放,通过搜索和实验获得较好的平衡参数作为模型适用参数。在特征金字塔网络阶段,抽取特征提取网络的部分特征层做融合,并进行卷积计算,每一层有两个分支,分别输出目标的类别置信度和目标的位置。其中针对类别预测和位置预测设计了两种不同的目标损失函数,公式定义如下:
class loss=-αt(1-pt)γlog(pt),γ>0,αt∈[0,1] (1)
步骤四,模型训练
在本发明中,特征提取主干网络初始化采取基于lmageNet大规模公开数据集训练的预训练模型,特征金字塔网络随机初始化。然后将OTA场景下收集的图片数据集划分为训练集和验证集,在训练集上做预处理操作,进行放缩、随机旋转、随机翻转、随机裁切、色彩调整等操作,包含但不限于对比度、亮度、锐度、曝光等,有效减少过拟合现象并增加样本量。迭代模型直至训练loss收敛,且在验证集上的测试效果达到最优。
步骤五,模型预测
利用步骤三中训练好的模型对线上OTA图片做前向预测,输出图像的关键目标类别和种类。
对于S03,数据集为原图通过SO2中模型类别和位置预测进行裁切的图片,并进行人工标注类别。将裁切后的图片划分为训练集和验证集进行模型训练和测试。
对于S04,将S03中预测的类别和位置,与人工核实,若模型预测类别与人工相同,位置预测大致相同,则为正确,反之为错误,需要进一步调整训练。针对错误的case,总结错误类型,并针对性改善。
本发明基于OTA酒店下的海量图片信息,利用深度学习的方法对图片进行纠错,能够快速准确的发现信息错误,可大幅度节省运营维护成本,保证图片信息的准确性,有效提升OTA场景下用户的体验。
图5是本发明的基于照片库的场景设施识别***的模块示意图。如图5所示,本发明的基于照片库的场景设施识别***5包括:
照片库模块51,提供一照片库,照片库中包含具有拍摄时定位信息的照片。
文本遍历模块52,遍历目标文本,在目标文本中抓取关于场景名称的第一关键词和关于场景设施类别的第二关键词。
场景定位模块53,获得场景名称的定位信息。
备选照片模块54,在照片库中根据定位信息获得备选照片集。
设施识别模块55,对备选照片集中的照片基于图片识别进行设施检测获得场景设施类别标签。
关联建立模块56,将目标文本中的第二关键词与具有相同的场景设施类别标签的照片建立映射关系。
本发明的基于照片库的场景设施识别***能够确保酒店展示图片的真实性,防止酒店展示虚假照片,保证用户获知真实的图片,既降低了人工纠错的成本,也杜绝了用户被欺骗的风险,提高了用户进行酒店消费的体验。
本发明实施例还提供一种基于照片库的场景设施识别设备,包括处理器。存储器,其中存储有处理器的可执行指令。其中,处理器配置为经由执行可执行指令来执行的基于照片库的场景设施识别方法的步骤。
如上所示,该实施例本发明的基于照片库的场景设施识别***能够确保酒店展示图片的真实性,防止酒店展示虚假照片,保证用户获知真实的图片,既降低了人工纠错的成本,也杜绝了用户被欺骗的风险,提高了用户进行酒店消费的体验。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为***、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。
图6是本发明的基于照片库的场景设施识别设备的结构示意图。下面参照图6来描述根据本发明的这种实施方式的电子设备600。图6显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元610可以执行如图1中所示的步骤。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、***总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储平台等。
本发明实施例还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现的基于照片库的场景设施识别方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。
如上所示,该实施例本发明的基于照片库的场景设施识别***能够确保酒店展示图片的真实性,防止酒店展示虚假照片,保证用户获知真实的图片,既降低了人工纠错的成本,也杜绝了用户被欺骗的风险,提高了用户进行酒店消费的体验。
图7是本发明的计算机可读存储介质的结构示意图。参考图7所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上,本发明的目的在于提供基于照片库的场景设施识别方法、***、设备及存储介质,本发明的基于照片库的场景设施识别***能够确保酒店展示图片的真实性,防止酒店展示虚假照片,保证用户获知真实的图片,既降低了人工纠错的成本,也杜绝了用户被欺骗的风险,提高了用户进行酒店消费的体验。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (12)
1.一种基于照片库的场景设施识别方法,其特征在于,包括以下步骤:
S110、提供一照片库,所述照片库中包含具有拍摄时定位信息的照片;
S120、遍历目标文本,在所述目标文本中抓取关于场景名称的第一关键词和关于场景设施类别的第二关键词;
S130、获得所述场景名称的定位信息;
S140、在所述照片库中根据所述定位信息获得备选照片集;
S150、对所述备选照片集中的照片基于图片识别进行设施检测获得场景设施类别标签;以及
S160、将所述目标文本中的第二关键词与具有相同的场景设施类别标签的照片建立映射关系。
2.根据权利要求1所述的基于照片库的场景设施识别方法,其特征在于,在所述步骤S110中,所述照片库包括用户设备中储存的照片集和/或与所述用户的网络帐户相关联的云端照片库。
3.根据权利要求1所述的基于照片库的场景设施识别方法,其特征在于,在所述步骤S120中,基于第一词典遍历所述目标文本获得所述第一关键词,所述第一词典中具有各种场景名称;
基于第二词典再次遍历所述目标文本获得所述第二关键词,所述第二词典中具有基于每个所述场景名称下的设施类别名称。
4.根据权利要求3所述的基于照片库的场景设施识别方法,其特征在于,所述场景名称是酒店名称,所述设施类别名称是酒店设施的名称和/或客房设施的名称。
5.根据权利要求3所述的基于照片库的场景设施识别方法,其特征在于,所述目标文本位于以下位置中的至少一个:
一旅游平台的酒店预定网页的文本中;
一酒店网页的文本中;
一办公楼租赁网页的文本中;
一房产销售网页的文本中。
6.根据权利要求1所述的基于照片库的场景设施识别方法,其特征在于,所述步骤S150中,通过建立基于深度卷积神经网络的图像信息挖掘算法模型,对照片进行画面识别,输出基于各个预设场景设施类别标签的置信度,输出置信度大于预设阈值的场景设施类别标签。
7.根据权利要求6所述的基于照片库的场景设施识别方法,其特征在于,所述步骤S150中,利用目标检测的方法提取图像信息,包含特征提取网络和特征金字塔网络,所述提取网络由全卷积网络构成,所述特征金字塔网络抽取特征提取网络的部分特征层做融合,并进行卷积计算,每一层有两个分支,分别输出目标的类别置信度和目标的位置。
8.根据权利要求1所述的基于照片库的场景设施识别方法,其特征在于,所述步骤S160中,基于所述第二关键词建立相关的场景设施类别标签的照片子集,在所述目标文本中生成各个所述第二关键词分别连接到所述照片子集的超链接。
9.根据权利要求1所述的基于照片库的场景设施识别方法,其特征在于,所述步骤S160中,基于每个所述第二关键词建立相关的场景设施类别标签的照片子集,将所述目标文本中所有所述第二关键词的照片子集组成备选照片合集,在所述目标文本的网页的页面的所有图片槽中,只允许选择所述备选照片合集中的图片。
10.一种基于照片库的场景设施识别***,用于实现权利要求1所述的基于照片库的场景设施识别方法,其特征在于,包括:
照片库模块,提供一照片库,所述照片库中包含具有拍摄时定位信息的照片;
文本遍历模块,遍历目标文本,在所述目标文本中抓取关于场景名称的第一关键词和关于场景设施类别的第二关键词;
场景定位模块,获得所述场景名称的定位信息;
备选照片模块,在所述照片库中根据所述定位信息获得备选照片集;
设施识别模块,对所述备选照片集中的照片基于图片识别进行设施检测获得场景设施类别标签;以及
关联建立模块,将所述目标文本中的第二关键词与具有相同的场景设施类别标签的照片建立映射关系。
11.一种基于照片库的场景设施识别设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至9任意一项所述基于照片库的场景设施识别方法的步骤。
12.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现权利要求1至9任意一项所述基于照片库的场景设施识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011553573.9A CN112651332A (zh) | 2020-12-24 | 2020-12-24 | 基于照片库的场景设施识别方法、***、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011553573.9A CN112651332A (zh) | 2020-12-24 | 2020-12-24 | 基于照片库的场景设施识别方法、***、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112651332A true CN112651332A (zh) | 2021-04-13 |
Family
ID=75362723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011553573.9A Pending CN112651332A (zh) | 2020-12-24 | 2020-12-24 | 基于照片库的场景设施识别方法、***、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112651332A (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160142626A1 (en) * | 2014-11-17 | 2016-05-19 | International Business Machines Corporation | Location aware photograph recommendation notification |
CN106355429A (zh) * | 2016-08-16 | 2017-01-25 | 北京小米移动软件有限公司 | 图像素材的推荐方法及装置 |
CN107481054A (zh) * | 2017-08-14 | 2017-12-15 | 携程计算机技术(上海)有限公司 | 酒店优惠信息的推送及装置、电子设备、存储介质 |
CN107526769A (zh) * | 2017-07-10 | 2017-12-29 | 北京百度网讯科技有限公司 | 基于人工智能的照片处理方法及装置、设备及可读介质 |
CN108710847A (zh) * | 2018-05-15 | 2018-10-26 | 北京旷视科技有限公司 | 场景识别方法、装置及电子设备 |
CN108764208A (zh) * | 2018-06-08 | 2018-11-06 | Oppo广东移动通信有限公司 | 图像处理方法和装置、存储介质、电子设备 |
CN109783798A (zh) * | 2018-12-12 | 2019-05-21 | 平安科技(深圳)有限公司 | 文本信息添加图片的方法、装置、终端及存储介质 |
CN110209858A (zh) * | 2018-02-28 | 2019-09-06 | 阿里巴巴集团控股有限公司 | 展示图片确定、对象搜索、展示方法、装置、设备和介质 |
CN110851605A (zh) * | 2019-11-14 | 2020-02-28 | 携程计算机技术(上海)有限公司 | Ota酒店的图文信息匹配的检测方法、***及电子设备 |
CN110929139A (zh) * | 2018-09-04 | 2020-03-27 | 阿里巴巴集团控股有限公司 | 搜索推荐方法及装置 |
CN111522979A (zh) * | 2020-04-20 | 2020-08-11 | 携程旅游网络技术(上海)有限公司 | 图片排序推荐方法、装置、电子设备、存储介质 |
CN111597413A (zh) * | 2020-05-14 | 2020-08-28 | 上海携程商务有限公司 | 信息推送方法、***、设备及存储介质 |
CN112001389A (zh) * | 2020-10-29 | 2020-11-27 | 北京淇瑀信息科技有限公司 | 一种多场景视频中文本信息识别方法、装置及电子设备 |
-
2020
- 2020-12-24 CN CN202011553573.9A patent/CN112651332A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160142626A1 (en) * | 2014-11-17 | 2016-05-19 | International Business Machines Corporation | Location aware photograph recommendation notification |
CN106355429A (zh) * | 2016-08-16 | 2017-01-25 | 北京小米移动软件有限公司 | 图像素材的推荐方法及装置 |
CN107526769A (zh) * | 2017-07-10 | 2017-12-29 | 北京百度网讯科技有限公司 | 基于人工智能的照片处理方法及装置、设备及可读介质 |
CN107481054A (zh) * | 2017-08-14 | 2017-12-15 | 携程计算机技术(上海)有限公司 | 酒店优惠信息的推送及装置、电子设备、存储介质 |
CN110209858A (zh) * | 2018-02-28 | 2019-09-06 | 阿里巴巴集团控股有限公司 | 展示图片确定、对象搜索、展示方法、装置、设备和介质 |
CN108710847A (zh) * | 2018-05-15 | 2018-10-26 | 北京旷视科技有限公司 | 场景识别方法、装置及电子设备 |
CN108764208A (zh) * | 2018-06-08 | 2018-11-06 | Oppo广东移动通信有限公司 | 图像处理方法和装置、存储介质、电子设备 |
CN110929139A (zh) * | 2018-09-04 | 2020-03-27 | 阿里巴巴集团控股有限公司 | 搜索推荐方法及装置 |
CN109783798A (zh) * | 2018-12-12 | 2019-05-21 | 平安科技(深圳)有限公司 | 文本信息添加图片的方法、装置、终端及存储介质 |
CN110851605A (zh) * | 2019-11-14 | 2020-02-28 | 携程计算机技术(上海)有限公司 | Ota酒店的图文信息匹配的检测方法、***及电子设备 |
CN111522979A (zh) * | 2020-04-20 | 2020-08-11 | 携程旅游网络技术(上海)有限公司 | 图片排序推荐方法、装置、电子设备、存储介质 |
CN111597413A (zh) * | 2020-05-14 | 2020-08-28 | 上海携程商务有限公司 | 信息推送方法、***、设备及存储介质 |
CN112001389A (zh) * | 2020-10-29 | 2020-11-27 | 北京淇瑀信息科技有限公司 | 一种多场景视频中文本信息识别方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10007867B2 (en) | Systems and methods for identifying entities directly from imagery | |
CN111062871B (zh) | 一种图像处理方法、装置、计算机设备及可读存储介质 | |
US9454714B1 (en) | Sequence transcription with deep neural networks | |
WO2020232861A1 (zh) | 命名实体识别方法、电子装置及存储介质 | |
CN110008300B (zh) | Poi别名的确定方法、装置、计算机设备和存储介质 | |
US8725490B2 (en) | Virtual universal translator for a mobile device with a camera | |
US9785627B2 (en) | Automated form fill-in via form retrieval | |
CN105517679B (zh) | 用户地理位置的确定 | |
JP6012060B2 (ja) | 画像の方向を修正するための画像内容に基づく画像の回転 | |
JP2009003415A (ja) | 地図データ更新方法および装置 | |
US20210073617A1 (en) | Machine learning system to score alt-text in image data | |
CN109582880A (zh) | 兴趣点信息处理方法、装置、终端及存储介质 | |
JPWO2008152805A1 (ja) | 画像認識装置及び画像認識方法 | |
US20180089869A1 (en) | System and Method For Previewing Indoor Views Using Augmented Reality | |
US20210090266A1 (en) | Method and device for labeling point of interest | |
CN111914775B (zh) | 活体检测方法、装置、电子设备及存储介质 | |
CN109583389B (zh) | 绘本识别方法及装置 | |
US9122943B1 (en) | Identifying rendering differences between label rendering engines | |
CN113361643A (zh) | 基于深度学习的通用标志识别方法、***、设备及存储介质 | |
CN114943937A (zh) | 行人重识别方法、装置、存储介质及电子设备 | |
CN110555488A (zh) | 图像序列的审核方法及***、电子设备和存储介质 | |
CN111523169A (zh) | 一种装修方案生成方法、装置、电子设备及存储介质 | |
CN110609879B (zh) | 兴趣点判重方法、装置、计算机设备及存储介质 | |
CN114282258A (zh) | 截屏数据脱敏方法、装置、计算机设备及存储介质 | |
US20190228486A1 (en) | Method and system for acquiring data files of blocks of land and of building plans and for making matches thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |