CN108268488B - 网页主图识别方法和装置 - Google Patents
网页主图识别方法和装置 Download PDFInfo
- Publication number
- CN108268488B CN108268488B CN201611259514.4A CN201611259514A CN108268488B CN 108268488 B CN108268488 B CN 108268488B CN 201611259514 A CN201611259514 A CN 201611259514A CN 108268488 B CN108268488 B CN 108268488B
- Authority
- CN
- China
- Prior art keywords
- picture
- main
- theme
- candidate
- webpage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000012216 screening Methods 0.000 claims abstract description 15
- 238000001914 filtration Methods 0.000 claims description 21
- 238000013135 deep learning Methods 0.000 claims description 14
- 238000010801 machine learning Methods 0.000 claims description 4
- 238000012546 transfer Methods 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0276—Advertisement creation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/59—Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
- G06V20/597—Recognising the driver's state or behaviour, e.g. attention or drowsiness
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Business, Economics & Management (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Library & Information Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Signal Processing (AREA)
- Game Theory and Decision Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Information Transfer Between Computers (AREA)
- User Interface Of Digital Computer (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种网页主图识别方法和装置,该方法包括:基于网页中各图片的页面属性,筛选出候选主图;根据候选主图的信息主题,对候选主图的原始图片进行裁剪,得到对应的图片构图;以及确定出信息主题与所述网页的主题匹配的候选主图;以及将匹配的候选主图所对应的图片构图识别为所述网页的主图。应用本发明,可识别出有效突出网页的主题的主图,提升网页信息的传递效率,提高用户体验。
Description
技术领域
本公开一般涉及互联网技术领域,具体涉及一种网页主图识别方法和装置。
背景技术
随着互联网技术的发展,图文并茂形态的网页越来越多。商业推广中,网页中的图片可以直观地向用户传达所包含的内容;而且,相比文字展示,网页中的图片展示可提供更多的信息,更利于网民直观快速选定感兴趣的内容,尤其是图片质量和信息明显高于其他图片的网页主图,最能体现网页的主题。因此,实际应用中,为了提高商业推广的点击率,可以充分挖掘广告主的图片物料,在商业推广中展示突出网页的主题的主图。
目前,现有技术中存在一种主图识别方案可抓取网页中的关键图片:根据网页地址获取网页的DOM(Document Object Model,文档对象模型)结构;根据网页的DOM结构定位网页的中心节点;正则匹配中心节点及其兄弟节点处的图片,对正则匹配出的图片进行格式过滤和属性过滤(选出符合指定高度和宽度的图片),输出符合过滤条件的图片;将输出的图片作为抓取到的网页的关键图片。
然而,本发明的发明人发现,通过现有网页主图识别方案抓取的主图无法准确表达网页的主题,从而导致网页信息传递效率低。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种能够挖掘出有效突出网页的主题的主图的方案,从而提升网页信息的传递效率,提高用户体验。
第一方面,本申请实施例提供了一种网页主图识别方法,包括:
基于网页中各图片的页面属性,筛选出候选主图;
根据候选主图的信息主题,对候选主图的原始图片进行裁剪,得到对应的图片构图;
确定出信息主题与所述网页的主题匹配的候选主图;以及
将匹配的候选主图所对应的图片构图识别为所述网页的主图。
第二方面,本申请实施例还提供了一种网页主图识别装置,包括:
属性筛选单元,配置用于基于网页中各图片的页面属性,筛选出候选主图;
构图裁剪单元,配置用于根据候选主图的信息主题,对候选主图的原始图片进行裁剪,得到对应的图片构图;
主题匹配单元,配置用于确定出信息主题与所述网页的主题匹配的候选主图;以及
主图识别单元,配置用于将匹配的候选主图所对应的图片构图识别为所述网页的主图。
第三方面,本申请实施例还提供了一种计算设备,包括一个或多个处理器以及存储器,所述存储器包含可由所述处理器执行的指令以使得所述处理器执行本申请实施例提供的网页主图识别方法。
本申请实施例提供的网页主图识别方案,在根据页面属性筛选出候选主图后,通过对候选主图的原始图片的裁剪,以得到能够更加突出信息主题的图片构图;将信息主题与网页的主题匹配的图片构图作为网页的主图,不仅能够表达网页的主题,还可有效突出网页的主题,提升网页信息的传递效率。进一步地,通过图片类型对候选主图进行过滤,可保障最终确定的网页主图的高质量需求。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出了其中可以应用本申请实施例的示例性***架构;
图2示出了根据本申请实施例的网页主图识别方法的示例性流程图;
图3示出了根据本申请另一实施例的网页主图识别方法的示例性流程图;
图4示出了根据本申请一个实施例的网页主图识别装置的示例性结构框图;
图5出了根据本申请另一个实施例的网页主图识别装置的示例性结构框图;以及
图6示出了适于用来实现本申请实施例的计算机***的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
请参考图1,其示出了可以应用本申请实施例的示例性***架构100。
如图1所示,***架构100可以包括终端设备101、102、网络103和服务器104、105、106和107。网络103用以在终端设备101、102和服务器104、105、106、107之间提供通信链路的介质。网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户110可以使用终端设备101、102通过网络103与服务器104、105、106、107交互,以访问各种服务,例如浏览网页、下载数据等。
终端设备101、102可以是各种电子设备,包括但不限于个人电脑、智能手机、智能电视、平板电脑、个人数字助理、电子书阅读器等等。
服务器104、105、106、107可以是提供各种服务的服务器。服务器可以响应于用户的服务请求而提供服务。可以理解,一个服务器可以提供一种或多种服务,同一种服务也可以由多个服务器来提供。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
如背景技术中所提到的,现有技术提供的网页主图识别方案存在无法准确表达网页的主题的问题。这样,不仅会导致广告主网页信息的传递效率降低,而且将会导致用户无法准确快速地访问网页,用户体验差。
鉴于现有技术的上述缺陷,本申请实施例提供了一种网页主图识别方案,根据页面属性筛选出候选主图后,通过对候选主图的原始图片的裁剪,以得到能够更加突出信息主题的图片构图;将信息主题与网页的主题匹配的图片构图作为网页的主图,可有效突出网页的主题,从而提升网页信息的传递效率,提高用户体验。下面将结合流程图来描述本申请实施例的方法。
参考图2,其示出了根据本申请一个实施例的网页主图识别方法的示例性流程图。图2所示的方法可以在图1中的终端设备执行,或服务器执行。
如图2所示,在步骤210中,基于网页中各图片的页面属性,筛选出候选主图。
本发明的发明人对网页的页面结构进行分析后发现,最能表达网页主图的最主要的图片(即主图)在网页中的位置通常比较靠前且特殊;且相较于其他图片,主图的面积较大,清晰度较高。
因此,本申请实施例中,可以先抓取网页的页面信息,识别出网页中所包含的所有图片;针对网页中包含的每个图片,获取该图片的页面属性。其中,图片的页面属性可以包括如下至少一项:页面位置、屏幕占比。
页面位置指的是图片在网页中所处的位置;屏幕占比指的是图片的面积在整个网页屏幕的面积中所占比例。图片在网页中所处的位置,可通过浏览器渲染,真实计算出图片在网页中的坐标信息。
获取到网页中各图片的页面属性之后,可以基于页面属性,筛选出网页中的候选主图;筛选出的候选主图为一个或多个。
具体地,可以将网页中满足以下任一条件的图片筛选为候选主图:图片的页面位置与预设中心位置之间的差值小于第一阈值;图片的屏幕占比超过第二阈值。其中,第一阈值、第二阈值均是本领域技术人员设置的经验值。
或者,为了提高最终识别的主图的准确率,可在候选主图的筛选过程中将同时满足上述两个条件的图片作为候选主图;而满足其中任一条件或不满足上述两个条件的图片作为非候选主图。
可选地,页面属性可以进一步包括:图片面积、图片清晰度等。
这样,在筛选候选主图的过程中,可以先利用图片清晰度和图片面积做初步过滤:去除图片清晰度低于第三阈值和图片面积小于第四阈值的图片;继而,针对过滤后剩余的图片进行页面位置与预设中心位置的比较,以及图片的屏幕占比的计算;根据页面位置和屏幕占比筛选候选主图。其中,第三阈值、第四阈值可由本领域技术人员根据经验进行设置。
接着,在步骤220中,根据候选主图的信息主题,对候选主图的原始图片进行裁剪,得到对应的图片构图。
本申请实施例中,可先针对步骤210筛选得到的每个候选主图,抓取对应的原始图片;继而,利用基于深度学习的第一模型工具,识别候选主图的信息主题;并利用第一模型工具,对候选主图的原始图片进行裁剪,以得到突出信息主题的图片构图。
其中,第一模型工具是基于深度学习的预先训练好的机器学习模型。例如,可以预先收集样本图片,人工确定样本图片的信息主题,并裁剪出样本图片中突出该信息主题的图片构图;继而,利用机器学习模型学习样本图片与信息主题之间的对应关系、信息主题与图片构图之间的对应关系、样本图片与图片构图之间的对应关系,得到第一模型工具。实际应用中,第一模型工具的训练,也可采用本领域常用的其他技术手段,在此不再详述。
接着,在步骤230中,确定出信息主题与网页的主题匹配的候选主图。
为了筛选出突出网页的主题的主图,需要将各候选主图的信息主题与网页的主题进行比对,确定出与网页的主题匹配的候选主图。
候选主图的信息主题可采用本领域技术人员常用的图片主题提取技术手段进行提取;或者也可以直接获取第一模型工具识别出的候选主图的信息主题。
考虑到实际应用中,广告主通常会对网页配置竞价词,而这些竞价词一般会集中在某一个主题上。因此,网页的主题可根据用户预先为该网页配置的竞价词而确定。
最后,在步骤240中,将匹配的候选主图所对应的图片构图识别为网页的主图。
进一步地,本申请实施例可应用于搜索结果内容的生成。例如,在用户输入检索关键词后,可将用户输入的检索关键词作为查询主题;接收到查询主题后,可查找信息主题与该查询主题匹配的主图;继而,将查找到匹配的主图作为搜索结果内容进行展示。
从上面描述可以看出,在本申请的一些实施例中,针对现有网页主题不突出的问题,提出了根据候选主图的信息主题,对候选主图进行裁剪的方案。这样做可以得到候选主图突出主题的合理构图,继而在与网页的主题进行匹配后,可以得到有效突出网页的主题的主图,提升网页信息的传递效率,提升用户体验。而且,在实际应用中,若识别出的网页主图进行推广展示,将大大提高推广的点击率。
应当注意,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变部分执行顺序。例如,在执行步骤210后,可以先执行步骤230,确定出信息主题与网页的主题匹配的候选主图;之后,执行步骤220,针对与网页的主题匹配的候选主图,根据该候选主图的信息主题,对候选主图的原始图片进行裁剪,得到对应的图片构图;继而通过步骤240将匹配的候选主图所对应的图片构图识别为网页的主图。
图3示出了根据本申请另一实施例的网页主图识别方法的示例性流程图。图3所示的方法可以在图1中的终端设备或服务器执行。
如图3所示,在步骤310中,基于网页中各图片的页面属性,筛选出候选主图。
步骤310与步骤210类似,此处不再赘述。
在步骤320中,根据候选主图的信息主题,对候选主图的原始图片进行裁剪,得到对应的图片构图。
步骤320与步骤220类似,此处不再赘述。
在步骤330中,获取候选主图的图片类型,过滤指定的图片类型的候选主图。
图3所示实施例中,为了过滤一些低质量的图片,可以利用基于深度学习的第二模型工具,对候选主图的原始图片进行分类,确定出候选主图的图片类型。继而,通过预设的过滤条件对步骤210筛选出的候选主图进行过滤。比如,过滤指定的图片类型的候选主图。其中,指定的图片类型包括如下至少一项:纹理类型、二维码类型。实际应用中,还可以根据实际需求,设置需要过滤指定的图片类型。
其中,第二模型工具是基于深度学习的预先训练好的分类模型。例如,可以预先收集样本图片,人工确定样本图片的类型描述;继而,将收集的样本图片和对应的类型描述作为训练样本,对分类模型进行训练,得到第二模型工具。实际应用中,第二模型工具的训练,也可采用本领域常用的其他技术手段,在此不再详述。
接着,在步骤340中,确定出信息主题与网页的主题匹配的候选主图。
最后,在步骤350中,将匹配的候选主图所对应的图片构图识别为网页的主图。
进一步地,可将用户输入的检索关键词作为查询主题;接收到查询主题后,可查找信息主题与该查询主题匹配的主图;继而,将查找到匹配的主图作为搜索结果内容进行展示。
从上面描述可以看出,在本申请的一些实施例中,针对现有网页主题不突出的问题,提出了根据候选主图的信息主题,对候选主图进行裁剪的方案。这样做可以得到候选主图突出主题的合理构图,继而在与网页的主题进行匹配后,可以得到有效突出网页的主题的主图,提升网页信息的传递效率,提升用户体验。
而且,图3的实施例相比于图2的实施例,增加了通过图片类型对候选主图进行过滤的方案,可过滤低质量的图片,以此保障最终确定的网页主图的高质量需求,提升用户体验。
应当注意,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。例如,实施例3中的步骤320和步骤330可以交换顺序或同时进行。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
进一步参考图4,其示出了根据本申请一个实施例的网页主图识别装置400的示例性结构框图。
如图4所示,网页主图识别装置400可以包括:属性筛选单元401、构图裁剪单元402、主题匹配单元403和主图确定单元404。
其中,属性筛选单元401配置用于基于网页中各图片的页面属性,筛选出候选主图。
页面属性包括如下至少一项:页面位置、屏幕占比。
具体地,属性筛选单元401配置用于将网页中满足以下任一条件的图片筛选为候选主图:图片的页面位置与预设中心位置之间的差值小于第一阈值;图片的屏幕占比超过第二阈值。
构图裁剪单元402配置用于根据候选主图的信息主题,对候选主图的原始图片进行裁剪,得到对应的图片构图。
具体地,构图裁剪单元402配置用于利用基于深度学习的第一模型工具,识别候选主图的信息主题;以及利用基于深度学习的第一模型工具,对候选主图的原始图片进行裁剪,以得到突出信息主题的图片构图。
主题匹配单元403配置用于确定出信息主题与网页的主题匹配的候选主图。
其中,网页的主题根据用户为该网页配置的竞价词而确定。
主图识别单元404配置用于将匹配的候选主图所对应的图片构图识别为网页的主图。
可选地,网页主图识别装置400中还可以包括:主图展示单元。
主图展示单元配置用于接收到查询主题后,查找信息主题与查询主题匹配的主图,将匹配的主图进行展示。
应当理解,网页主图识别装置400中记载的诸单元与图2描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征同样适用于网页主图识别装置400及其中包含的单元,在此不再赘述。
进一步参考图5,其示出了根据本申请另一个实施例的网页主图识别装置500的示例性结构框图。
如图5所示,网页主图识别装置500可以包括:属性筛选单元501、构图裁剪单元502、候选过滤单元503、主题匹配单元504和主题确定单元505。
其中,属性筛选单元501配置用于基于网页中各图片的页面属性,筛选出候选主图。页面属性包括如下至少一项:页面位置、屏幕占比。
具体地,属性筛选单元501配置用于将网页中满足以下任一条件的图片筛选为候选主图:图片的页面位置与预设中心位置之间的差值小于第一阈值;图片的屏幕占比超过第二阈值。
构图裁剪单元502配置用于根据候选主图的信息主题,对候选主图的原始图片进行裁剪,得到对应的图片构图。
具体地,构图裁剪单元502配置用于利用基于深度学习的第一模型工具,识别候选主图的信息主题;以及利用基于深度学习的第一模型工具,对候选主图的原始图片进行裁剪,以得到突出信息主题的图片构图。
候选过滤单元503配置用于获取候选主图的图片类型;以及过滤指定的图片类型的候选主图,其中,指定的图片类型包括如下至少一项:纹理类型、二维码类型。
具体地,候选过滤单元503配置用于利用基于深度学习的第二模型工具,对候选主图的原始图片进行分类,确定出候选主图的图片类型。
主题匹配单元504配置用于确定出信息主题与网页的主题匹配的候选主图。其中,网页的主题根据用户为该网页配置的竞价词而确定。
主图识别单元505配置用于将匹配的候选主图所对应的图片构图识别为网页的主图。
可选地,网页主图识别装置500中还可以包括:主图展示单元。
主图展示单元配置用于接收到查询主题后,查找信息主题与查询主题匹配的主图,将匹配的主图进行展示。
应当理解,网页主图识别装置500中记载的诸单元与参考图3描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征同样适用于网页主图识别装置500及其中包含的单元,在此不再赘述。
进一步地,本申请实施例还提供了一种计算设备,包括一个或多个处理器以及存储器;其中,存储器包含可由处理器执行的指令以使得处理器执行本申请实施例提供的网页主图识别方法。
下面参考图6,其示出了适于用来实现本申请实施例的计算设备600的结构示意图。
如图6所示,计算机***600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有***600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考图2-图3描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行图2-图3的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
附图中的流程图和框图,图示了按照本发明各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块或单元、程序段、或代码的一部分,所述模块或单元、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中。这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
作为另一方面,本申请还提供了一种存储有计算机程序的计算机可读存储介质,该计算机可读存储介质可以是上述实施例中所述计算设备中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本申请的公式输入方法。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (15)
1.一种网页主图识别方法,其特征在于,包括:
基于网页中各图片的页面属性,筛选出候选主图;
根据候选主图的信息主题,对候选主图的原始图片进行裁剪,得到突出所述信息主题的图片构图;
确定出信息主题与所述网页的主题匹配的候选主图;以及
将匹配的候选主图所对应的图片构图识别为所述网页的主图;
所述根据候选主图的信息主题,对候选主图的原始图片进行裁剪,得到对应的图片构图,包括:
利用基于深度学习的第一模型工具,识别候选主图的信息主题;以及
利用所述第一模型工具,对候选主图的原始图片进行裁剪,以得到突出所述信息主题的图片构图;
利用机器学习模型学习样本图片与信息主题之间的对应关系、信息主题与图片构图之间的对应关系、样本图片与图片构图之间的对应关系,得到所述第一模型工具。
2.根据权利要求1所述的识别方法,其特征在于,所述页面属性包括如下至少一项:页面位置、屏幕占比。
3.根据权利要求2所述的识别方法,其特征在于,所述根据网页中各图片的页面属性,筛选出候选主图,包括:将网页中满足以下任一条件的图片筛选为候选主图:
图片的页面位置与预设中心位置之间的差值小于第一阈值;
图片的屏幕占比超过第二阈值。
4.根据权利要求1所述的识别方法,其特征在于,所述网页的主题根据用户为该网页配置的竞价词而确定。
5.根据权利要求1所述的识别方法,其特征在于,所述筛选出候选主图之后,还包括:
获取所述候选主图的图片类型;以及
过滤指定的图片类型的候选主图,其中,所述指定的图片类型包括如下至少一项:纹理类型、二维码类型。
6.根据权利要求5所述的识别方法,其特征在于,所述获取所述候选主图的图片类型,包括:
利用基于深度学习的第二模型工具,对所述候选主图的原始图片进行分类,确定出所述候选主图的图片类型。
7.根据权利要求1-6任一所述的识别方法,其特征在于,还包括:
接收到查询主题后,查找信息主题与所述查询主题匹配的主图;以及
将匹配的主图进行展示。
8.一种网页主图识别装置,其特征在于,包括:
属性筛选单元,配置用于基于网页中各图片的页面属性,筛选出候选主图;
构图裁剪单元,配置用于根据候选主图的信息主题,对候选主图的原始图片进行裁剪,得到突出所述信息主题的图片构图;
主题匹配单元,配置用于确定出信息主题与所述网页的主题匹配的候选主图;以及
主图识别单元,配置用于将匹配的候选主图所对应的图片构图识别为所述网页的主图;
所述构图裁剪单元配置用于利用基于深度学习的第一模型工具,识别候选主图的信息主题;以及利用基于深度学习的第一模型工具,对候选主图的原始图片进行裁剪,以得到突出所述信息主题的图片构图;
利用机器学习模型学习样本图片与信息主题之间的对应关系、信息主题与图片构图之间的对应关系、样本图片与图片构图之间的对应关系,得到所述第一模型工具。
9.根据权利要求8所述的识别装置,其特征在于,所述页面属性包括如下至少一项:页面位置、屏幕占比。
10.根据权利要求9所述的识别装置,其特征在于,
所述属性筛选单元配置用于将网页中满足以下任一条件的图片筛选为候选主图:
图片的页面位置与预设中心位置之间的差值小于第一阈值;
图片的屏幕占比超过第二阈值。
11.根据权利要求8所述的识别装置,其特征在于,所述网页的主题根据用户为该网页配置的竞价词而确定。
12.根据权利要求8所述的识别装置,其特征在于,还包括:
候选过滤单元,配置用于获取所述候选主图的图片类型;以及过滤指定的图片类型的候选主图,其中,所述指定的图片类型包括如下至少一项:纹理类型、二维码类型。
13.根据权利要求12所述的识别装置,其特征在于,所述候选过滤单元配置用于利用基于深度学习的第二模型工具,对所述候选主图的原始图片进行分类,确定出所述候选主图的图片类型。
14.根据权利要求8-13任一所述的识别装置,其特征在于,还包括:
主图展示单元,配置用于接收到查询主题后,查找信息主题与所述查询主题匹配的主图,将匹配的主图进行展示。
15.一种计算设备,包括一个或多个处理器以及存储器,其特征在于:
所述存储器包含可由所述处理器执行的指令以使得所述处理器执行权利要求1-7任一所述的方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611259514.4A CN108268488B (zh) | 2016-12-30 | 2016-12-30 | 网页主图识别方法和装置 |
PCT/CN2017/083544 WO2018120575A1 (zh) | 2016-12-30 | 2017-05-09 | 网页主图识别方法和装置 |
EP17888273.4A EP3564833B1 (en) | 2016-12-30 | 2017-05-09 | Method and device for identifying main picture in web page |
US16/474,842 US10963690B2 (en) | 2016-12-30 | 2017-05-09 | Method for identifying main picture in web page |
JP2019552321A JP6838167B2 (ja) | 2016-12-30 | 2017-05-09 | ウェブページメイン画像認識方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611259514.4A CN108268488B (zh) | 2016-12-30 | 2016-12-30 | 网页主图识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108268488A CN108268488A (zh) | 2018-07-10 |
CN108268488B true CN108268488B (zh) | 2022-04-19 |
Family
ID=62706746
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611259514.4A Active CN108268488B (zh) | 2016-12-30 | 2016-12-30 | 网页主图识别方法和装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10963690B2 (zh) |
EP (1) | EP3564833B1 (zh) |
JP (1) | JP6838167B2 (zh) |
CN (1) | CN108268488B (zh) |
WO (1) | WO2018120575A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110209854B (zh) * | 2019-05-06 | 2021-08-31 | 无线生活(北京)信息技术有限公司 | 图片确定方法及装置 |
CN112766997A (zh) * | 2019-11-01 | 2021-05-07 | 百度在线网络技术(北京)有限公司 | 图片投放方法、装置、设备和存储介质 |
CN113742553B (zh) * | 2021-09-03 | 2024-03-19 | 上海哔哩哔哩科技有限公司 | 数据处理方法及装置 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0116113D0 (en) | 2001-06-30 | 2001-08-22 | Hewlett Packard Co | Tilt correction of electronic images |
GB2378340A (en) | 2001-07-31 | 2003-02-05 | Hewlett Packard Co | Generation of an image bounded by a frame or of overlapping images |
JP2005062991A (ja) * | 2003-08-08 | 2005-03-10 | Komatsu Ltd | Webページ閲覧装置 |
US20080288459A1 (en) * | 2007-05-17 | 2008-11-20 | Sang-Heun Kim | Web page transcoding method and system applying queries to plain text |
US20100073398A1 (en) | 2008-09-22 | 2010-03-25 | Microsoft Corporation | Visual summarization of web pages |
JP5407640B2 (ja) * | 2009-07-29 | 2014-02-05 | ソニー株式会社 | 画像対応装置、動作設定方法、プログラム |
JP5165021B2 (ja) | 2010-05-11 | 2013-03-21 | ヤフー株式会社 | カテゴリ処理装置及び方法 |
JP5388988B2 (ja) | 2010-10-26 | 2014-01-15 | ヤフー株式会社 | 広告選択装置、方法及びプログラム |
US9589184B1 (en) * | 2012-08-16 | 2017-03-07 | Groupon, Inc. | Method, apparatus, and computer program product for classification of documents |
US20140122233A1 (en) | 2012-10-31 | 2014-05-01 | Microsoft Corporation | User-advertiser bargaining in search results |
US9536001B2 (en) | 2012-11-13 | 2017-01-03 | Microsoft Technology Licensing, Llc | Intent-based presentation of search results |
US20140244405A1 (en) * | 2013-02-28 | 2014-08-28 | OneSpot, Inc. | Automatic Generation of Digital Advertisements |
CN104142945B (zh) * | 2013-05-08 | 2018-05-04 | 阿里巴巴集团控股有限公司 | 一种基于查询词的检索方法及装置 |
CN103824311B (zh) * | 2013-11-29 | 2017-05-03 | 北京世界星辉科技有限责任公司 | 聚合图像的生成方法及设备 |
CN104063489A (zh) | 2014-07-04 | 2014-09-24 | 百度在线网络技术(北京)有限公司 | 一种确定网页图片相关度及显示检索结果的方法及装置 |
CN104123363B (zh) * | 2014-07-21 | 2018-07-13 | 北京奇虎科技有限公司 | 网页主图提取方法及装置 |
CN105630780A (zh) * | 2014-10-27 | 2016-06-01 | 小米科技有限责任公司 | 网页信息处理方法及装置 |
CN104504649A (zh) * | 2014-12-30 | 2015-04-08 | 百度在线网络技术(北京)有限公司 | 图片的裁剪方法和装置 |
CN105095911B (zh) * | 2015-07-31 | 2019-02-12 | 小米科技有限责任公司 | 敏感图片识别方法、装置以及服务器 |
CN105718950B (zh) * | 2016-01-22 | 2018-11-27 | 天津中科智能识别产业技术研究院有限公司 | 一种基于结构约束的半监督多视角聚类方法 |
CN105959330A (zh) * | 2016-07-20 | 2016-09-21 | 广东世纪网通信设备股份有限公司 | 虚假链接拦截方法、装置以及*** |
-
2016
- 2016-12-30 CN CN201611259514.4A patent/CN108268488B/zh active Active
-
2017
- 2017-05-09 JP JP2019552321A patent/JP6838167B2/ja active Active
- 2017-05-09 EP EP17888273.4A patent/EP3564833B1/en active Active
- 2017-05-09 US US16/474,842 patent/US10963690B2/en active Active
- 2017-05-09 WO PCT/CN2017/083544 patent/WO2018120575A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
EP3564833B1 (en) | 2023-02-22 |
US10963690B2 (en) | 2021-03-30 |
WO2018120575A1 (zh) | 2018-07-05 |
EP3564833A4 (en) | 2020-08-19 |
US20190332859A1 (en) | 2019-10-31 |
JP6838167B2 (ja) | 2021-03-03 |
JP2020502710A (ja) | 2020-01-23 |
CN108268488A (zh) | 2018-07-10 |
EP3564833A1 (en) | 2019-11-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106484266B (zh) | 一种文本处理方法及装置 | |
CN105677764B (zh) | 信息提取方法和装置 | |
US11449563B2 (en) | User driven clipping based on content type | |
WO2015047920A1 (en) | Title and body extraction from web page | |
CN107153716B (zh) | 网页内容提取方法和装置 | |
US20150278248A1 (en) | Personal Information Management Service System | |
EP3276509A1 (en) | Automatic detection and transfer of relevant image data to content collections | |
CN115982376B (zh) | 基于文本、多模数据和知识训练模型的方法和装置 | |
CN113382279A (zh) | 直播推荐方法、装置、设备、存储介质以及计算机程序产品 | |
CN108268488B (zh) | 网页主图识别方法和装置 | |
CN114722292A (zh) | 书籍搜索方法、装置、设备和存储介质 | |
CN109558123B (zh) | 网页转化电子书的方法、电子设备、存储介质 | |
CN106611148B (zh) | 基于图像的离线公式识别方法和装置 | |
CN106919593B (zh) | 一种搜索的方法和装置 | |
WO2018208412A1 (en) | Detection of caption elements in documents | |
CN112182451A (zh) | 网页内容摘要生成方法、设备、存储介质及装置 | |
US20130230248A1 (en) | Ensuring validity of the bookmark reference in a collaborative bookmarking system | |
CN114880498B (zh) | 事件信息展示方法及装置、设备和介质 | |
CN113221572B (zh) | 一种信息处理方法、装置、设备及介质 | |
KR102444172B1 (ko) | 영상 빅 데이터의 지능적 마이닝 방법과 처리 시스템 | |
CN114416945A (zh) | 一种词云图显示方法、装置、设备及介质 | |
CN112950167A (zh) | 设计服务匹配方法、装置、设备及存储介质 | |
US11106737B2 (en) | Method and apparatus for providing search recommendation information | |
CN113343133A (zh) | 显示页面生成方法、相关装置及计算机程序产品 | |
CN108319640B (zh) | 根据用户偏好进行车源展现的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |