TWI620441B - 即時影像擷取參數的機器學習之技術 - Google Patents

即時影像擷取參數的機器學習之技術 Download PDF

Info

Publication number
TWI620441B
TWI620441B TW105103784A TW105103784A TWI620441B TW I620441 B TWI620441 B TW I620441B TW 105103784 A TW105103784 A TW 105103784A TW 105103784 A TW105103784 A TW 105103784A TW I620441 B TWI620441 B TW I620441B
Authority
TW
Taiwan
Prior art keywords
image
parameter
candidate
scene
features
Prior art date
Application number
TW105103784A
Other languages
English (en)
Other versions
TW201707436A (zh
Inventor
艾德蒙 查隆
迪米崔 魯道伊
諾姆 利維
哈里許 愛沙奇桑卡蘭
賈諾 尼卡寧
喬尼 馬蒂斯 馬塔
澤曼 沃羅諾夫
Original Assignee
英特爾公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 英特爾公司 filed Critical 英特爾公司
Publication of TW201707436A publication Critical patent/TW201707436A/zh
Application granted granted Critical
Publication of TWI620441B publication Critical patent/TWI620441B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/771Feature selection, e.g. selecting representative features from a multi-dimensional feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/35Categorising the entire scene, e.g. birthday party or wedding scene
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/64Computer-aided capture of images, e.g. transfer from script file into camera, check of taken image quality, advice or proposal for image composition or decision on when to take image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)
  • Image Processing (AREA)

Abstract

可提供用於操作一機器學習裝置之方法、設備及系統其係經由獲得訓練影像資料,就一影像擷取裝置的一或多個即時參數進行該訓練影像資料之一離線預測分析,及基於該離線預測分析產生一或多個參數預測模型。此外,可提供用於操作該影像擷取裝置之方法、設備及系統其係經由獲得與該影像擷取裝置相關聯的一候選者影像,判定該候選者影像對應於一參數預測模型中表示的一特定類型場景,及至少部分地基於與該特定類型場景相關聯的一或多個參數值調整該影像擷取裝置的一或多個即時參數。

Description

即時影像擷取參數的機器學習之技術
本發明係有關於即時影像擷取參數的機器學習之技術。
發明背景
相機可使用自動曝光模式用以判定針對影像的正確曝光而無最終用戶(例如,照相者)的輸入。更明確言之,習知自動曝光解決方案可能試圖決定曝光參數值,諸如曝光時間、類比增益、數位增益等其使得最終影像符合亮度(brightness)目標。因時間限制及與即時相機操作相關聯的的處理極限故,亮度目標可能由相機製造商固定。但自視覺觀點,不同類型場景可能沒有相同的最佳亮度位準。如此,針對一型場景固定的亮度目標可能對另一型場景獲得非最佳結果。另一方面,針對不同類型場景將不同的亮度目標硬編碼於相機可能涉及耗時及昂貴的代碼編寫、彙編及製造活動。
依據本發明之一實施例,係特地提出一種影像擷取裝置,其包含:用以擷取一候選者影像的一感測器模組; 用以自該感測器模組獲得該候選者影像的一預處理器;及耦合至該預處理器的一目標覆寫設備,該目標覆寫設備包括:一預測器,用以判定該候選者影像對應於一參數預測模型中表示的一特定類型場景;及一參數控制器,用以至少部分地基於與該特定類型場景相關聯的一或多個參數值來調整該影像擷取裝置的一或多個即時參數。
10、40‧‧‧機器學習裝置
12、42‧‧‧訓練影像資料
14‧‧‧預測模型
16、24‧‧‧參考影像
18、30‧‧‧候選者影像
20、54、64‧‧‧影像擷取裝置
22‧‧‧影像
26‧‧‧亮度目標位準
28‧‧‧預設亮度目標位準
32、46‧‧‧方法
34-38、48-52‧‧‧方塊
40a‧‧‧預測模型產生器
40b、60c、70‧‧‧特徵計算器
40c、60d‧‧‧特徵選擇器
40d、60e‧‧‧分段組件
40e‧‧‧地面實況擷取器
44、62‧‧‧參數預測模型
56、66‧‧‧感測器模組
58、68‧‧‧預處理器
60、80‧‧‧目標覆寫設備(TOA)
60a‧‧‧預測器
60b‧‧‧參數預測器
61‧‧‧信號節點
72‧‧‧自動曝光控制(AEC)組件
74‧‧‧自動對焦(AF)組件
76‧‧‧調性對映(TM)組件
78‧‧‧自動白平衡(AWB)組件
82‧‧‧其它管線組件
84‧‧‧白平衡增益組件
700‧‧‧系統
702‧‧‧平台
705‧‧‧晶片組
710‧‧‧處理器
712‧‧‧記憶體
714‧‧‧儲存裝置
715‧‧‧圖形子系統
716‧‧‧應用程式
718‧‧‧無線電
720‧‧‧顯示器
722‧‧‧使用者介面
730‧‧‧內容服務裝置
740‧‧‧內容傳遞裝置
760‧‧‧網路
800‧‧‧裝置
802‧‧‧殼體
804‧‧‧顯示器
806‧‧‧輸入/輸出(I/O)裝置
808‧‧‧天線
812‧‧‧導航特性件
實施例之各項優點經由研讀後文說明書及隨附之申請專利範圍,且藉由參考附圖對熟諳技藝人士將變得更為彰顯,附圖中:圖1A為依據一實施例用以判定即時影像擷取參數的一機器學習辦法之一實例的方塊圖;圖1B為依據一實施例一亮度目標決定之一實例的例示;圖2為依據一實施例操作機器學習裝置之方法之一實例的流程圖;圖3為依據一實施例一機器學習裝置之一實例的方塊圖;圖4為依據一實施例操作影像擷取裝置之方法之一實例的流程圖;圖5為依據一實施例一影像擷取裝置之一實例的方塊圖;圖6為依據一實施例一多層知覺(MLP)神經網路之一信號節點之一實例的例示; 圖7為依據一實施例具有一目標覆寫設備部署於多個組件中之一影像擷取裝置之一實例的方塊圖;圖8為依據一實施例具有一導航控制器的系統之一實例的方塊圖;及圖9為依據一實施例具有一小形狀因數的系統之一實例的方塊圖。
較佳實施例之詳細說明
圖1A顯示決定即時影像擷取參數的機器學習辦法。於該例示性實施例中,一機器學習裝置10(例如,伺服器、桌上型電腦、筆記型電腦、平板電腦、變形平板等)使用訓練影像資料12用以產生一預測模型14,其表示含在該訓練影像資料12中的各型場景。更明確言之,訓練影像資料12可包括特定類型場景的參考影像16以及與一影像擷取裝置20(例如,數位相機、智慧型電話、變形平板、平板電腦等)相關聯的候選者影像18。例示說明的參考影像16具有最佳亮度、聚焦、及/或白平衡特性,而候選者影像18可含有由影像擷取裝置產生的原始影像而未就亮度、聚焦、白平衡等做加強。容後詳述,機器學習裝置10可就一或多個即時參數(例如,曝光控制亮度參數、調性對映亮度參數、對焦參數、白平衡參數等)進行訓練影像資料12的離線預測分析,其中例示說明的預測模型14係基於離線預測分析而產生。
再者,例示性影像擷取裝置20檢測何時接續影像 對應於預測模型14中反映的特定類型場景,及至少部分基於與該等特定類型場景相關聯的預測模型14中之參數值而調整影像擷取裝置20的即時參數(例如,曝光控制亮度參數、調性對映亮度參數、對焦參數、白平衡參數等)。舉例言之,預測模型14針對特定類型之高動態範圍場景,諸如明亮天空有個人站在前景中,可包括曝光控制亮度參數(例如,曝光時間、類比增益、數位增益、閃光燈),其中影像擷取裝置20可決定類似類型的場景正在被即時拍照。於此種情況下,影像擷取裝置20可於預測模型14使用曝光控制亮度參數用以產生取決於影像22中所含場景類型(例如,明亮天空有個人站在前景中)被優化的影像22。
特別值得注意者為於該例示性實施例中,影像擷取裝置20並未以任何固定亮度目標硬編碼。反而,預測模型14可單純給影像擷取裝置20提供適當場景特性及針對影像擷取裝置20的對映參數值快速地檢測特殊場景,且收歛在相對於參考影像16優化影像22的最佳即時參數。就此方面而言,可由影像擷取裝置20的製造商及/或終端使用者(例如,拍照者)產生(例如,使用離線影像處理工具及/或不同的影像擷取裝置)的參考影像16可表示寬廣多種場景類型。舉例言之,另一型高度動態範圍場景,諸如有明亮窗戶的室內房間,也可涵括於參考影像16,其中預測模型14可提供與針對另一型高度動態範圍場景不同的場景特性及對應參數值(例如,明亮天空有個人站在前景中)。如此,例示性機器學習辦法使得影像擷取裝置20能優化許多不同類型場 景的影像而無需考慮即時相機操作相關聯的時間限制及處理極限。機器學習裝置10及影像擷取裝置20可在相同或不同平台上實施。
圖1B顯示一參考影像24具有一亮度目標位準26,其係用來即時覆寫與一候選者影像30相關聯的一預設亮度目標位準28。參考影像24通常可用於離線預測分析用以產生一參數預測模型,諸如預測模型14(圖1A),其中候選者影像30通常表示欲被優化的一影像,諸如優化影像22(圖1A)中之一者。於該例示性實施例中,參考影像24及候選者影像30兩者含有明亮天空有個人站在前景中,其由影像擷取裝置的製造商或終端用戶將被視為一「特殊場景」。據此,於離線預測分析期間有關特定場景類型習得的知識可用來以與參考影像24相關聯的亮度目標位準26覆寫預設亮度目標位準28。
現在參考圖2,顯示操作一機器學習裝置之方法32。如前文已討論,方法32大致上於機器學習裝置實施,諸如機器學習裝置10(圖1)。更明確言之,方法32可實施為於可執行軟體的一或多個模組,呈儲存於記憶體的機器-或電腦-可讀取儲存媒體中之一組邏輯指令,諸如隨機存取記憶體(RAM)、唯讀記憶體(ROM)、可規劃ROM(PROM)、韌體、快閃記憶體等,於可組配邏輯諸如可規劃邏輯陣列(PLA)、可現場程式規劃閘陣列(FPGA)、複雜可規劃邏輯裝置(CPLD),於使用電路技術,諸如特定應用積體電路(ASIC)、互補金氧半導體(CMOS)、或電晶體-電晶體邏輯(TTL)技術、 或其任何組合的固定功能邏輯硬體。
例示性處理方塊34提出獲得訓練影像資料,其中該訓練影像資料可包括特定類型場景之參考影像及與一影像擷取裝置相關聯的候選者影像。例示性方塊36進行訓練影像資料相對於影像擷取裝置的一或多個即時參數的離線預測分析。方塊36可包括基於訓練影像資料而識別一組「候選者」特徵(例如,邊緣、角隅、直方圖及/或其它統計資料),及自該組候選者特徵中選出一組「分析」特徵。
更明確言之,影像擷取管線可含有計算影像統計資料的自動曝光、自動對焦、及自動白平衡組件。大部分此等統計資料可於影像的各個「拼貼塊」計算(例如,若影像大小為1000x1000像素而拼貼塊大小為50x50像素,則拼貼塊數目為每個影像20x20=400拼貼塊),但其它統計資料可針對整個影像通用計算(諸如通用直方圖)。此外,統計資料可使用彩度及光度(luminance)資訊兩者以及相關影像濾波器之輸出及直方圖資料。
結果,特徵之數目可能相當高。舉例言之,即便當拼貼塊數目為8x8=64時,影像維度之數字可能約為1700。因此,一旦已經識別該組候選者特徵,特徵/屬性排序或選擇解決方案可用以選擇該組分析特徵。當屬性值為相似/接近時,藉由度量預測類別值如何地相似/接近,特徵選擇通常可評估屬性的價值/排序。特徵選擇可使用機器學習(ML)軟體包中方便易得的演算法/存庫,諸如得自WEKA(Waikato大學)的「ReliefFAttributeEval」。於一個實 施例中,某個數目(例如,200)的排名在前的屬性可用作為被選用該組分析特徵。
處理方塊36也可提供將訓練影像資料的影像基於亮度強度及該組候選者特徵而分段成多區,及以每區基準自訓練影像資料擷取地面實況資料,其中該離線預測分析係進一步基於地面實況資料進行。更明確言之,可擷取三個類型的像素:「陰影」、「中間調性」、及「打亮」。分段可在線性空間(亦即未施加γ校正)中的灰階影像(亮度頻道)上進行,可不使用特殊影像資訊。
為了提高分段的穩健度,可首先定位白及黑像素。為達此目的,可假設影像灰階值定標為0...1範圍。白像素可定義為具有g0.95,於該處g為像素灰階值。黑像素可定義為具有g<0.05,其中針對其餘分段過程白及黑像素可忽略不計。為了建立曝光獨立分段,可在影像(白及黑區除外)上執行直方圖等化。此種調性操作可修改像素值,使得所得影像的直方圖儘可能地接近均一者。在該等化影像上,像素可根據其灰階值***如下:陰影:0.05g<0.25
中間調性:0.25g<0.75
打亮:0.75g<0.95
此處提供之數值僅係為了方便討論且可依情況而改變。此外,該等區域可基於其它屬性定義,諸如對焦程度、白平衡狀態等。然後,各區域之亮度可以其中像素之平均值計算,其中該計算可基於全尺寸影像操作,或其 它由影像統計資料(例如,自動白平衡及紅、綠、藍、sync/RGBS)輸出所得縮減尺寸影像操作。如此,地面實況資料諸如平均亮度可根據分段結果及該組候選者特徵,以每區為基準而擷取自訓練影像資料。再者,地面實況資料及該組分析特徵可用來進行離線預測分析。
方塊38可基於離線預測分析而產生一或多個參數預測模型。各個參數預測模型通常可包括具有參數值的多個神經網路節點。更明確言之,參數預測模型可在各個節點使用特徵權值及臨界值,以及針對模型本身的節點權值及臨界值。舉例言之,當使用神經網路多層知覺模型以進行數值預測(或回歸分析)時,臨界值可使用神經網路存庫工具直接計算,諸如MATLAB(數學工作公司(Mathworks,Inc.)之註冊商標)訓練組件軟體工具。於一個實施例中,含有例如200特徵之一組分析特徵可組合100節點單層神經網路模型。也可使用其它預測模型諸如以樹為基礎之預測模型、非線性最小平方、最小平方支援向量機器等。
圖3顯示機器學習裝置40(40a-40e)。機器學習裝置40可方便取代前文已討論的機器學習裝置10(圖1A)。於該例示性實施例中,機器學習裝置40獲得訓練影像資料42(特定類型場景之參考影像及與一影像擷取裝置相關聯的候選者影像),其中一預測模型產生器40a進行訓練影像資料42相對於一影像擷取裝置的一或多個即時參數的離線預測分析。即時參數可包括例如,曝光控制亮度參數、調性對映亮度參數、對焦參數、白平衡參數等。機器學習裝 置40可包括一特徵計算器40b(例如,統計資料計算器)用以基於訓練影像資料42識別一組候選者特徵,及一特徵選擇器40c用以自該組候選者特徵中選出一組分析特徵,其中該預測模型產生器40a可基於該組分析特徵進行離線預測分析。
機器學習裝置40也可包括一分段組件40d用以基於光度強度而將訓練影像資料42中之影像分段成多區。一地面實況擷取器40e可基於每區基準而自訓練影像資料擷取地面實況資料(例如,平均亮度),其中該預測模型產生器40a可進一步基於地面實況資料而進行離線預測分析。例示性預測模型產生器40a基於離線預測分析而產生一或多個參數預測模型44。如前記,各個參數預測模型44可對應一型場景,及包括具有參數值之多個神經網路節點。
轉向參考圖4,顯示一種操作影像擷取裝置之方法46。如前文討論,方法46通常係於影像擷取裝置實施,例如機器學習裝置20(圖1)。更明確言之,方法46可使用電技術諸如ASIC、CMOS或TTL技術、或其任何組合,於固定功能邏輯硬體,以可組配邏輯諸如PLA、FPGA、CPLD,實施為於可執行軟體中之一或多個模組,為儲存於記憶體諸如RAM、ROM、PROM、韌體、快閃記憶體等的機器-或電腦-可讀取儲存媒體中之一組邏輯指令。
例示性處理方塊48提供獲得(例如,作為迭代重複處理的一部分以針對一特定類型場景收歛在優化即時參數上)與一影像擷取裝置相關聯的一候選者影像。候選者影 像因而包括預處理原始拜耳(Bayer)資料。方塊50可決定候選者影像對應在一參數預測模型中表示的一特定類型場景。於一個實施例中,方塊50包括基於候選者影像而識別一組候選者特徵(例如,邊緣、角隅、直方圖及/或其它統計資料),及自該組候選者特徵中選出一組分析特徵。方塊50也可包括基於與候選者影像相關聯的該組分析特徵與該經擇定的參數預測模型間之對應程度而自多個參數預測模型中選定一參數預測模型。
影像擷取裝置的一或多個即時參數(例如,亮度參數、聚焦參數、白平衡參數)可於方塊52基於與該特定類型場景相關聯的一或多個參數值而予調整。方塊52可包括計算來自於參數預測模型中的一或多個神經網路節點之一或多個參數值。舉例言之,若對應候選者影像的該組分析特徵與參數預測模型中之某些節點重度相關,雙彎曲函數(例如,具有「S」字形的邏輯函數)可於各個相關節點計算用以決定節點對涉及場景類型的貢獻。然後雙彎曲函數之結果可經線性組合以計算影像的估計參數值。舉例言之,以亮度為例,計算可決定曝光控制參數值(例如,曝光時間、類比增益、數位增益、閃光燈等)、調性對映參數值等。如前文討論,方塊52也可基於例如光度強度,提供將候選者影像分段成多區。分段資訊可由影像擷取裝置中之其它影像管線組件使用。
圖5顯示一影像擷取裝置54。如前文討論,影像擷取裝置54方便取代影像擷取裝置20(圖1A)。於該例示性 實施例中,影像擷取裝置20包括一感測器模組56用以擷取候選者影像(例如,迭代重複地收歛在針對一特定類型場景的優化即時參數上)及一預處理器58用以自感測器模組56獲得候選者影像。預處理器58可在候選者影像上進行某些操作,諸如缺陷像素校正、雜訊減低、線性化、陰影校正等。
例示性影像擷取裝置54也包括耦合至預處理器58的一目標覆寫設備60(60a-60e)。目標覆寫設備60通常包括一預測器60a用以決定/檢測何時候選者影像對應於一參數預測模型62中表示的一特定類型場景。此外,一參數控制器60b可基於與該特定類型場景相關聯的一或多個參數值而調整影像擷取裝置54的一或多個即時參數(例如,亮度參數、聚焦參數、白平衡參數)。於一個實施例中,預測器60a計算來自參數預測模型62中的一或多個神經網路節點之一或多個參數值。
目標覆寫設備60也可包括一特徵計算器60c(例如,統計資料計算器)用以基於候選者影像識別一組候選者特徵,及一特徵選擇器60d用以自該組候選者特徵中選出一組分析特徵,其中該參數控制器60b可進一步基於該組分析特徵而調整一或多個即時參數。圖6顯示多層知覺(MLP)神經網路之一信號節點61的一實例,其中該相同特徵向量係用於各個節點,但權值及偏壓值可於各個節點改變。全部節點之輸出可使用輸出層之適當權值及偏壓值組合。於該例示性實施例中, ,表示特徵向量及Nf為特徵數目;,表示於第i個節點中各個特徵之權值;,表示第i個節點之值及Bi為第i個節點之偏壓(或臨界值);σ(x),為活化函數其可以是線性、雙彎曲、tanh等如於下列:
,表示各個節點之值的向量其於輸出層組合以計算終預測及Nn為節點數目;,表示輸出層中之權值(例如,各個節點對終預測計算之貢獻);,表示預測終值,於該處b0為輸出層之偏壓(或臨界值)及於輸出層的活化函數為線性函數。
如前記,也可使用其它預測模型諸如以樹為基礎之預測模型、非線性最小平方、最小平方支援向量機器等。例示性目標覆寫設備60也包括一分段組件60e,其基於例如光度強度而將候選者影像分段成多區。分段資訊可由影像擷取裝置54中之其它影像管線組件(於圖中未顯示)使用。
現在轉而參考圖7,一影像擷取裝置64之一個實例以更大細節顯示。於該例示性實施例中,一感測器模組 66擷取候選者影像(例如,原始拜耳資料),其中一預處理器68自感測器模組66取得候選者影像及處理之(例如,透過缺陷像素校正、雜訊減低、線性化、陰影校正等)。一特徵計算器70可使用影像統計資料用以基於候選者影像而識別多組候選者特徵。特徵計算器70之輸出可提供給一自動曝光控制(AEC)組件72、一自動對焦(AF)組件74、一調性對映(TM)組件76、一自動白平衡(AWB)組件78及其類。AEC組件72大致上可最大化影像的資訊內容,及TM組件76可判定影像之終亮度。
特別值得注意者為一目標覆寫設備(TOA)80可部署於AEC組件72、AF組件74、TM組件76、及AWB組件78中之一或多者,其中如前文討論,各個TOA 80可發揮類似目標覆寫設備60(圖5)之功能。如此,於AEC組件72中之TOA 80可對感測器模組66控制亮度,曝光控制參數經調整適應由機器學習裝置所產生的參數預測模型中表示的特定類型場景。同理,於TM組件76中之TOA 86可透過其它管線組件82(例如,γ及調性對映)控制亮度,調性對映參數經調整適應於參數預測模型中表示的特定類型場景。此外,AF組件74中的例示性TOA 80可控制感測器模組66中之聚焦相關致動器,聚焦參數經調整適應於參數預測模型中表示的特定類型場景。此外,AWB組件78中之TOA 80可針對白平衡增益組件84進行RGB增益控制,白平衡參數經調整適應於參數預測模型中表示的特定類型場景。
圖8例示系統700之一實施例。於實施例中,系統 700可以是媒體系統,但系統700並不限於此一脈絡。舉例言之,系統700可結合入個人電腦(PC)、膝上型電腦、超膝上型電腦、平板、觸控板、可攜式電腦、手持式電腦、掌上型電腦、個人數位助理器(PDA)、胞狀電話、胞狀電路/PDA之組合、電視、智慧型裝置(例如,智慧型電話、智慧型平板、或智慧型電視)、行動網際網路裝置(MID)、傳訊裝置、資料通訊裝置等。
於實施例中,系統700包含耦合至一顯示器720的一平台702,顯示器720呈現視覺內容。平台702可自一內容裝置,諸如內容服務裝置730或內容傳遞裝置740或其它類似內容來源接收內容。包含一或多個導航特性件之一導航控制器750可用來與例如平台702及/或顯示器720互動。此等組件各自容後詳述。
於各種實施例中,平台702可包含晶片組705、處理器710、記憶體712、儲存裝置714、圖形子系統715、應用程式716及/或無線電718(例如,網路控制器)之任一種組合。晶片組705可提供處理器710、記憶體712、儲存裝置714、圖形子系統715、應用程式716及/或無線電718間之交互通訊。舉例言之,晶片組705可包括能夠提供與儲存裝置714交互通訊之一儲存裝置配接器(圖中未顯示)。
處理器710可實施為複雜指令集電腦(CISC)處理器或精簡指令集電腦(RISC)處理器;x86指令集可相容處理器、多核心、或任何其它微處理器或中央處理單元(CPU)。於實施例中,處理器710可包括雙核心處理器、雙核心行動 處理器等。
記憶體712可實施為依電性記憶體,諸如但非僅限於隨機存取記憶體(RAM)、動態隨機存取記憶體(DRAM)、或靜態RAM(SRAM)。
儲存裝置714可實施為非依電性儲存裝置,諸如但非僅限於磁碟驅動裝置、光碟驅動裝置、磁帶驅動裝置、內部儲存裝置、外接式儲存裝置、快閃記憶體、電池後備SDRAM(同步DRAM)、及/或網路可接取儲存裝置。於實施例中,儲存裝置714可包含技術以當涵括例如多個硬碟驅動裝置時增加儲存效能,提升對有價值之數位媒體的保護。
圖形子系統715可執行影像諸如靜像或視訊之處理用於顯示。圖形子系統715可以是例如圖形處理單元(GPU)或視覺處理單元(VPU)。類比或數位介面可用以通訊式耦接圖形子系統715及顯示器720。舉例言之,該介面可為高畫質多媒體介面、顯示器埠、無線HDMI、及/或無線HD依從性技術中之任一者。圖形子系統715可整合入處理器710或晶片組705。圖形子系統715可為通訊式耦接至晶片組705之一獨立式卡片。於一個實施例中,圖形子系統715包括如此處描述之影像擷取裝置。
此處描述之圖形及/或視訊處理技術可於各種硬體架構具體實施。舉例言之,圖形及/或視訊功能可整合於一晶片組。另外,可使用分開的圖形及/或視訊處理器。至於又另一實施例,該等圖形及/或視訊功能可由一通用處理器,包括多核心處理器提供。於又一個實施例中,該等功 能可於一消費性電子裝置實施。
無線電718可包括能夠使用多種合宜無線通訊技術發射及接收信號之一或多個無線電。此等技術可涉及橫跨一或多個無線網路通訊。無線網路之實施例包括(但非限制性)無線區域網路(WLAN)、無線個人區域網路(WPAN)、無線都會區域網路(WMAN)、胞狀網路、及衛星網路。於橫跨此等網路通訊中,無線電718可以任何版本根據一或多個適用標準操作。
於實施例中,顯示器720可包含任何電視型監視器或顯示器。顯示器720可包含例如電腦顯示器螢幕、觸控螢幕顯示器、視訊監視器、類似電視裝置、及/或電視。顯示器720可為數位及/或類比。於實施例中,顯示器720可為全像顯示器。又,顯示器720可為接收視覺投影之一透明表面。此等投影可傳遞各種形式之資訊、影像、及/或物體。舉例言之,此等投影可為行動增強實境(MAR)應用程式之一視覺疊加。於一或多個軟體應用程式716之控制之下,平台702可在顯示器720上顯示使用者介面722。
於實施例中,內容服務裝置730可藉任何國家、國際及/或獨立服務主持,及如此,例如透過網際網路可存取平台702。內容服務裝置730可耦接至平台702及/或耦接至顯示器720。平台702及/或內容服務裝置730可耦接至一網路760以通訊(例如發送及/或接收)媒體資訊至及自網路760。內容傳遞裝置740也可耦接至平台702及/或耦接至顯示器720。
於實施例中,內容服務裝置730可包含有線電視盒、個人電腦、網路、電話、能夠傳遞數位資訊及/或內容之網際網路致動裝置或設施、及能夠透過網路760或直接地在內容提供者與平台702及/或顯示器720間單向或雙向通訊內容的任何其它類似裝置。須瞭解內容可透過網路760單向及/或雙向地至及自系統700中之組件中之任一者及一內容提供者通訊。內容之實施例可包括任何媒體資訊,包括例如視訊、音樂、醫療及遊戲資訊等。
內容服務裝置730接收內容,諸如有線電視節目,包括媒體資訊、數位資訊、及/或其它內容。內容提供者之實施例可包括任何有線或衛星電視或無線電或網際網路內容提供者。所提出之實例絕非意圖限制實施例。
於實施例中,平台702可自具有一或多個導航特性件之導航控制器750接收控制信號。控制器750之導航特性件例如可用以介接使用者介面722。於實施例中,導航控制器750可為一指標裝置,其可為一電腦硬體組件(特別人機介面裝置)其許可一使用者將空間(例如連續及多維)資料輸入一電腦。許多系統諸如圖形使用者介面(GUI)、及電視及監視器允許該使用者使用實體手勢以控制及提供資料給該電腦或電視。
控制器750之導航特性件之移動可藉指標器、游標、調焦環、或顯示在顯示器上之其它視覺指示器的移動,或藉音訊指令而複製在一顯示器(例如顯示器720)上。舉例言之,於軟體應用程式716之控制之下,位在導航控制器750 上之導航特性件例如可對映至顯示在使用者介面722上的虛擬導航特性件。於實施例中,控制器750可以並不是一個分開組件,反而係整合入平台702、揚聲器子系統1260、麥克風7140、及/或顯示器720。但實施例絕非僅限於此處顯示的或描述的元件或情境。
於實施例中,驅動裝置(圖中未顯示)可包括技術使得使用者在初始啟動之後能夠類似電視機藉觸摸一鈕,或藉可聽聞的指令而即時開關平台702。程式邏輯許可平台702串流化內容至媒體配接器或其它內容服務裝置730或內容傳遞裝置740,即便當該平台被「關閉」時亦復如此。此外,晶片組705可包含例如支援5.1環繞音效音訊及/或高傳真7.1環繞音效音訊之硬體及/或軟體支援。驅動裝置可包括用於整合聲頻或圖形平台之聲頻或圖形驅動裝置。於實施例中,該聲頻或圖形驅動裝置可包含一週邊組件互連(PCI)快速圖形卡。
於各種實施例中,系統700中顯示之組件中之任一者或多者可經整合。舉例言之,平台702及內容服務裝置730可經整合,平台702及內容傳遞裝置740可經整合,或平台702、內容服務裝置730及內容傳遞裝置740可經整合。於各種實施例中,平台702及/或顯示器720可為一整合單元。例如,顯示器720及內容服務裝置730可經整合,或顯示器720及內容傳遞裝置740可經整合。此等實施例絕非限制本文揭示之範圍。
於各種實施例中,系統700可實施為無線系統、 有線系統、或兩者的組合。當實施為無線系統時,系統700可包括適用於透過無線分享媒體,諸如一或多個天線、發射器、接收器、收發器、放大器、濾波器、控制邏輯等通訊之組件及介面。無線分享媒體之一實施例可包括無線頻譜諸如RF頻譜等之一部分。當實施為有線系統時,系統700可包括適用於透過有線通訊媒體,諸如輸入/輸出(I/O)配接器、連結該I/O配接器與一相對應有線通訊媒體之實體連接器、網路介面卡(NIC)、碟片控制器、視訊控制器、音訊控制器等通訊之組件及介面。有線通訊媒體之實施例可包括導線、纜線、金屬引線、印刷電路板(PCB)、背板、開關組織結構、半導體材料、雙絞線、同軸纜線、光纖等。
平台702可建立一或多個邏輯或實體通道以通訊資訊。該資訊可包括媒體資訊及控制資訊。媒體資訊可指表示對一使用者有意義的內容之任何資料。內容之實施例可包括例如,得自語音對話之資料、視訊會議、串流化視訊及音訊、電子郵件(email)訊息、語音郵件訊息、文數符號、圖形、影像、視訊、文字等。得自語音對話之資料例如可為口語資訊、無聲週期、背景雜訊、舒適噪音、語調等。控制資訊可指表示對一自動化系統有意義的命令、指令或控制字眼之任何資料。舉例言之,控制資訊可用以經由一系統路徑安排媒體資訊,或指示一節點以一預定方式處理該媒體資訊。但實施例絕非限於圖8中顯示的或描述的元件或情境。
如前述,系統700可實施成各種實體樣式或形狀 因數。圖9例示其中可具體實施系統700的小形狀因數裝置800的一個實例。於實施例中,例如,裝置800可實施為具有無線能力之一行動計算裝置。一行動計算裝置可指具有處理系統及行動電源或電源供應器諸如一或多個電池之任何裝置。
如前文描述,一行動計算裝置之實施例可包括一個人電腦(PC)、膝上型電腦、超膝上型電腦、平板、觸控板、可攜式電腦、手持式電腦、掌上型電腦、個人數位助理器(PDA)、胞狀電話、胞狀電話/PDA之組合、電視、智慧型裝置(例如智慧型電話、智慧型平板或智慧型電視)、行動網際網路裝置(MID)、傳訊裝置、資料通訊裝置等。
一行動計算裝置之實施例也可包括配置以由個人穿戴的電腦,諸如手腕電腦、手指電腦、戒指電腦、眼鏡電腦、皮帶夾電腦、臂帶電腦、鞋電腦、衣著電腦、及其它可穿戴型電腦。於實施例中,例如行動計算裝置可實施為能夠執行電腦應用程式以及語音通訊及/或資料通訊的智慧型電話。雖然若干實施例係以實施為智慧型電話的行動計算裝置舉例描述,但須瞭解其它實施例也可使用其它有線或無線行動運算裝置實施。該等實施例並非限於此一脈絡。
如圖9顯示,裝置800可包括一殼體802、一顯示器804、一輸入/輸出(I/O)裝置806、及一天線808。裝置800也可包括導航特性件812。顯示器804可包含適用於行動計算裝置顯示資訊的任何適當顯示器單元。I/O裝置806可包 括將資訊載入一行動計算裝置的任何合宜I/O裝置。I/O裝置806之實施例可包括文數鍵盤、數字小鍵盤、觸控板、輸入鍵、按鈕、開關、翹板開關、軟體等。資訊也可藉麥克風載入裝置800。此種資訊可藉如此處描述之一語音辨識裝置數位化。該等實施例並非限於此一脈絡。
額外備註及實例:實例1可包括一種影像擷取裝置,其包含:一感測器模組用以擷取一候選者影像;一預處理器用以自該感測器模組獲得該候選者影像;及耦合該預處理器之一目標覆寫設備,該目標覆寫設備包括:一預測器用以判定該候選者影像對應於一參數預測模型中表示的一特定類型場景,及一參數控制器用以至少部分地基於與該特定類型場景相關聯的一或多個參數值調整該影像擷取裝置的一或多個即時參數。
實例2可包括實例1之影像擷取裝置,其中該預測器係用以計算來自於該參數預測模型中的一神經網路節點之該等一或多個參數值。
實例3可包括實例1之影像擷取裝置,其中該等一或多個即時參數係將包括一曝光控制亮度參數、一調性對映亮度參數、一對焦參數或一白平衡參數中之一或多者。
實例4可包括實例1之影像擷取裝置,其中該目標覆寫設備進一步包括一分段組件用以基於光度強度而將該候選者影像分段成多個區域。
實例5可包括實例1至4中之任一者之影像擷取裝 置,其中該目標覆寫設備進一步包括:一特徵計算器用以基於該候選者影像識別一組候選者特徵;及一特徵選擇器用以從該組候選者特徵中選定一組分析特徵,其中該等一或多個即時參數係用以基於該組分析特徵而進一步被調整。
實例6可包括實例5之影像擷取裝置,其中該預測器係用以基於該組分析特徵與該經選取的參數預測模型間之一對應程度而從多個參數預測模型中選擇該參數預測模型。
實例7可包括一種包含一組指令的至少一個電腦可讀取儲存媒體,其當由一影像擷取裝置執行時,使得該影像擷取裝置用以:獲得與該影像擷取裝置相關聯的一候選者影像;判定該候選者影像對應於一參數預測模型中表示的一特定類型場景;及至少部分地基於與該特定類型場景相關聯的一或多個參數值調整該影像擷取裝置的一或多個即時參數。
實例8可包括實例7之至少一個電腦可讀取儲存媒體,其中該等指令當被執行時使得該影像擷取裝置用以計算來自於該參數預測模型中的一神經網路節點之該等一或多個參數值。
實例9可包括實例7之至少一個電腦可讀取儲存媒體,其中該等一或多個即時參數係將包括一曝光控制亮度參數、一調性對映亮度參數、一對焦參數或一白平衡參數中之一或多者。
實例10可包括實例7之至少一個電腦可讀取儲存媒體,其中該等指令當被執行時使得該影像擷取裝置用以基於光度強度而將該候選者影像分段成多個區域。
實例11可包括實例7至10中之任一者之至少一個電腦可讀取儲存媒體,其中該等指令當被執行時使得該影像擷取裝置用以:基於該候選者影像識別一組候選者特徵;及從該組候選者特徵中選定一組分析特徵,其中該等一或多個即時參數係用以基於該組分析特徵而進一步被調整。
實例12可包括實例11之至少一個電腦可讀取儲存媒體,其中該等指令當被執行時使得該影像擷取裝置用以基於該組分析特徵與該經選取的參數預測模型間之一對應程度而從多個參數預測模型中選擇該參數預測模型。
實例13可包括一種操作一機器學習裝置之方法,其包含:獲得訓練影像資料;就一影像擷取裝置的一或多個即時參數進行該訓練影像資料之一離線預測分析;及基於該離線預測分析產生一或多個參數預測模型。
實例14可包括實例13之方法,其中各個參數預測模型包括具有參數值之多個神經網路節點。
實例15可包括實例13之方法,其中該離線預測分析係就一曝光控制亮度參數、一調性對映亮度參數、一對焦參數或一白平衡參數中之一或多者進行。
實例16可包括實例13之方法,其中該訓練影像資料包括特定類型場景之參考影像及與該影像擷取裝置相關聯的候選者影像。
實例17可包括實例13之方法,其進一步包括基於光度強度將訓練影像資料中之影像分段成多個區域;及以每個區域為基準從該訓練影像資料中擷取地面實況資料,其中該離線預測分析係至少部分地基於該地面實況資料進行。
實例18可包括實例13至17中之任一者之方法,其進一步包括基於該訓練影像資料識別一組候選者特徵;及從該組候選者特徵中選出一組分析特徵,其中該離線預測分析係至少部分地基於該組分析特徵而被進行。
實例19可包括一種包含一組指令的至少一個電腦可讀取儲存媒體,其當由一機器學習裝置執行時,使得該機器學習裝置用以:獲得訓練影像資料;就一影像擷取裝置的一或多個即時參數進行該訓練影像資料之一離線預測分析;及基於該離線預測分析產生一或多個參數預測模型。
實例20可包括實例19之至少一個電腦可讀取儲存媒體,其中各個參數預測模型係將包括具有參數值之多個神經網路節點。
實例21可包括實例19之至少一個電腦可讀取儲存媒體,其中該離線預測分析係就一曝光控制亮度參數、一調性對映亮度參數、一對焦參數或一白平衡參數中之一或多者進行。
實例22可包括實例19之至少一個電腦可讀取儲存媒體,其中該訓練影像資料係將包括特定類型場景之參 考影像及與該影像擷取裝置相關聯的候選者影像。
實例23可包括實例19之至少一個電腦可讀取儲存媒體,其中該等指令當被執行時使得該機器學習裝置用以:基於光度強度將訓練影像資料中之影像分段成多個區域;及以每個區域為基準從該訓練影像資料中擷取地面實況資料,其中該離線預測分析係用以至少部分地基於該地面實況資料進行。
實例24可包括實例19至23中之任一者之至少一個電腦可讀取儲存媒體,其中該等指令當被執行時使得該機器學習裝置用以:基於該訓練影像資料識別一組候選者特徵;及從該組候選者特徵中選出一組分析特徵,其中該離線預測分析係用以至少部分地基於該組分析特徵而被進行。
實例25可包括一種操作一影像擷取裝置之方法,其包含:獲得與該影像擷取裝置相關聯的一候選者影像;判定該候選者影像對應於一參數預測模型中表示的一特定類型場景;及至少部分地基於與該特定類型場景相關聯的一或多個參數值調整該影像擷取裝置的一或多個即時參數。
實例26可包括實例25之方法,其進一步包括計算來自於該參數預測模型中的一神經網路節點之該等一或多個參數值。
實例27可包括實例25之方法,其中調整該等一或多個即時參數包括調整一曝光控制亮度參數、一調性對映 亮度參數、一對焦參數或一白平衡參數中之一或多者。
實例28可包括實例25之方法,其進一步包括基於光度強度而將該候選者影像分段成多個區域。
實例29可包括實例25至28中之任一者之方法,其進一步包括基於該候選者影像識別一組候選者特徵;及從該組候選者特徵中選定一組分析特徵,其中該等一或多個即時參數係用以基於該組分析特徵而進一步被調整。
實例30可包括實例29之方法,其進一步包括基於該組分析特徵與該經選取的參數預測模型間之一對應程度而從多個參數預測模型中選擇該參數預測模型。
實例31可包括一種目標覆寫設備包含一預測器用以獲得與該影像擷取裝置相關聯的一候選者影像及判定該候選者影像對應於一參數預測模型中表示的一特定類型場景;及一參數控制器用以至少部分地基於與該特定類型場景相關聯的一或多個參數值調整該影像擷取裝置的一或多個即時參數。
實例32可包括實例31之目標覆寫設備,其中該預測器係用以計算來自於該參數預測模型中的一神經網路節點之該等一或多個參數值。
實例33可包括實例31之目標覆寫設備,其中該等一或多個即時參數係將包括一曝光控制亮度參數、一調性對映亮度參數、一對焦參數或一白平衡參數中之一或多者。
實例34可包括實例31之目標覆寫設備,其進一步 包括一分段組件用以基於光度強度而將該候選者影像分段成多個區域。
實例35可包括實例31至34中之任一者之目標覆寫設備,其進一步包括一特徵計算器用以基於該候選者影像識別一組候選者特徵;及一特徵選擇器用以從該組候選者特徵中選定一組分析特徵,其中該等一或多個即時參數係用以基於該組分析特徵而進一步被調整。
實例36可包括實例35之目標覆寫設備,其中該預測器係用以基於該組分析特徵與該經選取的參數預測模型間之一對應程度而從多個參數預測模型中選擇該參數預測模型。
實例37可包括一種機器學習裝置包含用於獲得訓練影像資料之構件;用於就一影像擷取裝置的一或多個即時參數進行該訓練影像資料之一離線預測分析之構件;及用於基於該離線預測分析產生一或多個參數預測模型之構件。
實例38可包括實例37之機器學習裝置,其中各個參數預測模型係用以包括具有參數值之多個神經網路節點。
實例39可包括實例37之機器學習裝置,其中該離線預測分析係將就一曝光控制亮度參數、一調性對映亮度參數、一對焦參數或一白平衡參數中之一或多者進行。
實例40可包括實例37之機器學習裝置,其中該訓練影像資料係將包括特定類型場景之參考影像及與該影像 擷取裝置相關聯的候選者影像。
實例41可包括實例37之機器學習裝置,其進一步包括用於基於光度強度將訓練影像資料中之影像分段成多個區域之構件;及用於以每個區域為基準從該訓練影像資料中擷取地面實況資料之構件,其中該離線預測分析係至少部分地基於該地面實況資料進行。
實例42可包括實例37至41中之任一者之機器學習裝置,其進一步包括用於基於該訓練影像資料識別一組候選者特徵之構件;及用於從該組候選者特徵中選出一組分析特徵之構件,其中該離線預測分析係至少部分地基於該組分析特徵而被進行。
實例43可包括一種影像擷取裝置包含用於獲得與該影像擷取裝置相關聯的一候選者影像之構件;用於判定該候選者影像對應於一參數預測模型中表示的一特定類型場景之構件;及用於至少部分地基於與該特定類型場景相關聯的一或多個參數值調整該影像擷取裝置的一或多個即時參數之構件。
實例44可包括實例43之影像擷取裝置,其進一步包括用於計算來自於該參數預測模型中的一神經網路節點之該等一或多個參數值之構件。
實例45可包括實例43之影像擷取裝置,其中該用於調整該等一或多個即時參數之構件包括用於調整一曝光控制亮度參數、一調性對映亮度參數、一對焦參數或一白平衡參數中之一或多者之構件。
實例46可包括實例43之影像擷取裝置,其進一步包括用於基於光度強度而將該候選者影像分段成多個區域之構件。
實例47可包括實例43至46中之任一者之影像擷取裝置,其進一步包括用於基於該候選者影像識別一組候選者特徵之構件;及用於從該組候選者特徵中選定一組分析特徵之構件,其中該等一或多個即時參數係用以基於該組分析特徵而進一步被調整。
實例48可包括實例47之影像擷取裝置,其進一步包括用於基於該組分析特徵與該經選取的參數預測模型間之一對應程度而從多個參數預測模型中選擇該參數預測模型之構件。
技術上可提供一種方式於運行時間區別衝突的特殊場景,及判定其中各者的優化目標參數值,而無需針對特殊場景檢測寫專用代碼。有關影像曝光調整的用戶偏好/行為也可經習得與模型化。該模型可即時施加至相機的影像處理軟體/驅動裝置。此種辦法帶來的時間與成本節省可能相當大。此外,分段技術使得可對影像中的焦點做調整(例如,若陰影或打亮欲聚焦,則該等區域可分開處理)。再者,拍照者可訓練他們的影像擷取裝置照他們本身獨特的(及主觀的)味口嗜好而處理影像。
各種實施例可使用硬體元件、軟體元件、或兩者的組合實施。硬體元件之實施例可包括處理器、微處理器、電路、電路元件(例如電晶體、電阻器、電容器、電感器等)、 積體電路、特定應用積體電路(ASIC)、可規劃邏輯裝置(PLD)、數位信號處理器(DSP)、可現場程式規劃閘陣列(FPGA)、邏輯閘、暫存器、半導體裝置、晶片、微晶片、晶片組等。軟體元件之實施例可包括軟體組件、程式、應用程式、電腦程式、應用程式、系統程式、機器程式、作業系統軟體、中介軟體、韌體、軟體模組、常式、次常式、函式、方法、程序、軟體介面、應用程式規劃介面(API)、指令集、計算代碼、電腦代碼、代碼節段、電腦代碼節段、字元、數值、符號、或其任何組合。決定一實施例是否使用硬體元件及/或軟體元件實施可根據多項因素而改變,諸如期望計算速率、功率位準、耐熱性、處理週期預算、輸入資料率、輸出資料率、記憶體資源、資料匯流排速度及其它設計或效能限制。
至少一個實施例的一或多個面向可由儲存於機器可讀取媒體上的代表性指令實施,其表示處理器內部的各種邏輯,其當由機器讀取時使得該機器製造邏輯用以從事此處描述之技術。此種表示型態稱作為「IP核心」可儲存於具體有形的機器可讀取媒體上及供給各種客戶或製造廠用以載入實際上製造該邏輯或處理器的製造機器。
實施例可施用於全部類型的半導體積體電路(IC)晶片。此等IC晶片之實例包括但非限於處理器、控制器、晶片組組件、可規劃邏輯陣列(PLA)、記憶體晶片、網路晶片等。此外,於部分圖式中,信號導體線路係以線路表示。有些可能不同以指示更多組成信號路徑,具有數字標示以 指示組成信號路徑的號碼,及/或在一端或多端有箭頭以指示主要資訊流方向。但此點不應以限制性方式解譯之。反而,此等額外細節可連結一或多個具體實施例用以方便更容易瞭解電路。任何表示的信號線路,無論是否有額外資訊,實際上皆可包含一或多個信號其可於多個方向行進且可使用任何合宜類型的信號方案實施,例如以差分對實施的數位或類比線路、光纖線路、及/或單端線路。
已經給定大小/模型/數值/範圍之實例,但實施例並非受限於此。因製造技術(例如微影術)隨時間之推移而成熟,預期可製造更小型裝置。此外,為求例示說明及討論上的簡明,眾所周知之至IC晶片及其它組件的電源/接地連結可顯示或可不顯示於圖式內,因而不會遮掩實施例之某些面向。又復,配置可以方塊圖形式顯示來避免遮蔽實施例,也有鑑於下述事實,有關此等方塊圖配置實施的特定細節係高度取決於欲實現實施例的平台,亦即此等特定細節係在熟諳技藝人士的知識範圍內。當陳述特定細節(例如電路)來描述具體實施例時,熟諳技藝人士顯然易知可實施實施例而無或有此等特定細節或其變化。如此描述可視為例示性而非限制性。
若干實施例例如可使用機器-或具體有形的電腦-可讀取媒體或物件實現,該等媒體或物件可儲存指令或指令集,其若由機器執行時可使得機器執行依據該等實施例之方法及/或操作。此種機器例如可包括任何適當處理平台、計算平台、計算裝置、處理裝置、計算系統、處理系統、 電腦、處理器等,且可使用硬體及/或軟體之任何適當組合而體現。機器可讀取媒體或物件例如可包括任何適當型別的記憶體單元、記憶體裝置、記憶體物件、記憶體媒體、儲存裝置、儲存物件、儲存媒體及/或儲存單元,例如,記憶體、可卸式或非可卸式媒體、可抹除或非可抹除媒體、可寫式或可覆寫式媒體、數位或類比媒體、硬碟、軟碟、光碟-唯讀記憶體(CD-ROM)、可錄式光碟(CD-R)、光碟可覆寫式(CD-RW)、光碟、磁性媒體、磁光媒體、活動式記憶卡或碟、各型數位影音碟(DVD)、卡帶、卡匣等。指令可包括使用任何適當的高階、低階、物件取向、視覺、編譯及/或解釋程式規劃語言體現之任何型別的碼,諸如原始碼、編譯碼、解釋碼、可執行碼、靜代碼、動態碼、加密碼等。
除非另行特別陳述否則須瞭解術語諸如「處理」、「運算」、「計算」、「判定」等係指電腦或計算系統或相似的電子計算裝置之動作及/或處理程序,將計算系統的暫存器及/或記憶體內部的表示為物理量(例如電子)資料操控及/或變換為其它資料,該等資料係類似地在計算系統的記憶體、暫存器或其它資訊儲存裝置、傳輸裝置或顯示裝置內部表示為物理量。實施例並非限於此一脈絡。
「耦合」一詞於此處可用來直接或間接地指示關注組件間之任何類型關係,可應用於電氣、機械、流體、光學、電磁學、電機、或其它連結。此外,如此處使用的「第一」、「第二」等詞只用來協助討論,除非另行指示不 具任何特定時間或時序意義。
由前文說明熟諳技藝人士將瞭解實施例之寬廣技術可以多種形式實現。因此,雖然已經就特定實例描述實施例,但實施例之真正範圍並非受此所限,原因在於當研讀附圖、說明書、及如下申請專利範圍時其它修改將為熟諳技藝人士所顯然易知。

Claims (24)

  1. 一種影像擷取裝置,其包含:一感測器模組,用以擷取包括一預設影像特性位準之一候選者影像;以及一目標覆寫設備,其包括:一預測器,用以判定該候選者影像包括類似於在一基於訓練影像資料之參數預測模型中表示的一特定類型場景之一場景,其中該訓練影像資料係基於一參考影像,該參考影像包括該特定類型場景之一影像特性目標位準;以及一參數控制器,用以基於該候選者影像包括類似於該特定類型場景之一場景的該判定及與該特定類型場景之該影像特性目標位準相關聯的一或多個參數值,來調整該影像擷取裝置的一或多個即時參數而產生對應於包括該影像特性目標位準之該候選者影像的一優化影像。
  2. 如請求項1之影像擷取裝置,其中該預測器係用以計算來自該參數預測模型中的一或多個神經網路節點之該等一或多個參數值。
  3. 如請求項1之影像擷取裝置,其中該等一或多個即時參數要包括一曝光控制亮度參數、一調性對映亮度參數、一對焦參數或一白平衡參數中之一或多者。
  4. 如請求項1之影像擷取裝置,其中該目標覆寫設備進一 步包括一分段組件,用以基於光度強度而將該候選者影像分段成多個區域。
  5. 如請求項1之影像擷取裝置,其中該目標覆寫設備進一步包括:一特徵計算器,用以基於該候選者影像來識別一組候選者特徵;及一特徵選擇器,用以從該組候選者特徵中選定一組分析特徵,其中該等一或多個即時參數係基於該組分析特徵而進一步被調整。
  6. 如請求項5之影像擷取裝置,其中該預測器係用以從多個參數預測模型中選擇該參數預測模型,該選擇係基於在該組分析特徵與該被選取的參數預測模型之間的一對應程度。
  7. 一種包含一組指令之至少一個電腦可讀取儲存媒體,當該等指令由一影像擷取裝置執行時,使得該影像擷取裝置用以:獲得與該影像擷取裝置相關聯的包括一預設影像特性位準之一候選者影像;判定該候選者影像包括類似於在一基於訓練影像資料之參數預測模型中表示的一特定類型場景之一場景,其中該訓練影像資料係基於一參考影像,該參考影像包括該特定類型場景之一影像特性目標位準;以及基於該候選者影像包括類似於該特定類型場景之一場景的該判定及與該特定類型場景之該影像特性目 標位準相關聯的一或多個參數值,來調整該影像擷取裝置的一或多個即時參數而產生對應於包括該影像特性目標位準之該候選者影像的一優化影像。
  8. 如請求項7之至少一個電腦可讀取儲存媒體,其中當該等指令被執行時,使得該影像擷取裝置用以計算來自該參數預測模型中的一或多個神經網路節點之該等一或多個參數值。
  9. 如請求項7之至少一個電腦可讀取儲存媒體,其中該等一或多個即時參數要包括一曝光控制亮度參數、一調性對映亮度參數、一對焦參數或一白平衡參數中之一或多者。
  10. 如請求項7之至少一個電腦可讀取儲存媒體,其中當該等指令當被執行時,使得該影像擷取裝置用以基於光度強度而將該候選者影像分段成多個區域。
  11. 如請求項7之至少一個電腦可讀取儲存媒體,其中當該等指令被執行時,使得該影像擷取裝置用以:基於該候選者影像來識別一組候選者特徵;及從該組候選者特徵中選定一組分析特徵,其中該等一或多個即時參數係基於該組分析特徵而進一步被調整。
  12. 如請求項11之至少一個電腦可讀取儲存媒體,其中當該等指令被執行時,使得該影像擷取裝置用以從多個參數預測模型中選擇該參數預測模型,該選擇係基於在該組分析特徵與該被選取的參數預測模型之間的一對應程 度。
  13. 一種操作一機器學習裝置之方法,其包含:獲得訓練影像資料,其中該訓練影像資料係基於一參考影像,該參考影像包括要在一參數預測模型中表示的一特定類型場景之一影像特性目標位準;就一影像擷取裝置的一或多個即時參數進行該訓練影像資料之一離線預測分析;以及基於該離線預測分析而產生一或多個參數預測模型,其中包括一預設影像特性位準之一候選者影像包括類似於基於訓練影像資料的該特定類型場景之一判定要被做出,且其中對於該影像擷取裝置的該等一或多個即時參數之一調整要被做出,其係基於該候選者影像包括類似於該特定類型場景之該場景的該判定及與該特定類型場景之該影像特性目標位準相關聯的一或多個參數值,而產生對應於包括該影像特性目標位準之該候選者影像的一優化影像。
  14. 如請求項13之方法,其中每一參數預測模型包括具有參數值之多個神經網路節點。
  15. 如請求項13之方法,其中該離線預測分析係就一曝光控制亮度參數、一調性對映亮度參數、一對焦參數或一白平衡參數中之一或多者而進行。
  16. 如請求項13之方法,其中該訓練影像資料包括特定類型場景之參考影像、以及與該影像擷取裝置相關聯的候選者影像。
  17. 如請求項13之方法,其進一步包括:基於光度強度將該訓練影像資料中之影像分段成多個區域;及以每個區域為基準從該訓練影像資料中擷取地面實況資料,其中該離線預測分析係至少部分地基於該地面實況資料而被進行。
  18. 如請求項13之方法,其進一步包括:基於該訓練影像資料而識別一組候選者特徵;及從該組候選者特徵中選出一組分析特徵,其中該離線預測分析係至少部分地基於該組分析特徵而被進行。
  19. 一種包含一組指令之至少一個電腦可讀取儲存媒體,其當該等指令由一機器學習裝置執行時,使得該機器學習裝置用以:獲得訓練影像資料,其中該訓練影像資料係基於一參考影像,該參考影像包括要在一參數預測模型中表示的一特定類型場景之一影像特性目標位準;就一影像擷取裝置的一或多個即時參數,進行該訓練影像資料之一離線預測分析;以及基於該離線預測分析而產生一或多個參數預測模型,其中包括一預設影像特性位準之一候選者影像包括類似於基於訓練影像資料的該特定類型場景之一判定要被做出,且其中對於該影像擷取裝置的該等一或多個即時參數之一調整要被做出,其係基於該候選者影像包 括類似於該特定類型場景之該場景的該判定及與該特定類型場景之該影像特性目標位準相關聯的一或多個參數值,而產生對應於包括該影像特性目標位準之該候選者影像的一優化影像。
  20. 如請求項19之至少一個電腦可讀取儲存媒體,其中各個參數預測模型要包括具有參數值之多個神經網路節點。
  21. 如請求項19之至少一個電腦可讀取儲存媒體,其中該離線預測分析係就一曝光控制亮度參數、一調性對映亮度參數、一對焦參數或一白平衡參數中之一或多者進行。
  22. 如請求項19之至少一個電腦可讀取儲存媒體,其中該訓練影像資料要包括特定類型場景之參考影像、以及與該影像擷取裝置相關聯的候選者影像。
  23. 如請求項19之至少一個電腦可讀取儲存媒體,其中當該等指令被執行時,使得該機器學習裝置用以:基於光度強度將該訓練影像資料中之影像分段成多個區域;及以每個區域為基準從該訓練影像資料中擷取地面實況資料,其中該離線預測分析係用以至少部分地基於該地面實況資料而被進行。
  24. 如請求項19之至少一個電腦可讀取儲存媒體,其中當該等指令被執行時,使得該機器學習裝置用以:基於該訓練影像資料而識別一組候選者特徵;及從該組候選者特徵中選出一組分析特徵,其中該離 線預測分析係至少部分地基於該組分析特徵而被進行。
TW105103784A 2015-03-27 2016-02-04 即時影像擷取參數的機器學習之技術 TWI620441B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/670,642 US9826149B2 (en) 2015-03-27 2015-03-27 Machine learning of real-time image capture parameters
US14/670,642 2015-03-27

Publications (2)

Publication Number Publication Date
TW201707436A TW201707436A (zh) 2017-02-16
TWI620441B true TWI620441B (zh) 2018-04-01

Family

ID=56975741

Family Applications (1)

Application Number Title Priority Date Filing Date
TW105103784A TWI620441B (zh) 2015-03-27 2016-02-04 即時影像擷取參數的機器學習之技術

Country Status (5)

Country Link
US (1) US9826149B2 (zh)
EP (1) EP3275175A4 (zh)
CN (1) CN107810505B (zh)
TW (1) TWI620441B (zh)
WO (1) WO2016160221A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI749356B (zh) * 2018-08-13 2021-12-11 大陸商深圳市商湯科技有限公司 一種圖像風格轉換方法及設備、儲存介質
TWI767763B (zh) * 2019-03-15 2022-06-11 日商索尼半導體解決方案公司 資料管線裝置
TWI812291B (zh) * 2022-06-17 2023-08-11 緯創資通股份有限公司 連續學習的機器學習方法及電子裝置

Families Citing this family (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10290028B2 (en) * 2014-10-08 2019-05-14 Streamoid Technologies Private Limited Computer implemented system for managing advertisements and a method thereof
US10091414B2 (en) * 2016-06-24 2018-10-02 International Business Machines Corporation Methods and systems to obtain desired self-pictures with an image capture device
KR102407815B1 (ko) * 2016-12-22 2022-06-13 삼성전자주식회사 영상 처리 장치 및 방법
EP3340609B1 (en) * 2016-12-22 2024-03-27 Samsung Electronics Co., Ltd. Apparatus and method for processing image
US20180189609A1 (en) * 2017-01-04 2018-07-05 Qualcomm Incorporated Training data for machine-based object recognition
US10530991B2 (en) * 2017-01-28 2020-01-07 Microsoft Technology Licensing, Llc Real-time semantic-aware camera exposure control
KR20180092778A (ko) 2017-02-10 2018-08-20 한국전자통신연구원 실감정보 제공 장치, 영상분석 서버 및 실감정보 제공 방법
US20210264528A1 (en) * 2017-02-24 2021-08-26 State Farm Mutual Automobile Insurance Company Technology for analyzing image data to automatically manage customer policies
US10607329B2 (en) * 2017-03-13 2020-03-31 Adobe Inc. Illumination estimation from a single image
US11276163B2 (en) * 2017-05-02 2022-03-15 Alvitae LLC System and method for facilitating autonomous control of an imaging system
US11273553B2 (en) 2017-06-05 2022-03-15 Autodesk, Inc. Adapting simulation data to real-world conditions encountered by physical processes
EP3649774A1 (en) 2017-07-03 2020-05-13 C/o Canon Kabushiki Kaisha Method and system for auto-setting cameras
US11676547B2 (en) 2017-07-07 2023-06-13 Semiconductor Energy Laboratory Co., Ltd. Display system and operation method of the display system
US10643320B2 (en) 2017-11-15 2020-05-05 Toyota Research Institute, Inc. Adversarial learning of photorealistic post-processing of simulation with privileged information
US10535138B2 (en) * 2017-11-21 2020-01-14 Zoox, Inc. Sensor data segmentation
US11134221B1 (en) 2017-11-21 2021-09-28 Daniel Brown Automated system and method for detecting, identifying and tracking wildlife
KR102438201B1 (ko) 2017-12-01 2022-08-30 삼성전자주식회사 사진 촬영과 관련된 추천 정보를 제공하는 방법 및 시스템
CN107820020A (zh) * 2017-12-06 2018-03-20 广东欧珀移动通信有限公司 拍摄参数的调整方法、装置、存储介质及移动终端
US20210166360A1 (en) * 2017-12-06 2021-06-03 Korea Advanced Institute Of Science And Technology Method and apparatus for inverse tone mapping
US10579908B2 (en) * 2017-12-15 2020-03-03 Google Llc Machine-learning based technique for fast image enhancement
CN109951627B (zh) * 2017-12-20 2021-09-10 Oppo广东移动通信有限公司 图像处理方法、装置、存储介质及电子设备
CN109960034B (zh) * 2017-12-25 2023-08-04 深圳点石创新科技有限公司 一种抬头显示器亮度调节***与方法
JP2019146022A (ja) * 2018-02-21 2019-08-29 オリンパス株式会社 撮像装置及び撮像方法
US10938649B2 (en) * 2018-03-19 2021-03-02 Arlo Technologies, Inc. Adjusting parameters in a network-connected security system based on content analysis
CN111867447B (zh) * 2018-03-26 2023-12-05 三星电子株式会社 用于监测用户眼部健康的电子设备及其操作方法
US11321618B2 (en) * 2018-04-25 2022-05-03 Om Digital Solutions Corporation Learning device, image pickup apparatus, image processing device, learning method, non-transient computer-readable recording medium for recording learning program, display control method and inference model manufacturing method
CN110149517B (zh) * 2018-05-14 2022-08-23 腾讯科技(深圳)有限公司 视频处理的方法、装置、电子设备及计算机存储介质
US10628929B2 (en) * 2018-05-28 2020-04-21 Augentix Inc. Method and computer system of image enhancement
CN108769543B (zh) * 2018-06-01 2020-12-18 北京壹卡行科技有限公司 曝光时间的确定方法及装置
JP2019215489A (ja) * 2018-06-14 2019-12-19 オリンパス株式会社 撮像装置および焦点調節方法
CN110708469B (zh) * 2018-07-10 2021-03-19 北京地平线机器人技术研发有限公司 用于适配曝光参数的方法和装置以及相应的相机曝光***
KR20200007676A (ko) 2018-07-13 2020-01-22 삼성전자주식회사 광원의 밝기를 제어하는 전자 장치 및 그 동작 방법
KR102661983B1 (ko) * 2018-08-08 2024-05-02 삼성전자주식회사 이미지의 인식된 장면에 기반하여 이미지를 처리하는 방법 및 이를 위한 전자 장치
US11093743B2 (en) 2018-08-10 2021-08-17 International Business Machines Corporation Intelligent personalization of operations of an image capturing device
US11394863B2 (en) * 2018-09-06 2022-07-19 Arlo Technologies, Inc. No-reference image quality assessment for iterative batch video analysis
CN113039556B (zh) 2018-10-11 2022-10-21 特斯拉公司 用于使用增广数据训练机器模型的***和方法
CN111178118B (zh) * 2018-11-13 2023-07-21 浙江宇视科技有限公司 图像采集处理方法、装置及计算机可读存储介质
CN111260678A (zh) * 2018-11-30 2020-06-09 百度在线网络技术(北京)有限公司 体操辅助学习的方法、装置、存储介质和终端设备
CN109362092B (zh) * 2018-12-07 2021-12-03 ***通信集团福建有限公司 网络参数调整方法、装置、设备及介质
US20210158097A1 (en) * 2018-12-12 2021-05-27 Compology, Inc. Method and system for fill level determination
WO2020123163A1 (en) * 2018-12-14 2020-06-18 Apple Inc. Machine learning assisted image prediction
EP3672228A1 (en) * 2018-12-20 2020-06-24 Axis AB Method and system for adjusting an image pipeline setting
DE112019006666T5 (de) * 2019-01-15 2021-11-04 Google Llc Bestimmung von Bereichen von Interesse für fotografische Funktionen
CN109801209B (zh) * 2019-01-29 2023-12-05 爱芯元智半导体(宁波)有限公司 参数预测方法、人工智能芯片、设备及***
CN113614498A (zh) * 2019-02-06 2021-11-05 日本电气株式会社 过滤器学习设备、过滤器学习方法和非暂时性计算机可读介质
WO2020176439A1 (en) 2019-02-25 2020-09-03 Walmart Apollo, Llc Systems and methods of product recognition through multi-model image processing
KR20200134374A (ko) * 2019-05-21 2020-12-02 삼성전자주식회사 이미지 신호 프로세서의 모델링 방법, 및 전자 기기
US11044450B2 (en) * 2019-06-07 2021-06-22 Adobe Inc. Image white balancing
US11165954B1 (en) * 2019-06-19 2021-11-02 Objectvideo Labs, Llc Scene-aware custom tuned video surveillance detection system
TWI773907B (zh) * 2019-07-11 2022-08-11 緯創資通股份有限公司 資料擷取裝置與資料運算系統及方法
EP3772720B1 (en) * 2019-08-08 2021-09-29 Siemens Healthcare GmbH Method and system for image analysis
US11436470B2 (en) * 2019-09-13 2022-09-06 Kyndryl, Inc. Generating simulated image training data
JP7317647B2 (ja) * 2019-09-19 2023-07-31 株式会社Screenホールディングス 学習装置、検査装置、学習方法および検査方法
CN110740264B (zh) * 2019-10-31 2021-06-04 重庆工商职业学院 一种智能摄像数据快速采集***及采集方法
US11849264B2 (en) 2019-11-22 2023-12-19 Samsung Electronics Co., Ltd. Apparatus and method for white balance editing
WO2021126004A1 (ru) * 2019-12-20 2021-06-24 Общество С Ограниченной Ответственностью "Дина" Способ фото/видео съемки цифровым устройством профессионально скомпанованных кадров
CN111131889B (zh) * 2019-12-31 2022-11-25 深圳创维-Rgb电子有限公司 场景自适应调整图像及声音的方法、***及可读存储介质
CN111246091B (zh) * 2020-01-16 2021-09-03 北京迈格威科技有限公司 一种动态自动曝光控制方法和装置及电子设备
EP4055807A4 (en) * 2020-01-31 2023-01-11 Samsung Electronics Co., Ltd. ELECTRONIC DEVICE WITH CAMERA AND METHODS OF OPERATING THEREOF
KR20210098292A (ko) 2020-01-31 2021-08-10 삼성전자주식회사 카메라를 포함하는 전자 장치 및 그 동작 방법
US12003746B2 (en) 2020-02-19 2024-06-04 Dolby Laboratories Licensing Corporation Joint forward and backward neural network optimization in image processing
US11356600B2 (en) * 2020-03-16 2022-06-07 Microsoft Technology Licensing, Llc Machine learning operations on different location targets using camera orientation
CN111445383B (zh) * 2020-03-20 2024-02-13 北京迈格威科技有限公司 影像参数的调节方法、装置及***
EP3886428A1 (en) * 2020-03-24 2021-09-29 Canon Kabushiki Kaisha System and edge device
WO2021102483A2 (en) * 2020-04-15 2021-05-27 Zeku, Inc. Method and apparatus for operating a companion processing unit
CN111614897B (zh) * 2020-05-13 2021-08-10 南京邮电大学 一种基于用户偏好多维度驱动的智能拍照方法
CN111787222A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 用于调节相机的方法、装置、电子设备与存储介质
WO2022060348A1 (en) * 2020-09-15 2022-03-24 Hewlett-Packard Development Company, L.P. Glare reduction in images
EP3979618A1 (en) * 2020-10-01 2022-04-06 Axis AB A method of configuring a camera
US11877052B2 (en) * 2020-12-08 2024-01-16 Cortica Ltd. Filming an event by an autonomous robotic system
CN112767230A (zh) * 2021-02-26 2021-05-07 清华大学 Gpu图神经网络优化方法及装置
CN113079319B (zh) * 2021-04-07 2022-10-14 杭州涂鸦信息技术有限公司 一种图像调整方法及其相关设备
CN113507570B (zh) * 2021-07-26 2023-05-26 维沃移动通信有限公司 曝光补偿方法、装置和电子设备
CN113591678B (zh) * 2021-07-28 2023-06-23 北京百度网讯科技有限公司 课堂注意力确定方法、装置、设备、存储介质及程序产品
US11509836B1 (en) 2021-12-29 2022-11-22 Insight Direct Usa, Inc. Dynamically configured processing of a region of interest dependent upon published video data selected by a runtime configuration file
US11704891B1 (en) 2021-12-29 2023-07-18 Insight Direct Usa, Inc. Dynamically configured extraction, preprocessing, and publishing of a region of interest that is a subset of streaming video data
US11778167B1 (en) 2022-07-26 2023-10-03 Insight Direct Usa, Inc. Method and system for preprocessing optimization of streaming video data
WO2024082183A1 (zh) * 2022-10-19 2024-04-25 华为技术有限公司 参数调节方法、装置以及智能终端

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6301440B1 (en) * 2000-04-13 2001-10-09 International Business Machines Corp. System and method for automatically setting image acquisition controls
US20090179998A1 (en) * 2003-06-26 2009-07-16 Fotonation Vision Limited Modification of Post-Viewing Parameters for Digital Images Using Image Region or Feature Information
TW201225004A (en) * 2010-12-09 2012-06-16 Ind Tech Res Inst Image based detecting system and method for traffic parameters and computer program product thereof
TW201308251A (zh) * 2011-08-04 2013-02-16 Yi-Wu Chiang 水下影像強化系統

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7184080B2 (en) * 2001-06-25 2007-02-27 Texas Instruments Incorporated Automatic white balancing via illuminant scoring
US7313268B2 (en) * 2002-10-31 2007-12-25 Eastman Kodak Company Method for using effective spatio-temporal image recomposition to improve scene classification
US7663689B2 (en) * 2004-01-16 2010-02-16 Sony Computer Entertainment Inc. Method and apparatus for optimizing capture device settings through depth information
EP1748378B1 (en) 2005-07-26 2009-09-16 Canon Kabushiki Kaisha Image capturing apparatus and image capturing method
CN100435556C (zh) * 2005-10-31 2008-11-19 台湾新力国际股份有限公司 照相机***
CN101478639B (zh) * 2008-01-04 2011-07-20 华晶科技股份有限公司 场景模式自动选择方法
CN101500082B (zh) * 2008-01-29 2011-08-24 鸿富锦精密工业(深圳)有限公司 相机及其个人化方法
US8194992B2 (en) * 2008-07-18 2012-06-05 Xerox Corporation System and method for automatic enhancement of seascape images
JP2012182572A (ja) 2011-02-28 2012-09-20 Sanyo Electric Co Ltd 電子カメラ
JP2013098879A (ja) * 2011-11-04 2013-05-20 Sony Corp 撮像制御装置、撮像装置、および、撮像制御装置の制御方法
US20140037135A1 (en) 2012-07-31 2014-02-06 Omek Interactive, Ltd. Context-driven adjustment of camera parameters
KR101949218B1 (ko) 2012-09-25 2019-02-18 삼성전자 주식회사 휴대 단말기의 이미지 촬영 방법 및 장치
CN103929631B (zh) * 2013-01-15 2016-12-28 瑞昱半导体股份有限公司 使用场景检测的白平衡调整方法及其装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6301440B1 (en) * 2000-04-13 2001-10-09 International Business Machines Corp. System and method for automatically setting image acquisition controls
US20090179998A1 (en) * 2003-06-26 2009-07-16 Fotonation Vision Limited Modification of Post-Viewing Parameters for Digital Images Using Image Region or Feature Information
TW201225004A (en) * 2010-12-09 2012-06-16 Ind Tech Res Inst Image based detecting system and method for traffic parameters and computer program product thereof
TW201308251A (zh) * 2011-08-04 2013-02-16 Yi-Wu Chiang 水下影像強化系統

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI749356B (zh) * 2018-08-13 2021-12-11 大陸商深圳市商湯科技有限公司 一種圖像風格轉換方法及設備、儲存介質
US11200638B2 (en) 2018-08-13 2021-12-14 Shenzhen Sensetime Technology Co., Ltd. Image style transform methods and apparatuses, devices and storage media
TWI767763B (zh) * 2019-03-15 2022-06-11 日商索尼半導體解決方案公司 資料管線裝置
TWI812291B (zh) * 2022-06-17 2023-08-11 緯創資通股份有限公司 連續學習的機器學習方法及電子裝置

Also Published As

Publication number Publication date
WO2016160221A1 (en) 2016-10-06
TW201707436A (zh) 2017-02-16
EP3275175A4 (en) 2018-11-21
US20160284095A1 (en) 2016-09-29
CN107810505A (zh) 2018-03-16
CN107810505B (zh) 2022-01-04
US9826149B2 (en) 2017-11-21
EP3275175A1 (en) 2018-01-31

Similar Documents

Publication Publication Date Title
TWI620441B (zh) 即時影像擷取參數的機器學習之技術
US9706111B2 (en) No-reference image and video quality evaluation
CN109916906B (zh) 缺陷检测装置及方法
CN106797451B (zh) 具有模型验证和管理的视觉对象跟踪***
TWI618409B (zh) 視頻中之局部變化偵測技術
US10430694B2 (en) Fast and accurate skin detection using online discriminative modeling
CN104488258B (zh) 用于双相机快门的方法和设备
US9070044B2 (en) Image adjustment
US9760794B2 (en) Method and system of low-complexity histrogram of gradients generation for image processing
US9940550B2 (en) Model compression in binary coded image based object detection
TWI617996B (zh) 使用方向性濾波之物件檢測技術
US11721024B2 (en) Real-time mask quality predictor
US10810462B2 (en) Object detection with adaptive channel features
US9148582B2 (en) Method and system for perfect shot imaging from multiple images
CN112541868B (zh) 图像处理方法、装置、计算机设备和存储介质
CN104052942B (zh) 改进的图像传感器像素校正技术
CN112711971A (zh) 终端消息处理方法及其图像识别方法、装置、介质和***
CN109040729B (zh) 图像白平衡校正方法、装置、存储介质及终端
CN112243118B (zh) 白平衡校正方法、装置、设备及存储介质
CN116862801A (zh) 图像处理方法、装置、电子设备及存储介质
CN115908862A (zh) 一种图像色彩处理方法、装置、电子设备和存储介质