ITTO20100042A1

ITTO20100042A1 - Metodo per il trasporto di dati informativi e/o applicativi allâ¬"interno di un flusso video digitale e relativi dispositivi per la generazione e la fruizione di tale flusso video

Info

Publication number: ITTO20100042A1
Application number: IT000042A
Authority: IT
Inventors: Giovanni Ballocca; Saverio Celia; Amato Paolo D
Original assignee: Sisvel Technology Srl
Priority date: 2010-01-22
Filing date: 2010-01-22
Publication date: 2011-07-23
Also published as: JP2013518458A; CN102934452A; KR20120127605A; US20120307882A1; EP2526689B1; EP2526689A1; ES2556364T3; IT1397789B1; WO2011089556A1

Description

â€œMetodo per il trasporto di dati informativi e/o applicativi allâ€™interno di un flusso video digitale e relativi dispositivi per la generazione e la fruizione di tale flusso videoâ€

DESCRIZIONE

- CAMPO DELLA TECNICA -La presente invenzione si riferisce in generale alla produzione e visualizzazione di contenuti video digitali.

In particolare, lâ€™invenzione si riferisce allâ€™utilizzo delle tecniche di codifica e decodifica video per il trasporto di dati informativi e/o applicativi allâ€™interno di contenuti video digitali e ai relativi dispositivi per la generazione e la fruizione di tali contenuti.

Lâ€™invenzione trova applicazione preferita e vantaggiosa nella codifica e decodifica di flussi video stereoscopici digitali, e si applica quindi ai relativi dispositivi per la generazione e la fruizione di tali flussi video stereoscopici.

- ARTE NOTA -Come noto, la distribuzione di contenuti video in formato digitale richiede lâ€™adozione di tecniche di codifica (compressione) atte a ridurre il bitrate necessario alla relativa trasmissione o memorizzazione su supporti di massa. Allâ€™atto della fruizione di tali contenuti, il fruitore utilizzerÃ un opportuno dispositivo di decodifica che applicherÃ tecniche di decompressione che consistono, usualmente, in operazioni inverse a quelle effettuate dal codificatore.

Tali contenuti video possono avere formato diverso. Per esempio, i materiali di archivio sono caratterizzati dallo storico formato 4:3, contenuti piÃ¹ recenti possono assumere il formato 16:9, mentre contenuti che provengono da produzioni cinematografiche possono assumere formati ancora piÃ¹ allungati. Questi contenuti potranno essere fruiti su dispositivi di visualizzazione caratterizzati da differenti formati degli schermi.

Di conseguenza, la distribuzione di questi contenuti su una specifica rete di trasporto o supporto di massa comporta lâ€™adozione di tecniche di adattamento e ottimizzazione della loro visualizzazione, in funzione anche delle preferenze dello spettatore.

Ad esempio, i contenuti in formato 4:3 possono essere adattati alla fruizione su dispositivi di visualizzazione 16:9 inserendo due bande nere verticali se lo spettatore preferisce visualizzare lâ€™immagine senza introdurre deformazioni.

AffinchÃ© il dispositivo di visualizzazione sia in grado di applicare tali tecniche di adattamento e ottimizzazione correttamente, Ã ̈ necessario che possa disporre delle informazioni che descrivono il formato dellâ€™immagine ricevuta.

Tale esigenza non si presenta solo nel mondo dei contenuti bidimensionali (2D) ma diviene ancora piÃ¹ pressante nel campo dei contenuti stereoscopici (3D).

Ad esempio, i flussi video stereoscopici possono contenere delle immagini composite al cui interno sono appositamente disposte unâ€™immagine destra ed una sinistra destinate rispettivamente allâ€™occhio destro e sinistro dellâ€™utente che osserva il video. Nel formato â€œside-by-sideâ€ , le due immagini destra e sinistra sono sottocampionate orizzontalmente e sono disposte in modo tale da occupare la metÃ sinistra e la metÃ destra dellâ€™immagine composita. Nel formato â€œtop-bottomâ€ le immagini destra e sinistra sono sottocampionate verticalmente e disposte nelle metÃ superiore ed inferiore dellâ€™immagine composita.

I dipositivi di visualizzazione, a loro volta, utilizzano tecniche differenti per la visualizzazione dellâ€™immagine stereoscopica. Per effettuare correttamente tale visualizzazione secondo la tecnica da essi utilizzata, Ã ̈ opportuno segnalare il formato dellâ€™immagine composita allâ€™interno del flusso video da visualizzare. Per ricostruire le immagini destra e sinistra, il decodificatore deve, infatti, sapere come queste sono disposte allâ€™interno dellâ€™immagine composita, altrimenti non puÃ² ricostruirle e permettere la visualizzazione corretta dei contenuti 3D.

Al giorno dâ€™oggi sono noti molti metodi per lâ€™inserimento di dati informativi e/o applicativi allâ€™interno di flussi video. Nella televisione analogica, ad esempio, dati di questo tipo venivano inseriti allâ€™interno dei ritorni di riga verticali (Vertical Blanking Interval). Col passaggio alla televisione digitale, questi ritorni di riga sono stati eliminati ed il trasporto di dati viene affidato ad apposite sezioni del flusso video separate dalla parte video. Ad esempio, Ã ̈ noto lâ€™uso di opportune tabelle di segnalazione allâ€™interno del transport stream MPEG2, che contengono informazioni relative al formato delle immagini 2D.

Inoltre, Ã ̈ noto lâ€™uso di header per il trasporto di dati di segnalazione allâ€™interno del flusso video digitale codificato.

Tali dati informativi e/o applicativi sono presenti e fruibili solo nel tratto della catena di distribuzione compreso tra il codificatore e il decodificatore. A livello di produzione, i contenuti video, infatti, non vengono compressi (o al limite vengono compressi con bassi livelli di compressione) per permettere lâ€™elaborazione degli stessi o la successiva riproduzione degli stessi senza perdita di qualitÃ , anche nel caso di frequenza ridotta (ralenty).

- OBIETTIVI E BREVE RIASSUNTO DELLâ€™INVENZIONE -Scopo della presente invenzione Ã ̈ fornire un metodo ed un sistema alternativi per il trasporto di dati informativi e/o applicativi allâ€™interno di un contenuto video digitale. In particolare Ã ̈ scopo della presente invenzione quello di presentare un metodo per il trasporto dei dati che possa essere applicato indifferentemente ai contenuti video 2D e 3D.

Altro scopo della presente invenzione Ã ̈ indicare un metodo e sistema per il trasporto di dati informativi e/o applicativi che permetta lâ€™utilizzo di tali dati anche in fase di produzione di contenuti video digitali.

Questi ed altri scopi della presente invenzione sono raggiunti mediante un metodo ed un sistema per il trasporto di dati informativi e/o applicativi allâ€™interno del flusso video (e dispositivi che implementano i suddetti metodi) incorporanti le caratteristiche delle rivendicazioni allegate, le quali formano parte integrante della presente descrizione.

In particolare, unâ€™idea alla base della presente invenzione Ã ̈ di inserire dei dati, in particolare unâ€™informazione relativa alle caratteristiche del flusso video stereoscopico digitale, come ad es. il suo formato, in alcune zone dei fotogrammi che formano il flusso video. In particolare, dati informativi e/o applicativi vengono inseriti in linee del fotogramma che non contengono informazione visiva utile, ossia informazione che fa parte dellâ€™immagine da visualizzare. In questo modo i dati informativi e/o applicativi viaggiano insieme allâ€™immagine (anchâ€™essa inserita nel fotogramma) e resistono cosÃ¬ ad eventuali cambiamenti del sistema di trasmissione che possono provocare la perdita dei metadati associati al video.

Dato che i dati informativi e/o applicativi non sono miscelati ai pixel dellâ€™immagine da visualizzare, i dati informativi e/o applicativi non risultano visibili e non infastidiscono la visione dello spettatore.

Vantaggiosamente, i dati informativi e/o applicativi vengono inseriti nelle prime o nelle ultime linee del fotogramma, cosÃ¬ da permettere una separazione semplice dellâ€™informazione visiva (ad es. immagine composita) da quella non visiva (i dati informativi e/o applicativi).

La scelta di inserire i dati informativi e/o applicativi allâ€™interno delle prime o ultime otto linee risulta poi particolarmente adatta nel caso di compressione H.264 di contenuti ad alta definizione (2D o 3D). Tale codifica H.264 viene descritta nel documento ITU-T â€œH.264 Advanced video coding for generic audiovisual servicesâ€ .

Il formato di codifica H.264 prevede che ogni immagine che compone il flusso video venga scomposta in cosiddetti â€œmacroblocchiâ€ , le cui dimensioni sono di 16x16 pixel. Ogni macroblocco contiene una matrice di 16x16 pixel di luminanza, mentre per i due segnali di crominanza (che hanno risoluzione piÃ¹ bassa) si utilizzano matrici di 8x8 pixel che coprono la stessa area della matrice di luminanza. Di conseguenza, unâ€™immagine di 1920x1080 pixel sarÃ rappresentata da una matrice di 1920x1088 pixel, con unâ€™aggiunta di otto linee sul fondo, aggiunta necessaria per il fatto che 1080 non Ã ̈ un numero divisibile per sedici, mentre ogni immagine deve essere scomposta in un numero intero di macroblocchi. Lâ€™invenzione prevede quindi di utilizzare le otto linee che non sono occupate dallâ€™immagine vera e propria per trasmettere i dati informativi e/o applicativi.

Ulteriori scopi e vantaggi della presente invenzione appariranno maggiormente chiari dalla descrizione che segue di alcuni esempi di realizzazione forniti a titolo esplicativo e non limitativo.

- BREVE DESCRIZIONE DELLE FIGURE -Alcuni esempi di realizzazione preferiti e vantaggiosi vengono descritti a titolo esemplificativo e non limitativo, con riferimento ai disegni allegati, in cui:

· La figura 1 mostra un diagramma di flusso relativo alle fasi che vanno dalla generazione alla fruizione di contenuti video.

· La figura 2 mostra un sistema di produzione e distribuzione di un flusso video stereoscopico secondo una prima forma di realizzazione della presente invenzione;

· Le figure 3a e 3b mostrano due esempi di un sistema per la fruizione di un flusso video stereoscopico secondo la presente invenzione;

· La figura 4 mostra un sistema di produzione e distribuzione di un flusso video stereoscopico secondo una seconda forma di realizzazione della presente invenzione;

· La figura 5 mostra un sistema di produzione e distribuzione di un flusso video stereoscopico secondo una terza forma di realizzazione della presente invenzione;

· La figura 6 mostra un sistema di produzione e distribuzione di un flusso video stereoscopico secondo una quarta forma di realizzazione della presente invenzione;

· La figura 7 mostra un sistema di produzione e distribuzione di un flusso video stereoscopico secondo una quinta forma di realizzazione della presente invenzione;

· La figura 8 mostra un sistema di produzione e distribuzione di un flusso video stereoscopico secondo una sesta forma di realizzazione della presente invenzione.

· La figura 9 mostra un sistema di produzione e distribuzione di un flusso video stereoscopico secondo una settima forma di realizzazione della presente invenzione.

Le figure illustrano differenti aspetti e forme di realizzazione della presente invenzione e, dove appropriato, numeri di riferimento illustranti strutture, componenti, materiali e/o elementi simili in differenti figure sono indicati da numeri di riferimento simili.

- DESCRIZIONE DETTAGLIATA DELLâ€™INVENZIONE â€“

In figura 1 viene mostrato schematicamente il processo che va dalla generazione alla fruizione di contenuti video digitali. In una prima fase 100 i contenuti vengono generati ed elaborati; questa fase prende il nome di produzione e puÃ² comprendere fasi quali lâ€™acquisizione delle immagini mediante telecamere, la creazione di contenuti video mediante computer grafica, il mixaggio, lâ€™editing delle immagini acquisite ed eventualmente la loro registrazione in un master ad alta qualitÃ (vale a dire senza compressione o con compressione blanda).

Successivamente, i contenuti video prodotti vengono codificati in modo tale da ridurre il bit rate e permetterne la registrazione ad uso dellâ€™utente (ad es. su supporti ottici quali i DVD o i Blu-Ray) o la distribuzione mediante rete di diffusione o telecomunicazioni. Questa fase prende il nome di distribuzione ed Ã ̈ indicata col riferimento 200 in figura 1.

Infine segue una fase che, ai fini della presente descrizione, individueremo come fase di fruizione 300, in cui i contenuti video distribuiti vengono decodificati da opportuni decodificatori (ad esempio dei lettori di DVD o dei set-top-box) e visualizzati sullo schermo.

La figura 2 mostra schematicamente un sistema per generare flussi video stereoscopici 2 secondo una prima forma di realizzazione della presente invenzione. Tale figura mostra quindi alcuni degli elementi tecnici che contribuiscono alle fasi di produzione e distribuzione sopra descritte con riferimento alla figura 1.

Il sistema comprende due coppie di telecamere 3a e 3b; chiaramente il numero di coppie di telecamere Ã ̈ solo esemplificativo e non limitativo, esso puÃ² andare da un minimo di una coppia di telecamere, fino anche a dieci coppie di telecamere e oltre. Ugualmente la coppia di telecamere puÃ² essere integrata in un unico dispositivo che acquisisce due immagini.

Per ogni coppia, le due telecamere acquisiscono immagini da due prospettive differenti. Le telecamere generano quindi una sequenza di immagini destra 4 ed una sequenza di immagini sinistra 5 che vengono ricevute da un multiplexer 6 ed inserite allâ€™interno di fotogrammi di corrispondenti flussi video.

Il multiplexer 6 provvede a combinare una coppia di immagini destra e sinistra delle sequenze 4 e 5 in unâ€™immagine composita C che viene fornita in uscita ad un

mixer di regia 10. In una forma di realizzazione lâ€™immagine composita C generata dal multiplexer 6 Ã ̈ unâ€™immagine di 1080x1920 pixel.

Il segnale in uscita dal mixer 10 puÃ² essere inviato direttamente al codificatore 8 per la compressione, oppure, prima della codifica, puÃ² venire registrato e subire ulteriori elaborazioni in fase di post-produzione.

Per questo motivo, in figura 2 il sistema di editing e postproduzione 7, che permette lâ€™elaborazione dellâ€™immagine composita, viene indicato con linea tratteggiata.

Lâ€™immagine composita, eventualmente elaborata dal sistema 7, viene fornita ad un codificatore 8 che la comprime e la codifica secondo un formato atto alla trasmissione e/o registrazione.

In una forma di realizzazione preferita, il codificatore 8 Ã ̈ un codificatore di tipo H.264 opportunamente modificato per inserire nel flusso video dei dati (ad es. una segnalazione) come meglio decritto nel seguito.

Il codificatore 8 genera quindi un flusso video comprendente una sequenza di fotogrammi trasmessi mediante matrici di dimensioni 1088x1920 in cui le prime 1080 linee contengono lâ€™immagine composita (C0) ricevuta in ingresso ed in cui una o piÃ¹ delle ultime otto linee contengono i dati informativi e/o applicativi.

Nellâ€™esempio di figura 2, il sistema comprende dei mezzi 9 che forniscono al codificatore 8 le informazioni da inserire come dati informativi e/o applicativi allâ€™interno del fotogramma.

In una forma di realizzazione, i mezzi 9 sono dei mezzi che permettono lâ€™inserimento manuale dei dati da inserire nel fotogramma quali dati informativi e/o applicativi; ad esempio, tali mezzi possono essere un personal computer che viene controllato da un utente per immettere manualmente i dati da inserire nel fotogramma. Alternativamente i mezzi dâ€™inserimento 9 possono limitarsi ad un dispositivo di immissione dati, quali una tastiera o una periferica di input di tipo touch screen, opportunamente collegati al codificatore 8 in modo tale da permettere allâ€™utente di fornire le informazioni che devono essere trasportate dal flusso video allâ€™interno dei fotogrammi.

Le informazioni fornite al codificatore 8 possono essere di vario tipo ed avere varie funzioni. In particolare, tali informazioni servono al decoder per ricostruire le immagini destra e sinistra, pertanto possono comprendere unâ€™informazione relativa al frame packaging (ossia relativa alla disposizione delle immagini destra e sinistra nellâ€™immagine composita).

Ricevute le informazioni di cui sopra dai mezzi dâ€™inserimento 9, il codificatore 8 genera quindi in uscita un flusso video che comprende sia lâ€™immagine composita ricevuta in ingresso, sia i dati informativi e/o applicativi che permettono al decodificatore di ricostruire le immagini destra e sinistra cosÃ¬ da permetterne la successiva visualizzazione.

Il flusso video stereoscopico 2 generato dal codificatore 8 puÃ² quindi essere registrato su unâ€™opportuno supporto (DVD, Blu-ray, memorie di massa, hard-disk, eccâ€¦) o essere trasmesso attraverso una rete di comunicazione quale una rete di broadcasting o di telecomunicazioni.

Il segnale in uscita, che nellâ€™esempio di figura 2 Ã ̈ codificato secondo le specifiche correnti dello standard H.264, contiene le indicazioni (cropping window, ovvero finestra che delimita lâ€™immagine) che istruiscono il decoder affinchÃ©, al momento della decodifica, effettui la delimitazione (cropping) dellâ€™immagine. Secondo una forma di realizzazione preferita, il codificatore 8 inserisce tra i metadati unâ€™opportuna informazione per segnalare al decoder che le linee aggiuntive devono essere analizzate prima di essere scartate. Tali metadati possono, ad esempio, essere inseriti in opportuni pacchetti dati quali le NAL (Network Abstraction Layer) unit della codifica H.264.

Veniamo ora allâ€™altro estremo della catena di distribuzione, e cioÃ ̈ al lato ricezione e visualizzazione o riproduzione. La figura 3a mostra schematicamente un sistema 3000 di fruizione dei contenuti video prodotti e distribuiti dal sistema di figura 2.

Il sistema 3000 comprende un decoder 3100 che acquisisce il flusso video 2 mediante un blocco di acquisizione 3110. Il blocco di acquisizione 3110 puÃ² comprendere uno o piÃ¹ tra: un sintonizzatore per ricevere un flusso video diffuso via etere (ad es. via rete terrestre o satellitare), unâ€™ingresso dati per ricevere un flusso video trasmesso via cavo (coassiale, fibra ottica, doppino o altro), un lettore per la lettura di un flusso video registrato come segnale video su un supporto ottico (ad es.DVD o Blu-Ray) o su una memoria di massa.

Il flusso video acquisito dal blocco 3110 viene decodificato dal blocco di decodifica 3120, in particolare un decodificatore H.264 modificato, che fornisce in uscita due sequenze di immagini destra e sinistra estratte dal flusso video 2 decodificato.

Il blocco di decodifica 3120 comprende unâ€™unitÃ 3121 per lâ€™analisi dei metadati contenuti nel flusso video, uno o piÃ¹ registri 3122 per la memorizzazione temporanea dei fotogrammi ricevuti (ad es. immagini di tipo I, B o P nella codifica H.264), unâ€™unitÃ di ricostruzione 3123 dei fotogrammi che ricostruisce le immagini composite presenti nei fotogrammi e le mette nellâ€™ordine temporale corretto, unâ€™unitÃ di estrazione 3124 delle immagini destra e sinistra che estrae le immagini destra e sinistra presenti nelle immagini composite ricostruite sulla base delle informazioni non visibili (dati informativi e/o applicativi) contenute nei fotogrammi ricevuti. Il decoder 3100 comprende poi unâ€™interfaccia dâ€™uscita 3130 che fornisce al dispositivo di visualizzazione 3200 le sequenze di immagini destra e sinistra estratte dal flusso video 2.

Lâ€™interfaccia 3130 puÃ² essere unâ€™interfaccia HDMI (High Definition Multimedia Interface), unâ€™interfaccia che fornisce in uscita due flussi video (uno per la sequenza di immagini destra e uno per la sequenza di immmagini sinistre) ad es. due flussi VGA o XVGA, o unâ€™interfaccia che fornisce in uscita due flussi RGB.

La forma di attuazione sopra descritta con riferimento alle figure 2 e 3a, che prevede lâ€™inserimento di unâ€™informazione nei metadati sulla presenza di dati informativi e/o applicativi nelle linee aggiuntive, presenta il vantaggio che, in caso di assenza di questi dati, il decoder puÃ² tralasciarne lâ€™analisi. Dâ€™altra parte, questa soluzione comporta un aumento della complessitÃ delle operazioni svolte dallâ€™encoder nonchÃ© della complessitÃ di decodifica del flusso.

In una forma di attuazione alternativa alla precedente, il codificatore non aggiunge metadati al flusso codificato, lasciando al decoder il compito di analizzare il contenuto delle linee aggiuntive prima di scartarle. In questo caso, lâ€™encoder e la struttura del flusso video codificato risultano semplificati, mentre risulta accresciuto lâ€™onere computazionale a carico del decoder, ed in particolare dellâ€™unitÃ di estrazione 3124 che per estrarre le immagini destra e sinistra deve prima analizzare il contenuto delle linee e/o colonne aggiuntive contenenti i dati informativi e/o applicativi.

In assenza di metadati dedicati, la ricerca dei dati informativi e/o applicativi puÃ² ad esempio essere effettuata nelle linee e/o colonne del fotogramma che (come indicato dai metadati, quali il metadato di cropping window) che non concorrono alla ricostruzione dellâ€™immagine a livello di decodificatore. In una forma di realizzazione, la ricerca dei dati viene effettuata ricercando le linee e/o colonne aggiunte contenenti pixel non uniformi.

Inâ€™unâ€™ulteriore forma di realizzazione, mostrata in figura 3b, il decodificatore 3100 differisce da quello di figura 3a per il fatto di non comprendere lâ€™unitÃ di estrazione 3124. In questa forma di realizzazione, il decodificatore si limita a decodificare il flusso video senza estrarre le immagini destra e sinistra, che restano multiplexate in immagini composite.

Queste ultime vengono trasmesse dallâ€™interfaccia 3131 di tipo analogo allâ€™interfaccia 3130, ma che porta in uscita un unico flusso video i cui fotogrammi contengono le immagini composite decompresse.

In questa forma di realizzazione, lâ€™estrazione delle immagini destra e sinistra Ã ̈ demandata al dispositivo di visualizzazione 3200 che viene provvisto di appositi mezzi. Qui di seguito vengono descritte delle varianti al sistema di figura 2, le quali si prestano a generare e distribuire flussi video secondo la presente invenzione.

Nellâ€™esempio di figura 4, le telecamere generano delle immagini costituite da 1080x1920 pixel, ed il multiplexer 60 genera una sequenza di fotogrammi C1 costituti da matrici di 1088x1920 pixel, in cui lâ€™immagine composita occupa le prime 1080 linee ed in cui i pixel delle ultime otto linee sono ad esempio tutti neri o grigi.

In particolare, le otto linee aggiuntive che permettono il trasporto dei dati informativi e/o applicativi, vengono create nella scheda del multiplexer 60 che riceve in entrata i due flussi video destro e sinistro e produce in uscita il flusso video stereoscopico, contenente le immagini composite C1.

I fotogrammi C1 generati dai diversi multiplexer 60 del sistema vengono ricevuti dal mixer di regia 10 in uscita dal quale si ha una sequenza di immagini con 1088x1920 pixel che sono compatibili con il formato richiesto per la compressione H.264.

Le otto linee di C1 che contengono informazione da non visualizzare (ossia non contengono lâ€™immagine composita) vengono quindi create in fase di produzione ed utilizzate giÃ in questa fase per trasportare dati che vengono inseriti allâ€™uscita del mixer 10 mediante un sistema 90 di inserimento della segnalazione. Come per i mezzi 9 di figura 2, il sistema 90 permette lâ€™inserimento manuale (ad esempio via computer o tastiera) da parte di unâ€™operatore dei dati informativi e/o applicativi. Questi dati vengono quindi inseriti in una o piÃ¹ delle otto linee aggiunte allâ€™immagine composita C1 in fase di multiplexing. In uscita al sistema 90 si hanno quindi dei fotogrammi C1a di dimensione 1088x1920 in cui 1080 linee contengono informazione visiva, ossia lâ€™immagine da visualizzare, e le rimanenti otto linee contengono informazione non visiva (ossia da non visualizzare) tra cui i dati inseriti dal sistema 90.

Le immagini C1a in uscita dal sistema 90 possono essere elaborate dal sistema di editing e post-produzione 70 (tratteggiato in figura 4 dato che puÃ² essere omesso) e modificate come immagini C2 sempre di dimensione 1088x1920. Il sistema 70 Ã ̈ simile al sistema 7 con la differenza che puÃ² gestire immagini di 1088x1920 pixel.

Le immagini C1a, eventualmente modificate dal sistema 70 come immagini C2, vengono ricevute dal codificatore 80 (preferibilmente di tipo H.264), che le comprime e genera il flusso video stereoscopico 2.A differenza dellâ€™esempio di figura 2, in cui i dati informativi e/o applicativi sono inseriti nel fotogramma in fase di codifica del flusso video, nellâ€™esempio di figura 4 i dati sono inseriti in fase di produzione.

Preferibilmente, quando i dati informativi e/o applicativi sono inseriti in fase di produzione, allora questi dati possono essere di vario tipo ed avere varie funzioni. In particolare, tali dati servono al decoder per ricostruire le immagini destra e sinistra, pertanto possono in particolare comprendere unâ€™informazione relativa al frame packaging (ossia relativa alla disposizione delle immagini destra e sinistra nellâ€™immagine composita), ma possono anche contenere informazioni relative ai parametri di ripresa. Dato che le immagini riprese da una telecamera possono essere combinate con immagini generate con metodi di computer grafica, i dati informativi e/o applicativi possono comprendere unâ€™informazione relativa alle modalitÃ con cui sono state effettuate le riprese con telecamera, cosÃ¬ da assicurare un corretto matching fra le immagini reali e quelle artificiali. Ad es. tale informazione puÃ² essere relativa alla distanza fra le due telecamere, destra e sinistra, che non sempre Ã ̈ uguale alla distanza media fra i due occhi umani; ancora, tale informazione permette di sapere se le due telecamere sono parallele o convergenti (in alcuni casi si imita il comportamento degli occhi umani, che quando focalizzano un oggetto vicino tendono a convergere).

Le informazioni di cui sopra sono utili anche per verificare che, se si combinano assieme due immagini provenienti da sorgenti diverse, non necessariamente prodotte da computer, ma anche da telecamere, lâ€™immagine risultante sia per cosÃ¬ dire â€œcoerenteâ€ e quindi gradevole alla vista. Infatti, combinare immagini prodotte con parametri di ripresa differenti puÃ² generare strani effetti poco gradevoli per il telespettatore.

In figura 5 viene mostrata una variante dellâ€™esempio di figura 4, in cui il multiplexer 600 oltre ad incrementare il numero di linee rispetto a quanto necessario per inserire lâ€™immagine composita (formattata secondo un formato prestabilito, ad es. 1080 righe per 1920 colonne), inserisce nelle linee aggiuntive anche i dati informativi e/o applicativi.

Uno o piÃ¹ sistemi dâ€™inserimento dati 900 (nellâ€™esempio di figura 5 uno solo, ma se ne possono prevedere piÃ¹ di uno fino ad uno per multiplexer) sono collegati ai multiplexer 600 e forniscono i dati informativi e/o applicativi da inserire in linee non visibili del fotogramma C1a in uscita dal multiplexer 600. Questi dati possono essere del medesimo tipo di quelli inseriti dal sistema 90 di figura 4. In questo modo i fotogrammi C1a in uscita dal multiplexer 600 corrispondono sostanzialmente a quelli in uscita dal sistema 90 di figura 4 e possono essere trattati nel medesimo modo mediante compressione ed eventuale elaborazione di editing e post produzione.

Nellâ€™esempio di figura 6, il multiplexer 6 Ã ̈ del medesimo tipo di figura 2; pertanto riceve i flussi video delle telecamere e li combina in un flusso video stereoscopico i cui fotogrammi contengono immagini composite.

Le otto linee per i dati informativi e/o applicativi vengono generate dal sistema di editing e post produzione 70 che genera cosÃ¬ una sequenza di fotogrammi contenenti sia lâ€™immagine composita sia i dati informativi e/o applicativi. Questi ultimi vengono generati utilizzando le informazioni fornite dai mezzi 9000 simili ai mezzi 90 descritti con riferimento alla figura 4.

Come per lâ€™esempio di figura 2, il codificatore 80 comprime la sequenza di fotogrammi C2 e li fornisce in uscita per la registrazione e/o trasmissione.

In una ulteriore forma di realizzazione non mostrata nelle figure, le otto linee per i dati informativi e/o applicativi vengono aggiunte allâ€™immagine composita dal sistema di editing, ma lâ€™inserimento dei dati informativi e/o applicativi in queste otto linee viene effettuato a livello di codificatore, ad esempio mediante mezzi del tipo descritto con riferimento alla figura 2.

In unâ€™ulteriore forma di realizzazione, i dati che vengono utilizzati per i dati informativi e/o applicativi vengono presi automaticamente da metadati associati ai flussi video generati dalle telecamere o al flusso video in uscita dal multiplexer o al flusso video in uscita dal sistema di editing e post produzione. Questa soluzione risulta particolarmente vantaggiosa dato che non richiede alcuna immissione manuale. Inoltre tale soluzione appare vantaggiosa in quanto molti degli strumenti utilizzati nella produzione professionale di contenuti audiovisivi, dai sistemi di acquisizione (telecamere) a quelli di trasporto (file formats, ad esempio MXF â€“ Material Exchange Format) e workflow management/archiviazione (Digital Asset Management) fanno uso di metadati per lâ€™annotazione e la descrizione delle â€œessenzeâ€ (i segnali video veri e propri); pertanto questi sono spesso disponibili alla scheda che produce il flusso stereoscopico o il codificatore.

Ai soli fini di maggior chiarezza, e senza scopo limitativo alcuno, in figura 7 viene mostrato il sistema di figura 2 in cui lâ€™inserimento delle informazioni per i dati informativi e/o applicativi avviene in automatico senza bisogno dei mezzi dâ€™inserimento 9. Il codificatore 800 riceve in ingresso lâ€™immagine composita C ed i metadati ad essa associati, estrae i metadati e li elabora per generare i dati informativi e/o applicativi da inserire nelle otto linee aggiunte allâ€™immagine composita e trasmesse nel fotogramma del flusso video stereoscopico.

Occorre osservare che nellâ€™ambiente di produzione possono avvenire elaborazioni complesse, quali ad es. la combinazione di immagini provenienti da fonti diverse, alcune magari provenienti da archivio, oppure da un broadcaster diverso che usa un diverso formato di frame packaging (impacchettamento delle due immagini destra e sinistra nellâ€™immagine composita). In questâ€™ultimo caso per la combinazione delle immagini Ã ̈ necessario effettuare una conversione di formato. Lâ€™uso dei dati informativi e/o applicativi sopra proposta (che specifica il formato di frame packaging) su tutti i segnali video circolanti nellâ€™ambiente di produzione, consente di automatizzare il processo di conversione.

Il flusso video risultante, che esce dallâ€™ambiente di produzione e va verso lâ€™ambiente di distribuzione, avrÃ invece un unico formato di frame packaging, con relativa segnalazione.

Negli esempi sopra descritti le immagini destra e sinistra acquisite dalle due telecamere 3a o 3b vengono combinate immediatamente in unâ€™immagine composita.

Ai fini della presente invenzione ciÃ² non Ã ̈ essenziale e le sequenze dâ€™immagini destra e sinistra possono viaggiare separatamente fino al codificatore.

CiÃ² Ã ̈ mostrato ad esempio in figura 8, dove le immagini destra e sinistra acquisite dalle coppie di telecamere 3a e 3b vengono ricevute dal mixer di regia 10 che fornisce in uscita due flussi video separati per le immagini destra e sinistra.

Le immagini destra e sinistra selezionate dal mixer di regia 10 vengono fornite in ingresso al sistema di editing e postproduzione 7000 dove vengono elaborate, ad esempio aggiungendo effetti speciali. Alternativamente le immagini vengono inviate direttamente al codificatore e multiplexer 8000. In caso fosse presente, il sistema di editing e post produzione 7000 invia separatamente i due flussi video destro e sinistro al codificatore e multiplexer 8000.

Questâ€™ultimo combina i flussi video in ingresso in un unico flusso video stereoscopico 2 i cui fotogrammi contengono unâ€™immagine composita piÃ¹ i dati informativi e/o applicativi (che, in questo esempio, sono ricevuti dai mezzi dâ€™inserimento 9, ma possono essere altrimenti ricavati automaticamente come sopra descritto) posti in un certo numero di linee (in particolare otto) che non trasportano informazione visiva, ossia lâ€™informazione che verrÃ poi visualizzata. Il codificatore e multiplexer 8000 puÃ² ad esempio combinare le immagini destra e sinistra secondo un qualsiasi formato (top-bottom, side-by-side ecc...) e poi codificarle secondo la codifica H.264.

In unâ€™ulteriore forma di realizzazione, descritta con riferimento alla figura 9, il codificatore 8001 codifica il flusso stereoscopico secondo la codifica MVC (Multi View Coding), descritta nellâ€™appendice H della norma H.264. Questa norma non prevede la generazione di unâ€™immagine composita vera e propria, bensÃ¬ la trasmissione di unâ€™immagine di base (base layer), ad esempio quella destra, e della differenza tra immagine destra ed immagine sinistra (enhancement layer). Un possibile esempio di tale tecnica Ã ̈ la cosiddetta codifica 2D plus Delta. Nella presente forma di realizzazione i dati informativi e/o applicativi relativi al frame packaging non sono necessari perchÃ© non esiste frame packaging. Inoltre il segnale compresso H.264 contiene al suo interno tutti i metadati necessari, per cui non Ã ̈ strettamente necessario utilizzare le otto linee aggiuntive per inserire informazioni utili per il dispositivo di visualizzazione. Gli inventori hanno tuttavia osservato che anche in questo caso lâ€™inserimento di una segnalazione nelle immagini di uno o di entrambi i layer appare utile e conveniente. In particolare appare conveniente inserire i dati informativi e/o applicativi a livello di produzione.

Nellâ€™esempio di figura 9 i flussi video in uscita del mixer 10 vengono ricevuti dal sistema dâ€™inserimento dati 9000 che aumenta il numero di linee di ogni fotogramma dei flussi video ricevuti in ingresso e inserisce dati informativi e/o applicativi nelle linee aggiunte. Preferibilmente, le telecamere generano flussi video con fotogrammi di 1080x1920 pixel che il sistema 9000 incrementa a 1088x1920 pixel inserendo i dati informativi e/o applicativi nelle linee aggiunte. Questi dati possono indicare se lâ€™immagine contenuta nel fotogramma Ã ̈ relativa ad unâ€™immagine destinata allâ€™occhio destro o a quello sinistro, e possono dare informazioni relative alle modalitÃ dâ€™acquisizione dellâ€™immagine (ad es. relazioni spaziali tra le due telecamere di una coppia), formato dellâ€™immagine (4:3 o 16:9) eccâ€¦ Tali informazioni Ã ̈ bene che siano preservate anche nellâ€™ambiente di distribuzione, in quanto capita spesso che, trascorsi molti anni dalla produzione di un programma, il master ad alta qualitÃ non sia piÃ¹ disponibile e quindi, se si vuole recuperare il programma per inserirlo ad es. in uno dei programmi che in gergo vengono chiamati â€œnostalgiaâ€ , Ã ̈ opportuno conoscere i parametri di ripresa al fine di effettuare correttamente la combinazione del suddetto vecchio programma con contenuti attuali.

Il sistema 9000 puÃ² ricavare automaticamente i dati dai flussi video ricevuti in ingresso come sopra descritto, oppure puÃ² riceverli da unâ€™opportuna periferica dâ€™inserimento controllata da unâ€™operatore che li inserisce manualmente.

Le immagini modificate dal sistema dâ€™inserimento 9000 possono essere fornite in ingresso al codificatore 8001 o (se presente) al sistema di editing e post produzione come mostrato in figura 9.

Dagli esempi sopra descritti, appare chiaro che il flusso video stereoscopico 2 generato con il metodo secondo la presente invenzione, comprende quindi unâ€™informazione visiva utile (immagine composita o immagini MVC) e i dati informativi e/o applicativi inseriti in una zona di un fotogramma che non contiene informazione visiva utile.

In una forma di realizzazione, i dati informativi e/o applicativi vengono inseriti in tutti i fotogrammi del flusso video stereoscopico.

In unâ€™altra forma di realizzazione i dati informativi e/o applicativi vengono inseriti solo in una parte dei fotogrammi del flusso video stereoscopico. Preferibilmente, i fotogrammi che non contengono i dati informativi e/o applicativi hanno le linee non contenenti informazione visiva utile riempite con pixel di ugual colore, in particolare grigi o neri. Analogamente, anche nei fotogrammi contenenti i dati, le linee aggiuntive (o porzioni di queste) non utilizzate per questi ultimi contengono preferibilmente pixel di uguale colore, in particolare nero o grigio.

I dati informativi e/o applicativi, siano essi presenti in tutti i fotogrammi, o solo in una parte di questi, possono essere utilizzati dal decodificatore per decodificare il segnale e ricostruire correttamente le immagini destra e sinistra cosÃ¬ da permetterne la visualizzazione.

Il decoder che riceve il flusso stereoscopico 2, ad esempio compresso secondo la codifica H.264, provvede a decomprimerlo e ad estrarre i dati informativi e/o applicativi dai fotogrammi.

Successivamente, lâ€™informazione contenuta nei dati suddetti puÃ² essere utilizzata per estrarre e/o ricostruire le immagini trasportate dal flusso video. In particolare questi dati possono permettere di ricostruire le immagini destra e sinistra, cosÃ¬ da fornirle ad un sistema di visualizzazione, ad esempio un televisore o un videoproiettore, che provvede a presentarle in modo tale da permettere la corretta fruizione dei contenuti 3D.

In una forma di realizzazione, il decodificatore conosce il formato di presentazione e cioÃ ̈ il formato richiesto allâ€™ingresso dal dispositivo di visualizzazione, che puÃ² coincidere o meno con quello usato per la visualizzazione stessa (ad es. line alternation, frame alternation, eccâ€¦). In questo caso il decodificatore puÃ² effettuare, ove necessario, una conversione dal formato di trasporto noto dai dati informativi e/o applicativi inseriti nelle linee aggiuntive al formato di presentazione.

In una prima forma di realizzazione il decoder conosce il formato richiesto allâ€™ingresso del dispositivo di visualizzazione in quanto questa informazione Ã ̈ stata programmata e inserita in modo permanente, per esempio in unâ€™apposita area di memoria, in sede di fabbricazione del decoder o del dispositivo di visualizzazione. Questa soluzione Ã ̈ particolarmente vantaggiosa se il decoder Ã ̈ incorporato nel dispositivo di visualizzazione e pertanto rigidamente associato ad esso.

In unâ€™altra forma di realizzazione, lâ€™informazione sul formato di presentazione viene trasmessa dal dispositivo di visualizzazione al decoder che la carica in unâ€™opportuna area di memoria. Questo Ã ̈ particolarmente vantaggioso nei casi in cui il decoder sia un dispositivo distinto dal dispositivo di visualizzazione e facilmente associabile ad esso mediante una interfaccia che permette uno scambio bidirezionale di dati. In questo modo senza intervento dellâ€™utente Ã ̈ possibile una visualizzazione corretta dei contenuti 3D senza possibilitÃ dâ€™errore.

In unâ€™altra forma di realizzazione tale informazione viene fornita manualmente al decoder da unâ€™utente.

Dalla descrizione sopra effettuata di alcuni esempi di realizzazione, appaiono chiare le caratteristiche ed i vantaggi della presente invenzione, il cui ambito di protezione Ã ̈ definito dalle rivendicazioni allegate. Eâ€™ chiaro quindi che una persona esperta del ramo puÃ² apportare diverse modifiche e varianti ai metodi e sistemi sopra descritti per trasportare dati allâ€™interno di flussi video e per decodificare questi ultimi.

Eâ€™ chiaro che il sistema qui descritto si applica anche in altri apparati o modelli di produzione e distribuzione di contenuti video 2D o 3D non professionali quali quelli descritti qui in dettaglio. Per esempio il dispositivo di acquisizione delle immagini che implementa lâ€™invenzione puÃ² essere incorporato in una macchina fotografica, videocamera o in un telefono cellulare atto a catturare immagini video e a memorizzarle in una memoria di massa per la loro visualizzazione successiva, vuoi sullo stesso apparato, vuoi su apparati diversi.

A tale scopo il flusso video risultante dalla cattura puÃ² essere trasferito su un diverso apparato di riproduzione e visualizzazione (ad esempio PC dotato di monitor, televisore, riproduttore multimediale portatile, eccâ€¦) in qualsiasi modo, (per esempio trasferendo il supporto dati di memorizzazione da un apparato allâ€™altro, via rete LAN wireless o cavo, via Internet, via bluetooth, via trasmissione su rete cellulare in forma di MMS, eccâ€¦). Anche in questo ambito si applica il modello schematico composto da produzione, distribuzione e fruizione dei contenuti video qui illustrato, sussiste lo stesso problema tecnico e puÃ² essere applicata la stessa soluzione tecnica oggetto della presente invenzione con accorgimenti del tutto ovvi per un esperto del ramo.

Inoltre un tecnico puÃ² combinare caratteristiche dei metodi, sistemi ed apparecchiature sopra descritte con riferimento a diversi esempi di realizzazione.

In particolare Ã ̈ chiaro che i vari passi del metodo di generazione del flusso video (editing, multiplexing, codifica, eccâ€¦) possono essere realizzati mediante dispositivi separati o in qualsiasi modo integrati e/o connessi. Ad esempio le due telecamere ed il multiplexer che ne riceve i video acquisiti possono essere inclusi in un'unica telecamera stereoscopica provvista di uno o piÃ¹ obiettivi.

PiÃ¹ in generale, Ã ̈ da sottolineare che Ã ̈ possibile e vantaggioso prevedere un sistema per lâ€™inserimento di dati in un flusso video, comprendente:

- unâ€™unitÃ dâ€™ingresso per ricevere uno o piÃ¹ flussi video, - unâ€™unitÃ dâ€™elaborazione per la generazione di fotogrammi contenenti le immagini di detti uno o piÃ¹ flussi video, detti fotogrammi comprendendo un numero di pixel maggiore rispetto al numero di pixel di dette immagini sorgente,

- mezzi dâ€™acquisizione atti ad acquisire dati informativi e/o applicativi da inserire in detti fotogrammi e mezzi dâ€™inserimento atti ad inserire detti dati informativi e/o applicativi in pixel di detti fotogrammi non occupati da dette immagini. Detti pixel possono occupare linee e/o colonne periferiche di detti fotogrammi.

Anche le unitÃ e i mezzi di questo sistema possono essere integrati in un unico apparato oppure far parte di apparati diversi.

Si deve notare che le forme di attuazione qui illustrate fanno riferimento al formato 1920x1080, ovvero il formato di uso piÃ¹ comune che, nella codifica H.264, presenta la necessitÃ di introdurre un incremento nelle dimensioni dellâ€™immagine codificata. Tale situazione potrebbe presentarsi, ed essere sfruttata in modo analogo, anche per formati di immagine differenti, per questo o altri sistemi di codifica.

Lâ€™invenzione Ã ̈ stata qui descritta con riferimento alla sola codifica H.264, ma puÃ² essere ugualmente applicata ad altre tecniche di compressione video in cui si rende necessario incrementare le dimensioni dellâ€™immagine da sottoporre al codificatore, ad es. perchÃ© le dimensioni di partenza non consentono la scomposizione dellâ€™immagine in un numero intero di macroblocchi, oppure per qualsiasi altra ragione. Tale situazione potrebbe presentarsi, ad esempio, nei successori della codifica H.264 attualmente in fase di studio e sviluppo (per esempio, il cosiddetto H.265/HVC). Eâ€™ ugualmente chiaro che, a seconda del formato del fotogramma, i dati informativi e/o applicativi possono essere inseriti in linee e/o colonne del fotogramma purchÃ© non contenenti informazione visiva, ossia pixel dellâ€™immagine da visualizzare.

I dati informativi e/o applicativi possono poi trasportare informazioni di vario genere, anche non relative alla formattazione dellâ€™immagine stereoscopica e/o alle modalitÃ di realizzazione delle riprese stereoscopiche. Ad esempio i dati informativi e/o applicativi possono essere utilizzati per segnalare la destinazione dâ€™uso del flusso video, in modo tale da renderlo decodificabile solamente a decoder posti o distribuiti in una data regione del mondo, ad esempio solo negli USA o solo in Europa. I dati informativi e/o applicativi possono quindi trasportare qualsiasi tipo di informazione, correlata o meno alle immagini nelle quali vengono inseriti, ed essere ad esempio utilizzati per applicazioni eseguibili a livello di decodificatore o di dispositivo di visualizzazione.

Inoltre, sebbene i fotogrammi che trasportano i dati informativi e/o applicativi nelle forme di attuazione sopra descritte contengano immagini stereoscopiche, Ã ̈ chiaro da quanto descritto che lâ€™invenzione puÃ² essere ugualmente applicata alle immagini 2D o alle rappresentazioni cosiddette â€œmultiview". Anche in flussi video digitali 2D Ã ̈ possibile inserire i dati informativi e/o applicativi in linee e/o colonne del fotogramma che non contengono pixel di immagini da visualizzare.

Claims

RIVENDICAZIONI 1. Metodo per il trasporto di dati allâ€™interno di un flusso video digitale, in cui detto flusso video digitale comprende dati informativi e/o applicativi non destinati alla visualizzazione ed almeno un fotogramma comprendente unâ€™immagine da visualizzare, ed in cui detto almeno un fotogramma comprende un numero di pixel maggiore rispetto al numero di pixel di detta immagine, il metodo essendo caratterizzato dal fatto di inserire detti dati informativi e/o applicativi in pixel di detto fotogramma non occupati da detta immagine.
2. Metodo secondo la rivendicazione 1, comprendente i passi di: - inserire detta immagine in un primo fotogramma, - aggiungere linee e/o colonne a detto primo fotogramma in modo tale da ottenere un fotogramma di dimensioni maggiori rispetto a detto primo fotogramma, - inserire detti dati informativi e/o applicativi in detto fotogramma di dimensioni maggiori.
3. Metodo secondo la rivendicazione 1 o 2, in cui dette linee e/o colonne sono aggiunte dal medesimo dispositivo che inserisce detti dati.
4. Metodo secondo la rivendicazione 1 o 2, dette linee e/o colonne sono aggiunte da un dispositivo distinto da quello che inserisce detti dati.
5. Metodo secondo la rivendicazione 2 o 3 o 4, in cui dette linee e/o colonne aggiunte sono linee e/o colonne periferiche di detto fotogramma di dimensioni maggiori.
6. Metodo secondo una qualsiasi delle rivendicazioni da 2 a 5, in cui dette linee e/o colonne aggiunte sono linee e/o colonne adiacenti di detto fotogramma di dimensioni maggiori.
7. Metodo secondo una qualsiasi delle rivendicazioni da 2 a 6, in cui detti dati informativi e/o applicativi occupano tutte o solo parte delle linee e/o colonne aggiunte.
8. Metodo secondo una qualsiasi delle rivendicazioni da 2 a 7, in cui detto fotogramma di dimensioni maggiori ha dimensioni tali da essere scomponibile in un numero intero di macroblocchi, le dimensioni dei macroblocchi dipendendo dallâ€™algoritmo di codifica utilizzato per la codifica di detto flusso video.
9. Metodo secondo una qualsiasi delle rivendicazioni da 1 a 8, in cui detta immagine da visualizzare Ã ̈ una immagine composita di un flusso video stereoscopico.
10. Metodo secondo una qualsiasi delle rivendicazioni da 1 a 8, in cui detta immagine Ã ̈ una tra unâ€™immagine destra ed unâ€™immagine sinistra, ed in cui detto flusso video comprende almeno un secondo fotogramma contenente la differenza tra dette immagini destra e sinistra.
11. Metodo secondo una qualsiasi delle rivendicazioni da 2 a 10, in cui dette linee e/o colonne sono aggiunte da un dispositivo a monte di un codificatore che comprime detto flusso video.
12. Metodo secondo una qualsiasi delle rivendicazioni da 2 a 10, in cui detti dati sono inseriti da un codificatore che comprime detto flusso video.
13. Metodo secondo la rivendicazione 12, in cui detto codificatore inserisce metadati in detto flusso video, detti metadati comprendendo unâ€™informazione atta a segnalare la presenza di dati in dette linee e/o colonne aggiunte.
14. Metodo secondo una qualsiasi delle rivendicazioni precedenti, in cui detti dati sono atti a permettere la elaborazione e/o la conversione automatica del formato dei fotogrammi del flusso video da un formato di trasporto ad un formato di presentazione.
15. Metodo secondo una qualsiasi delle rivendicazioni precedenti, in cui detti dati sono relativi alla formattazione di detta immagine, ed in particolare comprendono uno o piÃ¹ dei dati compresi nel gruppo costituito da: identificativo che lâ€™immagine Ã ̈ 2D o 3D, aspect ratio, frame packaging, modalitÃ di ripresa.
16. Metodo secondo una qualsiasi delle rivendicazioni da 2 a 15, in cui detti dati sono inseriti automaticamente.
17. Metodo secondo la rivendicazione 16, in cui detti dati sono ricavati da metadati associati ad un flusso video da cui si ricava detta immagine.
18. Metodo secondo una qualsiasi delle rivendicazioni da 2 a 15, in cui detti dati sono inseriti manualmente da un operatore.
19. Dispositivo per lâ€™inserimento di dati in un flusso video, comprendente: - unâ€™unitÃ dâ€™ingresso per ricevere unâ€™immagine, - unâ€™unitÃ dâ€™elaborazione per la generazione di un fotogramma di detto flusso video, detto fotogramma contenendo detta immagine e comprendendo un numero di pixel maggiore rispetto al numero di pixel di detta immagine, caratterizzato dal fatto di comprendere mezzi dâ€™acquisizione atti ad acquisire dati informativi e/o applicativi da inserire in detto flusso video e mezzi dâ€™inserimento atti ad inserire detti dati informativi e/o applicativi in pixel di detto fotogramma non occupati da detta immagine.
20. Dispositivo secondo la rivendicazione 19, in cui detta unitÃ dâ€™ingresso Ã ̈ atta a ricevere un primo fotogramma contenente detta immagine, in cui detta unitÃ dâ€™elaborazione Ã ̈ atta ad aggiungere linee e/o colonne a detto primo fotogramma in modo tale da ottenere un fotogramma di dimensioni maggiori rispetto a detto primo fotogramma, ed in cui detti mezzi dâ€™inserimento sono atti ad inserire detti dati informativi e/o applicativi in detto fotogramma di dimensioni maggiori.
21. Dispositivo secondo la rivendicazione 19 o 20, in cui dette linee e/o colonne aggiunte sono linee e/o colonne periferiche e/o adiacenti di detto fotogramma di dimensioni maggiori.
22. Dispositivo secondo una qualsiasi delle rivendicazioni da 19 a 21, in cui detti dati informativi e/o applicativi occupano tutte o solo parte delle linee e/o colonne aggiunte.
23. Dispositivo secondo una qualsiasi delle rivendicazioni da 19 a 22, in cui detti mezzi dâ€™acquisizione sono atti a ricavare detti dati informativi e/o applicativi da metadati associati ad un flusso video da cui si ricava detta immagine.
24. Dispositivo secondo una qualsiasi delle rivendicazioni da 19 a 23, ulteriormente comprendente unâ€™interfaccia per il collegamento da unâ€™unitÃ dâ€™inserimento dati operati da un operatore.
25. Dispositivo secondo una qualsiasi delle rivendicazioni da 19 a 24, ulteriormente comprendente mezzi per codificare detto flusso video secondo un algoritmo di codifica, ed in cui detto fotogramma di dimensioni maggiori ha dimensioni tali da essere scomponibile in un numero intero di macroblocchi, le dimensioni di detti macroblocchi dipendendo da detto algoritmo di codifica.
26. Dispositivo secondo la rivendicazione 25, in cui detti mezzi per codificare sono atti ad inserire metadati nel flusso video codificato, detti metadati comprendendo unâ€™informazione atta a segnalare la presenza di dati in dette linee e/o colonne aggiunte.
27. Dispositivo multiplexer comprendente un dispositivo secondo una qualsiasi delle rivendicazioni da 19 a 26.
28. Apparato per lâ€™acquisizione di immagini, in particolare telecamera, videocamera o fotocamera, comprendente un dispositivo secondo una qualsiasi delle rivendicazioni da 19 a 27.
29. Flusso video digitale comprendente dati informativi e/o applicativi non destinati alla visualizzazione ed almeno un fotogramma comprendente unâ€™immagine da visualizzare, detto almeno un fotogramma comprendendo un numero di pixel maggiore rispetto al numero di pixel di detta immagine, caratterizzato dal fatto che detti dati informativi e/o applicativi sono posti in pixel di detto fotogramma non occupati da detta immagine.
30. Flusso video secondo la rivendicazione 29, in cui detta immagine Ã ̈ unâ€™immagine composita comprendente unâ€™immagine destra ed unâ€™immagine sinistra multiplexate.
31. Flusso video secondo la rivendicazione 29 o 30, in cui detto flusso video Ã ̈ codificato secondo la codifica H.264 ITU-T â€œH.264 Advanced video coding for generic audiovisual servicesâ€ .
32. Flusso video secondo la rivendicazione 31, in cui detto flusso video Ã ̈ codificato secondo lâ€™appendice H della codifica H.264 ITU-T â€œH.264 Advanced video coding for generic audiovisual servicesâ€ .
33. Flusso video secondo una qualsiasi delle rivendicazioni da 29 a 32, in cui detti dati sono posti in linee e/o colonne periferiche di detto almeno un fotogramma.
34. Flusso video secondo una qualsiasi delle rivendicazioni da 29 a 33, ulteriormente comprendente metadati contenenti unâ€™informazione atta a segnalare la presenza di dati in detti pixel di detto fotogramma non occupati da detta immagine.
35. Metodo per decodificare un flusso video, in cui detto flusso video Ã ̈ un flusso video secondo una qualsiasi delle rivendicazioni da 29 a 34, ed in cui il metodo comprende i passi di: - Estrarre detti dati informativi e/o applicativi, - Estrarre detta immagine.
36. Metodo secondo la rivendicazione 35, in cui detti dati informativi e/o applicativi sono estratti utilizzando informazioni contenute in metadati inseriti in detto flusso video.
37. Metodo secondo la rivendicazione 36, ulteriormente comprendente i passi di: - Individuare, in particolare mediante unâ€™informazione di cropping window, linee e/o colonne del fotogramma da tagliare, - Ricercare detti dati informativi e/o applicativi in dette linee e/o colonne da tagliare, - Estrarre detti dati informativi e/o applicativi.
38. Metodo secondo una qualsiasi delle rivendicazioni da 35 a 37, in cui detti dati informativi e/o applicativi sono codificati mediante valori di pixel, ed in cui il metodo comprende i passi di: - Ricercare tra dette linee e/o colonne aggiuntive quelle contenenti pixel non uniformi, - Estrarre detti dati informativi e/o applicativi da dette linee e/o colonne contenenti pixel non uniformi.
39. Metodo secondo una qualsiasi delle rivendicazioni da 35 a 38, in cui detto flusso video Ã ̈ un flusso video stereoscopico, in particolare uno comprendente almeno unâ€™immagine composita o coppia di immagini destra e sinistra.
40. Metodo secondo una qualsiasi delle rivendicazioni da 35 a 39, in cui i fotogrammi di detto flusso video da decodificare Ã ̈ sono un formato di trasporto, ed in cui si individua detto formato di trasporto sulla base di detti dati estratti e si converte automaticamente il formato dei fotogrammi di detto flusso video da detto formato di trasporto ad un formato di presentazione.
41. Dispositivo per decodificare un flusso video stereoscopico, caratterizzato dal fatto di comprendere mezzi atti ad implementare il metodo secondo una qualsiasi delle rivendicazioni da 35 a 40.
42. Dispositivo per visualizzare un flusso video atto a implementare un metodo secondo la rivendicazione 41.
43. Dispositivo per convertire il formato di fotogrammi di un flusso video dâ€™ingresso a un formato di fotogrammi di un flusso video dâ€™uscita destinato a essere visualizzato su un dispositivo di visualizzazione, caratterizzato dal fatto di comprendere mezzi atti a convertire detto flusso video dâ€™ingresso in detto flusso video dâ€™uscita sulla base dei dati applicativi e/o informativi inseriti in detto flusso video dâ€™ingresso secondo il metodo di una qualsiasi delle rivendicazioni da 1 a 18.
44. Dispositivo secondo la rivendicazione 43, in cui il dispositivo Ã ̈ a conoscenza del formato da utilizzare allâ€™ingresso del dispositivo di visualizzazione in base a impostazioni inserite in sede di fabbricazione o assemblaggio del dispositivo.
45. Dispositivo secondo la rivendicazione 43, in cui il dispositivo viene a conoscenza del formato di presentazione da utilizzare allâ€™ingresso del dispositivo di visualizzazione in base a informazioni ricevute da detto dispositivo di visualizzazione.
46. Dispositivo secondo la rivendicazione 43, in cui il dispositivo viene a conoscenza del formato di presentazione da utilizzare allâ€™ingresso del dispositivo di visualizzazione in base a informazioni inserite manualmente da un utente. ***********