-
Die
Erfindung bezieht sich auf ein Verfahren zur Datenerkennung in einem
Aufzeichnungsgerät.
-
Hintergrund
-
Aufzeichnungsgeräte dienen
zur Aufzeichnung von Videodaten, insbesondere von Filmen, Live-Shows
usw. Solche Geräte
werden allgemein als Videorecorder (VCR) bezeichnet und erlauben
auf einem Band die Speicherung von mehreren Gruppen von Videodaten,
die sich auf verschiedene Filme oder Shows beziehen.
-
EP-A-0 838 820 und
EP-A-0 737 008 offenbaren
Verfahren, bei denen Videodaten und -sequenzen in einer Datenbasis
zusammen mit zugehörigen Informationen
gespeichert werden, die zur Identifizierung bestimmter Sequenzen
für eine
spätere
Wiedergewinnung dienen.
-
Erfindung
-
Der
Benutzer des Aufzeichnungsgerätes kann
wünschen,
automatisch einige spezifische Informationen den aufgezeichneten
Videodaten hinzuzufügen
und diese spezifischen Informationen so zu speichern, dass sie den
aufgezeichneten Daten zugeordnet werden. In einem solchen Fall ist
es erforderlich, die auf den Speichermitteln aufgezeichneten Videodaten
zu identifizieren oder zu erkennen.
-
Neben
einer solchen Anwendung besteht auch ein allgemeiner Bedarf zur
Identifizierung oder Erkennung von Videodaten. Eine solche Videodaten-Erkennung
ermöglicht
eine bequeme Benutzung von Aufzeichnungsgeräten.
-
Der
Erfindung liegt die Aufgabe zugrunde, einen verbesserten Weg zur
Identifizierung oder Erkennung von Videosequenzdaten zur automatischen Lieferung
von verbundenen Informationen aufzuzeigen. Diese Aufgabe wird durch
die in den Ansprüchen
1 bis 3 offenbarten Verfahren gelöst.
-
Die
Erfindung enthält
den grundsätzlichen Gedanken,
eine Gruppe von Mittelwerten zu erzeugen, die von Videodaten abgeleitet
werden, z. B. Luminanz-Helligkeits-Mittelwerte, und diese Gruppe von
Mittelwerten zur automatischen Erkennung oder Identifizierung von
Videodaten zu verwenden. Daher werden Videodaten selbst zur Erzeugung
von Parametern verwendet, die zur Erkennung oder Identifizierung
verwendet werden können.
-
Vorteilhafterweise
brauchen keine zusätzlichen
Identifizierungsdaten in eine Videodaten-Datei integriert und/oder übertragen
und/oder zusammen mit den Videodaten gespeichert zu werden.
-
Ein
anderer Vorteil der Erfindung besteht darin, dass die Helligkeits-Mittelwerte
von Videodaten völlig
unempfindlich für
Rauschen sind, das durch Kanal-Transfer zwischen der Programmquelle
und dem Aufzeichnungsgerät
eingeführt
werden kann. Daher ist die Wahrscheinlichkeit, rauschbehaftete Luminanzwerte
unter den empfangenen Videodaten auf der Seite des Aufzeichnungsgerätes zu haben, ziemlich
gering. Dies erleichtert die Identifizierung und Erkennung von Videodaten
mittels der Gruppe von Luminanz-Helligkeitswerten.
-
Ein
weiterer Vorteil besteht darin, dass mit wenig Mühe nur die Luminanz-Helligkeits-Mittelwerte aus
den Luminanz- Pixelwerten
der gespeicherten Videodaten berechnet werden können.
-
Im
Prinzip ist die Erfindung geeignet zum automatischen Identifizieren
oder Erkennen einer aufgezeichneten Videosequenz und zur automatischen Lieferung
von zusätzlichen,
auf die aufgezeichnete Videosequenz bezogenen Informationen, wobei
das Verfahren die Schritte enthält:
- – Erzeugen
einer Gruppe von Mittelwerten, die charakteristisch für Vollbilder
oder Halbbilder der aufgezeichneten Videosequenz sind aus Daten der
aufgezeichneten Videosequenz in einem Aufzeichnungsgerät;
- – Senden
der Gruppe von Mittelwerten von dem Aufzeichnungsgerät zu Server-Mitteln;
- – Vergleichen
der empfangenen Gruppe von Mittelwerten mit entsprechenden Daten,
die von auf der Server-Mittel-Seite
bekannten Videosequenzen abgeleitet sind, in den Server-Mitteln;
- – bei
Identifizierung oder Erkennung der Gruppe von Mittelwerten als zu
einer spezifischen der bekannten Videofrequenzen gehörend, Senden
von zusätzlichen
Daten, die in den Server-Mitteln gespeichert sind, und die auf die
identifizierte oder erkannte aufgezeichnete Videosequenz bezogen sind,
von den Server-Mitteln
zu dem Aufzeichnungsgerät;
- – Speichern
der zusätzlichen
Daten in Verbindung mit der aufgezeichneten Videosequenz unter Verwendung
des Aufzeichnungsgerätes.
-
Vorteilhafte
Merkmale der Erfindung sind in den Unteransprüchen offenbart.
-
Zeichnungen
-
Ausführungsbeispiele
der Erfindung werden unter Bezugnahme auf die beigefügten Zeichnungen näher erläutert. In
den Zeichnungen zeigen:
-
1 ein
schematisches Blockschaltbild einer Anordnung, die ein Aufzeichnungsgerät und Server-Mittel
umfasst;
-
2 eine
schematische Darstellung von Videodaten-Vollbildern, die in dem Aufzeichnungsgerät bzw. den
Server-Mitteln aufgezeichnet wurden.
-
Ausführungsbeispiele
-
In 1 enthält eine
Server-Vorrichtung 1 Steuermittel 2 und ein Titelarchiv 3 für Titel
von Gruppen von Videodaten, die in einem Programmarchiv 4 gespeichert
sind. Die Gruppe von Videodaten stellt zum Beispiel aufgezeichnete
Filme oder Fernsehshows dar. Eine einzelne Gruppe von Videodaten oder
mehrere Gruppen von Videodaten können
von der Server-Vorrichtung 1 oder
von einer Fernsehstation zu einem Aufzeichnungsgerät 5 gesendet
werden, zum Beispiel einem Videorecorder oder einem optischen Recorder.
Die Gruppe von zu dem Aufzeichnungsgerät 5 gesendeten Videodaten
wird in Speichermitteln 6, z. B. einer Videokassette oder
einer DVD (digital versatile disc) gespeichert.
-
Unter
Bezugnahme auf 1 und 2 wird eine
erste Ausführungsform
beschrieben. Eine Gruppe von in 2 gezeigten
Videodaten 20, z. B. ein Film, wird von einer Fernsehstation
oder von der Server-Vorrichtung 1 oder von irgendeiner
ande ren Videosequenzquelle zu dem Aufzeichnungsgerät 5 zwecks
Aufzeichnung gesendet. Die Gruppe von Videodaten 20 wird
auf einer Vollbild-für-Vollbild-
oder Halbbild-für-Halbbild-Basis übertragen
und gespeichert.
-
Automatisch
oder zu jeder Zeit nach der Aufzeichnung wünscht ein Benutzer des Aufzeichnungsgerätes 5 die
Speicherung zusätzlicher
Informationen, die sich auf die aufgezeichnete Gruppe von Videodaten
beziehen, zu speichern, z. B. einen Titel, eine Startzeit und eine
Endzeit des in der Gruppe von Videodaten 20 enthaltenen
Films. Das Aufzeichnungsgerät 5 analysiert
zum Beispiel vier einzelne Vollbilder oder Halbbilder oder Einheiten
oder Stücke 21 aus
zum Beispiel einhundert aufeinanderfolgenden Vollbildern oder Halbbildern
der gespeicherten Gruppe von Videodaten 20, um entsprechende
Analyse-Ergebniswerte an die Server-Vorrichtung 1 zu senden.
Die zeitlichen Orte dieser Stücke 21 sind über der
gesamten aufgezeichneten Gruppe von Videodaten 20 verteilt.
-
Für jedes
analysierte Vollbild oder Halbbild bzw. Einheit oder Stück wird
zum Beispiel ein einzelnes Byte für einen Mittelwert aus den
Pixelwerten eines Vollbildes oder eines Halbbildes oder einer Einheit/Stückes berechnet
und kann sofort gespeichert werden. Das Stück oder die Einheit kann mehrere Vollbilder
oder Halbbilder enthalten und kann aus Teilen von Vollbildern oder
Halbbildern bestehen. Der aktive Teil eines Vollbildes enthält zum Beispiel
720 Pixel horizontal und 576 Pixel vertikal bei einer 50 Hz-Fernsehnorm
(480 Pixel bei einer 60 Hz-Fernsehnorm). Ein Luminanz-Helligkeits-Mittelwert
für ein Vollbild
ist dann der durchschnittliche Helligkeitswert der 720×576 Luminanz-Pixelwerte. Vorzugsweise wird
bei der Abschätzung
der Pixelwerte nur die obere Hälfte
eines Vollbildes oder eines Halbbildes zur Berechnung eines der
Mittelwerte verwendet, um bei dem resultierenden Byte ein Zusammenstoßen durch eine
Untergruppe von Videodaten zu vermeiden, die in die Videodaten 20 eingefügt werden
könnten,
z. B. in einer PIP-(Bild-in-Bild)-
oder Untertitel/Überschrift-Darstellung.
Jenes Byte ist zum Beispiel der Helligkeits-Mittelwert der Luminanzpixel
der sichtbaren oberen Hälfte
des gesamten Vollbildes. Als Alternative oder in Kombination können die
Chrominanz-Sättigungs-Mittelwerte
einer oder beider Farbkomponenten verwendet werden. Als weitere
Alternative können
Halbbild-Mittelwerte
anstatt von Vollbild-Mittelwerten verwendet werden, wodurch eine Halbbild-Analyse
anstatt der Vollbild-Analyse
ausgeführt
wird. Alle Kombinationen dieser Merkmale können verwendet werden.
-
Als
Ergebnis wird eine Gruppe 22 von zum Beispiel 4 × 100 =
400 Bytes für
die gegenwärtig
aufgezeichnete Videosequenz gesammelt. Danach wird diese Gruppe 22 von
Mittelwerden zur Server-Vorrichtung 1 gesendet. Um einen
Film zu identifizieren, reicht es aus, nur einige wenige Vollbilder
zusammen mit ihrem zeitlichen Ort zur Ansammlung einer ausreichenden
Zahl von Helligkeits-Mittelwerten auszuwählen, wodurch eine Kompression
von Mittelwert-Daten erzielt wird. Wenn die zeitlichen Abstände solcher
ausgewählter
Vollbilder einen festen Wert haben, z. B. jedes zehnte oder jedes
fünfzehnte
Vollbild oder Halbbild, ist es nicht erforderlich, die Vollbild- oder
Halbbild-Abstandswerte zu übertragen.
-
Es
sei bemerkt, dass die Zahl von Vollbildern oder Halbbildern, die
zur Erzeugung der Mittelwerte 22 analysiert werden, bei
verschiedenen Anwendungen unterschiedlich sein können. In jedem Fall sollten die
analysierten Vollbilder oder Stücke 21 über die ganze
Sequenz oder den Film verteilt sein, um die Wahrscheinlichkeit zum
Einschließen
von Vollbildern aus wenigstens einer Gruppe von aufeinanderfolgenden Vollbildern
des Films oder der Gruppe von Videodaten 20 zu erhöhen, d.
h. nicht von einer zwischengeschalteten Reklameszene oder von dem
Ende oder dem Start eines anderen Films/einer anderen Gruppe von
Videodaten-Heading oder nach dem Film/der Gruppe von abzuschätzenden
und zu identifizierenden Videodaten. Vorteilhafterweise sollten die
zeitlichen Orte der Vollbilder oder Stücke 21 so ausgewählt werden,
dass die Werte der Mittelwert-Bytes sich ernsthaft während eines
Stückes
von aufeinanderfolgenden Vollbildern ändern, um ein charakteristischeres
Schema von Luminanz-Helligkeits-Mittelwerten
zu erhalten. Dies hilft zu vermeiden, dass Videodaten mit im wesentlichen
keiner besonderen Bedeutung (wie der Inhalt eines schwarzen Bildschirms
während
mehrerer Sekunden) zur Erzeugung der Gruppe von Luminanz-Helligkeits-Mittelwerten verwendet
werden.
-
Die
Gruppe 22 von Mittelwerten stellt ein charakteristisches
Byte-Schema für
die analysierte Gruppe von Videodaten 20 dar und wird dann
automatisch zu den Server-Mitteln 1 z. B. über eine
ISDN- oder analoge Telefonleitung gesendet. Die Server-Mittel 1 vergleichen
automatisch die empfangene Gruppe von Mittelwerten 22 mit
entsprechenden Mittelwert-Daten 23, die in ihrem Programmarchiv 4 gespeichert
sind.
-
Es
besteht keine Notwendigkeit für
eine 100%-Anpassung zwischen den Bytes der Mittelwert-Gruppe 22,
die in dem Aufzeichnungsgerät 5 erzeugt
wird und den Mittelwert-Bytes 23, die in dem Programmarchiv 4 gespeichert
sind. Eine nichtlineare Kanal- oder unvollkommene Klemmung während der Übertragung
oder des Transfers zwischen dem Videosequenz-Provider oder der Fernsehprogramm-Signalquelle
und dem Aufzeichnungsgerät 5 kann
kleine Abweichungen in der Helligkeit und/oder der Chrominanz-Sättigung
verursachen und dadurch in der davon abgeleiteten Mittelwert-Byte-Sequenz. Zum
Beispiel ist eine Mittelwert-Byte-Sequenz ,5, 88, 34, 92', die in dem Recorder
aus einem empfangenen Videosignal berechnet wird, verschieden, aber noch ähnlich der
Mittelwert-Byte-Sequenz ,5, 87, 35, 93', die in den Server-Mitteln 1 gespeichert
ist. Bekannte Datenanpassungs-Korrelationsverfahren können verwendet
werden, um diese Mittelwert-Sequenzen als Darstellung eines identischen
Films oder einer identischen Videosequenz zu identifizieren.
-
Falls
die Server-Mittel 1 die Gruppe von Videodaten 20 erkennen,
die durch die Gruppe von Mittelwerten 22 charakterisiert
ist, die von dem Aufzeichnungsgerät 5 empfangen werden,
senden sie automatisch Daten zurück
wie den Titel, den Namen des Regisseurs und des Produzenten des
Films und/oder ursprüngliche
Zeitstempel zu dem Aufzeichnungsgerät.
-
Außerdem können die
Server-Mittel 1 danach automatisch eine vollständige Gruppe
von zum Beispiel Luminanz-Helligkeits-Mittelwert-Bytes 24 für die identifizierte
Videodaten-Sequenz
(erzeugen und) senden, z. B. einen Film zu dem Aufzeichnungsgerät 5,
d. h. ein Mittelwert-Byte für
jedes Vollbild oder Halbbild. Diese vollständige Gruppe von Mittelwerten
wird dann in dem Aufzeichnungsgerät verwendet, um genau den Beginn
und das Ende und/oder Unterbrechungen der aufgezeichneten Videosequenz
zu bestimmen, indem sie mit den entsprechenden Mittelwerten der
aufgezeichneten Videosequenz verglichen werden.
-
Wenn
die Gruppe von Videodaten 20 ein Film mit einer Länge von
zum Beispiel einer Stunde und 30 Minuten ist, würde die vollständige Zahl
von Vollbildern 135.000 bei Zeilensprung-TV mit 50 Hz und 162.000 bei Zeilensprung-TV
für 60
Hz betragen. Eine ISDN-Verbindung würde nur etwa 20 Sekunden benötigen, um
diese Anzahl von Bytes zu übertragen. Daher sind
bekannte ISDN-Vorrichtungen in der Lage, die Übertragung der vollständigen Gruppe
von Mittelwerten 22 bei niedrigen Kosten durchzuführen. Selbst
ein analoges Telefonleitungs-Modem würde weniger als eine Minute
für die Übertragung
benötigen.
-
Wenn
die Server-Mittel 1 keine Anpassung zwischen den entsprechenden
Mittelwert-Bytes finden, können
sie automatisch eine Anforderung an das Aufzeichnungsgerät 5 von
weiteren Stücken
der Gruppe von zu identifizierenden Videodaten 20 senden.
Wenn weitere Anpassungs-Operationen noch nicht erfolgreich sind,
können
die Server-Mittel eine Nachricht wie „kann den Film nicht identifizieren" an das Aufzeichnungsgerät 5 senden.
-
Die
beschriebene Erfindung arbeitet gut ohne jegliche Benutzer-Steuerung,
d. h. die Identifizierung oder Erkennung der Gruppe von Videodaten 20,
des Titels usw., das Senden und die Bestimmung des Beginns, des
Endes und von Unterbrechungen in dem Aufzeichnungsgerät kann automatisch
ohne jede Hilfe durch den Benutzer ausgeführt werden.
-
Das
Titelarchiv 3 und das Programmarchiv 4 in den
Server-Mitteln sollte
mit entsprechenden Daten für
alle neuen Gruppen von gesendeten Videodaten aktualisiert werden,
z. B. Filmen oder Shows. Sogar Fernsehnachrichten könnten archiviert
werden. Dies würde
nicht viel Speicherraum besetzen: zum Beispiel werden (25(30) Bytes/s–1)·(3600s/h)·24h = 2.16
MBytes für
50 Hz-TV (2,59 MBytes für
60 Hz-TV) benötigt,
um alle Luminanz-Bytes für
einen Kanal während
24 Stunden ohne Kompression von irgendwelchen Mittelwert-Daten aufzuzeichnen.
Tatsächlich
ist die aktuell benötigte
Speicherkapazität wegen
der Übertragungs-Unterbrechungen,
Reklame und Programmwiederholungen niedriger.
-
Einige
Schritte der Erfindung können
wie folgt zusammengefasst werden:
- a) Erzeugen
einer Gruppe von Mittelwert-Bytes 22;
- b) Senden dieser Gruppe über
eine Telefonleitung zu den Server-Mitteln 1;
- c) Ausführen
der Datenidentifizierung/-erkennung;
- d) entsprechend der Gruppe von identifizierten/erkannten Videodaten
(Film) Sammeln von verbundenen zusätzlichen Informationen, z.
B. dem Titel und einer vollständigen
Gruppe von Mittelwert-Bytes 24;
- e) Senden der zusätzlichen
Informationen zu dem Aufzeichnungsgerät 5;
- f) Speichern des Titels in einem Archiv des Aufzeichnungsgerätes 5;
- g) Vergleichen der Gruppe von Videodaten 20, die in
dem Aufzeichnungsgerät 5 aufgezeichnet
sind, mit den empfangenen Mittelwert-Bytes 24 zur Feststellung
des genauen Ortes des Starts, des Endes und von Unterbrechungen
der aufgezeichneten Gruppe von Videodaten 20, und Speichern dieser
Informationen in dem Archiv.
-
Gemäß einer
weiteren Ausführungsform
programmiert ein Benutzer die Aufzeichnung eines Films in dem Aufzeichnungsgerät 5,
z. B. über
ein Menü-gesteuertes
,Naviclick'-Verfahren
oder über ,Showview'. Der Film wird später gesendet.
Die Programmier-Informationen werden wenigstens teilweise zu den
Server-Mitteln 1 (unmittelbar) nach der Programmierung,
aber vor der Aufzeichnung übertragen,
z. B. über
eine Telefonleitung. Die Server-Mittel 1 vergleichen die
empfangenen Pro grammier-Informationen mit Daten in ihrem Programmarchiv 4,
um den später
gesendeten Film zu identifizieren. Wenn der Film den Server-Mitteln 1 bereits
bekannt ist, z. B. ein Fernsehfilm, aber keine Liveshow, senden
die Provider-Mittel 1 die Gruppe von Mittelwert-Bytes 24 (einen
pro Vollbild) für
den identifizierten Film zu den Aufzeichnungsmitteln. Wenn die Aufzeichnung
später
beginnt, ist das Aufzeichnungsgerät 5 in der Lage, ankommende
Vollbilder mit Videodaten mit den Mittelwert-Bytes 24 zu
vergleichen, die bereits von den Server-Mitteln 1 empfangen
wurden. Daher ist das Aufzeichnungsgerät 5 in der Lage, die
Startzeit, die Endzeit und Unterbrechungen des übertragenen Films zu erkennen.
In diesem Fall zeichnet das Aufzeichnungsgerät 5 nur den Film selbst
ohne Ende einer vorherigen Fernsehübertragung oder Beginn einer
folgenden Fernsehübertragung
oder Reklame auf. Dies minimiert die Erfordernisse an Speicherkapazität. Selbst
eine verzögerte
Fernsehübertragung, z.
B. eine Verzögerung
um eine Stunde, könnte
ohne Probleme aufgezeichnet werden.
-
Wenn
die Server-Mittel 1 nicht die Mittelwert-Bytes des von
dem Benutzer programmierten Films enthalten, die zum Beispiel für eine Liveshow zutreffen
könnten,
senden die Server-Mittel 1 wenigstens den Namen des Films
und vielleicht zusätzliche (auf
den Film bezogene) Informationen, z. B. den Namen des Regisseurs,
den Namen des Produzenten usw., um eine minimale Unterstützung der
Aufzeichnungsmittel 5 vorzusehen.
-
Es
ist ein Vorteil der Erfindung, dass ein vollständiges Archiv der in dem Aufzeichnungsgerät 5 aufgezeichneten
Videodaten erzeugt werden kann. Selbst Informationen über Gruppen von
Videodaten 20, die bereits aufgezeichnet wurden, können dem Archiv
hinzugefügt
werden.
-
Die
Erfindung kann mit weniger zusätzlichen Kosten
für den
Benutzer ausgeführt
werden, weil die Telefonkosten für
die Datenübertragung
zwischen dem Aufzeichnungsgerät 5 und
den Server-Mitteln 1 niedrig sind (weniger als eine Minute
der Telefonverbindung). Nur ein Modem, eine Leitungsverbindung von
dem Aufzeichnungsgerät 5 zu
einem örtlichen Telefon
und einige zusätzliche
integrierte Schaltungen sind notwendig. Wenn das Aufzeichnungsgerät 5 Teil
eines Heim-Netzwerks ist, das bereits ein Modem enthält, könnte das
Aufzeichnungsgerät
dieses Heimnetz-Modem benutzen.