-
GEBIET DER
ERFINDUNG
-
Diese
Erfindung betrifft das Gebiet von Datenverteilungssystemen und umfaßt ein in
dem System der Datenverteilung vorhandenes Verfahren, um die Effizienz
der Datenübertragung
zu verbessern, um dadurch die Speicheranforderungen eines Teilnehmernetzwerk-Endgeräts zu verringern.
Dieses ermöglicht
die Implementation des Teilnehmernetzwerk-Endgeräts als eine einfache preiswerte
Endgerätvorrichtung,
welche eine Schnittstelle zu einem sich ständig veränderndem und die Kapazität erweiterndem
Datenverteilungssystem bilden kann und trotzdem den Teilnehmer mit
der notwendigen Information versorgen kann, um effizient auf die Fülle der
verfügbaren
Daten für
den Teilnehmer über
das Datenverteilungssystem zuzugreifen.
-
STAND DER
TECHNIK
-
WO
95/15658 offenbart einen Netzwerkmanager, welcher Kabelkopfstationskomponenten
und Set-Top-Endgeräte
in einem Fernsehprogrammverteilungssystem überwacht und verwaltet. Es
werden Kundenmenüs
bereitgestellt, welche dem Kunden verfügbare Programme vorschlagen,
welche wahrscheinlich auf der Basis historischer Daten der von dem
Teilnehmer zuvor betrachteten Programme wahrscheinlich von Interesse
sind.
-
PROBLEM
-
Es
ist ein Problem auf dem Gebiet der Datenverteilungssysteme, einen
Teilnehmer mit einer einfachen preiswerten Endgerätvorrichtung
auszustatten, welche eine Schnittstelle zu einem sich verändernden
Datenverteilungssystem bereitstellen und trotzdem den Teilnehmer
mit der Information vorsorgen kann, welche erforderlich ist, den
Teilnehmer in die Lage zu versetzten, effizient auf die Fülle der
für den
Teilnehmer verfügbaren
Daten über
das Datenverteilungssystem zuzugreifen. Die interessierenden Datenverteilungssysteme
sind typischerweise Kabelfernseh-(CATV)- oder Digitale Rundfunksatelliten-(DBS – Digital
Broadcast Satellite)-Systeme, welche gleichzeitig Multimediadaten ströme auf einer
Vielzahl von Kanälen
zu einem Teilnehmerendgerätadapter
senden, welcher bezüglich
Speicher und Funktionalität
eingeschränkt
ist, und welcher die Funktion hat, einen ausgewählten von der Vielzahl von
Rundfunkkanälen
für die
Anzeige auf einer Anzeigevorrichtung, wie z. B. auf einem Teilnehmerfernsehgerät anzuzeigen.
Zusätzlich
verfügt
das Internet über
die inhärente
Fähigkeit
in diese Klasse von Datenverteilungssystemen aufgrund seiner Fähigkeit,
Daten an eine verteilte Klientel zu verteilen, einbezogen zu werden.
-
In
den 1960-ern und 1970-ern waren die Datenübertragungsmöglichkeiten
eingeschränkt,
und daher waren nur die Auswahl von wenigen Rundfunkkanälen für einen
Teilnehmer eines CATV- oder DBS-Netzwerks verfügbar. Derzeit stellen typische
DBS- und CATV-Netzwerke
mehrere zehn Kanäle
bereit, und es wird erwartet, dass in der nahen Zukunft Hunderte
von Kanälen
gleichzeitig an die Teilnehmer über
CATV- und DBS-Netzwerke gesendet werden. Dieses ist sowohl aus der
Perspektive von Teilnehmern als auch Inhalteanbietern erwünscht, da
zunehmend spezialisierte Information erzeugt, unterteilt und an
ausgewählte
Gruppen von Teilnehmern geliefert werden kann, deren Interessen
mit dem Inhalt der gesendeten Information übereinstimmen. Ein unerwünschtes
Nebenprodukt dieser Fülle
von Information ist die Informationsüberlastung, und ein Großteil der
Teilnehmerzeit wird durch "ständiges Kanalumschalten" verschwendet. Dieses
ständige
Kanalumschalten stellt den Versuch des Teilnehmers dar, relevante
und/oder interessierende Information aus der Welt der Rundfunkinformation
zu lokalisieren, die durch methodisches Umschalten zwischen den
verfügbaren
Rundfunkkanälen
verfügbar
ist. Dieser Prozess ist ineffizient und stellt eine erhebliche Reduzierung
der an den Teilnehmer gelieferten Information aufgrund des Unvermögens des
Teilnehmers dar, die gewünschte
Information rechtzeitig zu lokalisieren.
-
Ein
Problem bei der Lieferung von Information an Teilnehmer ist die
Implementation der Netzwerkschnittstellenvorrichtung des Teilnehmers,
welche es dem Teilnehmer ermöglicht,
eine Schnittstelle zu dem Datenverteilungssystem aufzubauen. Es
gibt verschiedene Szenarien für
die Teilnehmernetzwerk-Schnittstellevorrichtung. Eine besteht in
der Verwendung von intelligenten, hochfunktionalen Vorrichtungen,
wie z. B. Personal-Computern.
Dieses ist derzeit ein unwahrscheinliches Szenario aus drei Gründen. Erstens
sind Personal-Computer in weniger als 30% von US-Haushalten vorhanden,
während
CATV derzeit in 65% der Haushalte vorhanden ist. DBS besitzt eine
niedrigere Durchdringung als die Personal-Computer oder CATV-Systeme (derzeit
weniger als 5%), soll aber mit der Zeit zunehmen. Das Problem mit
der Notwendigkeit des Kaufs einer relativ teueren Teilnehmernetzwerk-Schnittstellenvorrichtung
besteht darin, dass sie den Stückzahlenverkauf verhindert,
indem sie das Marktpotential stark einschränkt. Zweitens ist der Personal-Computermarkt
durch Komponentenanbieter gekennzeichnet, welche darum konkurrieren,
Technologien zu verkaufen, wie z. B. Netzwerkadapter und Monitore.
Zusätzlich
sind viele Personal-Computer aus Komponenten zusammengesetzt, welche
von verschiedenen Lieferanten gefertigt werden, und das sich ergebende
Produkt wird an Verbraucher mit spezieller Preis/Leistungs-Charakteristik
verkauft. Dieses erzeugt eine nahezu ungeeignete Umgebung vom Gesichtspunkt
des Entwurfs einer Teilnehmernetzwerk-Schnittstellenvorrichtung
mit breit gestreuter Anwendbarkeit, welche von einem Geschäftsgesichtspunkt
aus für
CATV-Kosten erforderlich ist. Unterschiedliche Softwareversionen
und deren inkompatiblen Anforderungen verkomplizieren ferner die
Interoperabilität.
Drittens verstärkt
die Verwendung eines Personal-Computers ferner das Risiko des bei
VCRs (Videorekordern) zu sehenden Phänomens der "blinkenden 12:00", da die Komplexität des Personal-Computers, wenn
er als die Teilnehmer-Schnittstellenvorrichtung verwendet wird,
technologisch eingeschränkte
Teilnehmer daran hindert, Zugriff auf die Information zu erlangen.
-
Ein
wesentlich wahrscheinlicheres Szenario ist die Verwendung eines
spezialisierten Endgerätadapters,
welcher derzeit auf dem Gebiet der Medien als eine "Set-Top-Box" (Aufsatzgerät) bezeichnet
wird. In diesem Szenario umfaßt
die Teilnehmer-Schnittstellenvorrichtung
ein Standardfernsehgerät,
welches mit einem Endgerätadapter
ausgerüstet
ist, welcher für
die Aufgabe des Zugriffes auf Multimediadatenströme für den Teilnehmer spezialisiert
ist, und diese Information über
das Fernsehgerät
präsentiert.
Dieser Endgerätadapter enthält Mikroprozessoren
sowie jede Logik, die für
die Auswahl, Dekomprimierung und Demultiplexierung der derzeit gesendeten
Multimediadatenströme
erforderlich ist. Der Endgerätadapter
bearbeitet auch Außer-Band-Signalisierungsaufgaben,
wie z. B. den Autorisierungszugriff auf eingeschränktes Material
und die Ausführung
jedes für
eine Teilnehmer/Serviceanbieter-Interaktion erforderlichen Protokolls.
Mehrere widerstreitende Faktoren sind bei der Optimierung des Endgerätadapters
am Werk. Erstens muß,
da in vielen Fällen Dienstkosten
durch den Dienstanbieter entstehen, und Dienstausfälle die
Teilnehmer verärgern,
der Endgerätadapter
robust sein. Zweitens muß der
Endgerätadapter
flexibel genug sein, um sich an jedes vorhersehbare Informationslieferungsszenario
innerhalb der Begrenzungen der DBS- oder CATV-Infrastrukturen anzupassen. Schließlich muß der Endgerätadapter
preiswert genug sein, um innerhalb der Möglichkeiten eines Teilnehmerkaufes
oder einer schnellen Kostenamortisierung durch Leasing für den Teilnehmer
zu liegen. Es ist wichtig anzumerken, dass in dem letzteren Szenario,
obwohl die Kosten über
eine erhebliche Zeitdauer amortisiert werden können, die monatliche Rechnung
für den
Teilnehmer nicht die Kosten von Filmmietgebühren überschreiten sollte, oder in
Hinblick auf staatliche Aufsichtsbehörden zu teuer sein sollte.
-
Der
Endgerätadapter
enthält
sowohl einen Prozessor als auch Speicher, welcher einen größeren Kostenfaktor
darstellt. Dieser Speicher unterstützt die Speicherung und Verarbeitung
von Daten und für
viele Berechnungsanwendungen besteht der einfachste Weg, eine Berechnungsanwendung
zu beschleunigen, in der Hinzufügung
von mehr Speicher. Leider gibt es mehrere Faktoren, welche die Ausrüstung des
Endgerätadapters
mit erheblichem Speicher ausschließen. Der erste besteht in den
Kosten des Speichers, welche sich sowohl aus der Menge des erforderlichen
Speichers als auch den Typ der für
den Endgerätadapter
erforderlichen Teile ergibt. Nicht-flüchtige RAMs sind für wenigstens
einen Teil des Datenspeichers erforderlich, um mit Auswirkungen
auf die Zuverlässigkeit
aufgrund von Netzausfällen
oder von Teilnehmern, welche den Netzadapter abtrennen, fertig zu
werden. Der zweite Faktor besteht in der Notwendigkeit eine Aktualisierung
der Hardware des Endgerätadapters
zu vermeiden, da diese eine teuer zu implementierende Operation
ist. Eine Informationsverteilungsarchitektur, welche sehr viel Speicher
bei dem Endgerätadapter
erfordert, zwingt die Techniker zur regelmäßigen Ausführung von Aktualisierungen
am Ort des Teilnehmers, da frühere
Installationen veralten.
-
CATV-"Convertor"-Boxen der neuen
Generation stellen Speicherplatz für Information bezüglich aktueller
Rundfunk- oder hinzukommender Programme (oder allgemeiner, Multimediaströme) bereit.
Die Speicherung dieser "Programmführungs"-Information in dem
Endgerätadapter
ist mit der Größenordnung
von 170 kByte ziemlich speicherintensiv, und wird mit der Zunahme
in der Kanalverfügbarkeit
Vergrößerungen
erfordern, welche proportional zu der Anzahl zusätzlicher Kanäle sind.
Der in dem Endgerätadapter
erforderliche große
Speicher ist eine Folge des Mangels an Information über den
Geschmack und die Interessen des Zuschauers, welche dazu genutzt
werden könnte, um
Untersätze
einer deskriptiven Information für
die lokale Speicherung in dem Endgerätadapter auszuwählen. Da
keine derartige Information zur Verfügung steht, muß die gesamte
Indexierungs- und Deskriptionsinformation bezüglich der Vielfalt gleichzeitiger
Rundfunkprogramme gesendet und in dem Speicher des Endgerätadapters
gehalten werden. Daher gibt es derzeit keine effektive Endgerätadapter/Datenverteilungs-Systemarchitektur
oder einen Betrieb, welche den Bedarf des Teilnehmers, eine Programmführungsinformation
in dem Endgerätadapter
zu haben und trotzdem sparsam in der Nutzung von teurem Speicher
ist, zu befriedigen.
-
Eine
weitere Anwendung dieser Technologie ist das Gebiet des Datenabrufs,
wobei der Teilnehmer Daten spezifischer Natur statt Standardrundfunkprogrammware
anfordert. In diesem Falle muß das
Informationsverteilungssystem unterscheiden, welche Information
von dem Teilnehmer angefordert wird und einen effizienten Mechanismus
zur Lieferung dieser Information bereitstellen. Die Lieferung derartiger
Information ist kompliziert, wenn der Teilnehmer mobil ist und Information
aus einer Informationsquelle anfordert, welche nicht die "Heimatort"-Informationsquelle
des Teilnehmers ist. Derartige Fälle
umfassen zellulare Kommunikations- oder persönliche Kommunikationssystemanwendungen
sowie die Anwendung des allgemeinen Internetzugangs. Der Teilnehmer
kann auf jeden dieser Dienste von jeder physikalischen Stelle aus
zugreifen, indem er eine Verbindung zu einem lokalen Anbieter derartiger
Dienste herstellt. Die von dem Teilnehmer angeforderte Information
kann ortsspezifisch sein, oder kann tageszeitspezifisch sein, und
die existierenden Informationsverteilungssysteme können derartige
spezifische Anfragen nicht in einer Weise erzeugen, welche für den Teilnehmer
zweckmäßig ist.
-
LÖSUNG
-
Die
vorstehenden Probleme werden gelöst
und ein technischer Fortschritt auf diesem Gebiet durch das Verfahren
der Optimierung der Kommunikation der vorliegenden Erfindung gemäß Definition
in Anspruch 1 erreicht. Die zugrundeliegende Architektur des Datenverteilungssystems
ist typischerweise ein hierarchisches Netzwerk, wie z. B. Kabelfernsehen.
Das Datenverteilungssystem stellt daher eine hierarchische Filterung
des Dateninhaltes der von einem Teilnehmer angeforderten oder für diesen
verfügbaren
Information bereit, um die zur Erfüllung einer Teilnehmerinformationsanforderung
erforderliche effektive Bandbreite zu verringern.
-
In
den Ausführungsformen
baut, um diese effektive Filterung zu erreichen, dieses Datenverteilungssystem
automatisch sowohl ein Zielprofil für jedes Zielobjekt (Programm
oder Informationsreaktion) auf, das gesendet wird, sowie ein "Zielprofilinteressenzusammenfassung" für jeden
Teilnehmer, wobei diese Zielprofilinteressenzusammenfassung den
Interessegrad des Teilnehmers an verschiedenen Typen von Zielobjekten beschreibt.
Das Datenverteilungssystem bewertet dann die Zielprofile gegenüber den
Zielprofilinteressenzusammenfassungen des Teilnehmers, um eine Teilnehmer-spezifische
Rangfolgenliste von Zielobjekten zu erzeugen, welche höchstwahrscheinlich
für jeden
Teilnehmer von Interesse sind, so dass der Teilnehmer aus diesen
möglicherweise
relevanten Zielobjekten auswählen
kann, welche automatisch durch dieses System aus der Fülle von
in dem Datenverteilungssystem verfügbaren Zielobjekten ausgewählt wurden.
Die Zielobjekte selbst werden in eine Vielzahl von Informationssegmenten
unterteilt, was es dem Datenverteilungssystem ermöglicht,
den Teilnehmer mit verarbeitbaren Datenmengen zu versorgen. Diese
Inhalt-basierenden Ähnlichkeitsmaße helfen
bei der Ermittlung der an den Teilnehmer zu übertragenden Informationssegmente
und deren Reihenfolge bei der Übertragung.
Die Ähnlichkeitsmaße können auch
zum Vorabholen von Informationssegmenten und Liefern dieser Segmente
an den Teilnehmer in einer Bandbreite einsparenden Weise genutzt
werden. Diese Fähigkeit
ist auf mobile Anwender erweiterbar, welche den Ort wechseln, und
die Lieferung von ortsspezifischer Information als eine Funktion
ihres sich verändernden
Ortes benötigen.
-
Diese
Architektur bietet mehrere Vorteile. Erstens können Technologieaktualisierungen
in dem Kern des Datenverteilungsnetzwerkes durchgeführt werden,
ohne eine Zugriff auf Teilnehmerendgerätvorrichtungen zu erfordern.
Zweitens ergeben sich signifikante Einsparungen bei der Datenspeicherung,
welche aus der Multiplexierung dieser Verzeichnisinformation über die
Teilnehmerpopulationen resultiert. Drittens kann sogar eine extrem
eingeschränkte
Speichermenge in dem Endgerätadapter
komplexe Informationsströme
und Teilnehmerinteressen mit vollständiger Allgemeinheit aufgrund
der Segmentierung der Zielobjekte handhaben.
-
In
der Ausführungsform
besteht das Datenverteilungssystem aus Clients, welche die Endgerätadapter mit
extrem eingeschränkter
Datenspeicherkapazität
sind, und aus Servern, welche Daten, wie z. B. Multimediainformation
(wie etwa Lifeprogrammzuspielun gen und/oder Video-on-Demand) und
deskriptive Information (Verzeichnisinformation, Pläne, Indizes)
für die
Multimediainformation enthalten. Die Clients werden als unter der
physikalischen Kontrolle der Teilnehmer stehend betrachtet, während die
Server in die physikalische Infrastruktur des Datenverteilungssystems
eingebettet sind. Der Schlüssel
zu einer Architektur mit eingeschränkter Datenspeicherung sind
die intelligente Nutzung eines lokalen Speichers, optimierte Speicherdurchsatzverwaltungsalgorithmen,
die Nutzung von Zielprofilinteressenzusammenfassungsinformation
und der Rückgriff
auf ein Kommunikationsprotokoll zwischen dem Client und Server,
um den lokalen Speicher über
Serveraktualisierungen und Clientanforderungen zu aktualisieren.
Dieses führt
zu einer verteilten Architektur für Verzeichnisinformation, welche
gegenüber
Veränderung
robust ist, preiswert ist, und die CATV/DBS-Infrastruktur selbst nutzt,
um diese Eigenschaften zu bewahren. In der Praxis ist der Client
der Endgerätadapter,
welcher aus der "Set-Top-Box" besteht. Der von
dem Server verwendete allgemeine Algorithmus zum Bereitstellen der
Verzeichnisinformation für
den Client ist wie folgt:
- 1. Wenn neue Verzeichnisinformation
in den Server geladen wird, lädt
der Server die Information in eine Plandatenstruktur. Wenn diese
Information eine Aktualisierung einer zuvor empfangenen Verzeichnisinformation
darstellt, werden die Empfänger
der vorherigen Verzeichnisinformation (die "Kopiegruppe") informiert, dass sie diese zuvor empfangene
Verzeichnisinformation löschen
sollten. Dieses stellt sicher, dass, die bei jedem Client gespeicherte
Verzeichnisinformation, obwohl sie nicht notwendigerweise vollständig ist,
korrekt ist.
- 2. Wenn der Server eine Anforderung von einem Client für Verzeichnisinformation
empfängt,
erhält
er die aktuellste Verzeichnisinformation aus seinem eigenen Speicher
und sendet diese an den Client.
- 3. Der Server sendet periodisch eine Tageszeit- und Datumsanzeige
an das Clientsystem, um eine Synchronisation zwischen dem Client
und dem Server sicherzustellen. Auf diese Weise stellt das Datenverteilungssystem
eine Synchronisation mit den Teilnehmerendgerätadaptern sicher und stellt
sicher, dass die darin gespeicherte Verzeichnisinformation auf aktuellen
Werten gehalten wird. Die Verwendung der Teilnehmerzielinteressenprofilzusammenfassungsfilterung
von Rundfunkprogrammen reduziert deutlich die Menge der in dem Speicher
des Teilnehmerendgerätadapters
zu speichernden Verzeichnisinformation und hat trotzdem die Funktion,
den Teilnehmer zu interessierenden Programmen in einer effizienten
Weise zu führen.
-
Im
Falle von anderer Information als Rundfunkprogrammen verwendet das
System die Teilnehmerprofilinteressenzusammenfassung für den Teilnehmer,
um zu ermitteln welche Information für den Teilnehmer von Interesse
ist. Diese Daten können
dazu verwendet werden, Ähnlichkeitsmaße zu erzeugen,
um ein intelligentes Vorabspeichern von Daten für die Übertragung an den Teilnehmer
zu implementieren. Die Reihenfolge sowie der Inhalt der an den anfordernden
Teilnehmer übertragenen
Daten wird variiert, um den Wirkungsgrad der Datenübertragung
bei den gegebenen Einschränkungen
der Übertragungsbandbreite
zu maximieren. Für
mobile Teilnehmer kann das System die Informationslieferung als
eine Funktion des Ortes des Teilnehmers spezifisch durchführen, und
ebenfalls die Daten an einem Ort in Vorwegnahme der Ankunft des
Teilnehmers im voraus speichern.
-
KURZBESCHREIBUNG DER ZEICHNUNGEN
-
1 stellt in Blockdiagrammform
eine typische Architektur eines Multimediaverteilungssystems mit einem
darin eingebauten Kundenpräferenzprofilsystem
dar;
-
2 stellt in Flußdiagrammform
das Verfahren der Erzeugung einer Übereinstimmungsmatrix dar;
-
3 stellt in Flußdiagrammform
das Verfahren der Auswahl virtueller Kanäle dar;
-
4 stellt in Blockdiagrammform
einen typischen Teilnehmerendgerätadapter
dar, der in Verbindung mit dem System von 1 verwendet wird;
-
5 stellt in Blockdiagrammform
die Software/Firmware-Architektur des typischen Teilnehmeradapters
von 4 dar;
-
6 stellt in Flußdiagrammform
den Betrieb des Ähnlichkeitsermittlungsprozesses
dar;
-
7 stellt in Flußdiagrammform
den Betrieb des Programmabgleichungsprozesses dar;
-
8 stellt die Bandbreitennutzung
des Datenverteilungssystems dar; und
-
9 und 10 stellen verschiedene Client-Server-Zwischenverbindungen
dar.
-
DETAILLIERTE
BESCHREIBUNG
-
1 veranschaulicht in Blockdiagrammform
eine typische Architektur des Datenverteilungssystems der vorliegenden
Erfindung. Das Datenverteilungssystem besteht aus Clients, welche
in den Endgerätadaptern 112 mit
extrem eingeschränkter
Datenspeicherkapazität
gespeichert sind, die sich in den Räumlichkeiten des Teilnehmers
befinden, und aus Servern, welche Datenverarbeitungs- 100,
Datenübertragungs- 108 und Datenspeicherungselemente 110 in
dem Netzwerk sind, (welche an der Kopfstation angeordnet sein könnte) welche
sowohl Multimediainformation, wie z. B. Lifezuspielungen als auch
Video-on-Demand) und deskriptive Information (Verzeichnisinformation,
Pläne,
Indizes) für
die Multimediainformation enthalten. Es wird angenommen, dass sich
die Clients unter der physikalischen Kontrolle des Teilnehmers befinden,
während
die Server in der physikalischen Infrastruktur des Datenverteilungssystems
eingebettet sind. Die Basisnetzwerkstruktur, welche die Clients
und Server ist ein Netzwerk mit einer Multisend-Abwärtsverbindung
hoher Bandbreite/Einzelsende-Aufwärtsverbindung niedriger Bandbreite.
Diese Bandbreiteneinschränkungen
sind Gegenstand der praktischen Implementation, und die Ungleichheit
der Bandbreite in den Abwärts-
und Aufwärtsverbindungen
ist keine technologische Notwendigkeit.
-
Das
Datenverteilungssystem kann nutzbringend im Zusammenhang mit Set-Top-Box-ähnlichen Vorrichtungen wie
z. B. PDAs (Personal Digital Assistant) oder Netzwerkcomputern oder
Personal-Computern die als eine Form einer Set-Top-Box verwendet
werden, als ein Verfahren zur Reduzierung der von den Nutzern beobachteten
Reaktionszeit verwendet werden. V. N. Padmanabhan und J. C. Mogul
offenbarten in einem Artikel mit dem Titel "Using Predictive Prefetching to Improve
World Wide Web Latency",
ACM SIGCOMM Computer Communication Review, July 1996 ein Verfahren
zum Vorabholen von in dem Viper Text Transport Protokoll (HTTP)
des Internet basierenden World Wide Web gespeicherter Information.
Im wesentlichen verwendet das Verfahren "Links" auf andere in einer Datei mit HTTP-Format
eingebettete Dokumente als Hinweise, dass diese Links bei dem Vorabholen
von Daten verwendet werden sollten; d. h., die durch die Links angegebenen
Dokumente sollten in Vorwegnahme des Wunsches des Benutzers geholt
werden, um den Links auf diese Dokumente zu folgen. Das Datenverteilungssystem
stellt zwei Verbesserungen für
dieses Verfahren dar. Erstens stellt es eine technologische Einrichtung
bereit, mittels welcher vorab geholte Daten mit Bedarfsdaten vermischt
werden können,
um insgesamt Verbesserungen in der Reaktionszeit auf eine große Population
von HTTP/WWW-Benutzern mit reduzierten Speicheranforderungen bereitzustellen.
Zweitens stellt das Datenverteilungssystem, welches die Abwärtsverbindung
als eine feste Kapazitätsressource
betrachtet, ein allgemeines Planungsverfahren bereit, das Techniken,
wie z. B. Benutzerpräferenzen
verkörpert,
um Vorabholungen auszuführen,
wenn Schlitze oder Bandbreiten nicht vollständig ausgenutzt sind, um preemptiv
den weiteren Bedarf nach Bandbreite zu reduzieren. Die allgemeine
Technik der Nutzung eines Ähnlichkeits-informierten Vorabholens
ist ausführlich
in der gleichzeitig anhängigen
Patentanmeldung mit dem Titel "Pseudonymous Server
For System For Customized Electronic Identification Of Desirable
Objects", U.S. Anmeldung
Ser. No. 08/550,886, eingereicht am 31. Oktober(Ser. Nr.
US 5,754,938 ) beschrieben.
-
Grunddefinitionen
-
Relevante
Definitionen von Begriffen für
den Zweck dieser Beschreibung umfassen: (a) ein für den Zugriff
durch den Teilnehmer verfügbares
Objekt, welches typischerweise elektronischer Natur ist, wird als
ein "Zielobjekt" bezeichnet, (b)
ein digital dargestelltes Profil, das Attribute des Zielobjektes
anzeigt, wird als ein "Zielprofil" bezeichnet, (c)
ein Profil, das die Attribute eines Teilnehmers enthält, wird
als ein "Teilnehmerprofil" bezeichnet, (d)
eine Zusammenfassung digitaler Profile von Zielobjekten, die ein
Teilnehmer bevorzugt und/oder nicht bevorzugt, wird als "Teilnehmerzielprofilinteressenzusammenfassung" dieses Teilnehmers
bezeichnet, (e) eine Sammlung von Zielobjekten mit ähnlichen
Profilen wird als eine "Gruppierung" bezeichnet, (f)
ein zusammengesetztes Profil, das durch Mittelung der Attribute
aller Zielobjekte in einer Gruppierung gebildet wird, wird als ein "Gruppierungsprofil" bezeichnet. In dem
hierin beschriebenen CATV/DBS-Beispiel wird der Begriff "Programm" anstelle von "Zielobjekt" zur Verdeutlichung
der Beschreibung verwendet.
-
Netzwerkelemente
und Systemeigenschaften
-
Die
durch das Datenverteilungsnetzwerk N gemäß Darstellung in 1 miteinander verbundenen
verschiedenen Elemente können
in zwei Klassen unterteilt und wie in 1 dargestellt
in Client und Server gruppiert werden. In dem CATV-Beispiel besteht
die Vielzahl der Clients jeweils aus einem einzelnen Teilnehmerendgerätadapter 112,
welcher mit Servern 102 (Programmquellen) über Datenkommunikationsverbindungen verbunden
ist. Die Clients sind typischerweise nicht kontinuierlich on-line,
da sie typischerweise nur einen einzigen Teilnehmerhaushalt versorgen
und das Nutzungsmuster eine Funktion der Teilnehmeraktivität ist. Ein Server 102 ist
typischerweise ein Programmquellensystem, von dem angenommen wird,
dass es kontinuierlich on-line ist, und die Funktion hat, entweder
eine Reihe von Programmen in einer vorbestimmten Reihenfolge zu
senden oder ein spezifisch von einem Teilnehmer gewähltes Programm
zu empfangen und zu senden (Video-on-Demand). Der Server 102 ist
mit einem Dauerspeicher, wie z. B. einem Magnetband- oder Magnetplattendatenspeichermedium
ausgestattet, und ist mit Clients über Datenkommunikationsverbindungen
verbunden. Die Datenkommunikationsverbindungen können eine beliebige Topologie
und Architektur aufweisen, und werden hierin für den Zweck der Vereinfachung
als eine typische Kabelfernsehen-Topologie
beschrieben. Insbesondere ist die vorliegende CATV-Architektur eine
Kabelanlage, welche ein Rundsendefernsehen emuliert. Sie kann in
allen praktischen Aspekten als ein Baum betrachtet werden, aus welchem
Information von den Teilnehmern bei den Blättern entnommen und von der
Programmquelle bei der Wurzel eingegeben wird. Beispielsweise ermöglicht die
Installation einer Satellitenschüssel
an der Wurzel des Netzwerkes, welche die restliche Infrastruktur
speist, das Multiplexieren des Ausgangssignals der Satellitenschüssel über eine
Anzahl von über Koaxialkabel
angeschlossene Teilnehmer. Ein digitales Rundsendesatellitensystem
kann ebenfalls als ein ziemlich flacher Baum (mit der Wurzel im
Orbit) betrachtet werden, welcher von mehreren Quellen gespeist wird.
-
In
dem Kabelfernsehsystem erzeugt eine Vielzahl von Programmquellen 102 Programme,
welche mittels einer Vielzahl von Kanalmodulatoren 104 moduliert
und an ein Verteilungssystem 108 übertragen werden. Das Verteilungssystem 108 ist
Teil eines Kopfendes 100, welches die empfangenen Programme über entsprechende
Knoten 110 wieder an Teilnehmerendgerätadapter 112 überträgt. Die
Teilnehmerendgerätadapter 112 enthalten
Software und das Kopfendesystem 100 enthält ebenfalls
Software die in einer Systemsteuerung 106 vorhanden ist,
um zu ermitteln, welche Programme wahrscheinlich für jeden
Teilnehmer von Interesse sind. Diese Programmauswahlsoftware steuert
die Programmierung der virtuellen Kanäle zu dem Teilnehmerendgerätadapter 112,
um zwischen einer Vielzahl von Kanälen auszuwählen, welche über das
Netzwerk N an das Kopfende 100 gesendet werden. Der Teilnehmer
kann den Teilnehmerendgerätadapter 112 dazu
verwenden, um aus den automatisch erzeugten virtuellen Kanälen oder
von dem Kopfende 100 aus verfügbaren tatsächlichen Kanälen auszuwählen.
-
Eine
passive Rückmeldung
bezüglich
Teilnehmerpräferenzen
zur Verwendung bei einer zukünftigen Programmplanung
kann in diesem Datensystem über
ein Teilnehmerdatensammelelement 114, welches mit dem Kopfende 100 verbunden
ist, integriert sein. In dieser Ausführungsform kann die Erzeugung
einer Zielprofilinteressenzusammenfassung für einen Teilnehmer bei dem
Kopfende 100 implementiert sein, was es dem Kopfendebetreiber
ermöglicht,
festzustellen, welche Programmierung durch die Sammlung der Teilnehmer
gewünscht
ist, oder sie kann in dem Endgerätadapter 112 des
Teilnehmers implementiert sein. In dem ersteren Fall wirkt die Programmauswahlsoftware
als ein Filter, um die Erzeugung virtueller Kanaldaten bei dem Teilnehmerendgerätadapter 112 zu
ermöglichen.
Die Rücklaufsignale
zu dem Kopfende 100 können über das CATV-System oder über Telefonleitungen 10 unter
Verwendung eines drahtgebundenen Rücklaufpfades zur Datensammlung
transportiert werden. Somit ist die Grundnetzwerkstruktur, welche
die Clients und Server verbindet, ein Netzwerk mit einer Multisende-Abwärtsverbindung
hoher Bandbreite/Einzelsende-Aufwärtsverbindung niedriger Bandbreite.
-
Obwohl
sich die vorstehende Beschreibung auf das Gebiet der Kanalauswahl
in einem CATV-Rundsendefernsehen-Aufbau konzentriert, kann die Vielzahl
von Kanälen,
welche durch digitale Technologie und Kompressionstechnologie ermöglicht wird,
die Nutzung dieser Kanäle
in einem Modus nahezu wie in einem tatsächlichen "Video-on-Demand"-(VoD)-System
ermöglichen.
Die Vielzahl von Kanälen
könnte
in einem "Frequenzsprung"-Modus (aus der Perspektive
jedes gegebenen Stroms) genutzt werden, um einen Zugriff auf bündelartige
Daten, wie z. B. MPEG-komprimierte Videoströme zu ermöglichen. Die deskriptive Information könnte für die Programmauswahl,
Darstellung und zur kundenspezifischen Anpassung der Auswahl und
Planung des Programms verwendet werden.
-
Teilnehmerendgerätadapter
-
4 veranschaulicht in Blockdiagrammform
die Gesamtarchitektur eines typischen Teilnehmerendgerätadapters
für die
CATV-Anwendung, während 5 die Architektur der darin
befindlichen Software/Firmware darstellt. Insbesondere werden die
Programmmaterialien, die entsprechende Programminhaltsprofil/Verzeichnis-Information
von dem Kopfende 100 über
einen Tuner 402 bei dem Datenempfänger 404 empfangen. Alternativ
kann die Inhaltsprofil/Verzeichnis-Information über einen speziellen Datenkanal
(dargestellt durch die gestrichelte Linie in 4) empfangen werden, welche den Tuner 402 umgehen
kann. In jedem Fall kann die Programminhaltsprofil/Verzeichnis-Information,
die empfangen wird, ein Untersatz von Materialien sein, die an dem
Kopfende 100 verfügbar
sind, wobei die Materialien einen Auszug der verfügbaren Information
darstellen, die mit der Zielprofilinteressenzusammenfassung für diesen
Teilnehmer moduliert ist.
-
Wenn
die von dem Kopfende 100 gesendeten Programmaterialien
verschlüsselt
sind, werden die verschlüsselten
empfangenen Programmaterialien von dem Tuner 402 an den
Entschlüssler 416 übertragen,
bevor sie durch den Prozessor 406 verarbeitet und/oder
von dem Modulator 418 für
die Anzeige moduliert werden. Wenn der Tuner 402 einen
von den gleichzeitig gesendeten Kanälen empfängt, wird die Inhaltsprofil/Verzeichnis-Information
an den Prozessor 406 entweder direkt geliefert, wenn das
empfangene Programm die Inhaltsprofil/Verzeichnis-Information in
ihrem vertikalen Austastintervall enthält, oder über den Datenempfänger 404.
Der Prozessor 406 überprüft die dem
Programmaterial zugeordnete Inhaltsprofil/Verzeichnis-Information, um
zu ermitteln, ob eine Übereinstimmung
zwischen dem Zielprogramm für
dieses Programmaterial und der Teilnehmerzielprofilinteressenzusammenfassung
vorliegt. Eine Eingabe seitens des Teilnehmers ist über den Teilnehmerendgerätadapter 112 möglich, welcher
Anzeigemenüs über eine
Bildschirmmenüvorrichtung 414 erzeugt,
und dem eine Fernbedienungsvorrichtung 408 und einen Infrarotempfänger 410 verwendenden
Benutzer, welcher, wie es allgemein auf dem Gebiet der Fernsehtechnik
bekannt ist. Die Teilnehmerzielprofilinteressenzusammenfassung ist
im Speicher 412 gespeichert, und wird dazu genutzt, die
Eignung der verschiedenen gesendeten Programme für den Teilnehmer endgerätadapter 112 sicherzustellen.
Der Prozessor 406 wählt
eine Vielzahl von den empfangenen Programmen als der Teilnehmerzielprofilinteressenzusammenfassung
entsprechend aus und weist diese Programme virtuellen Kanälen für das Betrachten
durch den Teilnehmer zu. Die virtuellen Kanäle werden dem Teilnehmer wie
allgemein bekannt über
das Fernsehgerät
präsentiert.
Der Teilnehmer kann dann einen der virtuellen Kanäle oder
irgendeinen verfügbaren
Kanal zum Betrachten eines von dem Teilnehmer gewählten Programms
auswählen.
-
Eine
Telefonschnittstelle 420 stellt einen Kommunikationspfad
in einem Einzelsendemodus von dem Teilnehmerendgerätadapter 112 zu
dem Kopfende 100 über
die Datensammelschaltung 114 bereit, um dem Prozessor 406 zu
ermöglichen,
die gesammelten Sehgewohnheitsdaten und die Teilnehmerzielprofilinteressenzusammensetzung
aus dem Speicher 412 an das Kopfende 100 zu übertragen.
Die Daten der Teilnehmerzielprofilinteressenzusammenfassung können optional
durch die Verwendung einer Verschlüsselungsvorrichtung 422 vertraulich
gehalten werden, um einen nicht autorisierten Zugriff auf diese
Daten zu verhindern. Zusätzlich
können
die Daten der Teilnehmerzielprofilzusammenfassung an das Kopfende 100 unter Verwendung
eines HF-Modulators 424 zurückübertragen werden, um die bidirektionale
Nutzung der Verbindung des Kopfendes 100/Teilnehmerendgerätadapter 112 zu
ermöglichen.
-
Die
Software/Firmware, welche in dem Teilnehmerendgerätadapter 112 betrieben
werden kann, um die vorstehend beschriebenen Steuerfunktionen auszuführen, ist
in Blockdiagrammform in 5 dargestellt. Insbesondere
wird ein autorisiertes Dienstsegment 502 des Speichers 412 zum
Speichern von Daten verwendet, welche der Teilnehmer als Teil der
Teilnahme an dem CATV-Netzwerk empfangen kann. Die diesen autorisierten
Programmen zugeordnete Inhaltsprofil/Verzeichnis-Informationen sind
in diesem Verzeichnissegment 504 gespeichert, dessen Daten
von dem Prozessor 406 verwendet werden, um die (als Übereinstimmungsmatrix
bezeichneten) Programmlisten zu berechnen, welche der Teilnehmer
wahrscheinlich zu sehen wünscht. Die Übereinstimmungsmatrix 508 ist
im Speicher 412 wie auch eine zugeordnete Tageszeit 510 gespeichert, welche
entweder lokal erzeugt oder von dem Kopfende 100 empfangen
wird. Aus der Übereinstimmungsmatrix 508 berechnet
der Prozessor 406 eine Liste virtueller Kanäle, welche
in die Programmführerliste 514 eingegeben
wird. Die Programmführerliste 514 wird
dem Teilnehmer über
das Teilnehmerfernsehgerät
in allgemein be kannter Weise angezeigt, so dass der Teilnehmer ein
Programm aus den verfügbaren
Auswahlmöglichkeiten wählen kann.
Sobald der Teilnehmer ein Programm aus der Programmführerliste 514 wählt, aktiviert
der Prozessor 406 den Kanalwähler 512 zur Abstimmung
auf den Kanal, welcher das gesendete gewählte Programm enthält. Der
Teilnehmer kann auch die erzeugte Teilnehmerzielprofilinteressenzusammenfassung
betrachten, um dadurch dem Teilnehmer zu ermöglichen, die darin enthaltenen
Daten manuell anzupassen oder zu modifizieren, um Veränderungen
in dem von dem Teilnehmer gewünschten
Sehgewohnheiten zu reflektieren. Die Integrität der Daten der Teilnehmerzielprofilinteressenzusammenfassung
wird durch die Verwendung einer Teilnehmerkennung 518 gewahrt,
welche sicherstellt, dass die Teilnehmereingabevorrichtung 516 nicht
von jemand anders als dem zugeordneten Teilnehmer manipuliert wird.
-
Architektur
der Datenspeicherung
-
Die
Schlüssel
zur Architektur einer eingeschränkten
Datenspeicherung in diesen Datenverteilungssystems sind die intelligente
Nutzung eines lokalen Speichers (Speicher 412), optimiert über Speichermanagementalgorithmen
und den Rückgriff
auf ein Kommunikationsprotokoll zwischen Client and Server zum Aktualisieren
der lokalen Datenspeicherung (Speicher 412) über Serveraktualisierungen
und Clientanforderungen. Dieses führt zu einer verteilten Architektur
für Verzeichnisinformation,
welche in Hinblick auf Veränderung
robust ist, preiswert ist, und die CATV-Infrastruktur selbst nutzt,
um diese Eigenschaften aufrechtzuerhalten. Da der Client der Endgerätadapter 112 in
der Form der "Set-Top-Box" vorliegt, ist der
gesamte von dem Server verwendete Datenverteilungsalgorithmus wie
folgt:
- 1. Wenn neue Verzeichnisinformation
in dem Server geladen wird, speichert der Server die Information
in einer Plandatenstruktur. Wenn diese Information eine Aktualisierung
der zuvor von dem Server empfangenen Verzeichnisinformation darstellt,
werden die Empfänger
der vorherigen Verzeichnisinformation (die "Kopiegruppe") darüber informiert, dass sie die
zuvor empfangene Verzeichnisinformation löschen sollten und sie durch
die neu empfangene Verzeichnisinformation ersetzen sollten. Dieses
stellt sicher, dass die Verzeichnisinformation bei einem Client
korrekt ist, obwohl nicht notwendigerweise vollständig sein
muß.
- 2. Wenn der Server eine Anforderung von einem Client nach Verzeichnisinformation
empfängt,
erhält
er die aktuellste Verzeichnisinformation aus seinem eigenen Speicher
und sendet diese an den Client.
- 3. Der Server sendet periodisch eine Tageszeit- und Datenanzeigeinformation
an das Clientsystem, um eine Synchronisation zwischen dem Client
und dem Server sicherzustellen.
-
Auf
diese Weise hält
das Datenverteilungssystem eine Synchronisation mit den Teilnehmerendgerätadaptern 112 aufrecht
und stellt sicher, dass die darin gespeicherte Verzeichnisinformation
auf den aktuellen Werten gehalten wird. Die Nutzung der Teilnehmerzielinteressenprofilzusammenfassungsfilterung
der Rundfunkprogramme reduziert signifikant die Menge der in dem
Speicher der Teilnehmerendgerätadapter
zu speichernden Information und erfüllt trotzdem die Funktion,
den Teilnehmer in einer effizienten Weise zu interessierenden Programmen
zu führen.
-
Prozess der
Datenübertragung
-
2 stellt in Flußdiagrammform
den Prozess dar, mittels welchem die Verzeichnisinformation an den Teilnehmerendgerätadapter 112 geliefert
und die Übereinstimmungsmatrix
erzeugt wird. Dieser Prozess kann in dem Datenverteilungssystem
oder in dem Teilnehmerendgerätadapter 112 als
eine Funktion der verfügbaren Übertragungsbandbreite
sowie der Datenspeicherkapazität
des Teilnehmerendgerätadapters 112 implementiert
sein. Für
den Zweck dieser Beschreibung wird angenommen, dass der Prozess
insgesamt oder zumindest teilweise in dem Datenverteilungssystem
stattfindet, und insbesondere in der Systemsteuerung 106 des
Kopfendes 108. Der Plan der verfügbaren Programme und deren
Eigenschaften (Inhaltsprofile) wird in einer Datenbank in dem Kopfende 100 bei
dem Schritt 202 erzeugt und gespeichert. Die Teilnehmerzielprofilinteressenzusammenfassungen
werden für
eine vorgegebene Zeitdauer aus dem Teilnehmerendgerätadapter 112 heruntergeladen
und bei dem Schritt 204 in einer Datenbank gespeichert.
Die Teilnehmerzielprofilinteressenzusammenfassungen umfassen die
Präferenzen
des Teilnehmers für
Programme und variieren bevorzugt als eine Funktion der Tageszeit,
was typischerweise eine Funktion der Identität der mehreren Betrachter in
dem Teilnehmerhaushalt ist.
-
Die
mit den elektronischen Programmführerdaten
empfangenen Inhaltsprofile werden mit den Teilnehmer-spezifischen
Präferenzen
(Teilnehmerzielprofilinteressenzusammenfassungen) verglichen, um
eine Übereinstimmungsmatrix
bei dem Schritt 206 zu erzeugen. Sobald die Übereinstimmungsmatrix
erzeugt worden ist, werden die Programme mit den höchsten Werten
für eine
Entsprechung mit den Präferenzen
des Teilnehmers priorisiert und für eine Präsentation an den Teilnehmer
als virtuelle Kanäle
bei dem Schritt 208 ausgewählt. Die Zuordnung virtueller
Kanäle
wird in einer Vorrangreihenfolge verarbeitet, wobei die am meisten
gewünschten Programme
zuerst virtuellen Kanälen
zugewiesen werden, bis alle gewünschten
Programme zugewiesen sind. Jedoch wird die Zuordnung virtueller
Kanäle
beendet, wenn unzureichend virtuelle Kanäle für die Anzahl von durch die Übereinstimmungsmatrix
verglichenen Programmen vorhanden sind. Es ist zu bevorzugen, dass
die Teilnehmerzielprofilinteressenzusammenfassungen und die Inhaltsprofile
aktualisiert werden, um Veränderungen
in den Teilnehmerpräferenzen
sowie die Korrektur von Fehlern in der ursprünglichen Ermittlung zu ermöglichen.
Bei dem Schritt 210 führt
die Systemsteuerung 106 eine Aufzeichnung von Programmen,
auf welche durch den Teilnehmer zugegriffen wurde, und über die
Länge der
Zugriffszeit. Bei dem Schritt 212 werden die Teilnehmerzielprofilinteressenzusammenfassungen
in dem Teilnehmerendgerätadapter 112 aktualisiert.
-
Sobald
die Übereinstimmungsmatrix
erzeugt ist, kann die Auswahl virtueller Kanäle mittels des in dem Flußdiagramm
in 3 dargestellten Prozessors
erreicht werden. Bei dem Schritt 302, Ermitteln, welche Teilnehmerzielprofilinteressenzusammenfassung
für die
zu planende Zeitdauer aktiv ist. Die verfügbaren Programme werden durch
Auswahl eines Untersatzes aller verfügbaren Programme ermittelt,
welcher den Umfang der Programmteilnahme des Teilnehmers anzeigt.
Eine Übereinstimmungsmatrix
wird bei dem Schritt 304 für die verfügbaren Programme erzeugt, und
die beliebtesten Programme für
den Teilnehmer werden ausgewählt.
Bei dem Schritt 306 wird ermittelt, ob alle Teilnehmerpräferenzen
erfüllt
sind, und ob irgendwelche zusätzlichen
Programme verfügbar
sind, um irgendwelche Teilnehmerpräferenzen zu erfüllen, die
verbleiben. Bei dem Schritt 308 wird der Planungsprozess
verlassen, wenn alle Präferenzen
mit verfügbaren
Programmen abgeglichen sind. Falls nicht, wird bei den Schritten 310 und 312 die
Präferenzliste
verkleinert, um diese abgeglichenen Präferenzen zu eliminieren, und
die Verarbeitung kehrt zu dem Schritt 304 zurück.
-
Hintergrund
zum Digitalen Rundfunksatelliten
-
Die
Technologie des Digitalen Rundfunksatelliten (DBS) stellt ein Rundfunknetzwerk
mit asymmetrischen Aufwärts/Abwärts-Verbindungsbandbreiten ähnlich dem
vorstehend beschriebenen CATV-Netzwerk zur Verfügung. Die Technologie beruht
auf relativ, Hochleistungssatelliten in großem Abstand, welche digitale Übertragungsraten
von entweder 30 Mbps (in einem reduzierten Fehlerkorrekturcodemodus
von 30 Mbps für Daten
und 10 Mbps für
eine Schutzcodierung) oder 23 Mbps (in einer robusteren Codierungskonfiguration
mit 23 Mbps für
Daten und 17 Mbps für
Schutzcodierung) erzielen kann. Jede Konfiguration wird mit einem
digital codieren 23 MHz Breitbandsatellitenkanal erzielt.
-
Die
Nutzung des Kanals für
Fernsehsignale wird mittels digitaler Kompressionstechnologien,
entweder dem Motion Picture Experts Group (MPEG) Standard(MPEG-II)
oder durch von der Industrie entwickelten eigene Standards erzielt.
Es liegt ein starker Rückgriff
auf komplexe Echtzeit-Dekompressionstechnologien vor, welche in
den Empfangseinheiten eingebettet sind, welche als das DBS-Analogon
der Set-Top-Box in dem CATV-Bereich betrachtet werden können. Die
Empfangseinheiten sind durch kleine Empfangsschüsseln (18–36'')
gekennzeichnet, welche mit der Analogon der Set-Top-Box über eine
koaxiale Verkabelung oder eine andere Einrichtung verbunden sind.
In der Box arbeitende Dekompressionsalgorithmen wandeln die Rohdigitalsignale
in ein für
die Darstellung auf einem NTSC-Fernsehgerät geeignetes Format um. Die
Algorithmen sind von erheblicher Komplexität und werden mittels Application
Specific Integrated Circuit (ASIC) oder Digital Signal Processor – Technologien
in Kombinationen mit einer weiteren spezialisierten Verarbeitung
implementiert. Die Gesamtkosten von Konfigurationen können auf
unter 1000 $ gebracht werden. Die Kosten der elektronischen Komponenten
nehmen konsistent mit anderen elektronischen Kommunikations- und
Berechnungstechnologien ab, obwohl durch Leistung und Verpackung
definierte Begrenzungen verbleiben und die erreichbaren Endkosten
begrenzen.
-
Die
Speicheranforderungen aller Konfigurationen werden als klein angesehen,
da Fernsehanwendungen als die Hauptanwendungen für die Technologie vorstellbar
sind. Viele von den vorgeschlagenen Systemen (z. B. Primestar, DIRECT
TV/USS, EchoStar und AlphaStar) sind fernsehorientiert, obwohl ein
gewisser Direktzugriff auf die digitalen Ströme über Hochgeschwindigkeitszugriffsports
in einigen Implementationen der Set-Top-Box-Analogons vorliegen. Obwohl
dieses für
zukünftige
Hochauflösungs-(HDTV)-Fernsehanwendungen
gedacht scheint, stellt deren Vorhandensein, eine in Betracht ziehbare
Möglichkeit
dar, diesen Hochgeschwindigkeitsdigitalzugriff in zukünftigen
Konfigurationen zu nutzen. Die Set-Top-Box-Analogons stellen typischerweise
eine RJ11-Buchse
bereit, welche für
eine Kommunikation mit dem öffentlichen
Telefonnetz (PSTN – Public
Switched Telephone Network)) verwendet wird, welches zur Übertragung
von Abrechnungsinformation oder so genannter "Impulse pay-per-view"-Antwortinformation verwendet wird.
-
Dieses
Datenverteilungssystem besteht aus Clients, welche Endbenutzerendgeräte mit extrem
eingeschränkter
Speicherkapazität
(diktiert durch die Faktoren, welche wir vorstehend in dieser Offenbarung
diskutiert haben) und aus Servern, welche Multimediainformation
(wie z. B. Video-on-Demand) und zusätzlich deskriptive Information
(Verzeichnisinformation, Pläne,
Indizes) für
die Multimediainformation enthalten. Von den Clients wird angenommen,
dass sie unter der physikalischen Kontrolle des Kunden stehen, während die
Server in dem DBS-Falle wahrscheinlich mit dem Satellitentransponder
aufwärtsverbunden
sind. Dieses führt
zu einer verteilten Architektur für Verzeichnisinformation, welche
in Hinblick auf Veränderung
robust ist, preiswert ist, und die DBS-Infrastruktur selbst nutzt, um diese
Eigenschaften aufrechtzuerhalten. In der Praxis ist der Client der
Architektur die "Set-Top-Box"-ähnliche Einheit für DBS, welche
wir hier vorstehend diskutiert haben.
-
Spezielle
Betrachtungen für
DBS gegenüber
CATV
-
Es
gibt eine Anzahl von Einschränkungen
des DBS-Systems gegenüber
CATV. Insbesondere sind diese:
- 1. Fehlerraten – Die Eigenschaften
des Funkkanals sind so, dass eine umfangreiche Fehlerschutzcodierung
vorhanden sein muß,
welche bis zu 50% der Kanalkapazität verbraucht. Dies ist ein
Hauptunterschied, beeinflußt
jedoch nicht unsere Architektur.
- 2. Geringe Hierarchienutzung (extrem flaches Netzwerk). Ein
Hauptproblem mit DBS oder Satelliten besteht allgemein darin, dass
es ein Rundsende- und Weitbereichssystem ist. Rundsenden ist nicht
so sehr ein Problem wie der weiter Bereich. Rundsenden ist eine
Spezialisierung von Multisenden, und bedeute de facto, dass alle
interessierten Empfänger
die Information verfügbar
finden. Der Weitbereichsvorteil besteht darin, dass das Satellitenmaterial
weit verteilt werden kann, uns aber nicht die Möglichkeit gibt, Speicherknoten
an Punkten innerhalb des Multisende-Verteilungsbaumes anzuordnen,
da es tatsächlich
KEINE derartigen Punkte gibt.
- 3. Wesentlich geringere Rückkanalbandbreite – CATV bietet
die Möglichkeit
von vernünftigen
Hochleistungskanälen,
welche die Clients verwenden können,
um Zellen zur Aufnahme in ihren Speicherbereichen auszuwählen. Die
erforderliche Sendeleistung schließt die Verwendung von Satelliten-Sender/Empfängern am
Ort des Client aus; es liegen ein Empfänger und eine andere Antworteinrichtung
(z. B. PSTN) vor.
- 4. Interoperabilität – es ist
eine eingeschränkte
Möglichkeit
zur Interoperation mit dem ATM-Zellen-ähnlichen Format möglich, dass
wir in dieser Offenbarung verwendet haben. Eine Überlagerung ist auf dem zugrundeliegenden
digitalen Paketformat unter Verwendung geeigneter Fragmentierungs-
und Reassemblierungsalgorithmen an der Schnittstelle zwischen Formaten
möglich.
-
Speicherreduzierungstechnik
in drahtloser ATM-Technologie
-
Der
asynchrone Übertragungsmodus
(ATM – Asynchronous
Transfer Mode) ist eine Verbindungsmultiplexierungstechnik, welche
breite Anwendung in Kerntelekommunikationsnetzwerken ("backbones") aufgrund ihrer
Fähigkeit
gefunden hat, Bandbreitenressourcen mit feiner Körnigkeit, z. B. 48-Oktett-"Zellen" von Daten zuzuweisen.
Erhebliches Hintergrundmaterial bezüglich ATM existiert in der
technischen Literatur; beispielsweise A. Fraser of Bell Laboratories
diskutierte die Geschichte der Asynchronous Time-Division Technique
in seinem ACM SIGCOMM Award Vortrag von 1994, welcher in ACM Computer
Communication nachgedruckt wurde. Es gibt eine Anzahl von Veröffentlichungen,
welche Endgerätadapter
für diese
Netzwerke in Zusammenhang mit Hochleistungs-Workstations diskutieren.
Diese Konstruktionen erfordern erheblichen Speicher, um erfolgreich
zu arbeiten, hauptsächlich
für die
Pufferung von ankommenden Daten, um verlorengegangene Daten und
deren Folge einer schlechten Systemleistung zu verhindern. Deutlich
weniger Aufmerksamkeit wurde der ATM-Unterstützung für preiswertere Vorrichtungen
geschenkt, wie z. B. denjenigen, welche von Benutzern für alltägliche Aufgaben
in der Zukunft, wie z. B. drahtlose PDAs verwendet werden können. Diese Vorrichtungen
sind durch niedrige Kosten, geringes Gewicht gekennzeichnet und
legen Wert auf eine lange Batterielebensdauer. Drahtloser ATM arbeitet
in Laboraufbauten und kann Videoverkehr tragen. Somit stellt er eine
Umgebung bereit, für
welche Speicherreduzierungsverfahren, die wir für CATV und DBS entwickelt haben,
ebenfalls zutreffen.
-
Speicherreduzierung
für mobile
Betrachtungssysteme
-
Die
Reduzierung der Speicheranforderungen für zukünftige drahtlose Endgeräte ist heute
aus Technologie- und Kostengründen
sehr wichtig, und dieses bleibt vorhersehbar auch in der Zukunft
so. Der Speicher stellt die Hauptkosten in vielen heutigen Informationshandhabungsvorrichtungen,
drahtgebundenen oder drahtlosen, dar. Der Speicher ist der Hauptverbraucher
von Energie in mobilen drahtlosen Systemen und eine Folge davon
ist, dass verringerter Speicher zu längerer Batterielebensdauer
in vielen Fällen
führt.
Die Vorteile von Speicherbedarfreduzierungstechniken sind zusammengefaßt wie folgt:
- 1. Die Systeme sind kompakter, wenn weniger
Speicher und weniger Batterien benötigt werden.
- 2. Aus denselben Gründen
sind sie leichter.
- 3. Es kann eine längere
Batterielebensdauer für
mobile Endgeräte
ohne Speicheplatten erreicht werden.
- 4. Die Kosten sind geringer.
-
Implementation
einer Client-Server-Architektur im drahtloser ATM
-
Das
Datenverteilungssystem besteht aus Clients, welche Endnutzerendgeräte mit extrem
eingeschränkter
Speicherkapazität
(diktiert durch die Faktoren, welche wie wir vor stehend in dieser
Offenbarung diskutiert haben) und aus Servern, welche Multimediainformation
(wie z. B. Video-on-Demand) und zusätzliche deskriptive Information
enthalten. Von den Clients wird angenommen, dass sie unter der physikalischen
Kontrolle des Kunden stehen. Dieses führt zu einer verteilten Architektur
für Verzeichnisinformation,
welche in Hinblick auf Veränderung
robust ist, preiswert ist, und die drahtlose ATM-Infrastruktur nutzt. In der Praxis ist
der Client der Architektur ein "Set-Top-Box"-Analogon, dessen Vorteile wir im Abschnitt
2 kurz zusammengefaßt haben
haben.
-
Implementation der Client/Server-Architektur
-
Das
Datenverteilungssystem besteht aus Clients, welche Endbenutzerendgeräte mit extrem
eingeschränkter
Speicherkapazität
(diktiert durch die Faktoren, welche wir vorstehend in dieser Offenbarung
diskutiert haben) und aus Servern, welche Multimediainformation
(wie z. B. Video-on-Demand) und zusätzlich deskriptive Information
(Verzeichnisinformation, Pläne,
Indizes) für
die Multimediainformation enthalten. Von den Clients wird angenommen,
dass sie unter der physikalischen Kontrolle des Kunden stehen, während die
Server in dem DBS-Falle wahrscheinlich mit dem Satellitentransponder
aufwärtsverbunden
sind. Dieses führt
zu einer verteilten Architektur für Verzeichnisinformation, welche
in Hinblick auf Veränderung
robust ist, preiswert ist, und die DBS-Infrastruktur selbst nutzt, um diese
Eigenschaften aufrechtzuerhalten. In der Praxis ist der Client der
Architektur die "Set-Top-Box"-ähnliche Einheit für DBS, welche
wir hier vorstehend diskutiert haben.
-
Es
gibt mehrere Alternativen für
unsere zu realisierende Client/Server-Architektur. Unter diesen
sind:
- 1. Gemeinsames Nutzen einer Parabolschüssel unter
mehreren Clientstellen, was eine eingeschränkte Form einer Hierarchie
und Speichereinsparungen ermöglicht.
Ein sehr einfaches Beispiel davon könnte eine Appartmentgebäude- oder
Reihenhauskonfiguration sein.
- 2. Speichern erheblicher Daten in einem Speicher an dem Aufwärtsverbindungspunkt
in dem System.
-
Dieses
ist in der Tat der Punkt, wo der Serveranteil der Architektur lokalisiert
sein sollte, damit unserer Architektur arbeitet. Die Idee hier besteht
darin, dass der Serverort die gesamte Information enthält, welche die
Set-Top-Boxen mit dem gleichen Speicher benötigen könnten. Ohne Hierarchie bietet
die Selektivität
der Ähnlichkeitsalgorithmen
keinerlei statistischen Gewinn. Das Verfahren zum Angehen dieses
Problems ist wie folgt:
- 1. Zuordnen eines Teils
eines DBS-Kanals. Dieser Kanal wird als ein "Speicher" von dem Client/Server-Algorithmus verwendet.
Es werde beispielsweise die Verwendung von 1 Mbps an Bandbreite
betrachtet. Dieses würde
etwa 2300 Zellen pro Sekunde ergeben. Die Anwendung des Ähnlichkeitsalgorithmus
würde darin
bestehen, auszuwählen,
welche Zellen in der nächsten
Sekunde zu senden sind. Wenn die Reaktionszeit besser als 1 Sekunde
sein muß,
kann das Planungsintervall ein kleinerer Wert, wie z. B. 1/30 Sekunde sein,
(obwohl Umlaufverzögerungen
problematisch sein könnten).
- 2. Planen der Bandbreitennutzung auf der Basis des Bedarfs von
Speicherzellen bei dem Client. Diese Planung ist der in der CATV-orientierten
Realisierung angewendeten SEHR ähnlich.
-
Server/Bodenstation-Algorithmus
-
Der
von dem Server genutzte Gesamtalgorithmus ist wie folgt:
- 1. Wenn neue Verzeichnisinformation in den
Server geladen wird, speichert der Server die Information in einer
Plandatenstruktur. Wenn diese Information eine Aktualisierung von
vorheriger Information darstellt, werden die Empfänger der
vorherigen Information (die "Kopiegruppe") darüber informiert,
dass sie diese Information löschen
sollten. Dieses stellt sicher, dass die Information bei jedem Client,
obwohl sie nicht notwendigerweise vollständig ist, korrekt ist.
- 2. Wenn der Server eine Anforderung von einem Client für Verzeichnisinformation
empfängt,
erhält
er die aktuellste Verzeichnisinformation aus seinem eigenen Speicher
und sendet diese an den Client.
- 3. Der Server sendet periodisch eine Tageszeit- und Datumsanzeige
an das Clientsystem.
-
Detaillierte
Beschreibung von Serveraktionen
-
Jedes
Kopfende 100 in dem Rundsende- oder Multisende-Netzwerk
arbeitet in einer Weise wie vorstehend erwähnt, um einen eingeschränkten Untersatz
von Verzeichnisinformation an die Teilnehmerendgerätadapter(Clients) 112 zu
verteilen, um dadurch den Teilnehmern zu ermöglichen, nur die Segmente der
Gesamtverzeichnisinformation zu betrachten, welche für diesen
Teilnehmer relevant sind. Um diese Aufgabe in einer schnellen Weise
zu lösen,
wird das Format der Daten, deren Inhalt und Verwaltung so geregelt,
dass die Effizienz der Datenübertragung
und Speicherung sichergestellt ist. Daher stellt die nachfolgende
Liste von Eigenschaften eine spezifische Implementation dieser Datenverteilungsarchitektur
für die
CATV-Anwendung dar:
- 1. Das Kopfende 100 ist
mit einer Uhr ausgestattet, welche ständig die aktuelle Tageszeit
bereithält.
- 2. Das Kopfende 100 besitzt eine aktuellen "Plan" für die Verzeichnisinformationslieferung.
Die Verzeichnisinformation wird durch ein <Kanalkennungs, Schlitzstart, Schlitzende> 3-Tupel indexiert.
Diese Indizes werden verwendet, um Information über das in dem identifizierten
Schlitz dargestellte Programmaterial aufzusuchen.
- 3. Ein Schlitz ist typischerweise ein vorbestimmtes Zeitsegment,
wie z. B. eine Zeitdauer von 1/2 Stunde, während eine Kanalkennung aus
die Rundsendekanalnummer in dem Rundfunknetz darstellen Daten besteht.
Diese Architektur trifft auch für
Video-on-Demand,
das zu beliebigen Zeiten startet, mit beliebigen Dauer läuft, oder
auf eine minutenweise "Mikroplanung" von Programmaterial
zu, da die Schlitzstart- und Endzeiten angegeben werden, sowie der
Kanal, auf welchem der Teilnehmerendgerätadapter auf das gewünschte Programmaterial
zugreifen kann.
- 4. Das Programmaterial, welches in dem identifizierten Zeitschlitz
rundgesendet wird, wird durch ein zweites 3-Tupel: <Name, Textbeschreibung,
Weiteres> beschrieben.
Das Feld "Name" ist der für das Programmaterial
verwendete Name und ist typischerweise ein kurzes Textstück. Das
Feld "Textbeschreibung" ist Text, welcher
das Programmaterial beschreibt und kann Zusammenfassungen, Filmbewertungen,
Drehbuchauszüge,
Schauspielernamen, von dem Film gewonnene Preise, usw. enthalten.
Das Feld "Weiteres" ist zu diesem Zeitpunkt
als Erweiterungsmöglichkeit
gedacht und kann Standbildfotos, Angaben über Gewalt- oder Erwachseneninhalt,
oder Information über
weiteres Programmaterial in einer Serie enthalten.
- 5. Programmaterial wird in dem Speicher in dem Kopfende 100 in
Einheiten fester Größe gespeichert.
Der Umfang der Einheit einer festen Größe ist so gewählt, dass
der verbrauchte Raum sowohl in dem Kopfende 100 als auch
in dem Endgerätadapter 112 minimiert
wird. In einer Speicherarchitektur mit einer festen Blockgröße führt die
Speicherung von großen
Objekten variabler Größe (den
Beschreibungen) typischerweise dazu, dass 1/2 der Blockgröße verschwendet
wird. Derartige Betrachtungen wurden extensiv in der Literatur bezüglich eines
nach Bedarf eingeteilten virtuellen Speichers diskutiert. Für diese
Offenbarung werden die Speichereinheiten als "Zellen" bezeichnet.
- 6. Ohne die Zellengröße auf 48
Oktette (Bytes) zu beschränken,
kann diese Größe für eine Interoperation mit
zukünftigen
Computernetzwerken auf der Basis der asynchronen Übertragungsmodus-(ATM)-Technologie
nützlich
sein, welche Zellen (Pakete) mit einer Nutzlastgröße von 48
Oktetten vorsieht.
- 7. Eine Zellengröße von 48
Byte dürfte
die meisten Programmaterial-Titel in einer einzigen Zelle aufnehmen.
Die nachstehend beschriebene Technik kann verwendet werden, wenn
die Titelinformation länger
als eine einzige Zelle ist.
- 8. Die "Textbeschreibung"- und "Weiteres"-Informationen besitzen
eine variable Größe und sind
aller Wahrscheinlichkeit nach größer als
eine einzige Zelle. Sie werden leicht unter Verwendung mehrerer
Zellen gespeichert, indem entweder durch eine Folge von Zellen zugeordnet
wird, die groß genug
ist, um die vollständige
Information aus dem Speicher des Kopfendes 100 zu enthalten,
oder indem einer Verknüpfungsliste
von Zellen zugeordnet wird, wobei eine Zelle Information enthält, die
zu der nächsten
Zelle führt.
Ein Beispiel einer derartigen Verknüpfungsliste in der Computerprogrammierungssprache "C", welches die geeignete Struktur bereitstellt,
wäre: Daher könnte der Text "and Peter Sellers
plays both the President and Doctor Strangelove in this classic black
comedy about the Cold War" in
drei Teilen gespeichert werden: "and
Peter Sellers plays both the President and", im Zellenkörper #1, "Doctor Strangelove in this classic black
comedy a", in dem
Zellenkörper #2,
und "bout the Cold
War", im Zellenkörper #3.
Diese
Verknüpfungslistendatenstruktur
bietet wie ein komplexeres virtuelles Speicherschema Vorteile in der
Multiplexspeicherung im Vergleich zu einem Verfahren, in welchem
zusammenhängende
Speicherbereiche erforderlich sind.
- 9. Das Kopfende 100 überträgt periodisch Verzeichnisinformation
entlang dem Abwärtsverbindungskanal an
Clients. Eine Schlüsselinnovation
dieses Datenverteilungssystems ist das Verfahren für die Planung
der Übertragung
der Verzeichnisinformation. Es kombiniert die Ähnlichkeitsmaß-Technologie
mit spezifischen Eigenschaften von Netzwerken mit Multisende-Abwärtsverbindungen
hoher Bandbreite/Einzelsende-Aufwärtsverbindungen
niedriger Bandbreite. Die Information wird in Einheiten von Zellen übertragen,
und insbesondere werden diese Zellen als Datenobjekte von 48 Oktett
betrachtet. Bei jeder Datenrate wird ein Satz einer Anzahl von Zellen
pro Zeiteinheit übertragen,
z. B. für
einen MHz-Kanal ein Bit pro Baud, werden 6 Megabit oder 750000 Oktette
pro Sekunde übertragen.
Diese Oktette können
als 48 Oktett-Zellen gruppiert sein und 15625 derartiger Zellen
könne pro
Sekunde übertragen
werden. Obwohl jedes Intervall verwendet werden kann, ist es günstig, ein
Intervall von 1 Sekunde zu verwenden, da dieses sowohl ein günstiger
Term für
Konstruktionsanalysen ist, und zufällig eine akzeptable Verzögerung ist,
welche die meisten menschlichen Teilnehmer als "sofort" betrachten. Mit 15625 Zellen pro Sekunde
könnte
jede Sekunde in dem Plan beispielsweise Titel für alle aktuellen Programme
in einem System 500 Kanälen
enthalten und 15000 Zellen für
weitere Information in derselben Sekunde belassen. Es dürfte klar
sein, dass höhere
Datenraten mehr Zellen pro Sekunde liefern und niedrige Datenraten
weniger Zellen.
Der Plan für
die Zellen, Zelle [1] ... Zelle [15625] wird unter Verwendung der
neuen Verfahren unserer vorstehenden Anmeldung kombiniert mit einigen
neuen Merkmalen entwickelt, um die Speicherbelegung zu reduzieren
und eine rasche Wechselwirkung zu unterstützen. Das Planungsproblem kann
als ein Job-Shop-Planungsproblem betrachtet werden. Teilnehmerinformationsanforderungen
(welche nachstehend bei der Diskussion des Client-Algorithmus beschrieben
werden) können
als Anforderungen für
die Übertragung
von Zellen betrachtet werden. Diese Zellen können Titelinformation, Textbeschreibung
des Programmaterials oder weitere Information über das Programmaterial enthalten.
Jede Zelle wird in dem System insgesamt durch ein <Kanalkennung, Zeit,
Zelle#> 3-Tupel bezeichnet,
wobei Zelle# dessen Position in dem <Namen, Textbeschreibung, Weiteres> 3-Tupel anzeigt. Diese
Indizes können
mehr oder weniger strukturiert werden, um die Implementation zu
erleichtern.
- 10. Der Plan wird gemäß den Prioritäten von
der höchsten
bis zur niedrigsten entwickelt. Ein Beispielprioritätsschema
ist:
- a.) Teilnehmeranforderungen von Namen, älteste Anforderung zuerst,
ein Zellenintervall pro Zeitpunkt wird zugeordnet, bis alle angeforderten
Namen übertragen
sind.
- b.) Teilnehmeranforderungen von Textbeschreibungen, älteste Anforderung
zuerst. Für
gleich alte Anforderungen wird ein Zellintervall pro Zeitpunkt zugeordnet,
bis der gesamte angeforderte Text übertragen ist.
- c.) Teilnehmeranforderungen von weiterer Information, älteste Anforderung
zuerst. Für
gleich alte Anforderungen wird ein Zellintervall pro Zeiteinheit
zugeordnet, bis alle angeforderten Daten übertragen sind.
- d.) Textbeschreibungen in Verbindung mit Teilnehmernamenanforderungen, älteste Anforderung
zuerst. Für
gleich alte Anforderungen wird ein Zellenintervall pro Zeiteinheit
zugeordnet, bis der gesamte angeforderte Text übertragen ist.
- e.) Weitere Information in Verbindung mit Teilnehmernamenanforderungen, älteste Anforderung
zuerst. Für gleich
alte Anforderungen wird ein Zellenintervall pro Zeiteinheit zugeordnet,
bis der gesamte angeforderte Text übertragen ist.
- f.) Namen für
Programmaterial in zukünftigen
Zeitintervallen, ähnlich
ermittelt nach den Teilnehmerinteressen, basierend auf der Analyse
der Textbeschreibungen oder des für den Planer verfügbaren Teilnehmerverhaltens,
wie z. B. typischer Nutzungszeiten für die Betrachtungsvorrichtung,
typische Kanalauswahl, usw.
- g.) Textbeschreibungen, ...
- h.) Weitere, ...
- 11. Der Zweck des Prioritätsverfahrens
besteht in der Bewahrung eines guten interaktiven Verhaltens, Fairneß gegenüber der
Teilnehmerpopulation (gemeinsame Nutzung des Kanals für den alle
zahlen) und gute Ausnützung
des Abwärtsverbindungskanals.
Das Vergeben von niedrigeren Prioritäten für vorhersehbare Sehgewohnheiten
ermöglicht,
dass die Information in die Endgerätadapter des Teilnehmers vorab
geladen wird, wenn der Kanal anderweitig von den spezifischen Teilnehmeranforderungen
nicht genutzt wird. Wenn Teilnehmer-spezifische Anforderungen ausgeführt haben,
nehmen die Anforderungen Priorität
eine in der Reihenfolge an, um eine beste interaktive Antwortzeit
bereitzustellen. Namen erhalten Priorität, da Namen oft zum Kanalsurfen
verwendet werden, und Bandbreite verschwendet werden würde, wenn
die Beschreibungen für
Namen gesendet würden,
welche verworfen werden. Andere Prioritätsverfahren können verwendet
werden, wie z. B. Preis-basierende oder die Nähe zum aktuellen Zeitpunkt
und das vorliegende Beispiel ist lediglich zur Veranschaulichung
und Darstellung gedacht, wie ein Plan für die Zellenübertragung bei
einem Server unter einem Satz von Taktikeinschränkungen entwickelt werden kann.
-
Client-Algorithmus
-
In
einer analogen Weise präsentiert
die nachfolgende Liste Eigenschaften einer spezifischen Implementation
des von dem Client (Teilnehmerendgerätadapter 112) in dieser
Datenverteilungsarchitektur für
die CATV-Anwendung verwendeten Algorithmus:
- 1.
Der Client-Speicher ist in Einheiten von Zellen organisiert.
- 2. Clients besitzen einen eingeschränkten Speicher.
- 3. Clients priorisieren die Speicherung von Information.
- 4. Ein Prioritätsschema
könnte
beispielsweise sein:
- a.) Name des momentan betrachteten Materials;
- b.) Textbeschreibung des betrachteten Materials oder sogar nur
der ersten wenigen Zellen, wenn dieser Speicher extrem beschränkt ist;
- c.) weitere Information über
das derzeit betrachtete Material, oder sogar nur der ersten wenigen
Zellen, wenn dieser Speicher extrem beschränkt ist;
- d.) Namensinformation des derzeit verfügbaren Materials in einer ausgewählten Gruppe
weiterer Kanäle;
- e.) Textbeschreibungen und weitere Information bezüglich Materials,
welches derzeit in einer ausgewählten Gruppe
weiterer Kanäle
verfügbar
ist;
- f.) Namensinformation von in der Zukunft verfügbaren Material
in einer ausgewählten
Gruppe weiterer Kanäle,
priorisiert nach Zeitnähe;
- g.) Textbeschreibungen und weitere Information bezüglich Materials,
welches zukünftig
in einer ausgewählten
Gruppe weiterer Kanäle
verfügbar
ist, priorisiert nach Zeitnähe.
-
Unter
der Annahme, dass ausreichend Speicherplatz verfügbar ist, können Affinitätsmatrizen
entwickelt werden, um Kanal- und Programmaterial auszuwählen. Die
Nutzung des Client-Speichers ist optimiert, wenn der Teilnehmerendgerätadapter
in der Lage ist, dem Teilnehmer eine sofortige oder nahezu sofortige Auswahl
von Material mit einem Minimum an Datenspeicherung zu bieten. Natürlich verbessert,
wie bei den meisten Informationssystemen, mehr Datenspeicher die
Leistung, jedoch kann sogar die minimalste Datenspeicherarchitektur(eine
Zelle) kombiniert mit dem Client/Server-Protokoll ein korrekt funktionierendes
Datenverteilungssystem bereitstellen. Ein einziger 64 kBit-RAM-Chip stellt Kapazität für etwas
mehr als 160 Zellen zur Verfügung,
so dass dieses extrem unwahrscheinlich ist. Wenn der Server korrekt
die Bedürfnisse
des Client vorhersieht, ist der Abwärtsverbindungsplan optimiert.
- 5. Information für abgelaufene Zeitintervalle
wird sofort verworfen.
- 6. Information aus dem Server wird als <Kanalkennung, Zeit, Zelle #> 3-Tupel angefordert.
- 7. Informationsanforderungen werden durch eine Teilnehmerinteraktion
oder erwartete Bedürfnisse
auf der Basis der bei dem Server geführten Historiedaten angespornt.
- 8. Informationsanforderungen können Anforderungen zum Senden
von Zellengruppen, wie z. B. solcher, die einer vollständigen Textbeschreibung
oder weiterer Information zugeordnet sind, umfassen. Dieses ermöglicht das
Muliplexieren des Abwärtsverbindungskanals
zwischen Teilnehmern, wie es in dem Abschnitt des Server-Algorithmus
beschrieben wurde.
- 9. Wenn eine Zelle ankommt, nachdem beispielsweise eine Anforderung
ausgegeben worden ist, wird sie auf Priorität gegenüber der derzeitigen Zellengruppe
geprüft.
Wenn unbenutzte Zellen in dem Speicher des Teilnehmerendgerätadapters
verfügbar
sind, wird die empfangene Zelle gespeichert. Wenn keine Zellen in dem
Speicher des Teilnehmerendgerätadapters
frei sind, wird die Priorität
der Zelle mit derzeit gespeicherten Zellen in dem Teilnehmerendgerätadapter
verglichen. Wenn die Priorität
der neu empfangenen Zelle höher
als die Priorität
einer zuletzt empfangenen Zelle ist, wird die vorhandene Zelle mit
der geringsten Priorität
verworfen und durch die neue Ankunftszelle mit höherer Priorität ersetzt.
Man beachte, dass dieser Prozess sowohl für angeforderte als auch unangeforderte
Zellen zutrifft und eine vorhersehende Nutzung ermöglicht,
wenn der Speicher in der La ge ist, dieses auszuführen, sowie zellenweise Aktualisierungen
für Teilnehmerendgerätadapter
mit extrem niedriger Kapazität.
-
Vorabholen
-
Die
Bandbreite ist an dem Wurzelende eines hierarchischen Knotennetzwerksystems
ist größer. In Vorwegnahme
einer Anforderung ist es klug, das Ähnlichkeitsmaß zu nutzen,
um prädiktiv
Dateien in lokale Server zu speichern, und ferner Auswahlen in gegebene
Verteilungszellen und(hierarchische) Teilzellen über Teil-Server auf der Basis
schmalbandig zu senden, welche Auswahlen am wahrscheinlichsten in
jeder Zelle angefordert werden, um so signifikant die Nutzung der
Bandbreite über
diese hierarchische Schmalbandsendekonfiguration zu erhöhen. Die
Wichtigkeit dieser Einsparungen erscheint proportional zu dem Grad
der Körnigkeit
(Kleinigkeit der Zelle) in der Schmalbandarchitektur. Diese Technik
kann auch zum Treffen von Entscheidungen für die Planung verwendet werden,
welche Daten auf spezielle Kanäle
gelegt werden sollten. Dieses kann für ein Netzwerk effektiver sein,
wenn eine Datei beliebt genug war, um immer in der Warteschlange zu
sein, da nach einem Anforderungsauftrag eine Datei teilweise unabhängig davon
herunter geladen werden kann, wo innerhalb der Länge der Datei das Herunterladen
begann. Der(anfänglich)
fehlende Anteil der Datei kann dann unmittelbar aufgenommen werden,
wenn das Schmalbandsenden der Datei wieder von vorne beginnt, und
somit das Herunterladen in derselben Zeitperiode abgeschlossen werden,
als ob eine spezielle Anforderung die Datei gemacht worden wäre. Mobile
Nutzer, deren geographischen Lagen bekannt sind, können Dateien
(z. B. in der Nacht) in die Server vorabspeichern lassen, welche
derzeit zu jedem gegebenen Zeitpunkt ihnen am nächsten liegen.
-
Das
vorliegende Datenverteilungssystem nutzt die Idee des Vorabholens,
welches auch aus Vorabspeichern, Cache-Vorladen, oder Vorwegnahme
in der technischen Literatur bezeichnet wird. Die Grundidee besteht
darin, dass, wenn gute Vorhersagen für zukünftige Datenanforderungen verfügbar sind,
und eine überschüssige Datenvorauslesefähigkeit
verfügbar
ist, die Daten aggressiv in Voraussicht zukünftigen Bedarfs vorab geholt
werden sollten. Falls sie erfolgreich ist, hat diese Technik zwei
Hauptvorteile, welche auf derzeitige und zukünftige Netzwerke anwendbar
sind. Erstens kann sie die Reaktionszeit, einen Hauptleistungsfaktor
in interaktiven Systemen, reduzieren (d. h. ver bessern). Zweitens
kann sie Blockierung und andere Probleme in Verbindung mit einer
Netzwerküberlastung
reduzieren. In 8 stellen
wir eine mögliche
zeitliche Abfolge von Bandbreiten dar, welche durch eine Anwendung
oder eine Gruppe von Anwendungen benötigt werden. Um zu verstehen,
wie Reaktionsfähigkeit
des Systems verbessert wird, kann man sehen, dass nicht genutzte
Bandbreite zur Übertragung
von Information genutzt wird, welche wahrscheinlich in der Zukunft
benötigt
wird. Wenn beispielsweise eine Liste 1, 2, 3, 4, ... durchlaufen
wird, ist es wahrscheinlich, dass, wenn ein Objekt N angefordert
worden ist, das Objekt N + 1 die nächste Anforderung sein wird.
Wenn N + 1 von dem entfernten System vorabgeholt wird, ist es ohne
zusätzliche
Verzögerung
verfügbar,
wenn die Anforderung erfolgt. Die in 8 dargestellte "unbenutzte Bandbreite" kann möglicherweise
zum Vorabholen verwendet werden. Um zu verstehen, wie die Blockierung
reduziert werden kann, nehmen wir zuerst zur Kenntnis, dass eine
Blockierung aufgrund unzureichender Ressourcen beruht. Das einfachste
Beispiel ist eine unzureichende Straßenkapazität für die vorliegende Belastung,
was zu "Verkehrsstaus" führt. Paket-vermittelte
Netzwerke, wie z. B. das IP-Internet leiden unter ähnlichen
Problemen. In 8 scheint
es, dass die Kapazität
in der Nähe
der Zeit = 43 oder ähnlich
erreicht oder überschritten
ist. Wenn Anforderungen während
dieser Periode gemacht werden, wird der Verkehr wahrscheinlich verzögert oder
geht sogar verloren. Wenn wir während
Periode leichterer Belastung erfolgreich vorabholen (z. B. zur Zeit
0 ... 42), verringern wir die Wahrscheinlichkeit, dass Daten zukünftig angefordert
werden, was im Wesentlichen die Garantie eines voll belasteten Netzes
heute gegen die Aussicht keiner Blockierung in der Zukunft eintauscht.
Durch Vorabholen von Daten in Vorwegnahme eines zukünftigen Bedarfs
reduzieren wir(wenigstens wahrscheinlich) diesen zukünftigen
Bedarf.
-
Das
Vorabholen wurde auf dem Gebiet der Computerbetriebssysteme bereits
mehrere Jahrzehnte verwendet, und eine Vielzahl von Algorithmen
wurde bereits erforscht. A. J. Smith of Berkeley hat berichtet, dass
der einzige Fall, in welchem erfolgreiche Vorhersagen über zukünftige Anforderungen
von Speicherobjekten durchgeführt
werden können,
vorliegt, wenn die Zugriffe sequentiell sind. Eine neuere Arbeit
für Inhalte auf
höherer
Ebene wie z. B. World-Wide-Web (WWW)-Hypertext hat gezeigt, dass
man Nutzerautorisierten Links auf andere Hypermedia-Dokumente mit
einem gewissen Erfolg folgen kann.
-
Die
Voraushol-Technologie dieser Offenbarung basiert auf unbenutzten
Schlitzen, die mit vorab gesendeter Information auf der Basis unseres
Verständnisses
des Nutzerinteresses gefüllt
werden, indem die in der großen
Originalanwendung entwickelten Ähnlichkeitsmaße verwendet
werden, und für
unsere Priorisierung (siehe Seite 18 der vorliegenden Erfindungsoffenbarung)
verwendet werden, ein Konzept, mit dem sie sich nicht befassen,
da sie http folgen: Links auf der Basis von Beobachtungen über die
hohe Wahrscheinlichkeit, dass Benutzer diesen Links folgen.
-
Die
vorliegende Erfindung kann nutzbringend innerhalb des Kontextes
von Vorrichtungen der Art von Set-Top-Boxen, wie z. B. PDA's oder Netzwerkcomputern
oder Personal-Computern, die als Form einer Set-Top-Box verwendet
werden als ein Verfahren zum Reduzieren der von Nutzern beobachteten
Reaktionszeit verwendet werden. Dieses Verfahren verwendete "Links" auf andere in einer
Datei mit htpp-Format eingebetteten Dokumenten als Hinweise dafür, dass
man diesen Links bei dem Vorabholen von Daten folgen sollten; d.
h. die durch Links angegebenen Dokumente sollten in Vorwegnahme
des Wunsches des Benutzers vorab geholt werden, um den Links zu
diesen Dokumenten zu folgen.
-
Die
vorliegende Erfindung stellt zwei Verbesserungen für dieses
Verfahren bereit. Erstens stellt es eine technologische Einrichtung
bereit, mittels welcher die vorab geholten Daten mit Bedarfsdaten
gemischt werden können,
um Gesamtverbesserungen in der Reaktionszeit für eine große Anzahl von HTTP/WWW-Nutzern
mit reduzierten Speicheranforderungen bereitzustellen. Zweitens
stellt die vorliegende Erfindung, welche die Abwärtsverbindung als eine feste
Speicherkapazitätsressource
betrachtet, ein allgemeines Planungsverfahren bereit, welches Techniken,
wie z. B. Nutzerpräferenzen
verkörpert,
um Information vorab zu holen, wenn Schlitze oder Bandbreiten untergenutzt
sind, um präemptiv
einen zukünftigen
Bandbreitenbedarf zu reduzieren. Die allgemeine Technik der Anwendung
des Ähnlichkeits-informierten
Vorabholens ist ausführlich
in der gleichzeitig anhängigen
Patentanmeldung mit dem Titel "Pseudonymous
Server For System For Customized Electronic Identification of Desirable
Objects" U.S. Anmeldung
Ser. Nr. 08/550,886, eingereicht am 31. Oktober 1995 beschrieben
(S.N. US. 5,794,938).
-
Künstliche
Verzögerungen
-
Diese
Anmerkung diskutiert die Idee "künstlicher
Verzögerungen" in der Warteschlangeneinreihung von
Anforderungen für
Satelliten- oder Kabelsysteme, an welche unsere Set-Top-Boxen angeschlossen
werden. Die Idee besteht darin, dass wird durch sorgfältige Verwaltung
der Warteschlangen deutliche Bandbreiteneinsparungen für das System
als Ganzes erzielen können.
Der Server-Planungsalgorithmus arbeitet wie dieser:
Die Set-Top-Box
des Client (von welchen viele vorhanden sein sollten) sendet Anforderungen
für Information in
Zellengrößeneinheiten
an das Serversystem. Das Serversystem wendet einen Prioritätsalgorithmus
(siehe insbesondere den nachstehenden Schritt 10) an, um
die nächste
Zelle zum Senden auszuwählen.
Durch Anpassen der relativen Prioritäten können wir eine gute Reaktionsfähigkeit
und verringerte Bandbreitenanforderungen trotz des geringen Speicherbedarfs
(und der niedrigen Kosten) der Set-Top-Boxen erzielen.
-
Man
stelle sich das Szenario vor, in welchem viele SetTop-Boxen mit
dem Server verbunden sind. Diese Situation könnte wie die in 10 dargestellte sein, in
welcher Cs Clients sind und S ein Server ist. Nun liegt deutlich
eine Vielzahl von Clients vor, und aufgrund dieser Vielzahl sind
wir in der Lage, eine Einsparung durch entsprechende Verzögerungen
zu erhalten. Ich glaube wiederum, dass das Ähnlichkeitsmaß hier der Schlüssel zum
Erfolg und für
die Neuheit ist. Man betrachte die Zellanforderungen für die Clients
C1, C4 und C5, welche nachstehend unter Verwendung von Buchstaben
dargestellt sind, um spezielle Zellen anzuzeigen, wie es in unserem
Offenbarungstext diskutiert wird.
- C1: E-T-A-O-I-N-S-H-R-D-L-U
.......
- C4: N-A-T-I-O-N-A-L-V-E-L ......
- C5: E-T-A-O-N-L-Y-S-U-D .....
-
Wir
markieren diese Zellanforderung mit Zeiten, welche deren Übertragungsintervallen
zugeordnet sind:
T:
I: 0000000001111
M: 1-2-3-4-5-6-7-8-9-0-1-2-3
......
E:
-
Nun
werde zur Vereinfachung angenommen, dass alle vorstehend dargestellten
Zellanforderungen dieselbe Priorität besitzen. Der Server könnte dann
tatsächlich
die nachstehende Folge von Zellen über den Kanal senden:
S:
E-N-E-T-A-A-A-T-T-O-I-O .....
-
Somit
bedienen wir die Zellanforderungen C1-C4-C5-C1-C4-C5 ... (tatsächlich kann
der Server Überlappungen
zwischen den Anforderungen C1 und C5 in dem ersten Intervall, C4
und C5 in dem zweiten Intervall, C4 und C5 in dem dritten Intervall,
und C1 und C5 in dem vierten Intervall erkennen, wobei gegeben ist:
S:
E-N-T-A-A-T-O-I-I-O-N-N ....
)
-
Man
stelle sich vor, dass die Clients immer hören. Dann können wir die Zellanforderungen
in der HOFFNUNG, dass die ANTWORTEN VERMISCHTen werden, verzögern, was
mehrere Set-Top-Box-Clients mit derselben ANTWORT zufrieden stellt.
Um dieses konkret zu machen, betrachte man den Verzögerungsdienst
durch nur eine Periode. Somit kann das Ausgangssignal des Servers
aussehen wie etwa:
S: #-E-N-T-A-O-I-N-L-S-A-Y .....
-
Was
hier abläuft,
ist sehr subtil. Indem die Serviceanforderungen einiger Clients
verzögert
werden, VERGRÖSSERN
WIR DIE WAHRSCHEINLICHKEIT, dass eine andere Anforderung hereinkommt,
welche wir in den Dienst der äquivalenten
verzögerten
An forderung falten können.
Der Preis dafür
liegt möglicherweise in
einer Verzögerung,
aber mit ausreichender Überlappung
sind die Zellenzeiten für
48 Bytes auf einem DBS-Kanal
kurz genug, den wir wahrscheinlich ausreichend verzögern können.
-
Wenn
wir das Problem für
einen Moment theoretisch betrachten, können wir den Gewinn für eine akzeptable
Verzögerung
D als die Anzahl redundanter Übertragungen
berechnen, welche aufgrund einer Verzögerung D eliminiert werden.
Somit beträgt
für Verzögerungen
von 1 bis 10 Zellenzeiten die Gesamtanzahl von DBS-Zellen ohne Redundanzprüfungen 30;
die erforderliche Anzahl, wenn diese kleine Optimierung angewendet
wird, ist nachstehend dargestellt:
Verzögerung von DBS-Zellen Bandbreiteneinsparungen
02340/24
= 25%
11830/18 = 66%
21730/17 = 76%
31730/17 = 76%
41530/15
= 100%
51530/15 = 100%
61530/15 = 100%
71530/15 =
100%
81530/15 = 100%
91530/15 = 100%
101530/15 =
114%
-
Wir
berechnen den Bandbreitengewinn gegenüber der einfachen Nutzung von
30 Zellenzeiten; der Bandbreitengewinn ergibt sich aus der Tatsache,
dass uns der synchrone Satellitenkanal eine feste Bandbreite zur
Verfügung
stellt, was eine feste Anzahl von Zellen pro Zeiteinheit ergibt,
und wir haben gerade 16 Zellenzeiten durch die Verwendung des Verzögerungsverfahrens
gespart. Für
dieses Beispiel ist an diesem Punkt kein weiterer Gewinn mehr möglich, da
die gesamte Verdoppelung eliminiert worden ist. In einem gewissen Sinne
verhält
sich dieses wie ein Kompressionsverfahren. Der Ähnlichkeitsalgorithmus vergrößert die
Wahrscheinlichkeit, dass diese Überlappungen
auftreten – die
ideale Situation ist die, wenn wir lange genug warten, so dass die
geplante Rund funkzelle nahezu alle Anforderungen innerhalb eines
signifikanten Zeitintervalls (beispielsweise mehreren Millisekunden)
erfüllt.
-
Grundfilterung
von Programmen
-
Das
Datenverteilungssystem der vorliegenden Erfindung baut automatisch
sowohl ein Zielprofil für
jedes Zielobjekt in den elektronischen Medien sowie eine "Teilnehmerzielprofilinteressenzusammenfassung" für jeden
Teilnehmer auf, wobei diese Teilnehmerzielprofilinteressenzusammenfassung
den Interessegrad des Teilnehmers an verschiedenen Typen von Zielobjekten
beschreibt. Das System bewertet dann die Zielprofile gegenüber den
Teilnehmerzielprofilinteressenzusammenfassungen, um eine Teilnehmerspezifische
Rangreihenfolgeliste von Zielobjekten zu erzeugen, welche höchst wahrscheinlich
für jeden
Teilnehmer von Interesse sind, so dass der Teilnehmer aus diesen
möglicherweise
relevante Zielobjekte auswählen
kann, welche automatisch durch dieses System aus der Fülle von
auf den elektronischen Medien verfügbaren Zielobjekten ausgewählt wurden.
-
Da
die Leute viele Interessen haben, muß eine Zielprofilinteressenzusammenfassung
für einen
einzelnen Teilnehmer mehrere Interessensbereiche repräsentieren,
indem sie beispielsweise aus einem Satz individueller Suchprofile
besteht, wovon jedes einen Interessenbereich des Teilnehmers bezeichnet.
Jedem Teilnehmer werden diejenigen Zielobjekte präsentiert,
deren Profile am besten den Teilnehmerinteressen gemäß Beschreibung
durch die Teilnehmerzielprofilinteressenzusammenfassung entsprechen.
Die Teilnehmerzielprofilinteressenzusammenfassungen werden automatisch
auf einer fortlaufenden Basis aktualisiert, um die sich verändernden
Teilnehmerinteressen zu reflektieren. Zusätzlich können Zielobjekte basierend
auf der Ähnlichkeit
zueinander in Gruppierungen gruppiert werden, beispielsweise auf
der Ähnlichkeit
ihrer Themen in dem Falle, in welchem die Zielobjekte veröffentlichte
Programme sind, und Menüs
automatisch für
jede Gruppierung von Zielobjekten erzeugt werden, um dem Teilnehmer
zu ermöglichen,
durch die Gruppierungen zu navigieren und manuell interessierende
Zielobjekte zu lokalisieren. Aus Gründen der Vertraulichkeit und
Geheimhaltung kann ein spezieller Teilnehmer nicht die Veröffentlichung
aller in der Teilnehmerzielprofilinteressenzusammenfassung aufgezeichneten
Interessen wünschen,
insbesondere wenn diese Interessen durch die Kaufverhaltensmuster
des Teilnehmers bestimmt sind. Der Teil nehmer kann wünschen,
dass die gesamte oder ein Teil der Zielprofilinteressenzusammenfassung
vertraulich gehalten wird. Es ist deshalb erforderlich, dass Daten
in einer Zielprofilinteressenzusammenfassung eines Teilnehmers vor
einer unerwünschten
Veröffentlichung
mit Ausnahme der Zustimmung des Teilnehmers geschützt werden,
was eine Verarbeitung zumindest eines Teils der Zustimmungsmatrix
in dem Teilnehmerendgerätadapter
mit sich bringen kann. Gleichzeitig müssen die Zielprofilinteressenzusammenfassungen
des Teilnehmers für
die relevanten Server zugänglich sein,
um den Abgleich mit Zielobjekten des Teilnehmers durchzuführen, wenn
der Vorteil dieses Abgleichs sowohl vom Anbieter als auch Verbraucher
der Zielobjekte gewünscht
wird.
-
In
der bevorzugten Ausführungsform
der Erfindung verwendet das Datenverteilungssystem ein fundamentales
Verfahren zum genauen und effizienten Abgleichen von Teilnehmern
und Zielobjekten, indem automatisch Profilinformation berechnet,
verwendet und aktualisiert wird, welche sowohl die Interessen des
Teilnehmers als auch die Eigenschaften der Zielobjekte beschreibt.
Die Zielobjekte sind typischerweise Programme und deren Eigenschaften
werden gespeichert und/oder in den elektronischen Medien als (digitale)
Daten dargestellt und/oder bezeichnet. Der Informationslieferungsprozess
in der bevorzugten Ausführungsform
basiert auf der Ermittlung der Ähnlichkeit
zwischen einem Profil für
das Zielobjekt und den Profilen von Zielobjekten, für welche
der Teilnehmeroder ein ähnlicher
Teilnehmer) eine positive Rückmeldung
in der Vergangenheit gegeben hat. Die individuellen Daten, die ein
Zielobjekt beschreiben und das Profil des Zielobjekts darstellen werden
hierin als "Attribute" des Zielobjektes
bezeichnet. Attribute können
die nachstehenden umfassen, sind jedoch nicht darauf beschränkt: (1)
lange Textteile (eine Filmbesprechung oder eine Werbung), (2) kurze
Textteile (Name eines Filmregisseurs, Name einer Stadt, aus welcher
eine Werbung platziert wurde), (3) numerische Messwerte (einem Film
gegebene Bewertungen), (4) Beziehungen zu anderen Typen des Objekts
(Liste der Schauspieler in einem Film). Jedes dieser Attribute,
aber insbesondere die Numerischen, können mit der Qualität des Zielobjektes
korrelieren, wie z. B. Messwerte für dessen Beliebtheit (wie oft
darauf zugegriffen wird), oder die Teilnehmerzufriedenheit (Anzahl
der empfangenen Beschwerden).
-
Jeder
Film besitzt einen unterschiedlichen Wertesatz für diese Attribute. Dieses Beispiel
veranschaulicht zweckmäßigerweise
drei Arten von Attributen. Es ist offensichtlich, dass sie dazu
genutzt werden können, um
zum Identifizieren der interessierenden Zielobjekte (Filme) des
Teilnehmers beizutragen. Beispielsweise kann der Teilnehmer mit
Elternberatung (PG) Filme und in den 1970-ern hergestellte Filme
gemietet haben. Diese Verallgemeinerung ist nützlich: neue Filme mit Werten
für eines
oder beide Attribute, welche numerisch ähnlich diesen sind(wie z. B.
eine MPAA-Bewertung von 1, Erscheinungsdatum von 1975) werden als
den Filmen ähnlich
beurteilt, welche der Teilnehmer gerne sieht, und daher für ihn möglicherweise
von Interesse sind. Textattribute sind wichtig, um den Teilnehmer
bei der Lokalisierung gewünschter
Filme zu unterstützen.
Beispielsweise kann der Teilnehmer in der Vergangenheit Interesse
an Filmen gezeigt haben, dessen Beschreibungstext Worte wie "Verfolgungsjagd", "Explosion", "Explosionen", "Held", "spannend", und "hervorragend" enthalten. Diese
Verallgemeinerung ist wiederum für
die Identifizierung neuer interessierender Filme nützlich. Das
TF/IDF-Verfahren kann dazu genutzt werden, um Filmbeschreibungen
zu profilieren, oder selbst die darin enthaltenen geschlossenen
Untertitel, wie es nachstehend beschrieben wird. Assoziative Attribute
zeichnen Beziehungen zwischen Zielobjekten in diesem Bereich, nämlich Filme
und Hilfszielobjekte einer vollständig anderen Art, nämlich Menschen
auf.
-
Zerlegung
komplexer Attribute
-
Obwohl
textliche und assoziative Attribute große und komplexe Datenteile
sind, können
sie für
Informationsgewinnungszwecke in kleinere, einfachere numerische
Attribute zerlegt werden. Dieses bedeutet, dass jeder Satz von Attributen
durch einen (üblicherweise
größeren) Satz
von numerischen Attributen ersetzt werden kann, und somit jedes
Profil als ein Vektor von Zahlen dargestellt werden kann, welche
die Werte dieser numerischen Attribute angeben. Insbesondere kann
ein Textattribut, wie z. B. der volle Text einer Filmkritik durch
eine Sammlung numerischer Attribute ersetzt werden, welche Wertungen
darstellen, um das Vorhandensein und die Wichtigkeit der Worte in
diesem Text zu bezeichnen. Die Wertung eines Wortes in einem Text kann
anhand zahlreicher Möglichkeiten
definiert werden. Die einfachste Definition besteht darin, dass
die Wertung die Häufigkeit
des Wortes in dem Text ist, welche berechnet wird, indem die Anzahl
der Male berechnet wird, mit denen das Wort in dem Text auftritt,
und indem diese Zahl durch die Gesamtanzahl der Worte in dem Text
dividiert wird. Diese Wertungsart wird oft als die "Begriffshäufigkeit" (TF – term frequency)
des Wortes bezeichnet. Die Definition der Begriffshäufigkeit
kann optional modifiziert werden, um unterschiedliche Abschnitte des
Textes ungleichmäßig zu gewichten:
Beispielsweise kann jedes Auftreten eines Wortes in dem Texttitel
als ein 3-faches oder allgemeiner als k-faches Auftreten gezählt werden
(als ob der Titel k-mal innerhalb des Textes wiederholt worden wäre), um
eine heuristische Annahme zu reflektieren, dass die Worte in dem
Titel besonders wichtige Indikatoren für den Inhalt oder das Thema
des Textes sind.
-
Ebenso
wie ein Textattribut in eine Anzahl von Komponentenbegriffen (Buchstaben- oder Wort-Engramme)
zerlegt werden kann, kann ein assoziatives Attribut in eine Anzahl
von Komponentenbeziehungen zerlegt werden. Beispielsweise wäre ein typisches
assoziatives Attribut, das bei der Profilierung eines Films verwendet
wird, eine Liste von Teilnehmern, welche diesen Film gemietet haben.
Diese Liste kann durch eine Sammlung numerischer Attribute ersetzt
werden, welche die "Beziehungswerten" zwischen dem Film
und jedem von den dem System bekannten Teilnehmern angibt. Beispielsweise
wäre das
165.-te derartige numerische Attribut der Beziehungswert für den Film
und den Teilnehmer #165, wobei der Beziehungswert 1 ist, wenn der
Teilnehmer #165 zuvor den Film gemietet hat, und ansonsten 0. In
einer subtileren Verfeinerung könnte dieser
Beziehungswert als der Grad des Interesses, möglicherweise 0, definiert sein,
den der Teilnehmer #165 an dem Film zeigte, wie es durch die Relevanzrückmeldung
ermittelt wird.
-
Ähnlichkeitsmaße
-
Was
bedeutet es, dass zwei Zielobjekte ähnlich sind? Genauer gesagt,
wie sollte man den Grad der Ähnlichkeit
messen? Es sind viele Lösungsansätze möglich, und
jedes vernünftige
Maß, das
hinsichtlich des Satzes von Zielobjektprofilen berechnet werden
kann, kann verwendet werden, wobei Zielobjekte als ähnlich betrachtet
werden, wenn der Abstand zwischen ihren Profilen gemäß diesem
Maß klein
ist. Somit weist die nachstehende bevorzugte Ausführungsform
eines Zielobjekt-Ähnlichkeitsmaßsystems
viele Varianten auf.
-
Zuerst
werde der Abstand zwischen zwei Werten eines gegebenen Attributes
abhängig
davon definiert, ob das Attribut ein numerisches, Beziehungs- oder
ein Textattribut ist. Wenn das Attribut numerisch ist, ist dann
der Abstand zwischen den zwei Werten des Attributes der Absolutwert
der Differenz zwischen den zwei Werten. Wenn es für eine Gruppierungsbildung
oder andere Zwecke erforderlich ist, kann ein Maß, das einen Ver gleich von
zwei beliebigen Objekten (unabhängig
davon, ob sie von derselben oder gleichen Art sind) erlaubt, wie
folgt definiert werden. Wenn a ein Attribut ist, dann sei Max(a)
die obere Begrenzung des Abstandes zwischen zwei Werten des Attributes
a; man beachte, dass wenn das Attribut a ein Beziehungs- oder Textattribut
ist, dieser Abstand ein Winkel ist, welcher durch arccos bestimmt
ist, so dass Max(a) als 180° gewählt werden
kann, während
dann, wenn das Attribut ein numerisches Attribut ist, eine ausreichend
große
Zahl von den Systemdesignern gewählt
werden muss. Der Abstand zwischen zwei Werten eines Attributes a
ist wie vorstehend in dem Falle gegeben, in welchem beide Werte
definiert sind; der Abstand zwischen zwei undefinierten Werten wird
als 0 angenommen; der Abstand zwischen einem definierten Wert und
einem undefinierten Wert wird immer als Max(a)/2 angenommen. Dieses
ermöglicht
es uns zu ermitteln, wie nahe aneinander zwei Zielobjekte in Bezug
auf ein Attribut a sind, selbst wenn das Attribut a keinen definierten
Wert für
beide Zielobjekte besitzt. Der Abstand d(*, *) zwischen zwei Zielobjekten
in Bezug auf deren gesamten Mehrfachattributprofile ist dann in
Begriffen dieser individuellen Attributabstände genau wie zuvor. Es wird
angenommen, dass ein Attribut in einem derartigen System die Art
des Zielobjektes ("Film", "Novelle", usw.) spezifiziert,
und dass dieses Attribut hoch gewichtet werden kann, wenn Zielobjekte
unterschiedlicher Arten, trotz der Attribute, die sie gemeinsam
haben können,
als sehr unterschiedlich betrachtet werden kann.
-
Filterung: Relevanzrückmeldung
-
Ein
Filterungssystem ist eine Vorrichtung, welche viele Zielobjekte
durchsuchen und ein gegebenes Teilnehmerinteresse an jedem Zielobjekt
abschätzen
kann, um so diejenigen zu identifizieren, die für den Teilnehmer von größtem Interesse
sind. Das Filtersystem verwendet Relevanzrückmeldung, um seine Kenntnis über die
Interessen des Teilnehmers zu verfeinern: jedesmal, wenn das System
ein Zielobjekt als möglicherweise
interessierend für
einen Teilnehmer identifiziert, liefert der Teilnehmerfalls es ein
Online-Teilnehmer
ist) eine Rückmeldung,
ob das Zielobjekt tatsächlich
von Interesse ist oder nicht. Eine derartige Rückmeldung wird langfristig
in zusammengefaßter
Form als Teil einer Datenbank mit Teilnehmerrückmeldeinformation gespeichert,
und kann entweder aktiv oder passiv erzeugt werden. Bei einer aktiven
Rückmeldung
zeigt der Teilnehmer explizit sein oder ihr Interesse beispielsweise
auf einer Skale von –2
(aktives Mißfallen) über 0 (kein
spezielles Interesse) bis 10 (großes Interesse) an. In der passiven
Rück meldung
leitet das System das Teilnehmerinteresse aus dem Verhalten des
Teilnehmers ab. Beispielsweise könnte
das System, wenn die Zielobjekte Textdokumente sind überwachen,
welche Dokumente der Teilnehmer zum Lesen oder nicht zum Lesen auswählt, und
wie viel Zeit der Teilnehmer zum Lesen dieser aufwendet.
-
Filterung: Ermittlung
des thematischen Interesses durch Ähnlichkeit
-
Die
Relevanzrückkopplung
bestimmt nur das Interesse des Teilnehmers an bestimmten Zielobjekten: nämlich den
Zielobjekten, für
welche der Teilnehmer die Möglichkeit
zur Bewertung (entweder aktiv oder passiv) hatte. Für Zielobjekte,
die der Teilnehmer noch nicht gesehen hat, muß das Filtersystem das Teilnehmerinteresse
abschätzen.
Diese Abschätzungsaufgabe
ist der Kern des Filterungsproblems, und der Grund, warum die Ähnlichkeitsmessung
wichtig ist. Der Teilnehmer kann aktive und/oder passive Rückmeldung
an das System bezüglich
der präsentierten
Programme geben. Das System besitzt jedoch keine Rückmeldungsinformation
von dem Teilnehmer für
Programme, welche niemals dem Teilnehmer präsentiert wurden, wie z. B. neue
Programme, die gerade dem Sendeplan hinzugefügt worden sind, oder alte Programme,
die das System nicht für
eine Präsentation
an den Teilnehmer auswählt.
-
Wie
es im Flußdiagramm
in 6 dargestellt ist,
kann die Bewertung der Wahrscheinlichkeit des Interesses an einem
speziellen Zielobjekt für
einen spezifischen Teilnehmer automatisch berechnet werden. Das Interesse,
das ein gegebenes Zielobjekt X für
einen Teilnehmer U darstellt, wird als die Summe von zwei Größen angenommen:
q(U, X), die intrinsische "Qualität" von X, plus f(U,
X) das "thematische
Interesse", das
Teilnehmer, wie z. B. U, an Zielobjekten wie X haben. Für jedes
Zielobjekt X wird das intrinsische Qualitätsmaß q(U, X) leicht bei den Schritten 601 bis 603 direkt
aus den numerischen Attributen für
das Zielobjekt X abgeschätzt.
Der Berechnungsprozess beginnt bei dem Schritt 601, bei
dem bestimmte zugewiesene numerische Attribute des Zielobjektes
X spezifisch ausgewählt
werden, wobei die Attribute aufgrund ihrer eigentlichen Art positiv
oder negativ mit dem Interesse des Teilnehmers korreliert werden
sollten. Derartige als "Qualitätsattribute" bezeichnete Attribute
haben die normative Eigenschaft, dass je höher(oder in einigen Fällen niedriger) ihr
Wert ist, der Teilnehmer erwartungsgemäß ein um so höheres Interesse
daran findet. Qualitätsattribute
des Zielobjektes X können
umfassen, sind jedoch nicht darauf beschränkt, die Beliebtheit des Zielobjektes
X unter Teilnehmern im allgemeinen, die Bewertung, die ein spezifischer
Kritiker dem Zielobjekt X gegeben hat, das Alter(Zeit seit der Entstehung – ebenfalls
als Veralterung bekannt) des Zielobjektes X, die Anzahl von in dem Zielobjekt
X verwendeten Vulgärworten,
der Preis des Zielobjektes X und die Geldmenge, welche die das Zielobjekt
X verkaufende Firma der favorisierten karitativen Organisation des
Teilnehmers gespendet hat. Bei dem Schritt 602 wird jedes
der ausgewählten
Attribute mit einer positiven oder negativen Gewichtung multipliziert, welche
die Stärke
der Präferenz
des Teilnehmers U für
diejenigen Zielobjekte, die hohe Werte für dieses Attribut besitzen,
anzeigt, wobei die Gewichtung aus einer Qualitätsattributgewichtungen speichernden
Datendatei für
den ausgewählten
Teilnehmer geholt werden muss. Bei dem Schritt 603 wird
eine gewichtete Summe der identifizierten gewichteten ausgewählten Attribute
berechnet, um das intrinsische Qualitätsmaß q(U, X) zu berechnen. Bei
dem Schritt 604 werden die zusammengefaßten gewichteten Relevanzrückmeldungsdaten
ausgelesen, wobei einige Relevanzrückmeldungspunkte stärker als
andere gewichtet werden, und die gespeicherten Relevanzdaten in
einem gewissen Umfang beispielsweise durch die Anwendung von Suchprofilsätzen zusammengefaßt werden
können.
Der schwierigere Teil der Ermittlung des Interesses des Teilnehmers
U am Zielobjekt X besteht bei dem Schritt 605 in dem Finden
oder Berechnen des Wertes von f(U, X), welcher das thematische Interesse
bezeichnet, das Teilnehmer wie U allgemein an Zielobjekten wie X
haben. Das Verfahren zur Ermittlung eines Teilnehmerinteresses beruht
auf der nachfolgenden Heuristik: wenn X und Y ähnliche Zielobjekte sind(ähnliche
Attribute besitzen), und U und V ähnliche Teilnehmer sind(ähnliche
Attribute besitzen), wird dann vorhergesagt, dass das thematische
Interesse f(U, X) einen ähnlichen
Wert wie das thematische Interesse f(V, Y) hat. Diese Heuristik
führt zu
einem effektiven Verfahren, da geschätzte Werte der thematischen
Interessenfunktion f(*, *) tatsächlich
für bestimmte
Argumente für
diese Funktion bekannt sind: insbesondere wenn der Teilnehmer V
eine Relevanz-Rückmeldungsbewertung
von r(V, Y) für
das Zielobjekt Y geliefert hat, haben wir, soweit diese Bewertung
das tatsächliche
Interesse des Teilnehmers V an dem Zielobjekt Y repräsentiert,
r(V, Y) = q(V, Y) + f(V, Y) und können f(V, Y) als r(V, Y) – q(V, Y)
abschätzen.
Somit wird das Problem der Abschätzung
des thematischen Interesses an allen Punkten ein Problem einer Interpolation
zwischen den Abschätzungen
des thematischen Interesses an ausgewählten Punkten, wie z. B. die
Rückmeldungsabschätzung von
f(V, Y) als r(V, Y) – q(V,
Y). Diese Interpolation kann mit jeder Standardglättungstechnik erreicht
werden, indem als Eingabe die bekannten Punktabschätzungen
des Wertes der thematischen Interessenfunktion f(*, *) verwendet
werden, und als Ausgangsgröße eine
Funktion ermittelt wird, welche die gesamte thematische Interessenfunktion
f(*, *) annähert.
-
Nicht
allen Punktabschätzungen
der thematischen Interessenfunktion f(*, *) sollte die gleiche Gewichtung
als Eingangsgrößen für den Glättungsalgorithmus
gegeben werden. Da eine passive Relevanz-Rückmeldung weniger zuverlässig als
eine aktive Relevanz-Rückmeldung
ist, sollten aus passiver Relevanz-Rückmeldung erzeugte Punktabschätzungen
weniger stark gewichtet werden als aus aktiven Relevanz-Rückmeldung erzeugter
Punktabschätzungen,
oder überhaupt
nicht verwendet werden. In den meisten Bereichen können sich
die Interessen eines Teilnehmers mit der Zeit verändern, und
deshalb sollten Abschätzungen
des thematischen Interesses, welche aus einer neueren Rückmeldung
abgeleitet werden auch stärker
gewichtet werden. Die Interessen eines Teilnehmers können stimmungsabhängig variieren,
somit sollten Schätzungen
des thematischen Interesses, die aus der aktuellen Sitzung stammen,
stärker
für die
Dauer der aktuellen Sitzung gewichtet werden, und frühere Schätzungen
des thematischen Interesses, welche etwa zur aktuellen Tageszeit oder
am aktuellen Werktag erstellt wurden, stärker gewichtet werden. Eine
Schätzung
des thematischen Interesses f(V, Y) sollte stärker gewichtet werden, wenn
der Teilnehmer V mehr Erfahrung mit dem Zielobjekt Y hatte. In der
Tat besteht eine nützliche
Strategie für
das System darin, die Langzeit-Rückmeldung
für derartige Zielobjekte
zu verfolgen.
-
Um
die Glättungstechnik
effektiv anzuwenden, ist es erforderlich, eine Definition über den Ähnlichkeitsabstand
zwischen (U, X) und(V, Y) für
alle Teilnehmer U und V und für
alle Zielobjekte X und Y zu besitzen. Wir haben bereits gesehen,
wie der Abstand d(X, Y) zwischen zwei Zielobjekten X und Y zu definieren
ist, wenn deren Attribute gegeben sind. Wir können ein Paar wie z. B. (U,
X) als ein erweitertes Objekt betrachten, welches alle Attribute
des Zielobjektes X und alle Attribute des Teilnehmers U trägt; dann
kann der Abstand zwischen (U, X) und(V, Y) in genau derselben Weise
berechnet werden. Dieser Ansatz erfordert, dass der Teilnehmer U,
der Teilnehmer V und alle anderen Teilnehmer einige Attribute von
sich selbst in dem System gespeichert haben: Beispielsweise Alter
(numerisch), Sozialversicherungsnummer (Text) und eine Liste früher gelesener
Dokumenten (Beziehung). Es sind diese Attribute, welche die Bezeichnung
des "ähnlichen
Teilnehmers" bestimmen.
Somit ist es erwünscht,
(als "Teilnehmerprofil" bezeichnete) Profile
von Teilnehmern sowie (als "Zielprofile" bezeichnete) Profile
von Zielobjekten zu erzeugen. Einige von den für die Profilierung von Teilnehmern
verwendeten Attribute können
mit den für
die Profilierung von Zielobjekten verwendeten Attribute verwandt
sein: beispielsweise ist es unter Verwendung von Beziehungsattributen
möglich,
Zielobjekte wie z. B. X durch das Interesse zu charakterisieren,
das verschiedene Teilnehmer an dieser gezeigt haben, und gleichzeitig
Teilnehmer, wie z. B. U, durch das Interesse zu charakterisieren,
das sie an verschiedenen Zielobjekten gezeigt haben. Zusätzlich können Teilnehmerprofile
von irgendwelchen Attributen Gebrauch machen, welche zur Charakterisierung
von Menschen nützlich
sind, wie z. B. diejenigen, die in dem vorstehenden Beispielbereich vorgeschlagen
wurden, in welchem Zielobjekte mögliche
Verbraucher sind. Man beachte, dass das Interesse eines Teilnehmers
U selbst dann abgeschätzt
werden kann, wenn der Teilnehmer U ein neuer Teilnehmer oder ein
Oft-line-Teilnehmer ist, welcher niemals irgendeine Rückmeldung
geliefert hat, da die Relevanz-Rückmeldung
von Teilnehmern berücksichtigt
wird, deren Attribute ähnlich
zu den Attributen von U sind.
-
-
Für einige
Anwendungen des Filterungssystems ist es bei der Abschätzung des
thematischen Interesses zweckmäßig, eine
zusätzliche "Vorwegannahme keines
thematischen Interesses" (oder
eine "Vorgabe in Richtung
0") zu treffen.
Um die Nützlichkeit
einer derartigen Vorwegannahme zu verstehen, werde angenommen, dass
das System ermitteln muß,
ob das Zielobjekt A thematisch für
den Teilnehmer U interessant ist, dass jedoch Teilnehmer wie der
Teilnehmer U niemals eine Rückmeldung
bezüglich
Zielobjekten selbst entfernt ähnlicher
Zielobjekte X gemacht haben. Die Vorwegannahme keines thematischen
Interesses besagt, dass wenn dieses so ist, dieses so ist, Teilnehmer
wie der Teilnehmer U einfach nicht an derartigen Zielobjekten interessiert
sind, und sie deshalb nicht suchen und mit ihnen interagieren. Mit
dieser Vorwegannahme sollte das System das thematische Interesse
f(U, X) als niedrig einschätzen.
Formal hat dieses Beispiel die Eigenschaft, dass (U, X) weit von
allen Punkten (V, Y) entfernt ist, wo eine Rückmeldung verfügbar ist.
In einem derartigen Falle wird das thematische Interesse f(U, X)
als nahe an Null vorweg angenommen, selbst wenn der Wert der thematischen
Interessenfunktion f(*, *) bei all den weit entfernt liegenden umgebenden
Punkten hoch ist, bei welchen deren Wert bekannt ist. Wenn eine
Glättungstechnik
verwendet wird, kann eine derartige Vorwegannahme keines thematischen
Interesses, falls es zweckmäßig ist,
durch Manipulieren der Eingangsgröße für die Glättungstechnik eingeführt werden.
Zusätzlich
zur Verwendung beobachteter Werte der thematischen Interessenfunktion
f(*, *) als Eingangsgröße besteht
der Trick ebenfalls darin, falsche Beobachtungen der Form des thematischen
Interesses f(V, Y) = 0 für
ein Gitter von Punkten (V, Y) einzuführen, welches über den
mehrdimensionalen Raum verteilt ist. Diesen falschen Beobachtungen
sollte eine relativ niedrige Gewichtung als Eingangsgrößen für den Glättungsalgorithmus
gegeben werden. Je stärker
sie gewichtet werden, desto stärker ist
die Vorwegannahme keines Interesses.
-
Nachstehendes
stellt ein weiteres einfaches Beispiel einer Abschätzungstechnik
bereit, welche die Vorwegannahme von keinem Interesse hat. Es sei
g eine abnehmende Funktion von nicht-negativen realen Zahlen zu
nicht-negativen realen Zahlen wie z. B. g(x) = ex oder
g(x) = min(1, x–k) wobei k > 1 ist. Es werde das thematische
Interesse f(U, X) mit dem nachfolgenden g-gewichteten Mittelwert
abgeschätzt.
-
Hier
sind die Summierungen über
alle Paare (V, Y) so, dass ein Teilnehmer V eine Rückmeldung
r(V, Y) über
das Zielobjekt Y, d. h. über
alle Paare (V, Y) geliefert hat, so dass eine Relevanz-Rückmeldung
r(V, Y) definiert ist. Man beachte, dass sowohl mit dieser Technik
als auch mit herkömmlichen
Glättungstechniken
der Schätzwert
des thematischen Interesses f(U, X) nicht notwendigerweise gleich
r(U, X) – q(U,
X) sein muß, selbst
wenn r(U, X) definiert ist.
-
Filterung: Anpassung der
Gewichtungen und Restrückmeldung
-
Das
vorstehend beschriebene System erfordert, dass das Filterungssystem
Abstände
zwischen (Teilnehmer, Zielobjekt)-Paaren wie z. B. den Abstand zwischen
(U, X) und(V, Y) mißt.
Wenn die vorstehend beschriebene Einrichtung zum Messen des Abstandes
zwischen zwei Multiattributprofilen gegeben ist, muß das Verfahren
daher eine Gewichtung jedem der in dem Profil der (Teilnehmer, Zielobjekt)-Paare
verwendeten Attribut zuordnen, d. h. jeden Attribut, das zum Profilieren
entweder von Teilnehmer- oder Zielobjekten verwendet wird. Diese
Gewichtungen spezifizieren die relative Wichtigkeit der Attribute
bei der Feststellung der Ähnlichkeit
oder des Unterschiedes, und daher in der Ermittlung, wie das thematische
Interesse von einem (Teilnehmer, Zielobjekt)-Paar zu einem nächsten verallgemeinert
wird. Zusätzliche
Gewichtungen bestimmten, welche Attribute eines Zielobjektes zu
der Qualitätsfunktion
q beitragen, und wie stark.
-
Es
ist möglich
und oft für
ein Filterungssystem erwünscht,
einen unterschiedlichen Satz von Gewichtungen für jeden Teilnehmer zu speichern.
Beispielsweise möchte
ein Teilnehmer, welcher glaubt, dass Zwei-Sterne-Filme eine grundsätzlich unterschiedliche
Thematik und Stil gegenüber
Vier-Sterne-Filmen besitzen, ein hohes Gewicht der "Anzahl von Sternen" für die Zwecke
der Abstandsmessung d(*, *) zuordnen; dieses bedeutet, dass ein
Interesse an einem Zwei-Sterne-Film nicht notwendigerweise ein Interesse
an einem anderweitigen ähnlichen
Vier-Sterne-Film oder umgekehrt signalisiert. Wenn der Teilnehmer
auch mit den Kritiken übereinstimmt
und tatsächlich
Vier-Sterne-Filme bevorzugt, möchte
der Teilnehmer auch der "Anzahl
von Sternen" ein
hohes Gewicht in der Bestimmung der Qualitätsfunktion q geben. In derselben
Weise kann ein Teilnehmer, welcher Vulgarität verabscheut, einer "Vulgaritätswertung" ein hohes negatives
Gewicht bei der Bestimmung der Qualitätsfunktion q geben, obwohl
die "Vulgaritätswertung" nicht notwendigerweise
eine hohe Gewichtung in der Bestimmung der thematischen Ähnlichkeit
von zwei Filmen hat.
-
Attributgewichtungen
(beider Sorten) können
von dem Systemverwalter oder dem einzelnen Teilnehmer entweder auf
temporärer
oder permanenter Basis eingestellt oder angepaßt werden. Es ist jedoch oft
erwünscht,
daß das
Filterungssystem Attributgewichtungen automatisch auf der Basis
der Relevanz-Rückmeldung
lernt. Die optimalen Attri- butgewichtungen für einen Teilnehmer U sind diejenigen,
welche die genaueste Vorhersage der Interessen des Teilnehmers U
erlauben. D. h., mit der Abstandmessung und der durch diese Attributgewichtungen
definierten Qualitätsfunktion
kann das Interesse des Teilnehmers U an dem Zielobjekt X, q(U, X)
+ f(U, X) genau mittels der vorstehenden Techniken abgeschätzt werden.
Die Effektivität
eines speziellen Satzes von Attributgewichtungen für einen
Teilnehmer U kann daher gemessen werden, indem man sieht, wie genau
es die bekannten Interessen des Teilnehmers U vorhersagt.
-
Formal
werde angenommen, dass der Teilnehmer U zuvor eine Rückmeldung
bezüglich
der Zielobjekte X1, X2,
X3, ... Xn erzeugt
hat, und dass die Rückmeldebewertungen
r(U, X1), r(U, X2),
r(U, X3), ... r(U, Xn)
sind. Werte der Rückmeldungsbewertungen
r(*, *) für andere
Teilnehmer und andere Zielobjekte können ebenfalls bekannt sein.
Das System kann die nachstehende Prozedur verwenden, um die Effektivität des Satzes
von Attributsgewichtungen zu messen, welche es momentan für den Teilnehmer
U speichert: (i) Für
jedes I ≤ I ≤ n Verwenden
der Abschätzungstechniken,
um q(U, X1) + f(U, Xj)
aus allen bekannten Werten von Rückmeldungsbewertungen
r abzuschätzen.
Bezeichnen dieses Schätzwertes
als ai.
-
(ii)
Wiederholen des Schrittes (i), jedoch zu diesem Zeitpunkt Durchführen der
Abschätzung
für jedes 1 ≤ I ≤ n ohne Verwendung
der Rückmeldebewertungen
r(U, Xj) als Eingangsgrößen für jedes j so, dass der Abstand
d(Xi, Xj) kleiner
als ein fester Schwellenwert ist. D. h., Abschätzen jedes q(U, Xi)
+ f(U, Xi) nur aus anderen Werten der Rückmeldebewertung
r; insbesondere werde r(U, Xi) selbst nicht
verwendet. Bezeichnen dieser Abschätzung als bi.
Die Differenz ai – bi wird
hierin als die "Restrückmeldung
rres(U, Xi) des
Teilnehmers U bezüglich
des Zielobjektes Xi" bezeichnet. (iii) Berechnen des Fehlermaßes des
Teilnehmers U, (a1 – b1)2 + (a2 – b2)2 + (a3 – b3)2 + ... + (an – bn)2
-
Eine
Gradientenabnahme oder anderes numerisches Optimierungsverfahren
kann zur Anpassung der Attributgewichtungen des Teilnehmers U so
verwendet werden, dass dieses Fehlermaß ein (lokales) Minimum erreicht.
Dieser Lösungsansatz
arbeitet tendenziell am besten, wenn die in der Abschätzung verwendete
Glättungstechnik
so ist, dass der Wert von f(V, Y) stark von der Punktabschätzung r(V,
Y) – q(V,
Y) beeinflußt
wird, wenn der letztere Wert als eine Eingangsgröße bereitgestellt wird. Andererseits
kann das Vorhandensein oder Fehlen der einzigen Eingangsrückmeldebewertung
r(U, Xi) in den Schritten (i)–(ii) ai und bi nicht sehr
voneinander verschieden machen. Eine leichte Variante dieser Lerntechnik
paßt einen
einzelnen globalen Satz von Attributgewichten für alle Teilnehmer an, indem
die Gewichtungen so angepaßt
werden, dass sie nicht das Fehlermaß eines spezifischen Teilnehmers
minimieren, sondern statt dessen das gesamte Fehlermaß aller Teilnehmer.
Diese globalen Gewichtungen werden als eine anfängliche Vorgabeeinstellung
für einen
Teilnehmer verwendet, welcher noch keinerlei Rückmeldung erzeugt hat. Gradientenabnahme
kann angewendet werden, um die individuellen Gewichtungen dieses
Teilnehmers über
der Zeit anzupassen. Selbst wenn die Attributgewichtungen zum Minimieren
des Fehlermaßes
für den
Teilnehmer U angewendet werden, ist das Fehlermaß im allgemeinen immer noch
positiv, was bedeutet, dass die Restrückmeldung von einem Teilnehmer
U sich noch nicht auf 0 bei allen Ziel- Objekten reduziert hat. Es ist nützlich anzumerken,
dass eine hohe Restrückmeldung
von einem Teilnehmer U bezüglich
eines Zielobjektes X anzeigt, dass der Teilnehmer U das Zielobjekt
X bei seinem gegebenen Profil unerwartet gut mochte, d. h. besser,
als es das Glättungsmodell
aus den Meinungen des Teilnehmers U bezüglich Zielobjekten mit ähnlichen
Profilen vorhersagen konnte. In ähnlicher Weise
zeigt eine niedrige Restrückmeldung
an, dass der Teilnehmer I das Zielobjekt X weniger als erwartet mochte.
Per Definition kann diese unerwartete Vorliebe oder Abneigung nicht
das Ergebnis der thematischen Ähnlichkeit
sein, und muß daher
als eine Anzeige der intrinsischen Qualität des Zielobjektes X betrachtet
werden. Daraus folgt, dass ein nützliches
Qualitätsattribut
für ein
Zielobjekt I der Mittelwertbetrag der Restrückkopplung rres(V,
X) von Teilnehmern bezüglich
dieses Zielobjektes, gemittelt über
alle Teilnehmer V ist, welche eine Relevanz-Rückmeldung bezüglich des
Zielobjektes lieferten. In einer Variante dieser Idee wird die Restrückkopplung
niemals unterschiedslos über
alle Teilnehmer gemittelt, um ein neues Attribut zu erzeugen, sondern
statt dessen geglättet,
um die Ähnlichkeit
von Teilnehmern untereinander zu berücksichtigen. Man erinnere sich,
dass das Qualitätsmaß q(U, X)
von dem Teilnehmer U, sowie von dem Zielobjekt X abhängt, so
dass ein gegebenes Zielobjekt X von unterschiedlichen Teilnehmern
als eine unterschiedliche Qualität
aufweisend wahrgenommen werden kann. In dieser Variante wird wie
vorstehend q(U, X) als eine gewichtete Summe von verschiedenen Qualitätsattributen
berechnet, welche nur von X abhängig
sind, aber dann ein zusätzlicher
Term hinzuaddiert, nämlich
ein Schätzwert
von rres(U, X) welcher durch Anwenden eines
Glättungsalgorithmus
auf bekannte Werte von rres(V, X) gefunden
wird. Hier reicht V über
alle Teilnehmer, welche eine Relevanz-Rückmeldung bezüglich des
Zielobjektes X lieferten, und der Glättungsalgorithmus ist auf die
Abstände
d(U, V) von jedem derartigen Teilnehmer V zu dem Teilnehmer U empfindlich.
-
Vergleichen
des Zielprofils des vorliegenden Programms mit einer Zielprofilinteressenzusammenfassung
eines Teilnehmers
-
Der
Prozess, mit welchem ein Teilnehmer diese Vorrichtung verwendet
um Programme zu betrachten, ist in Flußdiagrammform in 1 dargestellt. Bei dem Schritt 701 aktiviert
der Teilnehmer den Teilnehmerendgerätadapter 112. Der
Teilnehmer hat eine Teilnehmerzielprofilinteressenzusammenfassung
im Verteilungssystem 100 gespeichert. Wenn der Teilnehmer
einen Zugang zu Programmen bei dem Schritt 702 anfordert, berück sichtigt
die entweder in dem Verteilungssystem 100 oder in dem Teilnehmerendgerätadapter 112 angeordnete
Profilabgleichsoftware sequentiell jedes Suchprofil pk aus
der Teilnehmerzielprofilinteressenzusammenfassung, um zu ermitteln,
welche Programme am meisten wahrscheinlich für den Teilnehmer interessant sind.
Die Programme wurden bereits automatisch in einem früheren Schritt
in einen hierarchischen Gruppierungsbaum zusammengefaßt, so dass
die Ermittlung für
jeden Teilnehmer rasch erfolgen kann. Der hierarchische Gruppierungsbaum
dient als Entscheidungsbaum für
die Ermittlung, welche Programmzielprofile dem Suchprofil pk am ähnlichsten
sind: die Suche nach relevanten Programme beginnt an der Spitze
des Baums, und bei jeder Ebene des Baums werden die Verzweigung
oder die Verzweigungen ausgewählt,
welche Gruppierungsprofile besitzen, die pk am
nächsten
kommen. Dieser Prozess wird rekursiv ausgeführt, bis die Blätter des
Baums erreicht sind, wodurch die interessierenden individuellen
Programme des Teilnehmers identifiziert werden.
-
Eine
Variante dieses Prozesses nutzt die Tatsache, dass viele Teilnehmer ähnliche
Interessen haben. Statt die Schritte 5 bis 9 des vorstehenden Prozesses
getrennt für
jede Zielprofilinteressenzusammenfassung jedes Teilnehmers auszuführen, ist
es möglich,
eine zusätzliche
Effizienz zu erzielen, indem diese Schritte nur einmal für jede Gruppe ähnlicher
Zielprofilinteressenzusammenfassungen ausgeführt werden, und dadurch die
Bedürfnisse
vieler Teilnehmer auf einmal erfüllt
werden. In dieser Variante beginnt das System mit einer nicht-hierarchischen
Zusammenfassung in Gruppierungen aller Zielprofilinteressenzusammenfassungen
einer großen
Anzahl von Teilnehmern. Für
jede Gruppierung k der Zielprofilinteressenzusammenfassung mit dem Gruppierungsprofil
pk lokalisiert sie Programme mit zu pk ähnlichen
Zielprofilen. Jedes lokalisierte Programm wird dann als für jeden
Teilnehmer interessierend identifiziert, welcher eine Zielprofilinteressenzusammenfassung
besitzt, die in der Gruppierung k der Zielprofilinteressenzusammenfassungen
repräsentiert
ist.
-
Präsentation
von Programmlisten an den Teilnehmer
-
Sobald
der Profilkorrelationsschritt für
einen ausgewählten
Teilnehmer oder eine Gruppe von Teilnehmern abgeschlossen ist, speichert
die Programmauswahlsoftware bei dem Schritt 704 eine Liste
der identifizierten Programme für
die Präsentation
an den Teilnehmer. Auf Anforderung eines Teilnehmers holt der Prozessor 406 die
erzeugte Liste relevanter Programme und präsentiert diese Liste von Titeln
der ausgewählten Programme
dem Teilnehmer, welcher dann bei dem Schritt 705 irgendein
Programm für
die Betrachtung auswählen
kann. Die Liste der Programmtitel ist gemäß dem Grad der Ähnlichkeit
des Programmzielprofils zu der ähnlichsten
Teilnehmerzielprofilinteressenzusammenfassung sortiert.
-
Überwachung
der betrachteten Programme
-
Der
Prozessor 406 überwacht
bei Schritt 707 welche Programme der Teilnehmer betrachtet,
und verfolgt, wieviel Zeit bei der Betrachtung des Programms aufgewendet
wird. Diese Information kann mit dem Maß der Tiefe des Teilnehmerinteresses
an dem Programm kombiniert werden, was eine passive Relevanz-Rückmeldungsbewertung
wie vorstehend beschrieben ergibt. Die genauen Details hängen von
der Länge
und der Art der gesuchten Programme ab. Das berechnete Maß der Programmattraktivität kann dann
als eine Gewichtungsfunktion zur Einstellung der Teilnehmerzielprofilinteressenzusammenfassung
verwendet werden, um dadurch genauer die sich dynamisch verändernden
Interessen des Teilnehmers zu reflektieren.
-
Aktualisierung
von Teilnehmerprofilen
-
Eine
Aktualisierung einer Teilnehmerzielprofilinteressenzusammenfassung
kann bei dem Schritt
708 unter Verwendung des in der gleichzeitig
anhängigen
U.S. Patentanmeldung Ser. Nr. 08/346,425 (S.N.
US 5,758,257 ) beschriebenen Verfahrens
durchgeführt
werden. Wenn ein Programm betrachtet wird, verschiebt das Verteilungssystem
100 die
Zielprofilinteressenzusammenfassung leicht in die Richtung der Zielprofile
derjenigen naheliegenden Programme, für welche das berechnete Maß der Programmattraktivität hoch war.
Bei einer gegebenen Zielprofilinteressenzusammenfassung mit Attributen
u
ik aus einem Teilnehmerzielprofilinteressenzusammenfassungssatz,
und einem Satz von J Programmen, welche mit (derzeitig als korrekt
angesehenen) Attributen d
jk verfügbar sind,
wobei I Teilnehmer indiziert, j Programme indiziert und k Attribute
indiziert, würde
vorhergesagt werden, dass der Teilnehmer I einen Satz von P bestimmten
Programmen auswählen
würde,
um die Summe von d(u
i, b
j) über den
gewählten
Programmen j zu minimieren. Die gewünschten Attribute u
ik eines Teilnehmers und Attribute d
jk eines Programms wären eine bestimmte Form von
Worthäufigkeiten
wie z. B. TF/IDF, wie beispielsweise aus Programmbeschreibungen
oder des Zusammenfassungstextes des Programms und möglicherweise
weitere Attribute wie z. B. die Quelle, und die Länge des
Programms, während d(u
i, d
j) der Abstand
zwischen diesen zwei Attributvektoren (Profilen) unter Verwendung
des vorstehend beschriebenen Ähnlichkeitsmaßes ist.
Wenn der Teilnehmer einen anderen Satz von P Programmen als vorhergesagt
auswählt,
sollte der Prozessor
406 versuchen, u und/oder d anzupassen,
um die Programme welche der Teilnehmer ausgewählt hat, genauer vorherzusagen.
Insbesondere sollten u
i und/oder d
j verschoben werden, um deren Ähnlichkeit
zu vergrößern, wenn
vorhergesagt wurde, dass der Teilnehmer nicht das Programm j wählt, aber
es wählte,
und möglicherweise
deren Ähnlichkeit
zu verkleinern, wenn vorhergesagt wurde, dass der Teilnehmer das
Programm j wählt,
es aber nicht wählte.
Ein bevorzugtes Verfahren besteht darin u für jede falsche Vorhersage,
dass der Teilnehmer kein Programm j auswählt, unter Verwendung der Formel
u
ik' =
u
ik – e(u
ik, d
jk) zu verschieben.
-
Hier
wird ui als die Zielprofilinteressenzusammenfassung
aus dem Zielprofilinteressenzusammenfassungssatz des Teilnehmers
I gewählt,
welche dem Zielprofil am nächsten
kommt. Wenn e positiv ist, vergrößert diese
Anpassung die Übereinstimmung
zwischen dem Zielprofilinteressenzusammenfassungssatz des Teilnehmers
I und den Zielprofilen der Programme, welche der Teilnehmer I tatsächlich wählt, indem
ui näher
an dj für
den Fall gebracht wird, in welchem der Algorithmus nicht das Programm
vorhersagte, das der Betrachter auswählte. Die Größe e bestimmt,
wie viele Beispielprogramme jemand sehen muß, um die Zielprofilinteressenzusammenfassung
wesentlich zu ändern.
Wenn e zu groß ist,
wird der Algorithmus instabil, jedoch für ein ausreichend kleines e
steuert er u auf seinen korrekten Wert. Im allgemeinen sollte e
proportional zu dem Maß der
Programmattraktivität
sein; beispielsweise sollte es relativ hoch sein, wenn ein Teilnehmer
I eine lange Zeit mit dem Lesen des Programms j verbringt. Man könnte theoretisch
auch die vorstehende Formel zur Verringerung der Übereinstimmung
in dem Falle verwenden, in welchem der Algorithmus ein Programm
vorhersagte, das der Teilnehmer nicht gelesen hat, indem e in diesem
Falle negativ gemacht wird. Jedoch liegt keine Garantie vor, dass
sich u in diesem Falle in die korrekte Richtung bewegt. Man kann
auch die Attributgewichtungen wi des Teilnehmers
I durch einen ähnlichen
Algorithmus verschieben: Wik' = (wik – e|uik – djk|)Σk(wik – e|uik – djk|)
-
Dieses
ist besonders wichtig, wenn man Worthäufigkeiten mit anderen Attributen
kombiniert. Wie vorstehend erhöht
dieses die Übereinstimmung
wenn e positiv ist – für den Fall,
in welchem der Algorithmus nicht das Programm vorhersagte, das der
Teilnehmer las, dieses Mal durch die Verringerung der Gewichtungen
derjenigen Eigenschaften, für
welche sich das Teilnehmerzielprofil ui von
dem Programmprofil dj unterscheidet. Wiederum
bestimmt die Größe von e
wie viele Beispielprogramme jemand sehen muß, um das zu ersetzen, was
ursprünglich
angenommen wurde. Anders als die Prozedur für die Anpassung u macht man
von der Tatsache Gebrauch, dass der vorgenante Algorithmus die Anpassung
verringert, wenn e negativ ist – für den Fall, in
welchem der Algorithmus ein Programm vorhersagte, das der Teilnehmer
nicht las. Der Nenner des Ausdrucks verhindert, dass Gewichtungen
mit der Zeit auf Null schrumpfen, indem die modifizierten Gewichtungen wi' neu
normiert werden, dass die Summe 1 ist. Sowohl u als auch w können für jedes
genutzte Programm angepaßt
werden. Wenn e klein ist, wie es sein sollte, besteht kein Konflikt
zwischen den zwei Teilen des Algorithmus. Die ausgewählte Teilnehmerzielprofilinteressenzusammenfassungsgruppe
wird bei dem Schlitz 708 aktualisiert.
-
Zusätzliche
Anwendungen
-
Die
vorstehend angegebene Anwendung des Datenverteilungssystems der
vorliegenden Erfindung auf ein Kabelfernsehsystem soll nicht den
Schutzumfang der Erfindung einschränken. Das hierin offenbarte Grundkonzept
ist auf viele Anwendungen anwendbar, welche die Verwendung einer
Teilnehmerendgerätvorrichtung
implizieren, welche eine eingeschränkte Datenspeicherkapazität besitzt,
und wenn eine eingeschränkte
Bandbreite zur Übertragung
von Daten zur Verfügung
steht, obwohl die Teilnehmerendgerätvorrichtung einen Zugriff
auf eine Fülle
von Information hat. Eine Anzahl derartiger Anwendungen wird hierin
angegeben, um einige signifikante Klassen dieser weiteren Anwendungen
dieses Systems zu veranschaulichen.
- 1. Verbesserte
interaktive Verkaufs- und Produktdemonstration – Das vorliegende Datenverteilungssystem ermöglicht die
Verwendung von deskriptiver Information, das Prinzip der Bezugslokalität und der
Interessen-basierenden Auswahl, um den von einer Teilnehmerendgerätvorrichtung
verwendeten Speicher zu reduzieren. Da die Schlüsselmerkmale des Datenverteilungssystems
die automatisierte Ermittlung der Benutzerin teressen und das Vorabholen
umfassen, ist eine natürliche
Anwendung des Datenverteilungssystems eine Verbesserung der derzeitigen
Home-Shopping-Technologien, mit einer interaktiven Menü-basierenden
Katalogdurchsicht. Die Interessen-basierenden Auswahlmerkmale erlauben
es Händlern,
benutzerspezifische Kataloge auf der Basis früherer Auswahlen zu erzeugen.
Das offenbarte Datenverteilungssystem kann auf vielen Ebenen von
der Auswahl spezifischer Präsentationen
bis zur Auswahl von "Kanälen" eingesetzt werden,
auf welchen geeignete Produktinformation verfügbar ist. Zusätzlich stellen
viele Hersteller von Werkzeugen, Geräten und Küchenvorrichtungen Videodemonstration
der verwendeten Vorrichtungen bereit, welche Benutzer ermuntern,
die Vorrichtung effektiv zu nutzen, und welche Nicht-Besitzer ermuntern,
Käufer
zu werden. Das Datenverteilungssystem ermöglicht, dass die Beschreibungen
der Vorrichtungen an ein großes
Publikum möglicher
Benutzer geliefert werden, welche ein Interesse an der Vorrichtung
haben.
- 2. Hand-Reiseführerassistent – Das vorliegende
Datenverteilungssystem kann dazu verwendet werden, (über das
Web) für
Reisende relevante Information herunterzuladen, wobei die Information
von dem Nutzer identifiziert wird oder automatisch auf einer Ortsbasis
mittels GPS (oder ein lokales HF-Signal) identifiziert werden kann.
Dieses umfaßt
nicht nur Straßen
und Reisebedingungen, sondern auch auf die Lage von Tankstellen,
Restaurants, Unterkünften,
Sehenswürdigkeiten
und deren zugeordneten Betriebszeiten. Einige lokale Geschäfte können auch
Kataloginformation über
ihre Produkte, Dienste und speziellen Werbeaktionen anpassen wollen,
oder können
einen umfassenden Web-basierenden Katalog mit eingeschränkten geographisch-spezifischen
Auswahlmöglichkeiten
anbieten wollen. Somit können
die vorliegend beschriebenen Ähnlichkeitsmaße dazu
genutzt werden, um selektiv die Produktauswahlen zu präsentieren,
welche für
den Benutzer am meisten für
jeden gegebenen lokalen Katalog interessant sind. Dieses System
kann Karteninformation in einer Mehrkanalumgebung bereitstellen.
Es werde ein 5-Kanal-System betrachtet, welches einen Kanal für Karteninformation
und 4 Kanäle
für eine "gezoomte" Karteninformation
bei einem Faktor von zweifacher Vergrößerung bereitstellt. Die Profilinformation
könnte
zur Detektion genutzt werden, wann spezielle Merkmale wahrscheinlich
die Aufmerksamkeit des Betrachters auf sich ziehen, um Karteninformation
auf der Basis dieser Eigenschaften (Gewässer, Gebäude, Flughäfen, usw.) vorab zu holen.
Es ist leicht zu sehen, dass mit mehreren Kanälen diese Karteninformation
in einer Vielzahl von Richtungen als auch Vergrößerungen bereitgestellt werden
könnte.
In diesem System wird der Speicher optimiert, indem selektiv Informationsdetails
von für
das Benutzerinteresse relevanten Orten heruntergeladen werden. Viele
Reisewerbungen verwenden Videoclips oder Bilder, um die visuellen
Merkmale von lokalem Interesse darzustellen. Die kundenspezifische
Anpassung dieser Präsentationen
auf der Basis des Nutzerinteresses kann eine raschere und einsichtigere
Auswahl von Zielorten sicherstellen, was sowohl der Reiseindustrie als
auch dem Kunden nutzt. Diese Verfahren kann entweder mit einem Kanalauswahl-,
Indexierungs- oder speziellen Anpassungs-Dienst angewendet werden.
Ferner sind Museen tendenziell in hohem Maße visuell, und besitzen trotzdem
deskriptive Information oder Zusammenfassungen über die Ausstellungsstücke für Besucher,
welche mehr Information über
Themen und Ausstellungsstücke
suchen. Das in dieser Anmeldung offenbarte Datenverteilungssystem
kann spezifisch angepaßte
Museumstouren ermöglichen,
kann Menüs
mit geeigneten Auswahlmöglichkeiten
aus einer Mehrkanalumgebung entwickeln, oder kann mit Echtzeit-"Kanal-Surfing" von Kanälen auf
der Basis des Benutzerinteresses Unterstützung bieten.
- 3. Das Datenverteilungssystem kann entscheiden, welche Auswahlen
herunterzuladen sind, und bezüglich der
heruntergeladenen Auswahlen auch die Detailauflösung entscheiden, welche auf
der Basis des von dem System vorhergesagten Benutzerinteresses empfohlen
wird. Somit kann das Datenverteilungssystem entweder herunterladen:
a) das vollständige
Video, b) eine Standgrafik, c) eine Textbeschreibung, d) eine Zusammenfassung
der Textbeschreibung, e) den Auswahltitel aus einem Verzeichnis
oder Menü,
f) das Element in keinem Fall herunterladen.
- 4. Immobilien-Vorbesichtigungen – Immobilienkauf ist einer
der größten Käufe welche
von den meisten Verbrauchern in ihrem Leben gemacht werden, und
trotzdem ist das Informationssystem extrem primitiv. Insbesondere
werden einfache Schwarzweißfotos
mit einfachen Textbeschreibungen verwendet, um Kunden zu einer Immobilienagentur
oder einem privaten Verkäufer
zu locken, welcher dann ein ausführliches
Datenblatt und möglicherweise
einen Besuch des Gebäudes
ermöglicht,
wenn Interesse besteht. Dieses ist zeitaufwendig, und wenn das Haus
vom Eigentümer
bewohnt ist, möglicherweise
für potentielle
Käufer,
den Verkäufer
und den Makler unangenehm. Das Datenverteilungssystem ermöglicht eine
verbesserte Auswahl und Präsentation
von Information für
potentielle Käufer,
einschließlich
möglicher
Videoclips und einer größeren Bibliothek
von Fotografien. Abhängig
von der Perspektive des Käufers,
Maklers oder Verkäufers
bietet das Datenverteilungssystem effektiver Häuser vorab an, verringert die
Verkaufskosten und die benötigte Zeit
für die
Besichtigung von ungeeigneten Häusern,
und erspart dem Käufer
einen möglichen
großen
Aufwand an Unbequemlichkeit.
- 5. Smart Card-Werberabatte – Wie
bei der derzeitigen Hand-Pager-(Personensuchsystem)-Technologie
ist es möglich,
einfache Nur-Empfangs-Geräte
mit niedrigeren Kosten zu bauen, welche die hierin offenbarten Konzepte
verkörpern.
Insbesondere ist es eine einfache technische Aufgabe (siehe "A Distributed Location System
for the Active Office" A.
Harter and A. Hopper, IEEE Network, Jan./Feb. 1994, pp. 62.70) Identität anzeigende
Bakensender mit niedriger Bandbreite zu bauen und diesen mit einem
Empfänger
zu koppeln, welcher in der Lage ist, mit höheren Raten von einer Rundfunkquelle,
wie z. B. einem Satelliten, einer Rundfunksendeantenne oder einer
Basisstation oder dergleichen zu empfangen. Wenn sie als ein Aspekt
von zukünftigen "Smart Card"-Systemen betrachtet
wird, würde
die vorliegende Erfindung das Herunterladen einer Vielzahl für den Nutzer
nützlicher
Informationen in eine derartige "Smartcard"-Vorrichtung ermöglichen.
Insbesondere könnten
Coupon-artige elektronische Kredite in eine Smart Card geladen werden,
um gezogen zu werden, wenn Käufe
durchgeführt
werden. Auf diese Weise könnten
die Funktionen einer Direktversandwerbung in der elektronischen
Verbreitungsmöglichkeit
der vorliegenden Erfindung wiederholt werden. In der "Smart Card"-Vorrichtung aufbewahrte
Kaufaufzeichnungen bilden einen Teil des Benutzerprofils für diese
Anwendung, welche die Wahl entsprechender elektronischer Coupons
zum Herunterladen aus der Rundsendevorrichtung vorschlagen. Die
Speicherreduzierungstechnologie der vorliegenden Erfindung weist
deutliche Kosten- und
Leistungsvorteile für
diese Umgebung auf.
-
Zusammenfassung
-
Das
Datenverteilungssystem baut automatisch sowohl ein Zielprofil für jedes
Zielobjekt (Programm) auf, das rundgesendet wird, sowie eine "Zielprofilinteressenzusammenfassung" für jeden
Teilnehmer, wobei die Zielprofilinteressenzusammenfassung den Interessegrad
des Teilnehmers an verschiedenen Arten von Zielobjekten beschreibt.
Das System bewertet dann die Zielprofile gegenüber den Teilnehmerzielprofilinteressenzusammenfassungen,
um eine an Teilnehmer-spezifisch angepaßte Rangfolgenliste von Zielobjekten
zu erzeugen, welche höchst
wahrscheinlich für
jeden Teilnehmer von Interesse sind, so dass der Teilnehmer aus diesen
möglicherweise
relevanten Zielobjekten auswählen
kann, welche automatisch durch dieses System aus der Vielzahl verfügbarer Zielobjekte
auf dem Datenverteilungssystem ausgewählt wurden. Diese Architektur
bietet mehrere Vorteile. Erstens können Technologieaktualisierungen
in dem Kern des Datenverteilungsnetzwerkes ausgeführt werden,
ohne einen Zugriff auf das Teilnehmerendgerät zu erfordern. Zweitens ergeben
sich signifikante Einsparungen in der Datenspeicherung, welche sich
aus der Multiplexierung dieser Verzeichnisinformation über Teilnehmerpopulationen
ergibt. Drittens kann sogar eine extrem eingeschränkte Speichermenge
in dem Endgerätadapter
komplexe Informationsströme
Teilnehmerinteressen mit vollständiger
Allgemeinheit handhaben.