DE69821092T2

DE69821092T2 - Rundfunkdatenverteilsystem mit asymmetrischen auf- und abwärtsverbindungsbandbreiten

Info

Publication number: DE69821092T2
Application number: DE69821092T
Authority: DE
Inventors: S. Frederick Canaan Valley Davis HERZ; M. Jonathan SMITH; David Wachob
Original assignee: Pinpoint Inc
Current assignee: Pinpoint Inc
Priority date: 1997-02-21
Filing date: 1998-02-17
Publication date: 2004-11-11
Anticipated expiration: 2018-02-18
Also published as: DE69821092D1; AU6175198A; WO1998037696A1; ATE257996T1; EP0962098B1; CA2282241A1; JP2001513278A; EP0962098A1

Description

GEBIET DER ERFINDUNG
Diese Erfindung betrifft das Gebiet von Datenverteilungssystemen und umfaßt ein in dem System der Datenverteilung vorhandenes Verfahren, um die Effizienz der Datenübertragung zu verbessern, um dadurch die Speicheranforderungen eines Teilnehmernetzwerk-Endgeräts zu verringern. Dieses ermöglicht die Implementation des Teilnehmernetzwerk-Endgeräts als eine einfache preiswerte Endgerätvorrichtung, welche eine Schnittstelle zu einem sich ständig veränderndem und die Kapazität erweiterndem Datenverteilungssystem bilden kann und trotzdem den Teilnehmer mit der notwendigen Information versorgen kann, um effizient auf die Fülle der verfügbaren Daten für den Teilnehmer über das Datenverteilungssystem zuzugreifen.
STAND DER TECHNIK
WO 95/15658 offenbart einen Netzwerkmanager, welcher Kabelkopfstationskomponenten und Set-Top-Endgeräte in einem Fernsehprogrammverteilungssystem überwacht und verwaltet. Es werden Kundenmenüs bereitgestellt, welche dem Kunden verfügbare Programme vorschlagen, welche wahrscheinlich auf der Basis historischer Daten der von dem Teilnehmer zuvor betrachteten Programme wahrscheinlich von Interesse sind.
PROBLEM
Es ist ein Problem auf dem Gebiet der Datenverteilungssysteme, einen Teilnehmer mit einer einfachen preiswerten Endgerätvorrichtung auszustatten, welche eine Schnittstelle zu einem sich verändernden Datenverteilungssystem bereitstellen und trotzdem den Teilnehmer mit der Information vorsorgen kann, welche erforderlich ist, den Teilnehmer in die Lage zu versetzten, effizient auf die Fülle der für den Teilnehmer verfügbaren Daten über das Datenverteilungssystem zuzugreifen. Die interessierenden Datenverteilungssysteme sind typischerweise Kabelfernseh-(CATV)- oder Digitale Rundfunksatelliten-(DBS – Digital Broadcast Satellite)-Systeme, welche gleichzeitig Multimediadaten ströme auf einer Vielzahl von Kanälen zu einem Teilnehmerendgerätadapter senden, welcher bezüglich Speicher und Funktionalität eingeschränkt ist, und welcher die Funktion hat, einen ausgewählten von der Vielzahl von Rundfunkkanälen für die Anzeige auf einer Anzeigevorrichtung, wie z. B. auf einem Teilnehmerfernsehgerät anzuzeigen. Zusätzlich verfügt das Internet über die inhärente Fähigkeit in diese Klasse von Datenverteilungssystemen aufgrund seiner Fähigkeit, Daten an eine verteilte Klientel zu verteilen, einbezogen zu werden.
In den 1960-ern und 1970-ern waren die Datenübertragungsmöglichkeiten eingeschränkt, und daher waren nur die Auswahl von wenigen Rundfunkkanälen für einen Teilnehmer eines CATV- oder DBS-Netzwerks verfügbar. Derzeit stellen typische DBS- und CATV-Netzwerke mehrere zehn Kanäle bereit, und es wird erwartet, dass in der nahen Zukunft Hunderte von Kanälen gleichzeitig an die Teilnehmer über CATV- und DBS-Netzwerke gesendet werden. Dieses ist sowohl aus der Perspektive von Teilnehmern als auch Inhalteanbietern erwünscht, da zunehmend spezialisierte Information erzeugt, unterteilt und an ausgewählte Gruppen von Teilnehmern geliefert werden kann, deren Interessen mit dem Inhalt der gesendeten Information übereinstimmen. Ein unerwünschtes Nebenprodukt dieser Fülle von Information ist die Informationsüberlastung, und ein Großteil der Teilnehmerzeit wird durch "ständiges Kanalumschalten" verschwendet. Dieses ständige Kanalumschalten stellt den Versuch des Teilnehmers dar, relevante und/oder interessierende Information aus der Welt der Rundfunkinformation zu lokalisieren, die durch methodisches Umschalten zwischen den verfügbaren Rundfunkkanälen verfügbar ist. Dieser Prozess ist ineffizient und stellt eine erhebliche Reduzierung der an den Teilnehmer gelieferten Information aufgrund des Unvermögens des Teilnehmers dar, die gewünschte Information rechtzeitig zu lokalisieren.
Ein Problem bei der Lieferung von Information an Teilnehmer ist die Implementation der Netzwerkschnittstellenvorrichtung des Teilnehmers, welche es dem Teilnehmer ermöglicht, eine Schnittstelle zu dem Datenverteilungssystem aufzubauen. Es gibt verschiedene Szenarien für die Teilnehmernetzwerk-Schnittstellevorrichtung. Eine besteht in der Verwendung von intelligenten, hochfunktionalen Vorrichtungen, wie z. B. Personal-Computern. Dieses ist derzeit ein unwahrscheinliches Szenario aus drei Gründen. Erstens sind Personal-Computer in weniger als 30% von US-Haushalten vorhanden, während CATV derzeit in 65% der Haushalte vorhanden ist. DBS besitzt eine niedrigere Durchdringung als die Personal-Computer oder CATV-Systeme (derzeit weniger als 5%), soll aber mit der Zeit zunehmen. Das Problem mit der Notwendigkeit des Kaufs einer relativ teueren Teilnehmernetzwerk-Schnittstellenvorrichtung besteht darin, dass sie den Stückzahlenverkauf verhindert, indem sie das Marktpotential stark einschränkt. Zweitens ist der Personal-Computermarkt durch Komponentenanbieter gekennzeichnet, welche darum konkurrieren, Technologien zu verkaufen, wie z. B. Netzwerkadapter und Monitore. Zusätzlich sind viele Personal-Computer aus Komponenten zusammengesetzt, welche von verschiedenen Lieferanten gefertigt werden, und das sich ergebende Produkt wird an Verbraucher mit spezieller Preis/Leistungs-Charakteristik verkauft. Dieses erzeugt eine nahezu ungeeignete Umgebung vom Gesichtspunkt des Entwurfs einer Teilnehmernetzwerk-Schnittstellenvorrichtung mit breit gestreuter Anwendbarkeit, welche von einem Geschäftsgesichtspunkt aus für CATV-Kosten erforderlich ist. Unterschiedliche Softwareversionen und deren inkompatiblen Anforderungen verkomplizieren ferner die Interoperabilität. Drittens verstärkt die Verwendung eines Personal-Computers ferner das Risiko des bei VCRs (Videorekordern) zu sehenden Phänomens der "blinkenden 12:00", da die Komplexität des Personal-Computers, wenn er als die Teilnehmer-Schnittstellenvorrichtung verwendet wird, technologisch eingeschränkte Teilnehmer daran hindert, Zugriff auf die Information zu erlangen.
Ein wesentlich wahrscheinlicheres Szenario ist die Verwendung eines spezialisierten Endgerätadapters, welcher derzeit auf dem Gebiet der Medien als eine "Set-Top-Box" (Aufsatzgerät) bezeichnet wird. In diesem Szenario umfaßt die Teilnehmer-Schnittstellenvorrichtung ein Standardfernsehgerät, welches mit einem Endgerätadapter ausgerüstet ist, welcher für die Aufgabe des Zugriffes auf Multimediadatenströme für den Teilnehmer spezialisiert ist, und diese Information über das Fernsehgerät präsentiert. Dieser Endgerätadapter enthält Mikroprozessoren sowie jede Logik, die für die Auswahl, Dekomprimierung und Demultiplexierung der derzeit gesendeten Multimediadatenströme erforderlich ist. Der Endgerätadapter bearbeitet auch Außer-Band-Signalisierungsaufgaben, wie z. B. den Autorisierungszugriff auf eingeschränktes Material und die Ausführung jedes für eine Teilnehmer/Serviceanbieter-Interaktion erforderlichen Protokolls. Mehrere widerstreitende Faktoren sind bei der Optimierung des Endgerätadapters am Werk. Erstens muß, da in vielen Fällen Dienstkosten durch den Dienstanbieter entstehen, und Dienstausfälle die Teilnehmer verärgern, der Endgerätadapter robust sein. Zweitens muß der Endgerätadapter flexibel genug sein, um sich an jedes vorhersehbare Informationslieferungsszenario innerhalb der Begrenzungen der DBS- oder CATV-Infrastrukturen anzupassen. Schließlich muß der Endgerätadapter preiswert genug sein, um innerhalb der Möglichkeiten eines Teilnehmerkaufes oder einer schnellen Kostenamortisierung durch Leasing für den Teilnehmer zu liegen. Es ist wichtig anzumerken, dass in dem letzteren Szenario, obwohl die Kosten über eine erhebliche Zeitdauer amortisiert werden können, die monatliche Rechnung für den Teilnehmer nicht die Kosten von Filmmietgebühren überschreiten sollte, oder in Hinblick auf staatliche Aufsichtsbehörden zu teuer sein sollte.
Der Endgerätadapter enthält sowohl einen Prozessor als auch Speicher, welcher einen größeren Kostenfaktor darstellt. Dieser Speicher unterstützt die Speicherung und Verarbeitung von Daten und für viele Berechnungsanwendungen besteht der einfachste Weg, eine Berechnungsanwendung zu beschleunigen, in der Hinzufügung von mehr Speicher. Leider gibt es mehrere Faktoren, welche die Ausrüstung des Endgerätadapters mit erheblichem Speicher ausschließen. Der erste besteht in den Kosten des Speichers, welche sich sowohl aus der Menge des erforderlichen Speichers als auch den Typ der für den Endgerätadapter erforderlichen Teile ergibt. Nicht-flüchtige RAMs sind für wenigstens einen Teil des Datenspeichers erforderlich, um mit Auswirkungen auf die Zuverlässigkeit aufgrund von Netzausfällen oder von Teilnehmern, welche den Netzadapter abtrennen, fertig zu werden. Der zweite Faktor besteht in der Notwendigkeit eine Aktualisierung der Hardware des Endgerätadapters zu vermeiden, da diese eine teuer zu implementierende Operation ist. Eine Informationsverteilungsarchitektur, welche sehr viel Speicher bei dem Endgerätadapter erfordert, zwingt die Techniker zur regelmäßigen Ausführung von Aktualisierungen am Ort des Teilnehmers, da frühere Installationen veralten.
CATV-"Convertor"-Boxen der neuen Generation stellen Speicherplatz für Information bezüglich aktueller Rundfunk- oder hinzukommender Programme (oder allgemeiner, Multimediaströme) bereit. Die Speicherung dieser "Programmführungs"-Information in dem Endgerätadapter ist mit der Größenordnung von 170 kByte ziemlich speicherintensiv, und wird mit der Zunahme in der Kanalverfügbarkeit Vergrößerungen erfordern, welche proportional zu der Anzahl zusätzlicher Kanäle sind. Der in dem Endgerätadapter erforderliche große Speicher ist eine Folge des Mangels an Information über den Geschmack und die Interessen des Zuschauers, welche dazu genutzt werden könnte, um Untersätze einer deskriptiven Information für die lokale Speicherung in dem Endgerätadapter auszuwählen. Da keine derartige Information zur Verfügung steht, muß die gesamte Indexierungs- und Deskriptionsinformation bezüglich der Vielfalt gleichzeitiger Rundfunkprogramme gesendet und in dem Speicher des Endgerätadapters gehalten werden. Daher gibt es derzeit keine effektive Endgerätadapter/Datenverteilungs-Systemarchitektur oder einen Betrieb, welche den Bedarf des Teilnehmers, eine Programmführungsinformation in dem Endgerätadapter zu haben und trotzdem sparsam in der Nutzung von teurem Speicher ist, zu befriedigen.
Eine weitere Anwendung dieser Technologie ist das Gebiet des Datenabrufs, wobei der Teilnehmer Daten spezifischer Natur statt Standardrundfunkprogrammware anfordert. In diesem Falle muß das Informationsverteilungssystem unterscheiden, welche Information von dem Teilnehmer angefordert wird und einen effizienten Mechanismus zur Lieferung dieser Information bereitstellen. Die Lieferung derartiger Information ist kompliziert, wenn der Teilnehmer mobil ist und Information aus einer Informationsquelle anfordert, welche nicht die "Heimatort"-Informationsquelle des Teilnehmers ist. Derartige Fälle umfassen zellulare Kommunikations- oder persönliche Kommunikationssystemanwendungen sowie die Anwendung des allgemeinen Internetzugangs. Der Teilnehmer kann auf jeden dieser Dienste von jeder physikalischen Stelle aus zugreifen, indem er eine Verbindung zu einem lokalen Anbieter derartiger Dienste herstellt. Die von dem Teilnehmer angeforderte Information kann ortsspezifisch sein, oder kann tageszeitspezifisch sein, und die existierenden Informationsverteilungssysteme können derartige spezifische Anfragen nicht in einer Weise erzeugen, welche für den Teilnehmer zweckmäßig ist.
LÖSUNG
Die vorstehenden Probleme werden gelöst und ein technischer Fortschritt auf diesem Gebiet durch das Verfahren der Optimierung der Kommunikation der vorliegenden Erfindung gemäß Definition in Anspruch 1 erreicht. Die zugrundeliegende Architektur des Datenverteilungssystems ist typischerweise ein hierarchisches Netzwerk, wie z. B. Kabelfernsehen. Das Datenverteilungssystem stellt daher eine hierarchische Filterung des Dateninhaltes der von einem Teilnehmer angeforderten oder für diesen verfügbaren Information bereit, um die zur Erfüllung einer Teilnehmerinformationsanforderung erforderliche effektive Bandbreite zu verringern.
In den Ausführungsformen baut, um diese effektive Filterung zu erreichen, dieses Datenverteilungssystem automatisch sowohl ein Zielprofil für jedes Zielobjekt (Programm oder Informationsreaktion) auf, das gesendet wird, sowie ein "Zielprofilinteressenzusammenfassung" für jeden Teilnehmer, wobei diese Zielprofilinteressenzusammenfassung den Interessegrad des Teilnehmers an verschiedenen Typen von Zielobjekten beschreibt. Das Datenverteilungssystem bewertet dann die Zielprofile gegenüber den Zielprofilinteressenzusammenfassungen des Teilnehmers, um eine Teilnehmer-spezifische Rangfolgenliste von Zielobjekten zu erzeugen, welche höchstwahrscheinlich für jeden Teilnehmer von Interesse sind, so dass der Teilnehmer aus diesen möglicherweise relevanten Zielobjekten auswählen kann, welche automatisch durch dieses System aus der Fülle von in dem Datenverteilungssystem verfügbaren Zielobjekten ausgewählt wurden. Die Zielobjekte selbst werden in eine Vielzahl von Informationssegmenten unterteilt, was es dem Datenverteilungssystem ermöglicht, den Teilnehmer mit verarbeitbaren Datenmengen zu versorgen. Diese Inhalt-basierenden Ähnlichkeitsmaße helfen bei der Ermittlung der an den Teilnehmer zu übertragenden Informationssegmente und deren Reihenfolge bei der Übertragung. Die Ähnlichkeitsmaße können auch zum Vorabholen von Informationssegmenten und Liefern dieser Segmente an den Teilnehmer in einer Bandbreite einsparenden Weise genutzt werden. Diese Fähigkeit ist auf mobile Anwender erweiterbar, welche den Ort wechseln, und die Lieferung von ortsspezifischer Information als eine Funktion ihres sich verändernden Ortes benötigen.
Diese Architektur bietet mehrere Vorteile. Erstens können Technologieaktualisierungen in dem Kern des Datenverteilungsnetzwerkes durchgeführt werden, ohne eine Zugriff auf Teilnehmerendgerätvorrichtungen zu erfordern. Zweitens ergeben sich signifikante Einsparungen bei der Datenspeicherung, welche aus der Multiplexierung dieser Verzeichnisinformation über die Teilnehmerpopulationen resultiert. Drittens kann sogar eine extrem eingeschränkte Speichermenge in dem Endgerätadapter komplexe Informationsströme und Teilnehmerinteressen mit vollständiger Allgemeinheit aufgrund der Segmentierung der Zielobjekte handhaben.
In der Ausführungsform besteht das Datenverteilungssystem aus Clients, welche die Endgerätadapter mit extrem eingeschränkter Datenspeicherkapazität sind, und aus Servern, welche Daten, wie z. B. Multimediainformation (wie etwa Lifeprogrammzuspielun gen und/oder Video-on-Demand) und deskriptive Information (Verzeichnisinformation, Pläne, Indizes) für die Multimediainformation enthalten. Die Clients werden als unter der physikalischen Kontrolle der Teilnehmer stehend betrachtet, während die Server in die physikalische Infrastruktur des Datenverteilungssystems eingebettet sind. Der Schlüssel zu einer Architektur mit eingeschränkter Datenspeicherung sind die intelligente Nutzung eines lokalen Speichers, optimierte Speicherdurchsatzverwaltungsalgorithmen, die Nutzung von Zielprofilinteressenzusammenfassungsinformation und der Rückgriff auf ein Kommunikationsprotokoll zwischen dem Client und Server, um den lokalen Speicher über Serveraktualisierungen und Clientanforderungen zu aktualisieren. Dieses führt zu einer verteilten Architektur für Verzeichnisinformation, welche gegenüber Veränderung robust ist, preiswert ist, und die CATV/DBS-Infrastruktur selbst nutzt, um diese Eigenschaften zu bewahren. In der Praxis ist der Client der Endgerätadapter, welcher aus der "Set-Top-Box" besteht. Der von dem Server verwendete allgemeine Algorithmus zum Bereitstellen der Verzeichnisinformation für den Client ist wie folgt:

1. Wenn neue Verzeichnisinformation in den Server geladen wird, lädt der Server die Information in eine Plandatenstruktur. Wenn diese Information eine Aktualisierung einer zuvor empfangenen Verzeichnisinformation darstellt, werden die Empfänger der vorherigen Verzeichnisinformation (die "Kopiegruppe") informiert, dass sie diese zuvor empfangene Verzeichnisinformation löschen sollten. Dieses stellt sicher, dass, die bei jedem Client gespeicherte Verzeichnisinformation, obwohl sie nicht notwendigerweise vollständig ist, korrekt ist.
2. Wenn der Server eine Anforderung von einem Client für Verzeichnisinformation empfängt, erhält er die aktuellste Verzeichnisinformation aus seinem eigenen Speicher und sendet diese an den Client.
3. Der Server sendet periodisch eine Tageszeit- und Datumsanzeige an das Clientsystem, um eine Synchronisation zwischen dem Client und dem Server sicherzustellen. Auf diese Weise stellt das Datenverteilungssystem eine Synchronisation mit den Teilnehmerendgerätadaptern sicher und stellt sicher, dass die darin gespeicherte Verzeichnisinformation auf aktuellen Werten gehalten wird. Die Verwendung der Teilnehmerzielinteressenprofilzusammenfassungsfilterung von Rundfunkprogrammen reduziert deutlich die Menge der in dem Speicher des Teilnehmerendgerätadapters zu speichernden Verzeichnisinformation und hat trotzdem die Funktion, den Teilnehmer zu interessierenden Programmen in einer effizienten Weise zu führen.

Im Falle von anderer Information als Rundfunkprogrammen verwendet das System die Teilnehmerprofilinteressenzusammenfassung für den Teilnehmer, um zu ermitteln welche Information für den Teilnehmer von Interesse ist. Diese Daten können dazu verwendet werden, Ähnlichkeitsmaße zu erzeugen, um ein intelligentes Vorabspeichern von Daten für die Übertragung an den Teilnehmer zu implementieren. Die Reihenfolge sowie der Inhalt der an den anfordernden Teilnehmer übertragenen Daten wird variiert, um den Wirkungsgrad der Datenübertragung bei den gegebenen Einschränkungen der Übertragungsbandbreite zu maximieren. Für mobile Teilnehmer kann das System die Informationslieferung als eine Funktion des Ortes des Teilnehmers spezifisch durchführen, und ebenfalls die Daten an einem Ort in Vorwegnahme der Ankunft des Teilnehmers im voraus speichern.
KURZBESCHREIBUNG DER ZEICHNUNGEN
1 stellt in Blockdiagrammform eine typische Architektur eines Multimediaverteilungssystems mit einem darin eingebauten Kundenpräferenzprofilsystem dar;
2 stellt in Flußdiagrammform das Verfahren der Erzeugung einer Übereinstimmungsmatrix dar;
3 stellt in Flußdiagrammform das Verfahren der Auswahl virtueller Kanäle dar;
4 stellt in Blockdiagrammform einen typischen Teilnehmerendgerätadapter dar, der in Verbindung mit dem System von 1 verwendet wird;
5 stellt in Blockdiagrammform die Software/Firmware-Architektur des typischen Teilnehmeradapters von 4 dar;
6 stellt in Flußdiagrammform den Betrieb des Ähnlichkeitsermittlungsprozesses dar;
7 stellt in Flußdiagrammform den Betrieb des Programmabgleichungsprozesses dar;
8 stellt die Bandbreitennutzung des Datenverteilungssystems dar; und
9 und 10 stellen verschiedene Client-Server-Zwischenverbindungen dar.
DETAILLIERTE BESCHREIBUNG
1 veranschaulicht in Blockdiagrammform eine typische Architektur des Datenverteilungssystems der vorliegenden Erfindung. Das Datenverteilungssystem besteht aus Clients, welche in den Endgerätadaptern 112 mit extrem eingeschränkter Datenspeicherkapazität gespeichert sind, die sich in den Räumlichkeiten des Teilnehmers befinden, und aus Servern, welche Datenverarbeitungs- 100, Datenübertragungs- 108 und Datenspeicherungselemente 110 in dem Netzwerk sind, (welche an der Kopfstation angeordnet sein könnte) welche sowohl Multimediainformation, wie z. B. Lifezuspielungen als auch Video-on-Demand) und deskriptive Information (Verzeichnisinformation, Pläne, Indizes) für die Multimediainformation enthalten. Es wird angenommen, dass sich die Clients unter der physikalischen Kontrolle des Teilnehmers befinden, während die Server in der physikalischen Infrastruktur des Datenverteilungssystems eingebettet sind. Die Basisnetzwerkstruktur, welche die Clients und Server ist ein Netzwerk mit einer Multisend-Abwärtsverbindung hoher Bandbreite/Einzelsende-Aufwärtsverbindung niedriger Bandbreite. Diese Bandbreiteneinschränkungen sind Gegenstand der praktischen Implementation, und die Ungleichheit der Bandbreite in den Abwärts- und Aufwärtsverbindungen ist keine technologische Notwendigkeit.
Das Datenverteilungssystem kann nutzbringend im Zusammenhang mit Set-Top-Box-ähnlichen Vorrichtungen wie z. B. PDAs (Personal Digital Assistant) oder Netzwerkcomputern oder Personal-Computern die als eine Form einer Set-Top-Box verwendet werden, als ein Verfahren zur Reduzierung der von den Nutzern beobachteten Reaktionszeit verwendet werden. V. N. Padmanabhan und J. C. Mogul offenbarten in einem Artikel mit dem Titel "Using Predictive Prefetching to Improve World Wide Web Latency", ACM SIGCOMM Computer Communication Review, July 1996 ein Verfahren zum Vorabholen von in dem Viper Text Transport Protokoll (HTTP) des Internet basierenden World Wide Web gespeicherter Information. Im wesentlichen verwendet das Verfahren "Links" auf andere in einer Datei mit HTTP-Format eingebettete Dokumente als Hinweise, dass diese Links bei dem Vorabholen von Daten verwendet werden sollten; d. h., die durch die Links angegebenen Dokumente sollten in Vorwegnahme des Wunsches des Benutzers geholt werden, um den Links auf diese Dokumente zu folgen. Das Datenverteilungssystem stellt zwei Verbesserungen für dieses Verfahren dar. Erstens stellt es eine technologische Einrichtung bereit, mittels welcher vorab geholte Daten mit Bedarfsdaten vermischt werden können, um insgesamt Verbesserungen in der Reaktionszeit auf eine große Population von HTTP/WWW-Benutzern mit reduzierten Speicheranforderungen bereitzustellen. Zweitens stellt das Datenverteilungssystem, welches die Abwärtsverbindung als eine feste Kapazitätsressource betrachtet, ein allgemeines Planungsverfahren bereit, das Techniken, wie z. B. Benutzerpräferenzen verkörpert, um Vorabholungen auszuführen, wenn Schlitze oder Bandbreiten nicht vollständig ausgenutzt sind, um preemptiv den weiteren Bedarf nach Bandbreite zu reduzieren. Die allgemeine Technik der Nutzung eines Ähnlichkeits-informierten Vorabholens ist ausführlich in der gleichzeitig anhängigen Patentanmeldung mit dem Titel "Pseudonymous Server For System For Customized Electronic Identification Of Desirable Objects", U.S. Anmeldung Ser. No. 08/550,886, eingereicht am 31. Oktober(Ser. Nr. US 5,754,938 ) beschrieben.
Grunddefinitionen
Relevante Definitionen von Begriffen für den Zweck dieser Beschreibung umfassen: (a) ein für den Zugriff durch den Teilnehmer verfügbares Objekt, welches typischerweise elektronischer Natur ist, wird als ein "Zielobjekt" bezeichnet, (b) ein digital dargestelltes Profil, das Attribute des Zielobjektes anzeigt, wird als ein "Zielprofil" bezeichnet, (c) ein Profil, das die Attribute eines Teilnehmers enthält, wird als ein "Teilnehmerprofil" bezeichnet, (d) eine Zusammenfassung digitaler Profile von Zielobjekten, die ein Teilnehmer bevorzugt und/oder nicht bevorzugt, wird als "Teilnehmerzielprofilinteressenzusammenfassung" dieses Teilnehmers bezeichnet, (e) eine Sammlung von Zielobjekten mit ähnlichen Profilen wird als eine "Gruppierung" bezeichnet, (f) ein zusammengesetztes Profil, das durch Mittelung der Attribute aller Zielobjekte in einer Gruppierung gebildet wird, wird als ein "Gruppierungsprofil" bezeichnet. In dem hierin beschriebenen CATV/DBS-Beispiel wird der Begriff "Programm" anstelle von "Zielobjekt" zur Verdeutlichung der Beschreibung verwendet.
Netzwerkelemente und Systemeigenschaften
Die durch das Datenverteilungsnetzwerk N gemäß Darstellung in 1 miteinander verbundenen verschiedenen Elemente können in zwei Klassen unterteilt und wie in 1 dargestellt in Client und Server gruppiert werden. In dem CATV-Beispiel besteht die Vielzahl der Clients jeweils aus einem einzelnen Teilnehmerendgerätadapter 112, welcher mit Servern 102 (Programmquellen) über Datenkommunikationsverbindungen verbunden ist. Die Clients sind typischerweise nicht kontinuierlich on-line, da sie typischerweise nur einen einzigen Teilnehmerhaushalt versorgen und das Nutzungsmuster eine Funktion der Teilnehmeraktivität ist. Ein Server 102 ist typischerweise ein Programmquellensystem, von dem angenommen wird, dass es kontinuierlich on-line ist, und die Funktion hat, entweder eine Reihe von Programmen in einer vorbestimmten Reihenfolge zu senden oder ein spezifisch von einem Teilnehmer gewähltes Programm zu empfangen und zu senden (Video-on-Demand). Der Server 102 ist mit einem Dauerspeicher, wie z. B. einem Magnetband- oder Magnetplattendatenspeichermedium ausgestattet, und ist mit Clients über Datenkommunikationsverbindungen verbunden. Die Datenkommunikationsverbindungen können eine beliebige Topologie und Architektur aufweisen, und werden hierin für den Zweck der Vereinfachung als eine typische Kabelfernsehen-Topologie beschrieben. Insbesondere ist die vorliegende CATV-Architektur eine Kabelanlage, welche ein Rundsendefernsehen emuliert. Sie kann in allen praktischen Aspekten als ein Baum betrachtet werden, aus welchem Information von den Teilnehmern bei den Blättern entnommen und von der Programmquelle bei der Wurzel eingegeben wird. Beispielsweise ermöglicht die Installation einer Satellitenschüssel an der Wurzel des Netzwerkes, welche die restliche Infrastruktur speist, das Multiplexieren des Ausgangssignals der Satellitenschüssel über eine Anzahl von über Koaxialkabel angeschlossene Teilnehmer. Ein digitales Rundsendesatellitensystem kann ebenfalls als ein ziemlich flacher Baum (mit der Wurzel im Orbit) betrachtet werden, welcher von mehreren Quellen gespeist wird.
In dem Kabelfernsehsystem erzeugt eine Vielzahl von Programmquellen 102 Programme, welche mittels einer Vielzahl von Kanalmodulatoren 104 moduliert und an ein Verteilungssystem 108 übertragen werden. Das Verteilungssystem 108 ist Teil eines Kopfendes 100, welches die empfangenen Programme über entsprechende Knoten 110 wieder an Teilnehmerendgerätadapter 112 überträgt. Die Teilnehmerendgerätadapter 112 enthalten Software und das Kopfendesystem 100 enthält ebenfalls Software die in einer Systemsteuerung 106 vorhanden ist, um zu ermitteln, welche Programme wahrscheinlich für jeden Teilnehmer von Interesse sind. Diese Programmauswahlsoftware steuert die Programmierung der virtuellen Kanäle zu dem Teilnehmerendgerätadapter 112, um zwischen einer Vielzahl von Kanälen auszuwählen, welche über das Netzwerk N an das Kopfende 100 gesendet werden. Der Teilnehmer kann den Teilnehmerendgerätadapter 112 dazu verwenden, um aus den automatisch erzeugten virtuellen Kanälen oder von dem Kopfende 100 aus verfügbaren tatsächlichen Kanälen auszuwählen.
Eine passive Rückmeldung bezüglich Teilnehmerpräferenzen zur Verwendung bei einer zukünftigen Programmplanung kann in diesem Datensystem über ein Teilnehmerdatensammelelement 114, welches mit dem Kopfende 100 verbunden ist, integriert sein. In dieser Ausführungsform kann die Erzeugung einer Zielprofilinteressenzusammenfassung für einen Teilnehmer bei dem Kopfende 100 implementiert sein, was es dem Kopfendebetreiber ermöglicht, festzustellen, welche Programmierung durch die Sammlung der Teilnehmer gewünscht ist, oder sie kann in dem Endgerätadapter 112 des Teilnehmers implementiert sein. In dem ersteren Fall wirkt die Programmauswahlsoftware als ein Filter, um die Erzeugung virtueller Kanaldaten bei dem Teilnehmerendgerätadapter 112 zu ermöglichen. Die Rücklaufsignale zu dem Kopfende 100 können über das CATV-System oder über Telefonleitungen 10 unter Verwendung eines drahtgebundenen Rücklaufpfades zur Datensammlung transportiert werden. Somit ist die Grundnetzwerkstruktur, welche die Clients und Server verbindet, ein Netzwerk mit einer Multisende-Abwärtsverbindung hoher Bandbreite/Einzelsende-Aufwärtsverbindung niedriger Bandbreite.
Obwohl sich die vorstehende Beschreibung auf das Gebiet der Kanalauswahl in einem CATV-Rundsendefernsehen-Aufbau konzentriert, kann die Vielzahl von Kanälen, welche durch digitale Technologie und Kompressionstechnologie ermöglicht wird, die Nutzung dieser Kanäle in einem Modus nahezu wie in einem tatsächlichen "Video-on-Demand"-(VoD)-System ermöglichen. Die Vielzahl von Kanälen könnte in einem "Frequenzsprung"-Modus (aus der Perspektive jedes gegebenen Stroms) genutzt werden, um einen Zugriff auf bündelartige Daten, wie z. B. MPEG-komprimierte Videoströme zu ermöglichen. Die deskriptive Information könnte für die Programmauswahl, Darstellung und zur kundenspezifischen Anpassung der Auswahl und Planung des Programms verwendet werden.
Teilnehmerendgerätadapter
4 veranschaulicht in Blockdiagrammform die Gesamtarchitektur eines typischen Teilnehmerendgerätadapters für die CATV-Anwendung, während 5 die Architektur der darin befindlichen Software/Firmware darstellt. Insbesondere werden die Programmmaterialien, die entsprechende Programminhaltsprofil/Verzeichnis-Information von dem Kopfende 100 über einen Tuner 402 bei dem Datenempfänger 404 empfangen. Alternativ kann die Inhaltsprofil/Verzeichnis-Information über einen speziellen Datenkanal (dargestellt durch die gestrichelte Linie in 4) empfangen werden, welche den Tuner 402 umgehen kann. In jedem Fall kann die Programminhaltsprofil/Verzeichnis-Information, die empfangen wird, ein Untersatz von Materialien sein, die an dem Kopfende 100 verfügbar sind, wobei die Materialien einen Auszug der verfügbaren Information darstellen, die mit der Zielprofilinteressenzusammenfassung für diesen Teilnehmer moduliert ist.
Wenn die von dem Kopfende 100 gesendeten Programmaterialien verschlüsselt sind, werden die verschlüsselten empfangenen Programmaterialien von dem Tuner 402 an den Entschlüssler 416 übertragen, bevor sie durch den Prozessor 406 verarbeitet und/oder von dem Modulator 418 für die Anzeige moduliert werden. Wenn der Tuner 402 einen von den gleichzeitig gesendeten Kanälen empfängt, wird die Inhaltsprofil/Verzeichnis-Information an den Prozessor 406 entweder direkt geliefert, wenn das empfangene Programm die Inhaltsprofil/Verzeichnis-Information in ihrem vertikalen Austastintervall enthält, oder über den Datenempfänger 404. Der Prozessor 406 überprüft die dem Programmaterial zugeordnete Inhaltsprofil/Verzeichnis-Information, um zu ermitteln, ob eine Übereinstimmung zwischen dem Zielprogramm für dieses Programmaterial und der Teilnehmerzielprofilinteressenzusammenfassung vorliegt. Eine Eingabe seitens des Teilnehmers ist über den Teilnehmerendgerätadapter 112 möglich, welcher Anzeigemenüs über eine Bildschirmmenüvorrichtung 414 erzeugt, und dem eine Fernbedienungsvorrichtung 408 und einen Infrarotempfänger 410 verwendenden Benutzer, welcher, wie es allgemein auf dem Gebiet der Fernsehtechnik bekannt ist. Die Teilnehmerzielprofilinteressenzusammenfassung ist im Speicher 412 gespeichert, und wird dazu genutzt, die Eignung der verschiedenen gesendeten Programme für den Teilnehmer endgerätadapter 112 sicherzustellen. Der Prozessor 406 wählt eine Vielzahl von den empfangenen Programmen als der Teilnehmerzielprofilinteressenzusammenfassung entsprechend aus und weist diese Programme virtuellen Kanälen für das Betrachten durch den Teilnehmer zu. Die virtuellen Kanäle werden dem Teilnehmer wie allgemein bekannt über das Fernsehgerät präsentiert. Der Teilnehmer kann dann einen der virtuellen Kanäle oder irgendeinen verfügbaren Kanal zum Betrachten eines von dem Teilnehmer gewählten Programms auswählen.
Eine Telefonschnittstelle 420 stellt einen Kommunikationspfad in einem Einzelsendemodus von dem Teilnehmerendgerätadapter 112 zu dem Kopfende 100 über die Datensammelschaltung 114 bereit, um dem Prozessor 406 zu ermöglichen, die gesammelten Sehgewohnheitsdaten und die Teilnehmerzielprofilinteressenzusammensetzung aus dem Speicher 412 an das Kopfende 100 zu übertragen. Die Daten der Teilnehmerzielprofilinteressenzusammenfassung können optional durch die Verwendung einer Verschlüsselungsvorrichtung 422 vertraulich gehalten werden, um einen nicht autorisierten Zugriff auf diese Daten zu verhindern. Zusätzlich können die Daten der Teilnehmerzielprofilzusammenfassung an das Kopfende 100 unter Verwendung eines HF-Modulators 424 zurückübertragen werden, um die bidirektionale Nutzung der Verbindung des Kopfendes 100/Teilnehmerendgerätadapter 112 zu ermöglichen.
Die Software/Firmware, welche in dem Teilnehmerendgerätadapter 112 betrieben werden kann, um die vorstehend beschriebenen Steuerfunktionen auszuführen, ist in Blockdiagrammform in 5 dargestellt. Insbesondere wird ein autorisiertes Dienstsegment 502 des Speichers 412 zum Speichern von Daten verwendet, welche der Teilnehmer als Teil der Teilnahme an dem CATV-Netzwerk empfangen kann. Die diesen autorisierten Programmen zugeordnete Inhaltsprofil/Verzeichnis-Informationen sind in diesem Verzeichnissegment 504 gespeichert, dessen Daten von dem Prozessor 406 verwendet werden, um die (als Übereinstimmungsmatrix bezeichneten) Programmlisten zu berechnen, welche der Teilnehmer wahrscheinlich zu sehen wünscht. Die Übereinstimmungsmatrix 508 ist im Speicher 412 wie auch eine zugeordnete Tageszeit 510 gespeichert, welche entweder lokal erzeugt oder von dem Kopfende 100 empfangen wird. Aus der Übereinstimmungsmatrix 508 berechnet der Prozessor 406 eine Liste virtueller Kanäle, welche in die Programmführerliste 514 eingegeben wird. Die Programmführerliste 514 wird dem Teilnehmer über das Teilnehmerfernsehgerät in allgemein be kannter Weise angezeigt, so dass der Teilnehmer ein Programm aus den verfügbaren Auswahlmöglichkeiten wählen kann. Sobald der Teilnehmer ein Programm aus der Programmführerliste 514 wählt, aktiviert der Prozessor 406 den Kanalwähler 512 zur Abstimmung auf den Kanal, welcher das gesendete gewählte Programm enthält. Der Teilnehmer kann auch die erzeugte Teilnehmerzielprofilinteressenzusammenfassung betrachten, um dadurch dem Teilnehmer zu ermöglichen, die darin enthaltenen Daten manuell anzupassen oder zu modifizieren, um Veränderungen in dem von dem Teilnehmer gewünschten Sehgewohnheiten zu reflektieren. Die Integrität der Daten der Teilnehmerzielprofilinteressenzusammenfassung wird durch die Verwendung einer Teilnehmerkennung 518 gewahrt, welche sicherstellt, dass die Teilnehmereingabevorrichtung 516 nicht von jemand anders als dem zugeordneten Teilnehmer manipuliert wird.
Architektur der Datenspeicherung
Die Schlüssel zur Architektur einer eingeschränkten Datenspeicherung in diesen Datenverteilungssystems sind die intelligente Nutzung eines lokalen Speichers (Speicher 412), optimiert über Speichermanagementalgorithmen und den Rückgriff auf ein Kommunikationsprotokoll zwischen Client and Server zum Aktualisieren der lokalen Datenspeicherung (Speicher 412) über Serveraktualisierungen und Clientanforderungen. Dieses führt zu einer verteilten Architektur für Verzeichnisinformation, welche in Hinblick auf Veränderung robust ist, preiswert ist, und die CATV-Infrastruktur selbst nutzt, um diese Eigenschaften aufrechtzuerhalten. Da der Client der Endgerätadapter 112 in der Form der "Set-Top-Box" vorliegt, ist der gesamte von dem Server verwendete Datenverteilungsalgorithmus wie folgt:

1. Wenn neue Verzeichnisinformation in dem Server geladen wird, speichert der Server die Information in einer Plandatenstruktur. Wenn diese Information eine Aktualisierung der zuvor von dem Server empfangenen Verzeichnisinformation darstellt, werden die Empfänger der vorherigen Verzeichnisinformation (die "Kopiegruppe") darüber informiert, dass sie die zuvor empfangene Verzeichnisinformation löschen sollten und sie durch die neu empfangene Verzeichnisinformation ersetzen sollten. Dieses stellt sicher, dass die Verzeichnisinformation bei einem Client korrekt ist, obwohl nicht notwendigerweise vollständig sein muß.
2. Wenn der Server eine Anforderung von einem Client nach Verzeichnisinformation empfängt, erhält er die aktuellste Verzeichnisinformation aus seinem eigenen Speicher und sendet diese an den Client.
3. Der Server sendet periodisch eine Tageszeit- und Datenanzeigeinformation an das Clientsystem, um eine Synchronisation zwischen dem Client und dem Server sicherzustellen.

Auf diese Weise hält das Datenverteilungssystem eine Synchronisation mit den Teilnehmerendgerätadaptern 112 aufrecht und stellt sicher, dass die darin gespeicherte Verzeichnisinformation auf den aktuellen Werten gehalten wird. Die Nutzung der Teilnehmerzielinteressenprofilzusammenfassungsfilterung der Rundfunkprogramme reduziert signifikant die Menge der in dem Speicher der Teilnehmerendgerätadapter zu speichernden Information und erfüllt trotzdem die Funktion, den Teilnehmer in einer effizienten Weise zu interessierenden Programmen zu führen.
Prozess der Datenübertragung
2 stellt in Flußdiagrammform den Prozess dar, mittels welchem die Verzeichnisinformation an den Teilnehmerendgerätadapter 112 geliefert und die Übereinstimmungsmatrix erzeugt wird. Dieser Prozess kann in dem Datenverteilungssystem oder in dem Teilnehmerendgerätadapter 112 als eine Funktion der verfügbaren Übertragungsbandbreite sowie der Datenspeicherkapazität des Teilnehmerendgerätadapters 112 implementiert sein. Für den Zweck dieser Beschreibung wird angenommen, dass der Prozess insgesamt oder zumindest teilweise in dem Datenverteilungssystem stattfindet, und insbesondere in der Systemsteuerung 106 des Kopfendes 108. Der Plan der verfügbaren Programme und deren Eigenschaften (Inhaltsprofile) wird in einer Datenbank in dem Kopfende 100 bei dem Schritt 202 erzeugt und gespeichert. Die Teilnehmerzielprofilinteressenzusammenfassungen werden für eine vorgegebene Zeitdauer aus dem Teilnehmerendgerätadapter 112 heruntergeladen und bei dem Schritt 204 in einer Datenbank gespeichert. Die Teilnehmerzielprofilinteressenzusammenfassungen umfassen die Präferenzen des Teilnehmers für Programme und variieren bevorzugt als eine Funktion der Tageszeit, was typischerweise eine Funktion der Identität der mehreren Betrachter in dem Teilnehmerhaushalt ist.
Die mit den elektronischen Programmführerdaten empfangenen Inhaltsprofile werden mit den Teilnehmer-spezifischen Präferenzen (Teilnehmerzielprofilinteressenzusammenfassungen) verglichen, um eine Übereinstimmungsmatrix bei dem Schritt 206 zu erzeugen. Sobald die Übereinstimmungsmatrix erzeugt worden ist, werden die Programme mit den höchsten Werten für eine Entsprechung mit den Präferenzen des Teilnehmers priorisiert und für eine Präsentation an den Teilnehmer als virtuelle Kanäle bei dem Schritt 208 ausgewählt. Die Zuordnung virtueller Kanäle wird in einer Vorrangreihenfolge verarbeitet, wobei die am meisten gewünschten Programme zuerst virtuellen Kanälen zugewiesen werden, bis alle gewünschten Programme zugewiesen sind. Jedoch wird die Zuordnung virtueller Kanäle beendet, wenn unzureichend virtuelle Kanäle für die Anzahl von durch die Übereinstimmungsmatrix verglichenen Programmen vorhanden sind. Es ist zu bevorzugen, dass die Teilnehmerzielprofilinteressenzusammenfassungen und die Inhaltsprofile aktualisiert werden, um Veränderungen in den Teilnehmerpräferenzen sowie die Korrektur von Fehlern in der ursprünglichen Ermittlung zu ermöglichen. Bei dem Schritt 210 führt die Systemsteuerung 106 eine Aufzeichnung von Programmen, auf welche durch den Teilnehmer zugegriffen wurde, und über die Länge der Zugriffszeit. Bei dem Schritt 212 werden die Teilnehmerzielprofilinteressenzusammenfassungen in dem Teilnehmerendgerätadapter 112 aktualisiert.
Sobald die Übereinstimmungsmatrix erzeugt ist, kann die Auswahl virtueller Kanäle mittels des in dem Flußdiagramm in 3 dargestellten Prozessors erreicht werden. Bei dem Schritt 302, Ermitteln, welche Teilnehmerzielprofilinteressenzusammenfassung für die zu planende Zeitdauer aktiv ist. Die verfügbaren Programme werden durch Auswahl eines Untersatzes aller verfügbaren Programme ermittelt, welcher den Umfang der Programmteilnahme des Teilnehmers anzeigt. Eine Übereinstimmungsmatrix wird bei dem Schritt 304 für die verfügbaren Programme erzeugt, und die beliebtesten Programme für den Teilnehmer werden ausgewählt. Bei dem Schritt 306 wird ermittelt, ob alle Teilnehmerpräferenzen erfüllt sind, und ob irgendwelche zusätzlichen Programme verfügbar sind, um irgendwelche Teilnehmerpräferenzen zu erfüllen, die verbleiben. Bei dem Schritt 308 wird der Planungsprozess verlassen, wenn alle Präferenzen mit verfügbaren Programmen abgeglichen sind. Falls nicht, wird bei den Schritten 310 und 312 die Präferenzliste verkleinert, um diese abgeglichenen Präferenzen zu eliminieren, und die Verarbeitung kehrt zu dem Schritt 304 zurück.
Hintergrund zum Digitalen Rundfunksatelliten
Die Technologie des Digitalen Rundfunksatelliten (DBS) stellt ein Rundfunknetzwerk mit asymmetrischen Aufwärts/Abwärts-Verbindungsbandbreiten ähnlich dem vorstehend beschriebenen CATV-Netzwerk zur Verfügung. Die Technologie beruht auf relativ, Hochleistungssatelliten in großem Abstand, welche digitale Übertragungsraten von entweder 30 Mbps (in einem reduzierten Fehlerkorrekturcodemodus von 30 Mbps für Daten und 10 Mbps für eine Schutzcodierung) oder 23 Mbps (in einer robusteren Codierungskonfiguration mit 23 Mbps für Daten und 17 Mbps für Schutzcodierung) erzielen kann. Jede Konfiguration wird mit einem digital codieren 23 MHz Breitbandsatellitenkanal erzielt.
Die Nutzung des Kanals für Fernsehsignale wird mittels digitaler Kompressionstechnologien, entweder dem Motion Picture Experts Group (MPEG) Standard(MPEG-II) oder durch von der Industrie entwickelten eigene Standards erzielt. Es liegt ein starker Rückgriff auf komplexe Echtzeit-Dekompressionstechnologien vor, welche in den Empfangseinheiten eingebettet sind, welche als das DBS-Analogon der Set-Top-Box in dem CATV-Bereich betrachtet werden können. Die Empfangseinheiten sind durch kleine Empfangsschüsseln (18–36'') gekennzeichnet, welche mit der Analogon der Set-Top-Box über eine koaxiale Verkabelung oder eine andere Einrichtung verbunden sind. In der Box arbeitende Dekompressionsalgorithmen wandeln die Rohdigitalsignale in ein für die Darstellung auf einem NTSC-Fernsehgerät geeignetes Format um. Die Algorithmen sind von erheblicher Komplexität und werden mittels Application Specific Integrated Circuit (ASIC) oder Digital Signal Processor – Technologien in Kombinationen mit einer weiteren spezialisierten Verarbeitung implementiert. Die Gesamtkosten von Konfigurationen können auf unter 1000 $ gebracht werden. Die Kosten der elektronischen Komponenten nehmen konsistent mit anderen elektronischen Kommunikations- und Berechnungstechnologien ab, obwohl durch Leistung und Verpackung definierte Begrenzungen verbleiben und die erreichbaren Endkosten begrenzen.
Die Speicheranforderungen aller Konfigurationen werden als klein angesehen, da Fernsehanwendungen als die Hauptanwendungen für die Technologie vorstellbar sind. Viele von den vorgeschlagenen Systemen (z. B. Primestar, DIRECT TV/USS, EchoStar und AlphaStar) sind fernsehorientiert, obwohl ein gewisser Direktzugriff auf die digitalen Ströme über Hochgeschwindigkeitszugriffsports in einigen Implementationen der Set-Top-Box-Analogons vorliegen. Obwohl dieses für zukünftige Hochauflösungs-(HDTV)-Fernsehanwendungen gedacht scheint, stellt deren Vorhandensein, eine in Betracht ziehbare Möglichkeit dar, diesen Hochgeschwindigkeitsdigitalzugriff in zukünftigen Konfigurationen zu nutzen. Die Set-Top-Box-Analogons stellen typischerweise eine RJ11-Buchse bereit, welche für eine Kommunikation mit dem öffentlichen Telefonnetz (PSTN – Public Switched Telephone Network)) verwendet wird, welches zur Übertragung von Abrechnungsinformation oder so genannter "Impulse pay-per-view"-Antwortinformation verwendet wird.
Dieses Datenverteilungssystem besteht aus Clients, welche Endbenutzerendgeräte mit extrem eingeschränkter Speicherkapazität (diktiert durch die Faktoren, welche wir vorstehend in dieser Offenbarung diskutiert haben) und aus Servern, welche Multimediainformation (wie z. B. Video-on-Demand) und zusätzlich deskriptive Information (Verzeichnisinformation, Pläne, Indizes) für die Multimediainformation enthalten. Von den Clients wird angenommen, dass sie unter der physikalischen Kontrolle des Kunden stehen, während die Server in dem DBS-Falle wahrscheinlich mit dem Satellitentransponder aufwärtsverbunden sind. Dieses führt zu einer verteilten Architektur für Verzeichnisinformation, welche in Hinblick auf Veränderung robust ist, preiswert ist, und die DBS-Infrastruktur selbst nutzt, um diese Eigenschaften aufrechtzuerhalten. In der Praxis ist der Client der Architektur die "Set-Top-Box"-ähnliche Einheit für DBS, welche wir hier vorstehend diskutiert haben.
Spezielle Betrachtungen für DBS gegenüber CATV
Es gibt eine Anzahl von Einschränkungen des DBS-Systems gegenüber CATV. Insbesondere sind diese:

1. Fehlerraten – Die Eigenschaften des Funkkanals sind so, dass eine umfangreiche Fehlerschutzcodierung vorhanden sein muß, welche bis zu 50% der Kanalkapazität verbraucht. Dies ist ein Hauptunterschied, beeinflußt jedoch nicht unsere Architektur.
2. Geringe Hierarchienutzung (extrem flaches Netzwerk). Ein Hauptproblem mit DBS oder Satelliten besteht allgemein darin, dass es ein Rundsende- und Weitbereichssystem ist. Rundsenden ist nicht so sehr ein Problem wie der weiter Bereich. Rundsenden ist eine Spezialisierung von Multisenden, und bedeute de facto, dass alle interessierten Empfänger die Information verfügbar finden. Der Weitbereichsvorteil besteht darin, dass das Satellitenmaterial weit verteilt werden kann, uns aber nicht die Möglichkeit gibt, Speicherknoten an Punkten innerhalb des Multisende-Verteilungsbaumes anzuordnen, da es tatsächlich KEINE derartigen Punkte gibt.
3. Wesentlich geringere Rückkanalbandbreite – CATV bietet die Möglichkeit von vernünftigen Hochleistungskanälen, welche die Clients verwenden können, um Zellen zur Aufnahme in ihren Speicherbereichen auszuwählen. Die erforderliche Sendeleistung schließt die Verwendung von Satelliten-Sender/Empfängern am Ort des Client aus; es liegen ein Empfänger und eine andere Antworteinrichtung (z. B. PSTN) vor.
4. Interoperabilität – es ist eine eingeschränkte Möglichkeit zur Interoperation mit dem ATM-Zellen-ähnlichen Format möglich, dass wir in dieser Offenbarung verwendet haben. Eine Überlagerung ist auf dem zugrundeliegenden digitalen Paketformat unter Verwendung geeigneter Fragmentierungs- und Reassemblierungsalgorithmen an der Schnittstelle zwischen Formaten möglich.

Speicherreduzierungstechnik in drahtloser ATM-Technologie
Der asynchrone Übertragungsmodus (ATM – Asynchronous Transfer Mode) ist eine Verbindungsmultiplexierungstechnik, welche breite Anwendung in Kerntelekommunikationsnetzwerken ("backbones") aufgrund ihrer Fähigkeit gefunden hat, Bandbreitenressourcen mit feiner Körnigkeit, z. B. 48-Oktett-"Zellen" von Daten zuzuweisen. Erhebliches Hintergrundmaterial bezüglich ATM existiert in der technischen Literatur; beispielsweise A. Fraser of Bell Laboratories diskutierte die Geschichte der Asynchronous Time-Division Technique in seinem ACM SIGCOMM Award Vortrag von 1994, welcher in ACM Computer Communication nachgedruckt wurde. Es gibt eine Anzahl von Veröffentlichungen, welche Endgerätadapter für diese Netzwerke in Zusammenhang mit Hochleistungs-Workstations diskutieren. Diese Konstruktionen erfordern erheblichen Speicher, um erfolgreich zu arbeiten, hauptsächlich für die Pufferung von ankommenden Daten, um verlorengegangene Daten und deren Folge einer schlechten Systemleistung zu verhindern. Deutlich weniger Aufmerksamkeit wurde der ATM-Unterstützung für preiswertere Vorrichtungen geschenkt, wie z. B. denjenigen, welche von Benutzern für alltägliche Aufgaben in der Zukunft, wie z. B. drahtlose PDAs verwendet werden können. Diese Vorrichtungen sind durch niedrige Kosten, geringes Gewicht gekennzeichnet und legen Wert auf eine lange Batterielebensdauer. Drahtloser ATM arbeitet in Laboraufbauten und kann Videoverkehr tragen. Somit stellt er eine Umgebung bereit, für welche Speicherreduzierungsverfahren, die wir für CATV und DBS entwickelt haben, ebenfalls zutreffen.
Speicherreduzierung für mobile Betrachtungssysteme
Die Reduzierung der Speicheranforderungen für zukünftige drahtlose Endgeräte ist heute aus Technologie- und Kostengründen sehr wichtig, und dieses bleibt vorhersehbar auch in der Zukunft so. Der Speicher stellt die Hauptkosten in vielen heutigen Informationshandhabungsvorrichtungen, drahtgebundenen oder drahtlosen, dar. Der Speicher ist der Hauptverbraucher von Energie in mobilen drahtlosen Systemen und eine Folge davon ist, dass verringerter Speicher zu längerer Batterielebensdauer in vielen Fällen führt. Die Vorteile von Speicherbedarfreduzierungstechniken sind zusammengefaßt wie folgt:

1. Die Systeme sind kompakter, wenn weniger Speicher und weniger Batterien benötigt werden.
2. Aus denselben Gründen sind sie leichter.
3. Es kann eine längere Batterielebensdauer für mobile Endgeräte ohne Speicheplatten erreicht werden.
4. Die Kosten sind geringer.

Implementation einer Client-Server-Architektur im drahtloser ATM
Das Datenverteilungssystem besteht aus Clients, welche Endnutzerendgeräte mit extrem eingeschränkter Speicherkapazität (diktiert durch die Faktoren, welche wie wir vor stehend in dieser Offenbarung diskutiert haben) und aus Servern, welche Multimediainformation (wie z. B. Video-on-Demand) und zusätzliche deskriptive Information enthalten. Von den Clients wird angenommen, dass sie unter der physikalischen Kontrolle des Kunden stehen. Dieses führt zu einer verteilten Architektur für Verzeichnisinformation, welche in Hinblick auf Veränderung robust ist, preiswert ist, und die drahtlose ATM-Infrastruktur nutzt. In der Praxis ist der Client der Architektur ein "Set-Top-Box"-Analogon, dessen Vorteile wir im Abschnitt 2 kurz zusammengefaßt haben haben.
Implementation der Client/Server-Architektur
Das Datenverteilungssystem besteht aus Clients, welche Endbenutzerendgeräte mit extrem eingeschränkter Speicherkapazität (diktiert durch die Faktoren, welche wir vorstehend in dieser Offenbarung diskutiert haben) und aus Servern, welche Multimediainformation (wie z. B. Video-on-Demand) und zusätzlich deskriptive Information (Verzeichnisinformation, Pläne, Indizes) für die Multimediainformation enthalten. Von den Clients wird angenommen, dass sie unter der physikalischen Kontrolle des Kunden stehen, während die Server in dem DBS-Falle wahrscheinlich mit dem Satellitentransponder aufwärtsverbunden sind. Dieses führt zu einer verteilten Architektur für Verzeichnisinformation, welche in Hinblick auf Veränderung robust ist, preiswert ist, und die DBS-Infrastruktur selbst nutzt, um diese Eigenschaften aufrechtzuerhalten. In der Praxis ist der Client der Architektur die "Set-Top-Box"-ähnliche Einheit für DBS, welche wir hier vorstehend diskutiert haben.
Es gibt mehrere Alternativen für unsere zu realisierende Client/Server-Architektur. Unter diesen sind:

1. Gemeinsames Nutzen einer Parabolschüssel unter mehreren Clientstellen, was eine eingeschränkte Form einer Hierarchie und Speichereinsparungen ermöglicht. Ein sehr einfaches Beispiel davon könnte eine Appartmentgebäude- oder Reihenhauskonfiguration sein.
2. Speichern erheblicher Daten in einem Speicher an dem Aufwärtsverbindungspunkt in dem System.

Dieses ist in der Tat der Punkt, wo der Serveranteil der Architektur lokalisiert sein sollte, damit unserer Architektur arbeitet. Die Idee hier besteht darin, dass der Serverort die gesamte Information enthält, welche die Set-Top-Boxen mit dem gleichen Speicher benötigen könnten. Ohne Hierarchie bietet die Selektivität der Ähnlichkeitsalgorithmen keinerlei statistischen Gewinn. Das Verfahren zum Angehen dieses Problems ist wie folgt:

1. Zuordnen eines Teils eines DBS-Kanals. Dieser Kanal wird als ein "Speicher" von dem Client/Server-Algorithmus verwendet. Es werde beispielsweise die Verwendung von 1 Mbps an Bandbreite betrachtet. Dieses würde etwa 2300 Zellen pro Sekunde ergeben. Die Anwendung des Ähnlichkeitsalgorithmus würde darin bestehen, auszuwählen, welche Zellen in der nächsten Sekunde zu senden sind. Wenn die Reaktionszeit besser als 1 Sekunde sein muß, kann das Planungsintervall ein kleinerer Wert, wie z. B. 1/30 Sekunde sein, (obwohl Umlaufverzögerungen problematisch sein könnten).
2. Planen der Bandbreitennutzung auf der Basis des Bedarfs von Speicherzellen bei dem Client. Diese Planung ist der in der CATV-orientierten Realisierung angewendeten SEHR ähnlich.

Server/Bodenstation-Algorithmus
Der von dem Server genutzte Gesamtalgorithmus ist wie folgt:

1. Wenn neue Verzeichnisinformation in den Server geladen wird, speichert der Server die Information in einer Plandatenstruktur. Wenn diese Information eine Aktualisierung von vorheriger Information darstellt, werden die Empfänger der vorherigen Information (die "Kopiegruppe") darüber informiert, dass sie diese Information löschen sollten. Dieses stellt sicher, dass die Information bei jedem Client, obwohl sie nicht notwendigerweise vollständig ist, korrekt ist.
2. Wenn der Server eine Anforderung von einem Client für Verzeichnisinformation empfängt, erhält er die aktuellste Verzeichnisinformation aus seinem eigenen Speicher und sendet diese an den Client.
3. Der Server sendet periodisch eine Tageszeit- und Datumsanzeige an das Clientsystem.

Detaillierte Beschreibung von Serveraktionen
Jedes Kopfende 100 in dem Rundsende- oder Multisende-Netzwerk arbeitet in einer Weise wie vorstehend erwähnt, um einen eingeschränkten Untersatz von Verzeichnisinformation an die Teilnehmerendgerätadapter(Clients) 112 zu verteilen, um dadurch den Teilnehmern zu ermöglichen, nur die Segmente der Gesamtverzeichnisinformation zu betrachten, welche für diesen Teilnehmer relevant sind. Um diese Aufgabe in einer schnellen Weise zu lösen, wird das Format der Daten, deren Inhalt und Verwaltung so geregelt, dass die Effizienz der Datenübertragung und Speicherung sichergestellt ist. Daher stellt die nachfolgende Liste von Eigenschaften eine spezifische Implementation dieser Datenverteilungsarchitektur für die CATV-Anwendung dar:

1. Das Kopfende 100 ist mit einer Uhr ausgestattet, welche ständig die aktuelle Tageszeit bereithält.
2. Das Kopfende 100 besitzt eine aktuellen "Plan" für die Verzeichnisinformationslieferung. Die Verzeichnisinformation wird durch ein <Kanalkennungs, Schlitzstart, Schlitzende> 3-Tupel indexiert. Diese Indizes werden verwendet, um Information über das in dem identifizierten Schlitz dargestellte Programmaterial aufzusuchen.
3. Ein Schlitz ist typischerweise ein vorbestimmtes Zeitsegment, wie z. B. eine Zeitdauer von 1/2 Stunde, während eine Kanalkennung aus die Rundsendekanalnummer in dem Rundfunknetz darstellen Daten besteht. Diese Architektur trifft auch für Video-on-Demand, das zu beliebigen Zeiten startet, mit beliebigen Dauer läuft, oder auf eine minutenweise "Mikroplanung" von Programmaterial zu, da die Schlitzstart- und Endzeiten angegeben werden, sowie der Kanal, auf welchem der Teilnehmerendgerätadapter auf das gewünschte Programmaterial zugreifen kann.
4. Das Programmaterial, welches in dem identifizierten Zeitschlitz rundgesendet wird, wird durch ein zweites 3-Tupel: <Name, Textbeschreibung, Weiteres> beschrieben. Das Feld "Name" ist der für das Programmaterial verwendete Name und ist typischerweise ein kurzes Textstück. Das Feld "Textbeschreibung" ist Text, welcher das Programmaterial beschreibt und kann Zusammenfassungen, Filmbewertungen, Drehbuchauszüge, Schauspielernamen, von dem Film gewonnene Preise, usw. enthalten. Das Feld "Weiteres" ist zu diesem Zeitpunkt als Erweiterungsmöglichkeit gedacht und kann Standbildfotos, Angaben über Gewalt- oder Erwachseneninhalt, oder Information über weiteres Programmaterial in einer Serie enthalten.
5. Programmaterial wird in dem Speicher in dem Kopfende 100 in Einheiten fester Größe gespeichert. Der Umfang der Einheit einer festen Größe ist so gewählt, dass der verbrauchte Raum sowohl in dem Kopfende 100 als auch in dem Endgerätadapter 112 minimiert wird. In einer Speicherarchitektur mit einer festen Blockgröße führt die Speicherung von großen Objekten variabler Größe (den Beschreibungen) typischerweise dazu, dass 1/2 der Blockgröße verschwendet wird. Derartige Betrachtungen wurden extensiv in der Literatur bezüglich eines nach Bedarf eingeteilten virtuellen Speichers diskutiert. Für diese Offenbarung werden die Speichereinheiten als "Zellen" bezeichnet.
6. Ohne die Zellengröße auf 48 Oktette (Bytes) zu beschränken, kann diese Größe für eine Interoperation mit zukünftigen Computernetzwerken auf der Basis der asynchronen Übertragungsmodus-(ATM)-Technologie nützlich sein, welche Zellen (Pakete) mit einer Nutzlastgröße von 48 Oktetten vorsieht.
7. Eine Zellengröße von 48 Byte dürfte die meisten Programmaterial-Titel in einer einzigen Zelle aufnehmen. Die nachstehend beschriebene Technik kann verwendet werden, wenn die Titelinformation länger als eine einzige Zelle ist.
8. Die "Textbeschreibung"- und "Weiteres"-Informationen besitzen eine variable Größe und sind aller Wahrscheinlichkeit nach größer als eine einzige Zelle. Sie werden leicht unter Verwendung mehrerer Zellen gespeichert, indem entweder durch eine Folge von Zellen zugeordnet wird, die groß genug ist, um die vollständige Information aus dem Speicher des Kopfendes 100 zu enthalten, oder indem einer Verknüpfungsliste von Zellen zugeordnet wird, wobei eine Zelle Information enthält, die zu der nächsten Zelle führt. Ein Beispiel einer derartigen Verknüpfungsliste in der Computerprogrammierungssprache "C", welches die geeignete Struktur bereitstellt, wäre:
Daher könnte der Text "and Peter Sellers plays both the President and Doctor Strangelove in this classic black comedy about the Cold War" in drei Teilen gespeichert werden: "and Peter Sellers plays both the President and", im Zellenkörper #1, "Doctor Strangelove in this classic black comedy a", in dem Zellenkörper #2, und "bout the Cold War", im Zellenkörper #3. Diese Verknüpfungslistendatenstruktur bietet wie ein komplexeres virtuelles Speicherschema Vorteile in der Multiplexspeicherung im Vergleich zu einem Verfahren, in welchem zusammenhängende Speicherbereiche erforderlich sind.
9. Das Kopfende 100 überträgt periodisch Verzeichnisinformation entlang dem Abwärtsverbindungskanal an Clients. Eine Schlüsselinnovation dieses Datenverteilungssystems ist das Verfahren für die Planung der Übertragung der Verzeichnisinformation. Es kombiniert die Ähnlichkeitsmaß-Technologie mit spezifischen Eigenschaften von Netzwerken mit Multisende-Abwärtsverbindungen hoher Bandbreite/Einzelsende-Aufwärtsverbindungen niedriger Bandbreite. Die Information wird in Einheiten von Zellen übertragen, und insbesondere werden diese Zellen als Datenobjekte von 48 Oktett betrachtet. Bei jeder Datenrate wird ein Satz einer Anzahl von Zellen pro Zeiteinheit übertragen, z. B. für einen MHz-Kanal ein Bit pro Baud, werden 6 Megabit oder 750000 Oktette pro Sekunde übertragen. Diese Oktette können als 48 Oktett-Zellen gruppiert sein und 15625 derartiger Zellen könne pro Sekunde übertragen werden. Obwohl jedes Intervall verwendet werden kann, ist es günstig, ein Intervall von 1 Sekunde zu verwenden, da dieses sowohl ein günstiger Term für Konstruktionsanalysen ist, und zufällig eine akzeptable Verzögerung ist, welche die meisten menschlichen Teilnehmer als "sofort" betrachten. Mit 15625 Zellen pro Sekunde könnte jede Sekunde in dem Plan beispielsweise Titel für alle aktuellen Programme in einem System 500 Kanälen enthalten und 15000 Zellen für weitere Information in derselben Sekunde belassen. Es dürfte klar sein, dass höhere Datenraten mehr Zellen pro Sekunde liefern und niedrige Datenraten weniger Zellen. Der Plan für die Zellen, Zelle [1] ... Zelle [15625] wird unter Verwendung der neuen Verfahren unserer vorstehenden Anmeldung kombiniert mit einigen neuen Merkmalen entwickelt, um die Speicherbelegung zu reduzieren und eine rasche Wechselwirkung zu unterstützen. Das Planungsproblem kann als ein Job-Shop-Planungsproblem betrachtet werden. Teilnehmerinformationsanforderungen (welche nachstehend bei der Diskussion des Client-Algorithmus beschrieben werden) können als Anforderungen für die Übertragung von Zellen betrachtet werden. Diese Zellen können Titelinformation, Textbeschreibung des Programmaterials oder weitere Information über das Programmaterial enthalten. Jede Zelle wird in dem System insgesamt durch ein <Kanalkennung, Zeit, Zelle#> 3-Tupel bezeichnet, wobei Zelle# dessen Position in dem <Namen, Textbeschreibung, Weiteres> 3-Tupel anzeigt. Diese Indizes können mehr oder weniger strukturiert werden, um die Implementation zu erleichtern.
10. Der Plan wird gemäß den Prioritäten von der höchsten bis zur niedrigsten entwickelt. Ein Beispielprioritätsschema ist:
a.) Teilnehmeranforderungen von Namen, älteste Anforderung zuerst, ein Zellenintervall pro Zeitpunkt wird zugeordnet, bis alle angeforderten Namen übertragen sind.
b.) Teilnehmeranforderungen von Textbeschreibungen, älteste Anforderung zuerst. Für gleich alte Anforderungen wird ein Zellintervall pro Zeitpunkt zugeordnet, bis der gesamte angeforderte Text übertragen ist.
c.) Teilnehmeranforderungen von weiterer Information, älteste Anforderung zuerst. Für gleich alte Anforderungen wird ein Zellintervall pro Zeiteinheit zugeordnet, bis alle angeforderten Daten übertragen sind.
d.) Textbeschreibungen in Verbindung mit Teilnehmernamenanforderungen, älteste Anforderung zuerst. Für gleich alte Anforderungen wird ein Zellenintervall pro Zeiteinheit zugeordnet, bis der gesamte angeforderte Text übertragen ist.
e.) Weitere Information in Verbindung mit Teilnehmernamenanforderungen, älteste Anforderung zuerst. Für gleich alte Anforderungen wird ein Zellenintervall pro Zeiteinheit zugeordnet, bis der gesamte angeforderte Text übertragen ist.
f.) Namen für Programmaterial in zukünftigen Zeitintervallen, ähnlich ermittelt nach den Teilnehmerinteressen, basierend auf der Analyse der Textbeschreibungen oder des für den Planer verfügbaren Teilnehmerverhaltens, wie z. B. typischer Nutzungszeiten für die Betrachtungsvorrichtung, typische Kanalauswahl, usw.
g.) Textbeschreibungen, ...
h.) Weitere, ...
11. Der Zweck des Prioritätsverfahrens besteht in der Bewahrung eines guten interaktiven Verhaltens, Fairneß gegenüber der Teilnehmerpopulation (gemeinsame Nutzung des Kanals für den alle zahlen) und gute Ausnützung des Abwärtsverbindungskanals. Das Vergeben von niedrigeren Prioritäten für vorhersehbare Sehgewohnheiten ermöglicht, dass die Information in die Endgerätadapter des Teilnehmers vorab geladen wird, wenn der Kanal anderweitig von den spezifischen Teilnehmeranforderungen nicht genutzt wird. Wenn Teilnehmer-spezifische Anforderungen ausgeführt haben, nehmen die Anforderungen Priorität eine in der Reihenfolge an, um eine beste interaktive Antwortzeit bereitzustellen. Namen erhalten Priorität, da Namen oft zum Kanalsurfen verwendet werden, und Bandbreite verschwendet werden würde, wenn die Beschreibungen für Namen gesendet würden, welche verworfen werden. Andere Prioritätsverfahren können verwendet werden, wie z. B. Preis-basierende oder die Nähe zum aktuellen Zeitpunkt und das vorliegende Beispiel ist lediglich zur Veranschaulichung und Darstellung gedacht, wie ein Plan für die Zellenübertragung bei einem Server unter einem Satz von Taktikeinschränkungen entwickelt werden kann.

Client-Algorithmus
In einer analogen Weise präsentiert die nachfolgende Liste Eigenschaften einer spezifischen Implementation des von dem Client (Teilnehmerendgerätadapter 112) in dieser Datenverteilungsarchitektur für die CATV-Anwendung verwendeten Algorithmus:

1. Der Client-Speicher ist in Einheiten von Zellen organisiert.
2. Clients besitzen einen eingeschränkten Speicher.
3. Clients priorisieren die Speicherung von Information.
4. Ein Prioritätsschema könnte beispielsweise sein:
a.) Name des momentan betrachteten Materials;
b.) Textbeschreibung des betrachteten Materials oder sogar nur der ersten wenigen Zellen, wenn dieser Speicher extrem beschränkt ist;
c.) weitere Information über das derzeit betrachtete Material, oder sogar nur der ersten wenigen Zellen, wenn dieser Speicher extrem beschränkt ist;
d.) Namensinformation des derzeit verfügbaren Materials in einer ausgewählten Gruppe weiterer Kanäle;
e.) Textbeschreibungen und weitere Information bezüglich Materials, welches derzeit in einer ausgewählten Gruppe weiterer Kanäle verfügbar ist;
f.) Namensinformation von in der Zukunft verfügbaren Material in einer ausgewählten Gruppe weiterer Kanäle, priorisiert nach Zeitnähe;
g.) Textbeschreibungen und weitere Information bezüglich Materials, welches zukünftig in einer ausgewählten Gruppe weiterer Kanäle verfügbar ist, priorisiert nach Zeitnähe.

Unter der Annahme, dass ausreichend Speicherplatz verfügbar ist, können Affinitätsmatrizen entwickelt werden, um Kanal- und Programmaterial auszuwählen. Die Nutzung des Client-Speichers ist optimiert, wenn der Teilnehmerendgerätadapter in der Lage ist, dem Teilnehmer eine sofortige oder nahezu sofortige Auswahl von Material mit einem Minimum an Datenspeicherung zu bieten. Natürlich verbessert, wie bei den meisten Informationssystemen, mehr Datenspeicher die Leistung, jedoch kann sogar die minimalste Datenspeicherarchitektur(eine Zelle) kombiniert mit dem Client/Server-Protokoll ein korrekt funktionierendes Datenverteilungssystem bereitstellen. Ein einziger 64 kBit-RAM-Chip stellt Kapazität für etwas mehr als 160 Zellen zur Verfügung, so dass dieses extrem unwahrscheinlich ist. Wenn der Server korrekt die Bedürfnisse des Client vorhersieht, ist der Abwärtsverbindungsplan optimiert.

5. Information für abgelaufene Zeitintervalle wird sofort verworfen.
6. Information aus dem Server wird als <Kanalkennung, Zeit, Zelle #> 3-Tupel angefordert.
7. Informationsanforderungen werden durch eine Teilnehmerinteraktion oder erwartete Bedürfnisse auf der Basis der bei dem Server geführten Historiedaten angespornt.
8. Informationsanforderungen können Anforderungen zum Senden von Zellengruppen, wie z. B. solcher, die einer vollständigen Textbeschreibung oder weiterer Information zugeordnet sind, umfassen. Dieses ermöglicht das Muliplexieren des Abwärtsverbindungskanals zwischen Teilnehmern, wie es in dem Abschnitt des Server-Algorithmus beschrieben wurde.
9. Wenn eine Zelle ankommt, nachdem beispielsweise eine Anforderung ausgegeben worden ist, wird sie auf Priorität gegenüber der derzeitigen Zellengruppe geprüft. Wenn unbenutzte Zellen in dem Speicher des Teilnehmerendgerätadapters verfügbar sind, wird die empfangene Zelle gespeichert. Wenn keine Zellen in dem Speicher des Teilnehmerendgerätadapters frei sind, wird die Priorität der Zelle mit derzeit gespeicherten Zellen in dem Teilnehmerendgerätadapter verglichen. Wenn die Priorität der neu empfangenen Zelle höher als die Priorität einer zuletzt empfangenen Zelle ist, wird die vorhandene Zelle mit der geringsten Priorität verworfen und durch die neue Ankunftszelle mit höherer Priorität ersetzt. Man beachte, dass dieser Prozess sowohl für angeforderte als auch unangeforderte Zellen zutrifft und eine vorhersehende Nutzung ermöglicht, wenn der Speicher in der La ge ist, dieses auszuführen, sowie zellenweise Aktualisierungen für Teilnehmerendgerätadapter mit extrem niedriger Kapazität.

Vorabholen
Die Bandbreite ist an dem Wurzelende eines hierarchischen Knotennetzwerksystems ist größer. In Vorwegnahme einer Anforderung ist es klug, das Ähnlichkeitsmaß zu nutzen, um prädiktiv Dateien in lokale Server zu speichern, und ferner Auswahlen in gegebene Verteilungszellen und(hierarchische) Teilzellen über Teil-Server auf der Basis schmalbandig zu senden, welche Auswahlen am wahrscheinlichsten in jeder Zelle angefordert werden, um so signifikant die Nutzung der Bandbreite über diese hierarchische Schmalbandsendekonfiguration zu erhöhen. Die Wichtigkeit dieser Einsparungen erscheint proportional zu dem Grad der Körnigkeit (Kleinigkeit der Zelle) in der Schmalbandarchitektur. Diese Technik kann auch zum Treffen von Entscheidungen für die Planung verwendet werden, welche Daten auf spezielle Kanäle gelegt werden sollten. Dieses kann für ein Netzwerk effektiver sein, wenn eine Datei beliebt genug war, um immer in der Warteschlange zu sein, da nach einem Anforderungsauftrag eine Datei teilweise unabhängig davon herunter geladen werden kann, wo innerhalb der Länge der Datei das Herunterladen begann. Der(anfänglich) fehlende Anteil der Datei kann dann unmittelbar aufgenommen werden, wenn das Schmalbandsenden der Datei wieder von vorne beginnt, und somit das Herunterladen in derselben Zeitperiode abgeschlossen werden, als ob eine spezielle Anforderung die Datei gemacht worden wäre. Mobile Nutzer, deren geographischen Lagen bekannt sind, können Dateien (z. B. in der Nacht) in die Server vorabspeichern lassen, welche derzeit zu jedem gegebenen Zeitpunkt ihnen am nächsten liegen.
Das vorliegende Datenverteilungssystem nutzt die Idee des Vorabholens, welches auch aus Vorabspeichern, Cache-Vorladen, oder Vorwegnahme in der technischen Literatur bezeichnet wird. Die Grundidee besteht darin, dass, wenn gute Vorhersagen für zukünftige Datenanforderungen verfügbar sind, und eine überschüssige Datenvorauslesefähigkeit verfügbar ist, die Daten aggressiv in Voraussicht zukünftigen Bedarfs vorab geholt werden sollten. Falls sie erfolgreich ist, hat diese Technik zwei Hauptvorteile, welche auf derzeitige und zukünftige Netzwerke anwendbar sind. Erstens kann sie die Reaktionszeit, einen Hauptleistungsfaktor in interaktiven Systemen, reduzieren (d. h. ver bessern). Zweitens kann sie Blockierung und andere Probleme in Verbindung mit einer Netzwerküberlastung reduzieren. In 8 stellen wir eine mögliche zeitliche Abfolge von Bandbreiten dar, welche durch eine Anwendung oder eine Gruppe von Anwendungen benötigt werden. Um zu verstehen, wie Reaktionsfähigkeit des Systems verbessert wird, kann man sehen, dass nicht genutzte Bandbreite zur Übertragung von Information genutzt wird, welche wahrscheinlich in der Zukunft benötigt wird. Wenn beispielsweise eine Liste 1, 2, 3, 4, ... durchlaufen wird, ist es wahrscheinlich, dass, wenn ein Objekt N angefordert worden ist, das Objekt N + 1 die nächste Anforderung sein wird. Wenn N + 1 von dem entfernten System vorabgeholt wird, ist es ohne zusätzliche Verzögerung verfügbar, wenn die Anforderung erfolgt. Die in 8 dargestellte "unbenutzte Bandbreite" kann möglicherweise zum Vorabholen verwendet werden. Um zu verstehen, wie die Blockierung reduziert werden kann, nehmen wir zuerst zur Kenntnis, dass eine Blockierung aufgrund unzureichender Ressourcen beruht. Das einfachste Beispiel ist eine unzureichende Straßenkapazität für die vorliegende Belastung, was zu "Verkehrsstaus" führt. Paket-vermittelte Netzwerke, wie z. B. das IP-Internet leiden unter ähnlichen Problemen. In 8 scheint es, dass die Kapazität in der Nähe der Zeit = 43 oder ähnlich erreicht oder überschritten ist. Wenn Anforderungen während dieser Periode gemacht werden, wird der Verkehr wahrscheinlich verzögert oder geht sogar verloren. Wenn wir während Periode leichterer Belastung erfolgreich vorabholen (z. B. zur Zeit 0 ... 42), verringern wir die Wahrscheinlichkeit, dass Daten zukünftig angefordert werden, was im Wesentlichen die Garantie eines voll belasteten Netzes heute gegen die Aussicht keiner Blockierung in der Zukunft eintauscht. Durch Vorabholen von Daten in Vorwegnahme eines zukünftigen Bedarfs reduzieren wir(wenigstens wahrscheinlich) diesen zukünftigen Bedarf.
Das Vorabholen wurde auf dem Gebiet der Computerbetriebssysteme bereits mehrere Jahrzehnte verwendet, und eine Vielzahl von Algorithmen wurde bereits erforscht. A. J. Smith of Berkeley hat berichtet, dass der einzige Fall, in welchem erfolgreiche Vorhersagen über zukünftige Anforderungen von Speicherobjekten durchgeführt werden können, vorliegt, wenn die Zugriffe sequentiell sind. Eine neuere Arbeit für Inhalte auf höherer Ebene wie z. B. World-Wide-Web (WWW)-Hypertext hat gezeigt, dass man Nutzerautorisierten Links auf andere Hypermedia-Dokumente mit einem gewissen Erfolg folgen kann.
Die Voraushol-Technologie dieser Offenbarung basiert auf unbenutzten Schlitzen, die mit vorab gesendeter Information auf der Basis unseres Verständnisses des Nutzerinteresses gefüllt werden, indem die in der großen Originalanwendung entwickelten Ähnlichkeitsmaße verwendet werden, und für unsere Priorisierung (siehe Seite 18 der vorliegenden Erfindungsoffenbarung) verwendet werden, ein Konzept, mit dem sie sich nicht befassen, da sie http folgen: Links auf der Basis von Beobachtungen über die hohe Wahrscheinlichkeit, dass Benutzer diesen Links folgen.
Die vorliegende Erfindung kann nutzbringend innerhalb des Kontextes von Vorrichtungen der Art von Set-Top-Boxen, wie z. B. PDA's oder Netzwerkcomputern oder Personal-Computern, die als Form einer Set-Top-Box verwendet werden als ein Verfahren zum Reduzieren der von Nutzern beobachteten Reaktionszeit verwendet werden. Dieses Verfahren verwendete "Links" auf andere in einer Datei mit htpp-Format eingebetteten Dokumenten als Hinweise dafür, dass man diesen Links bei dem Vorabholen von Daten folgen sollten; d. h. die durch Links angegebenen Dokumente sollten in Vorwegnahme des Wunsches des Benutzers vorab geholt werden, um den Links zu diesen Dokumenten zu folgen.
Die vorliegende Erfindung stellt zwei Verbesserungen für dieses Verfahren bereit. Erstens stellt es eine technologische Einrichtung bereit, mittels welcher die vorab geholten Daten mit Bedarfsdaten gemischt werden können, um Gesamtverbesserungen in der Reaktionszeit für eine große Anzahl von HTTP/WWW-Nutzern mit reduzierten Speicheranforderungen bereitzustellen. Zweitens stellt die vorliegende Erfindung, welche die Abwärtsverbindung als eine feste Speicherkapazitätsressource betrachtet, ein allgemeines Planungsverfahren bereit, welches Techniken, wie z. B. Nutzerpräferenzen verkörpert, um Information vorab zu holen, wenn Schlitze oder Bandbreiten untergenutzt sind, um präemptiv einen zukünftigen Bandbreitenbedarf zu reduzieren. Die allgemeine Technik der Anwendung des Ähnlichkeits-informierten Vorabholens ist ausführlich in der gleichzeitig anhängigen Patentanmeldung mit dem Titel "Pseudonymous Server For System For Customized Electronic Identification of Desirable Objects" U.S. Anmeldung Ser. Nr. 08/550,886, eingereicht am 31. Oktober 1995 beschrieben (S.N. US. 5,794,938).
Künstliche Verzögerungen
Diese Anmerkung diskutiert die Idee "künstlicher Verzögerungen" in der Warteschlangeneinreihung von Anforderungen für Satelliten- oder Kabelsysteme, an welche unsere Set-Top-Boxen angeschlossen werden. Die Idee besteht darin, dass wird durch sorgfältige Verwaltung der Warteschlangen deutliche Bandbreiteneinsparungen für das System als Ganzes erzielen können. Der Server-Planungsalgorithmus arbeitet wie dieser:
Die Set-Top-Box des Client (von welchen viele vorhanden sein sollten) sendet Anforderungen für Information in Zellengrößeneinheiten an das Serversystem. Das Serversystem wendet einen Prioritätsalgorithmus (siehe insbesondere den nachstehenden Schritt 10) an, um die nächste Zelle zum Senden auszuwählen. Durch Anpassen der relativen Prioritäten können wir eine gute Reaktionsfähigkeit und verringerte Bandbreitenanforderungen trotz des geringen Speicherbedarfs (und der niedrigen Kosten) der Set-Top-Boxen erzielen.
Man stelle sich das Szenario vor, in welchem viele SetTop-Boxen mit dem Server verbunden sind. Diese Situation könnte wie die in 10 dargestellte sein, in welcher Cs Clients sind und S ein Server ist. Nun liegt deutlich eine Vielzahl von Clients vor, und aufgrund dieser Vielzahl sind wir in der Lage, eine Einsparung durch entsprechende Verzögerungen zu erhalten. Ich glaube wiederum, dass das Ähnlichkeitsmaß hier der Schlüssel zum Erfolg und für die Neuheit ist. Man betrachte die Zellanforderungen für die Clients C1, C4 und C5, welche nachstehend unter Verwendung von Buchstaben dargestellt sind, um spezielle Zellen anzuzeigen, wie es in unserem Offenbarungstext diskutiert wird.

C1: E-T-A-O-I-N-S-H-R-D-L-U .......
C4: N-A-T-I-O-N-A-L-V-E-L ......
C5: E-T-A-O-N-L-Y-S-U-D .....

Wir markieren diese Zellanforderung mit Zeiten, welche deren Übertragungsintervallen zugeordnet sind:
T:
I: 0000000001111
M: 1-2-3-4-5-6-7-8-9-0-1-2-3 ......
E:
Nun werde zur Vereinfachung angenommen, dass alle vorstehend dargestellten Zellanforderungen dieselbe Priorität besitzen. Der Server könnte dann tatsächlich die nachstehende Folge von Zellen über den Kanal senden:
S: E-N-E-T-A-A-A-T-T-O-I-O .....
Somit bedienen wir die Zellanforderungen C1-C4-C5-C1-C4-C5 ... (tatsächlich kann der Server Überlappungen zwischen den Anforderungen C1 und C5 in dem ersten Intervall, C4 und C5 in dem zweiten Intervall, C4 und C5 in dem dritten Intervall, und C1 und C5 in dem vierten Intervall erkennen, wobei gegeben ist:
S: E-N-T-A-A-T-O-I-I-O-N-N ....
)
Man stelle sich vor, dass die Clients immer hören. Dann können wir die Zellanforderungen in der HOFFNUNG, dass die ANTWORTEN VERMISCHTen werden, verzögern, was mehrere Set-Top-Box-Clients mit derselben ANTWORT zufrieden stellt. Um dieses konkret zu machen, betrachte man den Verzögerungsdienst durch nur eine Periode. Somit kann das Ausgangssignal des Servers aussehen wie etwa:
S: #-E-N-T-A-O-I-N-L-S-A-Y .....
Was hier abläuft, ist sehr subtil. Indem die Serviceanforderungen einiger Clients verzögert werden, VERGRÖSSERN WIR DIE WAHRSCHEINLICHKEIT, dass eine andere Anforderung hereinkommt, welche wir in den Dienst der äquivalenten verzögerten An forderung falten können. Der Preis dafür liegt möglicherweise in einer Verzögerung, aber mit ausreichender Überlappung sind die Zellenzeiten für 48 Bytes auf einem DBS-Kanal kurz genug, den wir wahrscheinlich ausreichend verzögern können.
Wenn wir das Problem für einen Moment theoretisch betrachten, können wir den Gewinn für eine akzeptable Verzögerung D als die Anzahl redundanter Übertragungen berechnen, welche aufgrund einer Verzögerung D eliminiert werden. Somit beträgt für Verzögerungen von 1 bis 10 Zellenzeiten die Gesamtanzahl von DBS-Zellen ohne Redundanzprüfungen 30; die erforderliche Anzahl, wenn diese kleine Optimierung angewendet wird, ist nachstehend dargestellt:
Verzögerung von DBS-Zellen Bandbreiteneinsparungen
02340/24 = 25%
11830/18 = 66%
21730/17 = 76%
31730/17 = 76%
41530/15 = 100%
51530/15 = 100%
61530/15 = 100%
71530/15 = 100%
81530/15 = 100%
91530/15 = 100%
101530/15 = 114%
Wir berechnen den Bandbreitengewinn gegenüber der einfachen Nutzung von 30 Zellenzeiten; der Bandbreitengewinn ergibt sich aus der Tatsache, dass uns der synchrone Satellitenkanal eine feste Bandbreite zur Verfügung stellt, was eine feste Anzahl von Zellen pro Zeiteinheit ergibt, und wir haben gerade 16 Zellenzeiten durch die Verwendung des Verzögerungsverfahrens gespart. Für dieses Beispiel ist an diesem Punkt kein weiterer Gewinn mehr möglich, da die gesamte Verdoppelung eliminiert worden ist. In einem gewissen Sinne verhält sich dieses wie ein Kompressionsverfahren. Der Ähnlichkeitsalgorithmus vergrößert die Wahrscheinlichkeit, dass diese Überlappungen auftreten – die ideale Situation ist die, wenn wir lange genug warten, so dass die geplante Rund funkzelle nahezu alle Anforderungen innerhalb eines signifikanten Zeitintervalls (beispielsweise mehreren Millisekunden) erfüllt.
Grundfilterung von Programmen
Das Datenverteilungssystem der vorliegenden Erfindung baut automatisch sowohl ein Zielprofil für jedes Zielobjekt in den elektronischen Medien sowie eine "Teilnehmerzielprofilinteressenzusammenfassung" für jeden Teilnehmer auf, wobei diese Teilnehmerzielprofilinteressenzusammenfassung den Interessegrad des Teilnehmers an verschiedenen Typen von Zielobjekten beschreibt. Das System bewertet dann die Zielprofile gegenüber den Teilnehmerzielprofilinteressenzusammenfassungen, um eine Teilnehmerspezifische Rangreihenfolgeliste von Zielobjekten zu erzeugen, welche höchst wahrscheinlich für jeden Teilnehmer von Interesse sind, so dass der Teilnehmer aus diesen möglicherweise relevante Zielobjekte auswählen kann, welche automatisch durch dieses System aus der Fülle von auf den elektronischen Medien verfügbaren Zielobjekten ausgewählt wurden.
Da die Leute viele Interessen haben, muß eine Zielprofilinteressenzusammenfassung für einen einzelnen Teilnehmer mehrere Interessensbereiche repräsentieren, indem sie beispielsweise aus einem Satz individueller Suchprofile besteht, wovon jedes einen Interessenbereich des Teilnehmers bezeichnet. Jedem Teilnehmer werden diejenigen Zielobjekte präsentiert, deren Profile am besten den Teilnehmerinteressen gemäß Beschreibung durch die Teilnehmerzielprofilinteressenzusammenfassung entsprechen. Die Teilnehmerzielprofilinteressenzusammenfassungen werden automatisch auf einer fortlaufenden Basis aktualisiert, um die sich verändernden Teilnehmerinteressen zu reflektieren. Zusätzlich können Zielobjekte basierend auf der Ähnlichkeit zueinander in Gruppierungen gruppiert werden, beispielsweise auf der Ähnlichkeit ihrer Themen in dem Falle, in welchem die Zielobjekte veröffentlichte Programme sind, und Menüs automatisch für jede Gruppierung von Zielobjekten erzeugt werden, um dem Teilnehmer zu ermöglichen, durch die Gruppierungen zu navigieren und manuell interessierende Zielobjekte zu lokalisieren. Aus Gründen der Vertraulichkeit und Geheimhaltung kann ein spezieller Teilnehmer nicht die Veröffentlichung aller in der Teilnehmerzielprofilinteressenzusammenfassung aufgezeichneten Interessen wünschen, insbesondere wenn diese Interessen durch die Kaufverhaltensmuster des Teilnehmers bestimmt sind. Der Teil nehmer kann wünschen, dass die gesamte oder ein Teil der Zielprofilinteressenzusammenfassung vertraulich gehalten wird. Es ist deshalb erforderlich, dass Daten in einer Zielprofilinteressenzusammenfassung eines Teilnehmers vor einer unerwünschten Veröffentlichung mit Ausnahme der Zustimmung des Teilnehmers geschützt werden, was eine Verarbeitung zumindest eines Teils der Zustimmungsmatrix in dem Teilnehmerendgerätadapter mit sich bringen kann. Gleichzeitig müssen die Zielprofilinteressenzusammenfassungen des Teilnehmers für die relevanten Server zugänglich sein, um den Abgleich mit Zielobjekten des Teilnehmers durchzuführen, wenn der Vorteil dieses Abgleichs sowohl vom Anbieter als auch Verbraucher der Zielobjekte gewünscht wird.
In der bevorzugten Ausführungsform der Erfindung verwendet das Datenverteilungssystem ein fundamentales Verfahren zum genauen und effizienten Abgleichen von Teilnehmern und Zielobjekten, indem automatisch Profilinformation berechnet, verwendet und aktualisiert wird, welche sowohl die Interessen des Teilnehmers als auch die Eigenschaften der Zielobjekte beschreibt. Die Zielobjekte sind typischerweise Programme und deren Eigenschaften werden gespeichert und/oder in den elektronischen Medien als (digitale) Daten dargestellt und/oder bezeichnet. Der Informationslieferungsprozess in der bevorzugten Ausführungsform basiert auf der Ermittlung der Ähnlichkeit zwischen einem Profil für das Zielobjekt und den Profilen von Zielobjekten, für welche der Teilnehmeroder ein ähnlicher Teilnehmer) eine positive Rückmeldung in der Vergangenheit gegeben hat. Die individuellen Daten, die ein Zielobjekt beschreiben und das Profil des Zielobjekts darstellen werden hierin als "Attribute" des Zielobjektes bezeichnet. Attribute können die nachstehenden umfassen, sind jedoch nicht darauf beschränkt: (1) lange Textteile (eine Filmbesprechung oder eine Werbung), (2) kurze Textteile (Name eines Filmregisseurs, Name einer Stadt, aus welcher eine Werbung platziert wurde), (3) numerische Messwerte (einem Film gegebene Bewertungen), (4) Beziehungen zu anderen Typen des Objekts (Liste der Schauspieler in einem Film). Jedes dieser Attribute, aber insbesondere die Numerischen, können mit der Qualität des Zielobjektes korrelieren, wie z. B. Messwerte für dessen Beliebtheit (wie oft darauf zugegriffen wird), oder die Teilnehmerzufriedenheit (Anzahl der empfangenen Beschwerden).
Jeder Film besitzt einen unterschiedlichen Wertesatz für diese Attribute. Dieses Beispiel veranschaulicht zweckmäßigerweise drei Arten von Attributen. Es ist offensichtlich, dass sie dazu genutzt werden können, um zum Identifizieren der interessierenden Zielobjekte (Filme) des Teilnehmers beizutragen. Beispielsweise kann der Teilnehmer mit Elternberatung (PG) Filme und in den 1970-ern hergestellte Filme gemietet haben. Diese Verallgemeinerung ist nützlich: neue Filme mit Werten für eines oder beide Attribute, welche numerisch ähnlich diesen sind(wie z. B. eine MPAA-Bewertung von 1, Erscheinungsdatum von 1975) werden als den Filmen ähnlich beurteilt, welche der Teilnehmer gerne sieht, und daher für ihn möglicherweise von Interesse sind. Textattribute sind wichtig, um den Teilnehmer bei der Lokalisierung gewünschter Filme zu unterstützen. Beispielsweise kann der Teilnehmer in der Vergangenheit Interesse an Filmen gezeigt haben, dessen Beschreibungstext Worte wie "Verfolgungsjagd", "Explosion", "Explosionen", "Held", "spannend", und "hervorragend" enthalten. Diese Verallgemeinerung ist wiederum für die Identifizierung neuer interessierender Filme nützlich. Das TF/IDF-Verfahren kann dazu genutzt werden, um Filmbeschreibungen zu profilieren, oder selbst die darin enthaltenen geschlossenen Untertitel, wie es nachstehend beschrieben wird. Assoziative Attribute zeichnen Beziehungen zwischen Zielobjekten in diesem Bereich, nämlich Filme und Hilfszielobjekte einer vollständig anderen Art, nämlich Menschen auf.
Zerlegung komplexer Attribute
Obwohl textliche und assoziative Attribute große und komplexe Datenteile sind, können sie für Informationsgewinnungszwecke in kleinere, einfachere numerische Attribute zerlegt werden. Dieses bedeutet, dass jeder Satz von Attributen durch einen (üblicherweise größeren) Satz von numerischen Attributen ersetzt werden kann, und somit jedes Profil als ein Vektor von Zahlen dargestellt werden kann, welche die Werte dieser numerischen Attribute angeben. Insbesondere kann ein Textattribut, wie z. B. der volle Text einer Filmkritik durch eine Sammlung numerischer Attribute ersetzt werden, welche Wertungen darstellen, um das Vorhandensein und die Wichtigkeit der Worte in diesem Text zu bezeichnen. Die Wertung eines Wortes in einem Text kann anhand zahlreicher Möglichkeiten definiert werden. Die einfachste Definition besteht darin, dass die Wertung die Häufigkeit des Wortes in dem Text ist, welche berechnet wird, indem die Anzahl der Male berechnet wird, mit denen das Wort in dem Text auftritt, und indem diese Zahl durch die Gesamtanzahl der Worte in dem Text dividiert wird. Diese Wertungsart wird oft als die "Begriffshäufigkeit" (TF – term frequency) des Wortes bezeichnet. Die Definition der Begriffshäufigkeit kann optional modifiziert werden, um unterschiedliche Abschnitte des Textes ungleichmäßig zu gewichten: Beispielsweise kann jedes Auftreten eines Wortes in dem Texttitel als ein 3-faches oder allgemeiner als k-faches Auftreten gezählt werden (als ob der Titel k-mal innerhalb des Textes wiederholt worden wäre), um eine heuristische Annahme zu reflektieren, dass die Worte in dem Titel besonders wichtige Indikatoren für den Inhalt oder das Thema des Textes sind.
Ebenso wie ein Textattribut in eine Anzahl von Komponentenbegriffen (Buchstaben- oder Wort-Engramme) zerlegt werden kann, kann ein assoziatives Attribut in eine Anzahl von Komponentenbeziehungen zerlegt werden. Beispielsweise wäre ein typisches assoziatives Attribut, das bei der Profilierung eines Films verwendet wird, eine Liste von Teilnehmern, welche diesen Film gemietet haben. Diese Liste kann durch eine Sammlung numerischer Attribute ersetzt werden, welche die "Beziehungswerten" zwischen dem Film und jedem von den dem System bekannten Teilnehmern angibt. Beispielsweise wäre das 165.-te derartige numerische Attribut der Beziehungswert für den Film und den Teilnehmer #165, wobei der Beziehungswert 1 ist, wenn der Teilnehmer #165 zuvor den Film gemietet hat, und ansonsten 0. In einer subtileren Verfeinerung könnte dieser Beziehungswert als der Grad des Interesses, möglicherweise 0, definiert sein, den der Teilnehmer #165 an dem Film zeigte, wie es durch die Relevanzrückmeldung ermittelt wird.
Ähnlichkeitsmaße
Was bedeutet es, dass zwei Zielobjekte ähnlich sind? Genauer gesagt, wie sollte man den Grad der Ähnlichkeit messen? Es sind viele Lösungsansätze möglich, und jedes vernünftige Maß, das hinsichtlich des Satzes von Zielobjektprofilen berechnet werden kann, kann verwendet werden, wobei Zielobjekte als ähnlich betrachtet werden, wenn der Abstand zwischen ihren Profilen gemäß diesem Maß klein ist. Somit weist die nachstehende bevorzugte Ausführungsform eines Zielobjekt-Ähnlichkeitsmaßsystems viele Varianten auf.
Zuerst werde der Abstand zwischen zwei Werten eines gegebenen Attributes abhängig davon definiert, ob das Attribut ein numerisches, Beziehungs- oder ein Textattribut ist. Wenn das Attribut numerisch ist, ist dann der Abstand zwischen den zwei Werten des Attributes der Absolutwert der Differenz zwischen den zwei Werten. Wenn es für eine Gruppierungsbildung oder andere Zwecke erforderlich ist, kann ein Maß, das einen Ver gleich von zwei beliebigen Objekten (unabhängig davon, ob sie von derselben oder gleichen Art sind) erlaubt, wie folgt definiert werden. Wenn a ein Attribut ist, dann sei Max(a) die obere Begrenzung des Abstandes zwischen zwei Werten des Attributes a; man beachte, dass wenn das Attribut a ein Beziehungs- oder Textattribut ist, dieser Abstand ein Winkel ist, welcher durch arccos bestimmt ist, so dass Max(a) als 180° gewählt werden kann, während dann, wenn das Attribut ein numerisches Attribut ist, eine ausreichend große Zahl von den Systemdesignern gewählt werden muss. Der Abstand zwischen zwei Werten eines Attributes a ist wie vorstehend in dem Falle gegeben, in welchem beide Werte definiert sind; der Abstand zwischen zwei undefinierten Werten wird als 0 angenommen; der Abstand zwischen einem definierten Wert und einem undefinierten Wert wird immer als Max(a)/2 angenommen. Dieses ermöglicht es uns zu ermitteln, wie nahe aneinander zwei Zielobjekte in Bezug auf ein Attribut a sind, selbst wenn das Attribut a keinen definierten Wert für beide Zielobjekte besitzt. Der Abstand d(*, *) zwischen zwei Zielobjekten in Bezug auf deren gesamten Mehrfachattributprofile ist dann in Begriffen dieser individuellen Attributabstände genau wie zuvor. Es wird angenommen, dass ein Attribut in einem derartigen System die Art des Zielobjektes ("Film", "Novelle", usw.) spezifiziert, und dass dieses Attribut hoch gewichtet werden kann, wenn Zielobjekte unterschiedlicher Arten, trotz der Attribute, die sie gemeinsam haben können, als sehr unterschiedlich betrachtet werden kann.
Filterung: Relevanzrückmeldung
Ein Filterungssystem ist eine Vorrichtung, welche viele Zielobjekte durchsuchen und ein gegebenes Teilnehmerinteresse an jedem Zielobjekt abschätzen kann, um so diejenigen zu identifizieren, die für den Teilnehmer von größtem Interesse sind. Das Filtersystem verwendet Relevanzrückmeldung, um seine Kenntnis über die Interessen des Teilnehmers zu verfeinern: jedesmal, wenn das System ein Zielobjekt als möglicherweise interessierend für einen Teilnehmer identifiziert, liefert der Teilnehmerfalls es ein Online-Teilnehmer ist) eine Rückmeldung, ob das Zielobjekt tatsächlich von Interesse ist oder nicht. Eine derartige Rückmeldung wird langfristig in zusammengefaßter Form als Teil einer Datenbank mit Teilnehmerrückmeldeinformation gespeichert, und kann entweder aktiv oder passiv erzeugt werden. Bei einer aktiven Rückmeldung zeigt der Teilnehmer explizit sein oder ihr Interesse beispielsweise auf einer Skale von –2 (aktives Mißfallen) über 0 (kein spezielles Interesse) bis 10 (großes Interesse) an. In der passiven Rück meldung leitet das System das Teilnehmerinteresse aus dem Verhalten des Teilnehmers ab. Beispielsweise könnte das System, wenn die Zielobjekte Textdokumente sind überwachen, welche Dokumente der Teilnehmer zum Lesen oder nicht zum Lesen auswählt, und wie viel Zeit der Teilnehmer zum Lesen dieser aufwendet.
Filterung: Ermittlung des thematischen Interesses durch Ähnlichkeit
Die Relevanzrückkopplung bestimmt nur das Interesse des Teilnehmers an bestimmten Zielobjekten: nämlich den Zielobjekten, für welche der Teilnehmer die Möglichkeit zur Bewertung (entweder aktiv oder passiv) hatte. Für Zielobjekte, die der Teilnehmer noch nicht gesehen hat, muß das Filtersystem das Teilnehmerinteresse abschätzen. Diese Abschätzungsaufgabe ist der Kern des Filterungsproblems, und der Grund, warum die Ähnlichkeitsmessung wichtig ist. Der Teilnehmer kann aktive und/oder passive Rückmeldung an das System bezüglich der präsentierten Programme geben. Das System besitzt jedoch keine Rückmeldungsinformation von dem Teilnehmer für Programme, welche niemals dem Teilnehmer präsentiert wurden, wie z. B. neue Programme, die gerade dem Sendeplan hinzugefügt worden sind, oder alte Programme, die das System nicht für eine Präsentation an den Teilnehmer auswählt.
Wie es im Flußdiagramm in 6 dargestellt ist, kann die Bewertung der Wahrscheinlichkeit des Interesses an einem speziellen Zielobjekt für einen spezifischen Teilnehmer automatisch berechnet werden. Das Interesse, das ein gegebenes Zielobjekt X für einen Teilnehmer U darstellt, wird als die Summe von zwei Größen angenommen: q(U, X), die intrinsische "Qualität" von X, plus f(U, X) das "thematische Interesse", das Teilnehmer, wie z. B. U, an Zielobjekten wie X haben. Für jedes Zielobjekt X wird das intrinsische Qualitätsmaß q(U, X) leicht bei den Schritten 601 bis 603 direkt aus den numerischen Attributen für das Zielobjekt X abgeschätzt. Der Berechnungsprozess beginnt bei dem Schritt 601, bei dem bestimmte zugewiesene numerische Attribute des Zielobjektes X spezifisch ausgewählt werden, wobei die Attribute aufgrund ihrer eigentlichen Art positiv oder negativ mit dem Interesse des Teilnehmers korreliert werden sollten. Derartige als "Qualitätsattribute" bezeichnete Attribute haben die normative Eigenschaft, dass je höher(oder in einigen Fällen niedriger) ihr Wert ist, der Teilnehmer erwartungsgemäß ein um so höheres Interesse daran findet. Qualitätsattribute des Zielobjektes X können umfassen, sind jedoch nicht darauf beschränkt, die Beliebtheit des Zielobjektes X unter Teilnehmern im allgemeinen, die Bewertung, die ein spezifischer Kritiker dem Zielobjekt X gegeben hat, das Alter(Zeit seit der Entstehung – ebenfalls als Veralterung bekannt) des Zielobjektes X, die Anzahl von in dem Zielobjekt X verwendeten Vulgärworten, der Preis des Zielobjektes X und die Geldmenge, welche die das Zielobjekt X verkaufende Firma der favorisierten karitativen Organisation des Teilnehmers gespendet hat. Bei dem Schritt 602 wird jedes der ausgewählten Attribute mit einer positiven oder negativen Gewichtung multipliziert, welche die Stärke der Präferenz des Teilnehmers U für diejenigen Zielobjekte, die hohe Werte für dieses Attribut besitzen, anzeigt, wobei die Gewichtung aus einer Qualitätsattributgewichtungen speichernden Datendatei für den ausgewählten Teilnehmer geholt werden muss. Bei dem Schritt 603 wird eine gewichtete Summe der identifizierten gewichteten ausgewählten Attribute berechnet, um das intrinsische Qualitätsmaß q(U, X) zu berechnen. Bei dem Schritt 604 werden die zusammengefaßten gewichteten Relevanzrückmeldungsdaten ausgelesen, wobei einige Relevanzrückmeldungspunkte stärker als andere gewichtet werden, und die gespeicherten Relevanzdaten in einem gewissen Umfang beispielsweise durch die Anwendung von Suchprofilsätzen zusammengefaßt werden können. Der schwierigere Teil der Ermittlung des Interesses des Teilnehmers U am Zielobjekt X besteht bei dem Schritt 605 in dem Finden oder Berechnen des Wertes von f(U, X), welcher das thematische Interesse bezeichnet, das Teilnehmer wie U allgemein an Zielobjekten wie X haben. Das Verfahren zur Ermittlung eines Teilnehmerinteresses beruht auf der nachfolgenden Heuristik: wenn X und Y ähnliche Zielobjekte sind(ähnliche Attribute besitzen), und U und V ähnliche Teilnehmer sind(ähnliche Attribute besitzen), wird dann vorhergesagt, dass das thematische Interesse f(U, X) einen ähnlichen Wert wie das thematische Interesse f(V, Y) hat. Diese Heuristik führt zu einem effektiven Verfahren, da geschätzte Werte der thematischen Interessenfunktion f(*, *) tatsächlich für bestimmte Argumente für diese Funktion bekannt sind: insbesondere wenn der Teilnehmer V eine Relevanz-Rückmeldungsbewertung von r(V, Y) für das Zielobjekt Y geliefert hat, haben wir, soweit diese Bewertung das tatsächliche Interesse des Teilnehmers V an dem Zielobjekt Y repräsentiert, r(V, Y) = q(V, Y) + f(V, Y) und können f(V, Y) als r(V, Y) – q(V, Y) abschätzen. Somit wird das Problem der Abschätzung des thematischen Interesses an allen Punkten ein Problem einer Interpolation zwischen den Abschätzungen des thematischen Interesses an ausgewählten Punkten, wie z. B. die Rückmeldungsabschätzung von f(V, Y) als r(V, Y) – q(V, Y). Diese Interpolation kann mit jeder Standardglättungstechnik erreicht werden, indem als Eingabe die bekannten Punktabschätzungen des Wertes der thematischen Interessenfunktion f(*, *) verwendet werden, und als Ausgangsgröße eine Funktion ermittelt wird, welche die gesamte thematische Interessenfunktion f(*, *) annähert.
Nicht allen Punktabschätzungen der thematischen Interessenfunktion f(*, *) sollte die gleiche Gewichtung als Eingangsgrößen für den Glättungsalgorithmus gegeben werden. Da eine passive Relevanz-Rückmeldung weniger zuverlässig als eine aktive Relevanz-Rückmeldung ist, sollten aus passiver Relevanz-Rückmeldung erzeugte Punktabschätzungen weniger stark gewichtet werden als aus aktiven Relevanz-Rückmeldung erzeugter Punktabschätzungen, oder überhaupt nicht verwendet werden. In den meisten Bereichen können sich die Interessen eines Teilnehmers mit der Zeit verändern, und deshalb sollten Abschätzungen des thematischen Interesses, welche aus einer neueren Rückmeldung abgeleitet werden auch stärker gewichtet werden. Die Interessen eines Teilnehmers können stimmungsabhängig variieren, somit sollten Schätzungen des thematischen Interesses, die aus der aktuellen Sitzung stammen, stärker für die Dauer der aktuellen Sitzung gewichtet werden, und frühere Schätzungen des thematischen Interesses, welche etwa zur aktuellen Tageszeit oder am aktuellen Werktag erstellt wurden, stärker gewichtet werden. Eine Schätzung des thematischen Interesses f(V, Y) sollte stärker gewichtet werden, wenn der Teilnehmer V mehr Erfahrung mit dem Zielobjekt Y hatte. In der Tat besteht eine nützliche Strategie für das System darin, die Langzeit-Rückmeldung für derartige Zielobjekte zu verfolgen.
Um die Glättungstechnik effektiv anzuwenden, ist es erforderlich, eine Definition über den Ähnlichkeitsabstand zwischen (U, X) und(V, Y) für alle Teilnehmer U und V und für alle Zielobjekte X und Y zu besitzen. Wir haben bereits gesehen, wie der Abstand d(X, Y) zwischen zwei Zielobjekten X und Y zu definieren ist, wenn deren Attribute gegeben sind. Wir können ein Paar wie z. B. (U, X) als ein erweitertes Objekt betrachten, welches alle Attribute des Zielobjektes X und alle Attribute des Teilnehmers U trägt; dann kann der Abstand zwischen (U, X) und(V, Y) in genau derselben Weise berechnet werden. Dieser Ansatz erfordert, dass der Teilnehmer U, der Teilnehmer V und alle anderen Teilnehmer einige Attribute von sich selbst in dem System gespeichert haben: Beispielsweise Alter (numerisch), Sozialversicherungsnummer (Text) und eine Liste früher gelesener Dokumenten (Beziehung). Es sind diese Attribute, welche die Bezeichnung des "ähnlichen Teilnehmers" bestimmen. Somit ist es erwünscht, (als "Teilnehmerprofil" bezeichnete) Profile von Teilnehmern sowie (als "Zielprofile" bezeichnete) Profile von Zielobjekten zu erzeugen. Einige von den für die Profilierung von Teilnehmern verwendeten Attribute können mit den für die Profilierung von Zielobjekten verwendeten Attribute verwandt sein: beispielsweise ist es unter Verwendung von Beziehungsattributen möglich, Zielobjekte wie z. B. X durch das Interesse zu charakterisieren, das verschiedene Teilnehmer an dieser gezeigt haben, und gleichzeitig Teilnehmer, wie z. B. U, durch das Interesse zu charakterisieren, das sie an verschiedenen Zielobjekten gezeigt haben. Zusätzlich können Teilnehmerprofile von irgendwelchen Attributen Gebrauch machen, welche zur Charakterisierung von Menschen nützlich sind, wie z. B. diejenigen, die in dem vorstehenden Beispielbereich vorgeschlagen wurden, in welchem Zielobjekte mögliche Verbraucher sind. Man beachte, dass das Interesse eines Teilnehmers U selbst dann abgeschätzt werden kann, wenn der Teilnehmer U ein neuer Teilnehmer oder ein Oft-line-Teilnehmer ist, welcher niemals irgendeine Rückmeldung geliefert hat, da die Relevanz-Rückmeldung von Teilnehmern berücksichtigt wird, deren Attribute ähnlich zu den Attributen von U sind.
Für einige Anwendungen des Filterungssystems ist es bei der Abschätzung des thematischen Interesses zweckmäßig, eine zusätzliche "Vorwegannahme keines thematischen Interesses" (oder eine "Vorgabe in Richtung 0") zu treffen. Um die Nützlichkeit einer derartigen Vorwegannahme zu verstehen, werde angenommen, dass das System ermitteln muß, ob das Zielobjekt A thematisch für den Teilnehmer U interessant ist, dass jedoch Teilnehmer wie der Teilnehmer U niemals eine Rückmeldung bezüglich Zielobjekten selbst entfernt ähnlicher Zielobjekte X gemacht haben. Die Vorwegannahme keines thematischen Interesses besagt, dass wenn dieses so ist, dieses so ist, Teilnehmer wie der Teilnehmer U einfach nicht an derartigen Zielobjekten interessiert sind, und sie deshalb nicht suchen und mit ihnen interagieren. Mit dieser Vorwegannahme sollte das System das thematische Interesse f(U, X) als niedrig einschätzen. Formal hat dieses Beispiel die Eigenschaft, dass (U, X) weit von allen Punkten (V, Y) entfernt ist, wo eine Rückmeldung verfügbar ist. In einem derartigen Falle wird das thematische Interesse f(U, X) als nahe an Null vorweg angenommen, selbst wenn der Wert der thematischen Interessenfunktion f(*, *) bei all den weit entfernt liegenden umgebenden Punkten hoch ist, bei welchen deren Wert bekannt ist. Wenn eine Glättungstechnik verwendet wird, kann eine derartige Vorwegannahme keines thematischen Interesses, falls es zweckmäßig ist, durch Manipulieren der Eingangsgröße für die Glättungstechnik eingeführt werden. Zusätzlich zur Verwendung beobachteter Werte der thematischen Interessenfunktion f(*, *) als Eingangsgröße besteht der Trick ebenfalls darin, falsche Beobachtungen der Form des thematischen Interesses f(V, Y) = 0 für ein Gitter von Punkten (V, Y) einzuführen, welches über den mehrdimensionalen Raum verteilt ist. Diesen falschen Beobachtungen sollte eine relativ niedrige Gewichtung als Eingangsgrößen für den Glättungsalgorithmus gegeben werden. Je stärker sie gewichtet werden, desto stärker ist die Vorwegannahme keines Interesses.
Nachstehendes stellt ein weiteres einfaches Beispiel einer Abschätzungstechnik bereit, welche die Vorwegannahme von keinem Interesse hat. Es sei g eine abnehmende Funktion von nicht-negativen realen Zahlen zu nicht-negativen realen Zahlen wie z. B. g(x) = e^x oder g(x) = min(1, x^–k) wobei k > 1 ist. Es werde das thematische Interesse f(U, X) mit dem nachfolgenden g-gewichteten Mittelwert abgeschätzt.
Hier sind die Summierungen über alle Paare (V, Y) so, dass ein Teilnehmer V eine Rückmeldung r(V, Y) über das Zielobjekt Y, d. h. über alle Paare (V, Y) geliefert hat, so dass eine Relevanz-Rückmeldung r(V, Y) definiert ist. Man beachte, dass sowohl mit dieser Technik als auch mit herkömmlichen Glättungstechniken der Schätzwert des thematischen Interesses f(U, X) nicht notwendigerweise gleich r(U, X) – q(U, X) sein muß, selbst wenn r(U, X) definiert ist.
Filterung: Anpassung der Gewichtungen und Restrückmeldung
Das vorstehend beschriebene System erfordert, dass das Filterungssystem Abstände zwischen (Teilnehmer, Zielobjekt)-Paaren wie z. B. den Abstand zwischen (U, X) und(V, Y) mißt. Wenn die vorstehend beschriebene Einrichtung zum Messen des Abstandes zwischen zwei Multiattributprofilen gegeben ist, muß das Verfahren daher eine Gewichtung jedem der in dem Profil der (Teilnehmer, Zielobjekt)-Paare verwendeten Attribut zuordnen, d. h. jeden Attribut, das zum Profilieren entweder von Teilnehmer- oder Zielobjekten verwendet wird. Diese Gewichtungen spezifizieren die relative Wichtigkeit der Attribute bei der Feststellung der Ähnlichkeit oder des Unterschiedes, und daher in der Ermittlung, wie das thematische Interesse von einem (Teilnehmer, Zielobjekt)-Paar zu einem nächsten verallgemeinert wird. Zusätzliche Gewichtungen bestimmten, welche Attribute eines Zielobjektes zu der Qualitätsfunktion q beitragen, und wie stark.
Es ist möglich und oft für ein Filterungssystem erwünscht, einen unterschiedlichen Satz von Gewichtungen für jeden Teilnehmer zu speichern. Beispielsweise möchte ein Teilnehmer, welcher glaubt, dass Zwei-Sterne-Filme eine grundsätzlich unterschiedliche Thematik und Stil gegenüber Vier-Sterne-Filmen besitzen, ein hohes Gewicht der "Anzahl von Sternen" für die Zwecke der Abstandsmessung d(*, *) zuordnen; dieses bedeutet, dass ein Interesse an einem Zwei-Sterne-Film nicht notwendigerweise ein Interesse an einem anderweitigen ähnlichen Vier-Sterne-Film oder umgekehrt signalisiert. Wenn der Teilnehmer auch mit den Kritiken übereinstimmt und tatsächlich Vier-Sterne-Filme bevorzugt, möchte der Teilnehmer auch der "Anzahl von Sternen" ein hohes Gewicht in der Bestimmung der Qualitätsfunktion q geben. In derselben Weise kann ein Teilnehmer, welcher Vulgarität verabscheut, einer "Vulgaritätswertung" ein hohes negatives Gewicht bei der Bestimmung der Qualitätsfunktion q geben, obwohl die "Vulgaritätswertung" nicht notwendigerweise eine hohe Gewichtung in der Bestimmung der thematischen Ähnlichkeit von zwei Filmen hat.
Attributgewichtungen (beider Sorten) können von dem Systemverwalter oder dem einzelnen Teilnehmer entweder auf temporärer oder permanenter Basis eingestellt oder angepaßt werden. Es ist jedoch oft erwünscht, daß das Filterungssystem Attributgewichtungen automatisch auf der Basis der Relevanz-Rückmeldung lernt. Die optimalen Attri- butgewichtungen für einen Teilnehmer U sind diejenigen, welche die genaueste Vorhersage der Interessen des Teilnehmers U erlauben. D. h., mit der Abstandmessung und der durch diese Attributgewichtungen definierten Qualitätsfunktion kann das Interesse des Teilnehmers U an dem Zielobjekt X, q(U, X) + f(U, X) genau mittels der vorstehenden Techniken abgeschätzt werden. Die Effektivität eines speziellen Satzes von Attributgewichtungen für einen Teilnehmer U kann daher gemessen werden, indem man sieht, wie genau es die bekannten Interessen des Teilnehmers U vorhersagt.
Formal werde angenommen, dass der Teilnehmer U zuvor eine Rückmeldung bezüglich der Zielobjekte X₁, X₂, X₃, ... X_n erzeugt hat, und dass die Rückmeldebewertungen r(U, X₁), r(U, X₂), r(U, X₃), ... r(U, X_n) sind. Werte der Rückmeldungsbewertungen r(*, *) für andere Teilnehmer und andere Zielobjekte können ebenfalls bekannt sein. Das System kann die nachstehende Prozedur verwenden, um die Effektivität des Satzes von Attributsgewichtungen zu messen, welche es momentan für den Teilnehmer U speichert: (i) Für jedes I ≤ I ≤ n Verwenden der Abschätzungstechniken, um q(U, X₁) + f(U, X_j) aus allen bekannten Werten von Rückmeldungsbewertungen r abzuschätzen. Bezeichnen dieses Schätzwertes als a_i.
(ii) Wiederholen des Schrittes (i), jedoch zu diesem Zeitpunkt Durchführen der Abschätzung für jedes 1 ≤ I ≤ n ohne Verwendung der Rückmeldebewertungen r(U, X_j) als Eingangsgrößen für jedes j so, dass der Abstand d(X_i, X_j) kleiner als ein fester Schwellenwert ist. D. h., Abschätzen jedes q(U, X_i) + f(U, X_i) nur aus anderen Werten der Rückmeldebewertung r; insbesondere werde r(U, X_i) selbst nicht verwendet. Bezeichnen dieser Abschätzung als b_i. Die Differenz a_i – b_i wird hierin als die "Restrückmeldung r_res(U, X_i) des Teilnehmers U bezüglich des Zielobjektes X_i" bezeichnet. (iii) Berechnen des Fehlermaßes des Teilnehmers U, (a₁ – b₁)² + (a₂ – b₂)² + (a₃ – b₃)² + ... + (a_n – b_n)²
Eine Gradientenabnahme oder anderes numerisches Optimierungsverfahren kann zur Anpassung der Attributgewichtungen des Teilnehmers U so verwendet werden, dass dieses Fehlermaß ein (lokales) Minimum erreicht. Dieser Lösungsansatz arbeitet tendenziell am besten, wenn die in der Abschätzung verwendete Glättungstechnik so ist, dass der Wert von f(V, Y) stark von der Punktabschätzung r(V, Y) – q(V, Y) beeinflußt wird, wenn der letztere Wert als eine Eingangsgröße bereitgestellt wird. Andererseits kann das Vorhandensein oder Fehlen der einzigen Eingangsrückmeldebewertung r(U, X_i) in den Schritten (i)–(ii) a_i und b_i nicht sehr voneinander verschieden machen. Eine leichte Variante dieser Lerntechnik paßt einen einzelnen globalen Satz von Attributgewichten für alle Teilnehmer an, indem die Gewichtungen so angepaßt werden, dass sie nicht das Fehlermaß eines spezifischen Teilnehmers minimieren, sondern statt dessen das gesamte Fehlermaß aller Teilnehmer. Diese globalen Gewichtungen werden als eine anfängliche Vorgabeeinstellung für einen Teilnehmer verwendet, welcher noch keinerlei Rückmeldung erzeugt hat. Gradientenabnahme kann angewendet werden, um die individuellen Gewichtungen dieses Teilnehmers über der Zeit anzupassen. Selbst wenn die Attributgewichtungen zum Minimieren des Fehlermaßes für den Teilnehmer U angewendet werden, ist das Fehlermaß im allgemeinen immer noch positiv, was bedeutet, dass die Restrückmeldung von einem Teilnehmer U sich noch nicht auf 0 bei allen Ziel- Objekten reduziert hat. Es ist nützlich anzumerken, dass eine hohe Restrückmeldung von einem Teilnehmer U bezüglich eines Zielobjektes X anzeigt, dass der Teilnehmer U das Zielobjekt X bei seinem gegebenen Profil unerwartet gut mochte, d. h. besser, als es das Glättungsmodell aus den Meinungen des Teilnehmers U bezüglich Zielobjekten mit ähnlichen Profilen vorhersagen konnte. In ähnlicher Weise zeigt eine niedrige Restrückmeldung an, dass der Teilnehmer I das Zielobjekt X weniger als erwartet mochte. Per Definition kann diese unerwartete Vorliebe oder Abneigung nicht das Ergebnis der thematischen Ähnlichkeit sein, und muß daher als eine Anzeige der intrinsischen Qualität des Zielobjektes X betrachtet werden. Daraus folgt, dass ein nützliches Qualitätsattribut für ein Zielobjekt I der Mittelwertbetrag der Restrückkopplung r_res(V, X) von Teilnehmern bezüglich dieses Zielobjektes, gemittelt über alle Teilnehmer V ist, welche eine Relevanz-Rückmeldung bezüglich des Zielobjektes lieferten. In einer Variante dieser Idee wird die Restrückkopplung niemals unterschiedslos über alle Teilnehmer gemittelt, um ein neues Attribut zu erzeugen, sondern statt dessen geglättet, um die Ähnlichkeit von Teilnehmern untereinander zu berücksichtigen. Man erinnere sich, dass das Qualitätsmaß q(U, X) von dem Teilnehmer U, sowie von dem Zielobjekt X abhängt, so dass ein gegebenes Zielobjekt X von unterschiedlichen Teilnehmern als eine unterschiedliche Qualität aufweisend wahrgenommen werden kann. In dieser Variante wird wie vorstehend q(U, X) als eine gewichtete Summe von verschiedenen Qualitätsattributen berechnet, welche nur von X abhängig sind, aber dann ein zusätzlicher Term hinzuaddiert, nämlich ein Schätzwert von r_res(U, X) welcher durch Anwenden eines Glättungsalgorithmus auf bekannte Werte von r_res(V, X) gefunden wird. Hier reicht V über alle Teilnehmer, welche eine Relevanz-Rückmeldung bezüglich des Zielobjektes X lieferten, und der Glättungsalgorithmus ist auf die Abstände d(U, V) von jedem derartigen Teilnehmer V zu dem Teilnehmer U empfindlich.
Vergleichen des Zielprofils des vorliegenden Programms mit einer Zielprofilinteressenzusammenfassung eines Teilnehmers
Der Prozess, mit welchem ein Teilnehmer diese Vorrichtung verwendet um Programme zu betrachten, ist in Flußdiagrammform in 1 dargestellt. Bei dem Schritt 701 aktiviert der Teilnehmer den Teilnehmerendgerätadapter 112. Der Teilnehmer hat eine Teilnehmerzielprofilinteressenzusammenfassung im Verteilungssystem 100 gespeichert. Wenn der Teilnehmer einen Zugang zu Programmen bei dem Schritt 702 anfordert, berück sichtigt die entweder in dem Verteilungssystem 100 oder in dem Teilnehmerendgerätadapter 112 angeordnete Profilabgleichsoftware sequentiell jedes Suchprofil p_k aus der Teilnehmerzielprofilinteressenzusammenfassung, um zu ermitteln, welche Programme am meisten wahrscheinlich für den Teilnehmer interessant sind. Die Programme wurden bereits automatisch in einem früheren Schritt in einen hierarchischen Gruppierungsbaum zusammengefaßt, so dass die Ermittlung für jeden Teilnehmer rasch erfolgen kann. Der hierarchische Gruppierungsbaum dient als Entscheidungsbaum für die Ermittlung, welche Programmzielprofile dem Suchprofil p_k am ähnlichsten sind: die Suche nach relevanten Programme beginnt an der Spitze des Baums, und bei jeder Ebene des Baums werden die Verzweigung oder die Verzweigungen ausgewählt, welche Gruppierungsprofile besitzen, die p_k am nächsten kommen. Dieser Prozess wird rekursiv ausgeführt, bis die Blätter des Baums erreicht sind, wodurch die interessierenden individuellen Programme des Teilnehmers identifiziert werden.
Eine Variante dieses Prozesses nutzt die Tatsache, dass viele Teilnehmer ähnliche Interessen haben. Statt die Schritte 5 bis 9 des vorstehenden Prozesses getrennt für jede Zielprofilinteressenzusammenfassung jedes Teilnehmers auszuführen, ist es möglich, eine zusätzliche Effizienz zu erzielen, indem diese Schritte nur einmal für jede Gruppe ähnlicher Zielprofilinteressenzusammenfassungen ausgeführt werden, und dadurch die Bedürfnisse vieler Teilnehmer auf einmal erfüllt werden. In dieser Variante beginnt das System mit einer nicht-hierarchischen Zusammenfassung in Gruppierungen aller Zielprofilinteressenzusammenfassungen einer großen Anzahl von Teilnehmern. Für jede Gruppierung k der Zielprofilinteressenzusammenfassung mit dem Gruppierungsprofil p_k lokalisiert sie Programme mit zu p_k ähnlichen Zielprofilen. Jedes lokalisierte Programm wird dann als für jeden Teilnehmer interessierend identifiziert, welcher eine Zielprofilinteressenzusammenfassung besitzt, die in der Gruppierung k der Zielprofilinteressenzusammenfassungen repräsentiert ist.
Präsentation von Programmlisten an den Teilnehmer
Sobald der Profilkorrelationsschritt für einen ausgewählten Teilnehmer oder eine Gruppe von Teilnehmern abgeschlossen ist, speichert die Programmauswahlsoftware bei dem Schritt 704 eine Liste der identifizierten Programme für die Präsentation an den Teilnehmer. Auf Anforderung eines Teilnehmers holt der Prozessor 406 die erzeugte Liste relevanter Programme und präsentiert diese Liste von Titeln der ausgewählten Programme dem Teilnehmer, welcher dann bei dem Schritt 705 irgendein Programm für die Betrachtung auswählen kann. Die Liste der Programmtitel ist gemäß dem Grad der Ähnlichkeit des Programmzielprofils zu der ähnlichsten Teilnehmerzielprofilinteressenzusammenfassung sortiert.
Überwachung der betrachteten Programme
Der Prozessor 406 überwacht bei Schritt 707 welche Programme der Teilnehmer betrachtet, und verfolgt, wieviel Zeit bei der Betrachtung des Programms aufgewendet wird. Diese Information kann mit dem Maß der Tiefe des Teilnehmerinteresses an dem Programm kombiniert werden, was eine passive Relevanz-Rückmeldungsbewertung wie vorstehend beschrieben ergibt. Die genauen Details hängen von der Länge und der Art der gesuchten Programme ab. Das berechnete Maß der Programmattraktivität kann dann als eine Gewichtungsfunktion zur Einstellung der Teilnehmerzielprofilinteressenzusammenfassung verwendet werden, um dadurch genauer die sich dynamisch verändernden Interessen des Teilnehmers zu reflektieren.
Aktualisierung von Teilnehmerprofilen
Eine Aktualisierung einer Teilnehmerzielprofilinteressenzusammenfassung kann bei dem Schritt 708 unter Verwendung des in der gleichzeitig anhängigen U.S. Patentanmeldung Ser. Nr. 08/346,425 (S.N. US 5,758,257 ) beschriebenen Verfahrens durchgeführt werden. Wenn ein Programm betrachtet wird, verschiebt das Verteilungssystem 100 die Zielprofilinteressenzusammenfassung leicht in die Richtung der Zielprofile derjenigen naheliegenden Programme, für welche das berechnete Maß der Programmattraktivität hoch war. Bei einer gegebenen Zielprofilinteressenzusammenfassung mit Attributen u_ik aus einem Teilnehmerzielprofilinteressenzusammenfassungssatz, und einem Satz von J Programmen, welche mit (derzeitig als korrekt angesehenen) Attributen d_jk verfügbar sind, wobei I Teilnehmer indiziert, j Programme indiziert und k Attribute indiziert, würde vorhergesagt werden, dass der Teilnehmer I einen Satz von P bestimmten Programmen auswählen würde, um die Summe von d(u_i, b_j) über den gewählten Programmen j zu minimieren. Die gewünschten Attribute u_ik eines Teilnehmers und Attribute d_jk eines Programms wären eine bestimmte Form von Worthäufigkeiten wie z. B. TF/IDF, wie beispielsweise aus Programmbeschreibungen oder des Zusammenfassungstextes des Programms und möglicherweise weitere Attribute wie z. B. die Quelle, und die Länge des Programms, während d(u_i, d_j) der Abstand zwischen diesen zwei Attributvektoren (Profilen) unter Verwendung des vorstehend beschriebenen Ähnlichkeitsmaßes ist. Wenn der Teilnehmer einen anderen Satz von P Programmen als vorhergesagt auswählt, sollte der Prozessor 406 versuchen, u und/oder d anzupassen, um die Programme welche der Teilnehmer ausgewählt hat, genauer vorherzusagen. Insbesondere sollten u_i und/oder d_j verschoben werden, um deren Ähnlichkeit zu vergrößern, wenn vorhergesagt wurde, dass der Teilnehmer nicht das Programm j wählt, aber es wählte, und möglicherweise deren Ähnlichkeit zu verkleinern, wenn vorhergesagt wurde, dass der Teilnehmer das Programm j wählt, es aber nicht wählte. Ein bevorzugtes Verfahren besteht darin u für jede falsche Vorhersage, dass der Teilnehmer kein Programm j auswählt, unter Verwendung der Formel u_ik' = u_ik – e(u_ik, d_jk) zu verschieben.
Hier wird u_i als die Zielprofilinteressenzusammenfassung aus dem Zielprofilinteressenzusammenfassungssatz des Teilnehmers I gewählt, welche dem Zielprofil am nächsten kommt. Wenn e positiv ist, vergrößert diese Anpassung die Übereinstimmung zwischen dem Zielprofilinteressenzusammenfassungssatz des Teilnehmers I und den Zielprofilen der Programme, welche der Teilnehmer I tatsächlich wählt, indem u_i näher an d_j für den Fall gebracht wird, in welchem der Algorithmus nicht das Programm vorhersagte, das der Betrachter auswählte. Die Größe e bestimmt, wie viele Beispielprogramme jemand sehen muß, um die Zielprofilinteressenzusammenfassung wesentlich zu ändern. Wenn e zu groß ist, wird der Algorithmus instabil, jedoch für ein ausreichend kleines e steuert er u auf seinen korrekten Wert. Im allgemeinen sollte e proportional zu dem Maß der Programmattraktivität sein; beispielsweise sollte es relativ hoch sein, wenn ein Teilnehmer I eine lange Zeit mit dem Lesen des Programms j verbringt. Man könnte theoretisch auch die vorstehende Formel zur Verringerung der Übereinstimmung in dem Falle verwenden, in welchem der Algorithmus ein Programm vorhersagte, das der Teilnehmer nicht gelesen hat, indem e in diesem Falle negativ gemacht wird. Jedoch liegt keine Garantie vor, dass sich u in diesem Falle in die korrekte Richtung bewegt. Man kann auch die Attributgewichtungen w_i des Teilnehmers I durch einen ähnlichen Algorithmus verschieben: W_ik' = (w_ik – e|u_ik – d_jk|)Σ_k(w_ik – e|u_ik – d_jk|)
Dieses ist besonders wichtig, wenn man Worthäufigkeiten mit anderen Attributen kombiniert. Wie vorstehend erhöht dieses die Übereinstimmung wenn e positiv ist – für den Fall, in welchem der Algorithmus nicht das Programm vorhersagte, das der Teilnehmer las, dieses Mal durch die Verringerung der Gewichtungen derjenigen Eigenschaften, für welche sich das Teilnehmerzielprofil u_i von dem Programmprofil d_j unterscheidet. Wiederum bestimmt die Größe von e wie viele Beispielprogramme jemand sehen muß, um das zu ersetzen, was ursprünglich angenommen wurde. Anders als die Prozedur für die Anpassung u macht man von der Tatsache Gebrauch, dass der vorgenante Algorithmus die Anpassung verringert, wenn e negativ ist – für den Fall, in welchem der Algorithmus ein Programm vorhersagte, das der Teilnehmer nicht las. Der Nenner des Ausdrucks verhindert, dass Gewichtungen mit der Zeit auf Null schrumpfen, indem die modifizierten Gewichtungen w_i' neu normiert werden, dass die Summe 1 ist. Sowohl u als auch w können für jedes genutzte Programm angepaßt werden. Wenn e klein ist, wie es sein sollte, besteht kein Konflikt zwischen den zwei Teilen des Algorithmus. Die ausgewählte Teilnehmerzielprofilinteressenzusammenfassungsgruppe wird bei dem Schlitz 708 aktualisiert.
Zusätzliche Anwendungen
Die vorstehend angegebene Anwendung des Datenverteilungssystems der vorliegenden Erfindung auf ein Kabelfernsehsystem soll nicht den Schutzumfang der Erfindung einschränken. Das hierin offenbarte Grundkonzept ist auf viele Anwendungen anwendbar, welche die Verwendung einer Teilnehmerendgerätvorrichtung implizieren, welche eine eingeschränkte Datenspeicherkapazität besitzt, und wenn eine eingeschränkte Bandbreite zur Übertragung von Daten zur Verfügung steht, obwohl die Teilnehmerendgerätvorrichtung einen Zugriff auf eine Fülle von Information hat. Eine Anzahl derartiger Anwendungen wird hierin angegeben, um einige signifikante Klassen dieser weiteren Anwendungen dieses Systems zu veranschaulichen.

1. Verbesserte interaktive Verkaufs- und Produktdemonstration – Das vorliegende Datenverteilungssystem ermöglicht die Verwendung von deskriptiver Information, das Prinzip der Bezugslokalität und der Interessen-basierenden Auswahl, um den von einer Teilnehmerendgerätvorrichtung verwendeten Speicher zu reduzieren. Da die Schlüsselmerkmale des Datenverteilungssystems die automatisierte Ermittlung der Benutzerin teressen und das Vorabholen umfassen, ist eine natürliche Anwendung des Datenverteilungssystems eine Verbesserung der derzeitigen Home-Shopping-Technologien, mit einer interaktiven Menü-basierenden Katalogdurchsicht. Die Interessen-basierenden Auswahlmerkmale erlauben es Händlern, benutzerspezifische Kataloge auf der Basis früherer Auswahlen zu erzeugen. Das offenbarte Datenverteilungssystem kann auf vielen Ebenen von der Auswahl spezifischer Präsentationen bis zur Auswahl von "Kanälen" eingesetzt werden, auf welchen geeignete Produktinformation verfügbar ist. Zusätzlich stellen viele Hersteller von Werkzeugen, Geräten und Küchenvorrichtungen Videodemonstration der verwendeten Vorrichtungen bereit, welche Benutzer ermuntern, die Vorrichtung effektiv zu nutzen, und welche Nicht-Besitzer ermuntern, Käufer zu werden. Das Datenverteilungssystem ermöglicht, dass die Beschreibungen der Vorrichtungen an ein großes Publikum möglicher Benutzer geliefert werden, welche ein Interesse an der Vorrichtung haben.
2. Hand-Reiseführerassistent – Das vorliegende Datenverteilungssystem kann dazu verwendet werden, (über das Web) für Reisende relevante Information herunterzuladen, wobei die Information von dem Nutzer identifiziert wird oder automatisch auf einer Ortsbasis mittels GPS (oder ein lokales HF-Signal) identifiziert werden kann. Dieses umfaßt nicht nur Straßen und Reisebedingungen, sondern auch auf die Lage von Tankstellen, Restaurants, Unterkünften, Sehenswürdigkeiten und deren zugeordneten Betriebszeiten. Einige lokale Geschäfte können auch Kataloginformation über ihre Produkte, Dienste und speziellen Werbeaktionen anpassen wollen, oder können einen umfassenden Web-basierenden Katalog mit eingeschränkten geographisch-spezifischen Auswahlmöglichkeiten anbieten wollen. Somit können die vorliegend beschriebenen Ähnlichkeitsmaße dazu genutzt werden, um selektiv die Produktauswahlen zu präsentieren, welche für den Benutzer am meisten für jeden gegebenen lokalen Katalog interessant sind. Dieses System kann Karteninformation in einer Mehrkanalumgebung bereitstellen. Es werde ein 5-Kanal-System betrachtet, welches einen Kanal für Karteninformation und 4 Kanäle für eine "gezoomte" Karteninformation bei einem Faktor von zweifacher Vergrößerung bereitstellt. Die Profilinformation könnte zur Detektion genutzt werden, wann spezielle Merkmale wahrscheinlich die Aufmerksamkeit des Betrachters auf sich ziehen, um Karteninformation auf der Basis dieser Eigenschaften (Gewässer, Gebäude, Flughäfen, usw.) vorab zu holen. Es ist leicht zu sehen, dass mit mehreren Kanälen diese Karteninformation in einer Vielzahl von Richtungen als auch Vergrößerungen bereitgestellt werden könnte. In diesem System wird der Speicher optimiert, indem selektiv Informationsdetails von für das Benutzerinteresse relevanten Orten heruntergeladen werden. Viele Reisewerbungen verwenden Videoclips oder Bilder, um die visuellen Merkmale von lokalem Interesse darzustellen. Die kundenspezifische Anpassung dieser Präsentationen auf der Basis des Nutzerinteresses kann eine raschere und einsichtigere Auswahl von Zielorten sicherstellen, was sowohl der Reiseindustrie als auch dem Kunden nutzt. Diese Verfahren kann entweder mit einem Kanalauswahl-, Indexierungs- oder speziellen Anpassungs-Dienst angewendet werden. Ferner sind Museen tendenziell in hohem Maße visuell, und besitzen trotzdem deskriptive Information oder Zusammenfassungen über die Ausstellungsstücke für Besucher, welche mehr Information über Themen und Ausstellungsstücke suchen. Das in dieser Anmeldung offenbarte Datenverteilungssystem kann spezifisch angepaßte Museumstouren ermöglichen, kann Menüs mit geeigneten Auswahlmöglichkeiten aus einer Mehrkanalumgebung entwickeln, oder kann mit Echtzeit-"Kanal-Surfing" von Kanälen auf der Basis des Benutzerinteresses Unterstützung bieten.
3. Das Datenverteilungssystem kann entscheiden, welche Auswahlen herunterzuladen sind, und bezüglich der heruntergeladenen Auswahlen auch die Detailauflösung entscheiden, welche auf der Basis des von dem System vorhergesagten Benutzerinteresses empfohlen wird. Somit kann das Datenverteilungssystem entweder herunterladen: a) das vollständige Video, b) eine Standgrafik, c) eine Textbeschreibung, d) eine Zusammenfassung der Textbeschreibung, e) den Auswahltitel aus einem Verzeichnis oder Menü, f) das Element in keinem Fall herunterladen.
4. Immobilien-Vorbesichtigungen – Immobilienkauf ist einer der größten Käufe welche von den meisten Verbrauchern in ihrem Leben gemacht werden, und trotzdem ist das Informationssystem extrem primitiv. Insbesondere werden einfache Schwarzweißfotos mit einfachen Textbeschreibungen verwendet, um Kunden zu einer Immobilienagentur oder einem privaten Verkäufer zu locken, welcher dann ein ausführliches Datenblatt und möglicherweise einen Besuch des Gebäudes ermöglicht, wenn Interesse besteht. Dieses ist zeitaufwendig, und wenn das Haus vom Eigentümer bewohnt ist, möglicherweise für potentielle Käufer, den Verkäufer und den Makler unangenehm. Das Datenverteilungssystem ermöglicht eine verbesserte Auswahl und Präsentation von Information für potentielle Käufer, einschließlich möglicher Videoclips und einer größeren Bibliothek von Fotografien. Abhängig von der Perspektive des Käufers, Maklers oder Verkäufers bietet das Datenverteilungssystem effektiver Häuser vorab an, verringert die Verkaufskosten und die benötigte Zeit für die Besichtigung von ungeeigneten Häusern, und erspart dem Käufer einen möglichen großen Aufwand an Unbequemlichkeit.
5. Smart Card-Werberabatte – Wie bei der derzeitigen Hand-Pager-(Personensuchsystem)-Technologie ist es möglich, einfache Nur-Empfangs-Geräte mit niedrigeren Kosten zu bauen, welche die hierin offenbarten Konzepte verkörpern. Insbesondere ist es eine einfache technische Aufgabe (siehe "A Distributed Location System for the Active Office" A. Harter and A. Hopper, IEEE Network, Jan./Feb. 1994, pp. 62.70) Identität anzeigende Bakensender mit niedriger Bandbreite zu bauen und diesen mit einem Empfänger zu koppeln, welcher in der Lage ist, mit höheren Raten von einer Rundfunkquelle, wie z. B. einem Satelliten, einer Rundfunksendeantenne oder einer Basisstation oder dergleichen zu empfangen. Wenn sie als ein Aspekt von zukünftigen "Smart Card"-Systemen betrachtet wird, würde die vorliegende Erfindung das Herunterladen einer Vielzahl für den Nutzer nützlicher Informationen in eine derartige "Smartcard"-Vorrichtung ermöglichen. Insbesondere könnten Coupon-artige elektronische Kredite in eine Smart Card geladen werden, um gezogen zu werden, wenn Käufe durchgeführt werden. Auf diese Weise könnten die Funktionen einer Direktversandwerbung in der elektronischen Verbreitungsmöglichkeit der vorliegenden Erfindung wiederholt werden. In der "Smart Card"-Vorrichtung aufbewahrte Kaufaufzeichnungen bilden einen Teil des Benutzerprofils für diese Anwendung, welche die Wahl entsprechender elektronischer Coupons zum Herunterladen aus der Rundsendevorrichtung vorschlagen. Die Speicherreduzierungstechnologie der vorliegenden Erfindung weist deutliche Kosten- und Leistungsvorteile für diese Umgebung auf.

Zusammenfassung
Das Datenverteilungssystem baut automatisch sowohl ein Zielprofil für jedes Zielobjekt (Programm) auf, das rundgesendet wird, sowie eine "Zielprofilinteressenzusammenfassung" für jeden Teilnehmer, wobei die Zielprofilinteressenzusammenfassung den Interessegrad des Teilnehmers an verschiedenen Arten von Zielobjekten beschreibt. Das System bewertet dann die Zielprofile gegenüber den Teilnehmerzielprofilinteressenzusammenfassungen, um eine an Teilnehmer-spezifisch angepaßte Rangfolgenliste von Zielobjekten zu erzeugen, welche höchst wahrscheinlich für jeden Teilnehmer von Interesse sind, so dass der Teilnehmer aus diesen möglicherweise relevanten Zielobjekten auswählen kann, welche automatisch durch dieses System aus der Vielzahl verfügbarer Zielobjekte auf dem Datenverteilungssystem ausgewählt wurden. Diese Architektur bietet mehrere Vorteile. Erstens können Technologieaktualisierungen in dem Kern des Datenverteilungsnetzwerkes ausgeführt werden, ohne einen Zugriff auf das Teilnehmerendgerät zu erfordern. Zweitens ergeben sich signifikante Einsparungen in der Datenspeicherung, welche sich aus der Multiplexierung dieser Verzeichnisinformation über Teilnehmerpopulationen ergibt. Drittens kann sogar eine extrem eingeschränkte Speichermenge in dem Endgerätadapter komplexe Informationsströme Teilnehmerinteressen mit vollständiger Allgemeinheit handhaben.

Claims

Verfahren zum Optimieren von Kommunikation, das umfasst: a) Bereitstellen wenigstens einer Datenquelle einer Vielzahl von Zielobjekt-Datenelementen; b) Bereitstellen einer Vielzahl von Datenendgeräten, die jeweils einem bestimmten einer Vielzahl von Nutzern zugeordnet sind; c) Verbinden der wenigstens einen Datenquelle und der Vielzahl von Datenendgeräten über ein Kommunikationsmedium, das einen Abwärtsverbindungs-Kanal enthält; d) automatisches Erzeugen von Nutzerinteressenprofil-Daten für jeden der Vielzahl von Nutzern, die anzeigen, welche bestimmten der Vielzahl von Zielobjekt-Datenelementen wahrscheinlich für jeden der Vielzahl von Nutzern von Interesse sind; e) unter Verwendung der Nutzerinteressenprofil-Daten Durchsuchen der Vielzahl von Zielobjekt-Datenelementen, um für jeden der Vielzahl von Nutzern wenigstens eines der Vielzahl von Zielobjekt-Datenelementen zu identifizieren, das am wahrscheinlichsten den Nutzerinteressenprofil-Daten entspricht; f) Liefern bestimmter der Vielzahl von Zielobjekt-Datenelementen, die auf Basis der Ergebnisse des Schrittes des Durchsuchens priorisiert werden, zu der Vielzahl von Datenendgeräten; g) wobei beim Schritt des Lieferns wenigstens ein Teil der Zielobjekt-Datenelemente unter Verwendung wenigstens der Nutzerinteressenprofil-Daten prädiktiv vorabgerufen wird und mit On-Demand-Daten gemischt wird; und h) wobei prädiktiv vorabgerufene Zielobjekt-Datenelemente über den Abwärtsverbindungs-Kanal unter Verwendung unterausgelasteter Zeitschlitze oder Bandbreite geliefert werden, um präemptiv zukünftigen Bedarf an Bandbreite zu verringern.
Verfahren nach Anspruch 1, wobei die Vielzahl von Zielobjekt-Datenelementen wenigstens eines der folgenden Elemente umfassen: 1. Multimedia-Informationen; 2. Datenelemente, die in eine Vielzahl von Informationssegmenten aufgeteilt sind; 3. Internet-Links; und 4. Video-Inhalt; 5. MPEG-komprimierte Video-Streams.
Verfahren nach Anspruch 1 oder 2, wobei die Datenendgeräte wenigstens eine der folgenden Einrichtungen umfassen: 1. Terminaladapter: 2. Netzwerk-Schnittstellenvorrichtungen; 3. Mobile Vorrichtungen; 4. PDA; 5. Netzwerk-Computer; 6. Personalcomputer; und 7. Set-Top-Boxen.
Verfahren nach Anspruch 1, 2 oder 3, wobei das Kommunikationsmedium wenigstens eines der folgenden Systeme umfasst: 1. ein Kabelfernsehsystem; 2. ein digitales Rundfunksystem; und 3. ein Video-On-Demand-System.
Verfahren nach Anspruch 1, 2, 3 oder 4, wobei die Nutzerinteressenprofil-Daten in den Daten-Endgeräten gehalten werden.
Verfahren nach einem der vorangehenden Ansprüche, das des Weiteren umfasst: i) Bereitstellen eines Prozessors in jedem der Daten-Endgeräte; und j) Nutzen des Prozessors, um während des Schrittes des Durchsuchens eine Vielzahl von Datenelementen als den Nutzerinteressenprofil-Daten entsprechend auszuwählen und Datenelemente virtuellen Kanälen zur Betrachtung durch die Nutzer zuzuordnen.
Verfahren nach Anspruch 6, wobei während des Schrittes des Durchsuchens der Prozessor Verzeichnisinformationen, die mit jedem der Vielzahl von Zieldatenelementen verbunden sind, mit Nutzerinteressenprofil-Daten vergleicht, um zu ermitteln, ob Entsprechung vorliegt.
Verfahren nach einem der Ansprüche 1 bis 5, das des Weiteren umfasst: i) Sammeln von Zieldaten-Nutzungsinformationen, so beispielsweise Sehgewohnheits-Daten, und Übertragen derselben über das Kommunikationsmedium zur Nutzung bei der Verbesserung der Nutzerinteressenprofil-Daten.
Verfahren nach einem der Ansprüche 1 bis 5, das des Weiteren umfasst: i) Bereitstellen eines Verzeichnisses beschreibender Informationen für die Vielzahl von Zielobjekt-Datenelementen an der wenigstens einen Datenquelle; und j) auf vorgewählte Weise Bereitstellen eines Teils des Verzeichnisses beschreibender Informationen, der am Besten dem Nutzerinteressenprofil jedes der Vielzahl von Nutzern entspricht, für jeden der Vielzahl von Nutzern.
Verfahren nach einem der Ansprüche 1 bis 5, das des Weiteren umfasst: i) Unterteilen jedes der Vielzahl von Zieldatenelementen in Informationssegmente; und j) während des Schrittes des Lieferns Übertragen der Vielzahl von Zieldatenelementen in Übertragungsvorgängen, die die Informationssegmente nutzen, um die effektive Bandbreite zu verringern, die für den Betrieb erforderlich ist.
Verfahren nach Anspruch 10, wobei die Informationssegmente der Vielzahl von Zieldatenelementen auf Basis bekannter Standortdaten in Bezug auf die Vielzahl von Nutzern vorabgerufen werden.
Verfahren nach einem der vorangehenden Ansprüche, das des Weiteren die folgenden Schritte umfasst: I) Bereitstellen eines Verzeichnisses von Informationen, die sich auf die Vielzahl von Zielobjektdatentypen beziehen; II) automatisches Erzeugen eines nutzerspezifischen Verzeichnisses der Vielzahl von Zielobjekten für jeden der Vielzahl von Nutzern unter Verwendung der Nutzerinte ressenprofil-Daten, das nur Segmente des Verzeichnisses von Informationen enthält, die für den speziellen Nutzer relevant sind; und III) auf vorgewählte Weise Bereitstellen eines Teils des Verzeichnisses beschreibender Informationen, der am Besten dem Nutzerinteressenprofil jedes der Vielzahl von Nutzern entspricht, für jeden der Vielzahl von Nutzern.
Verfahren nach Anspruch 12, das des Weiteren umfasst: i) Bereitsteilen aktualisierter Verzeichnisse von Informationen, die sich auf die Vielzahl von Zieldatenelementen beziehen; j) Anweisen bestimmter betroffener der Vielzahl von Datenendgeräten, nutzerspezifische Verzeichnisse zu löschen; k) beim Erfassen einer Anfrage nach Verzeichnisinformationen an einem bestimmten der Vielzahl von Datenendgeräten Übermitteln eines neuen aktualisierten nutzerspezifischen Verzeichnisses zu dem bestimmten der Vielzahl von Datenendgeräten.
Verfahren nach Anspruch 13, das des Weiteren umfasst: l) periodisches Senden von Tageszeit- und Datumsinformationen zu der Vielzahl von Datenendgeräten, um genaue Planung und Übertragung zu ermöglichen.
Verfahren nach einem der vorangehenden Ansprüche, das des Weiteren umfasst: i) Bereitstellen einer künstlichen Verzögerung beim Schritt des Lieferns, um Bandbreiteneinsparungen zu erzielen.
Verfahren nach einem der vorangehenden Ansprüche, das des Weiteren umfasst: l) Empfangen von Relevanz-Rückmeldung von bestimmten der Vielzahl von Nutzern, die anzeigt, ob bestimmte der Vielzahl von Zieldatenobjekten tatsächlich von Interesse sind oder nicht.
Verfahren nach einem der vorangehenden Ansprüche, das des Weiteren umfasst: i) Bereitstellen eines prädiktiven Modells für jeden der Vielzahl von Nutzern; j) wobei das Modell eine Anzahl von Attributen enthält, die jeweils ein Maß der Relevanz für jeden der Vielzahl von Nutzern darstellen; k) Empfangen von Relevanz-Rückmeldung von der Vielzahl von Nutzern; und l) Anpassen des Modells mit der Zeit, wenn Relevanz-Rückmeldung empfangen wird.
Verfahren nach Anspruch 17, das des Weiteren umfasst: m) dass die Relevanz-Rückmeldung wenigstens eines der folgenden Verfahren umfasst: 1. aktive Rückmeldung 2. passive Rückmeldung 3. Restrückmeldung (residue feedback), die einem Schätzwert der Relevanz beim Nichtvorhandensein aktiver Rückmeldung entspricht; 4. ein Fehlermaß, das einem Unterschied zwischen vorhergesagter Relevanz und tatsächlicher Nutzung entspricht.
Verfahren nach Anspruch 17 oder 18, das des Weiteren umfasst: m) dass die Attribute des Modells wenigstens eines der folgenden Elemente enthalten: 1. Begriffshäufigkeit, die ein Maß der Häufigkeit des Auftretens eines bestimmten Begriffs in einem Text ist; und 2. Beziehungs-Werte, die ein Maß eines bekannten Grades des Interesses an bestimmten Zielobjekt-Datenelementen sind; 3. einen numerischen Indikator der Relevanz, der für ein bestimmtes Attribut ermittelt wird; 4. einen numerischen Indikator der Relevanz, der für ein bestimmtes Attribut aus einer Gruppe von Attributen ermittelt wird.