DE102006000906A1 - Verfahren zum Klassifizieren einer Voice-Mail und Datenverarbeitungsvorrichtung - Google Patents

Verfahren zum Klassifizieren einer Voice-Mail und Datenverarbeitungsvorrichtung Download PDF

Info

Publication number
DE102006000906A1
DE102006000906A1 DE200610000906 DE102006000906A DE102006000906A1 DE 102006000906 A1 DE102006000906 A1 DE 102006000906A1 DE 200610000906 DE200610000906 DE 200610000906 DE 102006000906 A DE102006000906 A DE 102006000906A DE 102006000906 A1 DE102006000906 A1 DE 102006000906A1
Authority
DE
Germany
Prior art keywords
voice
mail
telephone call
unwanted
spam
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE200610000906
Other languages
English (en)
Inventor
Martina Hanck
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Solutions and Networks GmbH and Co KG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE200610000906 priority Critical patent/DE102006000906A1/de
Priority to PCT/EP2006/070091 priority patent/WO2007077152A1/de
Publication of DE102006000906A1 publication Critical patent/DE102006000906A1/de
Ceased legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/533Voice mail systems
    • H04M3/53333Message receiving aspects
    • H04M3/5335Message type or catagory, e.g. priority, indication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/436Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42136Administration or customisation of services
    • H04M3/42153Administration or customisation of services by subscriber

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zum Klassifizieren einer Voice-Mail. Zunächst wird ein einer Voice-Mail zugeordneter erster Sprachdatensatz mit einer Mehrzahl zweiter Sprachdatensätze verglichen. Korreliert der erste Sprachdatensatz mit einem der zweiten Sprachdatensätze, so wird die Voice-Mail als unerwünschte Voice-Mail klassifiziert. Die Erfindung betrifft auch eine Datenverarbeitungsvorrichtung (2), mit der das Verfahren durchgeführt werden kann.

Description

  • Die Erfindung betrifft ein Verfahren zum Klassifizieren einer Voice-Mail und eine Datenverarbeitungsvorrichtung.
  • Spam-Mails sind ein gängiges Problem beim heutigen E-Mail Verkehr. Eine Spam-Mail ist eine unerwünschte E-Mail, die insbesondere zu Werbezwecken in relativ großer Anzahl an beliebige Empfänger verschickt wird. Eine Spam-Mail ist unter anderem vom Empfänger unerwünscht, da sie Aufmerksamkeit bindet bzw. die Sichtbarkeit erwünschter Emails einschränkt und beim Herunterladen unnötige Kosten durch die Datenübertragung verursacht. Zur Abwehr von Spam-Mails gibt es so genannte Spam-Filter, die Spam-Mails anhand verschiedener Merkmale erkennen, aussortieren oder als solche markieren. Ein solches Merkmal ist beispielsweise eine Prüfsumme (Hashwert) der E-Mail. In einer Filterdatenbank können die Merkmale, wie die Prüfsumme, als Kennzeichen der als Spam-Mail klassifizierten E-Mails hinterlegt sein. Somit ist es möglich, eingehende E-Mails vor der Zustellung an den Empfänger zu überprüfen, indem die E-Mail nach charakteristischen Merkmalen untersucht wird und diese Merkmale mit den in der Filterdatenbank abgelegten Merkmalen verglichen werden. Ergibt der Vergleich, dass die E-Mail eine Spam-Mail ist, so unterbleibt z.B. deren Weiterleitung an den Empfänger.
  • Durch die zunehmende Verbreitung der Internet-Telefonie (Voice over IP) ist es zu erwarten, dass es in Zukunft verstärkt unerwünschte Telefonanrufe, wie z.B. Werbe-Anrufe geben wird. Globale Online-Telefonbücher können nämlich systematisch und automatisiert ausgewertet werden und automatisierte Anrufe über das Internet-Protokoll sind ähnlich preisgünstig wie E-Mails. Unerwünschte Telefonanrufe, wie die Werbe-Anrufe werden als SPIT-Anrufe (SPIT = Spam over IP-Telephony) bezeichnet.
  • Eingehende Telefonanrufe können vor deren Durchschaltung an den Empfänger nicht einfach klassifiziert werden wie E-Mails, da sie in Echtzeit übermittelt werden. Somit ist ein unerwünschter Anruf bereits erfolgt, durchgeschaltet oder angenommen, bevor er überhaupt aufgrund dessen Inhalt klassifiziert werden kann. Wird ein Telefonanruf nicht entgegen genommen, so ist es möglich, diesen in Form einer Voice-Mail auf einer Voice-Mailbox zu speichern, um den Telefonanruf später abzuhören. Eine Voice-Mail ist eine Rechner gestützte Nachrichten-Übermittlung in Form von gespeicherter Sprachinformation, die sich des Prinzips der Mailbox bedient. Ein Anrufer kann seine gesprochene Nachricht als Audio-Datei (Sprachdatensatz) in der Voice-Mailbox hinterlegen, die der Empfänger später aus seinem Fach abrufen kann. Eine Voice-Mailbox ist ein reservierter Speicherbereich in einem Netzwerk, der dem Teilnehmer als elektronischer Briefkasten dient.
  • SPIT-Anrufe sind jedoch nicht nur lästig, sondern können auch unnötigerweise eine Voice-Mailbox mit gespeicherten Anrufen belasten. Existierende Filtermechanismen für die Klassifizierung von unerwünschten Werbeanrufen bestehen zum Beispiel aus so genannten weißen oder schwarzen Listen, die erlaubte oder unerwünschte Rufnummern umfassen. Stammt ein Telefonanruf von einer verbotenen Rufnummer, so wird dieser nicht an die Voice-Mailbox weitergeleitet.
  • Die Aufgabe der Erfindung ist es daher, ein Verfahren zur flexibleren Klassifizierung einer Voice-Mail anzugeben.
  • Eine weitere Aufgabe der Erfindung ist es, eine Datenverarbeitungseinrichtung derart auszuführen, dass mit dieser eine Voice-Mail flexibler klassifiziert werden kann.
  • Die Aufgabe der Erfindung wird gelöst durch ein Verfahren zum Klassifizieren einer Voice-Mail, aufweisend folgende Verfahrensschritte: Vergleichen eines einer Voice-Mail zugeordneten ersten Sprachdatensatzes mit einer Mehrzahl zweiter Sprachdatensätze und Klassifizieren der Voice-Mail als unerwünschte Voice-Mail, wenn der erste Sprachdatensatz mit einem der zweiten Sprachdatensätze korreliert.
  • Unerwünschte Voice-Mails sind insbesondere die obenstehend beschriebenen SPIT-Anrufe. Mit dem erfindungsgemäßen Verfahren wird also eine Voice-Mail, also ein nicht entgegengenommener Telefonanruf, der z. B. in einer Voice-Mailbox bereits gespeichert ist oder in einer Voice-Mailbox gespeichert werden soll, klassifiziert, indem der der Voice-Mail zugeordnete erste Sprachdatensatz mit den zweiten Sprachdatensätzen verglichen wird. Die zweiten Sprachdatensätze sind Telefonanrufe, die bereits als unerwünscht klassifiziert sind, zugeordnet. Ergibt der Vergleich, dass der erste Sprachdatensatz mit wenigstens einem der zweiten Sprachdatensätze korreliert, so wird die dem ersten Sprachdatensatz zugeordnete Voice-Mail als unerwünschte Voice-Mail klassifiziert. Ist die Voice-Mail in der Voice-Mailbox bereits gespeichert, so kann diese z.B. automatisch gelöscht werden. Es kann aber auch vorgesehen sein, dass die Voice-Mail zunächst zwischengespeichert wird und nur dann an die Voice-Mailbox weiter geleitet wird, wenn die Voice-Mail nicht als eine unerwünschte Voice-Mail klassifiziert wurde.
  • Es ist vorstellbar, dass aufgezeichnete Durchsagen, z.B. SPIT-Voice-Mails, aus der Widergabe von bekannten Spam-Mails hergestellt werden. Gemäß einer Ausführungsform des erfin dungsgemäßen Verfahrens ist es daher vorgesehen, dass die zweiten Sprachdatensätze jeweils einer Spam-Mail einer Mehrzahl von Spam Mails zugeordnet sind. Es gibt bereits Datenbanken, in denen bereits erkannte Spam-Mails gespeichert sind. Somit ist es möglich, die Mehrzahl zweiter Sprachdatensätze, wie es nach einer Ausführungsform des erfindungsgemäßen Verfahrens vorgesehen ist, aus ihren zugeordneten Spam-Mails zu erzeugen, indem beispielsweise zweite Sprachdatensätze aus Spam-Mails in automatisierter Form mittels einer automatisierten Sprach-Wiedergabe und/oder durch Vorlesen der Spam-Mails und Aufnehmen der vorgelesenen Spam-Mails gewonnen werden.
  • Gemäß einer besonders bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens wird der Vergleich des ersten Sprachdatensatzes mit der Mehrzahl zweiter Sprachdatensätze gemäß folgender Verfahrensschritte vollzogen: Ermitteln wenigstens eines ersten Kennwertes durch eine Analyse des ersten Sprachdatensatzes und Vergleichen des ersten Kennwertes mit einer Mehrzahl zweiter Kennwerte, die aufgrund einer Analyse der Mehrzahl zweiter Sprachdatensätze derart erhalten wurden, sodass jeder der zweiten Sprachdatensätze wenigstens einem Kennwert der Mehrzahl zweiter Kennwerte zugeordnet ist. Um den ersten Sprachdatensatz mit den zweiten Sprachdatensätzen zu vergleichen, werden also entsprechende Kennwerte miteinander verglichen. Die einzelnen Kennwerte, also der dem ersten Sprachdatensatz zugeordnete erste Kennwert und die den zweiten Sprachdatensätzen zugeordneten zweiten Kennwerte, erhält man durch eine Analyse der entsprechenden Sprachdatensätze. Für eine automatisierte Analyse sind bekannte Sprachmustererkennungsalgorithmen oder andere Spracherkennungsmethoden geeignet. Die zweiten Kennwerte werden z.B. in einer Datenbank vorgehalten. Somit ist es nicht notwendig, die zweiten Sprachdatensätze, sondern es ist lediglich nötig, deren zugeordnete zweiten Kennwerte zu spei chern. Dies kann zu einem reduzierten Speicherbedarf führen. Aufgrund des Vergleichs des ersten Kennwertes mit den zweiten Kennwerten wird die Voice-Mail klassifiziert. Bei den einzelnen Kennwerten kann es sich jeweils um einen Kennwert oder um mehrere Kennwerte handeln, die z.B. zu Merkmalsvektoren zusammengefasst und gespeichert sind. Das Ergebnis des Vergleichs des ersten Kennwertes mit den zweiten Kennwerten kann auf Basis von Wahrscheinlichkeiten ermittelt werden, sodass eine Voice-Mail als unerwünscht klassifiziert wird, wenn der erste Kennwert mit einer bestimmten Mindestwahrscheinlichkeit wenigstens einem der zweiten Sprachdatensätze entspricht. In bekannten Spracherkennungssystemen werden für einen solchen Vergleich bzw. dessen Auswertung so genannte Hidden-Markov-Modelle verwendet. Die Voice-Mail wird also dann als unerwünschte Voice-Mail klassifiziert, wenn der erste Kennwert mit einem der zweiten Kennwerte korreliert.
  • Nach Varianten des erfindungsgemäßen Verfahrens wird die Mehrzahl zweiter Sprachdatensätze gemäß folgender Verfahrensschritte erweitert: Aufzeichnen eines Telefonaufrufs und Hinzufügen eines dem aufgezeichneten Telefonanruf zugeordneten Sprachdatensatz zur Mehrzahl zweiter Sprachdatensätze, wenn diejenige Person, die den Telefonanruf angehört hat, den Telefonanruf als unerwünschten Telefonanruf klassifiziert hat. Alternativ wird ein dem unerwünschten Telefonanruf zugeordneter Kennwert zur Mehrzahl zweiter Kennwerte hinzugefügt. Erhält nun jemand einen Telefonanruf, so wird dieser automatisch aufgezeichnet. Am Ende des Telefonanrufs kann der Angerufene den gehörten Telefonanruf als unerwünschten Telefonanruf klassifizieren. Dies ist beispielsweise durch eine automatisierte Abfrage möglich. Klassifiziert der Angerufene den Telefonanruf als unerwünschten Telefonanruf, so wird der aufgezeichnete Telefonanruf der Mehrzahl zweiter Sprachdatensätze hinzugefügt bzw. wird der aufgezeichnete Telefonanruf analysiert, um einen dem Tele fonanruf zugeordneten Kennwert zu erhalten, der der Mehrzahl zweiter Kennwerte hinzugefügt wird. Somit ist es möglich, die Anzahl bekannter unerwünschter Voice-Mails zu erweitern.
  • Die Mehrzahl zweiter Sprachdatensätze beziehungsweise die Mehrzahl zweiter Kennwerte können einer Mehrzahl von Spam-Mails zugeordnet sein. Um die Liste der Spam-Mails zu erweitern, können gemäß einer Ausführungsform des erfindungsgemäßen Verfahrens folgende Verfahrensschritte durchgeführt werden: Erzeugen einer dem unerwünschten Telefonanruf zugeordneten E-Mail und Hinzufügen der dem unerwünschten Telefonanruf zugeordneten E-Mail zur Mehrzahl von Spam-Mails.
  • Der Mehrzahl von Spam-Mails kann wiederum eine Mehrzahl von dritten Kennwerten zugeordnet sein, die die einzelnen Spam-Mails als Spam-Mails klassifizieren. Ein solcher dritter Kennwert ist beispielsweise eine Prüfsumme (Hashwert). Nach einer Ausführungsform des erfindungsgemäßen Verfahrens ist es vorgesehen, einen Kennwert für die dem unerwünschten Telefonanruf zugeordneten E-Mail zu der Mehrzahl von dritten Kennwerten hinzuzufügen.
  • Ein Vorteil des erfindungsgemäßen Verfahrens liegt in der Reduzierung der unerwünschten Voice-Nachrichten insbesondere auf einer Voice-Mailbox. Dadurch wird einem Überlauf der Voice-Mailbox vorgebeugt. Läuft nämlich die Voice-Mailbox über, so können auch erwünschte Voice-Mails nicht mehr gespeichert werden.
  • Die Aufgabe der Erfindung wird auch gelöst durch eine Datenverarbeitungsvorrichtung, aufweisend eine Sprachanalyseeinrichtung, die aufgrund einer zur Sprachanalyse eines einer Voice-Mail zugeordneten ersten Sprachdatensatzes einen ersten Kennwert ermittelt, eine erste Datenbank, in der eine Mehrzahl von zweiten Kennwerten gespeichert ist, eine Ver gleichsvorrichtung zum Vergleichen des ersten Kennwertes mit den zweiten Kennwerten und eine Entscheiderlogik zum Klassifizieren der Voice-Mail als unerwünschte Voice-Mail, wenn der erste Kennwert mit einem der zweiten Kennwerte korreliert. Die erfindungsgemäße Datenverarbeitungsvorrichtung ist demnach derart ausgeführt, dass mit dieser das erfindungsgemäße Verfahren durchgeführt werden kann.
  • Gemäß einer Ausführungsform der erfindungsgemäßen Datenverarbeitungsvorrichtung weist diese eine Voice-Mailbox auf, in der die Voice-Mail gespeichert ist, und die Datenverarbeitungsvorrichtung automatisch die Voice-Mail löscht, wenn die Entscheiderlogik diese als unerwünschte Voice-Mail klassifiziert. Somit wird einem Überlaufen der Voice-Mailbox aufgrund unerwünschter Voice-Mails vorgebeugt.
  • Die zweiten Kennwerte sind insbesondere jeweils einer Spam-Mail einer Mehrzahl von Spam-Mails zugeordnet.
  • Um die Mehrzahl zweiter Kennwerte zu erweitern, umfasst die erfindungsgemäße Datenverarbeitungsvorrichtung nach einer Variante eine Vorrichtung zum Aufzeichnen eines Telefonanrufs, wobei die Datenverarbeitungsvorrichtung derart ausgeführt ist, dass die Sprachanalyseeinrichtung bei einer Klassifizierung des Telefonanrufs als unerwünschter Telefonanruf den Telefonanruf analysiert, einen dem Telefonanruf zugeordneten Kennwert ermittelt und diesen Kennwert der Mehrzahl zweiter Kennwerte hinzufügt.
  • Der Mehrzahl von Spam-Mails kann wiederum einer Mehrzahl von dritten Kennwerten zugeordnet sein, die die einzelnen Spam-Mails als Spam-Mails klassifizieren. Ein solcher dritter Kennwert ist beispielsweise eine Prüfsumme (Hashwert). Nach einer Ausführungsform der erfindungsgemäßen Datenverarbeitungsvorrichtung umfasst diese eine Vorrichtung zum Herstel len einer E-Mail aus dem aufgezeichneten unerwünschten Telefonanruf, eine Vorrichtung zum Analysieren der E-Mail, die aufgrund der Analyse der E-Mail einen der E-Mail zugeordneten Kennwert herstellt, und eine zweite Datenbank, in der eine den Spam-Mails zugeordnete Mehrzahl dritter Kennwerte gespeichert ist. Die erfindungsgemäße Datenverarbeitungsvorrichtung ist dann derart eingerichtet, dass sie den der E-Mail zugeordneten Kennwert der Mehrzahl dritter Kennwerte hinzufügt.
  • Ein Ausführungsbeispiel der Erfindung ist in den beigelegten schematischen Zeichnungen exemplarisch dargestellt. Es zeigen:
  • 1 Ein das erfindungsgemäße Verfahren veranschaulichendes Szenario und
  • 2 bis 5 jeweils eine Datenbank.
  • Die 1 zeigt einen an ein öffentliches Datennetz 1 angeschlossenen Server 2, einen an das Datennetz 1 angeschlossenen Rechner 3 und ein an das Datennetz 1 angeschlossenes Telefon 4, mit dem eine Person 5 Anrufe tätigen und entgegen nehmen kann. Im Falle des vorliegenden Ausführungsbeispieles handelt es sich bei dem Telefon 4 um ein IP-Telefon, das über ein Voice-over-IP Protokoll mit weiteren, in der 1 nicht gezeigten Telefonen kommunizieren kann. Des Weiteren können auch an das Datennetz 1 angeschlossene Rechner, wie der Rechner 3, Sprachnachrichten an das Telefon 4 übermitteln, die die Person 5 mit dem Telefon 4 anhören kann.
  • Der Server 2 wird im Falle des vorliegenden Ausführungsbeispiels von einem Dienstleister betrieben, der auch für das Telefon 4 verantwortlich ist. Der Dienstleister bietet den Service einer Voice-Mailbox an, den die Person 5 in Anspruch nimmt. Zu diesem Zweck umfasst der Server 2 eine der Person 5 bzw. dem Telefon 4 zugeordnete Voice-Mailbox 6. Wird ein an das Telefon 4 gerichteter Anruf nicht entgegen genommen, so wird dieser in Form einer Voice-Mail in der Voice-Mailbox 6 gespeichert. Allgemein ist eine Voice-Mail eine Rechner gestützte Nachrichten-Übermittlung in Form von gespeicherter Sprachinformation, die sich des Prinzips der Mailbox bedient. Ein Anrufer kann seine gesprochene Nachricht als Audio-Datei (Sprachdatensatz) in der Voice-Mailbox hinterlegen, die der Empfänger, z.B. die Person 5, später aus seinem Fach abrufen kann. Eine Voice-Mailbox ist ein reservierter Speicherbereich in einem Netzwerk, der dem Teilnehmer als elektronischer Briefkasten dient.
  • Im Falle des vorliegenden Ausführungsbeispiels ist der Rechner 3 dafür vorgesehen, einen automatisierten Telefonanruf an eine Vielzahl von Telefonen und insbesondere an das Telefon 4 zu verschicken. Die Person 5 nimmt den Telefonanruf nicht entgegen, weshalb dieser in Form einer Voice-Mail in der Voice-Mailbox 6 abgelegt wird. Der automatisierte Telefonanruf ist unerwünscht und verbraucht daher unnütz Speicherplatz der Voice-Mailbox 6.
  • Damit die Voice-Mailbox 6 nicht aufgrund unerwünschter Telefonanrufe, wie z.B. so genannter Spit-Anrufe (Spam over IP-Telefonie) überläuft, läuft auf dem Server 2 ein Rechnerprogramm, das unerwünschte Voice-Mails, also unerwünschte und in der Voice-Mailbox 6 gespeicherte Voice-Mails erkennt und daraufhin automatisch löscht. Zu diesem Zweck ist in dem Server 2 eine in der 2 näher dargestellte erste Datenbank 21 gespeichert. Die erste Datenbank 21 umfasst eine Mehrzahlen von Merkmalsvektoren 1 bis N, die jeweils einem unerwünschten Telefonanruf zugeordnet sind. Jeder der Merkmalsvektoren 1 bis N umfasst wiederum wenigstens einen dem entsprechenden unerwünschten Telefonanruf zugeordneten Kenn wert. Anhand der Kennwerte ist es möglich zu entscheiden, ob eine eingehende Voice-Mail einer der unerwünschten Telefonanrufe zugeordnet werden kann, d.h. ob eine eingehende Voice-Mail ein der unerwünschten Telefonanrufe 1 bis N entspricht. Die Kennwerte der Merkmalsvektoren 1 bis N wurden im Falle des vorliegenden Ausführungsbeispiels dadurch ermittelt, dass der entsprechende unerwünschte Telefonanruf bzw. ein diesem Telefonanruf zugeordneter Sprachdatensatz mittels eines auf dem Server 2 laufenden Spracherkennungsalgorithmus analysiert wurde. Spracherkennungsalgorithmen sind dem Fachmann allgemein bekannt und arbeiten z.B. auf der Basis von Hidden-Markov-Modellen.
  • Im Falle des vorliegenden Ausführungsbeispiels startet der Server 2 automatisch seinen Spracherkennungsalgorithmus, wenn eine neue Voice-Mail in der Voice-Mailbox 6 eintrifft. Folglich wird auch die Voice-Mail, die dem vom Rechner 3 gesendeten Telefonanruf entspricht, analysiert, indem der Spracherkennungsalgorithmus den dieser Voice-Mail zugeordneten Sprachdatensatz analysiert. Das Ergebnis dieser Analyse ist ein Merkmalsvektor mit wenigstens einem Kennwert. Anschließend startet der Server 2 automatisch ein weiteres Rechnerprogramm, das den bzw. die Kennwerte des Merkmalsvektors dieser Voice-Mail mit den Merkmalsvektoren 1 bis N der Datenbank 21 vergleicht. Aufgrund dieses Vergleichs bestimmt das weitere Rechnerprogramm im Falle des vorliegenden Ausführungsbeispiels Wahrscheinlichkeitswerte, die ein Maß für eine Übereinstimmung der Voice-Mail mit den unerwünschten Telefonanrufen der Datenbank 21 angeben. Übersteigt einer dieser Wahrscheinlichkeiten eine in dem Server 2 hinterlegte vorgegeben Mindestwahrscheinlichkeit, dann wird die analysierte Voice-Mail bzw. dessen Sprachdatensatz automatisch aus der Voice-Mailbox 6 gelöscht.
  • Im Falle des vorliegenden Ausführungsbeispieles sind die unerwünschten Telefonanrufe, deren Merkmalsvektoren 1 bis N in der Datenbank 21 gespeichert sind, bekannten Spam-Mails zugeordnet. Eine Spam-Mail ist eine unerwünschte E-Mail, die insbesondere zu Werbezwecken in relativ großer Anzahl an beliebige Empfänger verschickt wird. Die Spam-Mails können anhand von ihnen zugeordneten Kennwerten, wie z.B. einer Prüfsumme (Hash-Wert) identifiziert werden. Zu diesem Zweck umfasst der Server 2 im Falle des vorliegenden Ausführungsbeispiels eine in de 3 näher dargestellte Datenbank 31, in der Spam-Mails 1 bis N zugeordnete Merkmalsvektoren 1' bis N' gespeichert sind.
  • Im Falle des vorliegenden Ausführungsbeispiels wurden zunächst aus den Spam-Mails 1' bis N' jeweils ein Sprachdatensatz mittels einer automatisierten Sprachwidergabe oder durch Vorlesen und Aufnehmen einer Spam-Mail hergestellt. Somit wurden N Sprachdatensätze generiert, die jeweils einem der N unerwünschten Telefonanrufen der Datenbank 21 entsprechen. Diese N Sprachdatensätze analysierte der Server 2 mit seinem Spracherkennungsalgorithmus, um die Merkmalsvektoren 1 bis N zu erhalten.
  • Im Falle des vorliegenden Ausführungsbeispiels ist der Server 2 ferner derart konfiguriert, dass die Person 5 mit ihrem Telefon 4 einen entgegengenommen Telefonanruf als unerwünschten Telefonanruf klassifizieren kann. Dazu umfasst der Server 2 ein Tonaufzeichnungsgerät 7, das einen an das Telefon 4 gerichteten und entgegengenommenen Telefonanruf aufzeichnet. Ferner läuft auf dem Server 2 ein weiteres Rechnerprogramm, das am Ende des für das Telefon 4 bestimmten und auch entgegengenommenen Telefonanrufs automatisiert diejenige Person, die den Telefonanruf entgegennahm, also z.B. die Person 5, fragt, ob der Telefonanruf unerwünscht war. Dazu umfasst der Server 2 eine entsprechende Sprachgenerie rungssoftware. Antwortet die Person 5 auf diese Frage mit "ja", so klassifiziert der Server 2 diesen Telefonanruf als unerwünschten Telefonanruf.
  • Wird ein Telefonanruf als unerwünscht klassifizierte, so startet der Server 2 seinen Spracherkennungsalgorithmus und analysiert den dem im Tonaufzeichnungsgerät 7 gespeicherten kürzlich als unerwünscht klassifizierten Telefonanruf zugeordneten Sprachdatensatz. Das Ergebnis dieser Analyse ist ein Merkmalsvektor N + 1, der der Datenbank 21 zugefügt wird. Die um den Merkmalsvektor N + 1 erweiterte Datenbank 21 ist in der 4 gezeigt.
  • Des Weiteren ist im Falle des vorliegenden Ausführungsbeispiels der Server 2 derart konfiguriert, dass er aus einem von der Person 5 klassifizierten und im Tonaufzeichnungsgerät 7 gespeicherten unerwünschten Telefonanruf eine Textdatei mit dem Inhalt des unerwünschten Telefonanrufs erstellt. Der Server 2 stellt aus dieser Textdatei eine E-Mail her, die ebenfalls eine Spam-Mail ist. Diese Spam-Mail kann wiederum anhand eines ihr zugeordneten Kennwertes, wie z.B. einer Prüfsumme (Hash-Wert), identifiziert werden. Somit ist es möglich, die Datenbank 31 um eine N + 1-te Spam-Mail zu erweitern, wie dies in der 5 dargestellt ist.
  • Im Falle des vorliegenden Ausführungsbeispieles wurde das erfindungsgemäße Verfahren anhand des Servers 2 erläutert, der als zentraler Server die Voice-Mailbox 6 umfasst und Telefonanrufe an Endgeräte, wie beispielsweise an das Telefon 4 leitet. Es ist jedoch insbesondere auch möglich, dass die Voice-Mailbox 6 im Telefon 4 integriert ist. Dann könnte beispielsweise der Spracherkennungsalgorithmus auf dem Telefon 4 laufen und die Datenbank 21 auf dem Telefon 4 hinterlegt sein. Des Weiteren ist es auch möglich, eine Voice-Mail zunächst zwischenzuspeichern und nur dann auf die Voice- Mailbox 6 zu leiten, wenn diese nicht als unerwünschter Telefonanruf klassifiziert wurde.

Claims (17)

  1. Verfahren zum Klassifizieren einer Voice-Mail, aufweisend folgende Verfahrensschritte: – Vergleichen eines einer Voice-Mail zugeordneten ersten Sprachdatensatzes mit einer Mehrzahl zweiter Sprachdatensätze und – Klassifizieren der Voice-Mail als unerwünschte Voice-Mail, wenn der erste Sprachdatensatz mit einem der zweiten Sprachdatensätze korreliert.
  2. Verfahren nach Anspruch 1, bei dem die zweiten Sprachdatensätze jeweils einer Spam-Mail einer Mehrzahl von Spam-Mails zugeordnet sind.
  3. Verfahren nach Anspruch 2, bei dem die zweiten Sprachdatensätze aus den ihren zugeordneten Spam-Mails erzeugt werden.
  4. Verfahren nach Anspruch 3, bei dem die zweiten Sprachdatensätze mittels einer automatisierten Sprachwiedergabe und/oder durch Vorlesen und Aufnehmen der entsprechenden Spam-Mail erzeugt werden.
  5. Verfahren nach einem der Ansprüche 1 bis 4, bei dem der Vergleich des ersten Sprachdatensatzes mit der Mehrzahl zweiter Sprachdatensätze folgende Verfahrensschritte aufweist: – Ermitteln wenigstens eines ersten Kennwertes durch eine Analyse des ersten Sprachdatensatzes und – Vergleichen des ersten Kennwertes mit einer Mehrzahl zweiter Kennwerte, die aufgrund einer Analyse der Mehrzahl zweiter Sprachdatensätze derart erhalten wurde, sodass jedem der zweiten Sprachdatensätze wenigstens ein Kennwert der Mehrzahl zweiter Kennwerte zugeordnet ist.
  6. Verfahren nach Anspruch 5, bei dem die Voice-Mail als unerwünschte Voice-Mail klassifiziert wird, wenn der Vergleich des ersten Kennwertes mit der Mehrzahl zweiter Kennwerte ergibt, dass der erste Kennwert mit einem der zweiten Kennwerte korreliert.
  7. Verfahren nach Anspruch 5 oder 6, bei dem der erste Kennwert erhalten wird, indem der erste Sprachdatensatz mittels Sprachanalyse automatisch analysiert wird und/oder die zweiten Kennwerte erhalten werden, indem die zweiten Sprachdatensätze mittels Sprachanalyse automatisch analysiert werden.
  8. Verfahren nach einem der Ansprüche 1 bis 7, bei dem die Voice-Mail in einer Voice-Mailbox (6) gespeichert ist und automatisch gelöscht wird, wenn die Voice-Mail als unerwünschte Voice-Mail klassifiziert wurde.
  9. Verfahren nach einem der Ansprüche 1 bis 8, aufweisend folgende Verfahrensschritte: – Aufzeichnen eines Telefonaufrufs und – Hinzufügen eines dem aufgezeichneten Telefonanruf zugeordneten Sprachdatensatz zur Mehrzahl zweiter Sprachdatensätze, wenn diejenige Person (5), die den Telefonanruf angehört hat, den Telefonanruf als unerwünschten Telefonanruf klassifiziert hat.
  10. Verfahren nach einem der Ansprüche 5 bis 8, aufweisend folgende Verfahrensschritte: – Aufzeichnen eines Telefonaufrufs, – Ermitteln eines dem Telefonanruf zugeordneten Kennwertes, wenn diejenige Person (5), die den Telefonanruf angehört hat, den Telefonanruf als unerwünschten Telefonanruf klassifiziert hat, und – Hinzufügen des dem unerwünschten Telefonanruf zugeordneten Kennwertes zur Mehrzahl zweiter Kennwerte.
  11. Verfahren nach Anspruch 9 oder 10, aufweisend folgende Verfahrensschritte: – Erzeugen einer dem unerwünschten Telefonanruf zugeordneten E-Mail und – Hinzufügen der dem unerwünschten Telefonanruf zugeordneten E-Mail zur Mehrzahl von Spam-Mails.
  12. Verfahren nach Anspruch 10, bei dem der Mehrzahl von Spam-Mails eine Mehrzahl von dritten Kennwerten zugeordnet ist, die die einzelnen Spam-Mails als Spam-Mail kategorisieren, und Hinzufügen eines Kennwertes für die dem unerwünschten Telefonanruf zugeordneten E-Mail zu der Mehrzahl von dritten Kennwerten.
  13. Datenverarbeitungsvorrichtung, aufweisend: eine Sprachanalyseeinrichtung, die aufgrund einer zur Sprachanalyse eines einer Voice-Mail zugeordneten ersten Sprachdatensatzes einen ersten Kennwert ermittelt, – eine erste Datenbank (21), in der eine Mehrzahl von zweiten Kennwerten gespeichert ist, – eine Vergleichsvorrichtung zum Vergleichen des ersten Kennwertes mit den zweiten Kennwerten und – eine Entscheiderlogik zum Klassifizieren der Voice-Mail als unerwünschte Voice-Mail, wenn der erste Kennwert mit einem der zweiten Kennwerte korreliert.
  14. Datenverarbeitungsvorrichtung nach Anspruch 13, aufweisend eine Voice-Mailbox (6), in der die Voice-Mail gespeichert ist, und die Datenverarbeitungsvorrichtung (2) automatisch die Voice-Mail löscht, wenn die Entscheiderlogik diese als unerwünschte Voice-Mail klassifiziert.
  15. Datenverarbeitungsvorrichtung nach Anspruch 13 oder 14, bei der die zweiten Kennwerte jeweils einer Spam-Mail einer Mehrzahl von Spam-Mail zugeordnet sind.
  16. Datenverarbeitungsvorrichtung nach einem der Ansprüche 13 bis 15, aufweisend eine Vorrichtung zum Aufzeichnen (7) eines Telefonanrufs, wobei die Datenverarbeitungsvorrichtung (2) derart ausgeführt ist, dass die Sprachanalyseeinrichtung bei einer Klassifizierung des Telefonanrufs als unerwünschter Telefonanruf den Telefonanruf analysiert, einen dem Telefonanruf zugeordneten Kennwert ermittelt und diesen Kennwert der Mehrzahl zweiter Kennwerte hinzufügt.
  17. Datenverarbeitungsvorrichtung nach Anspruch 16, aufweisend eine Vorrichtung zum Herstellen einer E-Mail aus dem aufgezeichneten unerwünschten Telefonanruf, eine Vorrichtung zum Analysieren der E-Mail, die aufgrund der Analyse der E-Mail einen der E-Mail zugeordneten Kennwert herstellt, und eine zweite Datenbank (31), in der eine den Spam-Mails zugeordnete Mehrzahl dritter Kennwerte gespeichert sind, und die Datenverarbeitungsvorrichtung (2) derart eingerichtet ist, dass sie den der E-Mail zugeordneten Kennwert der Mehrzahl dritter Kennwerte hinzufügt.
DE200610000906 2006-01-05 2006-01-05 Verfahren zum Klassifizieren einer Voice-Mail und Datenverarbeitungsvorrichtung Ceased DE102006000906A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE200610000906 DE102006000906A1 (de) 2006-01-05 2006-01-05 Verfahren zum Klassifizieren einer Voice-Mail und Datenverarbeitungsvorrichtung
PCT/EP2006/070091 WO2007077152A1 (de) 2006-01-05 2006-12-21 Verfahren zum klassifizieren einer voice-mail und datenverarbeitungsvorrichtung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE200610000906 DE102006000906A1 (de) 2006-01-05 2006-01-05 Verfahren zum Klassifizieren einer Voice-Mail und Datenverarbeitungsvorrichtung

Publications (1)

Publication Number Publication Date
DE102006000906A1 true DE102006000906A1 (de) 2007-07-12

Family

ID=37901043

Family Applications (1)

Application Number Title Priority Date Filing Date
DE200610000906 Ceased DE102006000906A1 (de) 2006-01-05 2006-01-05 Verfahren zum Klassifizieren einer Voice-Mail und Datenverarbeitungsvorrichtung

Country Status (2)

Country Link
DE (1) DE102006000906A1 (de)
WO (1) WO2007077152A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008024474A1 (de) * 2008-05-21 2009-12-10 Siemens Aktiengesellschaft Verfahren zur Erkennung künstlich generierter Sprache

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4136138A1 (de) * 1991-10-18 1993-05-06 Norm Pacific Automation Corp., Hsinchu, Tw Multifunktionales telefonsystem mit spracherkennungs- und auswerteeinrichtung sowie ein verfahren zum betrieb dieses telefonsystems
GB2379830A (en) * 2001-09-12 2003-03-19 Mitel Knowledge Corp Voice identification pre-screening and redirection system

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10046208A1 (de) * 2000-09-13 2002-03-28 Deutsche Telekom Ag Voicefilter
DE102005009793A1 (de) * 2004-12-30 2006-07-13 Siemens Ag Verfahren zur inhaltsbasierten Priorisierung von Sprachnachrichten in einem Kommunikationssystem
DE102005024353A1 (de) * 2005-05-27 2006-11-30 Deutsche Telekom Ag Betreffzeile für Telephongespräche

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4136138A1 (de) * 1991-10-18 1993-05-06 Norm Pacific Automation Corp., Hsinchu, Tw Multifunktionales telefonsystem mit spracherkennungs- und auswerteeinrichtung sowie ein verfahren zum betrieb dieses telefonsystems
GB2379830A (en) * 2001-09-12 2003-03-19 Mitel Knowledge Corp Voice identification pre-screening and redirection system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008024474A1 (de) * 2008-05-21 2009-12-10 Siemens Aktiengesellschaft Verfahren zur Erkennung künstlich generierter Sprache

Also Published As

Publication number Publication date
WO2007077152A1 (de) 2007-07-12

Similar Documents

Publication Publication Date Title
DE102005029287B4 (de) Verfahren zum Unterbinden einer Vermittlung von unerwünschten Telefonanrufen
DE602005002340T2 (de) Entdeckung von unerwünschten elektronischen Nachrichten (Spam)
LU101105B1 (de) Verfahren zur automatisierten Erstellung eines an eine vorgegebene Person gerichteten Phishing-Dokuments
DE60305458T2 (de) System und verfahren zur bereitstellung einer nachrichtengestützten kommunikationsinfrastruktur für einen automatisierten anrufzentralenbetrieb
DE60118844T2 (de) Sprachfilter zur Ersetzung von erkannten Worten einer Sprachmitteilung
DE602005003409T2 (de) Ausfiltern unerwünschter Nachrichten (Spam) für Mobilfunkgeräte
DE102005058110A1 (de) Verfahren zum Ermitteln möglicher Empfänger
EP1052817A2 (de) Vorrichtung zur automatischen Bearbeitung von eingehender elektronischer Post(=Email)
DE102021204829A1 (de) Automatische korrektur fehlerhafter audioeinstellungen
DE10005291B4 (de) System und Verfahren zum verbesserten Handhaben von aufgefädelten Nachrichten
EP1898617A1 (de) Zentrale Speicherung von Daten
DE10340587A1 (de) System und Verfahren zum Verarbeiten von Information und Daten in Mobiltelefonen
DE102008062300B3 (de) Verfahren und Vorrichtung zum intelligenten Zusammenstellen einer Multimedianachricht für ein Mobilfunksystem
EP1246100A2 (de) Verfahren, Vorrichtung und E-Mailserver zum Erkennen einer unerwünschten E-Mail
WO2005096572A1 (de) Verfahren zur überwachung der übertragung von elektronischen nachrichten
CN109977243A (zh) 一种基于视频录制的单向面试方法及***
DE102006000906A1 (de) Verfahren zum Klassifizieren einer Voice-Mail und Datenverarbeitungsvorrichtung
DE102005046375B3 (de) Verfahren und Vorrichtungen zur Vermeidung des Empfangs unerwünschter Nachrichten in einem IP-Kommunikationsnetzwerk
DE102010007259A1 (de) Verfahren und Kommunikationssystem zur Übermittlung von Informationen über einen Defekt an zumindest einem Teil eines Kraftfahrzeugs
DE10326092B3 (de) Verfahren zum Kategorisieren von Nachrichten und Vorrichtungen zur Durchführung desselben
EP2779536A1 (de) Verfahren und Vorrichtung zur Verwaltung von Kommunikationsvorgängen
WO2001039440A1 (de) Versand von e-mails mittels telefon
WO2009040210A1 (de) Teilen von emails zwischen zwei benutzern mit hilfe eines servers
DE10046208A1 (de) Voicefilter
DE102006023759A1 (de) Verfahren und Detektorvorrichtung zur Abwehr von über ein Internet-Protokoll-basierendes Netz übertragenen unerwünschten Telefonanrufen

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8127 New person/name/address of the applicant

Owner name: NOKIA SIEMENS NETWORKS GMBH & CO.KG, 81541 MUE, DE

8131 Rejection