DE102006000906A1 - Verfahren zum Klassifizieren einer Voice-Mail und Datenverarbeitungsvorrichtung - Google Patents
Verfahren zum Klassifizieren einer Voice-Mail und Datenverarbeitungsvorrichtung Download PDFInfo
- Publication number
- DE102006000906A1 DE102006000906A1 DE200610000906 DE102006000906A DE102006000906A1 DE 102006000906 A1 DE102006000906 A1 DE 102006000906A1 DE 200610000906 DE200610000906 DE 200610000906 DE 102006000906 A DE102006000906 A DE 102006000906A DE 102006000906 A1 DE102006000906 A1 DE 102006000906A1
- Authority
- DE
- Germany
- Prior art keywords
- voice
- telephone call
- unwanted
- spam
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/53—Centralised arrangements for recording incoming messages, i.e. mailbox systems
- H04M3/533—Voice mail systems
- H04M3/53333—Message receiving aspects
- H04M3/5335—Message type or catagory, e.g. priority, indication
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/436—Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42136—Administration or customisation of services
- H04M3/42153—Administration or customisation of services by subscriber
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Information Transfer Between Computers (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Telephonic Communication Services (AREA)
Abstract
Die Erfindung betrifft ein Verfahren zum Klassifizieren einer Voice-Mail. Zunächst wird ein einer Voice-Mail zugeordneter erster Sprachdatensatz mit einer Mehrzahl zweiter Sprachdatensätze verglichen. Korreliert der erste Sprachdatensatz mit einem der zweiten Sprachdatensätze, so wird die Voice-Mail als unerwünschte Voice-Mail klassifiziert. Die Erfindung betrifft auch eine Datenverarbeitungsvorrichtung (2), mit der das Verfahren durchgeführt werden kann.
Description
- Die Erfindung betrifft ein Verfahren zum Klassifizieren einer Voice-Mail und eine Datenverarbeitungsvorrichtung.
- Spam-Mails sind ein gängiges Problem beim heutigen E-Mail Verkehr. Eine Spam-Mail ist eine unerwünschte E-Mail, die insbesondere zu Werbezwecken in relativ großer Anzahl an beliebige Empfänger verschickt wird. Eine Spam-Mail ist unter anderem vom Empfänger unerwünscht, da sie Aufmerksamkeit bindet bzw. die Sichtbarkeit erwünschter Emails einschränkt und beim Herunterladen unnötige Kosten durch die Datenübertragung verursacht. Zur Abwehr von Spam-Mails gibt es so genannte Spam-Filter, die Spam-Mails anhand verschiedener Merkmale erkennen, aussortieren oder als solche markieren. Ein solches Merkmal ist beispielsweise eine Prüfsumme (Hashwert) der E-Mail. In einer Filterdatenbank können die Merkmale, wie die Prüfsumme, als Kennzeichen der als Spam-Mail klassifizierten E-Mails hinterlegt sein. Somit ist es möglich, eingehende E-Mails vor der Zustellung an den Empfänger zu überprüfen, indem die E-Mail nach charakteristischen Merkmalen untersucht wird und diese Merkmale mit den in der Filterdatenbank abgelegten Merkmalen verglichen werden. Ergibt der Vergleich, dass die E-Mail eine Spam-Mail ist, so unterbleibt z.B. deren Weiterleitung an den Empfänger.
- Durch die zunehmende Verbreitung der Internet-Telefonie (Voice over IP) ist es zu erwarten, dass es in Zukunft verstärkt unerwünschte Telefonanrufe, wie z.B. Werbe-Anrufe geben wird. Globale Online-Telefonbücher können nämlich systematisch und automatisiert ausgewertet werden und automatisierte Anrufe über das Internet-Protokoll sind ähnlich preisgünstig wie E-Mails. Unerwünschte Telefonanrufe, wie die Werbe-Anrufe werden als SPIT-Anrufe (SPIT = Spam over IP-Telephony) bezeichnet.
- Eingehende Telefonanrufe können vor deren Durchschaltung an den Empfänger nicht einfach klassifiziert werden wie E-Mails, da sie in Echtzeit übermittelt werden. Somit ist ein unerwünschter Anruf bereits erfolgt, durchgeschaltet oder angenommen, bevor er überhaupt aufgrund dessen Inhalt klassifiziert werden kann. Wird ein Telefonanruf nicht entgegen genommen, so ist es möglich, diesen in Form einer Voice-Mail auf einer Voice-Mailbox zu speichern, um den Telefonanruf später abzuhören. Eine Voice-Mail ist eine Rechner gestützte Nachrichten-Übermittlung in Form von gespeicherter Sprachinformation, die sich des Prinzips der Mailbox bedient. Ein Anrufer kann seine gesprochene Nachricht als Audio-Datei (Sprachdatensatz) in der Voice-Mailbox hinterlegen, die der Empfänger später aus seinem Fach abrufen kann. Eine Voice-Mailbox ist ein reservierter Speicherbereich in einem Netzwerk, der dem Teilnehmer als elektronischer Briefkasten dient.
- SPIT-Anrufe sind jedoch nicht nur lästig, sondern können auch unnötigerweise eine Voice-Mailbox mit gespeicherten Anrufen belasten. Existierende Filtermechanismen für die Klassifizierung von unerwünschten Werbeanrufen bestehen zum Beispiel aus so genannten weißen oder schwarzen Listen, die erlaubte oder unerwünschte Rufnummern umfassen. Stammt ein Telefonanruf von einer verbotenen Rufnummer, so wird dieser nicht an die Voice-Mailbox weitergeleitet.
- Die Aufgabe der Erfindung ist es daher, ein Verfahren zur flexibleren Klassifizierung einer Voice-Mail anzugeben.
- Eine weitere Aufgabe der Erfindung ist es, eine Datenverarbeitungseinrichtung derart auszuführen, dass mit dieser eine Voice-Mail flexibler klassifiziert werden kann.
- Die Aufgabe der Erfindung wird gelöst durch ein Verfahren zum Klassifizieren einer Voice-Mail, aufweisend folgende Verfahrensschritte: Vergleichen eines einer Voice-Mail zugeordneten ersten Sprachdatensatzes mit einer Mehrzahl zweiter Sprachdatensätze und Klassifizieren der Voice-Mail als unerwünschte Voice-Mail, wenn der erste Sprachdatensatz mit einem der zweiten Sprachdatensätze korreliert.
- Unerwünschte Voice-Mails sind insbesondere die obenstehend beschriebenen SPIT-Anrufe. Mit dem erfindungsgemäßen Verfahren wird also eine Voice-Mail, also ein nicht entgegengenommener Telefonanruf, der z. B. in einer Voice-Mailbox bereits gespeichert ist oder in einer Voice-Mailbox gespeichert werden soll, klassifiziert, indem der der Voice-Mail zugeordnete erste Sprachdatensatz mit den zweiten Sprachdatensätzen verglichen wird. Die zweiten Sprachdatensätze sind Telefonanrufe, die bereits als unerwünscht klassifiziert sind, zugeordnet. Ergibt der Vergleich, dass der erste Sprachdatensatz mit wenigstens einem der zweiten Sprachdatensätze korreliert, so wird die dem ersten Sprachdatensatz zugeordnete Voice-Mail als unerwünschte Voice-Mail klassifiziert. Ist die Voice-Mail in der Voice-Mailbox bereits gespeichert, so kann diese z.B. automatisch gelöscht werden. Es kann aber auch vorgesehen sein, dass die Voice-Mail zunächst zwischengespeichert wird und nur dann an die Voice-Mailbox weiter geleitet wird, wenn die Voice-Mail nicht als eine unerwünschte Voice-Mail klassifiziert wurde.
- Es ist vorstellbar, dass aufgezeichnete Durchsagen, z.B. SPIT-Voice-Mails, aus der Widergabe von bekannten Spam-Mails hergestellt werden. Gemäß einer Ausführungsform des erfin dungsgemäßen Verfahrens ist es daher vorgesehen, dass die zweiten Sprachdatensätze jeweils einer Spam-Mail einer Mehrzahl von Spam Mails zugeordnet sind. Es gibt bereits Datenbanken, in denen bereits erkannte Spam-Mails gespeichert sind. Somit ist es möglich, die Mehrzahl zweiter Sprachdatensätze, wie es nach einer Ausführungsform des erfindungsgemäßen Verfahrens vorgesehen ist, aus ihren zugeordneten Spam-Mails zu erzeugen, indem beispielsweise zweite Sprachdatensätze aus Spam-Mails in automatisierter Form mittels einer automatisierten Sprach-Wiedergabe und/oder durch Vorlesen der Spam-Mails und Aufnehmen der vorgelesenen Spam-Mails gewonnen werden.
- Gemäß einer besonders bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens wird der Vergleich des ersten Sprachdatensatzes mit der Mehrzahl zweiter Sprachdatensätze gemäß folgender Verfahrensschritte vollzogen: Ermitteln wenigstens eines ersten Kennwertes durch eine Analyse des ersten Sprachdatensatzes und Vergleichen des ersten Kennwertes mit einer Mehrzahl zweiter Kennwerte, die aufgrund einer Analyse der Mehrzahl zweiter Sprachdatensätze derart erhalten wurden, sodass jeder der zweiten Sprachdatensätze wenigstens einem Kennwert der Mehrzahl zweiter Kennwerte zugeordnet ist. Um den ersten Sprachdatensatz mit den zweiten Sprachdatensätzen zu vergleichen, werden also entsprechende Kennwerte miteinander verglichen. Die einzelnen Kennwerte, also der dem ersten Sprachdatensatz zugeordnete erste Kennwert und die den zweiten Sprachdatensätzen zugeordneten zweiten Kennwerte, erhält man durch eine Analyse der entsprechenden Sprachdatensätze. Für eine automatisierte Analyse sind bekannte Sprachmustererkennungsalgorithmen oder andere Spracherkennungsmethoden geeignet. Die zweiten Kennwerte werden z.B. in einer Datenbank vorgehalten. Somit ist es nicht notwendig, die zweiten Sprachdatensätze, sondern es ist lediglich nötig, deren zugeordnete zweiten Kennwerte zu spei chern. Dies kann zu einem reduzierten Speicherbedarf führen. Aufgrund des Vergleichs des ersten Kennwertes mit den zweiten Kennwerten wird die Voice-Mail klassifiziert. Bei den einzelnen Kennwerten kann es sich jeweils um einen Kennwert oder um mehrere Kennwerte handeln, die z.B. zu Merkmalsvektoren zusammengefasst und gespeichert sind. Das Ergebnis des Vergleichs des ersten Kennwertes mit den zweiten Kennwerten kann auf Basis von Wahrscheinlichkeiten ermittelt werden, sodass eine Voice-Mail als unerwünscht klassifiziert wird, wenn der erste Kennwert mit einer bestimmten Mindestwahrscheinlichkeit wenigstens einem der zweiten Sprachdatensätze entspricht. In bekannten Spracherkennungssystemen werden für einen solchen Vergleich bzw. dessen Auswertung so genannte Hidden-Markov-Modelle verwendet. Die Voice-Mail wird also dann als unerwünschte Voice-Mail klassifiziert, wenn der erste Kennwert mit einem der zweiten Kennwerte korreliert.
- Nach Varianten des erfindungsgemäßen Verfahrens wird die Mehrzahl zweiter Sprachdatensätze gemäß folgender Verfahrensschritte erweitert: Aufzeichnen eines Telefonaufrufs und Hinzufügen eines dem aufgezeichneten Telefonanruf zugeordneten Sprachdatensatz zur Mehrzahl zweiter Sprachdatensätze, wenn diejenige Person, die den Telefonanruf angehört hat, den Telefonanruf als unerwünschten Telefonanruf klassifiziert hat. Alternativ wird ein dem unerwünschten Telefonanruf zugeordneter Kennwert zur Mehrzahl zweiter Kennwerte hinzugefügt. Erhält nun jemand einen Telefonanruf, so wird dieser automatisch aufgezeichnet. Am Ende des Telefonanrufs kann der Angerufene den gehörten Telefonanruf als unerwünschten Telefonanruf klassifizieren. Dies ist beispielsweise durch eine automatisierte Abfrage möglich. Klassifiziert der Angerufene den Telefonanruf als unerwünschten Telefonanruf, so wird der aufgezeichnete Telefonanruf der Mehrzahl zweiter Sprachdatensätze hinzugefügt bzw. wird der aufgezeichnete Telefonanruf analysiert, um einen dem Tele fonanruf zugeordneten Kennwert zu erhalten, der der Mehrzahl zweiter Kennwerte hinzugefügt wird. Somit ist es möglich, die Anzahl bekannter unerwünschter Voice-Mails zu erweitern.
- Die Mehrzahl zweiter Sprachdatensätze beziehungsweise die Mehrzahl zweiter Kennwerte können einer Mehrzahl von Spam-Mails zugeordnet sein. Um die Liste der Spam-Mails zu erweitern, können gemäß einer Ausführungsform des erfindungsgemäßen Verfahrens folgende Verfahrensschritte durchgeführt werden: Erzeugen einer dem unerwünschten Telefonanruf zugeordneten E-Mail und Hinzufügen der dem unerwünschten Telefonanruf zugeordneten E-Mail zur Mehrzahl von Spam-Mails.
- Der Mehrzahl von Spam-Mails kann wiederum eine Mehrzahl von dritten Kennwerten zugeordnet sein, die die einzelnen Spam-Mails als Spam-Mails klassifizieren. Ein solcher dritter Kennwert ist beispielsweise eine Prüfsumme (Hashwert). Nach einer Ausführungsform des erfindungsgemäßen Verfahrens ist es vorgesehen, einen Kennwert für die dem unerwünschten Telefonanruf zugeordneten E-Mail zu der Mehrzahl von dritten Kennwerten hinzuzufügen.
- Ein Vorteil des erfindungsgemäßen Verfahrens liegt in der Reduzierung der unerwünschten Voice-Nachrichten insbesondere auf einer Voice-Mailbox. Dadurch wird einem Überlauf der Voice-Mailbox vorgebeugt. Läuft nämlich die Voice-Mailbox über, so können auch erwünschte Voice-Mails nicht mehr gespeichert werden.
- Die Aufgabe der Erfindung wird auch gelöst durch eine Datenverarbeitungsvorrichtung, aufweisend eine Sprachanalyseeinrichtung, die aufgrund einer zur Sprachanalyse eines einer Voice-Mail zugeordneten ersten Sprachdatensatzes einen ersten Kennwert ermittelt, eine erste Datenbank, in der eine Mehrzahl von zweiten Kennwerten gespeichert ist, eine Ver gleichsvorrichtung zum Vergleichen des ersten Kennwertes mit den zweiten Kennwerten und eine Entscheiderlogik zum Klassifizieren der Voice-Mail als unerwünschte Voice-Mail, wenn der erste Kennwert mit einem der zweiten Kennwerte korreliert. Die erfindungsgemäße Datenverarbeitungsvorrichtung ist demnach derart ausgeführt, dass mit dieser das erfindungsgemäße Verfahren durchgeführt werden kann.
- Gemäß einer Ausführungsform der erfindungsgemäßen Datenverarbeitungsvorrichtung weist diese eine Voice-Mailbox auf, in der die Voice-Mail gespeichert ist, und die Datenverarbeitungsvorrichtung automatisch die Voice-Mail löscht, wenn die Entscheiderlogik diese als unerwünschte Voice-Mail klassifiziert. Somit wird einem Überlaufen der Voice-Mailbox aufgrund unerwünschter Voice-Mails vorgebeugt.
- Die zweiten Kennwerte sind insbesondere jeweils einer Spam-Mail einer Mehrzahl von Spam-Mails zugeordnet.
- Um die Mehrzahl zweiter Kennwerte zu erweitern, umfasst die erfindungsgemäße Datenverarbeitungsvorrichtung nach einer Variante eine Vorrichtung zum Aufzeichnen eines Telefonanrufs, wobei die Datenverarbeitungsvorrichtung derart ausgeführt ist, dass die Sprachanalyseeinrichtung bei einer Klassifizierung des Telefonanrufs als unerwünschter Telefonanruf den Telefonanruf analysiert, einen dem Telefonanruf zugeordneten Kennwert ermittelt und diesen Kennwert der Mehrzahl zweiter Kennwerte hinzufügt.
- Der Mehrzahl von Spam-Mails kann wiederum einer Mehrzahl von dritten Kennwerten zugeordnet sein, die die einzelnen Spam-Mails als Spam-Mails klassifizieren. Ein solcher dritter Kennwert ist beispielsweise eine Prüfsumme (Hashwert). Nach einer Ausführungsform der erfindungsgemäßen Datenverarbeitungsvorrichtung umfasst diese eine Vorrichtung zum Herstel len einer E-Mail aus dem aufgezeichneten unerwünschten Telefonanruf, eine Vorrichtung zum Analysieren der E-Mail, die aufgrund der Analyse der E-Mail einen der E-Mail zugeordneten Kennwert herstellt, und eine zweite Datenbank, in der eine den Spam-Mails zugeordnete Mehrzahl dritter Kennwerte gespeichert ist. Die erfindungsgemäße Datenverarbeitungsvorrichtung ist dann derart eingerichtet, dass sie den der E-Mail zugeordneten Kennwert der Mehrzahl dritter Kennwerte hinzufügt.
- Ein Ausführungsbeispiel der Erfindung ist in den beigelegten schematischen Zeichnungen exemplarisch dargestellt. Es zeigen:
-
1 Ein das erfindungsgemäße Verfahren veranschaulichendes Szenario und -
2 bis5 jeweils eine Datenbank. - Die
1 zeigt einen an ein öffentliches Datennetz1 angeschlossenen Server2 , einen an das Datennetz1 angeschlossenen Rechner3 und ein an das Datennetz1 angeschlossenes Telefon4 , mit dem eine Person5 Anrufe tätigen und entgegen nehmen kann. Im Falle des vorliegenden Ausführungsbeispieles handelt es sich bei dem Telefon4 um ein IP-Telefon, das über ein Voice-over-IP Protokoll mit weiteren, in der1 nicht gezeigten Telefonen kommunizieren kann. Des Weiteren können auch an das Datennetz1 angeschlossene Rechner, wie der Rechner3 , Sprachnachrichten an das Telefon4 übermitteln, die die Person5 mit dem Telefon4 anhören kann. - Der Server
2 wird im Falle des vorliegenden Ausführungsbeispiels von einem Dienstleister betrieben, der auch für das Telefon4 verantwortlich ist. Der Dienstleister bietet den Service einer Voice-Mailbox an, den die Person5 in Anspruch nimmt. Zu diesem Zweck umfasst der Server2 eine der Person5 bzw. dem Telefon4 zugeordnete Voice-Mailbox6 . Wird ein an das Telefon4 gerichteter Anruf nicht entgegen genommen, so wird dieser in Form einer Voice-Mail in der Voice-Mailbox6 gespeichert. Allgemein ist eine Voice-Mail eine Rechner gestützte Nachrichten-Übermittlung in Form von gespeicherter Sprachinformation, die sich des Prinzips der Mailbox bedient. Ein Anrufer kann seine gesprochene Nachricht als Audio-Datei (Sprachdatensatz) in der Voice-Mailbox hinterlegen, die der Empfänger, z.B. die Person5 , später aus seinem Fach abrufen kann. Eine Voice-Mailbox ist ein reservierter Speicherbereich in einem Netzwerk, der dem Teilnehmer als elektronischer Briefkasten dient. - Im Falle des vorliegenden Ausführungsbeispiels ist der Rechner
3 dafür vorgesehen, einen automatisierten Telefonanruf an eine Vielzahl von Telefonen und insbesondere an das Telefon4 zu verschicken. Die Person5 nimmt den Telefonanruf nicht entgegen, weshalb dieser in Form einer Voice-Mail in der Voice-Mailbox6 abgelegt wird. Der automatisierte Telefonanruf ist unerwünscht und verbraucht daher unnütz Speicherplatz der Voice-Mailbox6 . - Damit die Voice-Mailbox
6 nicht aufgrund unerwünschter Telefonanrufe, wie z.B. so genannter Spit-Anrufe (Spam over IP-Telefonie) überläuft, läuft auf dem Server2 ein Rechnerprogramm, das unerwünschte Voice-Mails, also unerwünschte und in der Voice-Mailbox6 gespeicherte Voice-Mails erkennt und daraufhin automatisch löscht. Zu diesem Zweck ist in dem Server2 eine in der2 näher dargestellte erste Datenbank21 gespeichert. Die erste Datenbank21 umfasst eine Mehrzahlen von Merkmalsvektoren 1 bis N, die jeweils einem unerwünschten Telefonanruf zugeordnet sind. Jeder der Merkmalsvektoren 1 bis N umfasst wiederum wenigstens einen dem entsprechenden unerwünschten Telefonanruf zugeordneten Kenn wert. Anhand der Kennwerte ist es möglich zu entscheiden, ob eine eingehende Voice-Mail einer der unerwünschten Telefonanrufe zugeordnet werden kann, d.h. ob eine eingehende Voice-Mail ein der unerwünschten Telefonanrufe 1 bis N entspricht. Die Kennwerte der Merkmalsvektoren 1 bis N wurden im Falle des vorliegenden Ausführungsbeispiels dadurch ermittelt, dass der entsprechende unerwünschte Telefonanruf bzw. ein diesem Telefonanruf zugeordneter Sprachdatensatz mittels eines auf dem Server2 laufenden Spracherkennungsalgorithmus analysiert wurde. Spracherkennungsalgorithmen sind dem Fachmann allgemein bekannt und arbeiten z.B. auf der Basis von Hidden-Markov-Modellen. - Im Falle des vorliegenden Ausführungsbeispiels startet der Server
2 automatisch seinen Spracherkennungsalgorithmus, wenn eine neue Voice-Mail in der Voice-Mailbox6 eintrifft. Folglich wird auch die Voice-Mail, die dem vom Rechner3 gesendeten Telefonanruf entspricht, analysiert, indem der Spracherkennungsalgorithmus den dieser Voice-Mail zugeordneten Sprachdatensatz analysiert. Das Ergebnis dieser Analyse ist ein Merkmalsvektor mit wenigstens einem Kennwert. Anschließend startet der Server2 automatisch ein weiteres Rechnerprogramm, das den bzw. die Kennwerte des Merkmalsvektors dieser Voice-Mail mit den Merkmalsvektoren 1 bis N der Datenbank21 vergleicht. Aufgrund dieses Vergleichs bestimmt das weitere Rechnerprogramm im Falle des vorliegenden Ausführungsbeispiels Wahrscheinlichkeitswerte, die ein Maß für eine Übereinstimmung der Voice-Mail mit den unerwünschten Telefonanrufen der Datenbank21 angeben. Übersteigt einer dieser Wahrscheinlichkeiten eine in dem Server2 hinterlegte vorgegeben Mindestwahrscheinlichkeit, dann wird die analysierte Voice-Mail bzw. dessen Sprachdatensatz automatisch aus der Voice-Mailbox6 gelöscht. - Im Falle des vorliegenden Ausführungsbeispieles sind die unerwünschten Telefonanrufe, deren Merkmalsvektoren 1 bis N in der Datenbank
21 gespeichert sind, bekannten Spam-Mails zugeordnet. Eine Spam-Mail ist eine unerwünschte E-Mail, die insbesondere zu Werbezwecken in relativ großer Anzahl an beliebige Empfänger verschickt wird. Die Spam-Mails können anhand von ihnen zugeordneten Kennwerten, wie z.B. einer Prüfsumme (Hash-Wert) identifiziert werden. Zu diesem Zweck umfasst der Server2 im Falle des vorliegenden Ausführungsbeispiels eine in de3 näher dargestellte Datenbank31 , in der Spam-Mails 1 bis N zugeordnete Merkmalsvektoren 1' bis N' gespeichert sind. - Im Falle des vorliegenden Ausführungsbeispiels wurden zunächst aus den Spam-Mails 1' bis N' jeweils ein Sprachdatensatz mittels einer automatisierten Sprachwidergabe oder durch Vorlesen und Aufnehmen einer Spam-Mail hergestellt. Somit wurden N Sprachdatensätze generiert, die jeweils einem der N unerwünschten Telefonanrufen der Datenbank
21 entsprechen. Diese N Sprachdatensätze analysierte der Server2 mit seinem Spracherkennungsalgorithmus, um die Merkmalsvektoren 1 bis N zu erhalten. - Im Falle des vorliegenden Ausführungsbeispiels ist der Server
2 ferner derart konfiguriert, dass die Person5 mit ihrem Telefon4 einen entgegengenommen Telefonanruf als unerwünschten Telefonanruf klassifizieren kann. Dazu umfasst der Server2 ein Tonaufzeichnungsgerät7 , das einen an das Telefon4 gerichteten und entgegengenommenen Telefonanruf aufzeichnet. Ferner läuft auf dem Server2 ein weiteres Rechnerprogramm, das am Ende des für das Telefon4 bestimmten und auch entgegengenommenen Telefonanrufs automatisiert diejenige Person, die den Telefonanruf entgegennahm, also z.B. die Person5 , fragt, ob der Telefonanruf unerwünscht war. Dazu umfasst der Server2 eine entsprechende Sprachgenerie rungssoftware. Antwortet die Person5 auf diese Frage mit "ja", so klassifiziert der Server2 diesen Telefonanruf als unerwünschten Telefonanruf. - Wird ein Telefonanruf als unerwünscht klassifizierte, so startet der Server
2 seinen Spracherkennungsalgorithmus und analysiert den dem im Tonaufzeichnungsgerät7 gespeicherten kürzlich als unerwünscht klassifizierten Telefonanruf zugeordneten Sprachdatensatz. Das Ergebnis dieser Analyse ist ein Merkmalsvektor N + 1, der der Datenbank21 zugefügt wird. Die um den Merkmalsvektor N + 1 erweiterte Datenbank21 ist in der4 gezeigt. - Des Weiteren ist im Falle des vorliegenden Ausführungsbeispiels der Server
2 derart konfiguriert, dass er aus einem von der Person5 klassifizierten und im Tonaufzeichnungsgerät7 gespeicherten unerwünschten Telefonanruf eine Textdatei mit dem Inhalt des unerwünschten Telefonanrufs erstellt. Der Server2 stellt aus dieser Textdatei eine E-Mail her, die ebenfalls eine Spam-Mail ist. Diese Spam-Mail kann wiederum anhand eines ihr zugeordneten Kennwertes, wie z.B. einer Prüfsumme (Hash-Wert), identifiziert werden. Somit ist es möglich, die Datenbank31 um eine N + 1-te Spam-Mail zu erweitern, wie dies in der5 dargestellt ist. - Im Falle des vorliegenden Ausführungsbeispieles wurde das erfindungsgemäße Verfahren anhand des Servers
2 erläutert, der als zentraler Server die Voice-Mailbox6 umfasst und Telefonanrufe an Endgeräte, wie beispielsweise an das Telefon4 leitet. Es ist jedoch insbesondere auch möglich, dass die Voice-Mailbox6 im Telefon4 integriert ist. Dann könnte beispielsweise der Spracherkennungsalgorithmus auf dem Telefon4 laufen und die Datenbank21 auf dem Telefon4 hinterlegt sein. Des Weiteren ist es auch möglich, eine Voice-Mail zunächst zwischenzuspeichern und nur dann auf die Voice- Mailbox6 zu leiten, wenn diese nicht als unerwünschter Telefonanruf klassifiziert wurde.
Claims (17)
- Verfahren zum Klassifizieren einer Voice-Mail, aufweisend folgende Verfahrensschritte: – Vergleichen eines einer Voice-Mail zugeordneten ersten Sprachdatensatzes mit einer Mehrzahl zweiter Sprachdatensätze und – Klassifizieren der Voice-Mail als unerwünschte Voice-Mail, wenn der erste Sprachdatensatz mit einem der zweiten Sprachdatensätze korreliert.
- Verfahren nach Anspruch 1, bei dem die zweiten Sprachdatensätze jeweils einer Spam-Mail einer Mehrzahl von Spam-Mails zugeordnet sind.
- Verfahren nach Anspruch 2, bei dem die zweiten Sprachdatensätze aus den ihren zugeordneten Spam-Mails erzeugt werden.
- Verfahren nach Anspruch 3, bei dem die zweiten Sprachdatensätze mittels einer automatisierten Sprachwiedergabe und/oder durch Vorlesen und Aufnehmen der entsprechenden Spam-Mail erzeugt werden.
- Verfahren nach einem der Ansprüche 1 bis 4, bei dem der Vergleich des ersten Sprachdatensatzes mit der Mehrzahl zweiter Sprachdatensätze folgende Verfahrensschritte aufweist: – Ermitteln wenigstens eines ersten Kennwertes durch eine Analyse des ersten Sprachdatensatzes und – Vergleichen des ersten Kennwertes mit einer Mehrzahl zweiter Kennwerte, die aufgrund einer Analyse der Mehrzahl zweiter Sprachdatensätze derart erhalten wurde, sodass jedem der zweiten Sprachdatensätze wenigstens ein Kennwert der Mehrzahl zweiter Kennwerte zugeordnet ist.
- Verfahren nach Anspruch 5, bei dem die Voice-Mail als unerwünschte Voice-Mail klassifiziert wird, wenn der Vergleich des ersten Kennwertes mit der Mehrzahl zweiter Kennwerte ergibt, dass der erste Kennwert mit einem der zweiten Kennwerte korreliert.
- Verfahren nach Anspruch 5 oder 6, bei dem der erste Kennwert erhalten wird, indem der erste Sprachdatensatz mittels Sprachanalyse automatisch analysiert wird und/oder die zweiten Kennwerte erhalten werden, indem die zweiten Sprachdatensätze mittels Sprachanalyse automatisch analysiert werden.
- Verfahren nach einem der Ansprüche 1 bis 7, bei dem die Voice-Mail in einer Voice-Mailbox (
6 ) gespeichert ist und automatisch gelöscht wird, wenn die Voice-Mail als unerwünschte Voice-Mail klassifiziert wurde. - Verfahren nach einem der Ansprüche 1 bis 8, aufweisend folgende Verfahrensschritte: – Aufzeichnen eines Telefonaufrufs und – Hinzufügen eines dem aufgezeichneten Telefonanruf zugeordneten Sprachdatensatz zur Mehrzahl zweiter Sprachdatensätze, wenn diejenige Person (
5 ), die den Telefonanruf angehört hat, den Telefonanruf als unerwünschten Telefonanruf klassifiziert hat. - Verfahren nach einem der Ansprüche 5 bis 8, aufweisend folgende Verfahrensschritte: – Aufzeichnen eines Telefonaufrufs, – Ermitteln eines dem Telefonanruf zugeordneten Kennwertes, wenn diejenige Person (
5 ), die den Telefonanruf angehört hat, den Telefonanruf als unerwünschten Telefonanruf klassifiziert hat, und – Hinzufügen des dem unerwünschten Telefonanruf zugeordneten Kennwertes zur Mehrzahl zweiter Kennwerte. - Verfahren nach Anspruch 9 oder 10, aufweisend folgende Verfahrensschritte: – Erzeugen einer dem unerwünschten Telefonanruf zugeordneten E-Mail und – Hinzufügen der dem unerwünschten Telefonanruf zugeordneten E-Mail zur Mehrzahl von Spam-Mails.
- Verfahren nach Anspruch 10, bei dem der Mehrzahl von Spam-Mails eine Mehrzahl von dritten Kennwerten zugeordnet ist, die die einzelnen Spam-Mails als Spam-Mail kategorisieren, und Hinzufügen eines Kennwertes für die dem unerwünschten Telefonanruf zugeordneten E-Mail zu der Mehrzahl von dritten Kennwerten.
- Datenverarbeitungsvorrichtung, aufweisend: eine Sprachanalyseeinrichtung, die aufgrund einer zur Sprachanalyse eines einer Voice-Mail zugeordneten ersten Sprachdatensatzes einen ersten Kennwert ermittelt, – eine erste Datenbank (
21 ), in der eine Mehrzahl von zweiten Kennwerten gespeichert ist, – eine Vergleichsvorrichtung zum Vergleichen des ersten Kennwertes mit den zweiten Kennwerten und – eine Entscheiderlogik zum Klassifizieren der Voice-Mail als unerwünschte Voice-Mail, wenn der erste Kennwert mit einem der zweiten Kennwerte korreliert. - Datenverarbeitungsvorrichtung nach Anspruch 13, aufweisend eine Voice-Mailbox (
6 ), in der die Voice-Mail gespeichert ist, und die Datenverarbeitungsvorrichtung (2 ) automatisch die Voice-Mail löscht, wenn die Entscheiderlogik diese als unerwünschte Voice-Mail klassifiziert. - Datenverarbeitungsvorrichtung nach Anspruch 13 oder 14, bei der die zweiten Kennwerte jeweils einer Spam-Mail einer Mehrzahl von Spam-Mail zugeordnet sind.
- Datenverarbeitungsvorrichtung nach einem der Ansprüche 13 bis 15, aufweisend eine Vorrichtung zum Aufzeichnen (
7 ) eines Telefonanrufs, wobei die Datenverarbeitungsvorrichtung (2 ) derart ausgeführt ist, dass die Sprachanalyseeinrichtung bei einer Klassifizierung des Telefonanrufs als unerwünschter Telefonanruf den Telefonanruf analysiert, einen dem Telefonanruf zugeordneten Kennwert ermittelt und diesen Kennwert der Mehrzahl zweiter Kennwerte hinzufügt. - Datenverarbeitungsvorrichtung nach Anspruch 16, aufweisend eine Vorrichtung zum Herstellen einer E-Mail aus dem aufgezeichneten unerwünschten Telefonanruf, eine Vorrichtung zum Analysieren der E-Mail, die aufgrund der Analyse der E-Mail einen der E-Mail zugeordneten Kennwert herstellt, und eine zweite Datenbank (
31 ), in der eine den Spam-Mails zugeordnete Mehrzahl dritter Kennwerte gespeichert sind, und die Datenverarbeitungsvorrichtung (2 ) derart eingerichtet ist, dass sie den der E-Mail zugeordneten Kennwert der Mehrzahl dritter Kennwerte hinzufügt.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE200610000906 DE102006000906A1 (de) | 2006-01-05 | 2006-01-05 | Verfahren zum Klassifizieren einer Voice-Mail und Datenverarbeitungsvorrichtung |
PCT/EP2006/070091 WO2007077152A1 (de) | 2006-01-05 | 2006-12-21 | Verfahren zum klassifizieren einer voice-mail und datenverarbeitungsvorrichtung |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE200610000906 DE102006000906A1 (de) | 2006-01-05 | 2006-01-05 | Verfahren zum Klassifizieren einer Voice-Mail und Datenverarbeitungsvorrichtung |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102006000906A1 true DE102006000906A1 (de) | 2007-07-12 |
Family
ID=37901043
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE200610000906 Ceased DE102006000906A1 (de) | 2006-01-05 | 2006-01-05 | Verfahren zum Klassifizieren einer Voice-Mail und Datenverarbeitungsvorrichtung |
Country Status (2)
Country | Link |
---|---|
DE (1) | DE102006000906A1 (de) |
WO (1) | WO2007077152A1 (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102008024474A1 (de) * | 2008-05-21 | 2009-12-10 | Siemens Aktiengesellschaft | Verfahren zur Erkennung künstlich generierter Sprache |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4136138A1 (de) * | 1991-10-18 | 1993-05-06 | Norm Pacific Automation Corp., Hsinchu, Tw | Multifunktionales telefonsystem mit spracherkennungs- und auswerteeinrichtung sowie ein verfahren zum betrieb dieses telefonsystems |
GB2379830A (en) * | 2001-09-12 | 2003-03-19 | Mitel Knowledge Corp | Voice identification pre-screening and redirection system |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10046208A1 (de) * | 2000-09-13 | 2002-03-28 | Deutsche Telekom Ag | Voicefilter |
DE102005009793A1 (de) * | 2004-12-30 | 2006-07-13 | Siemens Ag | Verfahren zur inhaltsbasierten Priorisierung von Sprachnachrichten in einem Kommunikationssystem |
DE102005024353A1 (de) * | 2005-05-27 | 2006-11-30 | Deutsche Telekom Ag | Betreffzeile für Telephongespräche |
-
2006
- 2006-01-05 DE DE200610000906 patent/DE102006000906A1/de not_active Ceased
- 2006-12-21 WO PCT/EP2006/070091 patent/WO2007077152A1/de active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4136138A1 (de) * | 1991-10-18 | 1993-05-06 | Norm Pacific Automation Corp., Hsinchu, Tw | Multifunktionales telefonsystem mit spracherkennungs- und auswerteeinrichtung sowie ein verfahren zum betrieb dieses telefonsystems |
GB2379830A (en) * | 2001-09-12 | 2003-03-19 | Mitel Knowledge Corp | Voice identification pre-screening and redirection system |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102008024474A1 (de) * | 2008-05-21 | 2009-12-10 | Siemens Aktiengesellschaft | Verfahren zur Erkennung künstlich generierter Sprache |
Also Published As
Publication number | Publication date |
---|---|
WO2007077152A1 (de) | 2007-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE102005029287B4 (de) | Verfahren zum Unterbinden einer Vermittlung von unerwünschten Telefonanrufen | |
DE602005002340T2 (de) | Entdeckung von unerwünschten elektronischen Nachrichten (Spam) | |
LU101105B1 (de) | Verfahren zur automatisierten Erstellung eines an eine vorgegebene Person gerichteten Phishing-Dokuments | |
DE60305458T2 (de) | System und verfahren zur bereitstellung einer nachrichtengestützten kommunikationsinfrastruktur für einen automatisierten anrufzentralenbetrieb | |
DE60118844T2 (de) | Sprachfilter zur Ersetzung von erkannten Worten einer Sprachmitteilung | |
DE602005003409T2 (de) | Ausfiltern unerwünschter Nachrichten (Spam) für Mobilfunkgeräte | |
DE102005058110A1 (de) | Verfahren zum Ermitteln möglicher Empfänger | |
EP1052817A2 (de) | Vorrichtung zur automatischen Bearbeitung von eingehender elektronischer Post(=Email) | |
DE102021204829A1 (de) | Automatische korrektur fehlerhafter audioeinstellungen | |
DE10005291B4 (de) | System und Verfahren zum verbesserten Handhaben von aufgefädelten Nachrichten | |
EP1898617A1 (de) | Zentrale Speicherung von Daten | |
DE10340587A1 (de) | System und Verfahren zum Verarbeiten von Information und Daten in Mobiltelefonen | |
DE102008062300B3 (de) | Verfahren und Vorrichtung zum intelligenten Zusammenstellen einer Multimedianachricht für ein Mobilfunksystem | |
EP1246100A2 (de) | Verfahren, Vorrichtung und E-Mailserver zum Erkennen einer unerwünschten E-Mail | |
WO2005096572A1 (de) | Verfahren zur überwachung der übertragung von elektronischen nachrichten | |
CN109977243A (zh) | 一种基于视频录制的单向面试方法及*** | |
DE102006000906A1 (de) | Verfahren zum Klassifizieren einer Voice-Mail und Datenverarbeitungsvorrichtung | |
DE102005046375B3 (de) | Verfahren und Vorrichtungen zur Vermeidung des Empfangs unerwünschter Nachrichten in einem IP-Kommunikationsnetzwerk | |
DE102010007259A1 (de) | Verfahren und Kommunikationssystem zur Übermittlung von Informationen über einen Defekt an zumindest einem Teil eines Kraftfahrzeugs | |
DE10326092B3 (de) | Verfahren zum Kategorisieren von Nachrichten und Vorrichtungen zur Durchführung desselben | |
EP2779536A1 (de) | Verfahren und Vorrichtung zur Verwaltung von Kommunikationsvorgängen | |
WO2001039440A1 (de) | Versand von e-mails mittels telefon | |
WO2009040210A1 (de) | Teilen von emails zwischen zwei benutzern mit hilfe eines servers | |
DE10046208A1 (de) | Voicefilter | |
DE102006023759A1 (de) | Verfahren und Detektorvorrichtung zur Abwehr von über ein Internet-Protokoll-basierendes Netz übertragenen unerwünschten Telefonanrufen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
8127 | New person/name/address of the applicant |
Owner name: NOKIA SIEMENS NETWORKS GMBH & CO.KG, 81541 MUE, DE |
|
8131 | Rejection |