DE112011106041T5 - Suchvorrichtung - Google Patents

Suchvorrichtung Download PDF

Info

Publication number
DE112011106041T5
DE112011106041T5 DE112011106041.6T DE112011106041T DE112011106041T5 DE 112011106041 T5 DE112011106041 T5 DE 112011106041T5 DE 112011106041 T DE112011106041 T DE 112011106041T DE 112011106041 T5 DE112011106041 T5 DE 112011106041T5
Authority
DE
Germany
Prior art keywords
search
data
index
extension
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE112011106041.6T
Other languages
English (en)
Inventor
c/o Mitsubishi Electric Corp. Okato Yohei
c/o Mitsubishi Electric Corp. Aikawa Takeyuki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of DE112011106041T5 publication Critical patent/DE112011106041T5/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3605Destination input or retrieval
    • G01C21/3611Destination input or retrieval using character input or menus, e.g. menus of POIs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Automation & Control Theory (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Eine Sucheinheit (60) berechnet eine Zeichenreihenähnlichkeit durch Erhalten von Erweiterungsquellendokumentdaten, die teilweise mit einer Suchabfrage (70) übereinstimmen, aus einem Zeichenreihen-Suchindex (40), bestimmt eine Relationaldaten-Erweiterungs-Ähnlichkeit durch Erhalten von Erweiterungsbestimmungszieldokumentdaten, die so definiert sind, dass sie eine Beziehung mit den Erweiterungsquellendokumentdaten haben, aus einem Relationaldaten-Erweiterungsindex (50) und Korrigieren der erhaltenen Daten durch die Zeichenreihenähnlichkeit der Erweiterungsbestimmungszieldokumentdaten und Beziehungsgewichtungsdaten (80), und gibt ein Suchergebnis (90), das in einer Reihenfolge der Relationaldatenerweiterungs-Ähnlichkeit angeordnet ist, aus.

Description

  • TECHNISCHES GEBIET
  • Die vorliegende Erfindung bezieht sich auf eine Suchvorrichtung, die eine Fuzzysuche nach einem Index unter Verwendung eines Teils einer Suchabfrage als einen Suchschlüssel verwendet.
  • STAND DER TECHNIK
  • Wenn eine Suche nach einem Liedtitel, einem Einrichtungsnamen oder dergleichen durchgeführt wird. erinnert sich ein Benutzer nicht immer an seinen exakten Namen, und somit führt in einigen Fällen der Benutzer die Suche unter Verwendung eines populären Namens, eines abgekürzten Namens, eines Namens, an den er sich ungefähr und ungenau erinnert, oder dergleichen als Suchschlüssel durch. Mit Bezug auf ein Endgerät und eine Vorrichtung wie einer Fahrzeug-Navigationsvorrichtung und eines Smartphones, das nicht mit einer Tastatur als einer Eingabevorrichtung versehen ist, kann auch der Fall auftreten, in welchem die Suche unter Verwendung eines Ergebnisses der Spracherkennung eines Sprachsignals durch ein Mikrofon, eines Ergebnisses einer Zeichenerkennung einer Eingabe über ein Berührungspaneel oder dergleichen als des Suchschlüssels durchgeführt wird. In jedem Fall ist eine Technik erforderlich, um eine Fuzzy(mehrdeutige)-Suche nicht nur für einen ordnungsgemäßen Namen, sondern auch seinem in der Aussprache analogen Namen oder eine analoge Zeichenreihe durchzuführen.
  • Ein Beispiel für eine herkömmliche Suchtechnik, die die Fuzzysuche wie vorstehend beschrieben durchführt, wird im Patentdokument 1 vorgeschlagen. Eine Erfindung gemäß dem Patentdokument 1 ist eine Suchvorrichtung, die eine Fuzzysuche unter Verwendung einer Teilzeichenreihe in einem Suchbegriff durchführt; wenn eine Bewertung hiervon, die als die Teilzeichenreihe in dem Suchbegriff angehoben ist, mit einer höheren Rate in einer Suchziel-Zeichenreihe enthalten ist, und da die Teilzeichenreihe in der Suchziel-Zeichenreihe weiter vorwärts positioniert ist, kann ein angemessenes Suchergebnis, das dem Gefühl eines Benutzers entspricht, bei der Suche nach einem Einrichtungsnamen erhalten werden. Dies verwendet die folgenden Charakteristiken: im Allgemeinen besteht die Neigung, wenn ein Name für eine Einrichtung und so weiter auf Japanisch vorgesehen ist, zu bestimmen, dass Wörter und Sätze, die hervorzuheben sind, in dem Namen vorwärts positioniert werden; und gewöhnlich hat der Benutzer die Neigung, eine höhere Korrelationsfähigkeit zwischen der Suchziel-Zeichenreihe und dem Suchbegriff zu fühlen, wenn der Suchbegriff in der Suchziel-Zeichenreihe vorn anstatt in dieser hinten positioniert ist.
  • Wenn beispielsweise ein Suchname ”ABCD-LAND” als der Suchbegriff eingegeben wird, sucht die Suchvorrichtung nach einer Suchziel-Zeichenreihe enthaltend ”AB”, ”BC”, ”CD”, ”DL”, ”LA”, ”AN” und/oder ”ND”, die ihre Teilzeichenreihen sind. Wenn zwei Suchziel-Zeichenreihen ”ABDC-LAND” und ”ox BANK ABCD LAND BRANCH” als dieses Suchergebnis erhalten werden, wird ”ABCD-LAND” höher bewertet, das der Benutzer mit hoher Wahrscheinlichkeit wünscht.
  • Wenn andererseits eine Suche nach einem Liedtitel, einem Einrichtungsnamen und so weiter durchgeführt wird, werden in vielen Fällen mehrere korrelierte Schlüsselwörter als der Suchschlüssel verwendet. Wenn beispielsweise die Suche mit einer solchen Form wie ”<Künstlername> <Liedtitel>” oder ”<Stadtname> <Einrichtungsname>” durchgeführt wird, wird das Suchergebnis weiter eingeengt, als wenn die Suche nur mit dem Liedtitel oder dem Einrichtungsnamen durchgeführt wird, so dass erwartet werden kann, dass geeignetere Suchergebnisse erhalten werden.
  • Ein Beispiel für eine herkömmliche Suchtechnik, die eine Beziehung zwischen derartigen korrelierten Schlüsselwörtern in Betracht zieht, wird im Patentdokument 2 vorgeschlagen. Eine Erfindung gemäß dem Patentdokument 2 ist eine Suchvorrichtung, in der Einrichtungsnamen und ihre zugehörigen Informationen vorher miteinander assoziiert wurden, und ein Index für jede zugehörige Information wird gebildet, so dass ein Suchergebnis durch Spezifizieren der zugehörigen Information aus Wörtern und Sätzen in einer Suchabfrage erhalten wird, gefolgt durch Suchen nach dem Index auf der Grundlage der spezifizierten zugehörigen Information.
  • Wenn beispielsweise eine Suchabfrage nach ”PORK BONE, THIN NOODLE” eingegeben wird, bestimmt die Suchvorrichtung, dass ”PORK BONE” ein Schlüsselwort ist, das zu der zugehörigen Information ”TASTE” gehört, und sucht dann nach Indexdaten von Geschmack (taste), die vorher vorbereitet wurden, um hierdurch den entsprechenden Einrichtungsnamen zu erhalten. Weiterhin bestimmt die Suchvorrichtung, dass ”THIN NOODLE” ein Schlüsselwort ist, das zu der zugehörigen Information ”NOODLE” gehört, und sucht dann nach Indexdaten von noodle (Nudel in englisch), die vorher vorbereitet wurden, um hierdurch den entsprechenden Einrichtungsnamen zu erhalten. Dann kombiniert die Suchvorrichtung diese Suchergebnisse und präsentiert dem Benutzer eine Liste der entsprechenden Einrichtungsnamen als die Suchergebnisse.
  • DOKUMENTE DES STANDES DER TECHNIK
  • PATENTDOKUMENTE
    • Patentdokument 1: Japanische Patentanmeldungs-Offenlegungsschrift Nr. 2003-44515
    • Patentdokument 2: Japanische Patentanmeldungs-Offenlegungsschrift Nr. 2009-211683
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • DURCH DIE ERFINDUNG ZU LÖSENDE PROBLEME
  • Jedoch besteht bei dem vorgenannten Patentdokument 1, obgleich es möglich ist, eine Fuzzy-Suche unter Berücksichtigung der Ähnlichkeit der Zeichenreihe durchzuführen, ein Problem derart, dass eine Suche unter Verwendung einer gegenseitigen Beziehung zwischen den Schlüsselwörtern nicht durchgeführt werden kann, selbst wenn die Suche mit den Formen von ”<Künstlername> <Liedtitel>” und/oder ”<Stadtname> <Einrichtungsname>” durchgeführt wird.
  • Beispielsweise wird in einem Fall der Musiksuche, wenn ein Suchwort eingegeben wird, das einen Künstlernamen und einen Liedtitel, die aufeinander bezogen sind, wie ”<Künstlername> <Liedtitel>”, kombiniert, dieselbe Bewertung für denselben Liedtitel, selbst wenn der Künstlername unterschiedlich ist, erhalten, so dass der Künstlername in dem Suchwort in dem Suchergebnis nicht reflektiert werden kann.
  • Um den Künstlernamen in dem Suchergebnis zu reflektieren, ist es auch möglich, einen Index für eine Suchziel-Zeichenreihe zu erzeugen, in der der Künstlername und der Liedtitel miteinander verknüpft sind; jedoch wird das Datenvolumen für den Index vergrößert.
  • Weiterhin ist, wenn Indizes vorbereitet werden, die nicht nur dem Muster von ”<Künstlername> <Liedtitel>” entsprechen, sondern auch mehreren Mustern wie ”<Künstlername> >Albumname>” und/oder ”<Albumname> <Liedtitel>”, ein weiteres erhebliches Datenvolumen erforderlich, und somit besteht ein Problem dahingehend, dass der vorgenannte Index ungeeignet ist, in einer eingebetteten Ausrüstung wie einer Fahrzeug-Navigationsvorrichtung verwendet zu werden.
  • Andererseits ist bei dem vorgenannten Patentdokument 2, da die Indexdaten für jede zugehörige Information vorgesehen sind, eine Suchverarbeitung für jedes der Schlüsselwörter wie ”PORK-BONE-BROTH” und ”NOODLE” erforderlich, und somit besteht das Problem, dass eine Suchverarbeitungszeit hierfür länger wird.
  • Weiterhin müssen, da, wenn die Fuzzy-Suche gleichzeitig verwendet wird, es nicht möglich ist, eindeutig zu bestimmen, welches Wort in der Suchabfrage zu welcher zugehörigen Information gehört, alle Indizes der zugehörigen Informationen für alle Wörter in der Suchabfrage gesucht werden, und somit besteht das Problem, dass die Verarbeitung nicht in einer praktischen Zeit in der eingebetteten Ausrüstung wie der Fahrzeug-Navigationsvorrichtung durchgeführt werden kann.
  • Weiterhin wird bei Verwendung eines vorbestimmten Synonymwörterbuchs und so weiter in einer herkömmlichen Suchvorrichtung ein Verfahren angewendet, das eine Suche durch Erweitern von Wörtern in einer Suchabfrage auf unterschiedliche verwandte Wörter durchführt; jedoch tritt, wenn eine Fuzzy-Suche nach der Erweiterung auf die unterschiedlichen Wörter durchgeführt wird, das Problem auf, dass das Datenvolumen sehr groß wird, ähnlich wie beim Patentdokument 1.
  • Zusätzlich wird, wenn die Fuzzy-Suche für die Erweiterung selbst auf die unterschiedlichen Wörter ermöglicht wird, die Anzahl von Kombinationen hiervon sehr groß, ähnlich wie beim Patentdokument 2, und es tritt das Problem auf, dass die Verarbeitung nicht in einer brauchbaren Zeit durchgeführt werden kann.
  • Die vorliegende Erfindung wurde gemacht, um die vorgenannten Probleme zu lösen, und es ist eine Aufgabe der Erfindung, eine Suchvorrichtung zu schaffen, die eine flexible Fuzzy-Suche unter Verwendung der Beziehung zwischen den korrelierten Schlüsselwörtern durchführen kann, während das Datenvolumen für den Index unterdrückt wird.
  • MITTEL ZUM LÖSEN DER PROBLEME
  • Eine Suchvorrichtung nach der vorliegenden Erfindung enthält: einen Zeichenreihen-Suchindex, in welchem zu suchende Dokumentdaten und Teildaten durch Teilen der Dokumentdaten in vorbestimmte Einheiten registriert sind; einen Relationaldaten-Erweiterungsindex, in welchem eine Beziehung zwischen den jeweiligen Dokumentdaten und ein Typ der Beziehung definiert sind; eine Zeichenreihen-Sucheinheit, die eine Suchabfrage in Teildaten in den vorbestimmten Einheiten teilt und die die Dokumentdaten, die teilweise mit den Teildaten übereinstimmen, aus dem Zeichenreihen-Suchindex erhält, um eine Ähnlichkeit hiervon zu berechnen; und eine Relationaldaten-Erweiterungssucheinheit, die Dokumentdaten eines Erweiterungsbestimmungsziels, das so definiert ist, dass es die Beziehung mit Bezug auf die Erweiterungsquellen-Dokumentdaten hat, aus dem Relationaldaten-Erweiterungsindex erhält durch Verwendung der durch die Zeichenreihen-Sucheinheit als einer Erweiterungsquelle erhaltenen Dokumentdaten, und die die Ähnlichkeit der Dokumentdaten der Erweiterungsquelle durch Verwendung einer Gewichtung gemäß dem Typ der Beziehung und der Ähnlichkeit der Erweiterungsbestimmungsziel-Dokumentdaten korrigiert, und die die Erweiterungsquellen-Dokumentdaten in einer Reihenfolge der korrigierten Ähnlichkeit anordnet und ausgibt.
  • WIRKUNG DER ERFINDUNG
  • Gemäß der vorliegenden Erfindung ist es möglich, wenn der Relationaldaten-Erweiterungsindex, in welchem die Beziehung zwischen den jeweiligen Dokumentdaten und dem Typ der Beziehung definiert sind, vorbereitet ist, getrennt von dem Zeichenreihen-Suchindex zum Durchführen einer Fuzzy-Suche für die Suchabfrage, und die Ähnlichkeit bestimmt wird unter Berücksichtigung der Beziehung zwischen den jeweiligen Dokumentdaten, die teilweise mit der Suchabfrage übereinstimmen, und des Typs hiervon, eine flexible Fuzzy-Suche unter Verwendung einer Beziehung zwischen korrelierten Schlüsselwörtern durchzuführen, während das Datenvolumen des Zeichenreihen-Suchindex unterdrückt wird.
  • KURZBESCHREIBUNG DER ZEICHNUNGEN
  • 1 ist ein Blockschaltbild, das eine Konfiguration einer Suchvorrichtung gemäß dem Ausführungsbeispiel 1 der vorliegenden Erfindung zeigt.
  • 2 ist ein Blockschaltbild, das eine detaillierte Konfiguration einer Indexerzeugungseinheit in der Suchvorrichtung nach dem Ausführungsbeispiel 1 zeigt.
  • 3 ist ein Blockschaltbild, das eine detaillierte Konfiguration einer Sucheinheit in der Suchvorrichtung nach dem Ausführungsbeispiel 1 zeigt.
  • 4 ist eine Tabelle, die ein Beispiel für Registrierungsdaten in dem Ausführungsbeispiel 1 zeigt.
  • 5 ist eine Tabelle, die ein Beispiel für eine Relationaldefinitionsliste im Ausführungsbeispiel 1 zeigt.
  • 6 ist ein Flussdiagramm für die Indexerzeugungsverarbeitung durch die Indexerzeugungseinheit bei dem Ausführungsbeispiel 1.
  • 7 ist eine Tabelle, die ein Konfigurationsbeispiel für einen Zeichenreihen-Suchindex bei dem Ausführungsbeispiel 1 zeigt, wenn eine Wortzeichenreihe als ein Suchschlüssel gegeben wird.
  • 8 ist eine Tabelle, die ein Konfigurationsbeispiel für einen Zeichenreihen-Suchindex bei dem Ausführungsbeispiel 1 zeigt, wenn eine Phonemreihe als der Suchschlüssel gegeben wird.
  • 9 ist eine Tabelle, die ein Konfigurationsbeispiel für einen Zeichenreihen-Suchindex bei dem Ausführungsbeispiel 1 zeigt, wenn eine Teilzeichenreihe als der Suchschlüssel gegeben wird.
  • 10 ist eine Tabelle, die ein Beispiel für einen Relationaldaten-Erweiterungsindex bei dem Ausführungsbeispiel 1 zeigt.
  • 11 ist ein Flussdiagramm für die Suchverarbeitung durch die Sucheinheit bei dem Ausführungsbeispiel 1.
  • 12 ist eine Tabelle, die ein Beispiel für ein Zeichenreihen-Suchergebnis bei dem Ausführungsbeispiel 1 zeigt, wenn eine Suchabfrage ”ZYX quartet's blue sky” (Künstlername, Liedtitel) lautet.
  • 13 ist eine Tabelle, die ein Beispiel für Beziehungsgewichtungsdaten bei dem Ausführungsbeispiel 1 zeigt.
  • 14 ist eine Tabelle, die Schritte des Berechnens einer Relationaldaten-Erweiterungsähnlichkeit bei dem Ausführungsbeispiel 1 illustriert, wobei ein Fall für eine Suchabfrage ”ZYX quartet's blue sky” gezeigt ist.
  • 15 ist eine Tabelle, die ein Beispiel für ein Suchergebnis bei dem Ausführungsbeispiel 1 zeigt, wobei ein Fall für eine Suchabfrage ”ZYX quartet's blue sky” gezeigt wird.
  • 16 ist eine Tabelle, die ein Beispiel für ein Zeichenreihen-Suchergebnis bei dem Ausführungsbeispiel 1 zeigt, wobei ein Fall für eine Suchabfrage ”deep sea in country life” (Albumname, Liedtitel) gezeigt wird.
  • 17 ist eine Tabelle, die Schritte des Berechnens einer Relationaldaten-Erweiterungsähnlichkeit bei dem Ausführungsbeispiel 1 illustriert, wobei ein Fall für eine Suchabfrage ”deep sea in country life” gezeigt wird.
  • 18 ist eine Tabelle, die ein Beispiel für das Suchergebnis bei dem Ausführungsbeispiel 1 zeigt, wobei der Fall für die Suchabfrage ”deep sea in country life” gezeigt wird.
  • 19 ist eine Tabelle, die ein Beispiel für ein Zeichenreihen-Suchergebnis in einer Suchvorrichtung gemäß dem Ausführungsbeispiel 2 der Erfindung zeigt.
  • 20 ist eine Tabelle, die Schritte des Berechnens einer Relationsdaten-Erweiterungsähnlichkeit bei dem Ausführungsbeispiel 2 illustriert, wobei ein Fall der ”Betonung der Beziehung mit dem Künstlernamen” gezeigt wird.
  • 21 ist eine Tabelle, die ein Beispiel für ein Suchergebnis bei dem Ausführungsbeispiel 2 zeigt, wobei ein Fall des Setzens von ”Betonen der Beziehung mit dem Künstlernamen” gezeigt wird.
  • 22 ist eine Tabelle, die ein Beispiel für Beziehungsgewichtungsdaten bei dem Ausführungsbeispiel 2 zeigt, wobei ein Fall des ”Betonens der Beziehung mit dem Albumnamen” gezeigt wird.
  • 23 ist eine Tabelle, die Schritte des Berechnens einer Relationaldaten-Erweiterungsähnlichkeit bei dem Ausführungsbeispiel 2 illustriert, wobei ein Fall des Setzens von ”Betonung der Beziehung mit dem Albumnamen” gezeigt wird.
  • 24 ist eine Tabelle, die ein Beispiel für das Suchergebnis bei dem Ausführungsbeispiel 2 zeigt, wobei ein Fall der ”Betonung der Beziehung mit dem Albumnamen” gezeigt wird.
  • BESTE ART DER AUSFÜHRUNG DER ERFINDUNG
  • Nachfolgend werden, um die vorliegende Erfindung im Einzelnen zu erläutern, Ausführungsbeispiele zum Durchführen der Erfindung mit Bezug auf die begleitenden Zeichnungen beschrieben.
  • Ausführungsbeispiel 1
  • Bei dem vorliegenden Ausführungsbeispiel 1 wird ein Fall beschrieben, in welchem eine in 1 gezeigte Suchvorrichtung in eine Fahrzeug-Navigationsvorrichtung eingebaut und für eine Musiksuche verwendet wird. Jedoch ist die Anwendung der Suchvorrichtung nicht auf die Musiksuche der Fahrzeug-Navigationsvorrichtung beschränkt, und sie ist anwendbar auf allgemeine Suchen von in gegenseitiger Beziehung stehenden strukturellen Daten wie eine Suche nach einem Einrichtungsnamen und eine Adressensuche.
  • In 1 empfängt eine Indexerzeugungseinheit 10 Registrierungsdaten 20 und eine Relationaldefinitionsliste 30, und erzeugt einen Zeichenreihen-Suchindex 40 und einen Relationaldaten-Erweiterungsindex 50.
  • Unter Bezugnahme auf den Zeichenreihen-Suchindex 40 und den Relationaldaten-Erweiterungsindex 50, die von der Indexerzeugungseinheit 10 erzeugt wurden, sucht eine Sucheinheit 60 nach Daten, die mit einer von einem Benutzer eingegebenen Suchabfrage 70 übereinstimmen, und gibt dann ein Suchergebnis 90 aus, das gemäß Beziehungsgewichtungsdaten 80 einzustufen ist.
  • In 2 ist eine detaillierte Konfiguration der Indexerzeugungseinheit 10 gezeigt. Eine Zeichenreihenindex-Erzeugungseinheit 11 erzeugt den Zeichenreihen-Suchindex 40 auf der Grundlage von Dokumentdaten (Titelreihen), die in den Registrierungsdaten 20 enthalten sind. Eine Relationsdaten-Erweiterungsindex-Erzeugungseinheit 12 erzeugt den Relationaldaten-Erweiterungsindex 50 auf der Grundlage einer Relationaldefinitionsliste 30, die eine Beziehung zwischen den jeweiligen Dokumentdaten definiert, und eines Typs der Beziehung.
  • In 3 ist eine detaillierte Konfiguration der Sucheinheit 60 gezeigt. Eine Suchabfrage-Analysiereinheit 61 analysiert die Suchabfrage 70, wandelt sie in Teildaten zum Suchen des Zeichenreihen-Suchindex 40 um und gibt das Ergebnis zu einer Zeichenreihen-Sucheinheit 62 aus. Unter Bezugnahme auf den Zeichenreihen-Suchindex 40 und unter Verwendung der Teildaten als einen Suchschlüssel sucht die Zeichenreihen-Sucheinheit 62 nach den Dokumentdaten, die teilweise mit der Suchabfrage 70 übereinstimmen, berechnet eine Ähnlichkeit zwischen den Teildaten und den Dokumentdaten (Ähnlichkeit in der Zeichenreihe) und gibt das Ergebnis zu einer Relationaldatenerweiterungs-Sucheinheit 63 aus. Die Relationaldatenerweiterungs-Sucheinheit 63 korrigiert die Ähnlichkeit durch Berücksichtigen der Beziehung zwischen den jeweiligen Dokumentdaten durch Bezugnahme auf den Relationaldaten-Erweiterungsindex 50 und auch unter Berücksichtigung des Typs der Beziehung gemäß den Beziehungsgewichtungsdaten 80, und ordnet dann die Dokumentdaten in einer abnehmenden Reihenfolge der korrigierten Ähnlichkeit (Relationaldatenerweiterungs-Ähnlichkeit) an, um hierdurch das Suchergebnis 90 zu erstellen.
  • 4 ist ein Beispiel für die Registrierungsdaten 20. Die Registrierungsdaten 20 enthalten zumindest Daten von ”Dokument-ID (21)”, ”Titel (22)” und ”Datentyp (23)”. Beispielsweise enthält ein Datensatz von ”Dokument-ID (21)” = ”1” Daten von ”Titel (22)” = ”ABC-Rockband” und ”Datentyp (23)” = ”Künstlername”.
  • Es ist zu beachten, dass, da es Musikstücke mit demselben Namen durch verschiedene Künstler (z. B. ”Dokument-ID (21)” = ”102”, ”103”) gibt, ein Liedtitel und ein Albumname dieselben sind (zum Beispiel ”Dokument-ID (21)” = ”10”, ”108”) oder dergleichen, mehrere Datensätze mit demselben ”Titel (22)” existieren.
  • 5 ist ein Beispiel für die Relationaldefinitionsliste 30. Die Relationaldefinitionsliste 30 enthält zumindest Relationaldefinitionsdaten von ”Erweiterungsquellendokument-ID (31)”, ”Erweiterungsbestimmungszieldokument-ID (32)” und ”Beziehungstyp (33)”. Hier sind ”Erweiterungsquellendokument-ID (31)” und ”Erweiterungsbestimmungszieldokument-ID (32)” die Daten entsprechend dem in 4 gezeigten ”Dokument-ID (21)”. ”Beziehungstyp (33)” sind Informationen, die eine Beziehung zwischen den jeweiligen Daten des in 4 gezeigten ”Datentyps (23)” definieren, und in diesem Beispiel ist der Künstlername mit dem Albumnamen assoziiert, der Künstlername ist mit dem Liedtitel assoziiert, und der Albumname ist mit dem Liedtitel assoziiert. Beispielsweise definieren die Relationaldefinitionsdaten in einer ersten Zeile der Relationaldefinitionsliste 30, dass eine Relevanz zwischen dem Künstlernamen ”ABC-Rockband” des ”Dokument-ID (21)” = ”1” und dem Albumnamen ”Wild Country Life” des ”Dokument-ID (21)” = ”10” gibt.
  • Als Nächstes wird eine Arbeitsweise der Suchvorrichtung beschrieben. Zuerst wird die Indexerzeugungsverarbeitung beschrieben, gefolgt durch die Suchverarbeitung.
  • 6 ist ein Flussdiagramm der Indexerzeugungsverarbeitung durch die Indexerzeugungseinheit 10.
  • Schritt ST1 ist ein Registrierungsdaten-Lesevorgang, in welchem die Zeichenreihenindex-Erzeugungseinheit 11 aufeinanderfolgend die Registrierungsdaten 20 liest.
  • Schritt ST2 ist ein Zeichenreihenindex-Erzeugungsvorgang, in welchem die Zeichenreihenindex-Erzeugungseinheit 11 den Zeichenreihen-Suchindex 40 unter Verwendung einer Zeichenreihe von ”Titel (22)” in den eingelesenen Registrierungsdaten 20 erzeugt.
  • Für diesen Zeichenreihen-Suchindex 40 wird eine Verschiedenheit von Konfigurationsverfahren betrachtet in Abhängigkeit von der Robustheit einer Fuzzy(mehrdeutigen)-Suche und Charakteristiken einer Eingabevorrichtung (Tasteneingabe, Spracherkennungseingabe, Zeichenerkennungseingabe und dergleichen). Konfigurationsbeispiele hierfür werden nachfolgend mit Bezug auf 7 bis 9 beschrieben.
  • 7 ist ein Konfigurationsbeispiel für den Zeichenreihen-Suchindex 40, wenn eine Wortzeichenreihe als der Suchschlüssel gegeben wird. Dieser Zeichenreihen-Suchindex 40 besteht aus Daten von ”Wort-ID (42)”, ”Wortzeichenreihe (42)” und ”Dokument-ID-Gruppe (43)”. Beispielsweise hat mit Bezug auf ein Wort von ”Wortzeichenreihe (42)” = ”ABC” der Datensatz von ”Wort-ID (42)” = ”1” eine Gruppe von ”Dokument-ID (21)” enthaltend ”ABC” im in 4 gezeigten ”Titel (22)” als ”Dokument-ID-Gruppe (43)” registriert. Daher ist die Ausbildung derart, dass durch Verwendung der Zeichenreihe von Wort als dem Suchschlüssel die Dokument-IDs sämtlicher Titelreihen enthaltend das entsprechende Wort erhalten werden können.
  • In dem Fall dieses Konfigurationsbeispiels ist es möglich, eine robuste Suche gegen eine Abkürzung/Weglassung von Wörtern und eine Änderung der Wortreihenfolge in der Suchabfrage 70 durchzuführen.
  • Eine Indexdatenstruktur des Zeichenreihen-Suchindex 40 und seines internen Zeichenreihen-Suchalgorithmus sind keine wesentlichen Elemente der vorliegenden Erfindung, und somit wird ihre detaillierte Beschreibung weggelassen. Beispielsweise können, um eine Hochgeschwindigkeitssuche durch eine Wortzeichenreiheneinheit durchzuführen, ein öffentlich bekanntes Hash-Verfahren, binäres Suchverfahren oder dergleichen verwendet werden.
  • Wenn die Suchanfrage 70 stimmlich eingegeben wird, ist, da eine phonologische Ähnlichkeit wichtig wird, eine Konfiguration, die eine Phonemreihe als den Suchschlüssel verwendet, besser.
  • 8 ist ein Konfigurationsbeispiel für den Zeichenreihen-Suchindex 40, wenn die Phonemreihe als der Suchschlüssel gegeben ist. Dieser Zeichenreihen-Suchindex 40 besteht aus Daten von ”Wort-ID (41a)”, ”Phonemreihe (42a)” und ”Dokument-ID-Gruppe (43a)”. Beispielsweise hat mit Bezug auf eine Phonemreihe von ”Phonemreihe (42a)” = ”ei”, der Datensatz von ”Wort-ID (41a)” = ”1” eine Gruppe von ”Dokument-ID (21)” enthaltend ”ei” im in 4 gezeigten ”Titel (22)” als ”Dokument-ID-Gruppe (43a)” registriert.
  • Stattdessen kann, um eine wörtliche Ähnlichkeit zwischen Wörtern zu reflektieren, eine Konfiguration verwendet werden, die eine Teilzeichenreihe als den Suchschlüssel verwendet.
  • 9 ist ein Konfigurationsbeispiel für den Zeichenreihen-Suchindex 40, wenn die Teilzeichenreihe als der Suchschlüssel gegeben wird. Dieser Zeichenreihen-Suchindex 40 besteht aus Daten von ”Wort-ID (41b)”, ”Teilzeichenreihe (42b)” und ”Dokument-ID-Gruppe (43b)”. Beispielsweise hat mit Bezug auf die Teilzeichenreihe von ”Teilzeichenreihe (42b)” = ”AB”, der Datensatz von ”Wort-ID (41b)” = ”1” eine Gruppe von ”Dokument-ID (21)” enthaltend ”AB” im in 4 gezeigten ”Titel (22)” als ”Dokument-ID-Gruppe (43b)” registriert.
  • In dem Fall dieses Konfigurationsbeispiels ist es möglich, eine Fuzzy-Suche durchzuführen, die eine wortgetreue Ähnlichkeit zwischen Wörtern reflektiert.
  • In der Suchvorrichtung gemäß der vorliegenden Erfindung wird, obgleich irgendeiner der Zeichenreihen-Suchindizes 40 verwendet werden kann, im Folgenden eine Beschreibung gegeben unter der Annahme des Falles der Verwendung des Zeichenreihen-Suchindex 40, in welchem die in 7 gezeigte Wortzeichenreihe als der Suchschlüssel gegeben wird.
  • Nachfolgend bestimmt im Schritt ST3 von 6 die Zeichenreihenindex-Erzeugungseinheit 11, ob nicht verarbeitete Daten in den Registrierungsdaten 20 verbleiben oder nicht, und wenn nicht verarbeitete Daten verbleiben (Schritt ST3: ”JA”), werden die Vorgänge in den Schritten ST1 und ST2 wiederholt. Wenn keine nicht verarbeiteten Daten verbleiben (Schritt ST3: ”NEIN”), geht der Fluss zum Schritt ST4 weiter, und der von der Zeichenreihenindex-Erzeugungseinheit 11 vorbereitete Zeichenreihen-Suchindex 40 wird in einer Form ausgegeben, auf die in der später beschriebenen Suchverarbeitung Bezug genommen werden kann.
  • Schritt ST5 ist ein Relationaldefinitionslisten-Lesevorgang, und die Relationaldaten-Erweiterungsindex-Erzeugungseinheit 12 liest aufeinanderfolgend die Relationaldefinitionsliste 30.
  • Schritt ST6 ist ein Relationaldaten-Erweiterungsindex-Erzeugungsvorgang, und die Relationaldaten-Erweiterungsindex-Erzeugungseinheit 12 erzeugt den Relationaldaten-Erweiterungsindex 50 anhand der eingelesenen Relationaldefinitionsliste 30.
  • 10 ist ein Beispiel für den Relationaldaten-Erweiterungsindex 50. Dieser Relationaldaten-Erweiterungsindex 50 ist so konfiguriert, dass die entsprechenden ”Erweiterungsbestimmungszieldokument-ID (52” und ”Beziehungstyp (53)” unter Verwendung von ”Erweiterungsquellendokument-ID (52)” als dem Suchschlüssel erhalten (abgerufen) werden können.
  • Eine Indexdatenstruktur des Relationaldaten-Erweiterungsindex 50 und sein externer Suchalgorithmus sind keine wesentlichen Elemente der vorliegenden Erfindung, und daher wird deren detaillierte Beschreibung weggelassen. Beispielsweise wird durch Verwendung des öffentlich bekannten Hash-Verfahrens in Betracht gezogen, dass die Relationaldefinitionsdaten mit hoher Geschwindigkeit unter Verwendung von ”Erweiterungsquellendokument-ID (51)” als einem Hash-Schlüssel erhältlich sind.
  • Nachfolgend bestimmt im Schritt ST7 von 6 die Relationaldaten-Erweiterungsindex-Erzeugungseinheit 12, ob nicht verarbeitete Daten in der Relationaldefinitionsliste 30 verbleiben oder nicht, und wenn nicht verarbeitete Daten verbleiben (Schritt ST7: ”JA”), werden die Vorgänge der Schritt ST5 und ST6 wiederholt. Wenn keine nichtverarbeiteten Daten verbleiben (Schritt ST7: ”NEIN”), geht der Fluss zum Schritt ST8 weiter, und der von der Relationaldaten-Erweiterungsindex-Erzeugungseinheit 12 vorbereitete Relationaldaten-Erweiterungsindex 50 wird in einer Form ausgegeben, auf die in der später beschriebenen Suchverarbeitung Bezug genommen werden kann.
  • Das Vorstehende ist die Indexerzeugungsverarbeitung. Aufeinanderfolgend wird die Suchverarbeitung nachfolgend beschrieben.
  • 11 ist ein Flussdiagramm der Suchverarbeitung durch die Sucheinheit 60.
  • (1) Suchverarbeitungsbeispiel 1
  • In diesem Beispiel wird ein Fall beschrieben, in welchem ein Muster der Suchabfrage von ”<Künstlername> <Liedtitel>” verarbeitet wird, und es wird angenommen, dass ”ZYX quartet's blue sky” als die Suchabfrage 70 eingegeben wird, und dass ”Liedtitel” als ein Suchziel bezeichnet wird.
  • Schritt ST11 ist ein Analysiervorgang der Suchabfrage, und die Suchfrage-Analysiereinheit 61 analysiert eine Zeichenreihe der Suchabfrage 70 und teilt sie in Worteinheiten. Bei diesem Beispiel wird eine Suchanfrage-Zeichenreihe ”ZYX quartet's blue sky” in die Worteinheiten geteilt, um vier Wörter (”ZYX”, ”quartet's”, ”blue” and ”sky” zu erhalten. Diese Wörter werden als ein Suchabfrage-Analyseergebnis zu der Zeichenreihen-Sucheinheit 62 ausgegeben.
  • Schritt ST12 ist ein Suchvorgang für den Zeichenreihenindex, und die Zeichenreihen-Sucheinheit 62 erhält ein Suchergebnis entsprechend dem Suchanfrage-Analyseergebnis durch Bezugnahme auf den Zeichenreihen-Suchindex 40. Wenn der Zeichenreihen-Suchindex 40 eine in 7 gezeigten Konfiguration hat, werden jeweils ”Dokument-ID-Gruppe (43)” von ”Wort-ID (41)” = ”25”, ”6” und ”20” entsprechend drei Wörtern ”ZYX”, ”blue” bzw. ”sky” erhalten.
  • Andererseits wird eine Wortzeichenreihe entsprechend ”quartet's” nicht in dem Zeichenreihen-Suchindex 40 gefunden, so dass keine ”Dokument-ID-Gruppe (43)” hiervon existiert.
  • Dann fügt die Zeichenreihen-Sucheinheit 62 eine Zeichenreihenähnlichkeit zu jedem Dokument-ID, das in der erhaltenen ”Dokument-ID-Gruppe (43)” enthalten ist, hinzu und gibt das Ergebnis als ein Zeichenreihen-Suchergebnis zu der Relationaldaten-Erweiterungs-Sucheinheit 63 aus.
  • Wenn die Zeichenreihenähnlichkeit zu dieser hinzugefügt ist, ist es auch möglich, eine tf·idf-Gewichtung (Ausdruckfrequenz-Inverse-Dokumentfrequenz-Gewichtung) oder dergleichen zu verwenden, um die Wichtigkeit von Wörtern zu berücksichtigen; jedoch wird aus Gründen der Vereinfachung der Beschreibung diese unter der Annahme gegeben, dass alle Wörter in gleicher Weise eine Gewichtung von ”1” haben.
  • 12 ist ein Beispiel für ein Zeichenreihen-Suchergebnis, das eine Beziehung zwischen Dokument-IDs und Zeichenreihenähnlichkeiten zeigt, und ist ein Ergebnis mit Bezug auf eine Suchabfrage-Zeichenreihe ”ZYX quartet's blue sky”. Wenn die Gewichtung von ”1” für das Wort vorgesehen ist, führt ”clear blue sky” von ”Dokument-ID” = ”102” beispielsweise zu dem Ergebnis ”Zeichenreihenähnlichkeit” = ”2”, da es zwei Wörter ”blue” und ”sky” enthält.
  • Andererseits führt ”ZYX quartet” von ”Dokument-ID” = ”2” zu dem Ergebnis ”Zeichenreihenähnlichkeit” = ”1”, da es ein Wort ”ZYX” enthält. Da bei dem vorliegenden Ausführungsbeispiel 1 die Beschreibung für das Beispiel der Verwendung des Zeichenreihen-Suchindex 40 gegeben wird, in welchem die Wortzeichenreihe, wie in 7 gezeigt, als der Suchschlüssel verwendet wird, und somit ”quartet's” in der Suchabfrage 70 und ”quartet” von ”Wortzeichenreihe (42)” als nicht miteinander übereinstimmend bestimmt werden, wird eine Zeichenreihenähnlichkeit entsprechend dieser Nichtübereinstimmung nicht hinzugefügt.
  • Demgegenüber wird in dem Fall der Verwendung des Zeichenreihen-Suchindex 40 wie in 9 gezeigt, in welchem eine Teilzeichenreihe als der Suchschlüssel gegeben wird, da ein Wort ”quartet”, das in einem Titel ”ZYX quartet” von ”Dokument-ID” = ”2” enthalten ist, und ”quartet's” in der Suchabfrage 70 in hohem Maße ähnlich in der Zeichenreihe miteinander sind, jede ”Dokument-ID-Gruppe (43b)” von ”Teilzeichenreihe (42b)” entsprechend ”quartet's” erhalten, und als eine Folge wird ”Zeichenreihenähnlichkeit” von ”Dokument-ID” = ”2” höher als ein in 12 gezeigter Wert, so dass geeignetere Suchergebnisse erhalten werden.
  • Wenn ein Spracherkennungsergebnis als die Suchabfrage 70 gegeben wird, durch Verwendung des Zeichenreihen-Suchindex 40 wie in 8 gezeigt, in welchem jede Phonemreihe als der Suchschlüssel gegeben wird, wird ein Suchergebnis, das gegenüber einem Erkennungsfehler robust ist, erhalten. Selbst wenn beispielsweise das Wort ”ZYX” fehlerhaft als ”Z why X” spracherkannt wird, sind ”ZYX” und ”Z why X” als die Phonemreihe ähnlich miteinander; somit wird ”Dokument-ID-Gruppe (43a)”, das ähnlich zu darin enthaltenen Dokument-IDs ist, erhalten, so dass ein geeignetes Suchergebnis erhalten wird.
  • Schritt ST13 von 11 ist ein Relationaldaten-Erweiterungsindex-Suchvorgang, und durch Verwendung von ”Dokument-ID” (12) in dem Zeichenreihen-Suchergebnis als dem Suchschlüssel bezieht sich die Relationaldatenerweiterungs-Sucheinheit 63 auf den in 10 gezeigten Relationaldaten-Erweiterungsindex 50, um hierdurch ”Erweiterungsbestimmungsziel-ID (52)” und ”Beziehungstyp (53)” zu erhalten. Auch bezieht sich durch Verwendung des erhaltenen ”Beziehungstyp (53)” als Suchschlüssel die Relationaldatenerweiterungs-Sucheinheit 63 auf die Beziehungsgewichtungsdaten 80, erhält eine Beziehungsgewichtung gemäß dem Beziehungstyp und berechnet eine Relationaldatenerweiterungs-Ähnlichkeit.
  • 13 ist ein Beispiel für die Beziehungsgewichtungsdaten 80. Die Beziehungsgewichtungsdaten 80 definieren ”Beziehungsgewicht (82)” mit Bezug auf ”Beziehungstyp (81)”.
  • 14 ist eine Tabelle, die Schritte des Berechnens der Relationaldatenerweiterungs-Ähnlichkeit auf der Grundlage des in 12 gezeigten Zeichenreihen-Suchergebnisses.
  • Durch Verwendung des in 12 gezeigten ”Dokument-ID” = ”2” als dem Suchschlüssel erhält die Relationaldatenerweiterungsziel-Sucheinheit 63 aus dem in 10 gezeigten Relationaldaten-Erweiterungsindex 50 die folgenden drei Relationaldatenstücke: ”Erweiterungsbestimmungsdokument-ID (52)” = ”30” und ”Beziehungstyp (53)” = ”Künstlername → Albumname”; ”Erweiterungsbestimmungszieldokument-ID (52)” = ”103” und ”Beziehungstyp (53)” = ”Künstlername → Liedtitel”; und ”Erweiterungsbestimmungszieldokument-ID (52)” = ”110” und ”Beziehungstyp (53)” = ”Künstlername → Liedtitel”.
  • Von diesen sind die beiden ”Erweiterungsbestimmungszieldokument-IDs (52)” = ”30” und ”110” in ”Dokument-ID” in dem in 12 gezeigten Zeichenreihen-Suchergebnis nicht vorhanden, und somit wird die Berechnung hierfür durch Setzen der ”Zeichenreihenähnlichkeit” auf ”0” durchgeführt, wie in 14 gezeigt ist. Demgegenüber wird die Berechnung für ”Erweiterungsbestimmungszieldokument-ID (52)” = ”103” durchgeführt durch Verwendung von ”Zeichenreihenähnlichkeit” = ”2”, wie in 12 gezeigt ist.
  • Zusätzlich erhält die Relationaldatenerweiterungs-Sucheinheit 63 aus den in 13 gezeigten Beziehungsgewichtungsdaten 80 jede Beziehungsgewichtung, die mit Bezug auf ”Beziehungstyp (53)” von jeweiligen Relationsdaten definiert ist. ”Beziehungsgewichtung (82)” = ”0,3” ist für ”Erweiterungsbestimmungszieldokument-ID (52)” = ”30” gegeben mit dem Beziehungstyp von ”Künstlername → Albumname”.
  • Weiterhin fügt die Relationaldatenerweiterungs-Sucheinheit 63 einen Wert, der ”Zeichenreihenähnlichkeit” von ”Erweiterungsquellendokument-ID (51)” mit ”Beziehungsgewichtung (82)” multipliziert, zu ”Zeichenreihenähnlichkeit” von ”Erweiterungsbestimmungszieldokument-ID (52)” hinzu, um hierdurch ”Relationaldatenerweiterungs-Ähnlichkeit” zu bestimmen. Beispielsweise wird unter Betrachtung von Relationaldaten von ”Dokument-ID = ”103”, wie in einer fünften Zeile von 14 gezeigt ist, ”Relationaldatenerweiterungs-Ähnlichkeit” = 2,2 hierzu gegeben, da ”Zeichenreihenähnlichkeit” = ”1” zu ”Erweiterungsquellendokument-ID (51)” = ”2” gegeben wird; ”Beziehungsgewichtung (82)” = ”0,2” zu ”Künstlername → Liedtitel” gegeben wird; und ”Zeichenreihenähnlichkeit” = ”2” zu ”Erweiterungsbestimmungszieldokument-ID (52)” = ”103” gegeben wird. Auch wird unter Betrachtung von Relationaldaten von ”Dokument-IDs” = ”30” und ”110” eine ähnliche Berechnung durchgeführt, um hierdurch ”Relationaldatenerweiterungs-Ähnlichkeiten” = 0,3 und 0,2 zu erhalten.
  • Schritt ST14 in 11 ist ein Suchergebnis-Ausgabevorgang, und die Relationaldatenerweiterungs-Sucheinheit 83 ordnet die Berechnungsergebnisse der in 14 gezeigten Relationaldatenerweiterungs-Ähnlichkeit in der Reihenfolge von ”Relationaldatenerweiterungs-Ähnlichkeiten” an und gibt dann als das Suchergebnis 90 das in einer nur auf ”Liedtitel”, die als ein Suchziel bezeichnet sind, begrenzte Ergebnis aus. 15 ist ein Beispiel für das Suchergebnis 90.
  • Es ist festzustellen, dass als ein Verfahren zum Begrenzen auf die Typen der ”Liedtitel” und so weiter, die als das Suchziel bezeichnet sind, das Folgende veranschaulicht wird: die Registrierungsdaten 20 (die in 4 gezeigten Inhalte) wurden in einer Speichervorrichtung in der Suchvorrichtung gespeichert, und die Relationaldatenerweiterungs-Sucheinheit 63 bezieht sich auf diese Registrierungsdaten 20, um hierdurch nur das ”Dokument-ID (21)” auszuwählen, dessen ”Datentyp (23)” der ”Liedtitel” wird.
  • Wie vorstehend beschrieben ist, kann auf der Grundlage der Relationaldefinitionsliste 30, die vorher erhalten wurde, und der Beziehungsgewichtungsdaten 80 die Sucheinheit 60 die Suche und die Einstufung durchführen unter Berücksichtigung einer Beziehung zwischen den jeweiligen Suchzieldaten, beispielsweise zwischen einem Künstlernamen und einem Liedtitel bei einer Musiksuche, während die Fuzzy-Suche für die Zeichenreihe der Suchabfrage 70 durchgeführt wird.
  • In dem vorbeschriebenen Beispiel ist es möglich, mit Bezug auf denselben Liedtitel ”clear blue sky” durch die Künstler der ”ABC Rockband” und des ”ZYX-Quartetts”, da das Wort ”ZYX”, das ein Teil des Künstlernamens ist, in der Suchabfrage 70 enthalten ist, das Musikstück ”clear blue sky” durch den Künstler ”ZYX-Quartett” als höher eingestuft auszugeben, wie in 15 gezeigt ist.
  • (2) Suchverarbeitungsbeispiel 2
  • In dem vorstehenden Beispiel wird der Fall beschrieben, in welchem die Suchverarbeitung mit dem Muster der Suchabfrage ”<Künstlername> <Liedtitel>” durchgeführt wird; jedoch kann die Suchvorrichtung nach dem vorliegenden Ausführungsbeispiel eine Suchverarbeitung mit einer Suchabfrage, die ein anderes Muster hat, ohne Änderung der Konfiguration der Indizes durchführen.
  • Im Folgenden wird ein Fall beschrieben, in welchem ein Muster einer Suchabfrage ”<Albumname> <Liedtitel>” verarbeitet wird. In diesem Fall wird angenommen, dass ”deep sea in country life” als die Suchabfrage 70 eingegeben wird und ”Liedtitel” als ein Suchziel bezeichnet wird.
  • Weiterhin verwendet, selbst wenn die Suchabfrage dieses Musters verarbeitet wird, die Sucheinheit 60 den Zeichenreihen-Suchindex 40 und den Relationaldaten-Erweiterungsindex 50, die von der Indexerzeugungseinheit 10 auf der Grundlage der vorhergehenden Registrierungsdaten 20 und der Relationaldefinitionsliste 30 erzeugt sind.
  • Im Schritt ST11 von 11 analysiert die Suchabfrage-Analysiereinheit 61 die Zeichenreihe ”deep sea in country life” der Suchabfrage 70, teilt sie in Worteinheiten und gibt fünf Wörter ”deep”, ”sea”, ”in”, ”country” und ”life” aus.
  • Im Schritt ST12 erhält die Zeichenreihen-Sucheinheit 62 ”Dokument-ID-Gruppe (43)” entsprechend jedem Wort in dem Suchabfrage-Analyseergebnis durch Bezugnahme auf den Zeichenreihen-Suchindex 40. Wenn der Zeichenreihen-Suchindex 40, in welchem jede Wortzeichenreihe als der in 7 gezeigte Suchschlüssel gegeben ist, verwendet wird, wird jede ”Dokument-ID-Gruppe (43)” von ”Wort-ID (41” = ”11”, ”19”, ”10” und ”13” entsprechend den vier Wörtern ”deep”, ”sea”, ”country” bzw. ”life” erhalten. Andererseits wird die Wortzeichenreihe entsprechend ”in” in dem Zeichenreihen-Suchindex 40 nicht gefunden, so dass keine ”Dokument-ID-Gruppe (43)” hiervon existiert.
  • Dann fügt die Zeichenreihen-Sucheinheit 62 eine Zeichenreihenähnlichkeit zu jedem Dokument-ID in den erhaltenen ”Dokument-ID-Gruppen (43)” hinzu, das heißt, in ”Dokument-ID-Gruppe (43)” → ”105, 106” entsprechend ”deep”, in ”Dokument-ID-Gruppe (43)” = ”105, 106” entsprechend ”sea”, in ”Dokument-ID-Gruppe (43)” = ”10, 108” entsprechend ”country”, und in ”Dokument-ID-Gruppe (43)” = ”10, 108” entsprechend ”life”.
  • Mit Bezug auf die Suchabfrage-Zeichenreihe ”deep sea in country life” wird ein in 16 gezeigtes Zeichenreihen-Suchergebnis erhalten. In diesem Fall werden, wenn die Zeichenreihenähnlichkeit zu dieser hinzugefügt wird, alle Wörter so gesetzt, dass sie in gleichem Maße eine Gewichtung ”1” haben.
  • Im Schritt ST13 bezieht sich die Relationaldatenerweiterungs-Sucheinheit 63, unter Verwendung jedes ”Dokument-ID” (16) in dem Zeichenreihen-Suchergebnis als dem Suchschlüssel, auf den in 10 gezeigten Relationaldaten-Erweiterungsindex 50, um hierdurch ”Erweiterungsbestimmungsziel-ID (52)” und ”Beziehungstyp (53)” zu erhalten, und sie bezieht sich auch, unter Verwendung dieses ”Beziehungstyps (53)” als den Suchschlüssel, auf die in 13 gezeigten Beziehungsgewichtungsdaten 80, um hierdurch ”Beziehungsgewichtung (82)” zu erhalten, und berechnet dann die Relationaldatenerweiterungs-Ähnlichkeit unter Verwendung von diesen.
  • 17 ist eine Tabelle, die Schritte des Berechnens der Relationaldatenerweiterungs-Ähnlichkeit mit Bezug auf die Suchabfrage-Zeichenreihe ”deep sea in country life” auf der Grundlage des in 16 gezeigten Zeichenreihen-Suchergebnisses illustriert.
  • Durch Verwendung des in 16 gezeigten ”Dokument-ID” = ”10” als den Suchschlüssel erhält die Relationaldatenerweiterungs-Sucheinheit 63 aus dem in 10 gezeigten Relationaldaten-Erweiterungsindex 50 Relationaldaten ”Erweiterungsbestimmungszieldokument-ID (52)” = ”106” und ”Beziehungstyp (53)” = ”Albumname → Liedtitel”. Weiterhin erhält die Relationaldatenerweiterungs-Sucheinheit 63 aus den in 13 gezeigten Beziehungsgewichtungsdaten 80 ”Beziehungsgewichtung (82)” = ”0,1”, definiert für ”Beziehungstyp (53)” der Relationaldaten. Dann fügt die Relationaldatenerweiterungs-Sucheinheit 63 einen Wert, der ”Zeichenreihenähnlichkeit” = ”2” mit ”Beziehungsgewichtung (82)” = ”0,1” multipliziert, zu ”Zeichenreihenähnlichkeit” = ”2” von ”Erweiterungsbestimmungszieldokument-ID (52)” hinzu, um hierdurch ”Relationaldatenerweiterungs-Ähnlichkeit” = 2,2 zu erhalten.
  • Im Schritt ST14 ordnet die Relationaldatenerweiterungs-Sucheinheit 63 das Berechnungsergebnis der in 17 gezeigten Relationaldatenerweiterungs-Ähnlichkeiten in einer Reihenfolge von ”Relationaldatenerweiterungs-Ähnlichkeiten” an, um hierdurch auf nur die als ein Suchziel bezeichneten ”Liedtitel” beschränkt zu sein, und gibt dann das Ergebnis als ein in 18 gezeigtes Suchergebnis 90 aus.
  • Wie vorstehend beschrieben ist, wird es auf der Grundlage der Relationaldefinitionsliste 30, die vorher erhalten wird, und der Beziehungsgewichtungsdaten 80 möglich, dass die Sucheinheit 60 die Suche und die Einstufung durchführt unter Berücksichtigung der Beziehung zwischen den jeweiligen Suchzieldaten, beispielsweise zwischen einem Albumnamen und einem Liedtitel in der Musiksuche, während die Fuzzy-Suche für die Zeichenreihe der Suchabfrage 70 durchgeführt wird.
  • Bei dem vorstehenden Beispiel ist es mit Bezug auf denselben Liedtitel ”deep blue sea” in den Alben ”wild country life” und ”cold mountain”, da das Wort ”contry life”, das ein Teil des Album namens ist, in der Suchabfrage 70 enthalten ist, möglich, das Musikstück ”deep blue sea” in dem Album ”wild country life” mit einem höheren Rang auszugeben.
  • Weiterhin ist es möglich, sowohl das Muster der Suchabfrage ”<Künstlername> <Liedtitel>” als auch das Muster der Suchabfrage ”<Albumname> <Liedtitel>” zu handhaben, ohne jede Konfiguration des Zeichenreihen-Suchindex 40 und des Relationaldaten-Erweiterungsindex 50 zu ändern. Dies ergibt einen solchen Vorteil, dass es für verschiedene Muster der Suchabfrage unnötig ist, individuelle Zeichenreihen-Suchindizes 40 entsprechend den Mustern zu erzeugen, so dass das Datenvolumen verringert werden kann.
  • Gemäß dem Vorstehenden enthält die Suchvorrichtung nach dem Ausführungsbeispiel 1: den Zeichenreihen-Suchindex 40, in welchem die zu suchenden Registrierungsdaten 20 und durch Teilen der Registrierungsdaten 20 in die Worteinheiten erhaltenen Wortzeichenreihen registriert sind; den Relationaldaten-Erweiterungsindex 50, in welchem die Beziehung zwischen den jeweiligen Registrierungsdaten 20 und dem Typ der Beziehung definiert ist; die Suchabfrage-Analysiereinheit 61, die die Suchabfrage 70 in die Worteinheiten teilt; die Zeichenreihen-Sucheinheit 62, die die Registrierungsdaten 20 enthaltend eine Wortzeichenreihe, die teilweise mit den geteilten Wörtern übereinstimmt, aus dem Zeichenreihen-Suchindex 40 erhält und die die Zeichenreihenähnlichkeit berechnet; und die Relationaldatenerweiterungs-Sucheinheit 63, die die von der Zeichenreihen-Sucheinheit 62 erhaltenen Registrierungsdaten 20 als die Erweiterungsquellendokumentdaten verwendet, und die die Erweiterungsbestimmungszieldokumentdaten, die so definiert sind, dass sie die Beziehung mit Bezug auf die Erweiterungsquellendokumentdaten haben, aus dem Relationaldaten-Erweiterungsindex 50 erhält, und die die Zeichenreihenähnlichkeit der Erweiterungsquellendokumentdaten unter Verwendung einer Beziehungsgewichtung gemäß dem Typ der Beziehung, der in den Beziehungsgewichtungsdaten 80 gesetzt ist, und der Zeichenreihenähnlichkeit der Erweiterungsbestimmungszieldokumentdaten korrigiert, um hierdurch die Relationaldatenerweiterungs-Ähnlichkeit zu berechnen, und die das Suchergebnis 90, das die Erweiterungsquellendokumentdaten in der Reihenfolge der Relationaldatenerweiterungs-Ähnlichkeit anordnet, ausgibt. Daher wird es möglich, die Ähnlichkeit unter Berücksichtigung der Beziehung zwischen den jeweiligen Dokumentdaten, die teilweise mit der Suchabfrage 70 übereinstimmen, und des Typs von dieser durch Verwendung des Relationaldaten-Erweiterungsindex 50 zu bestimmen, so dass die flexible Fuzzy-Suche unter Verwendung der Beziehung zwischen den korrelierten Schlüsselwörtern durchgeführt werden kann. Weiterhin ist es, da der Relationaldaten-Erweiterungsindex 50 getrennt von dem Zeichenreihen-Suchindex 40 vorgesehen ist, nicht erforderlich, individuelle Zeichenreihen-Suchindizes 40 entsprechend den jeweiligen Mustern der Suchabfrage 70 zu erzeugen, wodurch das Datenvolumen unterdrückt wird.
  • Weiterhin ist es möglich, wenn der Zeichenreihen-Suchindex 40, der durch die Wortzeichenreihen 42 konfiguriert ist, wobei die zu suchenden Registrierungsdaten 20 in die Worteinheiten geteilt sind, verwendet wird, die robuste Suche gegenüber der Abkürzung/Weglassung des Worts und die Änderung der Wortreihenfolge durchzuführen.
  • Gemäß dem Ausführungsbeispiel 1 kann die Suchvorrichtung auch den Zeichenreihen, Suchindex 40 verwenden, der durch die Teilzeichenreihen 42b konfiguriert ist, wobei die zu suchenden Registrierungsdaten 20 in Einheiten einer beliebigen Anzahl von Zeichenreihen geteilt sind; in diesem Fall wird es möglich, eine Fuzzy-Suche durchzuführen, die eine wörtliche Ähnlichkeit von Wörtern reflektiert.
  • Weiterhin kann gemäß dem Ausführungsbeispiel 1 die Suchvorrichtung auch den Zeichenreihen-Suchindex 40 verwenden, der durch die Phonemreihen 42a konfiguriert ist, wobei die zu suchenden Registrierungsdaten 20 in Einheiten einer beliebigen Anzahl von Phonemreihen geteilt sind; in diesem Fall wird es möglich, eine Fuzzy-Suche durchzuführen, die eine phonologische Ähnlichkeit reflektiert. Somit ist es möglich, eine robuste Suche gegen einen Spracherkennungsfehler durchzuführen.
  • Weiterhin enthält die Suchvorrichtung gemäß dem Ausführungsbeispiel 1: die Zeichenreihenindex-Erzeugungseinheit 11, die den Zeichenreihen-Suchindex 40 erzeugt durch Teilen der zu suchenden Registrierungsdaten 20 in vorbestimmte Einheiten wie die Worteinheiten; und die Relationaldaten-Erweiterungsindex-Erzeugungseinheit 12, die den Relationaldaten-Erweiterungsindex 50 auf der Grundlage der Relationaldefinitionsliste 30, in der die Beziehung zwischen den jeweiligen Registrierungsdaten 20 und der Typ der Beziehung definiert sind, erzeugt. Aus diesem Grund ist es unnötig, individuelle Zeichenreihen-Suchindizes 40 entsprechend den jeweiligen Mustern der Suchabfrage 70 zu erzeugen, so dass das Datenvolumen unterdrückt werden kann.
  • Ausführungsbeispiel 2
  • Eine Suchvorrichtung nach dem vorliegenden Ausführungsbeispiel 2 hat eine Konfiguration in der Zeichnung ähnlich der der in 1 bis 3 gezeigten Suchvorrichtung, und verwendet ohne Änderung der Registrierungsdaten 20, der Relationaldefinitionsliste 30, des Zeichenreihen-Suchindex 40 und des Relationaldaten-Erweiterungsindex 50; somit wird nachstehend eine Beschreibung unter Bezugnahme auf 1 bis 11 und 13 gegeben.
  • Wenn eine Suche durch Änderung des Werts der Beziehungsgewichtungsdaten 80 durchgeführt wird, berechnet eine Sucheinheit 60 bei dem vorliegenden Ausführungsbeispiel 2 eine Relationaldatenerweiterungs-Ähnlichkeit gemäß einer Situation bei der Suche.
  • Im Folgenden wird angenommen, dass ”bad brothers wild wind” als eine Suchabfrage 70 eingegeben wird, und dass ”Liedtitel” als ein Suchziel bezeichnet wird. Dann wird mit Bezug auf diesen Umstand ein Fall beschrieben, in welchem eine Suche mit Beziehungsgewichtungsdaten ”Betonung der Beziehung mit Künstlername” durchgeführt wird, und ein Fall, in welchem eine Suche mit Beziehungsgewichtungsdaten ”Betonung der Beziehung mit Albumnamen” durchgeführt wird.
  • (1) Suchverarbeitungsbeispiel 1
  • Zuerst wird der Fall beschrieben, in welchem die Suche mit den Beziehungsgewichtungsdaten ”Betonung der Beziehung mit Künstlername” durchgeführt wird.
  • Im Schritt ST11 von 11 analysiert eine Suchabfrage-Analysiereinheit 61 die Zeichenreihe bad brothers wild wind” der Suchabfrage 70, teilt sie in Worteinheiten und gibt vier Wörter ”bad”, ”brothers”, ”wild” und ”wind” aus.
  • Im Schritt ST12 erhält eine Zeichenreihen-Sucheinheit 62 ”Dokument-ID-Gruppe (43)” entsprechend jedem Wort in einem Suchabfrage-Analyseergebnis durch Bezugnahme auf den Zeichenreihen-Suchindex 40. Wenn der Zeichenreihen-Suchindex 40, in welchem eine Wortzeichenreihe wie in 7 gezeigt als ein Suchschlüssel gegeben wird, verwendet wird, wird jede ”Dokument-ID-Gruppe (43)” von ”Wort-ID (41)” = ”2”, ”7”, ”23” und ”24” entsprechend den vier Wörtern ”bad”, ”brothers”, ”wild” beziehungsweise ”wind” erhalten.
  • Dann fügt die Zeichenreihen-Sucheinheit 62 eine Zeichenreihenähnlichkeit zu jedem Dokument-ID in ”Dokument-ID-Gruppe (43)2 = ”3, 30” entsprechend ”bad”, in ”Dokument-ID-Gruppe (43)” = ”30, 30” entsprechend ”brothers”, in ”Dokument-ID-Gruppe (43)” = ”10, 108, 110, 111” entsprechend ”wild”, und in ”Dokument-ID-Gruppe (43)” = ”110, 111” entsprechend ”wind” hinzu.
  • Mit Bezug auf die Suchabfrage-Zeichenreihe ”bad brothers wild wind” wird ein in 19 gezeigtes Zeichenreihen-Suchergebnis erhalten. Wenn die Zeichenreihenähnlichkeit diesem hinzugefügt wird, werden alle Wörter so gesetzt, dass sie gleichmäßig eine Gewichtung ”1” ähnlich wie bei dem vorstehenden Ausführungsbeispiel 1 haben.
  • Im Schritt ST13 berechnet eine Relationaldatenerweiterungs-Sucheinheit 63 unter Verwendung der Beziehungsgewichtungsdaten 80 eine Relationaldatenerweiterungs-Ähnlichkeit des Zeichenreihen-Suchergebnisses.
  • Hier ist gemäß den in 13 gezeigten Beziehungsgewichtungsdaten 80 ”Beziehungsgewichtung (82)” = ”0,2” für ”Künstlername Liedtitel” auf einen größeren Wert gesetzt als ”Beziehungsgewichtung (82)” = ”0,1” für ”Albumname → Liedtitel”, so dass ein Setzen von ”Betonung von Beziehung mit Künstlername” erhalten wird.
  • Demgemäß bezieht sich in diesem Beispiel die Relationaldatenerweiterungs-Sucheinheit 63 unter Verwendung von ”Dokument-ID” (19) in dem Zeichenreihen-Suchergebnis als dem Suchschlüssel auf den in 10 gezeigten Relationaldaten-Erweiterungsindex 50, um hierdurch ”Erweiterungsbestimmungsziel-ID (52)” und ”Beziehungstyp (53)” zu erhalten, und sie bezieht auch unter Verwendung dieses ”Beziehungstyps (53” als dem Suchschlüssel auf die in 13 gezeigten Beziehungsgewichtungsdaten 80, um hierdurch ”Beziehungsgewichtung (82)” zu erhalten, und berechnet dann die Relationaldatenerweiterungs-Ähnlichkeit unter Verwendung von diesen.
  • 20 ist eine Tabelle, die Schritte des Berechnens der Relationaldatenerweiterungs-Ähnlichkeit mit Bezug auf die Suchabfrage-Zeichenreihe ”bad brothers wild wind” auf der Grundlage des in 19 gezeigten Zeichenreihen-Suchergebnisses illustriert, wobei ein Fall von ”Betonung der Beziehung mit Künstlername” gezeigt wird.
  • In diesem Beispiel werden die folgenden Dokument-IDs erhalten: spezifisch vier Relationaldatenstücke ”Erweiterungsquellen-ID (51)” = ”3” (”Dokument-ID” = ”20”, ”104”, ”105”, ”111”); zwei Relationaldatenstücke ”Erweiterungsquellen-ID (51)” = ”30” (”Dokument-ID” = ”108”, ”110”); und ein Relationaldatenstück ”Erweiterungsquellen-ID (51)” = ”10” (”Dokument-ID” = ”106”). Von diesen fehlen die jeweiligen Relationaldatenstücke ”Dokument-ID” = ”20”, ”104”, ”105”, ”106” in dem Zeichenreihen-Suchergebnis, so dass die Berechnung durch Setzen von ”Zeichenreihenähnlichkeit” auf null durchgeführt wird.
  • Ähnlich wie bei dem vorstehenden Ausführungsbeispiel 1 fügt die Relationaldatenerweiterungs-Sucheinheit 63 mit Bezug auf die Relationaldaten einen Wert, der ”Zeichenreihenähnlichkeit” von ”Erweiterungsquellendokument-ID (51)” mit ”Beziehungsgewichtung (82)”, die in den Beziehungsgewichtungsdaten 80 definiert ist, multipliziert, zu ”Zeichenreihenähnlichkeit” von ”Erweiterungsbestimmungszieldokument-ID (52)” hinzu, um hierdurch die Relationaldatenerweiterungs-Ähnlichkeit zu bestimmen.
  • Im Schritt ST14 ordnet die Relationaldatenerweiterungs-Sucheinheit 63 das in 20 gezeigte Berechnungsergebnis der Relationaldatenerweiterungs-Ähnlichkeit in der Reihenfolge von ”Relationaldatenerweiterungs-Ähnlichkeit” an, um somit auf nur einen als ein Suchziel bezeichneten ”Liedtitel” beschränkt zu sein, und gibt das Ergebnis als ein in 21 gezeigtes Suchergebnis 90 aus.
  • (2) Suchverarbeitungsbeispiel 2
  • Als Nächstes wird, obgleich ”bad brothers wild wind”, was dieselbe wie vorstehend ist, als die Suchabfrage 70 eingegeben wird, ein Fall beschrieben, in welchem die Suche mit den Beziehungsgewichtungsdaten von ”Betonung auf Beziehung mit Albumname” durchgeführt wird. In diesem Fall sind die Vorgänge in den Schritten ST11 und ST12 ähnlich den vorbeschriebenen.
  • In 22 ist ein Beispiel für die Beziehungsgewichtungsdaten 80 von ”Betonung auf Beziehung mit Albumname” gezeigt. In den Beziehungsgewichtungsdaten 80 ist ”Beziehungsgewichtung (82a)” = ”0,2” für Albumname → Liedtitel” als ein größerer Wert gesetzt als ”Beziehungsgewichtung (82a)” = ”0,1” für ”Künstlername → Liedtitel”, so dass ein Setzen von ”Betonung auf Beziehung mit Albumname” erhalten wird.
  • Im Schritt !3 bezieht sich die Relationaldatenerweiterungs-Sucheinheit 63 unter Verwendung des ”Dokument-ID” (19) in dem Zeichenreihen-Suchergebnis als dem Suchschlüssel auf den in 10 gezeigten Relationaldaten-Erweiterungsindex 50, um hierdurch ”Erweiterungsbestimmungsziel-ID (52)” und ”Beziehungstyp (53)” zu erhalten, und sie bezieht sich auch unter Verwendung dieses ”Beziehungstyps (53)” als dem Suchschlüssel auf die in 22 gezeigten Beziehungsgewichtungsdaten 80, um hierdurch ”Beziehungsgewichtung (82a)” zu erhalten, und berechnet dann die Relationaldatenerweiterungs-Ähnlichkeit unter Verwendung von diesen.
  • 23 ist eine Tabelle, die Schritt des Berechnens der Relationaldatenerweiterungs-Ähnlichkeit mit Bezug auf die Suchabfrage-Zeichenreihe ”bad brothers wild wind” auf der Grundlage des in 19 gezeigten Zeichenreihen-Suchergebnisses, wobei ein Fall von ”Betonung auf Beziehung mit Albumname” gezeigt wird. Weiterhin ist 24 ein Suchergebnis 90.
  • Beispielsweise ist für die Relationaldaten von ”Dokument-ID” = ”111” mit ”Künstlername → Liedtitel” in dem Fall von ”Betonung auf Beziehung mit Künstlername”, die ”Relationaldatenerweiterungs-Ähnlichkeit” = 2,4 unter Verwendung von ”Beziehungsgewichtung (82)” = ”0,2” (20) gegeben, während in dem Fall von ”Betonung auf Beziehung mit Albumname” die ”Relationaldatenerweiterungs-Ähnlichkeit” = 2,2 unter Verwendung von ”Beziehungsgewichtung (82)” = ”0,1” (23) gegeben ist. Demgemäß wird ”wild ist he wind” von ”Dokument-ID” = ”111” in der Suchergebnis-Betonungsbeziehung mit dem Künstlernamen zuerst eingestuft (21), aber wird in der Suchergebnis-Betonungsbeziehung mit dem Albumnamen auf dem zweiten Rang eingestuft (24).
  • Demgegenüber werden die Relationaldaten von ”Dokument-ID” = ”110” mit ”Albumname → Liedtitel” in dem Fall des Betonens der Beziehung mit dem Künstlernamen auf dem zweiten Rang eingestuft (21), aber werden in dem Fall des Betonens der Beziehung mit dem Albumnamen auf dem ersten Rang eingestuft (24).
  • Wie vorstehend beschrieben ist, kann auf der Grundlage der Relationaldefinitionsliste 30, die vorher erhalten wird, und der Beziehungsgewichtungsdaten 80, die zu der Zeit der Suche gegeben werden, die Sucheinheit 60 eine Suche und eine Rangeinstufung unter Berücksichtigung einer Beziehung zwischen jeweiligen Suchzieldaten, beispielsweise zwischen einem Künstlernamen und einem Liedtitel in einer Musiksuche durchführen, während eine Fuzzy-Suche für die Zeichenreihe der Suchabfrage 70 durchgeführt wird.
  • Weiterhin wird, wenn die Suche durch Änderung des Werts der Beziehungsgewichtungsdaten 80 durchgeführt wird, ein Suchergebnis erhalten, das einer Situation und einem Zweck zu der Zeit der Suche entspricht.
  • Beispielsweise kann bei einer Anwendung für die Eingabe der Suchabfrage 70 in einem Fall, in welchem eine Auswahl aus Menüs von ”Vorrang für Beziehung mit Künstlername”, Vorrang für Beziehung mit Albumname” und dergleichen erfolgt, wenn die Relationaldatenerweiterungs-Sucheinheit 63 eine Suche durch Ändern der Beziehungsgewichtungsdaten 80 in 13, 22 und so weiter durchführt, eine Anpassung derart erfolgen, dass das Suchergebnis 90 gemäß einem Zweck des Benutzers erhalten wird.
  • Weiterhin ist es beispielsweise in einem Fall, in welchem eine Suche durch eine Spracheingabe erfolgt, wenn die Relationaldatenerweiterungs-Sucheinheit 63 die Suche durch unterschiedliches Verwenden der in 13 und 22 gezeigten Beziehungsgewichtungsdaten 80 für einen Fall durchgeführt wird, in welchem eine Spracheingabevorrichtung eine Spracheingabe des Benutzers mit einer Ansage ”Bitte einen Künstlernamen und einen Musiktitel eingeben” benötigt, und einen Fall durchgeführt wird, in welchem die Vorrichtung die Spracheingabe des Benutzers mit einer Ansage ”Bitte einen Albumnamen und einen Musiktitel eingeben” benötigt, möglich, das Suchergebnis zu erhalten, das der Situation und dem Zweck zu der Zeit der Suche genqügt.
  • Das vorbeschriebene Ausführungsbeispiel 2 ist so ausgestaltet, dass die Relationaldatenerweiterungs-Sucheinheit 63 die Beziehungsgewichtungsdaten 80 gemäß einer externen Eingabe, die einen Typ einer Beziehung als bevorzugt bezeichnet, ändert, und dass die Relationaldatenerweiterungs-Ähnlichkeit der Erweiterungsquellendokumentdaten entsprechend dem bevorzugten Beziehungstyp größer wird. Aus diesem Grund ist es zusätzlich zu den Wirkungen des vorbeschriebenen Ausführungsbeispiels 1 möglich, ein Suchergebnis zu erhalten, das der Situation und dem Zweck zu der Zeit der Suche genügt.
  • Es ist festzustellen, dass gemäß der vorliegenden Erfindung möglich ist, die Ausführungsbeispiele frei zu kombinieren, jede Komponente der Ausführungsbeispiele zu modifizieren oder jede Komponente in den Ausführungsbeispielen innerhalb des Bereichs der Erfindung wegzulassen.
  • GEWERBLICHE ANWENDBARKEIT
  • Wie vorstehend beschrieben ist, ist die Suchvorrichtung nach der vorliegenden Erfindung, da sie so ausgebildet ist, dass eine flexible Fuzzy-Suche für gegenseitig bezogene strukturelle Daten ausführbar ist, während das Datenvolumen unterdrückt wird, geeignet zur Verwendung in einer Fahrzeug-Navigationsvorrichtung, einen Smartphone und/oder dergleichen, die eine Musiksuche, eine Einrichtungsnamenssuche, eine Adressensuche und/oder dergleichen durchführen.
  • BESCHREIBUNG VON BEZUGSZAHLEN UND -ZEICHEN
    • 10: Indexerzeugungseinheit, 11: Zeichenreihenindex-Erzeugungseinheit, 12: Relationaldaten-Erweiterungsindex-Erzeugungseinheit, 20: Registrierungsdaten, 30: Relationaldatendefinitionsliste, 40: Zeichenreihen-Suchindex, 50: Relationaldaten-Erweiterungsindex, 60: Sucheinheit, 61: Suchabfrage-Analysiereinheit, 62: Zeichenreihen-Sucheinheit, 63: Relationaldatenerweiterungs-Sucheinheit, 70: Suchabfrage, 80: Beziehungsgewichtungsdaten, 90: Suchergebnis.

Claims (6)

  1. Suchvorrichtung, welche aufweist: einen Zeichenreihen-Suchindex, in welchem zu suchende Dokumentdaten und Teildaten durch Teilen der Dokumentdaten in vorbestimmte Einheiten registriert sind; einen Relationaldaten-Erweiterungsindex, in welchem eine Beziehung zwischen den jeweiligen Dokumentdaten und einem Typ der Beziehung definiert sind; eine Zeichenreihen-Sucheinheit, die eine Suchabfrage in Teildaten in den vorbestimmten Einheiten teilt und die die Dokumentdaten, die mit den Teildaten teilweise übereinstimmen, aus dem Zeichenreihen-Suchindex erhält, um eine Ähnlichkeit hiervon zu berechnen; und eine Relationaldatenerweiterungs-Sucheinheit, die Dokumentdaten eines Erweiterungsbestimmungsziels, die so definiert sind, dass sie die Beziehung mit Bezug auf die Erweiterungsquellendokumentdaten haben, aus dem Relationaldaten-Erweiterungsindex erhält durch Verwendung der von der Zeichenreihen-Sucheinheit erhaltenen Dokumentdaten als einer Erweiterungsquelle, und die die Ähnlichkeit der Dokumentdaten der Erweiterungsquelle korrigiert durch Verwendung einer Gewichtung gemäß dem Typ der Beziehung und der Ähnlichkeit der Erweiterungsbestimmungszieldokumentdaten, und die die Erweiterungsquellendokumentdaten in einer Reihenfolge der korrigierten Ähnlichkeit anordnet und ausgibt.
  2. Suchvorrichtung nach Anspruch 1, bei der der Zeichenreihen-Suchindex Teildaten hat, in die die zu suchenden Dokumentdaten in Worteinheiten geteilt sind, wobei die Zeichenreihen-Sucheinheit den Zeichenreihen-Suchindex unter Verwendung eines Worts, das ein Teil der Suchabfrage ist, als einen Suchschlüssel sucht.
  3. Suchvorrichtung nach Anspruch 1, bei der der Zeichenreihen-Suchindex Teildaten hat, in die die zu suchenden Dokumentdaten in Einheiten einer beliebigen Anzahl von Zeichen geteilt sind, wobei die Zeichenreihen-Sucheinheit den Zeichenreihen-Suchindex unter Verwendung einer Zeichenreihe mit der beliebigen Anzahl von Zeichen der Suchabfrage als einen Suchschlüssel sucht.
  4. Suchvorrichtung nach Anspruch 1, bei der der Zeichenreihen-Suchindex Teildaten hat, in die die zu suchenden Dokumentdaten in Einheiten einer beliebigen Anzahl von Phonemen geteilt ist, wobei die Zeichenreihen-Sucheinheit den Zeichenreihen-Suchindex unter Verwendung einer Phonemreihe mit der beliebigen Anzahl von Phonemen der Suchabfrage als einen Suchschlüssel sucht.
  5. Suchvorrichtung nach Anspruch 1, bei der die Relationaldatenerweiterungs-Sucheinheit die Gewichtung gemäß einer externen Eingabe, die den Typ der Beziehung als bevorzugte bezeichnet, derart erhöht, dass die Ähnlichkeit der Dokumentdaten, für die der Typ der Beziehung definiert ist, größer wird.
  6. Suchvorrichtung nach Anspruch 1, weiterhin aufweisend: eine Zeichenreihenindex-Erzeugungseinheit, die den Zeichenreihen-Suchindex durch Teilen der zu suchenden Dokumentdaten in Teildaten der vorbestimmten Einheiten erzeugt; und eine Relationaldaten-Erweiterungsindex-Erzeugungseinheit, die den Relationaldaten-Erweiterungsindex auf der Grundlage einer Relationaldatendefinitionsliste, in der die Beziehung zwischen den jeweiligen Dokumentdaten und dem Typ der Beziehung definiert ist, erzeugt.
DE112011106041.6T 2011-12-27 2011-12-27 Suchvorrichtung Pending DE112011106041T5 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2011/007312 WO2013098886A1 (ja) 2011-12-27 2011-12-27 検索装置

Publications (1)

Publication Number Publication Date
DE112011106041T5 true DE112011106041T5 (de) 2014-10-02

Family

ID=48696460

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112011106041.6T Pending DE112011106041T5 (de) 2011-12-27 2011-12-27 Suchvorrichtung

Country Status (5)

Country Link
US (1) US9507881B2 (de)
JP (1) JP5512055B2 (de)
CN (1) CN103890755A (de)
DE (1) DE112011106041T5 (de)
WO (1) WO2013098886A1 (de)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10394826B1 (en) * 2014-02-24 2019-08-27 Amazon Technologies, Inc. System and methods for searching query data
US9778833B2 (en) * 2014-07-18 2017-10-03 Microsoft Technology Licensing, Llc Identifying and surfacing relevant report artifacts in documents
CN106708834A (zh) * 2015-08-07 2017-05-24 腾讯科技(深圳)有限公司 一种对象搜索方法、装置及服务器
JP6340351B2 (ja) * 2015-10-05 2018-06-06 日本電信電話株式会社 情報検索装置、辞書作成装置、方法、及びプログラム
US10956469B2 (en) * 2017-01-06 2021-03-23 International Business Machines Corporation System and method for metadata correlation using natural language processing
US10482128B2 (en) * 2017-05-15 2019-11-19 Oracle International Corporation Scalable approach to information-theoretic string similarity using a guaranteed rank threshold
CN109325032B (zh) * 2018-09-18 2020-10-27 厦门市美亚柏科信息股份有限公司 一种索引数据存储及检索方法、装置及存储介质
DE112019005976T5 (de) * 2018-11-30 2021-08-19 Semiconductor Energy Laboratory Co., Ltd. Verfahren zur Dokumentensuche, System zur Dokumentensuche, Programm und nicht-transitorisches, von einem Computer lesbares Speichermedium
JP6978735B2 (ja) * 2019-04-09 2021-12-08 株式会社AI Samurai 文書検索装置、文書検索方法、及び、文書検索プログラム
CN111625544B (zh) * 2020-05-27 2023-08-01 贵州易鲸捷信息技术有限公司 SQL On HBase上基于字符串切分的倒排索引的方法及***
CN112507068B (zh) * 2020-11-30 2023-11-14 北京百度网讯科技有限公司 文档查询方法、装置、电子设备和存储介质
CN113553491A (zh) * 2021-06-25 2021-10-26 西安电子科技大学 一种基于倒排索引的工业大数据搜索优化方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3430431B2 (ja) * 1995-02-06 2003-07-28 日本電信電話株式会社 データベース検索装置及びデータベース検索方法
US5687361A (en) * 1995-02-13 1997-11-11 Unisys Corporation System for managing and accessing a dynamically expanding computer database
DE19645128C2 (de) * 1996-11-04 1999-02-11 Anja David Verfahren zum Verwalten von Dokumenten sowie Gerätetreiber zur Durchführung des Verfahrens
US6334123B1 (en) * 1999-09-03 2001-12-25 Whamtech, Inc. Index relational processor
JP2001134588A (ja) 1999-11-04 2001-05-18 Ricoh Co Ltd 文書検索装置
WO2001043077A1 (fr) * 1999-12-06 2001-06-14 Fujitsu Limited Procede et dispositif d'affichage d'images
JP2002189747A (ja) * 2000-12-19 2002-07-05 Hitachi Ltd 文書情報の検索方法
JP2003016103A (ja) * 2001-06-28 2003-01-17 Ai Frontier:Kk ホームページにおけるデータ紹介提示方式
JP2003044515A (ja) 2001-08-01 2003-02-14 Aisin Aw Co Ltd 検索装置及び検索プログラム
FR2860084A1 (fr) * 2003-09-22 2005-03-25 Joseph Michel Koskas Algorithme hierarchique de gestion de bases de donnees
JP4854973B2 (ja) * 2005-03-09 2012-01-18 富士通株式会社 記憶制御プログラム、記憶制御方法、記憶制御装置および記憶制御システム
US7734615B2 (en) * 2005-05-26 2010-06-08 International Business Machines Corporation Performance data for query optimization of database partitions
US7831588B2 (en) * 2008-02-05 2010-11-09 Yahoo! Inc. Context-sensitive query expansion
JP2009211683A (ja) 2008-02-08 2009-09-17 Canvas Mapple Co Ltd 情報検索装置、情報検索方法、及び情報検索プログラム
US8244721B2 (en) * 2008-02-13 2012-08-14 Microsoft Corporation Using related users data to enhance web search
US8024341B1 (en) * 2008-04-30 2011-09-20 AudienceScience Inc. Query expansion
US8275803B2 (en) * 2008-05-14 2012-09-25 International Business Machines Corporation System and method for providing answers to questions
US8219579B2 (en) 2008-12-04 2012-07-10 Michael Ratiner Expansion of search queries using information categorization
US8392440B1 (en) * 2009-08-15 2013-03-05 Google Inc. Online de-compounding of query terms
US20110307497A1 (en) * 2010-06-14 2011-12-15 Connor Robert A Synthewiser (TM): Document-synthesizing search method
US8935233B2 (en) * 2010-09-28 2015-01-13 International Business Machines Corporation Approximate index in relational databases

Also Published As

Publication number Publication date
WO2013098886A1 (ja) 2013-07-04
US20140236994A1 (en) 2014-08-21
US9507881B2 (en) 2016-11-29
JPWO2013098886A1 (ja) 2015-04-30
JP5512055B2 (ja) 2014-06-04
CN103890755A (zh) 2014-06-25

Similar Documents

Publication Publication Date Title
DE112011106041T5 (de) Suchvorrichtung
DE3853894T2 (de) Auf Paradigmen basierende morphologische Textanalyse für natürliche Sprachen.
DE102020205786B4 (de) Spracherkennung unter verwendung von nlu (natural language understanding)-bezogenem wissen über tiefe vorwärtsgerichtete neuronale netze
DE69900854T2 (de) Ein suchsystem und verfahren zum zurückholen von daten und die anwendung in einem suchgerät
CN106021364B (zh) 图片搜索相关性预测模型的建立、图片搜索方法和装置
DE69804495T2 (de) Informationsmanagement und wiedergewinnung von schlüsselbegriffen
Miller et al. A hidden Markov model information retrieval system
DE19952769B4 (de) Suchmaschine und Verfahren zum Abrufen von Informationen mit Abfragen in natürlicher Sprache
CN102262634B (zh) 一种自动问答方法及***
US8271502B2 (en) Presenting multiple document summarization with search results
US20040059731A1 (en) Multistage intelligent database search method
CN116701431A (zh) 一种基于大语言模型的数据检索方法及***
CA2610088A1 (en) Relationship networks
DE102022201222A1 (de) Neuronales netz mit interaktionsschicht, zum suchen, abrufen und einstufen
CN102750347B (zh) 一种用于图像或视频搜索重排序的方法
CN103559193A (zh) 一种基于选择单元的主题建模方法
CN101923556B (zh) 根据句子序列号进行网页搜索的方法和装置
CN106980620A (zh) 一种对中文字串进行匹配的方法及装置
Liu et al. Name your style: An arbitrary artist-aware image style transfer
CN115905489B (zh) 一种提供招投标信息搜索服务的方法
CN106021430A (zh) 基于Lucence自定义词库的全文检索匹配方法及***
DE112013006764T5 (de) Suchvorrichtung
CN106570196A (zh) 视频节目的搜索方法和装置
DE102013003036B4 (de) Kraftwagen-Infotainmentsystem mit Suchfunktionalität
CN108810640B (zh) 一种电视节目的推荐方法

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R083 Amendment of/additions to inventor(s)
R084 Declaration of willingness to licence
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06F0017300000

Ipc: G06F0016000000